首页 > 编程语言 >指定GPU运行和训练python程序 、深度学习单卡、多卡 训练GPU设置【一文读懂】

指定GPU运行和训练python程序 、深度学习单卡、多卡 训练GPU设置【一文读懂】

时间:2022-12-11 12:33:50浏览次数:51  
标签:P0 训练 python AI smi nvidia GPU

  • 版权: 本文由【墨理学AI】原创、各位大佬、一文读懂、敬请查阅
  • 声明: 作为全网 AI 领域 干货最多的博主之一,❤️ 不负光阴不负卿 ❤️
  • ​​❤️ 深度学习模型训练基础环境搭建相关教程————认真帮大家整理了​​

查看服务器显卡使用情况

一、命令行运行python程序时

  • 首先查看哪些GPU空闲,nvidia-smi显示当前GPU使用情况
nvidia-smi
  • 如下图所示:服务器中的两个显卡,编号为0、1 . 都被同一个进程 PID 3016 占用

指定GPU运行和训练python程序 、深度学习单卡、多卡 训练GPU设置【一文读懂】_服务器

图示基础信息

GPU:GPU 编号;
Name:GPU 型号;
Persistence-M:持续模式的状态。持续模式虽然耗能大,但是在新的GPU应用启动时,花费的时间更少,这里显示的是off的状态;
Fan:风扇转速,从0到100%之间变动;
Temp:温度,单位是摄氏度;
Perf:性能状态,从P0到P12,P0表示最大性能,P12表示状态最小性能(即 GPU 未工作时为P0,达到最大工作限度时为P12)。
Pwr:Usage/Cap:能耗;
Memory Usage:显存使用率;
Bus-Id:涉及GPU总线的东西
Disp.A:Display Active,表示GPU的显示是否初始化;
Volatile GPU-Util:浮动的GPU利用率;
Uncorr. ECC:Error Correcting Code,错误检查与纠正;
Compute M:compute mode,计算模式

???? 指定空闲的GPU运行python程序

CUDA_VISIBLE_DEVICES=0,1 python test.py

???? 在python程序中指定GPU(通常使用该设置)

在 train.py 最上方,设定使用的GPU 编号, 当这两行代码注释掉时,训练会自动使用该服务器的所有资源

import os
os.environ["CUDA_VISIBLE_DEVICES"] = "0,1"

每 10s 显示一次GPU使用情况, Xshell 中 CTRL + C 中止:

watch -n 10 nvidia-smi

每 2s 刷新一次GPU使用情况, Xshell 或者 Shell 窗口 中 CTRL + C 中止:

nvidia-smi -l 2

???? 更多有效教程

此次博文内容难以 以偏概全,如有不恰当的地方,欢迎评论区批评指正

对于即将入行计算机视觉的小伙伴,墨理这里推荐收藏的干货博文目前如下

指定GPU运行和训练python程序 、深度学习单卡、多卡 训练GPU设置【一文读懂】_服务器_02

  • ​​❤️ 深度学习模型训练基础环境搭建相关教程————认真帮大家整理了​​

墨理学AI


  • ???? 作为全网 AI 领域 干货最多的博主之一,❤️ 不负光阴不负卿 ❤️
  • ❤️ 如果文章对你有帮助、点赞、评论鼓励博主的每一分认真创作

指定GPU运行和训练python程序 、深度学习单卡、多卡 训练GPU设置【一文读懂】_深度学习_03

标签:P0,训练,python,AI,smi,nvidia,GPU
From: https://blog.51cto.com/u_15660370/5928218

相关文章

  • python多进程&多线程
    python多进程&多线程1.多进程定义  2.多线程  3.应用  3.1不使用多线程则顺序执行1importlogging2fromthreadingimportThread3fromti......
  • python爬虫小结1
    python爬虫小结11正则匹配中注意的:importrea='<div>指数</div>'word=re.findall('<div>(.*?)</div>',a)print(word)其中(.*?)是能匹配基本所有的字符,但是对于跨行的......
  • python 访问access数据库的实现
    1.安装ODBC的驱动64位http://download.microsoft.com/download/E/4/2/E4220252-5FAE-4F0A-B1B9-0B48B5FBCCF9/AccessDatabaseEngine_X64.exe32位http://download.micro......
  • javascript-代码随想录训练营day25
    216.组合总和Ⅲ题目链接:https://leetcode.cn/problems/combination-sum-iii/题目描述:找出所有相加之和为n的k个数的组合,且满足下列条件:只使用数字1到9每个数字......
  • 极客编程python入门-装饰器
    装饰器在函数调用前后自动打印日志,但又不希望修改now()函数的定义,这种在代码运行期间动态增加功能的方式,称之为“装饰器”(Decorator)。由于函数也是一个对象,而且函数对象可以......
  • python 3.10 报错 _internal.utils.misc import get_installed_distributions
    python3.10版本后不能导入frompip._internal.utils.miscimportget_installed_distributions可以使用importpkg_resources   用pkg_resources.working_set:......
  • 【2023最新B站评论爬虫】用python爬取上千条哔哩哔哩评论
    您好,我是@马哥python说,一枚10年程序猿。一、爬取目标之前,我分享过一些B站的爬虫:【Python爬虫案例】用Python爬取李子柒B站视频数据【Python爬虫案例】用python爬哔哩哔......
  • 代码随想录训练营第六十天 | 单调栈
    今天是代码随想录训练营的第六十天,是最后一天,也代表这一刷结束 84.柱状图中最大的矩形classSolution{publicintlargestRectangleArea(int[]heights){......
  • python 好用的库
    Prerequisite包含:arrow、tinydbarrowarrow可以很方便的处理时间和日期importarrownow=arrow.now()print(now)#2022-12-11T00:25:59.424262+08:00year=now.......
  • python 实现远程监控服务器内存,磁盘,cpu各项指标
    点击查看代码#!/usr/local/bin/python3#-*-coding:utf-8-*-importrequestsimportsubprocess,jsonimportparamikoimportsocketNORMAL=0TIMEOUT=2#远程监控......