首页 > 其他分享 >nvidia-smi命令有一张卡功率显示未N/A

nvidia-smi命令有一张卡功率显示未N/A

时间:2024-09-13 09:51:07浏览次数:10  
标签:10240MiB Off 驱动程序 nvidia smi NVIDIA 功率 GPU

在 NVIDIA-SMI 输出中,第四张 GPU 的功率显示为 “N/A”,这通常与以下几种情况相关:

Fri Sep 13 09:47:23 2024       
+-----------------------------------------------------------------------------------------+
| NVIDIA-SMI 550.54.14              Driver Version: 550.54.14      CUDA Version: 12.4     |
|-----------------------------------------+------------------------+----------------------+
| GPU  Name                 Persistence-M | Bus-Id          Disp.A | Volatile Uncorr. ECC |
| Fan  Temp   Perf          Pwr:Usage/Cap |           Memory-Usage | GPU-Util  Compute M. |
|                                         |                        |               MIG M. |
|=========================================+========================+======================|
|   0  NVIDIA GeForce RTX 3080        Off |   00000000:02:00.0 Off |                  N/A |
| 33%   45C    P0             93W /  320W |       0MiB /  10240MiB |      0%      Default |
|                                         |                        |                  N/A |
+-----------------------------------------+------------------------+----------------------+
|   1  NVIDIA GeForce RTX 3080        Off |   00000000:03:00.0 Off |                  N/A |
| 31%   44C    P0             90W /  320W |       0MiB /  10240MiB |      0%      Default |
|                                         |                        |                  N/A |
+-----------------------------------------+------------------------+----------------------+
|   2  NVIDIA GeForce RTX 3080        Off |   00000000:81:00.0 Off |                  N/A |
| 30%   39C    P0             86W /  320W |       0MiB /  10240MiB |      0%      Default |
|                                         |                        |                  N/A |
+-----------------------------------------+------------------------+----------------------+
|   3  NVIDIA GeForce RTX 3080        Off |   00000000:82:00.0 Off |                  N/A |
| 37%   48C    P0             89W /  320W |       0MiB /  10240MiB |      0%      Default |
|                                         |                        |                  N/A |
+-----------------------------------------+------------------------+----------------------+
|   4  NVIDIA GeForce RTX 3080        Off |   00000000:83:00.0 Off |                  N/A |
| 30%   41C    P0             N/A /  320W |       0MiB /  10240MiB |      0%      Default |
|                                         |                        |                  N/A |
+-----------------------------------------+------------------------+----------------------+
                                                                                         
+-----------------------------------------------------------------------------------------+
| Processes:                                                                              |
|  GPU   GI   CI        PID   Type   Process name                              GPU Memory |
|        ID   ID                                                               Usage      |
|=========================================================================================|
|  No running processes found                                                             |
+-----------------------------------------------------------------------------------------+
第四张开功率显示为N/A

可能的原因

  1. GPU 状态或设置问题

    • GPU 可能处于空闲状态,未启用高功耗模式。
    • GPU 电源管理策略限制了功率的读取,可能没有开启完整的监控。
  2. 驱动问题

    • 驱动程序不兼容或配置不正确,可能导致某些 GPU 的功率无法正确显示。
  3. 硬件问题

    • 该 GPU 可能存在硬件问题,比如温度传感器或电源相关的传感器失效,导致功率读取失败。
  4. BIOS/固件问题

    • GPU 或主板的 BIOS 设置可能限制了对 GPU 功率的读取。
  5. MIG(多实例 GPU)配置

    • 如果 GPU 配置了 MIG 模式(多实例 GPU),有时功率信息也会被屏蔽。

解决方法

  1. 重启 NVIDIA 驱动程序
    你可以尝试通过命令重启 NVIDIA 驱动,确保其正常工作:

    sudo systemctl restart nvidia-persistenced
    
  2. 更新或重装 NVIDIA 驱动程序

    • 检查是否有最新版本的驱动程序可以更新,或者重新安装当前的驱动程序。
    • 确保驱动程序与 CUDA 版本兼容。
  3. 检查电源管理设置

    • 检查系统或 GPU 的电源管理设置,确保不会限制功率监控。
    • 可以尝试将 GPU 设置为“持续模式”:
      sudo nvidia-smi -pm 1
      
  4. 硬件检查

    • 检查这张 GPU 是否插牢、连接的电源线是否正常工作。
  5. 查看 BIOS 设置

    • 进入主板 BIOS 检查 GPU 相关的设置,确保一切配置正常。

后续处理

如果以上方法都无效,建议检查是否有与该 GPU 相关的系统日志,或者联系硬件供应商获取进一步的支持。

标签:10240MiB,Off,驱动程序,nvidia,smi,NVIDIA,功率,GPU
From: https://www.cnblogs.com/jasmine456/p/18411661

相关文章

  • ubuntu安装nvidia显卡驱动及cuda
    安装NVIDIA驱动sudoaptupdate下载依赖sudoaptinstallgccmakevimssh-y查看是否禁用nouveaulsmod|grepnouveau显示输出代表没禁用禁用自带的nouveau开源驱动sudovim/etc/modprobe.d/blacklist-nouveau.conf文本输入以下两行blacklistnouveauoptionsnouve......
  • 黄仁勋的思维世界:Nvidia的AI和游戏之王
    在这个行业中,黄仁勋是一位举足轻重的人物,也是Nvidia的联合创始人之一。他因在创新方面的强大而富有远见的领导力而受到认可。从卑微的起点到领导一家改变了电子游戏和人工智能面貌的公司,黄仁勋的故事启迪了人们的雄心、韧性以及如何超前思考。早年生活和职业生涯黄仁勋出生于......
  • Scrapy设置动态代理IP—提升爬虫效率与成功率的秘诀
    在进行网络数据采集时,爬虫代理IP是一个不可或缺的工具。通过动态代理IP,Scrapy爬虫可以有效避免被目标网站封禁,提高数据采集的成功率和效率。本文将详细介绍如何在Scrapy中设置动态代理IP,让你的爬虫更加智能和高效。什么是动态代理IP?动态代理IP是指在数据采集过程中,定期更换使......
  • NS4263B 3.1Wx2 双声道 AB/D 类双模音频功率放大器附加耳机模式
    1特性●工作电压范围:3.0V-5.5V●AB类和D类工作模式切换●一线脉冲控制工作模式与关断模式●内置立体声耳机输出功能●输出功率3.1W@ClassD/Load=4ohm●THD+N=0.2%@VDD=5V/Po=1W●优异的全带宽EMI抑制能力●优异的“上电和掉电”噪声抑制●内置过流保护......
  • NS4263 3.0Wx2 双声道 AB/D 类双模音频功率放大器附加耳机模式
    1特性●工作电压范围:3.0V-5.25V●AB类和D类工作模式切换●一线脉冲控制工作模式与关断模式●内置立体声耳机输出功能●输出功率3W@ClassD/Load=4ohm●THD+N=0.1%@VDD=5V/Po=1W●优异的全带宽EMI抑制能力●优异的“上电和掉电”噪声抑制●内置过流保护......
  • 应急灯升压恒流芯片IC-H6902B 2.7V3.7V5V9V12V24V转48V60V80V100V 10A大电流大功率
    LED驱动方案:IC-H6902B升压恒流芯片!这款芯片以其好性能和不同应用场景,成为LED灯串驱动的不错选择。H6902B内置高精度误差放大器、固定关断时间控制电路和恒流驱动电路,确保高亮度LED灯串的稳定驱动。通过RFB采样电阻设置,轻松控制LED灯的驱动电流,实现恒定亮度。更棒的是,它还支持PWM信......
  • 功率电感的额定电流
    功率电感的额定电流功率电感的各参数:两个额定电流Isat,Irms如何理解?功率电感一般分为以下四种外形(如图)。而在DC/DC升压降压电路中,电感是仅次于IC的最核心元器件。选择好的功率电感,可获得较高的转换效率。功率电感的选型,一般需要参考以下几个参数:L(电感值),Isat(饱和电流),Ir......
  • NVIDIA驱动,CUDA,CONDA环境安装
    NVIDIA驱动安装检查驱动信息lastrebootuname-rcat/var/log/apt/history.lognvidia-smill/usr/src/lsmod|grepnvidialspci|grep-invidiadmesg-i|grepnvidiadmesg|grep-invidiadmesg|grep-invrmdpkg--get-selections|greplinux-ima......
  • 【没发表过的创新点】【多变量输入单步预测】基于CEEMDAN-VMD-CNN的风电功率预测研究(M
                                          ......
  • 功率单元和功率模块有什么区别?
        功率单元和功率模块在电力电子领域中各自扮演着重要角色,它们之间存在明显的区别,主要体现在以下几个方面:一、定义与构成功率单元:指的是集成在一块PCB(印刷电路板)上的功率转换电路模块,通常由MOSFET、IGBT(绝缘栅双极型晶体管)或SiCMOSFET等功率半导体器件构成。它能够......