首页 > 系统相关 >记录一次实验室linux系统的GPU服务器死机故障的排查——Linux系统的Power States

记录一次实验室linux系统的GPU服务器死机故障的排查——Linux系统的Power States

时间:2022-11-16 19:05:25浏览次数:80  
标签:Power 死机 电源 Linux 显卡 日志 崩溃 D0

实验室的ubuntu服务器不知怎么的突然又崩溃了,死机重启,然后查看日志,发现了下面的情况:

记录一次实验室linux系统的GPU服务器死机故障的排查——Linux系统的Power States_死机

 

 

 

 

由于从其他的日志中知道是显卡的问题引起的死机,而这个显卡的地址正好是D9:00,这部分的日志就不给出了。结合上面给出的日志,从这个Power State中可以判断显卡崩溃的时候该显卡的电源状态转为了D0。

记录一次实验室linux系统的GPU服务器死机故障的排查——Linux系统的Power States_d3_02

 

 

 

-------------------------------------------

 

 

那么我们根据这些信息可以得到一个什么结论呢(或许是猜测)?

网上查了下资料:

Power States(MSDN 翻译)

​电源管理驱动是如何切换各种电源状态的(D0,D1,D2,D3,D4)?​

​https://learn.microsoft.com/en-us/windows-hardware/drivers/kernel/device-power-states?redirectedfrom=MSDN

​http://www.winwin7.com/JC/5847.html​

​https://www.xitongcheng.com/jiaocheng/win10_article_57154.html​


 

 

 

记录一次实验室linux系统的GPU服务器死机故障的排查——Linux系统的Power States_html_03

 

 

 

可以知道D0的这个电源状态是最高的,这也就是意味着系统死机时的3号显卡的电源状态最高,而此时该显卡崩溃从而导致系统死机,因此我们就可以预估出此时的该显卡功率是最高的,此时的该卡GPU使用率也是极高的,由此我们就可以猜测出造成该显卡崩溃最后导致整个系统死机的主要原因就是3号显卡满功率运行造成的问题。

 

 

 

个人一个观点,如果linux系统死机,并且该死机是由某个计算硬件设备造成的,如本文中的GPU,而该设备造成系统崩溃的同一时间的电源状态为最高的D0,那么就有理由怀疑导致此次死机的主要原因就是该计算设备的满负荷运行造成的。

 

 

 

=================================================

 

标签:Power,死机,电源,Linux,显卡,日志,崩溃,D0
From: https://blog.51cto.com/u_15642578/5857001

相关文章

  • Linux登录时的提示信息
    一、/etc/issue和/etc/issue.net/etc/issue和/etc/issue​​.​​net都是Linux终端登录的欢迎语句存储文件,/etc/issue文件的使用方法与/etc/motd文件相差不大,它们的主要区......
  • 解决linux平台无法使用getch()的问题
    参考https://www.cnblogs.com/jiangxinnju/p/5516906.html#:~:text=%E5%8F%A6%E5%A4%96%E5%A4%A7%E5%AE%B6%E5%B9%B3%E6%97%B6%E4%B8%BB%E8%A6%81%E6%98%AF%E5%88%A9%E7%94......
  • linux 中awk 命令同时指定多个分割符
     001、[root@pc1test3]#lsa.txt[root@pc1test3]#cata.txt##测试数据ad_33;hh_kkdd;ff;dd;77uu_77_88_99[root@pc1test3]#awk-F"[_;]"'{p......
  • linux root切换新用户出现-bash-4.2$
     原因:新用户目录下缺少环境变量文件.bash_profile和.bashrc解决办法:将.bash_profile和.bashrc文件复制到登录的用户目录下登录root用户执行命令,执行完再次切换,切换成......
  • 下错jdk压缩包用rz上传到Linux乱码
    哭泣32位的JDK上传到64位的Centos,一开始上传就是乱码,然后网上说是因为上传压缩包要加参数rz-be,其实下对包就不用下载的是jdki586,三年了我还不知道这个32为的包rm:r......
  • USB无线网卡驱动安装(Install Realtek (rtl88x2bu) Wireless Drivers Linux Mint)
    IntroductionOnethingthatWindowsdoesdoverywellisdrivers.MostthingsyoumayconnecttoaPCwillautomagicallywork.Linuxalsogenerallyhasgoodou......
  • linux 基线检查
     <htmlxmlns:v="urn:schemas-microsoft-com:vml"xmlns:o="urn:schemas-microsoft-com:office:office"xmlns:x="urn:schemas-microsoft-com:office:excel"xmlns:dt="uui......
  • 《Unix/Linux系统编程》第14章学习笔记
    第14章MySQL数据库系统MySQL(MySQL2018)是一个关系数据库系统。在关系数据库中,数据存储在表中。每个表由多个行和列组成。表中的数据相互关联,表也可能与其他表有关联。......
  • linux 中判断一组数据是否有交叉
     001、shell实现[root@pc1test2]#lsa.txt[root@pc1test2]#cata.txt##测试数据146108161720[root@pc1test2]#cata.txt|tr"""\n"|sed-e......
  • Linux--学习笔记
    Linux--学习笔记第1章Linux入门1.1概述1.2Linux和Windows第2章Linux文件与目录结构2.1Linux文件Linux系统中一切皆文件。2.2Linux目录结构......