首页 > 系统相关 >未知进程占用显存排查

未知进程占用显存排查

时间:2024-06-21 14:42:33浏览次数:29  
标签:显存 ps python 占用 排查 进程

现象

nvitop   查看gpu 使用情况,会看到 ‘No Such Process’ 这样的进程占用了显存;

使用ps 查不到该命令。

 

 

原因

大概率是主进程挂了,或者被终止了,但是子进程仍然占用着显存。

 

解决方法

方法1: 如果确定进程都是python 启动的,执行下面的命令; 如果不是python,但是知道关键字,把python替换成关键字也行。

返回结果里不是root 的进程,大概率就是僵尸进程,判断是不是该进程在占显存, 然后kill 掉即可

ps aux|grep python|awk '{print $2}'|xargs ps -f -p|grep -E '^\w+\s+\w+\s+1\s'

 

方法2:查看设备占用 (不能完全查到)

fuser -v /dev/nvidia*
# 根据返回的结果排查

  

 

标签:显存,ps,python,占用,排查,进程
From: https://www.cnblogs.com/fadedlemon/p/18260495

相关文章

  • 【第12章】别人的工作流,如何使用和调试(下)?(安装视频生成模型SVD/服务器报错/爆显存/丢图
    ......
  • 视频汇聚安防综合管理系统EasyCVR平台GB28181设备注册未上线的原因排查与解决
    视频汇聚安防综合管理平台EasyCVR视频监控系统基于云边端架构,可支持海量视频汇聚集中管理,能提供视频监控直播、云端录像、云存储、录像检索与回看、告警(协议告警/智能告警/1400视图库告警)、平台级联、AI智能分析接入等视频能力服务。平台具备强大的兼容性,支持多协议、多类型设备接......
  • 电瓶车消防通道占用监测与预警系统
    电瓶车消防通道占用监测与预警系统(ElectricVehicleFireAccessMonitoring&AlertSystem,简称EVFAMAS)为了实现您所描述的功能,即检测电瓶车是否停在消防通道上,并在违规时向物业发送预警信息同时推送给业主,您可以设计一个基于图像识别和物联网技术的系统。以下是实现这一......
  • Java应用线上问题排查工具整理
    关于线上问题Java应用的线上问题,总结起来大概分为几类:CPU占用高,内存溢出,执行结果不对。CPU占用高引起CPU占用高的原因可能有多种,比如:代码进入死循环并发请求量大频繁FullGC打印日志太过于频繁内存溢出导致内存溢出的原因可能是:分配的Java堆空间不够,可以通过启动参数......
  • CLFS驱动程序(clfs.sys)是Windows操作系统中的一个组件,它提供了日志记录和恢复功能,以增
    clfs.sys是Windows操作系统中的一个系统文件,它是CLFS(CommonLogFileSystem)驱动程序的一部分。CLFS是Windows操作系统中用于管理日志文件的文件系统,它提供了日志记录和恢复功能。CLFS驱动程序(clfs.sys)具有以下功能和作用:日志记录:CLFS可以记录系统的操作、事件和错误等信息到......
  • 端口占用多:UE4/UE5像素流送云推流时如何优化端口使用?
    许多用户反映,在使用UE4或UE5进行像素流送云推流时,端口的占用数量较多。这促使我们思考,是否有方案能够减少这种资源占用?目前,像素流送技术对于端口的要求是每个独立用户占用一个端口。然而,但在实际场景中,尤其在用户数量众多,访问人数大的情况下,往往无法提供足够的端口资源。这主......
  • 排查Java进程CPU占用高之三板斧
    写在前面线上环境突然出现Java进程CPU占用率持续超过100%的问题,该如何排查并定位呢?问题一:我们如何知道线上环境的那个服务器(或者哪个Docker容器)出现了CPU持续高的故障了呢?如果是有比较完善的监控设施,当出现CPU持续高时可以通过发送报警通知的方式告知开发人员,如果没有监控通知,......
  • 云平台DNS故障导致网站访问卡顿异常排查过程,wireshark、strace等工具在实际问题排查过
    一、问题现象    项目上使用华为私有云,前段时间华为升级云平台后,云上用户反馈业务系统出现卡顿,之前几秒可以刷新出来的页面现在需要几十秒。提供了一个比较明显的url和curl调用方法。10.213.x.xxx:8082/files/logincurl-H"Content-Type:application/json"-H"T......
  • java 堆外内存排查
    操作系统:centos7jdk版本8yum-yinstallgccgcc-c++wgethttp://download.savannah.gnu.org/releases/libunwind/libunwind-0.99.tar.gzwgethttps://github.com/gperftools/gperftools/releases/download/gperftools-2.6.1/gperftools-2.6.1.tar.gz./configure--prefix=/u......
  • jenkins导致硬盘占用满了如何处理
    现象: 从根目录开始,使用du-h-x--max-depth=1 查看哪个目录占用过高,打算对于过高目录中的内容适当删减腾出一些空间通过追踪查询,发现是jenkins的构建纪录未清理,而且最近我们项目测试构建很频繁,导致磁盘最近爆涨。 注:查看隐藏文件的命令:du-sh.[!.]**|sort-hr解决......