【已解决】Failed to initialize NVML: Driver/library version mismatch NVML library version: 535.161
【已解决】Failed to initialize NVML: Driver/library version mismatch NVML library version: 535.161
问题描述
今天遇到这样一个问题:
Failed to initialize NVML: Driver/library version mismatch NVML library version: 535.161
原因分析和解决
其实这种问题一般都是系统检测到驱动和cuda版本不一致
的原因导致的,这也就是在我们用update操作时会有这样的问题:
sudo apt-get update
– 从服务器获取软件列表,并在本地保存为文件。
sudo apt-get upgrade
– 本地安装软件与本地软件列表对比,如本地安装版本低,会提示更新。
在 linux
中,安装软件最常用到的是 sudo apt-get
,这个命令会从软件仓库中检索并拉取我们想要的软件。 我就是使用的第一条命令。
查看我的升级日志,发现最近确实有升级的记录,那就很明显了。
(base) visionx@visionx:~$ cat /var/log/dpkg.log |grep nvidia|grep libnvidia-common
2024-04-09 06:50:34 upgrade libnvidia-common-525:all 525.147.05-0ubuntu0.20.04.1 525.147.05-0ubuntu2.20.04.1
2024-04-09 06:50:34 status half-configured libnvidia-common-525:all 525.147.05-0ubuntu0.20.04.1
2024-04-09 06:50:34 status unpacked libnvidia-common-525:all 525.147.05-0ubuntu0.20.04.1
2024-04-09 06:50:34 status half-installed libnvidia-common-525:all 525.147.05-0ubuntu0.20.04.1
2024-04-09 06:50:35 status unpacked libnvidia-common-525:all 525.147.05-0ubuntu2.20.04.1
2024-04-09 06:50:35 install libnvidia-common-535:all <无> 535.161.07-0ubuntu0.20.04.1
2024-04-09 06:50:35 status half-installed libnvidia-common-535:all 535.161.07-0ubuntu0.20.04.1
2024-04-09 06:50:35 status unpacked libnvidia-common-535:all 535.161.07-0ubuntu0.20.04.1
2024-04-09 06:50:35 upgrade libnvidia-common-520:all 525.147.05-0ubuntu0.20.04.1 525.147.05-0ubuntu2.20.04.1
2024-04-09 06:50:35 status half-configured libnvidia-common-520:all 525.147.05-0ubuntu0.20.04.1
2024-04-09 06:50:35 status unpacked libnvidia-common-520:all 525.147.05-0ubuntu0.20.04.1
2024-04-09 06:50:35 status half-installed libnvidia-common-520:all 525.147.05-0ubuntu0.20.04.1
2024-04-09 06:50:36 status unpacked libnvidia-common-520:all 525.147.05-0ubuntu2.20.04.1
2024-04-09 06:50:36 configure libnvidia-common-535:all 535.161.07-0ubuntu0.20.04.1 <无>
2024-04-09 06:50:36 status unpacked libnvidia-common-535:all 535.161.07-0ubuntu0.20.04.1
2024-04-09 06:50:36 status half-configured libnvidia-common-535:all 535.161.07-0ubuntu0.20.04.1
2024-04-09 06:50:36 status installed libnvidia-common-535:all 535.161.07-0ubuntu0.20.04.1
2024-04-09 06:50:36 configure libnvidia-common-520:all 525.147.05-0ubuntu2.20.04.1 <无>
2024-04-09 06:50:36 status unpacked libnvidia-common-520:all 525.147.05-0ubuntu2.20.04.1
2024-04-09 06:50:36 status half-configured libnvidia-common-520:all 525.147.05-0ubuntu2.20.04.1
2024-04-09 06:50:36 status installed libnvidia-common-520:all 525.147.05-0ubuntu2.20.04.1
2024-04-09 06:50:36 configure libnvidia-common-525:all 525.147.05-0ubuntu2.20.04.1 <无>
2024-04-09 06:50:36 status unpacked libnvidia-common-525:all 525.147.05-0ubuntu2.20.04.1
2024-04-09 06:50:36 status half-configured libnvidia-common-525:all 525.147.05-0ubuntu2.20.04.1
2024-04-09 06:50:36 status installed libnvidia-common-525:all 525.147.05-0ubuntu2.20.04.1
2024-04-09 06:57:54 status installed libnvidia-common-525:all 525.147.05-0ubuntu2.20.04.1
2024-04-09 06:57:54 remove libnvidia-common-525:all 525.147.05-0ubuntu2.20.04.1 <无>
2024-04-09 06:57:54 status half-configured libnvidia-common-525:all 525.147.05-0ubuntu2.20.04.1
2024-04-09 06:57:54 status half-installed libnvidia-common-525:all 525.147.05-0ubuntu2.20.04.1
2024-04-09 06:57:54 status config-files libnvidia-common-525:all 525.147.05-0ubuntu2.20.04.1
2024-04-09 06:57:55 status not-installed libnvidia-common-525:all <无>
当我把这个问题喂给chatgpt
的时候,她给了我这样的答复:
这个错误通常是因为 NVIDIA 驱动与 NVML 库版本不匹配所致。解决此问题的一种方法是更新或回滚 NVIDIA驱动程序,以使其与当前安装的 NVML 库版本匹配。
首先,您可以尝试更新 NVIDIA 驱动程序到与 NVML 库版本匹配的最新版本。您可以从 NVIDIA官方网站下载最新的驱动程序,并确保它与您当前的 NVML 库版本兼容。
如果更新驱动程序不起作用,您还可以尝试降级 NVML 库版本,使其与当前安装的 NVIDIA 驱动程序兼容。您可以从 NVIDIA Developer 网站下载适用于您的系统的 NVML 库的旧版本,并将其安装到您的系统中。
如果以上方法都不起作用,您可能需要进一步检查系统中的其他配置或依赖项,以确保 NVIDIA 驱动程序与 NVML库版本匹配,并且系统设置正确。您还可以考虑重新安装 NVIDIA 驱动程序和 NVML 库,以解决潜在的安装问题。
而我在互联网冲浪时也得到了类似的答复
并且给出的解决办法是这样的:
解决办法一、更新驱动
1.卸载驱动
sudo apt-get purge nvidia*
2.查找可用的驱动版本
ubuntu-drivers devices
查找本机内核版本:
cat /proc/driver/nvidia/version
发现为440.33.01
于是尝试安装440版本的驱动:
sudo apt-get install nvidia-driver-440 nvidia-settings nvidia-prime
然而安装失败,某些包不匹配,系统解决不了错误,卡了一会时间。
最终尝试安装415版本
的,安装成功了
sudo apt-get install nvidia-driver-415 nvidia-settings nvidia-prime
当然还有人这么建议,相当哇塞!!!
解决办法二、重启
这个方法在我的实战经历中我发现,凡是cuda
和driver
不一样的情况下大多数都可以
解决办法三、其他方法
这种方法还是挺好想的,但是我确实没想到哦,让我们感谢质数哥!
我尝试了几种思路:
1.最简单的是重启,貌似能解决;
2.重启不能解决就换重新安装了,后来就把一个固定的driver安装文件保存在本地,出了问题就重新sudo安装,好像也行,就是折腾;
3.固定版本,这个我试过,好像不咋好用;
4.设置驱动不更新,这个到目前为止还没出现问题。
上面4个方法是我都一一尝试过的,我用的系统是ubuntu的,具体方法也都是在知乎和csdn找的。
作者链接:质数 - 知乎
终极方法:关闭自动更新
相关链接
完结撒花
我为什么要教阿三哥使用筷子呢?
底下评论
问题一:
把驱动卸载了发现居然还有重启大法。。。
问题二:
第一次出现,重启解决了,第二次出现,重启也解决不了
问题三:
是因为重启会自动更新内核来适应驱动哈哈哈
问题四:
哈哈哈哈,太有意思了,反正类似的问题确实有一些可以重启解决
问题五:
不行了,装最低的版本都报错了
问题一:
重启试试呢
【已解决】Failed to initialize NVML: Driver/library version mismatch NVML library version: 535.161
标签:06,NVML,系列,04,09,library,04.1,common,libnvidia From: https://blog.csdn.net/weixin_54626591/article/details/142999955