首页 > 编程语言 >python系列&deep_study系列:【已解决】Failed to initialize NVML: Driver/library version mismatch NVML library v

python系列&deep_study系列:【已解决】Failed to initialize NVML: Driver/library version mismatch NVML library v

时间:2024-10-17 10:47:15浏览次数:3  
标签:06 NVML 系列 04 09 library 04.1 common libnvidia

【已解决】Failed to initialize NVML: Driver/library version mismatch NVML library version: 535.161




【已解决】Failed to initialize NVML: Driver/library version mismatch NVML library version: 535.161

问题描述

今天遇到这样一个问题:

Failed to initialize NVML: Driver/library version mismatch NVML library version: 535.161

原因分析和解决

其实这种问题一般都是系统检测到驱动和cuda版本不一致的原因导致的,这也就是在我们用update操作时会有这样的问题:

sudo apt-get update – 从服务器获取软件列表,并在本地保存为文件。
sudo apt-get upgrade – 本地安装软件与本地软件列表对比,如本地安装版本低,会提示更新。

linux中,安装软件最常用到的是 sudo apt-get ,这个命令会从软件仓库中检索并拉取我们想要的软件。 我就是使用的第一条命令。

查看我的升级日志,发现最近确实有升级的记录,那就很明显了。

(base) visionx@visionx:~$ cat /var/log/dpkg.log |grep nvidia|grep libnvidia-common
2024-04-09 06:50:34 upgrade libnvidia-common-525:all 525.147.05-0ubuntu0.20.04.1 525.147.05-0ubuntu2.20.04.1
2024-04-09 06:50:34 status half-configured libnvidia-common-525:all 525.147.05-0ubuntu0.20.04.1
2024-04-09 06:50:34 status unpacked libnvidia-common-525:all 525.147.05-0ubuntu0.20.04.1
2024-04-09 06:50:34 status half-installed libnvidia-common-525:all 525.147.05-0ubuntu0.20.04.1
2024-04-09 06:50:35 status unpacked libnvidia-common-525:all 525.147.05-0ubuntu2.20.04.1
2024-04-09 06:50:35 install libnvidia-common-535:all <无> 535.161.07-0ubuntu0.20.04.1
2024-04-09 06:50:35 status half-installed libnvidia-common-535:all 535.161.07-0ubuntu0.20.04.1
2024-04-09 06:50:35 status unpacked libnvidia-common-535:all 535.161.07-0ubuntu0.20.04.1
2024-04-09 06:50:35 upgrade libnvidia-common-520:all 525.147.05-0ubuntu0.20.04.1 525.147.05-0ubuntu2.20.04.1
2024-04-09 06:50:35 status half-configured libnvidia-common-520:all 525.147.05-0ubuntu0.20.04.1
2024-04-09 06:50:35 status unpacked libnvidia-common-520:all 525.147.05-0ubuntu0.20.04.1
2024-04-09 06:50:35 status half-installed libnvidia-common-520:all 525.147.05-0ubuntu0.20.04.1
2024-04-09 06:50:36 status unpacked libnvidia-common-520:all 525.147.05-0ubuntu2.20.04.1
2024-04-09 06:50:36 configure libnvidia-common-535:all 535.161.07-0ubuntu0.20.04.1 <无>
2024-04-09 06:50:36 status unpacked libnvidia-common-535:all 535.161.07-0ubuntu0.20.04.1
2024-04-09 06:50:36 status half-configured libnvidia-common-535:all 535.161.07-0ubuntu0.20.04.1
2024-04-09 06:50:36 status installed libnvidia-common-535:all 535.161.07-0ubuntu0.20.04.1
2024-04-09 06:50:36 configure libnvidia-common-520:all 525.147.05-0ubuntu2.20.04.1 <无>
2024-04-09 06:50:36 status unpacked libnvidia-common-520:all 525.147.05-0ubuntu2.20.04.1
2024-04-09 06:50:36 status half-configured libnvidia-common-520:all 525.147.05-0ubuntu2.20.04.1
2024-04-09 06:50:36 status installed libnvidia-common-520:all 525.147.05-0ubuntu2.20.04.1
2024-04-09 06:50:36 configure libnvidia-common-525:all 525.147.05-0ubuntu2.20.04.1 <无>
2024-04-09 06:50:36 status unpacked libnvidia-common-525:all 525.147.05-0ubuntu2.20.04.1
2024-04-09 06:50:36 status half-configured libnvidia-common-525:all 525.147.05-0ubuntu2.20.04.1
2024-04-09 06:50:36 status installed libnvidia-common-525:all 525.147.05-0ubuntu2.20.04.1
2024-04-09 06:57:54 status installed libnvidia-common-525:all 525.147.05-0ubuntu2.20.04.1
2024-04-09 06:57:54 remove libnvidia-common-525:all 525.147.05-0ubuntu2.20.04.1 <无>
2024-04-09 06:57:54 status half-configured libnvidia-common-525:all 525.147.05-0ubuntu2.20.04.1
2024-04-09 06:57:54 status half-installed libnvidia-common-525:all 525.147.05-0ubuntu2.20.04.1
2024-04-09 06:57:54 status config-files libnvidia-common-525:all 525.147.05-0ubuntu2.20.04.1
2024-04-09 06:57:55 status not-installed libnvidia-common-525:all <无>

当我把这个问题喂给chatgpt的时候,她给了我这样的答复:

这个错误通常是因为 NVIDIA 驱动与 NVML 库版本不匹配所致。解决此问题的一种方法是更新或回滚 NVIDIA驱动程序,以使其与当前安装的 NVML 库版本匹配。

首先,您可以尝试更新 NVIDIA 驱动程序到与 NVML 库版本匹配的最新版本。您可以从 NVIDIA官方网站下载最新的驱动程序,并确保它与您当前的 NVML 库版本兼容。

如果更新驱动程序不起作用,您还可以尝试降级 NVML 库版本,使其与当前安装的 NVIDIA 驱动程序兼容。您可以从 NVIDIA Developer 网站下载适用于您的系统的 NVML 库的旧版本,并将其安装到您的系统中。

如果以上方法都不起作用,您可能需要进一步检查系统中的其他配置或依赖项,以确保 NVIDIA 驱动程序与 NVML库版本匹配,并且系统设置正确。您还可以考虑重新安装 NVIDIA 驱动程序和 NVML 库,以解决潜在的安装问题。

而我在互联网冲浪时也得到了类似的答复

在这里插入图片描述

并且给出的解决办法是这样的:

解决办法一、更新驱动
1.卸载驱动
sudo apt-get purge nvidia*
2.查找可用的驱动版本
ubuntu-drivers devices

查找本机内核版本:

cat /proc/driver/nvidia/version

发现为440.33.01

于是尝试安装440版本的驱动:

sudo apt-get install nvidia-driver-440 nvidia-settings nvidia-prime

然而安装失败,某些包不匹配,系统解决不了错误,卡了一会时间。

最终尝试安装415版本的,安装成功了

sudo apt-get install nvidia-driver-415 nvidia-settings nvidia-prime

当然还有人这么建议,相当哇塞!!!

解决办法二、重启

这个方法在我的实战经历中我发现,凡是cudadriver不一样的情况下大多数都可以

在这里插入图片描述

解决办法三、其他方法

这种方法还是挺好想的,但是我确实没想到哦,让我们感谢质数哥!

我尝试了几种思路:
1.最简单的是重启,貌似能解决;
2.重启不能解决就换重新安装了,后来就把一个固定的driver安装文件保存在本地,出了问题就重新sudo安装,好像也行,就是折腾;
3.固定版本,这个我试过,好像不咋好用;
4.设置驱动不更新,这个到目前为止还没出现问题。

上面4个方法是我都一一尝试过的,我用的系统是ubuntu的,具体方法也都是在知乎和csdn找的。

作者链接:质数 - 知乎

终极方法:关闭自动更新

在这里插入图片描述

相关链接

完结撒花

我为什么要教阿三哥使用筷子呢?

底下评论

问题一:

把驱动卸载了发现居然还有重启大法。。。

问题二:

第一次出现,重启解决了,第二次出现,重启也解决不了

问题三:

是因为重启会自动更新内核来适应驱动哈哈哈

问题四:

哈哈哈哈,太有意思了,反正类似的问题确实有一些可以重启解决

问题五:

不行了,装最低的版本都报错了

问题一:

重启试试呢







鳗小鱼

【已解决】Failed to initialize NVML: Driver/library version mismatch NVML library version: 535.161

标签:06,NVML,系列,04,09,library,04.1,common,libnvidia
From: https://blog.csdn.net/weixin_54626591/article/details/142999955

相关文章

  • 《刚刚问世》系列初窥篇-Java+Playwright自动化测试-2-环境准备与搭建-基于Maven(详细
    1.简介上一篇宏哥已经讲解和分享了如何通过引入jar包来搭建Java+Playwright自动化测试环境,这一种是比较老的方法,说白了就是过时的老古董,但是我们必须了解和知道,其实maven搭建无非也就是下载引入相关的jar包,只不过相比之下是简单方便了,了解其本质可以帮助我们更好的学习maven搭建......
  • C#的自定义对话框和提示窗体 - 开源研究系列文章
          上次的应用因为需要用到对话框和提示窗体,然后系统自带的MessageBox界面个人又看不上,所以就想自己编写一个自定义的窗体,于是有了本文,具体的已经应用到笔者其它的应用里了。 1、项目目录;  2、源码介绍;1)实现;        2)......
  • PTA L1系列题解(C语言)(L1_073 -- L1_080)
    L1-073人与神题目内容:L1-073人与神-团体程序设计天梯赛-练习集(pintia.cn)跨界大神L.PeterDeutsch有一句名言:“Toiterateishuman,torecursedivine.”(迭代的是人,递归的是神)。本题就请你直接在屏幕上输出这句话。输入格式:本题没有输入。输出格式:在一行中输......
  • RabbitMQ系列学习笔记(三)--工作队列模式
    文章目录一、工作队列模式原理二、工作队列模式实战1、抽取工具类2、消费者代码3、生产者代码4、查看运行结果本文参考尚硅谷RabbitMQ教程丨快速掌握MQ消息中间件rabbitmqRabbitMQ详解Centos7环境安装Erlang、RabbitMQ详细过程(配图)一、工作队列模式原理与......
  • 作物与杂草的智能识别,基于YOLOv8全系列参数模型【n/s/m/lx/】开发构建田间低头作物杂
    一、背景田间杂草的有效管理是现代农业生产中面临的重要挑战之一。杂草不仅竞争作物的养分、水分和阳光,还可能成为害虫和病原体的寄主,从而降低农作物的产量和品质。因此,开发高效、精确的杂草检测和管理系统对于提高农业生产效率、降低化学除草剂的使用以及保护环境具有重要......
  • Aubo Robotics 工业机器人系列编程:i10a_Aubo-i10a机器人的系统架构与硬件组成
    Aubo-i10a机器人的系统架构与硬件组成在上一节中,我们介绍了Aubo-i10a机器人的基本概念和应用场景。本节将深入探讨Aubo-i10a机器人的系统架构和硬件组成,帮助您更好地理解机器人内部的工作原理和各个组件的功能。1.系统架构概述1.1系统架构图Aubo-i10a机器人的系统架......
  • Aubo Robotics 工业机器人系列编程:i10a_Aubo-i10a系统集成与项目管理
    Aubo-i10a系统集成与项目管理在工业机器人领域,系统集成与项目管理是确保机器人项目成功实施的关键步骤。本节将详细介绍Aubo-i10a工业机器人在系统集成和项目管理中的核心原理和具体操作,包括系统集成的步骤、项目管理的最佳实践以及相关的编程示例。系统集成概述系统集......
  • Gstreamer系列(5):Gstreamer在arm平台(Nano, Orin, Xavier等)使用硬编码对视频进行保存mp
            在工程实践中,通常使用使用英伟达版板卡作为图像处理的控制器,常见的有xavier,TX2,orin,Nano等,这些控制器使用Gstreamer进行硬件编码的插件通常为omxh264enc,nvv4l2h264enc。本文将基于这两个插件进行介绍区别,并给出使用示例本。本系列其他文章有:Gstreamer系......
  • 《RabbitMQ系列》之RabbitMQ的4种Exchange
    大家好,我是tc,今天为大家介绍一下RabbitMQ中的4种exchange,水平一般,能力有限,若有错误之处,欢迎指正。 对RabbitMQ稍有了解的朋友应该都知道,在RabbitMQ中,一个有4中Exchange,分别是direct、topic、fanout、headers。其实,还有一个默认的交换机,称为defaultexchange,其本质也是一个di......
  • 数据结构1系列题解前瞻
    A.线段树分裂算法:线段树、(平衡树?)板子题,不多做评价。但是开发空间很大,我的写法在洛谷题解上没找到,导致当时想贺题解没贺成。B.三元上升子序列算法:线段树、树状数组、分块、(CDQ分治?)二维偏序板子,开发空间极大,想怎么写就怎么写。C.STEP算法:线段树、分块线段树维护子区间信......