首页 > 其他分享 >阿里云轻量级 GPU 实例安装 NVIDIA 驱动

阿里云轻量级 GPU 实例安装 NVIDIA 驱动

时间:2024-02-06 19:34:47浏览次数:33  
标签:non NVIDIA driver free nvidia GPU 轻量级 distro

实例规格:轻量级 GPU 实例 vgn6i-vws / ecs.vgn6i-m4-vws.xlarge(4vCPU 23GiB)
操作系统:Ubuntu 22.04

第一部分:尝试失败的安装方法

查询 NVIDIA 产品型号

lspci | grep -i nvidia

输出

00:07.0 VGA compatible controller: NVIDIA Corporation TU104GL [Tesla T4] (rev a1)

根据产品型号去 NVIDIA 官网下载驱动

wget -c https://us.download.nvidia.cn/tesla/535.154.05/nvidia-driver-local-repo-ubuntu2204-535.154.05_1.0-1_amd64.deb

安装驱动

cp /var/nvidia-driver-local-repo-ubuntu2204-535.154.05/nvidia-driver-local-91B8C5A2-keyring.gpg /usr/share/keyrings/
dpkg -i nvidia-driver-local-repo-ubuntu2204-535.154.05_1.0-1_amd64.deb
apt update
apt install nvidia-driver-535 nvidia-dkms-535
reboot

重启后运行 nvidia-smi 命令却出现下面的错误,驱动没有安装成功

NVIDIA-SMI has failed because it couldn't communicate with the NVIDIA driver. Make sure that the latest NVIDIA driver is installed and running.

接着用 ubuntu-drivers devices 命令查看 nvidia 驱动版本

modalias : pci:v000010DEd00001EB8sv000010DEsd0000130Ebc03sc00i00
vendor   : NVIDIA Corporation
model    : TU104GL [Tesla T4]
manual_install: True
driver   : nvidia-driver-470-server - distro non-free
driver   : nvidia-driver-470 - distro non-free
driver   : nvidia-driver-525-server - distro non-free
driver   : nvidia-driver-418-server - distro non-free
driver   : nvidia-driver-535-server - distro non-free
driver   : nvidia-driver-545 - distro non-free
driver   : nvidia-driver-525 - distro non-free recommended
driver   : nvidia-driver-450-server - distro non-free
driver   : xserver-xorg-video-nouveau - distro free builtin

然后用下面的命令安装

apt install nvidia-driver-525-server

重启后问题依旧

第二部分:正确的安装方法

在阿里云官网找到这篇帮助文档——在GPU虚拟化型实例中安装GRID驱动(Linux),通过下面的命令成功完成了安装

if acs-plugin-manager --list --local | grep grid_driver_install > /dev/null 2>&1
then
    acs-plugin-manager --remove --plugin grid_driver_install
fi

acs-plugin-manager --exec --plugin grid_driver_install

nvidia-smi 命令输出结果:

标签:non,NVIDIA,driver,free,nvidia,GPU,轻量级,distro
From: https://www.cnblogs.com/dudu/p/18010103

相关文章

  • nvidia-persistenced failed to initialize. Check syslog for more details.
    nvidia-smi-pm-1#Internalnvidia-smierror.Unexpectedmodificationoperation./usr/bin/nvidia-persistenced--verbose#nvidia-persistencedfailedtoinitialize.Checksyslogformoredetails.nvidia-persistenced--persistence-mode#nvidia-persisten......
  • 告别 GPU 焦虑,玩转极致性价比的 CPU 文生图
    作者:壮怀、竹刚AIGC中的StableDiffusion文生图模型是开源流行的跨模态生成模型,用于生成给定文本对应的图像。但由于众所周知的原因,GPU资源出现了一卡难求的现状,如何通过云计算快速提升业务规模,降低文生图的计算成本,以及更好的保护自定义的扩展模型?针对文生图模型特性和规模......
  • Proxmox 7.4 使用vgpu_unlock,为GTX1060开启vGPU支持
    本文在2021年发布的博客《Proxmox5.4使用vgpu_unlock,为GTX1060开启vGPU支持》,介绍了ProxmoxVE5.4上部署vGPUunlock的操作步骤。 后续有发布了在 ProxmoxVE7.x上支持vGPU的博客《Proxmox7.2部署DoraCloud桌面云,支持vGPU》,实现了通过3个脚本完成vGPU的配置。 ......
  • go-carbon v2.3.8 发布,轻量级、语义化、对开发者友好的 golang 时间处理库
    carbon是一个轻量级、语义化、对开发者友好的golang时间处理库,支持链式调用。目前已被awesome-go收录,如果您觉得不错,请给个star吧github.com/golang-module/carbongitee.com/golang-module/carbon安装使用Golang版本大于等于1.16//使用github库goget-ugithu......
  • NVIDIA显卡驱动NVIDIA-Linux-x86_64-545.29.02 安装错误分析之一
    software/NVIDIA-Linux-x86_64-545.29.02/kernel-open/nvidia/libspdm_shash.c:在函数‘lkca_hmac_duplicate’中:/software/NVIDIA-Linux-x86_64-545.29.02/kernel-open/nvidia/libspdm_shash.c:90:26:错误:implicitdeclarationoffunction‘crypto_tfm_ctx_aligned’;didy......
  • Stable Code 3B:轻量级编程助手,无GPU本地运行
    引言StabilityAI近期发布了StableCode3B,这是一个集中了多项创新技术的轻量级编程辅助模型。它在保持轻量的同时,展现出了与大型模型如CodeLLaMA7B相媲美的性能,这一特性使其在没有GPU的环境中也能运行,极大地拓宽了其应用范围。模型概述StableCode3B,作为一款拥有30亿参数的编程......
  • nvtop —— GPU使用情况的可视化工具
    安装:sudoaptinstallnvtop......
  • PVE直通Nvidia显卡
    本文参考:PVE开启硬件直通功能、PVE7.3优化和显卡直通、PVE开启硬件显卡直通功能、PVE设置显卡直通、proxmoxPCIPassthrough简介其实网络上有很多不错的文章讲述了如何直通显卡,也有简单易用的脚本帮你直通(pvetools)。我也成功在pve上直通n卡给win10,但是在Debian12上,我一直没办......
  • 深度学习框架:为啥不同的框架,不同的运行设备(GPU/CPU/NPU),运算出的结果性能会有一定百分
    经常会遇到有人在网上说,TensorFlow的计算结果比pytorch的高上几个百分点,也有人说RTX3090的计算结果没有A100的好,还有人说NPU的计算结果比GPU的高,而且这种说法在业内也是极为常见的,甚至在读书时的实验室里和人交流也会有这种反馈,这里对其说说自己的理解。算法本质导致的随机性,......
  • 英伟达H20 GPU中企首个订单已签订,计划今年第二季度量产
    据东方国信发布的消息,该公司联同紫光股份、新华三集团签署了一份协议,其中新华三集团将向东方国信供应英伟达特供版H20GPU算力服务器。这是英伟达特供版AI芯片在中国市场的第一个订单。此外,据报道,百度、字节跳动、腾讯和阿里巴巴四家企业共同向英伟达订购了价值50亿美元的AI芯片......