首页 > 其他分享 >Cuda 驱动安装

Cuda 驱动安装

时间:2024-11-14 23:09:37浏览次数:1  
标签:kernel enable x86 -- 64 Cuda 驱动 安装 el7

Author: ACatSmiling

Since: 2024-11-13

CUDA(Compute Unified Device Architecture):是 NVIDIA 推出的一种并行计算平台和编程模型,它允许开发者利用 NVIDIA GPU(图形处理器)的强大计算能力进行通用计算,而不仅仅局限于图形处理。简单来说,CUDA 提供了一种方式,让程序员可以像编写 CPU 程序一样来编写能够在 GPU 上高效运行的程序。

安装步骤:

  1. 根据操作系统版本和 GPU 型号等,下载对应的 cuda 驱动,下载地址:https://developer.nvidia.com/cuda-downloads

    image-20241114230828037

  2. 检查服务器 GPU 识别情况,确保 GPU 卡能够完全识别,如不能识别,需要进行重新插拔、对调测试等步骤进行硬件排查。

    [root@desong-gpu-wushan ~]# lspci | grep -i nvidia
    00:07.0 3D controller: NVIDIA Corporation Device 2236 (rev a1)
    
  3. 安装 gcc,g++ 编译器。(GPU 驱动安装时,需要 gcc 编译器)

    [root@desong-gpu-wushan ~]# gcc -v
    Using built-in specs.
    COLLECT_GCC=gcc
    COLLECT_LTO_WRAPPER=/usr/libexec/gcc/x86_64-redhat-linux/4.8.5/lto-wrapper
    Target: x86_64-redhat-linux
    Configured with: ../configure --prefix=/usr --mandir=/usr/share/man --infodir=/usr/share/info --with-bugurl=http://bugzilla.redhat.com/bugzilla --enable-bootstrap --enable-shared --enable-threads=posix --enable-checking=release --with-system-zlib --enable-__cxa_atexit --disable-libunwind-exceptions --enable-gnu-unique-object --enable-linker-build-id --with-linker-hash-style=gnu --enable-languages=c,c++,objc,obj-c++,java,fortran,ada,go,lto --enable-plugin --enable-initfini-array --disable-libgcj --with-isl=/builddir/build/BUILD/gcc-4.8.5-20150702/obj-x86_64-redhat-linux/isl-install --with-cloog=/builddir/build/BUILD/gcc-4.8.5-20150702/obj-x86_64-redhat-linux/cloog-install --enable-gnu-indirect-function --with-tune=generic --with-arch_32=x86-64 --build=x86_64-redhat-linux
    Thread model: posix
    gcc version 4.8.5 20150623 (Red Hat 4.8.5-16) (GCC) 
    [root@desong-gpu-wushan ~]# g++ -v
    Using built-in specs.
    COLLECT_GCC=g++
    COLLECT_LTO_WRAPPER=/usr/libexec/gcc/x86_64-redhat-linux/4.8.5/lto-wrapper
    Target: x86_64-redhat-linux
    Configured with: ../configure --prefix=/usr --mandir=/usr/share/man --infodir=/usr/share/info --with-bugurl=http://bugzilla.redhat.com/bugzilla --enable-bootstrap --enable-shared --enable-threads=posix --enable-checking=release --with-system-zlib --enable-__cxa_atexit --disable-libunwind-exceptions --enable-gnu-unique-object --enable-linker-build-id --with-linker-hash-style=gnu --enable-languages=c,c++,objc,obj-c++,java,fortran,ada,go,lto --enable-plugin --enable-initfini-array --disable-libgcj --with-isl=/builddir/build/BUILD/gcc-4.8.5-20150702/obj-x86_64-redhat-linux/isl-install --with-cloog=/builddir/build/BUILD/gcc-4.8.5-20150702/obj-x86_64-redhat-linux/cloog-install --enable-gnu-indirect-function --with-tune=generic --with-arch_32=x86-64 --build=x86_64-redhat-linux
    Thread model: posix
    gcc version 4.8.5 20150623 (Red Hat 4.8.5-16) (GCC) 
    
    • yum install gccyum install gcc-c++
  4. 安装 kernel-devel 和 kernel-headers 软件包。

    [root@desong-gpu-wushan ~]# yum list | grep kernel
    Repodata is over 2 weeks old. Install yum-cron? Or run: yum makecache fast
    kernel.x86_64                             3.10.0-693.el7               @anaconda
    kernel-abi-whitelists.noarch              3.10.0-693.el7               @base-52 
    kernel-devel.x86_64                       3.10.0-693.el7               @anaconda
    kernel-headers.x86_64                     3.10.0-693.el7               @anaconda
    kernel-tools.x86_64                       3.10.0-693.el7               @anaconda
    kernel-tools-libs.x86_64                  3.10.0-693.el7               @anaconda
    abrt-addon-kerneloops.x86_64              2.1.11-60.el7.centos         base     
    erlang-kernel.x86_64                      R16B-03.18.el7               epel     
    kernel.x86_64                             3.10.0-1160.42.2.el7         updates  
    kernel-abi-whitelists.noarch              3.10.0-1160.42.2.el7         updates  
    kernel-debug.x86_64                       3.10.0-1160.42.2.el7         updates  
    kernel-debug-devel.x86_64                 3.10.0-1160.42.2.el7         updates  
    kernel-devel.x86_64                       3.10.0-1160.42.2.el7         updates  
    kernel-doc.noarch                         3.10.0-1160.42.2.el7         updates  
    kernel-headers.x86_64                     3.10.0-1160.42.2.el7         updates  
    kernel-tools.x86_64                       3.10.0-1160.42.2.el7         updates  
    kernel-tools-libs.x86_64                  3.10.0-1160.42.2.el7         updates  
    kernel-tools-libs-devel.x86_64            3.10.0-1160.42.2.el7         updates  
    libreport-plugin-kerneloops.x86_64        2.1.11-53.el7.centos         base     
    lirc-disable-kernel-rc.noarch             0.10.0-16.el7                epel     
    php-symfony-http-kernel.noarch            2.8.12-2.el7                 epel     
    texlive-l3kernel.noarch                   2:svn29409.SVN_4469-45.el7   base     
    texlive-l3kernel-doc.noarch               2:svn29409.SVN_4469-45.el7   base
    
    • yum install kernet-devel-$(uname -r) kernel-headers-$(uname -r)
  5. 禁用系统自带的 nouveau 模块。

    # 检查 nouveau 模块是否加载
    [root@desong-gpu-wushan ~]# lsmod | grep nouveau
    nouveau              1622010  0 
    mxm_wmi                13021  1 nouveau
    wmi                    19070  2 mxm_wmi,nouveau
    video                  24520  1 nouveau
    i2c_algo_bit           13413  1 nouveau
    drm_kms_helper        159169  2 cirrus,nouveau
    ttm                    99345  2 cirrus,nouveau
    drm                   370825  5 ttm,drm_kms_helper,cirrus,nouveau
    i2c_core               40756  5 drm,i2c_piix4,drm_kms_helper,i2c_algo_bit,nouveau
    
    # 编辑 /usr/lib/modprobe.d/dist-blacklist.conf,添加以下内容,如果没有则创建
    [root@desong-gpu-wushan modprobe.d]# vim /usr/lib/modprobe.d/dist-blacklist.conf
    blacklist nouveau
    options nouveau modeset=0
    
    # 使内核生效
    [root@desong-gpu-wushan modprobe.d]# dracut -force
    
  6. 修改系统运行级别为文本模式,GPU 驱动安装必须在文本模式下进行。

    [root@desong-gpu-wushan modprobe.d]# systemctl set-default multi-user.target
    Removed symlink /etc/systemd/system/default.target.
    Created symlink from /etc/systemd/system/default.target to /usr/lib/systemd/system/multi-user.target.
    # 重启系统
    [root@desong-gpu-wushan modprobe.d]# reboot
    
  7. 验证 nouveau 模块禁用生效,并进入文本模式。

    [root@desong-gpu-wushan ~]# lsmod | grep nouveau
    
  8. cuda 安装。

    # 赋予 cuda 安装包可执行权限
    [root@desong-gpu-wushan ~]# chmod +x cuda_12.2.0_535.54.03_linux.run
    # 执行 cuda 安装命令
    [root@desong-gpu-wushan ~]# ./cuda_12.2.0_535.54.03_linux.run --no-opengl-libs
    

    image-20241113164756822

    image-20241113164802852

    • 默认全部安装,如果已经安装过 GPU 驱动,则取消 Driver 选项的勾选。
    Driver:   Installed
    Toolkit:  Installed in /usr/local/cuda-12.2/
    
    Please make sure that
    
     -   PATH includes /usr/local/cuda-12.2/bin
     -   LD_LIBRARY_PATH includes /usr/local/cuda-12.2/lib64, or, add /usr/local/cuda-12.2/lib64 to /etc/ld.so.conf and run ldconfig as root
    
    To uninstall the CUDA Toolkit, run cuda-uninstaller in /usr/local/cuda-12.2/bin
    To uninstall the NVIDIA Driver, run nvidia-uninstall
    Logfile is /var/log/cuda-installer.log
    
  9. 配置环境变量。

    [root@desong-gpu-wushan ~]# vim /etc/profile
    export PATH=/usr/local/cuda/bin:$PATH
    export LD_LIBRARY_PATH=/usr/local/cuda/lib64:$LD_LIBRARY_PATH
    
  10. 生效环境变量。

    [root@desong-gpu-wushan ~]# source /etc/profile
    
  11. 测试 cuda 是否安装成功。

    [root@desong-gpu-wushan ~]# nvcc -V
    nvcc: NVIDIA (R) Cuda compiler driver
    Copyright (c) 2005-2023 NVIDIA Corporation
    Built on Tue_Jun_13_19:16:58_PDT_2023
    Cuda compilation tools, release 12.2, V12.2.91
    Build cuda_12.2.r12.2/compiler.32965470_0
    
  12. 修改系统运行级别为图形模式,然后重启系统。

    [root@desong-gpu-wushan ~]# systemctl set-default graphical.target
    Removed symlink /etc/systemd/system/default.target.
    Created symlink from /etc/systemd/system/default.target to /usr/lib/systemd/system/graphical.target.
    [root@desong-gpu-wushan ~]# reboot
    
  13. 验证GPU驱动及CUDA安装成功,以及图形化界面显示正常。

    [root@desong-gpu-wushan ~]# nvidia-smi
    Wed Nov  6 07:18:06 2024       
    +---------------------------------------------------------------------------------------+
    | NVIDIA-SMI 535.54.03              Driver Version: 535.54.03    CUDA Version: 12.2     |
    |-----------------------------------------+----------------------+----------------------+
    | GPU  Name                 Persistence-M | Bus-Id        Disp.A | Volatile Uncorr. ECC |
    | Fan  Temp   Perf          Pwr:Usage/Cap |         Memory-Usage | GPU-Util  Compute M. |
    |                                         |                      |               MIG M. |
    |=========================================+======================+======================|
    |   0  NVIDIA A10                     Off | 00000000:00:07.0 Off |                    0 |
    |  0%   39C    P0              58W / 150W |      4MiB / 23028MiB |      0%      Default |
    |                                         |                      |                  N/A |
    +-----------------------------------------+----------------------+----------------------+
                                                                                             
    +---------------------------------------------------------------------------------------+
    | Processes:                                                                            |
    |  GPU   GI   CI        PID   Type   Process name                            GPU Memory |
    |        ID   ID                                                             Usage      |
    |=======================================================================================|
    |  No running processes found                                                           |
    +---------------------------------------------------------------------------------------+
    

标签:kernel,enable,x86,--,64,Cuda,驱动,安装,el7
From: https://www.cnblogs.com/acatsmiling/p/18547059

相关文章

  • 知识管理驱动,打造企业知识中台业务管理新模式
    在数字化时代,知识已成为企业最宝贵的资产之一。如何高效地管理、整合和利用知识资源,成为企业提升竞争力、实现可持续发展的关键。知识管理驱动的企业知识中台业务管理新模式,正是为了应对这一挑战而诞生的。本文将深入探讨知识管理在打造企业知识中台过程中的核心价值、实施路径及......
  • AI知识库驱动:电商供应链智能化优化新策略
    随着人工智能技术的飞速发展,AI知识库在电商供应链中的应用日益广泛,为库存管理、订单处理、物流配送等关键环节带来了智能化改进。AI知识库作为一个集成了海量数据、通过高级算法进行智能分析和处理的信息系统,正在深刻改变电商供应链的运营模式和效率。本文将详细分析AI知识......
  • Yashandb数据库YCM安装
    YashandbYCM安装到官网下载YCM软件:https://download.yashandb.com/download开机自启前提管理平台开机自启需要确保对rc.local有可执行权限,可执行以下命令:#chmod+x/etc/rc.local将软件包上传至yasmanager用户/home/yasmanager路径下:[root@yashanyasmanager]#ta......
  • 【Inventor pro 2025下载与安装教程 含破解】
    1、安装包「Inventorpro2025」:链接:https://pan.quark.cn/s/d5d3bd812ae7提取码:Jp9B「Inventor2024」:链接:https://pan.quark.cn/s/8c39fc4bc193提取码:xdG5「Inventor2019」:链接:https://pan.quark.cn/s/8d7326f76cce提取码:XfSc2、安装教程(建议关闭杀毒软件)1)  ......
  • hadoop单机版本安装步骤
    1.5安装Hadoop1.5.1上传、解压hadoop安装文件:hadoop335解压缩[root@192~]#tar-zxvfhadoop-3.3.5.tar.gz重命名[root@192~]#mvhadoop-3.3.5hadoop3删除安装文件[root@192~]#rm-fhadoop-3.3.5.tar.gz1.5.2修改配置文件修改core-site.xml[root@192~]#vi......
  • gRPC cmake Visual Studio编译安装 (全命令行)
    gRPCcmake编译安装(全命令行)重要前言:所有在引用框中的命令都不要输入!!cmake--install. #在引用框中的不要输入到命令行cmake--install.--configDebug #命令没有被引用框包裹,需要输入到命令行中0x00环境配置vs2022,git,cmake,Powershell7<管理员......
  • 红队老子养成记 - 最新灯塔神器(全网失传)安装教程,信息收集利器!
    大家好,我是Dest1ny!今天是红队专题中的工具篇-信息收集。信息收集的好,随便拿shell!灯塔就是一个不错的选择,但是docker上已经没有他的镜像了,所以才有了这篇教程!CLASS-1下载1.首先去下载我寻找到的镜像zip,2.6.1,用docker导入就可以了! 这里使用的百度网盘的资源!!通过网......
  • Dosbox-x安装WinXP——图文教程
    一、前言很多老游戏只能在win95、98或者XP中运行,因此,很多人尝试将Win95、98安装到Dosbox中,利用Dosbox来玩那些久远的情怀。有Win98自然就有人想在Dosbox中安装更高级的Win系统,于是就有人尝试在Dosnox中安装Win2000、WinXP的,其中2023-07-03在国外的fabulous.systems出现了一篇利用......
  • Intellij IDEA如何设置中文版?安装中文汉化包插件?失败问题解决!
    前言大家好,我是小徐啊。IntellijIDEA默认是英文的操作界面,因为是外国人开发的嘛~对于英文好一点的同学来说,英文就英文吧,但对于英文比较差的同学,就还是希望能够汉化一下,变成熟悉的中文。今天小徐就来介绍下如何在IDEA中安装汉化插件,以及在这过程中,我遇到的奇怪问题,以及最后如何......
  • centOS7 docker 安装步骤
    一、安装前检查工作:1.检查/etc/yum.repos.d/CentOS-Base.repo文件是否存在,如果不存在,从网络仓库中复制一份新的CentOS-Base.repo文件。sudocurl-o/etc/yum.repos.d/CentOS-Base.repohttp://mirrors.aliyun.com/repo/Centos-7.repo或者使用wget:sudowget-O/etc/yum.r......