首页 > 系统相关 >Ubuntu安装CUDA工具包、cuDNN、TensorRT

Ubuntu安装CUDA工具包、cuDNN、TensorRT

时间:2023-06-02 23:35:51浏览次数:39  
标签:安装 TensorRT cuDNN cuda usr https local CUDA

简介一下这三个东西:

CUDA:是一种针对支持 CUDA 功能的 GPU(图形处理器)的 C 语言开发环境。

cuDNN:是GPU加速的用于深度神经网络的原语库。cuDNN为标准例程提供了高度优化的实现,例如向前和向后卷积,池化,规范化和激活层。

TensorRT:是nvidia家的一款高性能深度学习推理SDK。此SDK包含深度学习推理优化器和运行环境,可为深度学习推理应用提供低延迟和高吞吐量。在推理过程中,基于TensorRT的应用程序比仅仅使用CPU作为平台的应用程序要快40倍。

### 一、安装CUDA

#### 1.卸载已安装的NVIDIA驱动

安装CUDA工具包时,如果系统中有已安装过的驱动,则会无法顺利安装,所以先看一下系统是否已经安装过NVIDIA驱动

用如下命令进行查看已安装的驱动

```
dpkg -l | grep nvidia
```

如果存在已安装的驱动,用如下命令进行卸载

```
sudo systemctl stop nvidia*
sudo apt-get remove --purge '^nvidia-.*'
sudo apt-get autoremove
sudo rm /etc/X11/xorg.conf
sudo reboot
```

#### 2. 安装CUDA工具包

首先需要得知你的显卡适配什么版本的工具包,打开你的cmd (由于你的驱动已经卸载,ubuntu下之后的命令无法使用,这里建议切换到Windows系统)

```
nvidia-smi
```

会显示你适配的CUDA版本,这里我的系统适配11.6。所以之后的安装包我以11.6为例

![](https://img01.anzhiy.cn/useruploads/163/2023/05/27/647207ee1cab2.png)

进入[NVIDIA官网](https://developer.nvidia.com/cuda-toolkit-archive)下载

![](https://img01.anzhiy.cn/useruploads/163/2023/05/24/646e297c5593e.png)

选取合适的版本进行下载即可,我这里的命令是

```
wget https://developer.download.nvidia.com/compute/cuda/11.6.0/local_installers/cuda_11.6.0_510.39.01_linux.runsudo sh cuda_11.6.0_510.39.01_linux.run
```

选择accept

![](/i/ll/?i=ae1626a938c943e48b8da82ad5360a98.png#pic_center)

 

选择install

![](https://img01.anzhiy.cn/useruploads/163/2023/05/24/646e297c3f747.png)

#### 3. 配置环境变量

```
vim ~/.bashrc
```

在最后添加如下两行

```
export PATH=/usr/local/cuda-11.6/bin:$PATH
export LD_LIBRARY_PATH=/usr/local/cuda-11.6/lib64:$LD_LIBRARY_PATH
```

#### 4.验证

最后验证一下是否正确安装

```
nvcc --version
```

![](https://img01.anzhiy.cn/useruploads/163/2023/05/24/646e297c3f747.png)

### 二、安装cuDNN

#### 1.安装cuDNN包

来到我们的[官网](https://developer.nvidia.com/rdp/cudnn-archive#a-collapse805-111)

选择合适的CUDA版本下载安装包

![](https://img01.anzhiy.cn/useruploads/163/2023/05/27/647207efbfbcc.png)

#### 2. 安装cuDNN

(1)先将安装包解压缩,可以使用Tab键自动补全压缩包名称。(如果下载的是别的类型安装包可以参考[官方文档](https://developer.nvidia.com/nvidia-tensorrt-download))

```
tar -xvf cudnn-linux-x86_64-8.x.x.x_cudaX.Y-archive.tar.xz
```

(2)将cuDNN文件夹下的文件复制到CUDA安装目录下

```
sudo cp cudnn-*-archive/include/cudnn*.h /usr/local/cuda/include
sudo cp -P cudnn-*-archive/lib/libcudnn* /usr/local/cuda/lib64
sudo chmod a+r /usr/local/cuda/include/cudnn*.h /usr/local/cuda/lib64/libcudnn*
```

#### 3.验证

```
cat /usr/local/cuda/include/cudnn_version.h | grep CUDNN_MAJOR -A 2
```

![](https://img01.anzhiy.cn/useruploads/163/2023/05/27/64720a1fc80d6.png)

这就OK了

### 三、安装TensorRT

#### 1.安装TensorRT包

来到我们的[下载页面](https://developer.nvidia.com/tensorrt)

这里你先要注册一个账号,具体就不细说了,注册完可以看到这个界面

![](https://img01.anzhiy.cn/useruploads/163/2023/05/27/647207efc842b.png)

选择下载与自身系统和CUDA版本适配的包,这里注意要下与自身设备匹配格式的安装,比如我需要的是x86_64,一开始下载了arm格式的,出现了很多问题,浪费了时间。安装包很大,注意一下网络的稳定性。

#### 2.安装TensorRT

```
tar -zxvf TensorRT-8.4.1.5.Ubuntu-20.04.aarch64-gnu.cuda-11.6.cudnn8.4.tar.gz
```

移动TensorRT文件夹到/usr/local

```
sudo mv TensorRT-8.6.1.6 /usr/local
```

#### 3.配置环境变量

```
vim ~/.bashrc
```

最后添加一下内容

```
export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/TensorRT-8.6.1.6/lib
export C_INCLUDE_PATH=$C_INCLUDE_PATH:/usr/local/TensorRT-8.6.1.6/include
export CPLUS_INCLUDE_PATH=$CPLUS_INCLUDE_PATH:/usr/local/TensorRT-8.6.1.6/include
```

#### 4.验证

进入下面命令指定的文件夹

```
cd /usr/local/TensorRT-8.6.1.6/samples/sampleOnnxMNIST/
```

编译

```
sudo make
```

![](https://img01.anzhiy.cn/useruploads/163/2023/05/27/647207ef665d9.png)

进入bin文件夹,运行刚刚生成的可执行文件

```
cd ../../bin
./sample_onnx_minst
```

 

 

![](https://img01.anzhiy.cn/useruploads/163/2023/05/27/647207efac27f.png)

这样就算成功了

标签:安装,TensorRT,cuDNN,cuda,usr,https,local,CUDA
From: https://www.cnblogs.com/nobodyx/p/17453106.html

相关文章

  • CUDA ---- Hello World From GPU
    本篇博文仅实现helloworld,先看到效果,具体细节将在后续博文解释。准备如果你是第一次使用CUDA,在Linux下可以使用下面的命令来检查CUDA编译器是否安装正确:$whichnvcc一般,该指令输出为:/usr/local/cuda/bin/nvcc另外,你可能还需要检查下你机器上的GPU型号,可以使用给下面的命令查询:$l......
  • pytorch 训练 RuntimeError Unable to find a valid cuDNN algorithm to run convolut
    pytorch训练RuntimeError:UnabletofindavalidcuDNNalgorithmtorunconvolutionpytorch训练RuntimeError:UnabletofindavalidcuDNNalgorithmtorunconvolution#问题描述:python:3.95pytorch:1.10.2pythontrain.py--img640--batch64--epochs600--da......
  • 项目场景 with ERRTYPE = cudaError CUDA failure 999 unknown error
    项目场景[withERRTYPE=cudaError;boolTHRW=true]CUDAfailure999:unknownerror;GPU=24:需要升级之前老的程序,之前的cuda是10.2问题描述:环境cuda11.2(之前是10.2)onnxruntime-gpu1.10python3.9.7启动程序的时候Traceback(mostrecentcalllast):File"/home/a......
  • 项目场景 with ERRTYPE = cudaError CUDA failure 999 unknown error
    项目场景[withERRTYPE=cudaError;boolTHRW=true]CUDAfailure999:unknownerror;GPU=24:需要升级之前老的程序,之前的cuda是10.2问题描述:环境cuda11.2(之前是10.2)onnxruntime-gpu1.10python3.9.7启动程序的时候Traceback(mostrecentcalllast):File"/home/a......
  • OpenCV 和 TensorRT 之间的数据转换 HWC to CHW
    TensorRT做图像相关模型部署的时候,导入图片的数据存储往往是BHWC(Batch,Height,Width,Channel),而TensorRT推理的时候是BCHW.OpenCV和TensorRT之间的数据转换(BHWCtoBCHW),一般是所有元素遍历赋值:cv::Matorigin_image=cv::imread("test.jpg",1);if(!orig......
  • pytorch1.4.0 CUDA11.0 python3.7安装记录
    参考过程CUDA安装教程CUDA教程2找到自己电脑显卡的cuda版本CUDA是什么版本是11.0.140安装CUDA11.1下载链接,但是我们不用这个我们用的是11.0最新版的下载地址下载选项设置(害,整整2个多G啊)。可以在下载按钮的地方右键,复制链接,然后在迅雷下面下载。虽然慢但是稳定。不过用Chrome复......
  • linux安装cuda11.3 多版本切换
    https://developer.nvidia.com/cuda-toolkit-archivelsb_release查看ubuntu版本,选择对应版本后通过runfile安装:wgethttps://developer.download.nvidia.com/compute/cuda/11.3.1/local_installers/cuda_11.3.1_465.19.01_linux.runsudoshcuda_11.3.1_465.19.01_linux.run......
  • 【模型部署 01】C++实现分类模型(以GoogLeNet为例)在OpenCV DNN、ONNXRuntime、TensorRT
    深度学习领域常用的基于CPU/GPU的推理方式有OpenCVDNN、ONNXRuntime、TensorRT以及OpenVINO。这几种方式的推理过程可以统一用下图来概述。整体可分为模型初始化部分和推理部分,后者包括步骤2-5。以GoogLeNet模型为例,测得几种推理方式在推理部分的耗时如下:结论:GPU加速首选Tens......
  • cuda版本和显卡计算能力
    nvidia不同架构的显卡有不同的ComputeCapability,不同版本的cuda支持的ComputeCapability不同,所以安装cuda要支持该显卡对应的ComputeCapability。显卡的ComputeCapability查看:https://developer.nvidia.com/cuda-gpus#compute中文版:https://developer.nvidia.com/zh-cn/cu......
  • 玩转Jetson Nano(四):TensorRT图像识别
    玩转JetsonNano(四):TensorRT图像识别前言TensorRT简介TensorRT搭建安装所需的依赖安装jetson-inference配置cmake下载所需的模型文件编译测试CSI摄像头实时图像识别常见问题参考文献前言本文是个人使用JetsonNano的电子笔记,由于水平有限,难免出现错漏,敬请批评改正。更多精彩内容,可点......