CUDA
从CUDA Toolkit Archive下载相应版本的离线安装包,这里以11.7
为例。
打开安装包,在安装选项选择自定义模式,点击下一步。
在自定义安装选项中,仅选择CUDA组件(其中Nsight相关组件用于代码调试与性能分析),若未安装显卡驱动,选择NVIDIA GeForce Experience components并点击下一步。
可能会出现如下图提示,警告你未安装Visual Studio (可参考 【Windows 开发环境配置】C++ 篇 安装),这里打勾点击下一步即可。
安装完成后会自动添加到系统的PATH
环境变量,无需手动添加。
cuDNN
从cuDNN Archive下载相应版本的安装包,这里以8.4.1.50
为例。
下载完成后,将解压缩包中的文件复制到C:\Program Files\NVIDIA GPU Computing Toolkit\cuDNN\v8.4.1.50
目录下。
将C:\Program Files\NVIDIA GPU Computing Toolkit\cuDNN\v8.4.1.50\bin
添加到系统的PATH
环境变量。
Zlib
Zlib是cuDNN所需的数据压缩软件库。在ZLib网站下载32bit
或64bit
的zlib123dll.zip
(一般为64bit
)。
下载完成后,将解压缩包中的zlibwapi.dll
文件复制到C:\Program Files\NVIDIA GPU Computing Toolkit\cuDNN\v8.4.1.50\bin
目录下,zlibwapi.lib
文件复制到C:\Program Files\NVIDIA GPU Computing Toolkit\cuDNN\v8.4.1.50\lib
目录下。
TensorRT
从NVIDIA TensorRT 8.x Download下载相应版本的安装包,这里以8.4.2.4
为例。
下载完成后,将解压缩包中的文件复制到C:\Program Files\NVIDIA GPU Computing Toolkit\TensorRT\v8.4.2.4
目录下。
将C:\Program Files\NVIDIA GPU Computing Toolkit\TensorRT\v8.4.2.4\bin
添加到系统的PATH
环境变量。
TensorRT Python 包安装
在终端打开C:\Program Files\NVIDIA GPU Computing Toolkit\TensorRT\v8.4.2.4\python
目录,以python 3.10
为例,输入pip install tensorrt-8.4.2.4-cp310-none-win_amd64.whl
即可安装。
ONNX GraphSurgeon 包安装
在终端打开C:\Program Files\NVIDIA GPU Computing Toolkit\TensorRT\v8.4.2.4\onnx_graphsurgeon
目录,输入pip install onnx_graphsurgeon-0.3.12-py2.py3-none-any.whl
即可安装。