首页 > 系统相关 >使用 腾讯云Windows GPU 云服务器搭建深度学习环境

使用 腾讯云Windows GPU 云服务器搭建深度学习环境

时间:2024-09-19 14:24:41浏览次数:10  
标签:单击 Windows cuDNN CUDA 版本 服务器 GPU 安装


本文介绍如何使用 Windows GPU 云服务器,通过云服务器控制台搭建深度学习环境。

实例环境

实例类型GN8.LARGE56

操作系统:Windows Server 2019 数据中心版 64位 中文版

CPU:Intel(R) Xeon(R) CPU E5-2680 v4 @2.40GHz 2.40GHz * 6vCPUs

RAM:56GB

GPU:Tesla P40 * 1

驱动及相关库、软件版本:CUDA 10.2、Python 3.7、Pytorch 1.8.1、Tensorflow_gpu_2.2.0

选择驱动及相关库、软件版本

在安装驱动前,您需大致了解 CUDA、cuDNN、Pytorch、TensorFlow 及 Python 版本对应关系,以便根据实际配置选择适配版本,免除后续出现版本不匹配等问题。

选择 CUDA 驱动版本

CUDA(Compute Unified Device Architecture),是显卡厂商 NVIDIA 推出的运算平台。CUDA™ 是一种由 NVIDIA 推出的通用并行计算架构,该架构使 GPU 能够解决复杂的计算问题。其包含了 CUDA 指令集架构(ISA)以及 GPU 内部的并行计算引擎。

1. 查看显卡算力

在选择 CUDA 驱动版本时,需先了解本文使用(Tesla P40)显卡的算力。可通过 NVIDIA 官网 查询 Tesla P40 显卡算力为6.1。如下图所示:

使用 腾讯云Windows GPU 云服务器搭建深度学习环境_CUDA

2. 选择 CUDA 版本

如下图所示 CUDA 版本与显卡算力的关系,Tesla P40 显卡应选择8.0以上的 CUDA 版本。如需了解更多算力与 CUDA 版本信息,请参见 Application Compatibility on the NVIDIA Ampere GPU Architecture

使用 腾讯云Windows GPU 云服务器搭建深度学习环境_CUDA_02

选择显卡驱动版本

确定 CUDA 版本后,再选择显卡驱动版本。您可参考如下图所示 CUDA 与驱动对应关系图进行选择。如需了解更多信息,请参见 cuda-toolkit-driver-versions

使用 腾讯云Windows GPU 云服务器搭建深度学习环境_腾讯云_03

选择 cuDNN 版本

NVIDIA cuDNN 是用于深度神经网络的 GPU 加速库。其强调性能、易用性和低内存开销。NVIDIA cuDNN 可以集成到更高级别的机器学习框架中,例如谷歌的 Tensorflow、加州大学伯克利分校的流行 caffe 软件。简单的插入式设计可以让开发人员专注于设计和实现神经网络模型,而不是简单调整性能,同时还可以在 GPU 上实现高性能现代并行计算。

cuDNN 是基于 CUDA 的深度学习 GPU 加速库,有它才能在 GPU 上完成深度学习的计算。如需在 CUDA 上运行深度神经网络,需安装 cuDNN,才能使 GPU 进行深度神经网络的工作,工作速度相较 CPU 快很多。cuDNN 版本与 CUDA 版本的对应关系请参见 cuDNN Archive

选择 Pytorch 版本

您需根据 CUDA 版本,选择对应的 Pytorch 版本,匹配版本信息请参见 previous-versions

注意

CUDA 及 Pytorch 最新版本不一定是最佳选择,可能出现适配问题。建议在查阅版本适配信息后,选择合适的版本后再安装对应驱动。

选择 TesorFIow 版本

Tensorflow 较 Pytorch 稍复杂,它还需要 Python、编译器的版本支持。CPU、GPU 版本与 Python、CUDA、cuDNN 的版本对应关系如下:

基于 CPU 版本的 TensorFlow 版本

基于 GPU 版本的 TensorFlow 版本

操作步骤

创建实例

参见 购买 NVIDIA GPU 实例,创建 GPU 云服务器实例。 若您已具备 GPU 云服务器实例,则可参见 重装系统,重置已有实例的操作系统。

安装驱动、CUDA 及 cuDNN

安装显卡驱动

1. 参见 使用标准方式登录 Windows 实例(推荐),登录已创建的 GPU 云服务器。

2. 使用浏览器访问 NVIDIA 官网,并选择显卡的驱动版本。本文选择配置如下图所示:

使用 腾讯云Windows GPU 云服务器搭建深度学习环境_windows_04

3. 选择 SEARCH 进入下载页面,单击下载即可。 若您想通过下载至本地,再通过 FTP 上传至 GPU 云服务器,可参见 如何将本地文件拷贝到云服务器

4. 下载完成后,请双击安装包,根据页面提示完成安装。

安装 CUDA

1. 进入 CUDA Toolkit Archive,选择对应版本。本文以下载10.2版本为例,如下图所示:

使用 腾讯云Windows GPU 云服务器搭建深度学习环境_Python_05

2. 进入 CUDA Toolkit 10.2 Download 页面,选择对应系统配置。本文选择配置如下图所示:

使用 腾讯云Windows GPU 云服务器搭建深度学习环境_CUDA_06

3. 单击 Download,开始下载。

4. 下载完成后,请双击安装包,并根据页面提示进行安装。其中,请注意以下步骤:

在弹出的 CUDA Setup Package 窗口中,Extraction path 为暂时存放地址,无需修改,保持默认并单击 OK。如下图所示:

使用 腾讯云Windows GPU 云服务器搭建深度学习环境_腾讯云_07

许可协议步骤中,选择自定义并单击下一步。如下图所示:

使用 腾讯云Windows GPU 云服务器搭建深度学习环境_windows_08

根据实际需求选择安装组件,并单击下一步。如下图所示:

使用 腾讯云Windows GPU 云服务器搭建深度学习环境_CUDA_09

其余选项请根据页面提示,及实际需求进行选择,直至安装完毕。

配置环境变量

1. 在操作系统界面,右键单击左下角的

使用 腾讯云Windows GPU 云服务器搭建深度学习环境_CUDA_10

,在弹出菜单中选择运行

2. 在运行窗口中输入 sysdm.cpl,并单击确定

3. 在打开的系统属性窗口中,选择高级页签,并单击环境变量。如下图所示:

使用 腾讯云Windows GPU 云服务器搭建深度学习环境_CUDA_11

4. 选择系统变量中的 Path,单击编辑

5. 在弹出的编辑环境变量窗口中,新建并输入如下环境变量配置。



C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v10.2

C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v10.2\bin

C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v10.2\libnvvp

C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v10.2\lib\x64

C:\Program Files\NVIDIA Corporation\NVSMI

编辑完成后如下图所示:

使用 腾讯云Windows GPU 云服务器搭建深度学习环境_windows_12

6. 连续单击3次确定,保存设置。

检查显卡驱动及 CUDA

1. 在操作系统界面,右键单击左下角的win健,在弹出菜单中选择运行

2. 在运行窗口中输入 cmd,并单击确定

3. 在 cmd 窗口中:

执行以下命令,检查显卡驱动是否安装成功。

nvidia-smi

返回如下图所示界面表示显卡驱动安装成功。下图为正在运行中的 GPU,在 GPU 运行时,该命令可查看 GPU 的使用情况。

使用 腾讯云Windows GPU 云服务器搭建深度学习环境_腾讯云_13

执行以下命令,检查 CUDA 是否安装成功。

nvcc -V

返回如下图所示界面表示 CUDA 安装成功。

使用 腾讯云Windows GPU 云服务器搭建深度学习环境_CUDA_14

安装 cuDNN

1. 前往 cuDNN Download 页面,单击 Archived cuDNN Releases 查看更多版本。

2. 找到所需 cuDNN 版本,并下载。

3. 解压 cuDNN 压缩包,并将 binincludelib 文件夹拷贝至 C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v10.2 目录下。

4. 至此已完成 cuDNN 安装。

安装深度学习库

安装 Anaconda

建议通过 Anaconda 创建的虚拟环境安装 Pytorch 和 Tensorflow。通过 Anaconda,可便捷获取包并对包进行管理,同时可统一管理环境。Anaconda 包含了 conda、Python 在内的超过180个科学包及其依赖项,安装过程简单,能高性能使用 Python 和 R 语言,且有免费的社区支持。

1. 前往 Anaconda 官网,拉至页面底部,选择 archive 查看更多版本。

2. 在页面中下载所需版本,本文以下载 Anaconda3-2019.03-Windows-x86_64 为例。如下图所示:

使用 腾讯云Windows GPU 云服务器搭建深度学习环境_腾讯云_15

3. 请双击安装包,并根据页面提示进行安装。其中,请注意以下步骤:

Choose Install Location 步骤中,更改默认安装路径。因默认安装路径 C 盘中的 ProgramData 文件夹为隐藏文件夹,为了方便管理,建议安装在其他文件夹。下图所示为默认安装路径:

使用 腾讯云Windows GPU 云服务器搭建深度学习环境_服务器_16

Advanced Installation Options 步骤中,勾选全部选项,表示将 Anaconda 安装路径添加至环境变量,并将 Python 3.7 作为解释器。如下图所示:

使用 腾讯云Windows GPU 云服务器搭建深度学习环境_CUDA_17

4. 单击 Install 等待完成安装。

配置 Anaconda

1. 在操作系统界面,单击左下角的

使用 腾讯云Windows GPU 云服务器搭建深度学习环境_Python_18

,在弹出菜单中选择 Anaconda Prompt。如下图所示:

使用 腾讯云Windows GPU 云服务器搭建深度学习环境_CUDA_19

2. 在打开的 Anaconda Prompt 命令行窗口中,执行以下命令,创建虚拟环境。



conda create -n xxx_env python=3.7

说明

xxx_env 为环境名,python=3.7 为 Python 版本,您可根据实际需求进行修改。

创建成功即如下图所示:

使用 腾讯云Windows GPU 云服务器搭建深度学习环境_服务器_20

您可使用以下命令进入或退出已创建的虚拟环境。进入虚拟环境后,即可按照实际需求安装包。



#激活命令

conda activate xxx_env

#退出命令

conda deactivate

安装 Pytorch

前往 Pytorch 官网,使用官网推荐的安装代码。 本文已安装 CUDA 版本为10.2,并选择 pip 安装方式,则在已创建的 xxx_env 虚拟环境中执行如下命令进行安装:



# CUDA 10.2

pip install torch==1.8.1+cu102 torchvision==0.9.1+cu102 torchaudio==0.8.1 -f https://download.pytorch.org/whl/torch_stable.html

可通过替换源,加快安装速度,替换为清华源后则执行如下命令:



# CUDA 10.2

pip install torch==1.8.1+cu102 torchvision==0.9.1+cu102 torchaudio==0.8.1 -f https://download.pytorch.org/whl/torch_stable.html -i https://pypi.tuna.tsinghua.edu.cn/simple

安装 Tensorflow

执行以下命令,安装 Tensorflow_gpu_2.2.0。



pip install tensorflow-gpu==2.2.0 -i https://pypi.tuna.tsinghua.edu.cn/simple

执行以下命令,安装 keras。



pip install keras -i https://pypi.tuna.tsinghua.edu.cn/simple

至此,已完成了基本深度学习库的安装。您可参考本文方法安装更多所需要的包,并利用 Anaconda 自带的 jupyter notebook、Spyder 工具或者安装 PyCharm 等工具开始代码学习!

标签:单击,Windows,cuDNN,CUDA,版本,服务器,GPU,安装
From: https://blog.51cto.com/u_17018880/12056741

相关文章

  • 腾讯云轻量应用服务器搭建WordPress个人博客系统
    WordPress是全球最流行的开源的博客和内容管理网站的建站平台,具备使用简单、功能强大、灵活可扩展的特点,提供丰富的主题插件。腾讯云轻量应用服务器提供WordPress应用镜像,您可以使用它快速搭建博客、企业官网、电商、论坛等各类网站。说明本文档示例WordPress应用镜像底层基于......
  • 京东云金秋上云轻量云服务器!
    轻量云主机是面向中小企业、开发者打造的预装精选软件、开箱即用的主机产品,快速搭建网站、电商、企业低代码工具箱,云盘、共享文档、知识库、开发测试环境等,相对普通云主机,按套餐购买更优惠、控制台可视化管理,运维更简单,提供更便捷上云体验。轻量云主机这个专区是本次活动的主要专区......
  • Windows 查看服务器重启日志
    原文链接:https://blog.csdn.net/liuhuanping/article/details/136510703在Windows中,可以通过查看系统事件日志来查看服务器重启的日志记录。以下是如何查看系统事件日志中的重启记录的步骤:打开“事件查看器”:可以通过在开始菜单中搜索“事件查看器”来打开它,或者使用运行命令......
  • 京东云金秋上云云服务器!
    轻量云主机是面向中小企业、开发者打造的预装精选软件、开箱即用的主机产品,快速搭建网站、电商、企业低代码工具箱,云盘、共享文档、知识库、开发测试环境等,相对普通云主机,按套餐购买更优惠、控制台可视化管理,运维更简单,提供更便捷上云体验。爆款云主机这个专区是本次活动的主要专区......
  • 阿里云上1分钟搞定幻兽帕鲁联机服务器搭建
    1.基础部署幻兽帕鲁服务器1.1访问帕鲁专题活动页登录阿里云官网,用钉钉或者支付宝app扫码注册新用户(新用户福利较多,优惠力度大)点击“【官方推荐】新手玩家用计算巢一键部署帕鲁专属服务器”中的“一键购买及部署”。在这里,阿里云的服务把大部分游戏需要的配置都帮你配好了,包括网......
  • 【轻量云游戏服专区】一键开设《夜族崛起》游戏服务器
    《夜族崛起》(VRising)是一款由StunlockStudios开发的吸血鬼题材开放世界生存游戏。作为一只吸血鬼醒来。在附近的定居点狩猎鲜血,恢复力量。避开致命阳光的炙烤。建设您的城堡,在这个充满谜团,不断变化的开放世界里蓬勃发展。在线上寻觅友军,征服生者的土地。引用自:https://store.stea......
  • QM游戏服务器框架
    项目地址QM一个简单易用的、可拓展的游戏服务器框架完全使用csharp开发,包括了游戏服务器所需的基本组件。QM的架构设计使得伸缩QM伸缩性非常好,很容易进行集群和分布式开发。特性:1.依托dotnetty线程模型处理消息,性能非常不错2.支持async/await编......
  • 在 Windows 中,iSCSI 启动器的注册表设置可以影响其性能和行为。以下是一些常见的注册
    在Windows中,iSCSI启动器的注册表设置可以影响其性能和行为。以下是一些常见的注册表设置示例:1. iSCSI启动器配置路径:HKEY_LOCAL_MACHINE\SYSTEM\CurrentControlSet\Services\Tcpip\Parameters值:MaxUserPort(设置最大用户端口范围)2. 启动器参数路径:HKEY_LOCAL_MACHINE......
  • windows7遇到不兼容如何解决
    概述:低版本的Windows缺乏一些高版本中所新增的系统接口,而VxKex可以为程序提供这些缺失的接口从而使其正常运行当然VxKex不仅可以用于lucky也可以使其他一些最低要求为win10的程序在win7上运行起来详情见其github项目地址不过目前对游戏的效果不佳国内加速下载下载:https://d......
  • 阿里云服务器手动部署LNMP环境(Alibaba Cloud Linux 3/2、CentOS 7/8)
    LNMP是目前主流的网站服务器架构之一,适合运行大型和高并发的网站应用,例如电子商务网站、社交网络、内容管理系统等。LNMP分别代表Linux、Nginx、MySQL和PHP。本文介绍如何在AlibabaCloudLinux3/2、CentOS7/8操作系统的ECS实例上搭建LNMP环境。部署环境的实例要求手动部署LNMP环......