首页 > 其他分享 >试用阿里云GPU服务器进行深度学习模型训练

试用阿里云GPU服务器进行深度学习模型训练

时间:2024-04-17 14:11:19浏览次数:23  
标签:训练 模型 py 阿里 实例 试用 服务器进行 GPU

试用阿里云GPU服务器进行深度学习模型训练

最近在用PyTorch时发现在本地训练模型速度一言难尽,然后发现阿里云可以白嫖gpu服务器,只要没有申请过PAI-DSW资源的新老用户都可以申请5000CU*H的免费额度,三个月内有效。

阿里云免费试用活动页面

一、申请试用并创建实例

image-20240417111235734

  1. 点击试用,完成注册、实名、领取产品,然后前往控制台

  2. 创建工作空间并授权

  3. 授权完成,前往默认工作空间

  4. 创建交互式建模(DSW)实例

    找到交互式建模(DSW)然后点击创建实例

    image-20240417112343422

    image-20240417112725354

    输入实例名称(随便写)

    image-20240417130025758

    接下来选择GPU规格,选 A10 或者 V100 只有这两个是支持资源包抵扣的(资源包在我们申请试用的时候已经自动领取了),其他的不支持,这里注意!我这里选的是 A10显卡,每小时消耗6.991计算时,性能已经够用了。V100显卡的性能更好,相应的资源包抵扣使用时间也会短一些,大家可以根据自己需求选择。

    image-20240417131023677

    然后选择镜像,点击下一步创建实例即可

    image-20240417131110714

二、部署代码到实例进行训练
  1. 启动并打开实例

    image-20240417131541021

    打开后可以看到导航栏中有三项

    image-20240417132129994

  2. 上传训练模型的py文件

    点击这个按钮上传

    image-20240417132304798

    上传后可以在侧边栏看到

    image-20240417132440553

    也可以打开terminal查看,同样可以看到

    image-20240417132636342

  3. 开始训练

    跟在本地是一样的,依次执行generate.py、loader.py、train.py,我这里选择在terminal用命令执行,大家也可以选择在集成的vscode中执行

    # 在terminal依次输入下列命令执行
    python generate.py # 可能会提示ModuleNotFoundError: No module named 'captcha',这是我们的环境中没有captcha这个包,用pip安装即可,pip install captcha
    python loader.py
    python train.py
    
  4. 下载训练的pth文件到本地

    训练完成后会有一个pth文件,这是PyTorch训练的模型文件,我们可以下载到本地使用

    image-20240417134441844

三、总结

以上就是在阿里云人工智能平台PAI使用交互式建模(DSW)训练深度学习模型的过程,欢迎大家在评论区留言一起交流学习,有需要模型训练过程以及代码文件的可以看我上一篇blog

标签:训练,模型,py,阿里,实例,试用,服务器进行,GPU
From: https://www.cnblogs.com/gggod/p/18140592

相关文章

  • Python-GPU-编程实用指南(一)
    PythonGPU编程实用指南(一)原文:zh.annas-archive.org/md5/ef7eb3c148e0cfdfe01c331f2f01557c译者:飞龙协议:CCBY-NC-SA4.0前言问候和祝福!本文是关于使用Python和CUDA进行GPU编程的入门指南。GPU可能代表图形编程单元,但我们应该明确,这本书不是关于图形编程——它本质......
  • Python-GPU-编程实用指南(三)
    PythonGPU编程实用指南(三)原文:zh.annas-archive.org/md5/ef7eb3c148e0cfdfe01c331f2f01557c译者:飞龙协议:CCBY-NC-SA4.0第十章:使用已编译的GPU代码在本书的过程中,我们通常依赖PyCUDA库自动为我们接口我们的内联CUDA-C代码,使用即时编译和与Python代码的链接。然而......
  • gpupdate.exe 是 Windows 操作系统中的一个命令行工具,用于立即刷新本地计算机或用户的
    C:\Mount\Windows\System32\gpupdate.exeC:\Mount\Windows\SysWOW64\gpupdate.exeC:\Mount\Windows\WinSxS\amd64_microsoft-windows-g..policy-cmdlinetools_31bf3856ad364e35_10.0.20348.2340_none_e3e1b64c0e292aa6\gpupdate.exeC:\Mount\Windows\WinSxS\......
  • 科技驱动未来,提升AI算力,GPU扩展正当时
    要说这两年最火的科技是什么?我想“AI人工智能”肯定是最有资格上榜的,尤其ChatGPT推出后迅速在社交媒体上走红,短短5天,注册用户数就超过100万,2023年一月末,ChatGPT的月活用户更是突破1亿,成为史上增长最快的消费者应用。不少人认为,ChatGPT的热度,与其出色语言理解和文本生成能力有......
  • 搭建 Windows GPU 服务器需要考虑多个方面,包括硬件选择、操作系统安装、驱动程序安装
    搭建WindowsGPU服务器需要考虑多个方面,包括硬件选择、操作系统安装、驱动程序安装、软件配置等。以下是一个简单的指南,介绍了搭建WindowsGPU服务器的基本步骤:1.硬件选择选择适合您需求的硬件配置,包括GPU、CPU、内存和存储。GPU是关键的组件,应根据您的应用需求选择......
  • GpuMall镜像社区上线啦!超值福利抢鲜体验!
    想快速体验最新最优镜像?想随手分享你的原创镜像?想寻找一个交流镜像的优质平台?我们听到了广大友友们迫切的心声!立即免费体验:https://gpumall.com/login?type=register&source=cnblogs现在!我们的镜像社区上线啦!!!这里是公开分享镜像的最佳平台!在这里你可以和伙伴交流镜像,畅所欲言!还......
  • TravellingPurchasingMan
    Topcoder#Floyd#状压dpFloyd跑全源最短路,然后\(dp_{msk,x}\)表示在\(msk\)购物过,并且最后一次在\(x\)的最小完成时间,枚举一个转移即可,时间复杂度是\(\mathcal{O}(n^3+2^kk\))的//Author:xiaruizeconstintN=55+10;intn,m,t;structnode{ints,t......
  • Proxmox VE 7.x ,8.x 安装 NVIDA GRID vGPU 以及 Intel SR-IOV vGPU,一键安装脚本
    在Gitee上创建了一个项目。包括了NVIDIA和Intel核显启用vGPU的脚本。 项目地址:https://gitee.com/deskpool/proxmox-vgpu脚本支持ProxmoxVE7.x和8.x,支持NVIDAGRIDvGPU和   IntelSR-IOVvGPU。 介绍ProxmoxVE上支持vGPU的脚本。包括NVIDAGRIDvGP......
  • MindSpore运行报错RuntimeError: Unsupported device target GPU解决方案
    问题背景在运行MindSpore程序时,设置device_target为GPU,结果运行时报错:RuntimeError:UnsupporteddevicetargetGPU.Thisprocessonlysupportsoneofthe['CPU'].PleasecheckwhethertheGPUenvironmentisinstalledandconfiguredcorrectly,andcheckwhethercu......
  • 黑盒测试用例设计技术-语法测试原则及案例
    语法测试用例设计原则选项导出原则:当语法规则强制选择时,为该选择的每个备选方案导出一个测试用例(“选项”)。最小与最大重复次数原则:当语法规则强制执行最小重复次数时,应为此导出至少两个测试用例:一个满足最小重复次数,另一个不满足(小于最小重复次数)。当语法规则允许最大重复......