首页 > 其他分享 >7.28-跑deepspeed

7.28-跑deepspeed

时间:2024-07-29 21:51:13浏览次数:6  
标签:deepspeed 7.28 python practice param https 下载

完整代码:https://github.com/chenyinlin1/deepspeed_practice_example
官方文档:https://www.deepspeed.ai/getting-started/

Deepspeed安装:
1、创建虚拟环境deepspeed:conda create -n deepspeed python=3.8
2、cd /public/software/apps/DeepLearning/whl

安装对应版本的torch,torchvision,torchaudio,deepspeed(直接使用pip install + 文件名即可)
3、将数据集下载的位置更改到本地文件夹上(方便下载)

4、将github上的deepspeed实例上传到文件夹,并在登录节点上运行:python practice.py(目的是为了下载数据集,若不行则在https://www.cs.toronto.edu/~kriz/cifar.html自行下载python版本的)

5、创建param.sh脚本

6、提交任务:sbatch -p normal param.sh

其中使用zero offload训练未成功,因为没有找到合适的json文件(存档)
7、双卡训练效果:

单卡训练效果:

标签:deepspeed,7.28,python,practice,param,https,下载
From: https://www.cnblogs.com/fengyu-feat/p/18331159

相关文章

  • 「模拟赛」暑期集训CSP提高模拟10(7.28)
    \(145pts,Rank10\),众数分。数学专题模拟赛%%%总结写前面:1.线性递推式复杂度过大考虑矩阵快速幂优化;2.T1长时间切不了就先跳,先把所有题看一遍,拿分为主。赛时记录正常开T1,期望数学题,大概读懂了,手模下小样例,模了一遍又一遍,“我并不认为样例是对的”,跳了(很正确的决定)。......
  • 周报 | 24.7.22-24.7.28文章汇总
    为了更好地整理文章和发表接下来的文章,以后每周都汇总一份周报。周报|24.7.15-24.7.21文章汇总-CSDN博客集智书童|超级干货|用万字文章总结25种正则化方法(值得收藏)-CSDN博客kaggle竞赛宝典|时序表示学习的综述!_时间序列预测kaggle-CSDN博客小白学视觉|漫谈图神......
  • 上周热点回顾(7.22-7.28)
    热点随笔:· 周边上新,T恤上星:博客园T恤幸运闪系列,上架预售,上照预览 (博客园团队)· 强烈推荐!!!阿里旗下10款顶级开源项目 (程序员晓凡)· 给园子的会员送送优惠,和你的数据库聊聊天:会员权益「Chat2DB特惠」上线 (博客园团队)· 深入浅出分析最近火热的Mem0个性化AI记忆层 (J......
  • LLM大模型:deepspeed实战和原理解析
     多年前搞大数据,因为单节点无力存储和计算PB级别的数据,所以hadoop这种分布式存储和计算框架是标配!如今搞大模型,仍然需要对大量样本数据做计算,因为涉及矩阵运算,单机单卡运算效率太低,也涉及到分布式计算了,大模型时代的分布式pre-train和Inference框架就有现成的—deepspeed!......
  • 24.07.28 周总结 (kotlin加深 + Android studio 学习)
    Kotlin学习子类的属性覆盖AndroidstudioAI解决问题......
  • 2024.7.28
    群青嗚呼いつもの様に過ぎる日々にあくびが出るさんざめく夜越え今日も渋谷の街に朝が降るどこか虚しいようなそんな気持ちつまらないなでもそれでいいそんなもんさこれでいい知らず知らず隠してた本当の声を響かせてよほら見ないフリしていても確かにそこにある......
  • 2024.7.28 test
    A你有长度为\(2n\)的排列,每次操作是:把\(a_1,a_2,...,a_{2n}\)变成\(a_1,a_{n+1},a_2,a_{n+2},...,a_{n},a_{2n}\)。问多少次操作后序列回到最初的状态。\(n\le10^{14}\)。我们先把\(1\)开始标号改成\(0\)开始。那么操作是这样的:若\(x<n\),那么移动到\(2x\),若\(x\g......
  • 大创项目个人周报(2024.7.22—2024.7.28)
    本周个人情况汇报我本周主要学习了安卓开发的内容,根据《第一行代码Android》开展了学习。一、分析自己的第一个Android程序通过看书,我对项目的各个文件的功能有了大致了解,除app目录外,大多数文件和目录是自动生成的,app目录是今后开发工作主要涉及的部分。app的结构如下。......
  • 7.28《构建之法》读后感
    在7.6号,从网上购买了此书之后,就从中了解了软件工程这个专业的各种细节,对此我作出如下总结:《构建之法》这本书,作为一本全面而深入地探讨现代软件工程的著作,给我留下了深刻的印象。从初次翻开书页到细细品读,我不仅收获了丰富的知识,更在思维方式和职业态度上得到了极大的提升。以下......
  • 闲话 24.7.28
    闲话今天闲话的内容其实已经在前面的闲话里预告了(下面把YDRG006G称作(?)题。(这也是内部通称)6.18:实现了(?)题的std7.15:确定(?)题会出现在熨斗月赛这题还挺简单的不是吗(至少场上有个组合意义大神(handle:shijiuwan)推出了只用组合数的式子:\[\left(\dbinom{2n}n-\dbinom......