首页 > 其他分享 >pytorch分布式训练 DDP torchrun用法

pytorch分布式训练 DDP torchrun用法

时间:2022-11-29 11:44:27浏览次数:43  
标签:61234 -- DDP torchrun pytorch num master gpu

master的端口默认是29500,如果被占用了就换一个

torchrun --master_port 61234 --nproc_per_node $gpu_num train.py ...

shell脚本:

export CUDA_VISIBLE_DEVICES=$1
gpu_num=$(echo $CUDA_VISIBLE_DEVICES | awk -F ',' '{print NF}')

torchrun --master_port 61234 --nproc_per_node $gpu_num hf_train.py ...

标签:61234,--,DDP,torchrun,pytorch,num,master,gpu
From: https://www.cnblogs.com/wangbingbing/p/16934995.html

相关文章

  • PyTorch Geometric Temporal 介绍 —— 数据结构和RGCN的概念
    IntroductionPyTorchGeometricTemporalisatemporalgraphneuralnetworkextensionlibraryforPyTorchGeometric.PyTorchGeometricTemporal是基于PyTorchGe......
  • 高性能PyTorch训练
    参考:https://mp.weixin.qq.com/s/foB44Fm-IhX3yaawn_aZgg数据预处理几乎每个训练管道都以Dataset类开始。它负责提供数据样本。任何必要的数据转换和扩充都可能在此进......
  • pytorch torchvision.ops.roi_align 示例
    importtorchvisionimporttorchinput_=torch.rand(3,128,24,96)#[b,c,h,w]bbox=[[0,0.1,0.15,0.4,0.6],[0,0.1,0.15,0.4,0.6],[1,0.01,0.15,0.4,0......
  • Pytorch:使用Tensorboard记录训练状态
    我们知道TensorBoard是Tensorflow中的一个强大的可视化工具,它可以让我们非常方便地记录训练loss波动情况。如果我们是其它深度学习框架用户(如Pytorch),而想使用TensorBoard工......
  • 带GPU的Pytorch安装【看看避坑啊!】
    之前写过一篇如何安装Pytorch的博客,但主要是CPU版本的,注意的事项还比较少。现在专门再记录一遍安装GPU版本的。CPU版本参考:Pytorch的安装前言一定要记住,先看自己电脑......
  • pytorch之model.zero_grad() 与 optimizer.zero_grad()
    转自https://cloud.tencent.com/developer/article/17108641.引言在PyTorch中,对模型参数的梯度置0时通常使用两种方式:model.zero_grad()和optimizer.zero_grad()。二......
  • PyTorch学习
    PyTorch学习1.关于环境的一些思维导图来源-B站小土堆2.关于环境的搭建Anaconda(1)anaconda安装安装网站(清华镜像):https://repo.anaconda.com/archive/下载完成......
  • pytorch中x.view()和permute用法
    x.view(),它表示将Tensor的维度转变为view指定的维度permute(),这个函数是做维度交换的torch.view()方法对张量改变“形状”其实并没有改变张量在内存中真正的形状。......
  • 论文复现|Panoptic Deeplab(全景分割PyTorch)
    摘要:这是发表于CVPR2020的一篇论文的复现模型。本文分享自华为云社区《PanopticDeeplab(全景分割PyTorch)》,作者:HWCloudAI。这是发表于CVPR2020的一篇论文的复现模型......
  • PyTorch的安装与pycharm配置anaconda
    pytorch作为Python的一个深度学习库,安装比较简单,但是过程有比较坑的地方,下面就把自己的安装过程一一介绍。在安装前,首先要确定自己的计算机是否已经安装了Anaconda。anacond......