最近在复现论文里面的代码, 结果实验室里面的2080和论文结果相差有点多, 同时我的笔记本调试显卡显存太小, 因此尝试使用云服务器上面的GPU跑, 下面是采用Deepln的云服务器跑的代码的一些总结, 这是他们的网址https://www.deepln.com/#/
设置进程保护指令
sudo apt-get update && sudo apt-get install -y tmux # 下载专用包
tmux new -s work #创建相关保护进程
# 中断后打开
tmux ls # 查看进程名称
tmux attach -t 进程名字
设置清华源
pip config set global.index-url https://pypi.tuna.tsinghua.edu.cn/simple
注意: 不要使用pytorch的conda指令, 使用下面的pip指令, 不然出现conda相应过慢的现象
比如:
pip install torch==1.9.0+cu111 torchvision==0.10.0+cu111 torchaudio==0.9.0 -f https://download.pytorch.org/whl/torch_stable.html
这样就可以使用清华源进行加速了。
他们的云服务器的缺点:
- 目前还不能对环境配置进行镜像保存, 因此每次在进行租用时需要重新配置环境, 听说马上就上线环境镜像配置了, 就能缓解这种现象了。
- 第一次上传本地数据时时间过慢, 需要时间长, 并且需要在服务器开的时候上传, 因此我认为可以先租一个便宜的将相关数据保存到我的数据后再租要跑的GPU进行调, 这样可以省点钱,但是超30G需要额外掏钱。