作业调度系统
常见作业调度系统有slurm
LSF
PBS
,一般通过module load加载自己需要的软件。
这些调度系统的使用可以阅读相关文档:
GADI/PBS,上海交大/slurm,上科大/LSF
使用未安装的软件
通常我们会使用module load
来加载使用我们需要的软件,但是有些时候我们需要的软件并不在列表中,同时超算集群的账户是没有sudo权限的。
当我们指定安装路径为自己home目录下时,我们可以无root环境通过源码编译安装软件,但当安装的软件需要使用cuda编译环境的时候呢?
conda提供了完整的编译运行环境,这个环境包括nvcc
,cuda toolkit
,cudnn
。
只要在服务器正常安装显卡驱动的情况下,
conda install -c nvidia cuda
即可立刻拥有可以编译和运行的正确的CUDA
环境了。
需要查找其他包和历史版本,可以上官网查找,如CUDA。
注意
1、可以直接安装打包好的运行环境cuda
,而不是手动逐一安装,可能会缺点什么,如直接安装cudatoolkit
、nvcc
。
2、注意镜像源是否有conda-forge
,以及是否包含-c nvidia
的历史软件版本。