首页 > 其他分享 >Slurm 测试环境配置

Slurm 测试环境配置

时间:2023-07-25 11:37:41浏览次数:35  
标签:配置 sudo Slurm munge 192.168 etc systemctl nfs 测试环境

Slurm 测试环境配置

1.机器规划

Host:

HPC_Slurm_Main:192.168.141.135

Clients:

HPC_Slurm_Client01:192.168.141.136

HPC_Slurm_Client02:192.168.141.137

HPC_Slurm_Client03:192.168.141.138

2.修改主机名 /etc/hosts, /etc/hostname

192.168.141.136 node1-nfs

192.168.141.137 node2-nfs

192.168.141.138 node3-nfs

192.168.141.135 control1-nfs

192.168.141.136 node1

192.168.141.137 node2

192.168.141.138 node3

192.168.141.135 control1

 

3.NFS部署

3.1 服务器端:sudo apt-get install nfs-kernel-server

cat /etc/exports /home/xxx/software    *(insecure,rw,sync,no_root_squash)

/etc/init.d/nfs-kernel-server restart && systemctl enable nfs-kernel-server

 

验证:sudo exportfs -rv

 

3.2 客户端:sudo apt-get install nfs-common

a.客户端开机启动并挂载nfs: 编辑/etc/fstab文件添加如下内容:永久挂载software

control1-nfs:/software /software nfs defaults 0 0

(临时测试方案(不推荐):sudo mount -t nfs control1-nfs:/home/jose/software /home/jose//software)

b.客户端取消挂载:取消挂载:sudo umount /software

 

sudo reboot

 

4、Munge部署

1、useradd -m munge 

2、apt install munge

 

Host:

dd if=/dev/urandom bs=1 count=1024 > /etc/munge/munge.key  #在Master Node创建全局使用的密钥

chown munge: /etc/munge/munge.key 

chmod 400 /etc/munge/munge.key

chown -R munge: /var/lib/munge

chown -R munge: /var/run/munge

chown -R munge: /var/log/munge

 

scp /etc/munge/munge.key jose@node1:/etc/munge/

scp /etc/munge/munge.key jose@node2:/etc/munge/

scp /etc/munge/munge.key jose@node3:/etc/munge/

 

systemctl start munge

systemctl enable munge

 

权限设置,很重要

sudo chmod 1775  /etc/munge

sudo chmod  0600  /etc/munge/munge.key

#如果munge.key的所有者不对,需要执行以下命令

sudo chown munge: /etc/munge/munge.key

Client:

sudo apt install rng-tools5

sudo rngd -r /dev/urandom

sudo chmod 700 /etc/munge

sudo chown -R munge: /etc/munge

sudo chown -R munge: /var/lib/munge

sudo chown -R munge: /var/run/munge

sudo chown -R munge: /var/log/munge

sudo systemctl start rngd

sudo systemctl start munge

sudo systemctl enable rngd

sudo systemctl enable munge

 

5、Slurm部署

Host:

sudo apt install slurm-wlm -y

sudo apt install slurmctld  -y

 

sudo chmod +r /usr/share/doc/slurmctld/slurm-wlm-configurator.html

Client:

sudo apt install slurmd  -y 

 

sudo slurm -c

sudo slurm -D -s

Host:

python3 -m http.server

打开:http://192.168.141.135:8000/slurm-wlm-configurator.easy.html

将内容填入配置文件:/etc/slurm/slurm.conf

 

sudo mkdir /var/spool/slurmd

sudo mkdir /var/spool/slurmctld

 

# 启动 slurmd, 日志文件路径为 `/var/log/slurmd.log`

sudo systemctl start slurmd

# 启动 slurmctld, 日志文件路径为 `/var/log/slurmctld.log`

sudo systemctl start slurmctld

 

# 查看 slurmd 的状态

sudo systemctl status slurmd

# 查看 slurmctld 的状态

sudo systemctl status slurmctld

 

 

 

#ProctrackType=proctrack/cgroup  需要修改成 ProctrackType=proctrack/pgid

 

6、Slurm Mysql

sudo apt-get install mysql-server libmysqlclient-dev -y

 

在mysql中创建相应的用户

$ mysql -u root -p

create user 'slurm'@'localhost' identified by '2023@Slurm';

 grant all on slurm_acct_db.* to 'slurm'@'localhost';

 

# scontrol update NodeName=<node> State=RESUME

 

标签:配置,sudo,Slurm,munge,192.168,etc,systemctl,nfs,测试环境
From: https://www.cnblogs.com/josechuanmin/p/17579342.html

相关文章

  • RDMA虚拟环境配置
    3、IB虚拟网络配置检查是否支持:cat /boot/config-$(uname -r) | grep RXE 安装驱动:sudo apt-get install libibverbs1 ibverbs-utils librdmacm1 libibumad3 ibverbs-providers rdma-coresudo apt-get install librdmacm-dev执行ibv_devices检查是否可执......
  • seettings配置
    """Djangosettingsformyprojectproject.Generatedby'django-adminstartproject'usingDjango4.2.2.Formoreinformationonthisfile,seehttps://docs.djangoproject.com/en/4.2/topics/settings/Forthefulllistofsettingsandthe......
  • urls配置
    """URLconfigurationformyprojectproject.The`urlpatterns`listroutesURLstoviews.Formoreinformationpleasesee:https://docs.djangoproject.com/en/4.2/topics/http/urls/Examples:Functionviews1.Addanimport:frommy_appimp......
  • 永嘉微电/VINKA:电容式超强抗干扰 1按键/单通道/单键触摸触控芯片VK36N1D SOT23-6,该芯
    概述.VK36N1D具有1个触摸按键,可用来检测外部触摸按键上人手的触摸动作。该芯片具有较高的集成度,仅需极少的外部组件便可实现触摸按键的检测。提供了1个1对1输出脚,可通过IO脚选择上电输出电平,有直接输出和锁存输出2个型号可选。芯片内部采用特殊的集成电路,具有高电源电压抑制比......
  • easy-ui展开行配置用法(两种)
    第一种:用expand属性<easy-custom-tablerowKey="id":expand="expand"//添加expand属性,属性值为一个对象:tableData="tableData":columns="columns":maxHeight="tableHeight":headerCellSty......
  • 微服务下使用maven做多环境配置
    分享技术,用心生活前言:很多项目在开发,提测,上线时都会提前手动改一些配置文件来适应对应环境,麻烦不说了,而且也容易出错;生产环境的配置也容易暴露。基于此,我们基于springcloudalibaba架构下通过使用maven的profile来实现多环境切换的功能。1maven的profile介绍详细可查阅官......
  • ubuntu安装OpenJDK 17,并配置环境变量
    要在Ubuntu上安装OpenJDK17并配置环境变量,请按照以下步骤进行操作:第一步:打开终端(Terminal)。第二步:使用以下命令更新系统软件包列表:sudoaptupdate第三步:安装OpenJDK17:sudoaptinstallopenjdk-17-jdk以上命令将安装OpenJDK17及其相关组件。第四步:验证JDK是否已成功......
  • 在 Arch 配置 i3-wm 终端模拟器 xterm
    在Arch配置i3-wm终端模拟器xterm关于怎么在Arch安装i3-wm可以查看上一篇文章......
  • 使用emca命令行配置EM并通过浏览器访问EM示例
    EM是OracleEnterpriseManager简称,本文涉及操作及命令:配置EM-创建删除重建:   emca-configdbcontroldb-reposrecreate|drop|create启动、关闭、查看EM状态    emctlstart|stop|statusdbconsole环境:OEL5.7,ORACLE11.2.0.4,VBOX虚拟机配置EM前检查事项:1.确定......
  • centos 7配置ORACLE动态链接库
    随便在一个目录下解压instantclient-basiclite-linuxx64.zip(一般下最新的就好啦)然后在/etc/ld.so.conf文件添加解压完文件的目录 在执行ldconfig就好了。是不是很简单.ORACLE版本低的时候插入数据也许会报这个错cx_Oracle,cursor.execute(sql)执行的时候编码错误:UnicodeEn......