首页 > 其他分享 >集群调度LSF-学习笔记

集群调度LSF-学习笔记

时间:2023-02-23 16:00:43浏览次数:39  
标签:LSF 输出 查看 作业 调度 集群 BSUB


集群-------多台设备
HPC集群----多台用于计算的设备

集群调度-LSF:LSF 是一种强大的工作负载管理平台,提供基于各种策略的智能调度功能,利用分布式的基础架构资源来提高整体的系统性能。用户通过 LSF可以实现集群间的负载均衡,扩展集群构架和资源,最大限度的提高集群的使用效率。

主要命令:

bsub             命令提交
bqueues        队列查看
bhosts          节点查看
bjobs            作业查看

运行bqueues:

集群调度LSF-学习笔记_标准输出

QUEUE_NAME:队列名称

PRIO:优先级

NJOBS:几个作业在并行

PEND:阻塞的作业数量

RUN:正在运行的作业数量

SUSP:挂起的作业数量

提交作业:bsub < demo.sh

demo.sh:

#BSUB -J testJob
#BSUB -n 28
#BSUB -o %J.out
#BSUB -e %J.err
#BSUB -q normal

echo "111"

-J 作业名称

-n 作业至少需要的CPU核数(28的倍数),也可以是范围(表示方法如[28,56])

-o 标准输出文件

-i 标准输入文件

-e 标准错误输出文件

-q 作业所提交队列名

-o -i -e 三个参数的文件名中可以包含%J用于表示JOBID;如果没有指定标准输出文件,那么系统会自动设定为 output_%J;如不想要输出文件请设置 -o /dev/null。

执行 bsub < demo.sh 后,成功加入队列将显示:

Job <175039> is submitted to queue <normal>.

查看作业运行情况:bjobs

查看作业详情:bjobs -l 作业号

终止指定的作业:bkill   作业号

查看任务日志,显示处于运行时作业的标准输出和标准错误输出信息:

bpeek  -f  作业号  

显示节点当前负载:lsload

module av  查看可用软件

module load xxx  加载所需软件 

lsload  -gpuload  查看gpu各个卡的信息

标签:LSF,输出,查看,作业,调度,集群,BSUB
From: https://blog.51cto.com/u_13946099/6081321

相关文章

  • ClickHouse节点扩容、往集群中添加节点
     ClickHouse节点扩容、往集群中添加节点 背景最近公司ck数据量增长太快,几个T的硬盘快不够了,继续扩容。扩容有三种方案:    1.增加ck目前数据盘的大小,由于是......
  • nacos2.20 windows 单机和集群部署(模拟)
    前言Nacos文档:https://nacos.io/zh-cn/docs/deployment.htmlNacos是阿里开源的注册中心+配置中心服务。下载在 https://github.com/alibaba/nacos/releases 中,我......
  • 消息推送服务性能提升-2-集群
    前言首先迟到的祝大家中秋快乐。最近一周多没有更新了。其实我一直想憋一个大招,分享一些大家感兴趣的干货。鉴于最近我个人的工作内容,于是利用这三天小长假憋了一个出来(其......
  • 查看k8s集群kube-proxy的代理模式
    一、访问kube-proxy的接口与iptables模式下的kube-proxy相比,IPVS模式下的kube-proxy重定向通信的延迟要短,并且在同步代理规则时具有更好的性能。与其他代理模式......
  • 大规模 IoT 边缘容器集群管理的几种架构-4-Kubeedge
    前文回顾大规模IoT边缘容器集群管理的几种架构-0-边缘容器及架构简介大规模IoT边缘容器集群管理的几种架构-1-Rancher+K3s大规模IoT边缘容器集群管理的几种架构-......
  • Nacos单机&集群&持久化&nginx代理配置
    目录Nacos是什么注册中心对比环境搭建环境准备Nacos下载运行单机测试特性一:注册中心消费者项目POMYML配置类控制类启动类两个生产者项目POMYML控制类启动类验证特性二:配置......
  • mongodb集群更新configserver数据
    configserver日志异常    查看副本集运行日志,发现连接configserver时候显示连接configserver连接拒绝         登录configserver节点  ......
  • kubeadm 集群初始化参数 pod-network-cidr 有什么作用?
    问题kubeadminit创建集群时有个参数,即pod-network-cidr,在以往使用过程中,不设置该参数似乎创建的集群也能正常工作,那它究竟有什么作用呢?影响范围kubeadm给出的参数释义......
  • 04. Kubernetes - 集群安装(Kubeadm)
    Kubeadmkubeadm是Kubernetes社区提供的集群构建工具,它能够以最佳实践的方式部署一个最小化的可用Kubernetes集群。但是kubeadm在设计上并未安装网络解决方案,所以......
  • xxl-job 任务调度使用
    服务端代码下载​xxl-job-master​​application.properties客户端pom.xml<!--xll-job--><dependency><groupId>com.xuxueli</groupId>......