首页 > 系统相关 >Linux 高可用性方案之 Heartbeat 的日常维护命令

Linux 高可用性方案之 Heartbeat 的日常维护命令

时间:2022-10-17 20:01:18浏览次数:44  
标签:zh cn documentation 高可用性 Linux Heartbeat ha 资源 crm

crm_resource

crm_resource 命令对资源执行各种资源相关的操作。它可以修改已配置资源的定义、启动和停止资源,以及在节点间删除和迁移资源。
crm_resource [-?|-V|-S] -L|-Q|-W|-D|-C|-P|-p [options]
示例
列出所有资源:
crm_resource -L
检查正在运行资源的位置(以及是否在运行):
crm_resource -W -r my_first_ip
如果 my_first_ip 资源正在运行,此命令的输出中会显示正在运行资源的节点。如果资源没有在运行,输出中会显示此情况。
启动或停止资源:
crm_resource -r my_first_ip -p target_role -v started
crm_resource -r my_first_ip -p target_role -v stopped
查询资源的定义:
crm_resource -Q -r my_first_ip
将资源迁离当前位置:
crm_resource -M -r my_first_ip
将资源迁移到指定的位置:
crm_resource -M -r my_first_ip -H c001n02
允许资源返回其常规位置:
crm_resource -U -r my_first_ip
注: resource_stickiness 和 default_resource_stickiness 的值可能会意味着资源没有移回。在这种情况下,应先使用 -M 将资源移回,再运行此命令。
从 CRM 删除资源:
crm_resource -D -r my_first_ip -t primitive
从 CRM 删除资源组:
crm_resource -D -r my_first_group -t group
为 CRM 中的资源禁用资源管理:
crm_resource -p is-managed -r my_first_ip -t primitive -v off
为 CRM 中的资源启用资源管理:
crm_resource -p is-managed -r my_first_ip -t primitive -v on
在手动清理后,重设置有故障的资源:
crm_resource -C -H c001n02 -r my_first_ip
重新检查所有节点,以找出从 CRM 之外启动的资源:
crm_resource -P
重新检查一个节点,以找出从 CRM 之外启动的资源:
crm_resource -P -H c001n02
crm_resource 的详细参数配置可参见
http://www.novell.com/zh-cn/documentation/sle_ha/book_sleha/?page=/zh-cn/documentation/sle_ha/book_sleha/data/man_crmresource.html

crm_mon

crm_mon:crm_mon  命令允许您监视群集的状态和配置。其输出包括节点数、 uname 、 uuid 、状态、群集中配置的资源及其各自的当前状态。crm_mon 的输出可以显示在控制台上或打印到 HTML 文件。当具有不包含状态部分的群集配置文件时,crm_mon 会按文件中所指定的方式创建节点和资源概览。 
示例
显示群集的状态并每隔 15 秒获取一次更新后的列表:
crm_mon
显示群集的状态并在 -i 中指定的间隔后获取一次更新后的列表。如果 -i 未指定,则采用 15 秒的默认刷新间隔:
crm_mon -i interval[s]
在控制台上显示群集状态:
crm_mon -c
在控制台上显示一次群集状态,然后退出:
crm_mon -1
显示群集的状态并按节点对资源分组:
crm_mon -n
显示群集的状态,按节点对资源分组,并在列表中包括不活动的资源:
crm_mon -n -r
将群集的状态写入 HTML 文件:
crm_mon -h filename
在后台作为守护程序运行 crm_mon ,指定守护程序的 pid 文件以更轻松地控制守护程序进程,并创建 HTML 输出。此选项允许您持续创建 HTML 输出,该输出可以由其他监视应用程序轻松处理:
crm_mon -d -p filename -h filename
在现有群集配置文件(文件名)中显示群集配置,按节点对资源分组,并包括不活动的资源:此命令用于群集在线前的群集配置测试。
crm_mon -r -n -X filename
crm_mon 的详细参数配置可参见
http://www.novell.com/zh-cn/documentation/sle_ha/book_sleha/?page=/zh-cn/documentation/sle_ha/book_sleha/data/man_crmmon.html

crm_failcount

crm_failcount:Heartbeat 实施了一种精密的计算方法,当资源在当前节点上趋向失败时强制将该资源故障转移到其他节点。资源携带了一个 resource-stickiness 属性以确定它希望在某个节点上运行的自愿程度。它还具有 migration-threshold 属性,可用于确定资源应故障转移到其他节点的阈值。
可将 failcount 属性添加到资源,它的值将根据资源监视到的故障而递增。将 failcount 的值与 migration-threshold 的值相乘,可确定该资源的故障转移分数。如果此数字超过该资源的自选设置,则该资源将被移到其他节点并且不会在原始节点上再次运行,直到重设置故障计数。
crm_failcount 命令可查询指定节点上每个资源的故障计数。此工具还可用于重设置故障计数,并允许资源在它多次失败的节点上再次运行。
示例
重设置节点 node1 上资源 myrsc 的故障计数:
crm_failcount -D -U node1 -r my_rsc
查询节点 node1 上资源 myrsc 的当前故障计数:
crm_failcount -G -U node1 -r my_rsc
查看资源的积分
# 2>&1 /usr/heartbeat/sbin/ptest -LVVVVVVVV|grep -E "dump_node_scores"
crm_failcount 的详细参数配置可参见
http://www.novell.com/zh-cn/documentation/sle_ha/book_sleha/?page=/zh-cn/documentation/sle_ha/book_sleha/data/man_crmfailcount.html

cibadmin

cibadmin:cibadmin 是用于操作 Heartbeat CIB 的低级管理命令。它可以用来转储、更新或修改所有或部分 CIB ,删除整个 CIB 或执行各种 CIB 管理操作。
cibadmin 在 CIB 的 XML 树上运行,基本上不清楚所执行的更新或查询的含义。这意味着对于理解 XML 树中的元素含义的人来说很常见的快捷方式无法用于 cibadmin 。它在输入和输出时要求消除不明确性,并且只能处理有效的 XML 子树(标记和元素)。
注: 使用 cibadmin 应始终优先于手动编辑 cib.xml 文件,特别是在群集活动的情况下。群集会竭尽全力检测和阻止此做法,从而确保您的数据不会丢失或损坏。
示例
要获取递送到 stdout 的整个活动 CIB (包含状态部分等)的副本,请发出以下命令:
cibadmin -Q
要向资源部分添加 IPaddr2 资源,首先要使用以下内容创建一个文件 foo :
<primitive id="R_10.10.10.101" class="ocf" type="IPaddr2"
provider="heartbeat">
<instance_attributes id="RA_R_10.10.10.101">
<attributes>
<nvpair id="R_ip_P_ip" name="ip" value="10.10.10.101"/>
<nvpair id="R_ip_P_nic" name="nic" value="eth0"/>
</attributes>
</instance_attributes>
</primitive>
然后发出以下命令:
cibadmin --obj_type resources -U -x foo
要更改先前添加的 IPaddr2 资源的 IP 地址,请发出以下命令:
cibadmin -M -X '<nvpair id="R_ip_P_ip" name="ip" value="10.10.10.102"/>'
注: 此命令不会更改资源名称以匹配新的 IP 地址。要执行该操作,请先删除资源再重新添加带有新 ID 标记的资源。
要停止(禁用)先前添加的 IP 地址资源而不将它删除,请创建包含以下内容的名为 bar 的文件:
<primitive id="R_10.10.10.101">
<instance_attributes id="RA_R_10.10.10.101">
<attributes>
<nvpair id="stop_R_10.10.10.101" name="target-role" value="Stopped"/>
</attributes>
</instance_attributes>
</primitive>
然后发出以下命令:
cibadmin --obj_type resources -U -x bar
要重启动上一步中停止的 IP 地址资源,请发出以下命令:
cibadmin -D -X '<nvpair id="stop_R_10.10.10.101">'
要将此 IP 地址资源从 CIB 中彻底删除,请发出以下命令:
cibadmin -D -X '<primitive id="R_10.10.10.101"/>'
要将 CIB 替换为新的手动编辑版本,请使用以下命令:
cibadmin -R -x $HOME/cib.xml
cibadmin 的详细参数配置可参见
http://www.novell.com/zh-cn/documentation/sle_ha/book_sleha/?page=/zh-cn/documentation/sle_ha/book_sleha/data/man_cibadmin.html

crm_verify

crm_verify:crm_verify 用于检查配置数据库 (CIB) 的一致性和其他问题。它可用来检查包含配置的文件,并可连接到正在运行的群集。它报告两类问题:错误和警告。必须修复错误, Heartbeat 才能正常工作。但是,应让管理员来决定警告是否也应修复。
crm_verify 可帮助创建新的或已修改的配置。您可以在运行的群集中获取 CIB 的本地副本,编辑它,使用 crm_verify 验证它,然后使用 cibadmin 使新配置生效。
示例
检查运行的群集中配置的一致性,并生成详细输出:
crm_verify -VL
检查指定文件中的配置的一致性,并生成详细输出:
crm_verify -Vx file1
将配置传送到 crm_verify ,并生成详细输出:
cat file1.xml | crm_verify -Vp
crm_verify 的详细参数配置可参见
http://www.novell.com/zh-cn/documentation/sle_ha/book_sleha/?page=/zh-cn/documentation/sle_ha/book_sleha/data/man_crmverify.html

crm_diff

crm_diff: 命令协助创建和应用 XML 增补程序。这对可视化两个版本的群集配置之间的更改或保存更改可能非常有用,以便以后使用 cibadmin 应用更改。
示例
使用 crm_diff 确定各种 CIB 配置文件的区别并创建增补程序。通过增补程序的方式,轻松重用各个配置部分,而不必对每个部分使用 cibadmin 命令。
通过对要比较的两个群集设置运行 cibadmin 命令,获取两个不同的配置文件:
cibadmin -Q > cib1.xml
cibadmin -Q > cib2.xml
确定是区分所有文件还是只比较配置子集。
要将文件间的区别打印到 stdout ,请使用以下命令:
crm_diff -o cib1.xml -n cib2.xml
要将文件间的区别打印到某个文件并创建增补程序,请使用以下命令:
crm_diff -o cib1.xml -n cib2.xml > patch.xml
将增补程序应用于原始文件:
crm_diff -o cib1.xml -p patch.xml
crm_diff 的详细参数配置可参见
http://www.novell.com/zh-cn/documentation/sle_ha/book_sleha/?page=/zh-cn/documentation/sle_ha/book_sleha/data/man_crmdiff.html
解决 vip, 或者ldirectord 停止后导致集群无法访问:
vi /etc/ha.d/ha.cf
crm respawn
参考至 :
http://www.novell.com/zh-cn/documentation/sle_ha/book_sleha/?page=/zh-cn/documentation/sle_ha/book_sleha/data/man_crmresource.html
http://www.novell.com/zh-cn/documentation/sle_ha/book_sleha/?page=/zh-cn/documentation/sle_ha/book_sleha/data/man_crmfailcount.html
http://www.novell.com/zh-cn/documentation/sle_ha/book_sleha/?page=/zh-cn/documentation/sle_ha/book_sleha/data/man_cibadmin.html
http://www.novell.com/zh-cn/documentation/sle_ha/book_sleha/?page=/zh-cn/documentation/sle_ha/book_sleha/data/man_crmverify.html
http://www.novell.com/zh-cn/documentation/sle_ha/book_sleha/?page=/zh-cn/documentation/sle_ha/book_sleha/data/man_crmdiff.html
http://www.novell.com/zh-cn/documentation/sle_ha/book_sleha/?page=/zh-cn/documentation/sle_ha/book_sleha/data/man_crmmon.html


Linux 高可用性方案之 Heartbeat 的日常维护命令_html


标签:zh,cn,documentation,高可用性,Linux,Heartbeat,ha,资源,crm
From: https://blog.51cto.com/starsliao/5764173

相关文章

  • Linux系统中查看进程端口常用命令有哪些?
    在Linux系统中,熟练掌握各种各样的Linux命令是非常关键的,它的功能十分强大,几乎能摆平所有状况,是我们开展工作、提升工作效率的重中之重。本篇文章为大家详细介绍一下Linu......
  • linux常见问题
    1,使用python的时候发现pipinstallnumpy 报错:-bash:pip:未找到命令2,于是安装pip:wgethttps://bootstrap.pypa.io/pip/2.7/get-pip.py结果报错:-bash:wget:......
  • Linux6安装基础教程(Oracle Linux 6)
    安装OracleLinux6教程1.选择安装2.检查镜像,此处可选择Skip跳过3.选择安装语言4.布局键盘5.介质安装6.是否格式化,此处选择yes7.设置主机名8.配置静态IP地址9.选择时区,默认选......
  • CPU飙高问题排查,从linux到java代码
    第一步:top监测进程资源占用情况,获取异常进程编号。这一步可以获得异常占用进程号。第二步:psH-eopid,tid,%cpu|grepxxxx  H打印线程以及进程信息,-eo打印指定的字......
  • linux服务器如何查看硬盘序列号
      命令: hdparm-I 硬盘绝对路径--其中参数可以使用 “I”也可以使用 “i”,只是大写的参数展示的数据更详细;注:这个命令普通用户无法使用,需要使用管理员权限;......
  • aspose工具word转pdf文件,在linux服务器上出现内容乱码问题
    1、先看问题的出现:功能是这样滴:上传一个word文件,然后把word文件转成pdf,保存在服务器上,然后打开服务器上的pdf文件地址,在线查看文件出现内容乱码,如下:   2......
  • 实验-Linux添加磁盘分区挂载以及CentOS下的文件系统
    概览实验项目名称CentOS7下的文件系统实验时间2022年10月17日实验类型□验证性□设计性□综合性一、实验目的1.掌握在虚拟机中......
  • Linux下更改MySQL数据库存储路径
    1、home目录下建立data目录,data目录下建立mysql目录  2、首先停止掉mysql服务,在终端中执行"/etc/init.d/mysqlstop"或者执行"servicemysqldstop"并回车确定。3......
  • linux 代码覆盖率 检测
    gcc/g++自带了gcov工具可以自动生成一个执行代码覆盖率信息的文件gcda。只需要带编译宏-fprofile-arcs-ftest-coverage就可以生成gcno文件具体的信息可见http://gcc.g......
  • 在Linux系统安装及使用ShellClash的教程
    支持Debian、CentOS、Ubuntu、Armbian等绝大多数发行版Linux系统下安装及使用本脚本!使用步骤:登陆SSH使用SSH连接工具来登陆SSH,推荐putty(体积最小),JuiceSSH(支持安卓手机),或......