首页 > 其他分享 >KingbaseES V8R6 集群运维案例--麒麟系统bug导致sys_monitor.sh无法启动集群

KingbaseES V8R6 集群运维案例--麒麟系统bug导致sys_monitor.sh无法启动集群

时间:2023-05-09 19:48:14浏览次数:61  
标签:V8R6 运维 启动 数据库 sys sh 集群 monitor

案例说明:
麒麟信安操作系统,在部署了KingbaseES V8R6集群后,sys_monitor.sh在启动集群时,启动数据库服务失败,导致集群无法正常启动。后连接现场分析发现,此环境只要通过ssh或sys_securecmd工具远程启动数据库服务都会失败。操作系统版本如下:

适用版本:
KingbaseES V8R6

一、问题现象:
如下图所示,新部署的集群,通过sys_monitor.sh启动失败,但是通过sys_ctl手工启动主备节点数据库服务后,集群状态正常。

如下图所示,手工启动主备节点数据库服务后,集群状态正常:

二、问题分析:
1)分析sys_monitor.sh执行过程

执行: sh -x sys_monitor.sh start

如下图所示:

     1、sys_monitor.sh脚本通过sys_securecmd远程连接节点启动数据库服务。
     2、脚本反馈数据库服务已经被启动。
     3、ksql连接数据库服务访问失败。
     4、验证数据库服务启动失败,集群无法启动。

2)远程连接节点启动数据库服务测试


如上图所示,通过sys_securecmd或ssh连接远程节点启动数据库服务均失败。

3)查看数据库日志,在通过ssh或sys_securecmd远程启动数据库后,数据库会收到SIGTERM信号。

通过以上分析,数据库服务本地启动正常,但是通过ssh或securecmd工具远程启动后,数据库服务收到SIGTERM信号被终止,可能和操作系统有关。

三、问题解决:
后经操作系统人员分析,此故障为系统systemd服务bug ,打了补丁后,问题解决。下图为系统补丁。在此环境中,sys_securecmdd进程通过systemd服务管理。

标签:V8R6,运维,启动,数据库,sys,sh,集群,monitor
From: https://www.cnblogs.com/kingbase/p/17172496.html

相关文章

  • KingbaseES V8R6 Deallocate 语句使用说明
    用途DEALLOCATE被用来释放一个之前PREPARE好的SQL语句。如果不显式地释放一个PREPARE语句,那么会话结束时会释放它。prepare语句类似oracle的绑定变量绑定过程:1)PREPARE,准备绑定变量SQL2)EXECUTE,绑定并执行3)DEALLOCATE,释放绑定变量测试1.只有本地会话可以看的prepare语句......
  • KingbaseES V8R6 最老事务阻止vacuum freeze
    前言最近生产环境发生几次由于长事务导致表、库年龄没法回收的情况。我们要规避这种情况的发生,不要等发生了再去强制中断会话连接。当数据库中存在最老事务版本xmin,那么早于他的快照可以被标记为frozen,如果在最老事务之后产生的快照版本,不被标记为frozen。这个最老事务通常被认......
  • KingbaseES V8R6 sys_squeeze 使用
    sys_squeeze介绍sys_squeeze是KingbaseES的一个扩展插件,该组件将提供人工调用命令实现对表deadtuple的清理工作。该组件在清理表空间的过程中,不会全程加排他锁,能保证业务运行期间尽可能不影响对目标表的访问。而vacuumfull也可实现死亡元组占用空间释放,但是缺点是会锁表,阻止业......
  • KingbaseES V8R6备份恢复系列之 -- system-Id不匹配备份故障
    ​KingbaseESV8R6备份恢复案例之---system-Id不匹配备份故障案例说明:在KingbaseESV8R6执行备份时,在sys_log日志中出现system-id不一致的故障并伴随有归档失败,故障如下图所示:适用版本:KingbaseESV8R6一、问题分析1、查看当前数据库system-id可以通过sys_controldata-D......
  • KingbaseES数据库运维案例之---permission denied to create "sys_catalog.xxx"
    ​KingbaseES数据库运维案例之---permissiondeniedtocreate"sys_catalog.bdsj_bdgl_test"案例说明:在KingbaseES数据库kingbase.conf修改了search_path='"$user",sys_catalog'后,在数据库下执行创建对象操作,出现以下故障。适用版本:KingbaseESV8R6一、问题现象如下所示......
  • KingbaseES V8R6运维案例之---MySQL和KingbaseES字符串排序规则对比
    案例说明:相同数据排序后查询,在MySQL和KingbaseES下得到的排序顺序不一致,本案例从MySQL和KingbaseES的排序规则分析,两种数据库排序的异同点。适用版本:KingbaseESV8R6、MySQL8.0一、MySQL的排序规则1、排序规则(collation)排序规则是依赖于字符集,字符集是用来定义MySQL存储不......
  • KingbaseES V8R3 集群运维系列 -- sync_flag参数配置
    ​案例说明:在KingbaseESV8R3集群一主二备的架构中,配置了流复制为同步(sync)模式,但是集群启动后,流复制状态中显示备库是async模式(备库和主库数据已经同步),从备库的recovery.log日志也可以看到,备库启动后被复制模式设置为async模式。如下图备库recovery.log:适用版本:KingbaseES......
  • KingbaseES V8R6 等待事件之LWLock Buffer_IO
    等待事件含义当进程同时尝试访问相同页面时,等待其他进程完成其输入/输出(I/O)操作时,会发生LWLock:BufferIO等待事件。其目的是将同一页读取到共享缓冲区中。每个共享缓冲区都有一个与LWLock:BufferIO等待事件相关联的I/O锁,每次都必须在共享缓冲区外部检索页。此锁用于处理多个会......
  • KingbaseES V8R3 集群运维系列 -- failover切换后集群自动恢复
    ​案例说明:KingbaseESV8R3集群默认在触发failover切换后,为保证数据安全,原主库需要通过人工介入后,恢复为新的备库加入到集群。在无人值守的现场环境,需要在触发failover切换后,主库可以自动恢复为新备考加入集群,提升架构的高可用性。适用版本:KingbaseESV8R3集群架构:node_id......
  • 分享一个提高运维效率的 Python 脚本
    哈喽大家好我是咸鱼,今天给大家分享一个能够提升运维效率的python脚本咸鱼平常在工作当中通常会接触到下面类似的场景:容灾切换的时候批量对机器上的配置文件内容进行修改替换对机器批量替换某个文件中的字段对于Linux机器,咸鱼可以写个shell脚本或者直接批量使用sed命......