• 2024-11-15KingbaseES V8R3集群运维案例之---集群恢复案例
    案例说明:KingbaseESV8R3流复制集群在专用机环境下,出现异常问题,恢复过程如下:问题现象及解决方案:1、现象一如下所示,整个集群无法启动,选择其中一个节点作为主节点,数据库服务启动如下所示:解决方案:将sys_xlog下的xxxxA.history文件改名后,重新启动数据库服务:2、现象二数据库启
  • 2024-08-14KingbaseES V8R3集群运维案例---sys_md5修改密码错误
    案例说明:KingbaseESV8R3集群在通过sys_md5修改SYSTEM用户密码时出现异常“invalidpasswordlengthincluster_passwdfile”。适用版本:KingbaseESV8R3一、问题现象ksql访问集群9999端口,提示“md5authenticationfailed”:kingbasecluster服务端口9999的用户认证,是通过
  • 2024-07-05KingbaseES V8R3集群运维案例之---OpenEuler系统kingbasecluster无法启动
    案例说明:OpenEuler系统环境,KingbaseESV8R3集群无法启动kingbasecluster服务,经过检查发现,在通过脚本启动kingbasecluster检测网关(ping网关)时,系统返回中文提示,导致脚本检测网关联通失败,kingbasecluster服务启动失败。适用版本:KingbaseESV8R3操作系统:openEuler22.03LTS-
  • 2024-04-11KingbaseES V8R3备份恢复案例---sys_rman_v6执行物理备份
    案例说明:在KingbaseESV8R3的最新版本中使用了sys_rman_v6执行备份,本案例介绍如何使用sys_rman_v6执行物理备份。适用版本:KingbaseESV8R3系统架构:test=#showpool_nodes;node_id|hostname|port|status|lb_weight|role|select_cnt|load_balance_n
  • 2024-04-01KingbaseES V8R3集群运维案例---主库OOM故障分析
    案例说明:KingbaseESV8R3集群,主库数据库OOM,产生core,请帮忙分析。数据库内存64Gb,为华为云虚拟机,无swap。适用版本:KingbaseESV8R3一、问题分析1、查看sys_log数据库OOM信息PortalMemory:8192totalin1blocks;7888free(0chunks);304usedPortalHeapMemory:1
  • 2024-03-29KingbaseES V8R3集群运维案例之---failover切换后新主库启动过程
    案例说明:KingbaseESV8R3集群failover切换后,在生产环境中,新主库启动过程中可能会有业务访问,出现‘系统只读’的问题。如下图所示:适用版本:KingbaseESV8R3一、问题分析1、如下所示,failover切换过程:1)在master节点执行failover_stream.sh脚本执行failover切换。2)ping网关地
  • 2024-03-29KingbaseES V8R3集群运维案例之---集群启动“DATA_SIZE_DIFF 16 (MB)”故障
    案例说明:为保证集群数据的一致性安全,在主备库的数据相差“DATA_SIZE_DIFF>=16M"以上时,该备库不能参与主备切换,并且通过kingbase_monitor.sh启动集群时,集群将无法启动;本案例对此种故障做了复现,并测试了解决方法。适用版本:KingbaseESV8R3适用版本:KingbaseESV8R3一、案例
  • 2024-03-29KingbaseES V8R3备份恢复案例之---backup_label does not exist in KINGBASE_DATA
    案例说明:在KingbaseESV8R3集群主库执行sys_rman的全备时,出现‘backup_labeldoesnotexistinKINGBASE_DATA’的故障,如下图所示:适用版本:KingbaseESV8R3一、问题现象如下所示,数据库执行sys_rman物理备份:[kingbase@node201bin]$./sys_rman-Usystem-W123456-dtes
  • 2024-03-29KingbaseES集群运维案例之-- V8R3与V8R6集群wal函数应用
    案例说明:KingbaseESV8R3和V8R6集群在通过函数获取wal日志的相关信息时,两个版本的函数名称不同,本案例做了函数应用的对比和总结。适用版本:KingbaseESV8R3/R6一、KingbaseESV8R3相关函数Tips:在V8R3的版本,事务日志名称为xlog。1、查询数据库支持的函数test=#selectpron
  • 2023-09-19KingbaseES V8R3 备份恢复案例 -- sys_rman物理备份异机恢复
    案例说明:在生产环境通过sys_rman执行了物理备份后,需要在异机构建测试环境,本案例描述了通过物理备份异机恢复的详细过程及操作。适用版本:KingbaseESV8R3节点信息:[kingbase@node102bin]$cat/etc/hosts......192.168.1.101node101#生产节点192.168.1.102node
  • 2023-09-18KingbaseES V8R3集群运维案例之---主库数据库服务down后failover切换详解
    案例说明:对KingbaseESV8R3集群,主库数据库服务down后,failover切换进行分析,详解其执行切换的过程,本案例可用于对KingbaseESV8R3集群failover故障的分析参考。适用版本:KingbaseESV8R3集群架构:node_id|hostname|port|status|lb_weight|role|select_cnt
  • 2023-09-18KingbaseES V8R3集群运维案例---failover切换故障分析
    案例说明:KingbaseESV8R3集群主库数据库服务重启后,failover切换失败,分析failover失败的具体原因。适用版本:KingbaseESV8R3一、集群架构node13----->主库(primary)node25----->管理备库(standby)node58----->备库(standby)二、故障现象1主2备集群,172.31.*
  • 2023-09-18KingbaseES V8R3集群运维案例之---流复制异步同步及全同步模式配置
    案例说明:通过案例描述KingbaseESV8R3集群异步、同步及全同步强一致性配置,本案例为一主二备的架构。适用版本:KingbaseESV8R3集群架构:集群复制配置参数说明:1)sync_flag[kingbase@node101bin]$cat../etc/HAmodule.conf|grep-isync_#1->synchronouscluster,0->async
  • 2023-09-18kingbaseES V8R3集群运维案例之---集群部署前后ssh端口修改
    kingbaseESV8R3集群运维案例之---集群部署前后ssh端口修改案例说明:kingbaseESV8R3集群部署读写分离的集群是使用ssh的默认端口(22)部署,当改为非默认端口时,在部署中或部署后会因kingbasecluster脚本ssh的连接而失败,现提出以下解决方案。适用版本:KingbaseESV8R31
  • 2023-05-09KingbaseES V8R3 集群运维系列 -- sync_flag参数配置
    ​案例说明:在KingbaseESV8R3集群一主二备的架构中,配置了流复制为同步(sync)模式,但是集群启动后,流复制状态中显示备库是async模式(备库和主库数据已经同步),从备库的recovery.log日志也可以看到,备库启动后被复制模式设置为async模式。如下图备库recovery.log:适用版本:KingbaseES
  • 2023-05-09KingbaseES V8R3 集群运维系列 -- failover切换后集群自动恢复
    ​案例说明:KingbaseESV8R3集群默认在触发failover切换后,为保证数据安全,原主库需要通过人工介入后,恢复为新的备库加入到集群。在无人值守的现场环境,需要在触发failover切换后,主库可以自动恢复为新备考加入集群,提升架构的高可用性。适用版本:KingbaseESV8R3集群架构:node_id
  • 2023-03-02KingbaseES V8R3 集群运维案例 --操作系统‘soft lockup’引起的failover切换
    案例说明:在国产中标麒麟系统生产环境中,监控发现KingbaseESV8R3集群发生了failover的主备切换,客户需要给出分析报告,说明此次集群发生failover切换的原因,本次文档通过分析
  • 2023-03-02KingbaseES V8R3 运维案例 -- sys_dump备份故障“SYS_MAC_POLICY_ENFORCEMENT”
    ​案例说明:在KingbaseESV8R3执行sys_dump时出现“ERROR:permissiondeniedforrelationSYS_MAC_POLICY_ENFORCEMENT”故障,此前做过一些安全相关的配置,比如修改syssa
  • 2023-02-28KingbaseES V8R3 集群运维系列 -- 修改数据库服务端口
    ​案例说明:KingbaseESV8R3集群数据库服务端口(默认:54321)的配置在数据库及集群多个配置文件中都存在,修改端口需要更改所有的配置文件,本案例详细描述了数据库服务端口修改
  • 2023-02-24KingbaseES V8R3集群运维案例之---kingbase_monitor.sh启动”two master“案例
    案例说明:KingbaseESV8R3集群,执行kingbase_monitor.sh启动集群,出现“twomaster”节点的故障,启动集群失败;通过手工sys_ctl启动各节点数据库服务后,并手工重启kingbaseclust
  • 2023-01-11KingbaseES V8R3数据库运维案例之---不完整的启动包(incomplete startup packet)复现
    案例说明:在KingbaseESV8R3数据库的sys_log日志中,出现以下故障信息“不完整的启动包(incompletestartuppacket)”日志信息。本案例复现此日志信息发生的原因。如下图所示
  • 2022-12-13KingbaseES V8R3集群备份恢复案例之--- timingbackup备份
    案例说明:KingbaseESV8R3集群自带了timingbackup.sh的脚本,可以通过一个脚本执行逻辑和物理备份,逻辑备份采用sys_dump,物理备份适用sys_basebackup,本案例详细记录了脚本的使
  • 2022-12-12KingbaseES V8R3集群运维案例之---failover故障处理
    ​案例说明:此案例,为KingbaseESV8R3集群failover切换时,通用的故障处理方式。通过对failover.log和recovery.log日志的解读,让大家了解KingbaseESV8R3集群failover的恢复
  • 2022-10-20KingbaseES V8R3集群运维案例之---failover故障处理
    案例说明:此案例,为KingbaseESV8R3集群failover切换时,通用的故障处理方式。通过对failover.log和recovery.log日志的解读,让大家了解KingbaseESV8R3集群failover的恢复过程
  • 2022-08-27KingbaseES V8R3集群运维案例之---用户自定义表空间管理
    ​案例说明:KingbaseES数据库支持用户自定义表空间的创建,并建议表空间的文件存储路径配置到数据库的data目录之外。本案例复现了,当用户自定义表空间存储路径配置到data下