openGauss学习笔记-189 openGauss 数据库运维-常见故障定位案例-TPCC-WAL-内存
189.1 TPCC运行时,注入磁盘满故障,TPCC卡住的问题
189.1.1 问题现象
TPCC运行时,注入磁盘满故障,TPCC卡住,故障消除后,TPCC自动续跑。
189.1.2 原因分析
数据库本身机制,在性能日志(gs_profile)所在磁盘满时,导致无法写入而陷入无限等待,表现为TPCC卡住。磁盘满故障消除后,性能日志能正常写入,TPCC恢复正常。
189.1.3 处理分析
外部监控磁盘使用状况,定时进行清理磁盘。
189.2 备机处于need repair(WAL)状态问题
189.2.1问题现象
openGauss备机出现Standby Need repair(WAL)故障。
189.2.2 原因分析
因网络故障、磁盘满等原因造成主备实例连接断开,主备日志不同步,导致数据库在启动时异常。
189.2.3 处理分析
通过gs_ctl build -D 命令对故障节点进行重建,具体的操作方法请参见《工具与命令参考》中“系统内部命令 > gs_ctl”的build参数。
189.3 内存不足问题
189.3.1 问题现象
客户端或日志里出现错误:memory usage reach the max_dynamic_memory。
189.3.2 原因分析
出现内存不足可能因GUC参数max_process_memory值设置较小相关,该参数限制一个openGauss实例可用最大内存。
189.3.3 处理分析
通过工具gs_guc适当调整max_process_memory参数值。注意需重启实例生效。
标签:常见故障,WAL,gs,故障,TPCC,磁盘,openGauss,189.3 From: https://blog.51cto.com/shuchaoyang/9149135