首页 > 其他分享 >openGauss监控场景处理

openGauss监控场景处理

时间:2024-04-11 11:11:38浏览次数:21  
标签:场景 备库 死锁 资源 监控 进程 openGauss 节点 select

openGauss 监控场景处理
死锁数量异常
判断方法:

select sum(deadlocks) as deadlocks from dbe_perf.GLOBAL_STAT_DATABASE
异常分析:

请求与保持条件:获取资源的进程可以同时申请新的资源。
非剥夺条件:已经分配的资源不能从该进程剥夺。
循环等待条件:多个进程构成环路,并且每个进程都在等待相邻进程正占用的资源。
互斥条件:资源只能被一个进程使用。
解决方案

检索出死锁进程的 ID(select oid,relname from pg_class where relname=‘all_date’;),检索出来的字段中,waiting 字段数据为 t 的那条就是死锁进程,找到对应的 procpid 列的值。
将进程杀掉,select pg_cancel_backend(‘死锁那条数据的 procpid 值’),运行之后再次更新这个表,sql 顺利执行。
如果 pg_stat_activity 没有记录,则查询 pg_locks 是否有这个对象的锁,select pid_locks where relation=‘上面查询出来的 oid’;然后杀掉进程。
运维建议

在所有事务中都以相同的次序使用资源。
使事务尽可能简单并在一个批处理中。
为死锁超时参数设置一个合理范围。
避免在事务内和用户进行交互,减少资源锁定时间。
使用较低的隔离级别。
主备复制状态异常
判断方法

gs_om -t status|grep cluster_state|grep Normal|wc -l
异常分析

可能存在批量处理大量数据导致主从节点宕机,主节点重启后从节点 WAL 同步信息不完整。
主库宕机或者失联 3.备库宕机或者失联。
解决方案

通过查看主备状态判断是主节点还是备节点故障。
主节点故障可以尝试重启主节点,若不生效,可以再备节点使用 gs_ctl failover -D “备节点的数据目录”,然后刷新机器(gs_om -t refreshconf),这时如果主机好了,直接启动出现两主,这时使用 gs_ctl build -D “主节点的数据目录” -b incremental。
-b 参数为指定重建备机的模式,incremental 为取主备差异的数据增量修复备机。
备机回放 gap 使用空间异常
判断方法

select read_ptr-last_replayed_read_ptr as replay_gap from dbe_perf.GLOBAL_REDO_STATUS
异常分析

开启了数据文件的 checksum,因为回放时需要大量的 CPU 资源,在进行 checksum 时会消耗 startup 进程的资源。
主库频繁的离散 IO 操作,如大量的索引变更,大量的 vacuum 操作。
频繁和大量的系统调用。
解决方案

关闭 checksum,除非要防御物理篡改。
删除没有必要的索引。
根据业务调整垃圾回收的调度。
检查点拉长,可以减少 full page 的量。
加大备库的 shared buffer。
关闭 IO 时间的跟踪。
备库使用 IOPS 能力更强,IO 延迟更低的机器。
调整内核参数,使用并行 apply。
如果有多个备库,备库可以关闭 fsync。
将冻结年龄加大,可以减少冻结产生的 redo。
增加单个进程可打开的文件数。
长查询时间异常
判断方法

select EXTRACT (epoch from max(current_timestamp - query_start)) from dbe_perf.SESSION_STAT_SCTIVITY where query_start is not null and state=‘active’ and application_name not like ‘dn_%’;
异常分析

SQL 未经过优化,没有走合适的索引。
可能存在锁争用问题。
可能存在全表扫描问题。
解决方案

查看对应语句的执行计划并作出相应的优化。
创建合适的索引。

标签:场景,备库,死锁,资源,监控,进程,openGauss,节点,select
From: https://www.cnblogs.com/helloopenGauss/p/18128441

相关文章

  • 【微服务-应用性能监控】SkyWalking最佳实践
    上一篇我们掌握了基于Sleuth+Zipkin对微服务架构实施基于日志的链路追踪,通过Sleuth在微服务应用中附加链路数据,再通过Zipkin实现链路数据收集与可视化,从而保证开发与运维人员在生产环境了解微服务的执行过程与具体细节,为产品运维提供了有力的保障。本篇文章咱们还是......
  • openGauss与PostgreSQL对比测试SSL之自签名CA证书单向认证测试
    openGauss与PostgreSQL对比测试SSL之自签名CA证书单向认证测试本文测试自签名CA证书的单向认证:客户端只验证服务器证书的有效性,而服务器端不验证客户端证书的有效性。服务器加载证书信息并发送给客户端,客户端使用根证书来验证服务器端证书的有效性。服务端证书的客户......
  • openGauss2.0.0极简版安装
    openGauss2.0.0极简版安装openGauss的安装在官方文档的描述中,一直以企业生产环境为标准进行安装部署。但在个人基本的功能测试需求下,这样的安装操作显得有些复杂。在openGauss2.0.0版本中(2021.03.31发布)新增了极简版的软件包,极简版安装的使用主体主要针对高校和个人测试......
  • 在Linux中,如何监控系统资源使用情况?
    在Linux环境中,监控系统资源使用情况是系统管理和故障排查的关键环节。以下是一些主要的方法和命令来监控不同类型的系统资源:1.CPU使用情况top或htop:实时显示系统中各个进程对CPU资源的使用状况。top是一个经典的命令行工具,而htop是其增强版本,提供了彩色界面和垂直/水平......
  • Python中关于finally的使用场景
    finally关键字在Python中用于定义一个代码块,该代码块在try-except结构中无论是否发生异常,或者在try块中执行了return、break、continue等控制流语句,都会被执行。finally子句提供了确保某些清理操作(如释放资源、关闭文件、断开连接等)始终执行的一种机制,即使程序在处理过程中遭遇异......
  • 如何监控容器或K8s中的OpenSearch
    概述当前OpenSearch使用的越来越多,但是OpenSearch生态还不尽完善.针对如下情况:监控容器化或运行在K8s中的OpenSearch我查了下,官方还没有提供完备的方案.这里如何监控K8s中的OpenSearch,包括安装exporter插件、采集、展示全环节。OpenSearch简介OpenS......
  • 一网统管/安防监控/视频综合管理EasyCVR视频汇聚平台解决方案
    一、当前现状分析当前视频资源面临以下问题:1)不同单位在视频平台建设中以所属领域为单位,设备品牌众多,存在的标准不一,各系统之间也没有统一标准;2)各单位视频平台建设分散、统筹性差,没有进行统一规划、统一部署,各平台之间的数据共享不足,数据孤岛现象严重;3)各单位视频系统功能应用单......
  • 牛蛙!GoFrame2.7正式版的监控组件真是及时雨
    声明:本文首发在同名公众号:王中阳Go,未经授权禁止转载。......
  • 性能监控工具nmon下载配置
    我的服务器是centos7.8,官网下载nomon一、找到官网https://nmon.sourceforge.io/pmwiki.php  二、下载到被测服务器上wgethttp://sourceforge.net/projects/nmon/files/nmon16p_32_binaries_feb_2024.tar.gz解压文件执行启......
  • 安防视频监控/视频集中存储EasyCVR平台开启鉴权后设备列表不展示是为什么?
    安防视频监控/视频集中存储/云存储/磁盘阵列EasyCVR平台可拓展性强、视频能力灵活、部署轻快,EasyCVR基于云边端一体化架构,具有强大的数据接入、处理及分发能力,可提供视频监控直播、云端录像、云存储、录像检索与回看、智能告警、平台级联、云台控制、语音对讲、智能AI分析接入等功......