首页 > 其他分享 >一文解读GaussDB(DWS)监控运维诊断优化能力

一文解读GaussDB(DWS)监控运维诊断优化能力

时间:2024-11-15 11:31:31浏览次数:1  
标签:DWS 历史 运维 topsql GaussDB 查询 诊断 集群 SQL

本文分享自华为云社区《GaussDB(DWS) 监控运维诊断优化,历史查询诊断》,作者: yd_219384351。

 

DWS历史查询诊断,基于DWS集群历史topsql,提供异常诊断能力。提供SQL趋势统计分析曲线图,展示SQL历史运行趋势;提供历史topsql异常诊断能力,识别资源占用高,运行时间长,以及运行异常的烂SQL,展示各类异常SQL数量,并支持过滤各类异常SQL;提供单SQL的一键诊断能力,一键诊断能力包括SQL语句检查,执行计划诊断和可视化,帮助开发者分析执行计划,分析SQL语句执行性能消耗,提升租户侧自运维能力。

核心功能

功能使用

登录数据仓库服务,选择优化诊断菜单

左侧菜单栏选择优化诊断菜单,会进到优化诊断功能界面,在集群列表中选中集群,第一个tab页就是历史查询分析。

提示:此功能依赖历史查询监控指标,需要集群开启历史查询监控才能正常使用,集群如果未开启监控设置,可从此界面开启。

趋势统计

界面上方是历史查询趋势统计,提供三个tab页切换,分别为历史查询总趋势,SQL质量趋势,SQL运行时长趋势。

历史查询总趋势:支持按照不同维度(集群/用户/实例/应用名称/资源池),指定时间范围内,统计每分钟执行SQL数量。

SQL质量趋势:统计指定时间范围内,每类异常项的SQL数量。 SQL运行时长趋势:统计集群历史SQL执行时间(平均时长/最大时长/最小时长)。

SQL异常诊断,质量概览

界面中间部分,提供SQL质量概览,显示各类异常SQL数量,点击卡片下方列表同步过滤。

异常项:不下推/CPU超过10万秒/Not in子查询/时长超过1小时/内存超过10G/下盘超过50G/streaming数量超过50

不同集群,可调整异常项的阈值,异常诊断规则基于DWS集群历史topsql字段可灵活配置。

历史topsql详情

界面最下方部分,显示历史topsql详情列表,支持条件搜索和全字段排序。

默认显示查询ID,用户名称,数据库名称,提交时间,执行时间,查询语句,查询状态等字段,想要查看更多字段可点击右上角齿轮图标设置显示字段。 点击查看详情按钮可查看历史topsql详情

历史topsql数据汇总

历史topsql数据汇总,按照不同维度对历史topsql做汇总,显示SQL数量,和资源消耗情况。

维度:数据库/用户/资源池/应用名称/实例/uniqueSQLId

一键诊断-执行计划诊断

针对执行计划格式,对执行计划字符串进行解析,对历史topsql表中记录的执行计划进行诊断,并提供可视化图形,可以展示每个节点执行时长,type,扫描行数等信息。

异常诊断项:重分布异常,估算异常,计算倾斜,分区扫描异常,跨逻辑集群查询。

注意:集群历史topsql需要设置为perf级别才可以显示每步执行时长,需要设置guc参数resource_track_level=perf

一键诊断-SQL语句检查

对用户编写的SQL语句,结合现网经验,总结了12条SQL军规,对SQL语句进行静态检查,可以分析烂SQL,并给出修复意见。

提示:12条SQL军规只是结合DWS使用情况来制定的,具有参考价值,给出的规范还需要根据用户使用情况后续进行迭代。


华为开发者空间,汇聚鸿蒙、昇腾、鲲鹏、GaussDB、欧拉等各项根技术的开发资源及工具,致力于为每位开发者提供一台云主机、一套开发工具及云上存储空间,让开发者基于华为根生态创新。点击链接,免费领取您的专属云主机

 

点击关注,第一时间了解华为云新鲜技术~

标签:DWS,历史,运维,topsql,GaussDB,查询,诊断,集群,SQL
From: https://www.cnblogs.com/huaweiyun/p/18547631

相关文章

  • KingbaseES V8R3集群运维案例之---集群恢复案例
    案例说明:KingbaseESV8R3流复制集群在专用机环境下,出现异常问题,恢复过程如下:问题现象及解决方案:1、现象一如下所示,整个集群无法启动,选择其中一个节点作为主节点,数据库服务启动如下所示:解决方案:将sys_xlog下的xxxxA.history文件改名后,重新启动数据库服务:2、现象二数据库启......
  • 运维的分类
    初级运维工程师技能:“一些简单的系统及设备的维护,干得工作比较杂”月薪:“3K——7K”提升:“可以找适合自己一项技能去学习,同时可以考取行业内行业内含金量较高的证书”这个层级运维一般是在较小的公司,提供简单的重复性的运维服务,岗位替代性比较强,薪资的议价范围小中级运维工程师技......
  • Grafana:监控PostgreSQL数据运维新利器
    在数据驱动的业务环境中,数据库的性能监控是确保数据流畅和系统稳定的关键。PostgreSQL,作为强大的开源关系型数据库,其性能监控尤为重要。Grafana,一个开源的数据可视化和监控平台,提供了一个直观的界面来监控和分析数据。本文将带您了解如何利用Grafana来监控PostgreSQL,让您的数据库......
  • 全面指南:OpenSSH和日志管理策略,轻松提升安全与运维效率
    目录日志管理配置rsyslog服务器opensshSecureShell示例SSH主机密钥配置基于SSH密钥的身份验证 [root@lnh~]#cat/etc/redhat-releaseCentOSStreamrelease8//查看当前系统版本[root@lnh~]#uname-r4.18.0-257.el8.x86_64//查看当前系统......
  • 数据库运维实操优质文章文档分享(含Oracle、MySQL等) | 2024年10月刊
    本文为大家整理了墨天轮数据社区2024年10月发布的优质技术文章/文档,主题涵盖Oracle、MySQL、PostgreSQL等主流数据库系统以及国产数据库的技术实操,从基础的安装配置到复杂的故障排查,再到性能优化的实用技巧及常用脚本等,分享给大家:Oracle优质技术文章概念梳理&安装配置OracleR......
  • Linux之运维命令
    查看日志1、系统今日小于warning级别的日志manjournalctl|grep-C2"debug"|journalctl-xenall--sincetoday-pwarning[-ojson|-ojson-pretty]2、系统启动日志、内核日志#启动journalctl-b[-0]#内核journalctl-k3、指定服务或进程最新日志#......
  • 【运维】如何在不同操作系统上获取计算机硬件信息
    目录引言一、Windows操作系统1.1获取CPU信息1.2获取内存信息1.3获取硬盘信息1.4获取显卡信息1.5获取显存信息二、macOS操作系统2.1获取CPU信息2.2获取内存信息2.3获取硬盘信息2.4获取显卡信息2.5获取显存信息三、Linux操作系统3.1获取CPU信息3.2......
  • [运维][Nginx]Nginx学习(1/5)--Nginx基础
    Nginx简介背景介绍Nginx一个具有高性能的【HTTP】和【反向代理】的【WEB服务器】,同时也是一个【POP3/SMTP/IMAP代理服务器】,是由伊戈尔·赛索耶夫(俄罗斯人)使用C语言编写的,Nginx的第一个版本是2004年10月4号发布的0.1.0版本。另外值得一提的是伊戈尔·赛索耶夫将Nginx的源码......
  • 运维系列&虚拟机系列:Ubuntu Server 24.04.1 配置静态ip
    UbuntuServer24.04.1配置静态ipUbuntuServer24.04.1配置静态ip1.找到NetPlan配置文件2.cat一下3.我这里用的无线网卡,修改wlp1s0下的配置4.保存文件后,执行5.检查IP地址和网络连接UbuntuServer24.04.1配置静态ip实体机安装完后,记录一下静......
  • 运维工程师的出路到底在哪里?零基础入门到精通,收藏这篇就够了
    目录前言一、运维工程师的职责二、能力要求(一)技术方面(二)管理方面(三)业务方面三、35岁被称为运维半衰期,究竟为何?四、该如何顺利过渡半衰期五、运维的职业发展路径总结前言你是不是也常常听到身边的运维人员抱怨,他们的出路到底在哪里呢?别着急,让我告诉你,运维人员......