首页 > 其他分享 >TiDB 多集群告警监控-中章-融合多集群 Grafana

TiDB 多集群告警监控-中章-融合多集群 Grafana

时间:2023-08-23 12:36:21浏览次数:44  
标签:中章 数据源 Grafana 集群 监控 TiDB 仪表盘

作者: longzhuquan



背景

随着公司XC改造步伐的前进,越来越多的业务选择 TiDB,由于各个业务之间需要物理隔离,避免不了的 TiDB 集群数量越来越多。虽然每套 TiDB 集群均有两个详细的监控 Dashboard、Grafana,但对于运维来说几十套集群的监控、告警、巡检均需消耗巨大的精力。上篇介绍了监控工具的安装,以及业务组如何规范的设置。本章着重介绍如何将多套集群 Grafana 数据统一管理。



监控大盘介绍

TiDB 多集群告警监控-中章-融合多集群 Grafana_数据

在夜莺仪表盘-监控仪表盘界面,通过预先配置好想要查看的图表,用户在未来查看时只需点击即可直接浏览一系列图表,无需逐一选择。例如,在 MySQL 监控中,资深 DBA 可以事先将重要的图表以及应关注的图表都配置到监控大盘中。详细介绍可参考 仪表盘 介绍。

先看看单张效果

TiDB 多集群告警监控-中章-融合多集群 Grafana_数据_02

怎么样是不是似曾相识?没错监控大屏可以适配TiDB的 Grafana,上一篇接入数据源之后,其实夜莺即可通过查询到所有普罗米修斯的数据,也可以将 TIDB 的监控数据全部查询。前提是在此页面进行 PromQL 的编写。



优雅的 COPY TiDB 监控

前面已经看到效果,但如果按照官方一个一个的图标的编辑,那把TiDB一套集群图标编辑完,估计也过年了。那有没有更方便的方式呢?

经过我司大量的实践,已经适配出了一套常用的监控数据,并且已经提交给夜莺官方,在最新企业版“仪表盘-内置仪表盘”可以看到 TIDB 监控模版。各位可直接使用。开源版暂时未放出,不过有兴趣的需要可私聊题主,或者在文章下留言,即可得到同款模版(由于文章限制 json 文件不太好进行附件)。

TiDB 多集群告警监控-中章-融合多集群 Grafana_数据源_03

如得到文件后点击 仪表盘-监控仪表盘-对于业务组-批量导入-导入仪表盘 JSON 即可

TiDB 多集群告警监控-中章-融合多集群 Grafana_数据_04

导入完成后进入图表-点击修改按钮-选择tidb_datasource-取消隐藏变量-保存

即可在页面上自由选择数据源,选择完对应数据源(数据源与业务组一一对应)后建议在隐藏此变量,达到固定效果。

TiDB 多集群告警监控-中章-融合多集群 Grafana_数据_05



开源互相融合

上述方式过于复杂,并且没办法完美复刻 TiDB Grafana 监控项目。我们也观察到这点,目前正在与双方沟通协调此事,最终效果达到能将 TiDB 大盘完美展现在夜莺中。目前没办法直接展现原因由于双方的 grafana 版本不适配,后续可直接 COPY。不过目前也有一些进展,以其中一个大盘为例

点击保存-保存为文件-在通过上个章节的方式导入,即可实现完整复刻。不过目前仅仅支持几个特定的JSON模版。更多模版还需适配,当然如有强烈需求也可在文章留言反馈。我们可以尽量提供JSON模版。

TiDB 多集群告警监控-中章-融合多集群 Grafana_数据_06

TiDB 多集群告警监控-中章-融合多集群 Grafana_数据_07

TiDB 多集群告警监控-中章-融合多集群 Grafana_数据_08



成果展示

按照不同业务组区分不同集群

TiDB 多集群告警监控-中章-融合多集群 Grafana_数据_09

每个业务组拥有自己的大盘以及数据源

TiDB 多集群告警监控-中章-融合多集群 Grafana_模版_10

并且还可以将所有集群数据融合进同一个大盘,方便DBA监掌握百台机器资源使用情况。

TiDB 多集群告警监控-中章-融合多集群 Grafana_数据_11



结语

此篇介绍如何融合 Grafana ,目前看还存在一些适配性问题,但已经基本满足了需求。下篇将介绍如何补齐 TiDB 目前没有的监控指标,以及特殊需求的处理。

标签:中章,数据源,Grafana,集群,监控,TiDB,仪表盘
From: https://blog.51cto.com/u_15550868/7201189

相关文章

  • ES集群&kibana安装
    一、elasticsearch介绍Elasticsearch是个开源分布式搜索引擎,它的特点有:分布式,零配置,自动发现,索引自动分片,索引副本机制,restful风格接口,多数据源,自动搜索负载等。Elasticsearch是一个基于Lucene的搜索服务器。它提供了一个分布式多用户能力的全文搜索引擎,基于RESTfulweb接口......
  • ES集群设置密码
    一、环境:三台centos7服务器,一台为master节点,两台从节点。系统版本:CentOSLinuxrelease7.4.1708(Core)软件版本:elasticsearch-6.8.0.rpmJdk版本:jdk-8u161-linux-x64.tar.gzKibana版本:kibana-6.8.0-x86_64.rpm参考上一篇文档搭建:https://www.cnblogs.com/lydongbk/p/176505......
  • Easysearch 跨集群复制实战
    在之前的文章中,有通过网关实现容灾的案例。今天给大家介绍Easysearch的跨集群复制功能。该功能可在集群之间复制数据,应用场景包括但不限于以下举例:灾备同步:将数据同步到灾备中心,灾备中心可对外提供查询服务。读写分离:单一集群读写压力都较大时,为了避免读写互相干扰造成性能降级,可......
  • Easysearch 跨集群复制实战
    在之前的文章中,有通过网关实现容灾的案例。今天给大家介绍Easysearch的跨集群复制功能。该功能可在集群之间复制数据,应用场景包括但不限于以下举例:灾备同步:将数据同步到灾备中心,灾备中心可对外提供查询服务。读写分离:单一集群读写压力都较大时,为了避免读写互相干扰造成性能降......
  • HDFS集群启停命令
    HDFS集群启停命令:一键启停脚本#启动$HADOOP_HOME/sbin/start-dfs.sh#停用$HADOOP_HOME/sbin/stop-dfs.sh独立进程启程#脚本一hadoop-daemon.sh(start|status|stop)(namenode|secondarynamenode|datanode)#举例:hadoop-daemon.shstartdatanode#脚本二hdfs--dae......
  • 在VMware虚拟机集群上部署HDFS集群
    本篇博客跟大家分享一下如何在VMware虚拟机集群上部署HDFS集群一·、下载hadoop安装包进入官网:https://hadoop.apache.org 下载hadoop安装包由于ApacheHadoop是国外网址,下载安装包对于网络要求较高 二、上传压缩包,进行解压在进行解压之前,保证自己已经完成vmwa的黄静配置......
  • k3s 容器集群
    *参考*https://docs.k3s.io/architecturehttps://ithelp.ithome.com.tw/users/20121071/ironman/2820?page=1https://www.fullstaq.com/knowledge-hub/blogs/setting-up-your-own-k3s-home-clusterK3SasKubernetesdistributionMetalLBasloadbalancerRancherasc......
  • 轻松实现Apache,Tomcat集群和负载均衡
    环境说明      Apache :apache_2.0.55    1个       Tomcat: apache-tomcat-5.5.17(zip版)2个       mod_jk::mod_jk-apache-2.0.55.so 1个第一部分:负载均衡   负载均衡,就是apache将客户请求均衡的分给tomcat1,tomcat2....去处理  1.安......
  • LNMP集群架构
    网站集群拆分上一节我们是部署了单机的LNMP,再往下,要进行拆分了,无论是性能、还是安全性,都务必要拆分。拆分的内容有nginx集群mysqlnfs共享存储等 拆分思路情况1当前的单机环境已经装好了,数据也都有了,需要拆分到多个机器需要考虑数据迁移情况2初试环境直接以集......
  • ambari-hadoop集群中timeline和ams-hbase几种服务之间的调用关系
    最近经常碰到ambari集群timelineserver和ams-hbase服务的一些问题,梳理了下这些服务之间的调用关系,留作笔记方便后续查阅1.目前笔者用到的hadoop组件版本如下2.调用关系如下图3.关于timelineserver有两个版本v1.5和v2.03.1目前v1.5为过渡期版本,但是也是生产中应用用......