首页 > 其他分享 >TiDB 多集群告警监控-中章-融合多集群 Grafana

TiDB 多集群告警监控-中章-融合多集群 Grafana

时间:2024-01-11 11:03:12浏览次数:51  
标签:中章 数据源 Grafana 集群 监控 TiDB 仪表盘 适配

author:longzhuquan

背景

随着公司XC改造步伐的前进,越来越多的业务选择 TiDB,由于各个业务之间需要物理隔离,避免不了的 TiDB 集群数量越来越多。虽然每套 TiDB 集群均有两个详细的监控 Dashboard、Grafana,但对于运维来说几十套集群的监控、告警、巡检均需消耗巨大的精力。上篇介绍了监控工具的安装,以及业务组如何规范的设置。本章着重介绍如何将多套集群 Grafana 数据统一管理。

监控大盘介绍

TiDB 多集群告警监控-中章-融合多集群 Grafana_TiDB

在夜莺仪表盘-监控仪表盘界面,通过预先配置好想要查看的图表,用户在未来查看时只需点击即可直接浏览一系列图表,无需逐一选择。例如,在 MySQL 监控中,资深 DBA 可以事先将重要的图表以及应关注的图表都配置到监控大盘中。详细介绍可参考 仪表盘 介绍。

先看看单张效果

TiDB 多集群告警监控-中章-融合多集群 Grafana_TiDB_02

怎么样是不是似曾相识?没错监控大屏可以适配TiDB的 Grafana,上一篇接入数据源之后,其实夜莺即可通过查询到所有普罗米修斯的数据,也可以将 TIDB 的监控数据全部查询。前提是在此页面进行 PromQL 的编写。

优雅的 COPY TiDB 监控

前面已经看到效果,但如果按照官方一个一个的图标的编辑,那把TiDB一套集群图标编辑完,估计也过年了。那有没有更方便的方式呢?

经过我司大量的实践,已经适配出了一套常用的监控数据,并且已经提交给夜莺官方,在最新企业版“仪表盘-内置仪表盘”可以看到 TIDB 监控模版。各位可直接使用。开源版暂时未放出,不过有兴趣的需要可私聊题主,或者在文章下留言,即可得到同款模版(由于文章限制 json 文件不太好进行附件)。

TiDB 多集群告警监控-中章-融合多集群 Grafana_TiDB_03

如得到文件后点击 仪表盘-监控仪表盘-对于业务组-批量导入-导入仪表盘 JSON 即可

TiDB 多集群告警监控-中章-融合多集群 Grafana_Nightingale_04

导入完成后进入图表-点击修改按钮-选择tidb_datasource-取消隐藏变量-保存

即可在页面上自由选择数据源,选择完对应数据源(数据源与业务组一一对应)后建议在隐藏此变量,达到固定效果。

TiDB 多集群告警监控-中章-融合多集群 Grafana_TiDB_05

开源互相融合

上述方式过于复杂,并且没办法完美复刻 TiDB Grafana 监控项目。我们也观察到这点,目前正在与双方沟通协调此事,最终效果达到能将 TiDB 大盘完美展现在夜莺中。目前没办法直接展现原因由于双方的 grafana 版本不适配,后续可直接 COPY。不过目前也有一些进展,以其中一个大盘为例

点击保存-保存为文件-在通过上个章节的方式导入,即可实现完整复刻。不过目前仅仅支持几个特定的JSON模版。更多模版还需适配,当然如有强烈需求也可在文章留言反馈。我们可以尽量提供JSON模版。

TiDB 多集群告警监控-中章-融合多集群 Grafana_TiDB_06

TiDB 多集群告警监控-中章-融合多集群 Grafana_Nightingale_07

TiDB 多集群告警监控-中章-融合多集群 Grafana_TiDB_08

成果展示

按照不同业务组区分不同集群

TiDB 多集群告警监控-中章-融合多集群 Grafana_TiDB_09

每个业务组拥有自己的大盘以及数据源

TiDB 多集群告警监控-中章-融合多集群 Grafana_TiDB_10

并且还可以将所有集群数据融合进同一个大盘,方便DBA监掌握百台机器资源使用情况。

TiDB 多集群告警监控-中章-融合多集群 Grafana_TiDB_11

结语

此篇介绍如何融合 Grafana ,目前看还存在一些适配性问题,但已经基本满足了需求。下篇将介绍如何补齐 TiDB 目前没有的监控指标,以及特殊需求的处理。

标签:中章,数据源,Grafana,集群,监控,TiDB,仪表盘,适配
From: https://blog.51cto.com/ulricqin/9194253

相关文章

  • TiDB 多集群告警监控-初章-监控融合、自动告警处理
    author:longzhuquan背景随着公司XC改造步伐的前进,越来越多的业务选择TiDB,由于各个业务之间需要物理隔离,避免不了的TiDB集群数量越来越多。虽然每套TiDB集群均有两个详细的监控Dashboard、Grafana,但对于运维来说几十套集群的监控、告警、巡检均需消耗巨大的精力。“融合......
  • 移动护理系统-ZooKeeper单机和集群方式安装部署
    1.1zookeeper安装1.下载地址http://mirror.bit.edu.cn/apache/zookeeper/选择版本,我选择的是注意:下载新版本的时候需要下载带bin的,因为有时候会报错错误:找不到或无法加载主类org.apache.zookeeper.server.quorum.QuorumPeerMain你下载使用的zk是未编译的apache-zookeep......
  • rancher集群获取k8s的token
    一、概述在使用Kubernetes(简称K8S)集群进行容器编排时,我们需要使用Token来进行身份认证和访问控制。Rancher是一个开源的容器管理平台,可以帮助我们快速构建和管理K8S集群。本文将介绍如何在Rancher集群中获取K8S的Token。二、步骤概览下表展示了获取K8SToken的步骤概览:步骤操作1登......
  • rancher集群获取k8s的token
    你好,新入行的小伙伴!欢迎来到K8S的世界。今天,我将带你了解如何在Rancher集群中获取Kubernetes(K8s)的Token。这个过程可能会有些复杂,但别担心,我会尽可能地详细解释每一步。一、了解整体流程在开始之前,我们先大致了解一下整个流程。以下是获取KubernetesToken的基本步骤:登录到Rancher......
  • 开源大数据集群部署(一)集群实施规划
    作者:櫰木本次集群规划信息本次实际生产业务体量存在巨大差异,但集群规划内容相同,因此建议实际生产环境按照按照一定比例扩展即可。主机操作系统要求软件信息参数配置8C16G操作系统版本CentOSLinuxrelease7.8.2003(Core)java版本javaversion"1.8.0_281"......
  • K8S集群搭建
    K8S各节点环境准备1虚拟机操作系统环境准备参考链接:https://kubernetes.io/zh/docs/setup/production-environment/tools/kubeadm/install-kubeadm/2关闭swap分区2.1临时关闭swapoff-a&&sysctl-wvm.swappiness=02.2基于配置文件关闭sed-ri'/^[^#]*swap/......
  • k8s集群证书过期怎么办
    记录一次集群更新证书过程,因为集群证书已经更新了,以下只记录操作过程了。参考:https://blog.csdn.net/Harry_z666/article/details/1280151751、集群情况版本:v1.23.6部署方式:kubeadm部署由于使用kubeadm部署,证书有效期为一年,到期后证书失效。2、master更新集群证书#1、ma......
  • k8s集群搭建1.22.x (centos)
    版本1.22.xx版本兼容 集群搭建指导https://www.cnblogs.com/Sunzz/p/15184167.html  【1.18】https://blog.csdn.net/qq_34629877/article/details/120234616 【1.22】升级centos内核#导入公钥rpm--importhttps://www.elrepo.org/RPM-GPG-KEY-elrepo.org#安装......
  • 创建单机 PolarDB-X 集群
    https://doc.polardbx.com/quickstart/topics/quickstart-pxd-cluster.html#安装dockercurl-fsSLhttps://get.docker.com-oget-docker.shshget-docker.sh#配置普通用户访问dockersudogroupadddockersudogpasswd-a${USER}dockernewgrpdocker#安装pxdpip......
  • Elasticsearch分片大小设定和集群容量规划
    本文以Elasticsearch7.9.2为准。分片大小日志类:单个分片不超过50G搜索类:单个分片不超过20G先估算总数据量,再根据分片大小,确定分片数。容量规划容量规划时要考虑的因素:机器的软硬件配置单个文档的尺寸,文档总数,索引大小,分片个数,副本个数文档写入方式(如bulk的单次数......