首页 > 其他分享 >夜莺监控告警规则里的“仅在本业务组生效”具体是怎么个逻辑?

夜莺监控告警规则里的“仅在本业务组生效”具体是怎么个逻辑?

时间:2024-08-12 16:21:12浏览次数:11  
标签:10 机器 业务组 夜莺 时序 告警

首先,得了解告警和恢复的原理,参考官方文档: https://flashcat.cloud/docs/content/flashcat-monitor/nightingale-v6/faq/alerting-logic/

对于某个告警规则(假设其归属业务组 A),其 promql 为 cpu_usage_idle < 5 告警,夜莺的告警引擎就会拿着这个 promql 去查时序库,比如查到 10 台机器的 cpu_usage_idle 数据都小于 5 ,于是,时序库返回 10 条数据,进而产生 10 条告警。

时序库并不知道这 10 台机器是归属在哪个业务组的,比如时序库用的是 Prometheus,机器和业务组的关联关系是在夜莺里,是两个不同的系统。所以,时序库只是返回所有符合 cpu_usage_idle < 5 的 time series 指标数据。

如果勾选了仅在当前业务组生效,就本例而言,就是说,只有业务组 A 下面的机器触发了 < 5 这个规则,才产生告警事件,其他业务组的机器即便触发了也不产生告警规则。这是怎么做到的呢?

夜莺看到时序库返回了 10 条记录,然后就从这 10 条数据里取 ident 标签的值当做机器,然后看这个机器是否属于 “告警规则所属的业务组”,如果属于,那就生成告警事件,如果不属于,就丢弃这个事件。通过这种方式,来实现告警规则只对本业务组内的机器生效。

嗯,目前来看,整个逻辑是挺好的。

但是,有的时候,promql 可能会写一些聚合函数,导致 promql 查询的结果中不包含 ident 标签,此时,夜莺就无能为力了,不知道时序库返回的这个数据属于哪个机器,也就无法根据机器的归属关系判断是否发告警了。

promql 查询的结果中不包含 ident 标签的时候,夜莺就不根据归属关系做拦截,直接产生告警事件。

标签:10,机器,业务组,夜莺,时序,告警
From: https://www.cnblogs.com/ulricqin/p/18355169

相关文章

  • python3使用pyVmomi获取vCenter中告警信息语音告警
    原创文档编写不易,未经许可请勿转载,目前仅发布于博客园,其他平台均为非法转载。文档中有疑问的可以邮件联系我文章。邮箱:[email protected]一、说明文章分享在pyVmomi获取vCenter中的告警信息,对red级别的告警信息进行本地语音告警,记录告警信息到本地txt文件后清空当前vCenter上的......
  • 夜莺监控使用指南
    夜莺监控使用指南本文用于解决在部署和应用夜莺监控中遇到的一些问题以及官方文档缺失的某些步骤可能会遇到的坑。安装过程我使用是Nightingale+Categraf+Prometheus的架构。Nightingale安装文档:https://flashcat.cloud/docs/content/flashcat-monitor/nightingale-v7/instal......
  • Zabbix 5.0 LTS 配置企业微信(Webhook)自动发送告警信息
    依据前面文章《Zabbix5.0LTSURL健康监测》环境,实现企业微信(Webhook)自动发送告警信息。一、创建企业微信机器人先在自己的企业微信群里创建一个机器人,并获取其WebHook地址。右击群聊天卡片,添加群机器人。获得一个类似下图的WebHook地址。注意,这个WebHook地址非常......
  • 【AI+技术】日志分析:分层告警
    ❀威胁感知层威胁感知层是网络安全体系结构中的一部分,旨在实时监测、分析和感知网络中的安全威胁和异常活动。以下是威胁感知层中的几个重要组成部分的详细介绍:安全检测安全检测是威胁感知层的核心组成部分,负责通过监控网络流量、系统日志、主机行为等方式,实时检测和识别潜......
  • OpenSearch 实现自动化告警
    本文将介绍如何使用AmazonOpenSearch服务设置自动化告警,并通过SNS、Lambda和钉钉实现告警通知。1.创建SNS主题和订阅首先,我们需要创建一个SNS主题来发送通知:登录AWS控制台,进入SNS服务。点击"创建主题",选择标准类型,为主题命名。创建主题后,点击"创建订阅"。......
  • 服务器监控与告警系统配置指南
    服务器监控与告警系统配置指南1.前言本指南旨在提供服务器监控与告警系统配置的详细步骤,以确保服务器运行状况的实时监控和及时告警。2.监控系统2.1系统选择Prometheus+GrafanaZabbixNagios2.2安装与配置按照官方文档或社区教程进行系统安装和配置。配置监控指......
  • 运维文档:系统监控及告警配置
    运维文档:系统监控及告警配置1.概述本文档旨在描述系统监控及告警配置方案,涵盖以下内容:监控指标及阈值设定告警触发条件及通知方式告警处理流程2.监控指标及阈值指标描述阈值单位告警级别CPU使用率服务器CPU使用率80%%警告内存使用率服务器内存......
  • 使用夜莺+categraf监控redis和redis集群
    上一篇文章《使用Categraf快速建设MySQL监控,同时介绍夜莺模板中心》我们已经了解了如何使用夜莺配合Categraf监控MySQL,本节我们重点看看Redis监控的实操方案。Redis监控资料首先还是去模板中心找到Redis插件相关的说明和各类模板,菜单位置在:集成中心-模板中心,搜索......
  • 支持语音电话、短信、企业微信、钉钉、APP、第三方接口、音柱等多种告警通知方式的智
    AI视频监控平台简介AI视频监控平台是一款功能强大且简单易用的实时算法视频监控系统。它的愿景是最底层打通各大芯片厂商相互间的壁垒,省去繁琐重复的适配流程,实现芯片、算法、应用的全流程组合,从而大大减少企业级应用约95%的开发成本。用户只需在界面上进行简单的操作,就可以实......
  • 处理 Element Plus 告警
    处理ElementPlus告警在使用ElementPlus的Pagination分页组件时,出现告警:ElementPlusError:[ElPagination]Deprecatedusagesdetected,pleaserefertotheel-paginationdocumentationformoredetails代码大致如下:<template><el-rowstyle="margin-top:15px;"......