首页 > 其他分享 >13.4告警抑制实例

13.4告警抑制实例

时间:2024-09-10 10:23:06浏览次数:13  
标签:触发 severity 抑制 实例 critical 13.4 warning 告警


本节重点介绍 :

  • 告警抑制
  • 应用场景
  • 配置方法:一定要有equal标签
  • 配置演示:critical告警触发了就抑制warning的

告警抑制

应用场景

  • 如果某些其他警报已经触发,则抑制某些警报的通知。
  • 多用于某些高等级的告警已触发,然后低等级的被抑制
  • 如机器宕机告警触发,则机器上的进程存活监控都被抑制
  • 如region基础网络告警触发,region内部的服务端口探活都被抑制

配置

  • 告警中同一个机器node_name出发的 critical告警要抑制warning的
inhibit_rules:
  - source_match:
      severity: 'critical'
    target_match:
      severity: 'warning'
    equal: ['node_name']
  • 添加到alertmanager配置文件中并 reload

重启prometheus和alertmanager

  • 重启服务
systemctl restart prometheus
systemctl restart alertmanager

期望现象

  • 相同node_name的多条告警,当severity='critical’触发时抑制 severity='warning’的
  • 即 severity='warning’不会触发,对应的就是mysql的不会触发,node的会触发

真实现象

  • 真实图片举例
  • 5002 没收收到告警,即mysql的不会触发,即 severity='warning’没有触发
  • 5001 和 5003 能收到node的告警 ,即 severity='critical’触发了,并且抑制了severity='warning’的

本节重点总结 :

  • 告警抑制
  • 应用场景
  • 配置方法:一定要有equal标签
  • 配置演示:critical告警触发了就抑制warning的


标签:触发,severity,抑制,实例,critical,13.4,warning,告警
From: https://blog.51cto.com/moonfdd/11969554

相关文章

  • 实例讲解Simulink CAN通讯丢失故障判定模型搭建及仿真测试验证方法
    在电动汽车VCU软件开发中,要开发故障诊断模块,故障诊断类型中CAN报文通讯丢失的判定是非常重要的一个,当检测到某个控制器CAN报文通讯丢失,即接收不到该控制器的有效CAN信号,需要根据通讯丢失的判断作出相应的故障处理,以保证整车行车安全。本文通过ABS通讯丢失Simulink模块的搭建,介......
  • 安全运营之浅谈SIEM告警疲劳
    闲谈:     刚开始学习SIEM、态势感知这类产品的时,翻阅老外们的文章总是谈什么真阳性,假阳性告警、告警疲劳,当时在国内资料中没找到很合理的解释,慢慢就淡忘这件事了。随着慢慢深入工作,感觉大概理解了这些概念并且有了一些新的领悟。心血来潮写了这篇文章,想给刚接触SIEM......
  • MySQL——视图(三)应用实例——视图的应用
            本节将通过一个应用案例让读者熟练掌握在实际开发中创建并使用视图的完整过程。1.案例的目的        掌握视图的创建、查询、更新和删除操作。        假如有来自河北和山东的三个理科学生报考北京大学(PekingUniversity)和清华大学(Tsinghua......
  • Prometheus operator怎么添加targets和告警规则
    使用PrometheusOperator来管理Prometheus实例、添加targets和告警规则是一个相对简单的过程。以下是如何通过PrometheusOperator添加targets和告警规则的详细步骤。1.安装PrometheusOperator如果尚未安装PrometheusOperator,可以通过Helm或Kubernetes清单文......
  • Prometheus告警从触发到收到通知延迟在哪
    Prometheus的告警机制涉及多个步骤,从触发到收到通知的过程可能会遇到延迟。这些延迟主要来自以下几个方面:1.规则评估延迟评估周期:Prometheus会在配置的时间间隔内评估告警规则(通常是每1分钟)。如果在这个周期内没有检测到触发条件,告警将不会被触发。数据拉取延迟:Prometheu......
  • 告警架构高可用怎么做
    实现告警架构的高可用性(HighAvailability,HA)是确保监控系统可靠性和稳定性的关键。以下是一些实现Prometheus和Alertmanager高可用性的最佳实践:1.Prometheus高可用性1.1使用多个Prometheus实例部署多个Prometheus实例:可以在不同的服务器上部署多个Prometheus实......
  • 告警抑制怎么做
    告警抑制(AlertSuppression)是Prometheus和Alertmanager中的一种机制,用于防止在特定条件下重复发送相同的告警通知,减少干扰和告警疲劳。以下是如何实现告警抑制的几种方法:1.使用告警抑制规则在Alertmanager中,可以使用告警抑制规则来定义何时应该抑制特定的告警。抑制规则......
  • 如何实现告警的自动化响应
    实现告警的自动化响应可以帮助团队更快地处理问题,减少手动干预,提高系统的可靠性。以下是一些步骤和工具建议,可以帮助你实现告警的自动化响应:1.选择合适的监控工具Prometheus+Alertmanager:使用Prometheus监控指标,结合Alertmanager来管理告警。其他监控工具:可以考虑使用......
  • oem 如何查看告警去向
    一:页面查看找到OEM监控对象的home目录监视>预警历史记录点击:历史记录点击报错消息 看通知二:命令查看selectTARGET_NAME,MESSAGE,ALERT_STATE,COLLECTION_TIMESTAMP,DELIVERY_MESSAGEfromMGMT$ALERT_NOTIF_LOGwhereCOLLECTION_TIMESTAMP>sysdate-1......
  • 实例:使用 gdb 查看进程内存中的数据结构
    代码示例首先,创建一个简单的链表程序linked_list.c,以演示如何使用gdb查看内存中的数据结构。#include<stdio.h>#include<stdlib.h>//定义链表节点结构体typedefstructNode{intdata;structNode*next;}Node;//添加新节点到链表的尾部voidappen......