首页 > 其他分享 >异常事件升级策略

异常事件升级策略

时间:2023-03-21 15:45:33浏览次数:28  
标签:10 策略 认领 通报 分钟 升级 告警 异常

一、背景

目前告警是针对实时数值计算的结果,判定当前的值是否需要告警,存在以下问题:

  1. 不能知道什么时候该告警结束
  2. 当没有收到告警时,不能确定是因为收敛规则导致的暂时告警屏蔽,或者是 告警已经恢复引起。

二、解决思路

  1. 将告警的来源,从实时的时间序列值判断,变更为 异常事件的状态
  2. 针对异常事件进行告警的分级,升级策略
  3. 低等级的业务,应该经过时间的累积,达到高等级的告警
  4. 告警恢复了之后必须要通报
  5. 超时未处理可以自动关联屏蔽该实例该指标告警一段时间

三、事件开始结束判断规则

假设通过阈值、或者自动化算法判断后,某个时间序列的异常结果为 (1为异常,0为正常)

0,1,0,1,0,1,0,1,1,1,1,1,1,1,1,0,0,0,0,0,0

                            ↑                                              ↑

                       这里判断为事件开始                 这里判断为事件结束

假设判断是否为异常为:5分钟内3个点为异常

判断是否为正常为:6分钟里面6个点为正常

 

四、告警通道

 

4 对应电话告警

3对应紧急告警

2对应告警

1对应预警

三、告警升级策略

 

  首次判断异常 异常持续 异常结束
级别   
2、3级

异常开始1

IGNORE未认领:

异常开始预警/每10分钟1

60分钟升级为告警告警/每10分钟2

120分钟升级为紧急告警/每10分钟3

180分钟升级为紧急告警/每10分钟4

-------------------

ACCEPT已认领:

异常累计时长通报/每120分钟(已认领)

123

恢复时以当时的告警通道发送已恢复。(电话告警以紧急告警通道发送)

123

超时未认领通知

3

1级

异常开始告警3

IGNORE未认领:

异常开始告警/每10分钟(未认领)3

30分钟升级为电话告警/每10分钟(未认领)4

-------------------

ACCEPT已认领:

异常累计时长通报/每120分钟(已认领)3

异常结束紧急告警

3

超时未认领通知

3

S级

异常开始电话告警4

IGNORE未认领:

异常开始电话告警/每10分钟(未认领)

ACCEPT已认领:

异常累计时长通报/每60分钟(已认领)

异常结束紧急告警3

超时未认领通知3

 

四、告警事件登记配置

事件名 事件等级 最低告警通道 4级未认领升级 3级未认领升级 2级未认领升级 1级未认领升级 备注
12121212 C

1

60(分钟内未认领)10(分钟通报一次),(已认领)120(分钟通报一次)

120(分钟内未认领)10(分钟通报一次)

(已认领)120(分钟通报一次)

180(分钟内未认领)10(分钟通报一次)

(已认领)120(分钟通报一次)

240(分钟内未认领)10(分钟通报一次)

(已认领)60(分钟通报一次)

人话:240分钟还没人认领的话,电话也打了6次,没人到平台上认领告警,那就算了吧,属于超时未告警
  S

4

     

60(分钟内未认领)10(分钟通报一次)

(已认领)60(分钟通报一次)

 
  A

3

   

60(分钟内未认领)10(分钟通报一次)

(已认领)120(分钟通报一次)

120(分钟内未认领)10(分钟通报一次)

(已认领)60(分钟通报一次)

 

标签:10,策略,认领,通报,分钟,升级,告警,异常
From: https://www.cnblogs.com/tz2011/p/17240257.html

相关文章

  • windows下mysql5.6升级至mysql5.7
    下载mysql-5.7.39-winx64.zip并解压。停止5.6版本的mysql服务。将mysql5.6中的data目录和my.ini复制到mysql5.7的目录下。修改mysql5.7目录下的my.ini文件:#设置mysq......
  • ByteHouse:基于 ClickHouse 的实时计算能力升级
    更多技术交流、求职机会,欢迎关注字节跳动数据平台微信公众号,回复【1】进入官方交流群ByteHouse是火山引擎数智平台旗下云原生数据分析平台,为用户带来极速分析体验,能够支撑......
  • ByteHouse:基于 ClickHouse 的实时计算能力升级
    更多技术交流、求职机会,欢迎关注字节跳动数据平台微信公众号,回复【1】进入官方交流群 ByteHouse是火山引擎数智平台旗下云原生数据分析平台,为用户带来极速分析体验,能......
  • 性能测试知识科普(二):测试策略
    转载:https://www.cnblogs.com/imyalost/p/16711597.html上一篇文章聊到了性能测试最基本的三个术语:并发、TPS、响应时间,并且以高速收费站的故事为例,详细的分析了这三个术......
  • C++温故补缺(十一):异常
    异常处理参考:cnblogs异常和错误(bug)异常:是程序开发过程中必须考虑的一些特殊情况,是程序运行时可以预料的执行分支。异常是不可以避免的,如0除问题,数组越界问题,文件不存在......
  • java 异常
    1. 综述         异常产生的原因:1. java虚拟机产生异常                    2. 写的java程序代码有问题 ......
  • 全志系列芯片如何在Tina Linux中使用脚本完成定制化升级?
    1.主题在TinaLinux中,如何使用脚本完成定制化升级2.问题背景硬件:全平台软件:Tina其他:支持OTA升级的平台,可实现脚本定制化升级3.具体表现在OTA升级过程中,添加定制化需......
  • Oracle 数据库迁移,升级,打补丁必看的博客
    Oracle数据库迁移,升级,打补丁必看博客之前曾经多次看过这个大神的博客,当时没有太留意。今天查官方文档时,看着推荐的博客名字怎么这么熟悉,仔细看才发现他就是官方升级指引里......
  • 前端gis开发以及2D地图和3D地图开发策略
     场景前端很少涉及到地图展示开发(展示地图,对地图进行操作,数据可视化等),但特定公司专门做gis开发和地图开发(比如:建设公司,中铁集团等)。 地图开发策略场景一:直接调用成......
  • 数据库运维---数据库备份策略
    数据库安装方式:通用二进制安装策略1:直接拷贝数据库文件步骤1:主服务器上停用数据库[root@node01~]#systemctlstopmysqld.service步骤2:进入数据目录,打包并压缩数据......