首页 > 其他分享 >玩转Zabbix智能告警:降噪、排班、认领、升级、IM协同

玩转Zabbix智能告警:降噪、排班、认领、升级、IM协同

时间:2023-05-16 12:14:09浏览次数:59  
标签:处理 FlashDuty 支持 Zabbix IM 玩转 告警 值班

drawing

Zabbix作为一款流行的企业级监控工具,可以监控各种网络设备和服务的状态,并提供强大的告警功能,能够在出现异常情况时及时通知管理员。以下是Zabbix的一些特点:

  • 支持多种监控方式,包括SNMP、JMX、IPMI等,可以监控各种网络设备、服务器、虚拟化平台等;
  • 提供了丰富的监控项和模板,可以轻松地监控各种指标,如CPU、内存、磁盘、网络等;
  • 提供了灵活的告警方式,可以通过邮件、短信、电话等方式通知管理员,并且可以根据不同的告警级别设置不同的通知方式。

尽管Zabbix在监控和告警方面非常强大,但在处理告警事件方面仍有不足之处

  • 缺乏告警降噪和抑制风暴的能力;
  • 没有提供oncall值班调度的能力;
  • 没有提供IM工具内闭环处理告警的能力;
  • 告警协同处理能力薄弱,没有数据沉淀和分析。

不仅仅是Zabbix,很多告警系统存在类似的问题,而FlashDuty正是为了解决这些问题而存在:

  • 提供丰富的集成来源,支持接收Zabbix等告警事件,在一个平台处理公司内所有告警
  • 提供灵活的告警降噪、聚合、静默、抑制、收敛能力,避免告警风暴,不错过任何敏感信息
  • 提供强大的值班能力,支持各种排班场景,告警仅通知对的人
  • 打通飞书、钉钉和企业微信,真正做到在IM内部随时随地处理告警
  • 提供完善告警协同、故障协同能力,支持知识沉淀和关键指标分析

快速接入Zabbix告警

FlashDuty支持接入Zabbix 3.x~6.x 所有版本的告警事件。不同版本接入方式略有不同:

  • 3.x~4.x版本:支持Script方式接入
  • 5.x~6.x版本:支持Webhook方式以及脚本方式接入

Webhook接入方式(3步,详情参照文档,本文仅简述):

  1. 下载并导入FlashDuty定制的Media Type,配置好URL等信息
  2. 关联FlashDuty Media Type到一个User
  3. 创建Action,配置触发、恢复与更新Operations通过FlashDuty Media Type发送信息到User

Script接入方式(4步,详情参照文档,本文仅简述):

  1. 创建Script类型的Media Type,配置好Parameters
  2. 登录 Zabbix server 所在服务器,切换到脚本目录,下载并导入FlashDuty定制的推送脚本
  3. 关联FlashDuty Media Type到一个User
  4. 创建Action,配置触发、恢复与更新Operations通过FlashDuty Media Type发送信息到User。注意修改Default Message配置,FlashDuty将解析Message中加密的信息,来获得更丰富的告警详情

Zabbix告警详情

  1. FlashDuty提取Zabbix告警详情中的部分信息作为标签
drawing

2.多条相关的原始告警信息将被合并到一条告警中,可以在关联事件中回溯

drawing

设定灵活的触达策略

FlashDuty通知策略非常灵活,可以针对不同场景设定不同的通知策略:

  1. 支持按照时间条件来过滤事件,并发送到不同的人群;
  2. 支持设置聚合发送窗口,如果在等待期内告警自动恢复或被人工处理,则不会发送该条告警;
  3. 支持单聊群聊通知方式,以及多样的通知渠道。推荐以IM方式进行通知;
  4. 支持告警在不同人群中升级;
drawing
  1. 支持自定义通知模板渲染(Golang模板语法及上百种常用函数),配合预览调试能力;
drawing
  1. 支持告警静默、告警抑制,提前设定策略,减少不必要的告警通知。
drawing

设置专属值班日历

支持日常值班、节假日值班、临时调班等值班场景,支持自定义值班角色等高级选项,可灵活扩展。

drawing

自定义值班角色为高级功能,需要联系我们开通

在IM内外处理告警

全面打通飞书、钉钉和企业微信,支持在聊天页面直接处理告警,操作状态将在多端同步,真正做到随时随地处理告警

  1. 首次登录即完成账户关联,后续免登录
  2. 提供关键功能按钮,可以直接在卡片消息上操作
  3. 处理进度实时同步卡片,全员可见

以下分别为在飞书、钉钉和企业微信iOS客户端内处理告警过程:

drawing drawing drawing

查看告警治理趋势分析

支持统计关键的告警治理指标:

  1. 支持告警、故障的MTTx指标按多维度统计;
  2. 支持告警、故障等数量统计;
  3. 支持TopK告警策略和告警对象发现。
drawing

最后

总的来说,FlashDuty可以弥补Zabbix等监控系统在告警降噪、值班调度、告警协同处理等方面的不足。它支持多种告警来源,灵活的告警降噪和静默功能,强大的值班能力,以及完善的告警协同、故障处理、趋势分析能力。

如果您正在寻找一款更好的告警处理系统,那么FlashDuty值得一试。现在点击链接完成注册,自动获得专业版14天试用机会

标签:处理,FlashDuty,支持,Zabbix,IM,玩转,告警,值班
From: https://www.cnblogs.com/ulricqin/p/17404529.html

相关文章

  • 即时通讯技术文集(第15期):IM跨平台和社交软件红包技术 [共19篇]
    为了更好地分类阅读52im.net总计1000多篇精编文章,我将在每周三推送新的一期技术文集,本次是第15 期。[- 1 -] IM跨平台技术学习(一):快速了解新一代跨平台桌面技术——Electron[链接] http://www.52im.net/thread-2616-1-1.html[摘要] 本文将从入门者的角度,为你快速讲......
  • 150kW高速永磁电机Simplorer+maxwell双闭环联合仿真 转速
    150kW高速永磁电机Simplorer+maxwell双闭环联合仿真转速与电流双闭环效果较好,资料为联合仿真的工程文件以及性能图片,学习价值非常高,值得拥有ID:946999662468374130......
  • 四相开关磁阻电机Maxwell+Simplorer联合仿真性能及其波形
    四相开关磁阻电机Maxwell+Simplorer联合仿真性能及其波形ID:99999662109233088......
  • zabbix电话报警技巧
    Zabbix是一款开源的企业级监控系统,可以监控网络、服务器、应用程序等各种资源。在监控过程中,及时的告警通知是非常重要的,本文将介绍如何在Zabbix中配置电话、短信、飞书、钉钉、微信和邮件报警。前置条件已经安装并配置好了Zabbix5以上版本监控系统。提前下载电话短信报警媒介......
  • android 获取 imei号码
    核心代码:Imei=((TelephonyManager)getSystemService(TELEPHONY_SERVICE)).getDeviceId();1.加入权限在manifest.xml文件中要添加<uses-permissionandroid:name="android.permission.READ_PHONE_STATE"/>2.代码 1./**2.*3.*4.*创建日期2010-4-29下午05:02......
  • delphi Pascal yolov5 deepsort 目标检测 目标跟踪,支持onnxruntime、dnn、openvino和t
    delphiPascalyolov5deepsort目标检测目标跟踪,支持onnxruntime、dnn、openvino和tensorrt推理yolov5,使用c++封装成dll,delphi调用封装好的dll,实现目标检测和跟踪ID:212600676471966472......
  • yolov5v6.2 实例分割 Labview工业应用,封装dll后labview调用,支持openvino dnn onnxrunt
    yolov5v6.2实例分割Labview工业应用,封装dll后labview调用,支持openvinodnnonnxruntime和tensorrt四种方式推理,500万像素图像:cpu下openvino推理只要85ms、GPU下tensorrt推理只要25ms,最强实例分割模型。ID:114500689839116112......
  • 4机10节点系统暂态稳定性仿真/Simulink仿真 1.基于MATLAB/Simulink
    4机10节点系统暂态稳定性仿真/Simulink仿真1.基于MATLAB/Simulink平台搭建4机10节点系统仿真模型,可以仿真单相接地/两相相间短路/两相接地短路/三相短路故障情况下系统的暂态特性。2.研究电力系统稳定器(powersystemstabilizer)PSS和静止无功补偿器(staticvarcompensator)SVC......
  • 电力系统暂态稳定性Matlab编程/ Simulink仿真 单机无穷大系统发生
    电力系统暂态稳定性Matlab编程/Simulink仿真单机无穷大系统发生各类(三相短路,单相接地,两相接地,两相相间短路)等短路故障,各类(单相断线,两相断线,三相断线)等断线故障,暂态稳定仿真分析1.Matlab编程进行数值分析(采用欧拉法Euler,改进欧拉法improveEuler,4阶龙格库塔法Runger-Kutta),计算故障......
  • 电力系统静态稳定性仿真Matlab编程/simulink仿真 1.用Matlab
    电力系统静态稳定性仿真Matlab编程/simulink仿真1.用Matlab编程,把转子运动方程(摇摆方程)在运行点处线性化,采用小信号分析法,对线性化之后状态方程的系数矩阵求解特征值,根轨迹,通过特征值的特点来判断系统稳定性。2.用simulink搭建搭建单机无穷大系统,对其静态稳定性进行仿真分析。YID:......