首页 > 其他分享 >skywalking 监控告警处理和外挂配置

skywalking 监控告警处理和外挂配置

时间:2023-07-28 14:24:48浏览次数:36  
标签:外挂 10000 name service resp period time skywalking 告警

1、添加告警配置

vim configs/alarm-settings.yml
dingtalkHooks:
  textTemplate: |-
    {
      "msgtype": "text",
      "text": {
        "content": "Apache SkyWalking Alarm: \n %s."
      }
    }
  webhooks:
    - url: https://oapi.dingtalk.com/robot/send?access_token=<access_token>
      secret: <加签值>

2、添加apollo配置

vim application.yml
找到configurationapollo配置

apollo 添加配置

修改后的监控规则配置

rules:
  # Rule unique name, must be ended with `_rule`.
  service_resp_time_rule:
    metrics-name: service_resp_time
    op: ">"
    threshold: 10000
    period: 5
    count: 3
    silence-period: 3
    message: 服务 {name} 的响应时间在最近5分钟内有3分钟超过了10秒
  service_sla_rule:
    # Metrics value need to be long, double or int
    metrics-name: service_sla
    op: "<"
    threshold: 8000
    # The length of time to evaluate the metrics
    period: 5
    # How many times after the metrics match the condition, will trigger alarm
    count: 3
    # How many times of checks, the alarm keeps silence after alarm triggered, default as same as period.
    silence-period: 3
    message: 服务 {name} 的成功率在最近5分钟内有3分钟低于80%
  service_resp_time_percentile_rule:
    # Metrics value need to be long, double or int
    metrics-name: service_percentile
    op: ">"
    threshold: 10000,10000,10000,10000,10000
    period: 5
    count: 3
    silence-period: 5
    message: 服务 {name} 的百分位响应告警时间在最近5分钟内有3分钟出现告警, 由于超过了p50 > 10000, p75 > 10000, p90 > 10000, p95 > 10000, p99 > 10000之中的某个条件
  service_instance_resp_time_rule:
    metrics-name: service_instance_resp_time
    op: ">"
    threshold: 10000
    period: 5
    count: 3
    silence-period: 5
    message: 服务实例 {name} 的响应时间在最近5分钟内有3分钟超过了10秒。
  database_access_resp_time_rule:
    metrics-name: database_access_resp_time
    threshold: 10000
    op: ">"
    period: 5
    count: 3
    message: 数据库 {name} 访问的响应时间在最近5分钟内有3分钟超过了10秒
  endpoint_relation_resp_time_rule:
    metrics-name: endpoint_relation_resp_time
    threshold: 10000
    op: ">"
    period: 5
    count: 3
    message: 端点关系 {name} 的响应时间在最近5分钟内有3分钟超过了10秒
#  Active endpoint related metrics alarm will cost more memory than service and service instance metrics alarm.
#  Because the number of endpoint is much more than service and instance.
#
#  endpoint_avg_rule:
#    metrics-name: endpoint_avg
#    op: ">"
#    threshold: 1000
#    period: 10
#    count: 2
#    silence-period: 5
#    message: Response time of endpoint {name} is more than 1000ms in 2 minutes of last 10 minutes

dingtalkHooks:
  textTemplate: |-
    {
      "msgtype": "text",
      "text": {
      "content": "Apache SkyWalking Alarm: \n %s."
      }  
    }
  webhooks:
    - url: https://oapi.dingtalk.com/robot/send?access_token=cea97f9dc89fe65cc6b8ce56d202e3fe5ccb4e57335647b37d74aa10694fa6f0
      secret: SEC88c82dea0189dcd90558c77963e4f1aac984ff2edd7a4ad7ee74f58dab47bd96

#webhooks:
#  - http://127.0.0.1/notify/
#  - http://127.0.0.1/go-wechat/

标签:外挂,10000,name,service,resp,period,time,skywalking,告警
From: https://www.cnblogs.com/KennethLin/p/17587458.html

相关文章

  • skywalking快速上手
    Skywalking官网(SW快速上手)Skywalking本地安装(windows为例)skywalking本次使用的是apache-skywalking-apm-bin-es7(https://archive.apache.org/dist/skywalking),打开文件夹,打开目录bin/.bat是windows启动。点击之后会出钱两个command,这个时候就启动成功了。打开loca......
  • rabbitmq告警Error: health check failed. Message: resource alarm(s) in effect:[{r
     这个错误信息表示RabbitMQ的内存使用量超出了预设的阈值,导致触发了RabbitMQ的内存警告阈值报警。RabbitMQ在运行过程中会不断地将消息存储在内存中,如果内存使用量超出了预设的阈值,就会触发内存警告阈值报警。这个阈值的默认值是40%的物理内存,可以通过修改Rabbi......
  • shell脚本-入侵检测与告警
    shell脚本-入侵检测与告警原理利用inotifywait命令对一些重要的目录作一个实施监控,例如:当/root、/usr/bin等目录发生改变的,利用inotifywait看可以对其作一个监控作用。inotifywait介绍inotifywait是一个Linux下的命令行工具,用于监视文件系统的变化。它基于inotify机......
  • c#怎么写网络游戏的外挂
    ​网上有很多外挂制作的教程,大多是讲针对大型网络游戏的,主要包含一些抓包、反汇编、C++的知识综合。事实也如此,常见的外挂都是使用VC++写的,从来没有过C#或者其他.NET语言编写的外挂。一、声明WindowsAPI中的函数和常量   //键盘Hook结构函数    [StructLayout......
  • 【游戏行业部】反外挂技术的革新:如何有效应对 FPS 外挂的威胁
    FPS游戏外挂现状和泛滥原因在线多人的FPS游戏是实时性要求最高的游戏类型之一。在这种游戏中,玩家的一瞬间判断和反应能力会直接决定胜负。然而,网络延迟和实时加载的问题经常会导致游戏卡顿,这会极大地影响玩家的游戏体验。为了解决这个问题,FPS游戏通常会采用预加载技术。预加......
  • 小程序报错:【代码依赖分析】告警信息修改代码,或关闭【过滤无依赖文件】功能
    小程序报错:【代码依赖分析】告警信息修改代码,或关闭【过滤无依赖文件】功能控制台报如下问题“已被代码依赖分析忽略,无法被其他模块引用。你可根据控制台中的【代码依赖分析】告警信息修改代码,或关闭【过滤无依赖文件】功能”,也就是将一些需要的依赖被分析为无依赖文件过滤掉了,导......
  • EasyCVR告警类型设置后首页需要刷新才能更新的问题优化
    EasyCVR视频融合平台基于云边端一体化架构,可支持多协议、多类型设备接入,包括:NVR、IPC、视频编码器、无人机、车载设备、智能手持终端、移动执法仪等。平台具有强大的数据接入、处理及分发能力,可在复杂的网络环境中,将分散的各类视频资源进行统一汇聚、整合、集中管理。关于平台的......
  • Power BI外挂级辅助工具 - DAX Studio 入门 第一篇(共两篇)
    今天早上又是美好的一天,进公司刚落座。隔壁部门的Tony哥直接杀了过来,“米高米高,我们组开发了一个PBI报告,但是现在有点小问题,帮我们看下怎么解决?”是否有方法非常灵活把PBI报告里面的基础数据导出成平面文件分享给其他同事?是否有方法非常方便的查询和验证PBI报告中的数据准确性?......
  • 使用MASA全家桶从零开始搭建IoT平台(六)使用规则引擎实现告警通知
    目录前言方案实施流程安装Node-RED配置一个告警处理流程编写代码测试总结前言数据的挑战:物联网的发展带来了海量的数据。这些数据来源多样,格式不一,处理起来十分复杂。同时,物联网中的设备数量庞大,需要设备间进行高效的协同和管理,这也对数据处理提出了更高的要求。如何从这些复......
  • SkyWalking入门与实战
    SkyWalking部署一、基础介绍1.1概念SkyWalking是一个国产的开源框架,2015年由吴晟个人开源,2017年加入Apache孵化器,国人开源的产品,主要开发人员来自于华为,2019年4月17日Apache董事会批准SkyWalking成为顶级项目,支持Java、.Net、NodeJs等探针,数据存储支持Mysql、Elasticsearch等,......