首页 > 其他分享 >SRE-基于阿里云的告警体系建设

SRE-基于阿里云的告警体系建设

时间:2023-11-06 15:58:27浏览次数:37  
标签:现状 SRE 配置 sls 阿里 监控 告警 日志

基于数据源来做分类

sls日志告警

配置以及查看方式

sls日志左侧点击铃铛进入告警中心配置

告警规则触发就是sls日志的查询语句,配置的规则时间内,查询语句查询的数量达到配置值,就会触发告警

现状

5XX告警

应用error日志告警

云产品监控告警

配置以及查看方式

阿里云直接搜索云监控

左边云产品监控,然后搜索要配置的云产品即可,比如redis,rds,kafka

进去搜索到对应的实例,点击报警规则进去配置

现状

redis命中率,cpu等监控

mysql内存等监控

kafka堆积等监控

arms监控告警

配置以及查看方式

arms-应用监控-应用监控告警规则

现状

pod的fullgc,内存,以及应用的接口环比,慢接口等指标

xxl-job告警

配置以及查看方式

xxl-job管理台配置任务时选择告警组即可

现状

标签:现状,SRE,配置,sls,阿里,监控,告警,日志
From: https://www.cnblogs.com/intotw/p/17812869.html

相关文章

  • SRE服务端预案,应急处理手册
    服务端应急处理流程问题升级流程问题升级步骤SRE人员-各端组长-业务线负责人现有降级手段App业务入口降级降级范围以及作用域使用App降级策略,App在各个业务入口会直接降级,关闭对应的业务入口使用场景对应业务出现会持续扩大损失并且短期无法修复的报错,比如应用持续出现......
  • 阿里云网盘扩容
    1、登录阿里云控制台进行在线扩容2、使用以下命令确认已有分区的文件系统类型df-Th3、运行以下命令扩容分区growpart/dev/vda1注意:1之前有空格4、扩容文件系统resize2fs/dev/vda15、运行以下命令检查扩容后的结果df-Th......
  • 阿里云-docker容器相关操作
    查看所有的容器dockerps-a进入容器dockerexec-it容器ID/bin/bash停用全部运行中的容器dockerstop$(dockerps-q)删除全部容器dockerrm$(dockerps-aq)多条命令连接符&dockerstop$(dockerps-q)&dockerrm$(dockerps-aq)......
  • 阿里云安装docker
    yum更新yumupdateyuminstallepel-release-yyumcleanallyumlist安装并运行dockeryuminstalldocker-io-ysystemctlstartdocker检查安装结果docker-vdockerinfo启动dockersystemctlstartdocker#运行docker的守护进程重启dockersystemctlrestar......
  • prometheus添加自定义监控与告警(etcd为例)
    一、步骤及注意事项(前提,部署参考部署篇)一般etcd集群会开启HTTPS认证,因此访问etcd需要对应的证书使用证书创建etcd的secret将etcd的secret挂在到prometheus创建etcd的servicemonitor对象(匹配kube-system空间下具有k8s-app=etcd标签的service)创建service关联被监控对象二、......
  • 阿里大佬:DDD 领域层,该如何设计?
    文章很长,且持续更新,建议收藏起来,慢慢读!疯狂创客圈总目录博客园版为您奉上珍贵的学习资源:免费赠送:《尼恩Java面试宝典》持续更新+史上最全+面试必备2000页+面试必备+大厂必备+涨薪必备免费赠送:《尼恩技术圣经+高并发系列PDF》,帮你实现技术自由,完成职业升级,薪......
  • 2023maven的最新的阿里云仓库镜像最新地址
    参考地址:https://developer.aliyun.com/mvn/guide阿里云Maven中央仓库为 阿里云云效 提供的公共代理仓库,帮助研发人员提高研发生产效率,使用阿里云Maven中央仓库作为下载源,速度更快更稳定。阿里云云效 是企业级一站式DevOps平台,覆盖产品从需求到运营的研发全生命周期,其中云......
  • python训练阿里云语音合成模型
    训练阿里云多人训练语音合成模型model_link:https://modelscope.cn/models/speech_tts/speech_sambert-hifigan_tts_zh-cn_multisp_pretrain_24k/summary1.获取KANTTS算法训练框架2.配置虚拟环境(conda)需要下载pytorch及其他kantts算法依赖3.数据准备:https://modelsco......
  • 如何使用Poco库采集阿里云信息
    阿里云是一个云主机平台,我们在购买云主机的时候,往往会因为挑选自己心意的产品而眼花缭乱。今天我就使用Poco库编写一个采集阿里云信息的程序,有了它,我们在挑选阿里云产品你轻松了许多,一起来看看吧。```cpp//引入Poco库#include<Poco/Net/HTTPClientSession.h>#include<Po......
  • 羚通视频智能分析平台视频算法识别安全帽佩戴 反光衣穿戴算法检测告警运用方案
    羚通视频智能分析平台是一款卓越的算法分析平台,具备高性能、高可靠性、高可扩展性和低成本的特性,使用户能够高效地执行复杂计算任务。该平台在工地安全监测领域,结合了计算机视觉和深度学习算法,提供了实时精准的安全帽反光衣检测服务。在安全生产区域内部署反光衣识别系统,通过实时监......