WGCLOUD运维监测平台 从3.4.7版本开始引入了告警级别,所有监测资源都可以设置告警级别
告警级别从高到底,分别为:ERROR,WARN,INFO
ERROR代表重要告警,WARN代表一般告警,INFO代表提示信息
那么在哪儿配置告警级别呢?
告警级别在server/config/application.yml中配置,如果修改配置,需要重启server生效
#监控资源的告警级别,告警级别从高到底共3级:ERROR,WARN,INFO,如下是主机指标的告警级别配置,其他监控资源(如进程、端口、服务接口、数通监测、数据监测)的告警级别,可在编辑页面配置
level:
#主机上行/下行传输速率的告警级别
speedWarn: WARN
#主机内存使用率的告警级别
memWarn: WARN
#主机系统负载的告警级别
sysLoadWarn: WARN
#主机CPU使用率的告警级别
cpuWarn: WARN
#主机CPU温度的告警级别
cpuTemperatureWarn: WARN
#主机磁盘使用率的告警级别
diskWarn: WARN
#主机磁盘SMART健康检测的告警级别
smartWarn: ERROR
#主机下线的告警级别
hostDownWarn: ERROR
#服务器登录提醒的告警级别
hostLoginWarn: INFO
#指令下发的告警级别
shellWarn: INFO
#设置系统发送告警通知的级别,指此级别或更高级别的资源出现故障,会发送告警通知
defaultWarn: INFO
#是否将告警级别和标签添加到告警内容中,yes是,no否,是指系统会将告警级别和标签名称添加到告警内容中
addToWarnContent: yes
如上配置都是针对主机指标的告警级别配置
其他的资源告警级别,比如进程,端口,接口,日志等告警级别,不在配置文件中设置,可以在页面添加资源时候,进行设置。
如果每个主机的告警级别不一样,也可以个性化设置,在【自定义监控】模块可以针对每个主机设置告警阈值,告警开关,告警级别,如下图