首页 > 其他分享 >zabbix异常处理解决方案

zabbix异常处理解决方案

时间:2024-01-17 09:57:43浏览次数:24  
标签:StartPollers 解决方案 server etc zabbix conf 异常 than

                                                               zabbix异常处理解决方案

1、zabbix批量添加一百多台交换机导致,可以登录zabbix但是所有的监控值都无数据

解决方案:

             1》.查看zabbix-server.log

      2》.提示内存溢出,需要更改配置文件,编辑配置文件vim /etc/zabbix/zabbix_server.conf  根据报错中的如下条目,确认为CacheSize参数配置有问题导致

9655:20220726:030200.288 [file:dbconfig.c,line:97] __zbx_shmem_realloc(): please increase CacheSize configuration parameter

      》3.将zabbix服务端配置文件的如下参数做了调整:

]# cat /etc/zabbix/zabbix_server.conf|grep -E "^CacheSize"
CacheSize=1024M
# cat /etc/zabbix/zabbix_server.conf|grep -E "^StartHTTPPollers"
StartHTTPPollers=64
# cat /etc/zabbix/zabbix_server.conf|grep -E "^StartPingers"
StartPingers=128
#systemctl restart zabbix_server.service #修改完成后,重启zabbix服务

     4》.将mysql的最大连接数调整为1000

         echo "max_cnotallow=1000" >> /etc/my.cnf

      systemctl restart mysqld.service

     systemctl restart zabbix-server.service

二、报警提示More than 100 items having missing data for more than 10 minutes和Zabbix poller processes more than 75% busy错误。

[root@localhost zabbix]#  vim /usr/local/zabbix/etc/zabbix_server.conf
StartPollers=500
StartPollersUnreachable=50
StartTrappers=30
StartDiscoverers=6
CacheSize=1G
CacheUpdateFrequency=300
StartDBSyncers=20
HistoryCacheSize=512M
TrendCacheSize=256M
HistoryTextCacheSize=80M
ValueCacheSize=1Gd

 三、server日志很多first network error, wait for 15 seconds报错

server配置文件Timeout时间改大点,我改成了30s。

四、zabbix告警“Zabbix poller processes more than 75% busy”

告警原因:
1.某个进程卡住了,
2.僵尸进程出错,太多,导致慢了
3.网络延迟(可忽略)
4.zabbix消耗的内存多了

告警危害:
普通告警,暂无危害(但是最好处理)

处理方法:
一:简单,粗暴(重启zabbix-server可结合定时任务使用)
service zabbix-server restart
crontab -e 调出Cron编辑器中增加一个计划:
@daily service zabbix-server restart > /dev/null 2>&1

二:编辑Zabbix Server的配置文件/etc/zabbix/zabbix_server.conf,找到配置StartPollers的段落:
### Option: StartPollers
#       Number of pre-forked instances of pollers.
#
# Mandatory: no
# Range: 0-1000
# Default:
# StartPollers=5
取消StartPollers=一行的注释或者直接在后面增加:
StartPollers=10
将StartPollers改成多少取决于服务器的性能和监控的数量,将StartPollers设置成12之后就再没有遇到过警报。如果内存足够的话可以设置更高。

 

五、早上收到很多报警邮件,官网访问不了,很多服务器端口不通。但是用手机访问官网却可以访问,邮件里面很多Zabbix alerter processes more than 75% busy、Zabbix http poller processes more than 75% busy、和端口不通的报警信息。

由于之前优化过zabbix配置,所以觉得应该不是zabbix配置的问题。可能是那时候zabbix所在网络不通或者延时造成的(确认后是机房那边网络断开了2个小时,恢复后这些报警信息才发送出来了)。看来要针对zabbix服务器本身在异地做个监控,有时间弄个nagios看看。

 

      

标签:StartPollers,解决方案,server,etc,zabbix,conf,异常,than
From: https://www.cnblogs.com/fzhelpdesk/p/17969135

相关文章

  • 可靠消息服务事务(RocketMQ的分布式事务解决方案)
    系统环境Java:openjdkversion“1.8.0_382”rocketmq-all-5.1.4整体机制使用rocketmq的事务消息,分两个阶段保证分布式事务的最终一致性;一阶段:消息生产者(分布式事务发起方)发送半消息(消费者不接收半消息),之后完成本地事务的执行,根据执行结果选择将半消息投递给消费者或撤回半......
  • client-go异常场景分析
    场景1:同步时连不上kube-apiserverWaitForCacheSync一直阻塞,直到成功或者控制器停止。W011513:01:55.32988118339reflector.go:535]pkg/mod/k8s.io/[email protected]/tools/cache/reflector.go:229:failedtolist*v1.Node:Get"https://192.168.0.105:6443/api/v1/no......
  • Stable Diffusion python 运行异常解决
    StableDiffusionpython运行异常解决引言在使用Python进行程序开发时,我们可能会遇到程序运行异常的情况。本文将围绕StableDiffusion算法的Python实现,介绍一些常见的运行异常以及解决方法。StableDiffusion算法简介StableDiffusion算法是一种用于图像处理和计算机视觉领域......
  • 软件产品技术解决方案过程
    ......
  • Mysql8忽略大小写的解决方案
    一、删除服务器数据文件由于8.0没法设置参数后重启(失败),所以必须删掉老库,重新启动才行。切记:;本步骤要删掉老库所有资料,如果是数据库当前有用,请做好备份,再进行操作。systemctlstopmysqldcd/var/lib/mysql默认数据在这里rm-rf*二、添加配置,大小写不敏感vim/etc/my.cnflow......
  • springboot第48集:【思维导图】地图,面向对象,异常,功能代码
    在SpringBoot中,可以通过编写拦截器(Interceptor)来对请求进行拦截与处理。下面是一个简单的拦截器实现示例:创建一个类并实现HandlerInterceptor接口publicclassAuthInterceptorimplementsHandlerInterceptor{@OverridepublicbooleanpreHandle(HttpServletRequest......
  • 新能源汽车智慧充电桩解决方案:智慧化综合管理与数字化高效运营
    一、方案概述TSINGSEE青犀&触角云新能源汽车智慧充电桩解决方案基于管理运营平台,覆盖业务与应用、数据传输与梳理、多端开发、搭建等模块,融合AI、5G、Wi-Fi、移动支付等技术,实现充电基础设施由数字化向智能化演进,通过构建安全可监控、可追溯的规范化充电桩监管平台,实现智能管理......
  • 软件产品技术解决方案过程
    ......
  • zabbix6.0配置自动发现交换机
    zabbix6.0配置自动发现交换机一、创建自动发现规则  SNMPOID根据不同的设备填写,以思科交换要为例SNMPv2-MIB::sysName.0#这个有多个,也可以填写(.1.3.6.1.2.1.1.5.0) 二、查看自动发现的设备 三、创建发现动作 四、等待一段时间,然后查看主机群组,发现已经有许多自......
  • 项目上线后退出功能异常
    后台有个a标签<li><ahref="/back/managers/logout"onclick="if(!confirm('确认要退出系统么?')){returnfalse;}">退出</a></li>应该是访问下面方法的 //后台退出 back.GET("/managers/logout",Back.Managers{}.Logout) /......