Zabbix 组成架构
Zabbix Server
- zabbix server是agent程序报告系统可用性、系统完整性和统计数据的核心组件、是所有配置信息、统计信息和操作数据的核心存储器
zabbix数据库存储
- 所有配置信息和zavvix收集到的数据都被存储再数据库中
zabbix web 界面
- 为了从任何地方和任何平台都可以轻松的访问zabbix、我们提供基于zabbix界面,该界面是zabbix server的一部分、通常(不一定)跟zabbix运行在同一台物理机上
- 如果使用的SQlite,zabbix web必须要和zabbix server运行在同一台物理机上
zabbix proxy 代理服务器
- zabbix proxy 可以代替zabbix server收集性能和可用性数据、proxy代理服务器是zabbix软件可以选择部署的一部分、当然、proxy代理服务器可以帮助单台zabbix server分担压力
zabbix agent 监控代理
- zabbix agents监控代理部署在需要监控的目标主机上、能够主动监控本地资源和应用程序、并将收集到的数据报告给zabbix server
zabbix 数据流
- 监控方面:为了创建一个监控项(item)用于采集数据,必须先创建一个主机(host)
- 告警方面:在监控项里创建触发器(trigger),通过触发器(trigger)来出发告警动作(action)
- 因此如果你想收到Server XCPU负载过高的告警,必须满足:
- 未server X创建一个host并关联一个用于对cpu进行监控的监控项(item)
- 创建一个
Trigger
,设置成当CPU负载过高时会触发 - Trigger被触发,就会发送告警邮件
Zabbix 常用术语的含义
1.主机(host)
- 一台你想监控的网络设备、用ip或域名表示
2.主机组(host group)
- 主机的逻辑组:它包含
主机
和模板
,一个主机组里的主机和模板之间并没有任何之间的关联、通常在给不同用户组的主机分配权限时使用主机组
3.监控项(item)
- 你想要接受的主机的特定数据(监控的指标),一个度量数据
4.触发器(trigger)
- 一个被用于定义问题阈值和 评估 监控项接收到的数据的逻辑表达式
- 当接收到的数据高于设置的阈值时,触发器状态从
OK
变为Problem
,当接收到的数据低于阈值时,触发器保留/返回一个OK
的状态
5.事件(event)
- 单次发生的需要注意的事情,例如
触发器状态
改变或发现有监控代理自动注册
6.异常(problem)
- 一个处在
异常
状态的触发器
7.动作(action)
- 一个对
事件(event)
做出反应的预定义的操作
8.升级(escalation)
- 一个动作内执行操作的自动逸场景,发送通知/执行远程命令的序列
9.媒介(media)
- 发送告警通知的手段,告警通知的途径
10.通知(notification)
- 利用已选择的媒体途径把事件相关的信息发送给用户
11.远程命令(remote command)
- 一个预定义好的,满足一些条件的情况下,可以在被监控主机上自动执行的命令
12.模板(template)
- 一组可以被应用到一个或多个主机上的实体(监控项,触发器,图形,聚合图形,应用,LLD,Web场景)的集合
- 模板的任务就是加快对主机监控任务的实施,也可以使监控任务的批量修改更简单,
模板是直接关联到每台单独的主机上的
13.应用(application)
- 一组监控项组成的逻辑分组
14.web场景(web scrnario)
- 利用一个或多个http请求来检查网站的可用性
15.前端(frontend)
- zabbix提供的web界面
16.zabbix API
- zabbix API 允许你使用
JSON RPC协议
(是一个无状态且轻量级的远程过程调用RPC
传输协议,其传递内容通过 JSON 为主)来创建,更新和获取zabbix对象(如主机,监控项,图形和其他)信息或执行任何其他的自定义的任务
17.zabbix server
- zabbix 软件实现监控的核心程序,主要功能是与zabbix proxies和Agents进行交互、触发器计算、发送告警通知、并将数据集中保存等
18.zabbix agent
- 一个部署在监控对象上的,能够注定监控本地资源和应用的程序
- zabbix agent 部署在监控的目标上、主动检测本地的资源和应用(硬件驱动,内存,处理器统计等)
- zabbix agent 手机本地的操作信息并将数据报告给zabbix server用于进一步的处理、一旦出现异常(比如硬盘空间已满或者崩溃的服务进程),zabbix server 会主动告警管理员指定机器上的异常、zabbix agent的极端高效缘于它可以利用本地系统调用来完成统计数据的收集
19.被动(passive)和主动(active)检查
- zabbix agents 可以执行被动和主动两种检查方式
- 被动检查(passive check):agent应答数据请求、zabbix server(或者proxy)询问agent数据,如,CPU的负载情况,然后zabbix agent返回结果
- 主动检查(Active checks):处理过程相对复杂,agent必须首先从zabbix server 索取监控项列表以进行独立处理,然后周期性的发送新的值给server
- 执行被动或主动检查是通过选择相对应的检测项目类型来配置的,
item type
。Zabbix agent处理监控项类型有:zabbix agent 和 zabbix agent(active)
20.zabbix proxy
- 一个帮助zabbix server手机数据,分担zabbix server的负载的程序
- zabbix proxy 是一个可以从一个或多个首舰空设备手机监控数据、并将信息发送到zabbix server的进程、基本上是代表server工作的,所有收集的数据都在本地进行缓存,然后传送到proxy所属的zabbix server
- 部署Proxy 是可选的,但是可能非常有益于分散单个 zabbix server的负载、如果只有proxy 收集数据,server上的进程就会减少cpu消耗和磁盘I/O负载
- zabbix proxy 是完成远程区域、分支机构、没有本地管理员的网络集中监控的理想解决方案
- zabbix proxy 需要使用独立的数据库