2024 年了，IT 运维监控系统都有哪些推荐？

时间：2024-08-12 14:54:41浏览次数：18

标签：Kubernetes 运维 Zabbix Grafana 2024 Prometheus 监控告警

大浪淘沙，2024 年的今天，市面上很多监控系统慢慢淡出了大家的视野，而一些新的监控系统也逐渐崭露头角。今天我们就来看看 2024 年的当下，哪些 IT 运维监控系统最值得关注。

Prometheus

Prometheus-architecture

毫无疑问，Prometheus 是最值得关注的监控系统，因为 Prometheus 的规范和生态都非常厉害，很多中间件、数据库，直接就内置支持了 Prometheus，比如 ETCD、Kubernetes、RabbitMQ、Nginx VTS 等等，这个势能是非常强大的。

尤其是在容器和微服务监控场景，Prometheus 生态是不二之选，因为：

由于资源的生命周期比较短，通常是基于服务发现来发现监控目标，而不是资产管理式（Zabbix就是资产管理式）。
多维度筛选的需求强烈，比如通过标签聚合、过滤、分组等。需要一个针对性的 Query Language。PromQL 就是为此而生。

当然，这里我们说的是 Prometheus 生态，至于是否真的使用 Prometheus 二进制倒不一定，因为 Prometheus 本身的存储和查询性能并不是很好，所以很多公司会选择使用 Prometheus 的兼容产品，比如 VictoriaMetrics、Thanos 等。

Grafana

Prometheus 可以搞定数据采集、存储问题，并提供查询接口、查询语言，但是对于数据的展示，Prometheus 本身并不是很强大，通常大家会选择使用 Grafana 作为展示工具。

Grafana 不仅仅为 Prometheus 提供了很多的 Dashboard 模板，而且还支持多种数据源，比如 InfluxDB、Elasticsearch、Loki、MySQL、PostgreSQL、CloudWatch、Zabbix 等等。Grafana 的可视化能力，基本就是开源领域的标杆甚至事实标准了。

Grafana Dashboard

Nightingale

很多公司有多套 Prometheus，我在社区里见过一个公司有 200 多套 Prometheus，四五套、八九套的更是比比皆是，此时，大家就很想统一管理，比如公司有 8 套 Kubernetes，每套 Kubernetes 都有一个 Prometheus，这些 Prometheus 的数据类似，告警规则通用，每次修改一个告警规则，要修改 8 套 Prometheus，这就很麻烦了。另外，监控能力作为基础能力，通常是开放给公司所有业务研发团队，需要一些权限管控、知识沉淀的能力，Nightingale 可以帮助你解决这些问题。

Nightingale 的核心是做一个告警引擎，支持对接 Prometheus、VictoriaMetrics、Thanos、M3DB、Loki 等多种数据源，统一管理告警规则。而且考虑了边缘机房网络割裂的场景，即便是边缘机房和中心机房之间的网络坏掉了，边缘机房内部也可以自闭环生成、发送告警。

Zabbix

Zabbix 相对比较老了，擅长服务器、网络设备的监控，不擅长 Kubernetes、微服务的监控，由于越来越多的公司采用公有云，公有云自然搞定了硬件、网络设备的监控，所以 Zabbix 的市场份额在逐渐下降。

国内很多公司在使用 Zabbix，社区较为活跃，很多公司基于 Zabbix 封装了商业化产品，如果你是网工或系统运维，Zabbix 还是值得关注的。

其他

当然，还有一些其他的监控系统，比如：Cacti、Nagios，都太老了，不推荐使用。Cacti 在网工圈子里还是有一定的市场份额，Nagios 基本销声匿迹了。

监控作为稳定性保障的重要手段，涉及到的内容非常驳杂，如果您找乙方协助构建监控、可观测性方案，欢迎联系我们做产品技术交流：https://flashcat.cloud/contact/。

标签：Kubernetes,运维,Zabbix,Grafana,2024,Prometheus,监控,告警
From： https://www.cnblogs.com/ulricqin/p/18354967

「免费领票」从云计算到生成式AI，2024云栖大会等你来。
9月，又是一年科技盛宴。 2024.9.19-9.21云栖大会即将展开一场新的全球云计算产业链年度盛会大会为期三天将上演三场重磅主论坛400场论坛与并行话题40000平米智能科技大展汇聚全球顶尖企业与先锋场景实践者涵盖从云计算到生成式......
【2024-08-08】连岳摘抄
23:59假如你想快乐一小时，就去睡个午觉；快乐一天，就去钓鱼；快乐一个月，就去结婚；快乐一整年，就继承一笔遗产；快乐一辈子，就去帮助别人。 ......
【2024-08-09】连岳摘抄
23:59说别人错很容易，但重要的是自己怎么做才是对的。 ——汪成为确实，婚姻需要磨合。如切如磋者，道学也，如琢如磨者，自......
【IEEE出版，华中科技大学主办】2024年电气工程自动化与信息处理国际会议（EEAIP 2024，9月2
2024年电气工程自动化与信息处理国际会议（EEAIP2024）作为第四届能源、动力与电气工程国际学术会议（EPEE2024）的分会场，将于2024年9月20-22日在中国武汉举行。本届主会（EPEE2024）由华中科技大学主办，同时有着良好的举办历史：EPEE2021由东北电力大学主办，EPEE2022由华东交通大学......
2024纷享销客逆势再获7500万美元投资
8月12日，纷享销客宣布完成新一轮7500万美元的战略投资，由钟鼎资本领投，启明创投与建发新兴投资跟投，这是继2023年7月在IPO资本协助下获贵阳创投3000万美元投资后，纷享销客在一年间再获投资，这也是其连续第四年获得新的投资。本轮融资后，纷享销客将一如既往地持续完善产品的平台化、一......
【JPCS独立出版】第三届能源与动力工程国际学术会议（EPE 2024）
能源是人类社会发展的重要推动力量。如何安全、清洁、高效地存储、转化和利用能源，实现人类可持续发展，一直都是全球探讨的话题。第三届能源与动力工程国际学术会议（EPE2024）将于2024年10月18-20日在兰州举办。会议通过与业内众多平台、社会各团体协力，聚集能源与动力相关领域的学......
【学术会议征稿】第八届电子信息技术与计算机工程国际学术会议（EITCE 2024）
第八届电子信息技术与计算机工程国际学术会议（EITCE2024）20248th InternationalConferenceonElectronicInformationTechnologyandComputerEngineering 第八届电子信息技术与计算机工程国际学术会议（EITCE2024）将于2024年10月18日至20日在中国海口举办。本次会议旨......
2024年8月份的护网行动如何参加？
护网行动背景什么是“护网行动”？指挥机构∶由公安机关统一组织的"网络安全实战攻防演习"。护网分为两级演习∶公安部对总部，省厅对省级公司。什么是“实战攻防演习”每支队伍3-5人组成，明确目标系统，不限制攻击路径。提交漏洞不得分，获取权限、数据才能得分。禁止的行为......
【2024-08-07】外婆走了
23:59兹晨戒流火，商飙早已惊。云天收夏色，木叶动秋声。 ——《立秋》唐·刘言史刚收到母亲的电话，说外婆刚走了。外婆......
【2024-08-06】看见幸福
20:00在那种极其困难的环境中，人生乐趣仍然是有的。在任何情况下，人生也绝不会只有痛苦，这就是我悟出的禅机。 ——季羡林......

2024 年了，IT 运维监控系统都有哪些推荐？

Prometheus

Grafana

Nightingale

Zabbix

其他

相关文章

赞助商

阅读排行