国产监控之光-夜莺监控（Nightingale）

时间：2023-04-15 17:34:29浏览次数：33

标签：Categraf 夜莺采集监控组件 Nightingale n9e categraf

国产监控之光-夜莺监控（Nightingale）

夜莺是什么？

夜莺是一个服务端组件，类似 Grafana，可以对接不同的TSDB时序数据库作为数据源，支持的TSDB时序数据库如Prometheus、VictoriaMetrics、Thanos等等，只要数据进到这些库里了，夜莺就可以对数据源的数据进行分析、告警、可视化，以及后续的事件处理、告警自愈。

当然，夜莺也有端口接收监控数据，可以跟开源社区常见的各种监控采集器打通，比如Telegraf、Categraf、Grafana-agent、Datadog-agent、Prometheus生态的各类Exporter等等。这些agent采集了数据推给夜莺，夜莺适配了这些agent的数据传输协议，所以可以接收这些agent上报的监控数据，转存到后端对接的数据源，之后就可以对这些数据做告警分析、可视化。

夜莺部署架构

根据生产网络环境，夜莺可以实现中心汇聚式部署方案和边缘下层式混杂部署方案。

对于网络结构简单或小规模网络场景下，采用中心汇聚式部署方案实施比较简单，可以n9e核心组件采用单机或集群方式搭建，集群模式下前端需架设Nginx作为软负载或F5进行硬件设备负载，同时依赖MySQL和Redis中间件存储基础的元数据、用户信息等，不存在大数据量问题，因此，不用太考虑性能瓶颈。

Categraf是夜莺团队开发维护的监控采集侧核心组件，类似Telegraf、Grafana-Agent、Datadog-Agent，希望对所有常见监控对象提供监控数据采集能力，采用All-in-one的设计，不但支持指标采集，也希望支持日志和调用链路的数据采集。Categraf采集器采集了数据推送给夜莺，然后转存到后端数据源，如TSDB、ElasticSearch等。

注意：Categraf不属于夜莺监控系统组件，夜莺定位是服务端组件，不侧重监控数据采集侧。

国产监控之光-夜莺监控（Nightingale）_Nightingale

所有机房网络域下监控数据采集器都直接推数据给n9e，这个架构最为简单，维护成本最低。当然，前提是要求机房网络域结构简单、规模不大场景，即不太关注跨网络域访问安全问题和大规模跨网络域传输数据网络带宽限制等。

如果非上述场景，则要使用下面的边缘下沉式混杂部署方案：

国产监控之光-夜莺监控（Nightingale）_监控_02

这个图尝试解释 3 种不同的情形，比如 A 机房和中心网络链路很好，Categraf 可以直接汇报数据给中心n9e模块，另一个机房网络链路不好，就需要把时序库下沉部署，时序库下沉了，对应的告警引擎和转发网关也都要跟随下沉，这样数据不会跨机房传输，比较稳定。但是心跳还是需要往中心心跳，要不然在对象列表里看不到机器的 CPU、内存使用率。还有的时候，可能是接入的一个已有的Prometheus，数据采集没有走Categraf，那此时只需要把Prometheus作为数据源接入夜莺即可，可以在夜莺里看图、配告警规则，但是就是在对象列表里看不到，也不能使用告警自愈的功能，问题也不大，核心功能都不受影响。

边缘下沉式混杂部署方案中涉及到两个核心组件：n9e-pushgw组件和n9e-alert组件。

n9e-pushgw组件提供类似于remote_write和remote_read功能，categraf采集器将数据通过remote_write推送给n9e-pushgw组件，然后转存到tsdb时序数据，n9e服务端查询检索数据时通过remote_read讲求转发到对应机房下的n9e-pushgw组件。n9e-alert组件提供基于tsdb时序库中的指标数据告警功能。

一键部署

笔者已经在公有云上搭建了一套临时环境，可以先登录体验下：

http://124.222.45.207:17000/login
账号：root/root.2020

下面介绍下使用docker-compose快速一键部署。

1、代码在这里：

标签：Categraf,夜莺,采集,监控,组件,Nightingale,n9e,categraf
From： https://blog.51cto.com/u_16014310/6192383

Java + Jpcap实现监控 IP包流量
Java+Jpcap实现监控IP包流量说明：本设计是计算机网络课程的课设，因为代码是提前实现的，本博客于后期补上，又因为代码没写注释自己也看不懂了，所以，仅供参考，就当提供一种实现方式。文中提供的资料来源于网络，本文仅用于学习交流，如有侵权，可联系我进行删除。效果图：1）课程设计要求1......
印刷机械设备远程监控智能运维
方案背景近些年，印刷行业的飞速发展，印刷机械设备已经成为了现代印刷加工中不可或缺的工具，现代的印刷机械正进一步朝着远程自动化、联动化、系列化方向发展。随着市场竞争的日益激烈以及环保问题日益突出，印刷企业对于设备的监控和维护也越来越重视。如果印刷机械设备出现故障而无法正......
五一假期将近，给景区视频监控方案提几点建议
一、行业背景随着旅游业的不断发展，旅游安全问题越来越受到重视。尤其是五一假期将近，为确保游客在景区内的人身安全和财产安全，景区必须采用高效、可靠的安防视频监控系统，并进行科学规划和设计，从而实现及时发现安全事故和降低安全隐患。二、经验与建议作为垂直深耕音视频技术及视频监......
golang 必会之 pprof 监控系列(5) —— cpu 占用率统计原理
golangpprof监控系列(5)——cpu占用率统计原理大家好，我是蓝胖子。经过前面的几节对pprof的介绍，对pprof统计的原理算是掌握了七八十了，我们对memory,block,mutex,trace,goroutine,threadcreate这些维度的统计原理都进行了分析，但唯独还没有分析pprof工具是如何统计cpu使用情......
运维笔记--玩转Zabbix监控系列
立个flag，准备更新一套关于Zabbix监控系列的笔记，方便对zabbix感兴趣的同学或者运维小伙伴提供参考。先上个图：内容主要基于zabbix6.0，涉及如下：(一). Zabbix安装-CentOS7.6源码安装Zabbix6.0(二).Zabbix安装-图形界面配置(三). Zabbix安装-字体乱码问题处理(四). Zabbix展......
Prometheus监控zookeeper集群（1）
因为zookeeper版本较低为3.4.x版本，所有采用zookeeper_exporter方式采集数据1.下载（zookeeper_exporter采集器）https://github.com/carlpett/zookeeper_exporter/releases/download/v1.1.0/zookeeper_exporter2.传到liunx上/opt目录下，没有目录可以自行创建3.授予权限chmod755......
参加2015 qcon 回来的分享及年末做一次内部“监控演进分享”
有幸参加2015的qcon三天会议，回来做的分享：年末内部又有机会做一次监控的演进分享知识的总结.............
夜莺监控V6初探
目标客户用产品可能是功能设计好，也可能是因为响应快稳定可靠，例如滴滴用不了用高德，券商app故障受罚，微信凌晨服务崩溃，所以稳定性建设工作价值是保障客户体验，避免资损，社会负面舆论。故障生命周期处理围绕故障生命周期，在整个故障定位体系，可分为故障开始前，预案阶段，做量化分析找到潜......
zabbix分布式监控服务安装与配置
zabbix安装与配置一、什么是zabbix及优缺点 Zabbix能监视各种网络参数，保证服务器系统的安全运营；并提供灵活的通知机制以让系统管理员快速定位/解决存在的各种问题。是一个基于WEB界面的提供分布式系统监视以及网络监视功能的企业级的开源解决方案。 agent端：主机通过安装......
zabbix监控远程MySQL数据库
zabbix_agent客户端操作：1.数据库用户授权登录mysqlmysql>grantallon*.*tozabbix@'localhost'identifiedby"123";mysql>flushprivileges;2.cp模板到/usr/local/zabbix/etc/zabbix_agentd.conf.d/cp/root/zabbix-4.2.6/conf/zabbix_agentd/userparamet......

国产监控之光-夜莺监控（Nightingale）