首页 > 编程语言 >透过 node-exporter 彻底弄懂机器监控:01. node-exporter 框架讲解

透过 node-exporter 彻底弄懂机器监控:01. node-exporter 框架讲解

时间:2024-05-31 11:11:51浏览次数:16  
标签:node exporter level -- 01 go collector

前言

Prometheus 生态里有很多采集器负责各类监控数据的采集,其中使用最广泛的,显然是 node-exporter,负责 Linux、BSD 等系统的常规监控指标的采集,比如 CPU、内存、硬盘、网络、IO 等。其 github 地址是:https://github.com/prometheus/node_exporter 。很多人都用过,但对其细节未必清楚。

我想写一个小专栏,通过 node-exporter 这个采集器,讲解各类指标的含义、采集方法、使用场景、注意事项。顺带讲解 Linux 的很多观测手段。想必对于初中级研发、运维人员都会有帮助,专栏依旧会放到星球里,争取让星球的资源慢慢更为丰富起来。这块写完之后,后面可以继续 mysql、redis 等相关的专栏,一点点磕。

安装 node-exporter

要想方便调试,理解整个知识,建议还是要把 node-exporter 的代码下载下来,能够本地编译运行。这里我做一个简单演示,我的电脑是 Mac,M1 芯片,首先下载 go 安装包(https://go.dev/dl/):https://go.dev/dl/go1.22.2.darwin-arm64.tar.gz。一般使用 tar.gz 的文件就好,不用 pkg。

cd /Users/ulric/works/tgz
wget https://go.dev/dl/go1.22.2.darwin-arm64.tar.gz
tar -zxf go1.22.2.darwin-arm64.tar.gz

操作如上,/Users/ulric/works/tgz/go 这个目录就是 go 的安装目录,然后配置环境变量:

export GOROOT=/Users/ulric/works/tgz/go
export GOPATH=/Users/ulric/works/gopath
export PATH=$PATH:$GOROOT/bin:$GOPATH/bin

GOROOT 是 go 的安装目录,GOPATH 是 go 的工作目录,PATH 是环境变量,这样配置之后,就可以使用 go 命令了。上面的几行命令可以保存在 ~/.bash_profile 或者 ~/.zshrc 里,这样每次打开终端都会自动加载。

验证 go 环境是否正常安装:

% go version
go version go1.22.2 darwin/arm64

然后下载 node-exporter 的代码:

cd /Users/ulric/works
git clone https://github.com/prometheus/node_exporter.git

然后就可以编译了,如果你的网络环境不好,编译之前可以设置代理:

export GOPROXY=https://goproxy.cn,direct
cd /Users/ulric/works/node_exporter
go build

如果一切正常,就可以运行 node_exporter 做测试了,我先看看其版本:

ulric@ulric-flashcat node_exporter % ./node_exporter --version
node_exporter, version  (branch: , revision: 0d3400ebc976e14d5b87db276bb2ec32f55b4052)
  build user:
  build date:
  go version:       go1.22.2
  platform:         darwin/arm64
  tags:             unknown

如上,就完成了 node-exporter 的源码安装。

启动 node-exporter

生产环境启动 node-exporter,通常是通过 systemd 等方式启动,咱们这里为了学习方便,就直接把进程启动在前台即可:

ulric@ulric-flashcat node_exporter % ./node_exporter --log.level=debug
ts=2024-05-23T04:08:01.560Z caller=node_exporter.go:193 level=info msg="Starting node_exporter" version="(version=, branch=, revision=0d3400ebc976e14d5b87db276bb2ec32f55b4052)"
ts=2024-05-23T04:08:01.560Z caller=node_exporter.go:194 level=info msg="Build context" build_context="(go=go1.22.2, platform=darwin/arm64, user=, date=, tags=unknown)"
ts=2024-05-23T04:08:01.561Z caller=node_exporter.go:199 level=debug msg="Go MAXPROCS" procs=1
ts=2024-05-23T04:08:01.561Z caller=filesystem_common.go:111 level=info collector=filesystem msg="Parsed flag --collector.filesystem.mount-points-exclude" flag=^/(dev)($|/)
ts=2024-05-23T04:08:01.562Z caller=filesystem_common.go:113 level=info collector=filesystem msg="Parsed flag --collector.filesystem.fs-types-exclude" flag=^devfs$
ts=2024-05-23T04:08:01.562Z caller=node_exporter.go:111 level=info msg="Enabled collectors"
ts=2024-05-23T04:08:01.562Z caller=node_exporter.go:118 level=info collector=boottime
ts=2024-05-23T04:08:01.562Z caller=node_exporter.go:118 level=info collector=cpu
ts=2024-05-23T04:08:01.562Z caller=node_exporter.go:118 level=info collector=diskstats
ts=2024-05-23T04:08:01.562Z caller=node_exporter.go:118 level=info collector=filesystem
ts=2024-05-23T04:08:01.562Z caller=node_exporter.go:118 level=info collector=loadavg
ts=2024-05-23T04:08:01.562Z caller=node_exporter.go:118 level=info collector=meminfo
ts=2024-05-23T04:08:01.562Z caller=node_exporter.go:118 level=info collector=netdev
ts=2024-05-23T04:08:01.562Z caller=node_exporter.go:118 level=info collector=os
ts=2024-05-23T04:08:01.562Z caller=node_exporter.go:118 level=info collector=powersupplyclass
ts=2024-05-23T04:08:01.562Z caller=node_exporter.go:118 level=info collector=textfile
ts=2024-05-23T04:08:01.562Z caller=node_exporter.go:118 level=info collector=thermal
ts=2024-05-23T04:08:01.562Z caller=node_exporter.go:118 level=info collector=time
ts=2024-05-23T04:08:01.562Z caller=node_exporter.go:118 level=info collector=uname
ts=2024-05-23T04:08:01.565Z caller=tls_config.go:313 level=info msg="Listening on" address=[::]:9100
ts=2024-05-23T04:08:01.565Z caller=tls_config.go:316 level=info msg="TLS is disabled." http2=false address=[::]:9100

可以看到,node-exporter 启动成功,监听在 9100 端口,可以通过浏览器访问:http://localhost:9100/metrics 查看采集到的指标。或者通过 curl 命令:

curl -s http://localhost:9100/metrics

在我的本地 Mac 上,大概会采集 610 个指标,包括:

  • go 前缀的指标:这是 node-exporter 进程本身的一些指标,比如 gc 耗时、内存使用等
  • node 前缀的指标:机器的一些常规指标,比如 CPU、内存、硬盘、网络、IO 等,咱们后面重点研究这类指标
  • promhttp 前缀的指标:node-exporter 的 http 服务的一些指标,比如请求次数

node-exporter 启动参数

./node_exporter --help 可以查看 node-exporter 的启动参数,主要参数:

  • collector 前缀的指标:控制是否启用某个采集器,node-exporter 内置了多个采集器,比如 cpu、meminfo、ntp 等都是不同的采集器;collector 前缀的还有一些参数是控制各个采集器具体行为的,比如 --collector.ntp.server 控制 ntp 采集器的 ntp 服务器地址
  • web 前缀的指标:控制 node-exporter 的 http 服务,比如 --web.listen-address 控制监听地址,--web.telemetry-path 控制暴露指标数据的 API 路径
  • log 前缀的指标:控制日志打印,比如 --log.level 控制日志级别

大量参数都是围绕 collector 的,因为 node-exporter 的核心就是采集器,不同的采集器负责不同的指标采集。有部分 collector 是默认开启的,有部分是默认关闭的,README 中有详细说明。对于那些默认关闭的 collector,如果你想启用,就要小心测试了,看看采集耗时、对机器的资源占用的影响等。

node-exporter 源码结构

代码仓库根目录下,有个 node_exporter.go,main 函数入口就在这里。collector 目录下是各个插件的实现,比如 meminfo 相关的:

ulric@ulric-flashcat collector % ll meminfo*
-rw-r--r--  1 ulric  staff  1998 12 18 17:20 meminfo.go
-rw-r--r--  1 ulric  staff  2515 12 18 17:20 meminfo_darwin.go
-rw-r--r--  1 ulric  staff  1853 12 18 17:20 meminfo_linux.go
-rw-r--r--  1 ulric  staff  1163 12 18 17:20 meminfo_linux_test.go
-rw-r--r--  1 ulric  staff  1520 12 18 17:20 meminfo_netbsd.go
-rw-r--r--  1 ulric  staff  4655 12 18 17:20 meminfo_numa_linux.go
-rw-r--r--  1 ulric  staff  2950 12 18 17:20 meminfo_numa_linux_test.go
-rw-r--r--  1 ulric  staff  2483 12 18 17:20 meminfo_openbsd.go
-rw-r--r--  1 ulric  staff  2336 12 18 17:20 meminfo_openbsd_amd64.go

这些源码文件分成了很多不同的后缀,这是因为不同的系统,meminfo 的实现是不同的,go 语言通过后缀来区分不同的系统,比如 meminfo_darwin.go 是 Mac 系统的实现,meminfo_linux.go 是 Linux 系统的实现。

不同的插件,都会有个 init() 函数,这个函数会在 node-exporter 启动的时候被调用,用来注册插件。比如 meminfo 插件:

func init() {
	registerCollector("meminfo", defaultEnabled, NewMeminfoCollector)
}

所谓的插件注册,核心就是把各个插件的信息(名称、是否启用、工厂函数)保存在全局变量中,这样一来,node-exporter 启动的时候,就可以根据这些信息,动态创建插件实例,然后调用采集函数,采集指标。典型的插件化设计思路。

插件在 node-exporter 中抽象为一个 interface,只有一个 Update 函数:

type Collector interface {
	// Get new metrics and expose them via prometheus registry.
	Update(ch chan<- prometheus.Metric) error
}

比如内存采集插件 meminfo,就实现了这个接口:

func (c *meminfoCollector) Update(ch chan<- prometheus.Metric) error {
	var metricType prometheus.ValueType
	memInfo, err := c.getMemInfo()
	if err != nil {
		return fmt.Errorf("couldn't get meminfo: %w", err)
	}
	level.Debug(c.logger).Log("msg", "Set node_mem", "memInfo", memInfo)
	for k, v := range memInfo {
		if strings.HasSuffix(k, "_total") {
			metricType = prometheus.CounterValue
		} else {
			metricType = prometheus.GaugeValue
		}
		ch <- prometheus.MustNewConstMetric(
			prometheus.NewDesc(
				prometheus.BuildFQName(namespace, memInfoSubsystem, k),
				fmt.Sprintf("Memory information field %s.", k),
				nil, nil,
			),
			metricType, v,
		)
	}
	return nil
}

node-exporter 框架层面,会创建 prometheus.Metric 类型的 channel,作为一个监控数据接收器,传给 Update,各个插件实现 Update 函数,把采集到的指标数据写入 channel,node-exporter 框架层面,会把这些数据通过 /metrics 接口暴露出来。

小结

作为专栏第一篇,对 node-exporter 整体做了一些介绍,包括其定位、安装方式、启动参数、源码结构等。后续会逐个插件详细讲解,一起揭开 Linux 监控数据的神秘面纱,看看这些数据是如何采集的,用来干啥的,有啥坑,以及一些重要指标的含义。

标签:node,exporter,level,--,01,go,collector
From: https://www.cnblogs.com/ulricqin/p/18224100

相关文章

  • Linux 下 Node 安装与配置
    一、官网地址:Node.js中文网二、linux版本:lsb_release-a三、下载安装包3.1、下载地址:下载|Node.js中文网3.2、使用wget命令下载到linux服务器(也可以下载到本地再上传,在/usr/local目录)wgethttps://cdn.npmmirror.com/binaries/node/v16.17.0/node-v16.17.0-linux-x64.t......
  • Delphi 2010 新增功能之: IOUtils 单元(1): 初识 TDirectory.GetFiles
    用IOUtils单元下的TDirectory.GetFiles获取文件列表太方便了;下面的例子只是TDirectory.GetFiles的典型应用...unitUnit1;interfaceuses Windows,Messages,SysUtils,Variants,Classes,Graphics,Controls,Forms, Dialogs,StdCtrls;type TForm1=......
  • Nginx 实战-01-nginx ubuntu(windows WSL2) 安装笔记
    前言大家好,我是老马。很高兴遇到你。我们为java开发者实现了java版本的nginxhttps://github.com/houbb/nginx4j如果你想知道servlet如何处理的,可以参考我的另一个项目:手写从零实现简易版tomcatminicat手写nginx系列如果你对nginx原理感兴趣,可以阅读:从零......
  • N5_2013_07_Q3
    问题31ばん今から寝ます。家族に何と言いますか。现在要睡觉了。对家人说什么?1.おやすみなさい晚安2.こんばんは晚上好3.さようなら再见ねる(寝る)动睡觉かぞく(家族)名家人なんと言いますか疑怎么说2ばん時計がありません。時間が知りたいです。何と......
  • Mac卸载 Node npm,升级 Node
    电脑上的版本太老了。删除重新下载安装https://nodejs.org/en/download/prebuilt-installer由于使用安装包的形式安装的,所以网上的卸载命令不起作用。直接通过命令删除:#删除Node、npmjimmy@MacBook-Pronpm%sudorm-rf/usr/local/{bin/{node,npm},lib/node_modules/npm......
  • P6342 [CCO2017] Vera 与道路建设 题解
    题目大意对于一个图w一共有v个点点的编号为1,2,...,v,对于点a与点b如果满足$a\tob$且$b\toa$使得每一条道路都只走过一次,那么我们称$a,b$为完美点对,当一个联通图只有$k$个完美点对时,称这个联通图为美丽公路网,要求求出一个美丽公路网......
  • Debug-013-el-loading中显示倒计时时间
    前言:            今天实现一个小小的优化,业务上是后端需要从设备上拿数据,所以前端需要不断调用一个查询接口,直到后端数据获取完毕,前后端根据一个ending字段为true判断停止调用查询接口。由于这个查询时间比较久,所以需要一个laoding效果。优化:前端除了根据后......
  • 01--nginx基础
    前言:本文用来整理一下nginx的用法,应该是本人中间件专栏的第一篇文章,这里开始概念和实操将会同样重要,面试时基本概念的理解非常重要,深有体会,不会再让概念成为压死骆驼的稻草。1、nginx简介Nginx(enginex)是一个高性能的HTTP(解决C10k的问题)和反向代理服务器,也是一个IMAP/......
  • [JSOI2015] 染色问题
    [JSOI2015]染色问题题目描述萌萌家有一个棋盘,这个棋盘是一个\(n\timesm\)的矩形,分成\(n\)行\(m\)列共\(n\timesm\)个小方格。现在萌萌和南南有\(C\)种不同颜色的颜料,他们希望把棋盘用这些颜料染色,并满足以下规定:棋盘的每一个小方格既可以染色(染成\(C\)种颜......
  • promisify(rimraf)('node_modules') 这样的好处是什么?
    promisify(rimraf)('node_modules')这样的用法结合了两个Node.js中的概念:promisify和rimraf,带来了以下好处:从回调到Promise:promisify是Node.js内置的util模块中的一个函数,它将采用回调风格的函数转换为返回Promise的函数。这意味着原本使用回调的异步操作变得更加易于理解......