指标(Metrics)
Prometheus 会将所有采集到的样本数据以时间序列(time-series)的方式保存在内存数据库中,并且定时保存到硬盘上。
时间序列按照时间戳和值的序列顺序存放,每条时间序列通过 指标名称
(metrics name)和一组 标签集
(labelset)命名。
在时间序列中的每一个点称为一个 样本
(sample),样本由以下三部分组成:
- 指标(metric):指标名称和描述当前样本特征的标签集。
- 时间戳(timestamp):一个精确到毫秒的时间戳。
- 样本值(value): 一个 float64 的浮点型数据表示当前样本的值。
一个规范的指标数据一般包含以下三个部分:
# HELP
,说明该指标的用途。# TYPE
,说明该指标的数据类型。- 具体采集的指标。
比如以下数据示例:
# HELP node_cpu_seconds_total Seconds the CPUs spent in each mode.
# TYPE node_cpu_seconds_total counter
node_cpu_seconds_total{cpu="0",mode="idle"} 26855.45
其中具体的指标格式如下:
<指标名称>{<标签名称>=<标签值>, ...} 数据
它的具体含义如下:
指标名称
- 反映了被监控样本的含义。
- 命名符合正则表达式
[a-zA-Z_:][a-zA-Z0-9_:]*
。
标签
- 大括号中的标签反映了当前样本的特征维度,用于对样本数据进行过滤,聚合等。
- 命名符合正则表达式
[a-zA-Z_][a-zA-Z0-9_]*
。 - 以
__
作为前缀的标签,是系统保留的关键字,只能在系统内部使用。 - 标签的值则可以包含任何 Unicode 编码的字符。
数据
- 采集到的具体值。
在 Prometheus 的底层实现中,指标名称实际以
__name__=<指标名称>
的形式保存的。
因此以下两种方式均表示的同一条时间序列:
api_http_requests_total{method="POST", handler="/messages"}
等同于:
{__name__="api_http_requests_total",method="POST", handler="/messages"}