首页 > 其他分享 >Prometheus监控的4个黄金指标及示例

Prometheus监控的4个黄金指标及示例

时间:2024-04-30 23:57:19浏览次数:22  
标签:HTTP 请求 示例 查询 Prometheus PromQL 监控

Prometheus的黄金指标通常指的是在监控和度量系统性能时,关注的四个核心指标:延迟(Latency)、流量(Throughput)、错误(Errors)和饱和度(Saturation)。下面我将为你解释这些指标以及对应的PromQL(Prometheus Query Language)写法。

  1. 延迟(Latency)

    延迟是服务请求或操作所需的时间。例如,HTTP请求的平均响应时间。

    PromQL写法示例:

    histogram_quantile(0.95, sum(rate({job="my-service"}[5m]) by (le)))
    

    这个查询假设你有一个名为histogram_quantile的直方图指标,它记录了延迟分布。这个查询将计算过去5分钟内95%的请求延迟。

  2. 流量(Throughput)

    流量是系统在给定时间内处理的事务数量。例如,每秒处理的HTTP请求数。

    PromQL写法示例:

    rate({job="my-service"}[1m])
    

    这个查询将计算过去1分钟内my-service作业的HTTP请求率。

  3. 错误(Errors)

    错误是失败的服务请求或操作的数量。例如,返回HTTP 5xx状态码的请求。

    PromQL写法示例:

    increase(http_requests_total{code=~"5.."}[1m])
    

    这个查询将计算过去1分钟内HTTP响应码以5开头的请求数量(即错误请求)的增长量。

  4. 饱和度(Saturation)

    饱和度是指系统资源的利用情况,如CPU、内存、磁盘I/O等的使用率。

    PromQL写法示例(以CPU为例):

    (1 - avg(irate(node_cpu_seconds_total{mode="idle"}[5m]))) * 100
    

    这个查询将计算过去5分钟内CPU的平均非空闲时间(即饱和度),并将其转换为百分比。

请注意,上面的PromQL查询示例是基于假设的指标名和标签集。在实际使用中,你需要根据你的Prometheus设置和指标命名约定来调整这些查询。同时,确保你的Prometheus实例已经收集了相关的指标数据。

标签:HTTP,请求,示例,查询,Prometheus,PromQL,监控
From: https://www.cnblogs.com/ydswin/p/18168904

相关文章

  • 如何使用 Prometheus 监控 Kubernetes 集群的核心组件
    使用Prometheus监控Kubernetes集群的核心组件涉及几个关键步骤。以下是一个基本的流程:1.部署PrometheusOperatorPrometheusOperator是一个Kubernetes自定义资源控制器,用于管理和操作Prometheus集群。通过Helmchart或其他方式在Kubernetes集群中部署Prometheu......
  • Prometheus监控mongo
    安装mongo插件[email protected]:dcu/mongodb_exporter.git$GOPATH/src/github.com/dcu/mongodb_exporter也可以去github上,下载源码,在编译安装cd$GOPATH/src/github.com/dcu/mongodb_exportermakebuild./mongodb_exporter-h注意......
  • Prometheus监控MongoDB数据库
    监控环境:Prometheus数据库:MongoDB3.4.6集群,3个节点监控工具:mongodb_exporter 1、创建Mongodb监控可读账号 mongodbadmin库中执行useadmindb.createUser({user:"prometheus",pwd:"prometheus",roles:[{role:"read",db:&qu......
  • Java实现自定义指标数据远程写入Prometheus
    主要的流程如下:1>prometheus添加启动参数2>调用http请求来远程写,数据格式是protobuf(一种自定义的编码格式),编码格式是snappy(一种压缩格式)3>远程写通过snappy先压缩,然后将通过protobuf编码的字节数组发送请求;prometheus官网文档远程写提供remote.proto(包含编码和解码),remote.pr......
  • JDBC与各数据库产品连接的驱动及URL示例
    数据库驱动类JDBC连接Oracleoracle.jdbc.driver.OracleDriverjdbc:oracle:thin:@//127.0.0.1:1521/SchemaNameSQLServercom.microsoft.sqlserver.jdbc.SQLServerDrivernet.sourceforge.jtds.jdbc.Driverjdbc:sqlserver://127.0.0.1:1433;databa......
  • zabbi添加自定义监控项——检查文件是否存在
    1、检查脚本D:/check.pyimportosimportdatetimeimportargparse#获取文件名parser=argparse.ArgumentParser()parser.add_argument('filename')args=parser.parse_args()file_name=args.filename#获取今天日期today=datetime.datetime.today().strftime......
  • 交换机统一监控和远程控制:自动发现、自动监控、自动告警、自动修复
        交换机在网络架构中占据重要位置,连接各种设备和系统起到桥梁的作用,控制数据流动,使网络数据传输更加稳定高效。因此,交换机的状态必将影响网络的可靠性和可用性。    北京智和信通交换机管控方案统一纳管网络中不同类型、不同品牌、不同型号的交换机,通过远程监......
  • 在Linux中,如何监控系统资源使用情况?
    在Linux中,监控系统资源使用情况对于系统管理员来说是一项重要的任务,它有助于确保系统性能和及时发现潜在的瓶颈。以下是一些常用的命令和工具,用于监控不同类型的系统资源:1.CPU使用情况top:实时显示系统中各个进程对CPU资源的使用状况。tophtop:top的增强版本,提供了彩色界......
  • 在Linux中,如何监控磁盘I/O性能?
    在Linux中,可以使用iotop和iostat命令来监控磁盘的I/O性能。以下是如何使用这两个工具以及它们各自的特点:使用iotop命令:iotop是一个实时显示系统磁盘活动的工具,类似于top命令,但专注于I/O活动。它能够展示每个进程或线程的实时I/O使用情况,包括读写带宽,以及等待I/O操作所花费的时......
  • Qt-Model/View综合示例
    相关类简介Qt和Model/View模式相关的类比较多,但一般存在继承关系,按model(模型),view(视图),delegate(委托)划分为如下几种:类型类名简介父类modelQAbstractItemModel(抽象类)常用的Model的基类QObjectQStandardItemModel通用model可以实现以下任意类型......