prometheus联邦集群

时间：2024-09-24 15:51:40浏览次数：1

标签：__ name job Prometheus prometheus 集群联邦

一、简介

对于大部分监控规模而言，我们只需要在每一个数据中心安装一个Prometheus Server实例，就可以在各个数据中心处理上千规模的集群。同时将Prometheus Server部署到不同的数据中心可以避免网络配置的复杂性。

在每个数据中心部署单独的Prometheus Server，用于采集当前数据中心监控数据。并由一个中心的Prometheus Server负责聚合多个数据中心的监控数据。这一特性在Promthues中称为联邦集群。

联邦集群的核心在于每一个Prometheus Server都包含一个用于获取当前实例中监控样本的接口/federate。对于中心Prometheus Server而言，无论是从其他的Prometheus实例还是Exporter实例中获取数据实际上并没有任何差异。

集群部署架构

三、部署prometheus联邦集群并抓取对应节点数据

1.中心及联邦prometheus节点部署prometheus

在 100.131 100.132 100.133三台服务器上安装prometheus,二进制部署，部署步骤略，可参考：https://www.cnblogs.com/panwenbin-logs/p/18370049  ，各节点版本保持一致

2.被采集节点安装node-exporter

在 10.134 100.135 2台服务器上二进制部署node-exporter，部署步骤略，参考:参考：https://www.cnblogs.com/panwenbin-logs/p/18370049

3.配置prometheus联邦节点采集数据

#联邦节点1
scrape_configs:
  - job_name: "prod-app01"
    static_configs:
      - targets: ["192.168.100.134:9100"]


#联邦节点2
scrape_configs:
  - job_name: "prod-app02"
    static_configs:
      - targets: ["192.168.100.135:9100"]

验证是否抓取数据正常

4.配置中心prometheus server 抓取联邦节点prometheus

#在100.131上操作
vim prometheus.yml
 - job_name: 'prometheus-federate-100.132'
   scrape_interval: 10s
   honor_labels: true
   metrics_path: '/federate'
   params:
    'match[]':
      - '{job="prometheus"}'
      - '{__name__=~"job:.*"}'
      - '{__name__=~"node.*"}'
   static_configs:
     - targets:
       - '192.168.100.132:9090'  #下面的也可以不写，把133写在此处也是可以的

 - job_name: 'prometheus-federate-100.133'
   scrape_interval: 10s
   honor_labels: true
   metrics_path: '/federate'
   params:
    'match[]':
      - '{job="prometheus"}'
      - '{__name__=~"job:.*"}'
      - '{__name__=~"node.*"}'
   static_configs:
     - targets:
       - '192.168.100.133:9090'

systemctl restart prometheus

web端验证

grafana图标验证

可以看到数据可以正常抓取及展示

参考文档：https://prometheus.io/docs/prometheus/latest/federation/

标签：__,name,job,Prometheus,prometheus,集群,联邦
From： https://www.cnblogs.com/panwenbin-logs/p/18429140

Linux集群负载均衡DR模式LVS搭建
负载均衡DR模式LVS搭建1.基础准备（1）准备3台机器DR模式需要三台虚拟机，三台虚拟机只需要有“公网”IP,但在这种模式下又多了一个VIP。对应的机器和IP如下：调度器dir：192.168.147.130真实服务器rs1：192.168.147.131真实服务器rs2：192.168.147.132VIP：192.168.147.110（2）改名分发......
15.8 在k8s部署prometheus statefulset
本节重点介绍:检查，kube-systemns[root@prome-master01prometheus]#kubectlgetpod-nkube-systemNAMEREADYSTATUSRESTARTSAGEcoredns-7d75679df-7f7tx1/1Running088mcoredns-7d75679df-qmzbg1/1Running088metcd-prome-master011/1Running088mkube-apise......
15.7 创建prometheus的statsfulset配置
本节重点介绍:prometheusstatsfulsetyaml配置设置statsfulset副本反亲和性设置pod运行优先级设置volumeClaimTemplates设置配置文件热更新容器configmap-reload设置prometheus主容器statsfulset设置元信息apiVersion:apps/v1kind:StatefulSetmetadata:name:prometheus......
15.6 创建prometheus使用的配置configmap
本节重点介绍:config简介prometheusconfigmap编写configmap作用ConfigMap是一种API对象，用来将非机密性的数据保存到键值对中使用时，Pods可以将其用作环境变量、命令行参数或者存储卷中的配置文件。为何prometheus需要configmapprometheus的配置文件需要以configmap形式挂载编......
prometheus学习笔记之PushGateway
一、pushgateway简介pushgateway是采用被动推送的方式，而不是类似于prometheusserver主动连接exporter获取监控数据。pushgateway可以单独运行在一个节点，然后需要自定义监控脚本把需要监控的主动推送给pushgateway的API接口，然后pushgateway再等待prometheusser......
kafka集群架构与原理
前言这次我们从消息队列开始讨论。生产者-消费者模型中间需要一个消息队列，以存储生产者的产品。对传统的消息队列来说，它支持点对点（P2P）和发布/订阅（Pub/Sub）两种消息模型。在点对点模型中，消息被发送到一个队列，并且只有一个消费者可以消费该消息。在发布/订阅模型中，消......
Karmada新版本发布，支持联邦应用跨集群滚动升级
摘要：本次升级支持联邦应用跨集群滚动升级，使用户版本发布流程更加灵活可控；透明同事karmadactl新增了多项运维能力，提供独特的多集群运维体验。本文分享自华为云社区《Karmadav1.11版本发布！新增应用跨集群滚动升级能力》，作者：云容器大未来。Karmada是开放的多云多集群容器编排引擎......
es集群配置
#指定集群名称3个节点必须一致cluster.name:es-cluster#指定节点名称，每个节点名字唯一node.name:node-1#是否有资格为master节点，默认为truenode.master:true#是否为data节点，默认为truenode.data:true#绑定ip,开启远程访问,可以配置0.0.0.0network.host:0.0.0.0#指定web端口......
Python实战：为Prometheus开发自定义Exporter
Python实战：为Prometheus开发自定义Exporter在当今的微服务架构和容器化部署环境中，监控系统的重要性不言而喻。Prometheus作为一款开源的系统监控和警报工具，以其强大的功能和灵活性受到了广泛的欢迎。然而，Prometheus本身并不直接监控所有类型的服务或应用，这就需要我们为其开发自定......
联邦学习(Federated Learning)原理与代码实战案例讲解
联邦学习(FederatedLearning)原理与代码实战案例讲解关键词：联邦学习集中式学习数据隐私保护分布式机器学习同态加密安全多方计算1.背景介绍1.1问题的由来随着大数据时代的到来，数据孤岛现象日益严重。许多组织拥有大量的本地数据，但由于法律、安全或商业原因，这些数据......