首页 > 其他分享 >Prometheus部署

Prometheus部署

时间:2024-09-04 09:50:47浏览次数:12  
标签:exporter scrape 部署 prometheus 192.168 Prometheus usr local

机器准备

prometheus-server

192.168.252.143

主服务器(自监控和监控)

prometheus-node1

192.168.252.144

远程服务器(被监控)

grafana

192.168.252.141

图像显示

一、安装Prometheus-Server

192.168.252.143 prometheus-server

同步时间

yum -y install ntp
ntpdate ntp.aliyun.com  同步阿里云的时间

安装prometheus

1.从github上获取安装包
 wget https://github.com/prometheus/prometheus/releases/download/v2.31.0-rc.0/prometheus-2.31.0-rc.0.linux-amd64.tar.gz
2.解压安装包到 /usr/local/目录下
 tar -xzvf prometheus-2.31.0-rc.0.linux-amd64.tar.gz  -C /usr/local/

3.重命名
cd /usr/local/
mv prometheus-2.31.0-rc.0.linux-amd64/ prometheus

4.创建存放数据的目录
mkdir -p prometheus/data

配置systemctl管理

1.编辑配置文件
vim /usr/lib/systemd/system/prometheus.service
[Unit]
Description=https://prometheus.io

[Service]
Restart=on-failure
ExecStart=/usr/local/prometheus/prometheus --storage.tsdb.path=/usr/local/prometheus/data --config.file=/usr/local/prometheus/prometheus.yml

[Install]
WantedBy=multi-user.target

2.备份prometheus的文件并启动设置开机自启
 cp /usr/local/prometheus/prometheus.yml /usr/local/prometheus/prometheus.yml.bak

systemctl daemon-reload
systemctl start prometheus
systemctl enable prometheus
3.默认端口9090

访问

http://192.168.252.143:9090

二、安装Prometheus-Node1

192.168.252.144 prometheus-node1

同步时间

yum -y install ntp
ntpdate ntp.aliyun.com  同步阿里云的时间

安装node_exporter

wget https://github.com/prometheus/node_exporter/releases/download/v1.2.2/node_exporter-1.2.2.linux-amd64.tar.gz

tar -xvzf node_exporter-1.2.2.linux-amd64.tar.gz  -C /usr/local/
cd /usr/local/
mv node_exporter-1.2.2.linux-amd64/ node_exporter

配置systemctl管理

1.编辑配置文件
vim /usr/lib/systemd/system/node_exporter.service

[Unit]
Description=Prometheusnode_exporter

[Service]
User=nobody
ExecStart=/usr/local/node_exporter/node_exporter --log.level=error
ExecStop=/usr/bin/killallnode_exporter

[Install]
WantedBy=default.target

2.启动
systemctl daemon-reload
systemctl start node_exporter
systemctl enable node_exporter

配置监控

192.168.252.143 prometheus-server

1.编辑配置文件
vim  /usr/local/prometheus/prometheus.yml
在配置文件最后面添加:
  - job_name: 'prometheus-node1'
      static_configs:
        - targets: ["192.168.252.144:9100"]

1.检查配置文件是否正确
./promtool check config prometheus.yml 

Checking prometheus.yml
  SUCCESS: 1 rule files found

Checking /usr/local/prometheus/rules/host_monitor.yml
  SUCCESS: 1 rules found

  2.启动
  systemctl restart prometheus

3.访问
http://192.168.252.143:9090

三、安装Grafana

官方网址下载:Download Grafana | Grafana Labs

192.168.252.141 grafana

安装grafana

1.获取安装包
yum install -y https://dl.grafana.com/enterprise/release/grafana-enterprise-10.1.1-1.x86_64.rpm

2.启动grafana
systemct start grafana-server
systemctl enable grafana-server

登录访问

http://192.168.252.141:3000
默认账户密码
username:Admin
password:admin

修改账户密码

配置prometheus

四、配置文件

使用yml格式进行配置文件

更多参考:prometheus 配置文件详解 - liwenchao1995 - 博客园 (cnblogs.com)

一级配置字段

global             # 全局配置 (如果有内部单独设定,会覆盖这个数)

alerting           # 告警插件定义。这里会设定alertmanager这个报警插件。

rule_files         # 告警规则。 按照设定参数进行扫描加载,用于自定义报警规则,其报警媒介和route路由由alertmanager插件实现。

scrape_configs      # 采集配置。配置数据源,包含分组job_name以及具体target。又分为静态配置和服务发现

remote_write        # 用于远程存储写配置

remote_read         # 用于远程读配置

global字段

选项:
1.scrape_interval   # 全局默认的数据拉取间隔 
格式: 
scrape_interval: <duration> | default = 1m

2.scrape_timeout   # 全局默认的单次数据拉取超时,如果有context deadline exceeded错误,需要配置在特定的job下配置该字段
格式:
scrape_timeout: <duration> | default = 10s

3.evaluation_interval  #全局默认的规则----拉取间隔(报警)
格式:
evaluation_interval: <duration> | default = 1m

4.external_labels  # 	该服务端在与其他系统对接所携带的标签
格式:
<labelname>: <labelvalue>

alerting字段

与alertmanager字段连用

alert_relabel_configs:
此项配置和scrape_configs字段中relabel_configs配置一样,用于对需要报警的数据进行过滤后发向Alertmanager
说明 relabel-configs的配置允许你选择你想抓取的目标和这些目标的标签是什么。所以说如果你想要抓取这种类型的服务器而不是那种,可以使用relabel_configs
相比之下,metric_relabel_configs是发生在抓取之后,但在数据被插入存储系统之前使用。因此如果有些你想过滤的指标,或者来自抓取本身的指标(比如来自/metrics页面)你就可以使用metric_relabel_configs来处理。
alertmanagers:
该项目主要用来配置不同的alertmanagers服务,以及Prometheus服务和他们的链接参数。alertmanagers服务可以静态配置也可以使用服务发现配置。Prometheus以pushing 的方式向alertmanager传递数据。

原始配置文件

# my global config
global:
  scrape_interval: 15s # Set the scrape interval to every 15 seconds. Default is every 1 minute.
  evaluation_interval: 15s # Evaluate rules every 15 seconds. The default is every 1 minute.
  # scrape_timeout is set to the global default (10s).

# Alertmanager configuration
alerting:
  alertmanagers:
    - static_configs:
        - targets:
            - 192.168.252.141:9093
          # - alertmanager:9093

# Load rules once and periodically evaluate them according to the global 'evaluation_interval'.
rule_files:
  - "/usr/local/prometheus/rules/*.yml"
  # - "first_rules.yml"
  # - "second_rules.yml"

# A scrape configuration containing exactly one endpoint to scrape:
# Here it's Prometheus itself.
scrape_configs:
  # The job name is added as a label `job=<job_name>` to any timeseries scraped from this config.
  - job_name: "prometheus"

    # metrics_path defaults to '/metrics'
    # scheme defaults to 'http'.

    static_configs:
      - targets: ["localhost:9090"]

标签:exporter,scrape,部署,prometheus,192.168,Prometheus,usr,local
From: https://blog.csdn.net/qq_59671942/article/details/141828631

相关文章

  • 阿里重磅开源Qwen2-VL:超越人类的视觉理解能力,从医学影像到手写识别,这款开源多模态大模
    阿里重磅开源Qwen2-VL:超越人类的视觉理解能力,从医学影像到手写识别,这款开源多模态大模型究竟有多强?(附本地化部署教程)模型介绍最近呢,阿里巴巴开源了Qwen2-VL,在多模态大模型展现了在实际应用中的巨大潜力,尤其是在处理跨模态数据方面表现出众。以下是该模型的几大应用亮点:智......
  • 使用docker部署tensorrtllm推理大模型baichuan2-7b
    简介大模型的推理框架,我之前用过vllm和mindie。近期有项目要用tensorrtllm,这里将摸索的过程记录下,特别是遇到的问题。我的环境是Linux+rt3090准备docker环境本次使用docker镜像部署,需要从网上拉取:dockerpullnvcr.io/nvidia/tritonserver:24.08-trtllm-python-py3Th......
  • Prometheus入门
    介绍1、Prometheus是一个开源的服务监控系统和时序数据库,其提供了通用的数据模型和快捷数据采集、存储和查询接口。它的核心组件Prometheusserver会定期从静态配置的监控目标或者基于服务发现自动配置的自标中进行拉取数据,当新拉取到的数据大于配置的内存缓存区时,数据就会持久......
  • prometheus学习笔记之集群内服务发现环境准备
    一、环境介绍主要演示prometheus在k8s集群中如何通过服务自动去发现k8s集群自有服务及其他服务发现场景,后续会演示集群外部署prometheus自动发现k8s服务并获取数据创建监控使用的namespaceskubectlcreatensmonitoring配置docker可以下载镜像[root@k8s-masterdeploy]......
  • 第20天:信息打点-红蓝队自动化项目&资产侦察&企查产权&武器库部署&网络空间
    时间轴:演示案例自动化—武器库部署—F8x自动化—网络空间—AsamF自动化—企查信息—ENScan自动化—综合架构—ARL&Nemo各类红蓝队优秀工具项目集合:参考:https://github.com/guchangan1/All-Defense-Tool本项目集成了全网优秀的开源攻防武器项目,包含信息收集工具(自动......
  • MINIO部署
    创建挂载目录mkdir-p/root/dockerData/ivan_minio/启动方式docker-compose方式启动创建docker-compose.yml文件vimdocker-compose.ymlversion:'3'services:minio:image:"quay.io/minio/minio:RELEASE.2022-08-02T23-59-16Z"container_name:mini......
  • CentOS 7 docker 部署遇到内网通,外网不同 问题
     问题  [root@localhost~]#systemctlstatusnetwork●network.service-LSB:Bringup/downnetworkingLoaded:loaded(/etc/rc.d/init.d/network;bad;vendorpreset:disabled)Active:failed(Result:exit-code)sinceTue2024-09-0314:21:22CST;......
  • 安防视频EasyCVR视频汇聚平台集群部署出现状态不同步的情况是什么原因?
    随着视频监控技术的快速发展,各类视频资源的整合、管理与分发成为了安防行业的重要挑战。视频综合管理系统EasyCVR视频汇聚平台通过集群部署,实现了视频资源的高效整合与管理。集群部署不仅能够提升系统的处理能力和稳定性,还能有效避免单点故障,保障视频服务的连续性。有用户反馈,Ea......
  • Neural Magic发布GuideLLM:评估和优化大型语言模型(LLM)部署的强大工具
    大型语言模型(LLMs)的部署和优化已成为各种应用的关键。NeuralMagic推出了GuideLLM,以应对对高效、可扩展且具有成本效益的LLM部署日益增长的需求。这款强大的开源工具旨在评估和优化LLM的部署,以确保它们在满足现实中的推理需求的同时,具有高性能和最小的资源消耗。GuideLLM概述......
  • 前端Vue项目iHRM人力资源后台管理从Vue模板到整体开发Nginx部署上线
    前端Vue项目iHRM人力资源后台管理:‌从Vue模板到整体开发Nginx部署上线引言随着企业信息化的不断深入,‌人力资源管理系统的自动化和智能化成为企业提升管理效率的重要手段。‌本文将详细介绍一个基于Vue.js开发的人力资源后台管理系统(‌iHRM)‌的完整开发流程,‌包括从Vue模板的选......