首页 > 系统相关 >【Linux日常】windows机器添加GPU监控

【Linux日常】windows机器添加GPU监控

时间:2024-11-20 10:29:50浏览次数:1  
标签:exporter nvidia windows Linux 监控 gpu GPU 节点

监控项: Nvidia GPU
监控节点:192.168.10.11
被监控节点: windows机器,ip:10.0.0.10
插件:  https://github.com/utkuozdemir/nvidia_gpu_exporter/releases/download/v1.2.1/nvidia_gpu_exporter_1.2.1_windows_x86_64.zip 
预览模板

image

windows机器操作
1、进入监控机器
windows机器

ip: 10.0.0.10
账密信息:xxx

2、下载二进制包

https://github.com/utkuozdemir/nvidia_gpu_exporter/releases/download/v1.2.1/nvidia_gpu_exporter_1.2.1_windows_x86_64.zip

3、启动服务
双击执行
image

4、服务中将该服务设置为延迟启动

5、网页访问127.0.0.1:9835
image
image

算访问成功

6、Prometheus节点配置
本地监控节点: 192.168.10.11
需要保证当前端口已经放开,如果没有获取到数据需要看下是不是没放开防火墙
配置Prometheus.yml文件

  - job_name: 'gpu'
    static_configs:
      - targets: ["10.0.0.10:9835"]

重载/重启服务

curl -X POST http://localhost:9090/-/reload

7、prometheus节点验证是否接收到该数据
image

8、grafana添加模板监控
image

标签:exporter,nvidia,windows,Linux,监控,gpu,GPU,节点
From: https://www.cnblogs.com/queryH/p/18556353

相关文章

  • Linux基础命令二
    二、进阶命令2.1ps命令作用:监测进程。psaux:显示所有用户的进程可以看见CPU使用率,内存使用率、进程状态ps-ef系统上运行的所有进程可以看见PPID一些信息UID:启动这些进程的用户。PID:进程的进程ID。PPID:父进程的进程号(如果该进程是由另一个进程启动的)。C:进程生......
  • Linux基本命令(三) 文本处理及优化终端操作
    目录一、文本处理  1.1内容匹配1.1.1grep文件内容搜索1.1.2 awk正则匹配内容1.2 内容打印 1.2.1head显示文件头部内容1.2.2tail显示文件底部内容1.2.3sed文件内容显示1.2.4cut列提取1.3 内容处理1.3.1内容替换1.3.2sort内容排序1.3.3uniq内容去重......
  • 利用 TensorFlow Profiler:在 AMD GPU 上优化 TensorFlow 模型
    TensorFlowProfilerinpractice:OptimizingTensorFlowmodelsonAMDGPUs—ROCmBlogs简介TensorFlowProfiler是一组旨在衡量TensorFlow模型执行期间资源利用率和性能的工具。它提供了关于模型如何与硬件资源交互的深入见解,包括执行时间和内存使用情况。TensorFl......
  • 使用 ROCm 在 AMD GPU 上微调和测试前沿的语音模型
    Fine-tuningandTestingCutting-EdgeSpeechModelsusingROCmonAMDGPUs—ROCmBlogsAI语音代理或语音机器人是通过使用口头语言与人交流而设计的。语音机器人通常用于客户服务和个人助手应用,并有可能进入并革命性地改变人们与技术互动的几乎每个方面,这些方面可以从......
  • Rocky Linux 9.5 正式版发布 - RHEL 100% 1:1 兼容免费发行版
    RockyLinux9.5正式版发布-RHEL100%1:1兼容免费发行版RockyLinux由CentOS项目的创始人GregoryKurtzer领导请访问原文链接:https://sysin.org/blog/rocky-linux-9/查看最新版。原创作品,转载请保留出处。作者主页:sysin.org以社区方式驱动的企业LinuxRockyLinu......
  • Windows10怎么关闭同步中心
    Windows10怎么关闭同步中心文章目录Windows10怎么关闭同步中心一、前言二、问题描述三、解决步骤四、总结一、前言在使用Windows系统时,有时会遇到同步中心无法关闭的问题。尤其是在后台,右键点击同步中心图标后,发现没有关闭选项,令人困扰。本文将详细讲解通过注册......
  • Server2025 和 GPU-P(GPU Partitioning,GPU 分区技术)的正式支持,  GPU-P 是一种将物理 G
     Server2025和GPU-P(GPUPartitioning,GPU分区技术)的正式支持, WindowsServer2025系统将全面支持GPU-P技术。然而,GPU-P是一种将物理GPU划分为多个虚拟GPU(vGPU)并分配给不同虚拟机或容器的技术。如果你是在询问WindowsServer或MicrosoftHyper-V是否已经正式支持......
  • Windows11 一些典型系统错误的修复
    近些年windows11已然成为主流,一直用着也没啥大问题,今天有空,一些事件查看器里的小毛病,记录一下处理方法安全启动更新无法更新安全启动变量,错误为此计算机上未启用安全启动。。有关详细信息,请参阅https://go.microsoft.com/fwlink/?linkid=2169931所谓安全启动,TPM就是个......
  • 虚拟机之linux系统命令
    1、df查看磁盘使用情况(1)dfFilesystem:代表该文件系统时哪个分区,所以列出的是设备名称。1K-blocks:说明下面的数字单位是1KB,可利用-h或-m来改变单位大小,也可以用-B来设置。Used:已经使用的空间大小。Available:剩余的空间大小。Use%:磁盘使用率。如果使用率在90%以上时,就需要注......
  • 虚拟机之linux介绍和命令
    一、linux介绍1、Linux是一个免费、开源的操作系统,能多用户、多任务、支持多线程和多CPU的操作系统,相对windows更加稳定,在unix系统的基础上开发的系统;注解:(1)免费:不要钱(2)源代码公开(3)多用户:可以在不同用户操作(4)多任务:同时执行多个任务(5)多线程:支多个线程同时工作(6)多cpu:系......