首页 > 其他分享 >zabbix监控GPU使用率

zabbix监控GPU使用率

时间:2024-08-29 19:24:24浏览次数:7  
标签:grep zabbix awk smi nvidia print GPU 使用率


vi /etc/zabbix/zabbix_agent.conf (最后添加)

UserParameter=GPU.Usage,/usr/bin/nvidia-smi -q |grep -A 3 "Utilization" | grep Gpu | awk '{print $3}' | awk '{a+=$1}END{print a/NR}'

#UserParameter=GPU.Memory,/usr/bin/nvidia-smi -q |grep -A 3 "Utilization" | grep Memory | awk '{print $3}' | awk '{a+=$1}END{print a/NR}'

UserParameter=GPU.Memory,/usr/bin/nvidia-smi --query-gpu=index,memory.used,memory.total --format=csv | awk '{print $2,$4}' | awk '{a+=$1};{b+=$2}END{print a*100/b}'

:wq

systemctl restart zabbix-agent

注:

第3行是改造后的命令,因为第2行出来的结果跟正常nvidia-smi看到的差距有点大,第3行是根据nvidia-smi出来的结果人为做的计算。




标签:grep,zabbix,awk,smi,nvidia,print,GPU,使用率
From: https://blog.51cto.com/yangzhiming/11869447

相关文章

  • 深入浅出LLamaSharp:打造智能.NET应用,不需GPU也能玩转LLaMA模型
            在如今的.NET社区中,机器学习和人工智能的应用越来越普遍。今天我要给大家推荐一个名叫LLamaSharp的开源项目。这是llama.cpp的C#/.NET绑定,提供了高级的API,使得我们能在本地设备上使用C#/.NET推理LLaMA模型,并且部署它。        LLamaSharp支持在Windo......
  • 错误处理、cuda模型、GPU架构杂谈
    错误处理、cuda模型、GPU架构杂谈错误处理所有编程都需要对错误进行处理,早起的编码错误,编译器会帮搞定,内存错误也能观察出来,但是有些逻辑错误很难发现,甚至到了上线运行时才会被发现,而且有些厉害的bug复现会很难,不总出现,但是很致命,而且CUDA基本都是异步执行的,当错误出现的时候,不......
  • GPU的Fermi 架构与Kepler架构杂谈
    Fermi架构Fermi架构是第一个完整的GPU架构,如图10-15所示。图10-15Fermi架构是第一个完整的GPU架构Fermi架构逻辑图,如图10-15所示,具体数据如下:1)512个加速核心,CUDA核2)每个CUDA核心都有一个全流水线的整数算数逻辑单元ALU,和一个浮点数运算单元FPU3)CUDA核被组织到16个SM上4......
  • 并行动力:用PyTorch在多GPU上释放深度学习潜能
    标题:并行动力:用PyTorch在多GPU上释放深度学习潜能随着深度学习模型变得越来越复杂,单GPU训练往往难以满足需求。幸运的是,PyTorch提供了强大的多GPU训练支持,允许我们利用多个GPU来加速模型的训练过程。本文将详细介绍如何在PyTorch中使用多GPU训练,包括数据并行、模型并行以及......
  • Android 常用的性能分析工具详解:GPU呈现模式
    此篇将重点介绍几种常用的Android性能分析工具:一、Logcat日志选取Tag=ActivityManager,可以粗略地知道界面Displaying的时间消耗。当我们打开一个Activity的时候,log会打印一串log如下:I/ActivityManager﹕Displayedxxx.xxx.xxx/TestActivity:+1s272ms(total+3s843ms)第一......
  • zabbix监控Tomcat服务器操作指引
    作者:乐维社区(forum.lwops.cn)许远Tomcat是一个流行的JavaServlet容器,用于开发和部署JavaWeb应用程序,广泛应用于中小型系统、开发与测试环境、集成环境等场合。Zabbix是一个开源的监控解决方案,广泛用于监控各种网络参数、服务器健康状态以及应用程序的性能,而JMX(JavaManagement......
  • 在AMD GPU上使用DBRX Instruct
    DBRXInstructonAMDGPUs—ROCmBlogs在这篇博客中,我们展示了DBRXInstruct,这是由Databricks开发的一个专家混合大型语言模型,在支持ROCm的系统和AMDGPU上运行。关于DBRXInstructDBRX是一个基于Transformer的仅解码大型语言模型,拥有1320亿参数,采用了细粒度的专家混合......
  • 使用统计方法在AMD GPU上使用JAX Profiler可靠地比较大型生成AI模型中的算法性能
    UsingstatisticalmethodstoreliablycomparealgorithmperformanceinlargegenerativeAImodelswithJAXProfileronAMDGPUs—ROCmBlogs摘要本文提供了一份详细的指南,介绍如何在JAX实现的生成AI模型中测量和比较各种算法的性能。利用JAXProfiler和统计分析......
  • Java后端分布式系统的服务监控:Zabbix与Nagios
    Java后端分布式系统的服务监控:Zabbix与Nagios大家好,我是微赚淘客返利系统3.0的小编,是个冬天不穿秋裤,天冷也要风度的程序猿!在分布式系统中,服务监控是确保系统稳定性和可靠性的重要手段。Zabbix和Nagios是两款广泛使用的开源监控系统,它们提供了网络和服务器监控的功能。服务监控......
  • zabbix图形界面的字体问题
    现象,zabbixweb语言改为中文后  解决过程:1.去windows下控制面板-字体-复制(楷体-常规) find/-namedefines.inc.phpcat/usr/share/zabbix/include/defines.inc.php查看到字体及字体路径 进入字体目录:cd /usr/share/zabbix/assets/fonts上传新字体 替换字体配......