首页 > 编程语言 >JAVA应用CPU跳点自动DUMP工具 | 京东物流技术团队

JAVA应用CPU跳点自动DUMP工具 | 京东物流技术团队

时间:2024-02-01 12:11:27浏览次数:30  
标签:跳点 JAVA 阈值 DUMP JSTACK echo 线程 使用率 CPU

背景

在做系统监控时,CPU的使用率是一个关键的指标,它反映了系统的性能稳定性以及是否存在异常情况,能帮助我们了解系统的负载情况。通过监控CPU使用率,可以判断系统是否正常运行或者是否存在性能问题。如果CPU使用率过高,可能表示系统存在资源瓶颈,需要进行优化或升级。

CPU监控的难点

现有的监控平台提供了多种方式来获取容器和JVM的CPU使用率,并能够实时发送CPU跳点的报警。然而,对于运维人员来说,这些功能远远不够,因为我们需要深入了解导致CPU高的原因。由于CPU是一个动态变化的指标,仅仅在收到报警后通过运维平台的手动操作进行排查,很难抓住事故发生的现场情况。因此,我们需要一个能够自动记录现场的工具。

自动DUMP工具

对于Linux系统,我们可以通过设置一个周期的定时任务来检测CPU使用率。如果我们发现CPU使用率高,我们可以获取CPU使用率高的线程,并进一步处理JVM线程抓包的问题。

我们可以使用top命令来获取进程的CPU使用率以及线程的CPU使用率。针对JAVA应用程序,我们可以使用Jstack来dump当前线程的堆栈信息。然后,我们可以解析这两者的输出,并通过线程号进行匹配,最终生成一个包含CPU使用率的线程堆栈清单。最后,我们可以将此清单持久化到一个文本文件中。

最终的输出文件格式如下:

当前JAVA进程ID:205
当前JAVA进程ID(205)CPU使用率:99%
Top 10 CPU占用线程信息:
具体实现步骤如下:

 

  1. 从环境变量中读取CPU阈值和线程数阈值,脚本的两个配置项,不同分组和不同环境可以设置不同的阈值。

  2. 获取JAVA进程ID:使用pgrep命令获取当前运行中的Java进程的PID,并将其保存到变量中。

  3. 获取当前CPU使用率:使用top命令获取当前CPU使用率,主要是获取JAVA进程的CPU使用率。

  4. 检查CPU使用率是否超过阈值:与预设的CPU阈值进行比较,如果超过阈值,则执行后续操作,否则结束。

  5. 查找JAVA进程内占用CPU最高的线程:使用top命令查找占用CPU最高的前十个线程,并获取它们的相关信息。

  6. 捕捉JVM线程快照:使用jstack命令捕捉JVM线程快照,并将其保存到指定的日志文件中。

  7. 输出线程信息:解析并匹配线程栈文件,将占用CPU最高的前十个线程的信息包括线程的PID和堆栈信息合并到同一行输出。

  8. 日志记录和保存:将相关的CPU使用率及线程快照信息记录到日志文件中,方便后续分析和优化。

使用方式

在应用的启动脚本(start.sh)中添加命令,在crontab中添加一个分钟周期的定时任务

echo "* * * * * sh /export/App/bin/cpu-peak-dump.sh" 注:如果需要更细周期粒度的监控,也可以通过while true加sleep来控制运行周期,如果使用更细粒度周期时需要注意脚本本身造成的CPU使用率。

 

总结

该脚本是一个用于CPU性能监控的实用工具,通过定时检测并触发线程快照的方式,方便我们快速发现CPU异常占用以及定位问题所在。通过设置合适的阈值和线程数,可以根据具体项目的需求来应用该脚本,并根据日志记录的线程信息进行问题分析和优化。

注意:在使用该脚本时,需要根据具体环境配置相关的路径和变量,并根据项目的需要进行相应的调整和优化。

希望本文对您理解和运用该脚本提供了一些帮助,如有疑问或需要进一步了解,请随时联系我。

附录

完整的脚本文件cpu-peak-dump.sh

#!/bin/bash

# 由crontab触发每分钟执行一次,判断CPU使用率大于阈值时触发dump
# 使用方式:
# 把当前文件放到项目中与start.sh相同的目录
# 修改start.sh 在脚本最后加一行,一般是这一行后边 echo "$APP_NAME is up runnig :)"
# echo "* * * * * sh /export/App/bin/cpu-peak-dump.sh" | crontab -
# 可配置项:
# 触发dump的cpu阈值。default 70
# STACK_DUMP_CPU_THRESHOLD=xxx
# 触发dump时列举的线程数(按使用率由高到低排列) default 10
# STACK_DUMP_THREAD_COUNT=xxx
# 配置方式,使用行云分组的环境变量配置即可
# stack log 存放目录 /export/Logs/
# stack log 文件名: jstack_snapshot_$(date +%Y%m%d%H%M%S).log
# 最后,记得配置相应的日志清理策略

# 设置CPU阈值,当CPU使用率达到该阈值时触发线程快照
CPU_THRESHOLDthen
  echo "No Java process found."
  exit 1
fi

# 检查CPU使用率是否超过阈值
if [[ $CPU_USAGE -gt $CPU_THRESHOLD ]]; then

  # 使用top命令查找占用CPU最高的前十个线程,并获取它们的信息
  TOP_THREADS$JSTACK_OUTPUT_FILE

  # 获取占用CPU最高的前十个线程的信息,包括线程的PID和堆栈信息,并将它们合并到同一行输出
  echo "Top ${THREAD_COUNT} CPU占用线程信息:" $JSTACK_OUTPUT_FILE
  while read -r THREAD_INFO; do
    THREAD_TID$JSTACK_OUTPUT_FILE
    echo "线程TID: $THREAD_TID, THREAD_NID:$THREAD_NID, CPU使用率: $THREAD_CPU_USAGE%" $JSTACK_OUTPUT_FILE
    echo "$THREAD_STACK" $JSTACK_OUTPUT_FILE
  done "$TOP_THREADS"

  #  echo "====all stack as below:====" >>$JSTACK_OUTPUT_FILE
  #  echo "$JSTACK_OUTPUT" >>$JSTACK_OUTPUT_FILE
  echo "捕捉了JVM线程快照并保存到 $JSTACK_OUTPUT_FILE"
fi


作者:京东物流 张涛

来源:京东云开发者社区 自猿其说 Tech 转载请注明来源

标签:跳点,JAVA,阈值,DUMP,JSTACK,echo,线程,使用率,CPU
From: https://www.cnblogs.com/jingdongkeji/p/18000934

相关文章

  • 探索五款全球知名的JavaScript混淆加密工具
    ​现在市场上有很多好用的JavaScript混淆加密工具,其中一些比较流行且受欢迎的工具包括:1、UglifyJS(罗马尼亚):UglifyJS是一个非常流行的JavaScript工具库,它可以压缩、混淆、美化和格式化JavaScript代码。使用UglifyJS时,您可以通过调整参数来控制压缩级别并设置混淆选项。网站......
  • java直连mysql操作数据
    连接器importjava.sql.Connection;importjava.sql.DriverManager;importjava.sql.PreparedStatement;importjava.sql.ResultSet;importjava.sql.SQLException;/***@author:chenKeFeng*@date:2024/1/3010:21*/publicclassMySQLConnector{p......
  • BigInt:JavaScript 中的任意精度整数
    BigInts 是JavaScript中的一个新的数字基本(primitive)类型,可以用任意精度表示整数。使用 BigInt 可以安全地存储和操作大整数,即使这个数已经超出了 Number 能够表示的安全整数范围。umber 在JavaScript中被表示为双精度浮点数。这意味着它们的精度有限。......
  • 经验之谈——Java包装类
    目录应用场景总结wisdomJava基本类型的包装类使用都很简单,查一下就懂。我这里主要想讨论一下,为什么要用包装类?基本类型就如同人的裸手一样,直接让他去干一些危险的家务是不行的,比如进烤箱拿出盘子。但是手包上了一个隔热手套,那么就可以很轻松的去做这个事了。同理,在Java的编......
  • 每日一道Java面试题:说一说Java中的泛型?
    写在开头今天的每日一道Java面试题聊的是Java中的泛型,泛型在面试的时候偶尔会被提及,频率不是特别高,但在日后的开发工作中,却是是个高频词汇,因此,我们有必要去认真的学习它。泛型的定义什么是泛型?什么是泛型?这是个好问题,JDK5更新时带来了一个新特性-泛型,所谓“泛型”就是类型参......
  • Java中比较两个字符串==和.equals()区别
    ​在Java中,==和.equals()都是用于比较两个字符串是否相等的运算符,==比较的是两个字符串的引用地址,而.equals()比较的是两个字符串的内容。只有当两个字符串变量指向同一个字符串对象时,==和.equals()才会返回相同的结果 参考文档:Java中比较两个字符串==和.equals()区......
  • Java学习----基本语法
    1.注释有哪几种形式(1)单行注释:通常用于解释方法内某行代码的作用(2)多行注释:通常用于解释一段代码的作用(3)文档注释:通常用于生成Java开发文档2.标识符和关键字的区别(1)标识符就是一个名字(2)关键字不可以当做名字,不可修改,关键字是被赋予特殊含义的标识符3.自增(自减运算符)(1)后自增,......
  • Java的面向对象
    面向对象什么是面向对象面向对象思想:物以类聚,分类的思维方式。面向对象适合处理复杂的问题,适合处理需要多人协作的问题属性+方法=类面对象的本质:以类的方式组织代码,以对象的组织(封装)数据。三大特性:封装继承多态回顾方法及加深方法的定义:修饰符返回类型break:跳出sw......
  • Java 异常
    异常Error和ExceptionJava把异常当作对象处理,并定义一个基类java.lang.Throwable作为所有异常的超类异常类分为两大类:Error错误和Exception异常Error通常是灾难性的致命的错误,是程序无法控制和处理的,当出现这些异常时,JAVA虚拟机(JVM)一般会选择终止线程Exception通常情况下可以......
  • Java的方法详解
    Java方法详解什么是方法Java方法是语句的集合,它们在一块执行一个功能。方法是解决一类问题的步骤的有序组合方法包含于类或者对象中方法在程序中被创建,在其他地方被引用方法命名规则:驼峰原则publicclassDemo01{//main方法publicstaticvoidmain(String[]......