首页 > 其他分享 >点了下详情系统,CPU 100%。。。

点了下详情系统,CPU 100%。。。

时间:2023-09-04 09:56:13浏览次数:38  
标签:pid 系统 接口 GC 详情 线程 100 CPU

作者:玛奇玛
链接:https://juejin.cn/post/7233307834456129593

又是一个百无聊赖的早晨,我在快乐地摸鱼,工作群响了:离线系统登录不上了。我第一反应是不科学啊,系统已经很久改动过了...赶紧上生产环境看看,CPU高达1200%。接着又是熟练地敲出那几行排查CPU过高的命令:

top -H -p  pid 查看java占用率最高的几条线程
jstack pid >  xxx.txt   打印线程快照
jmap -heap pid   查看堆内存情况

推荐一个开源免费的 Spring Boot 实战项目:

https://github.com/javastacks/spring-boot-best-practice

看这玩意啥都看不出来,感觉是系统对象没有释放,在疯狂GC,但是因为FULL GC的时候已经STW了,所以无法查看到底是哪个线程出了问题。然后过了10分钟系统突然又好了....堵塞的操作已经完成,gc能正常回收了。 然后过了两分钟又卡死了,我先重启了系统,后面再分析分析。

等系统没什么人用的时候,我再试着重现一下问题,打开系统一顿乱点,结果是点开某个功能的详情时系统卡住了,CPU又飚上去了,喜闻乐见~问题定位到了,再实锤一下之前是不是这个问题,我看了一下localhost_access_log日志发现,确实是这个接口卡了一千多秒。

因为离线没什么人使用,所以问题过了很久再暴露出来,看了一下代码,主要是业务逻辑问题,有个参数没传进去,导致sql要查很久,查到了几百万的数据,gc也无法回收。

复盘

一开始我以为是某个接口调了很多次并发太高导致的,没想到点一下详情系统就挂了。。我们可以看到CPU在GC回收的时候STW,是没有线程能占用到CPU的,所以top -H -p pid 只能看到CPU全被GC线程占用了。如果是某个接口并发太高导致的,我们可以看jstack线程快照,里面是会有这个接口在执行的记录。

还有一个问题就是说系统GC卡了10-20分钟,却没有报OOM,还是一直在堵塞状态,后面还正常了一小会,这个是需要看堆内存的情况..因为比较难排查所以只是通过现象知道GC还是可以回收一点点垃圾的

总结

1、CPU100%的时候可以打印线程快照jstack pid,查看是哪个线程占用了CPU,一般都是某个业务线程阻塞无法进行GC回收导致。

2、可以查看localhost_access_log查看系统接口用时,一般用时很久的都是有问题的接口。

3、记得看业务代码参数有没有漏传,如果漏传参数可能会导致全表扫描直接卡死系统。

近期热文推荐:

1.1,000+ 道 Java面试题及答案整理(2022最新版)

2.劲爆!Java 协程要来了。。。

3.Spring Boot 2.x 教程,太全了!

4.别再写满屏的爆爆爆炸类了,试试装饰器模式,这才是优雅的方式!!

5.《Java开发手册(嵩山版)》最新发布,速速下载!

觉得不错,别忘了随手点赞+转发哦!

标签:pid,系统,接口,GC,详情,线程,100,CPU
From: https://www.cnblogs.com/javastack/p/17676149.html

相关文章

  • CPU执行程序的过程
    CPU执行程序的过程目录CPU执行程序的过程前言/基础知识为了更好的分析程序的执行过程,我们还需要了解一下基础的计算机硬件信息在执行指令前,我们还需要认识一下CPU中的重要部件:寄存器。特殊寄存器StackPointerregister(SP)LinkRegister(LR)ProgramCounter(PC)WordZeroRegister(W......
  • CPU扫盲
    CPU扫盲目录CPU扫盲指令集指令集概念指令集架构CPU和指令集的关系CPU如何执行指令以及流水线技术指令系统组成地址空间操作数指令操作和编码CPU如何执行一条指令CPU如何执行多条指令RISC-V指令集架构寄存器RSIC-V32I寄存器说明RAISC指令比较指令格式比较寻址方式比较公共指令功......
  • linux查看平均cpu占用率
    如果想要获取平均占用率,可以在top命令后添加"-d"参数,指定刷新时间间隔(单位为秒),例如top-d1这样会每隔1秒更新一次CPU的占用率信息。请注意,top命令会实时显示系统状态,您可以按下键盘上的"q"来退出top命令。......
  • 东方博宜OJ1009 数组逆序 C语言版
    题目描述给你 n 个整数,将其逆序输出。输入第一行一个整数 n (3≤n≤100)代表数的个数。第二行 n 个整数(空格隔开)(这些数在 0∼106 之间)。输出n 个整数(空格隔开)。样例输入3175输出571来源数组问题代码 #include<stdio.h>in......
  • AP100N75 场效应MOS 100V75A低内阻 N沟道MOS管SGT DFN5×6
    Features 100V,75ARDS(ON)<9.2mΩ@VGS=10VRDS(ON)<13.5mΩ@VGS=4.5V AdvancedSplitGateTrenchTechnology ExcellentRDS(ON)andLowGateCharge LeadfreeproductisacquiredApplication LoadSwitch PWMApplication Powermanagement100%UISTESTED!1......
  • 东方博宜OJ1007 统计大写字母的个数 C语言版
    题目描述算算以'.'结束的一串字符中含有多少个大写的英文字母。输入输入一串字符(长度不超过 8080 ),以'.'结束。输出输出一行,即这串字符中大写字母的个数。样例输入PRC,PRC,I'mfromChina.输出8来源字符串代码#include<stdio.h>intm......
  • 东方博宜OJ1000 熟悉一下Online Judge的环境 C语言版
    题目描述请不要笑。用来适应环境的题目,自然比较简单些。计算 22个整数的和,这两个整数都在 11到 100之间。输入输入只有一行,包括 22 个整数 a , b ,之间用一个空格分开。输出输出只有一行,包括 11 个整数。样例输入12输出3说明使用O......
  • 东方博宜OJ1002 编程求解1+2+3+...+n C语言版
    题目描述编程求解下列式子的值:n=1+2+3+⋯+n。输入输入一行,只有一个整数n(1≤n≤1000) 。输出输出只有一行(这意味着末尾有一个回车符号),包括 1 个整数。样例输入100输出5050来源简单循环代码  ......
  • 东方博宜OJ1003 - 编程求1+3+5+...+n C语言版
    题目描述编程求 1+3+5+⋯+n 。输入输入一行,只有一个整数 )n(1≤n<10000) 这里 n 为奇数。输出输出只有一行。样例输入99输出2500来源简单循环代码  ......
  • 东方博宜OJ1004 编程求1*2*3*...*n C语言版
    题目描述编程求 1×2×3×⋯×n 。输入输入一行,只有一个整数 n(1≤n≤10);输出输出只有一行(这意味着末尾有一个回车符号),包括 11 个整数。样例输入5输出120来源简单循环代码  ......