首页 > 系统相关 >记录一则exachk进程占用大量CPU资源

记录一则exachk进程占用大量CPU资源

时间:2023-01-17 13:00:20浏览次数:48  
标签:exachk 占用 tfa init kill 进程 CPU

有Exadata客户在进行exachk巡检之后反馈,发现系统中,exachk进程占用了大量CPU资源。
了解之前的变更,只是巡检之前升级了AHF,然后进行标准的exachk巡检。

现象:

目前机器整体CPU使用率是20%+,但被使用到的具体CPU core基本都是满负荷,都是这些exachk进程,这些进程初步判断的确是有异常,正常不会运行这么久都不结束。

解决:

尝试方案1:

首先,依据 文档 How to disable TFA autostart on Exadata (Doc ID 2516169.1)

# /etc/init.d/init.tfa shutdown
# /etc/init.d/init.tfa disable

关闭了tfa服务之后,发现进程依然存在。

尝试方案2:

可以尝试正常停止,先启动tfa,使用tfactl尝试将exachk进程停止:

/etc/init.d/init.tfa enable
/etc/init.d/init.tfa start
tfactl stop exachk

验证进程是否停止成功:

ps -ef|grep exachk

发现进程依然存在。

尝试方案3:

没办法,只能采用强行kill的方式,反复确认需要kill的进程PID信息,均是exachk,然后进行kill:

kill -9 xxxxxx
kill -9 xxxxxx
...

这样就完成 kill 所有异常exachk进程,CPU使用率也随之恢复正常。

目前tfa服务也保持启动状态,为了后续再观察,如有问题复现再具体分析。

总结:

针对异常的进程可以kill,但是需反复确保要操作kill的进程完全不会影响到正常生产运行。

标签:exachk,占用,tfa,init,kill,进程,CPU
From: https://www.cnblogs.com/jyzhao/p/17057563.html

相关文章

  • 闻其声而知雅意,基于Pytorch(mps/cpu/cuda)的人工智能AI本地语音识别库Whisper(Python
    前文回溯,之前一篇:含辞未吐,声若幽兰,史上最强免费人工智能AI语音合成TTS服务微软Azure(Python3.10接入),利用AI技术将文本合成语音,现在反过来,利用开源库Whisper再将语音转回......
  • CPU持续100%分析并解决
    背景接到客户电话,说某系统数据库服务器CPU利用率从上午8点开始到现在基本上都是100%的情况,影响到了业务。让给看看是什么原因导致的,怎么紧急处理一下。现象查看CPU利用率,确......
  • Windows使用命令行查看cpu的温度
    使用PowerShell(cmd命令行不行的),以管理员身份打开,$temp=gwmimsacpi_thermalzonetemperature-namespace"root/wmi"$temp.CriticalTripPoint/10-273.15#预警温度$te......
  • 刺激,线程池的一个BUG直接把CPU干到100%了。
    你好呀,我是歪歪。给大家分享一个关于ScheduledExecutorService线程池的BUG啊,这个BUG能直接把CPU给飚到100%,希望大家永远踩不到。但是,u1s1,一般来说也很难踩到。......
  • JobsUtility导致CPU过高问题
    UnityPlayer.dll新版加入了Jobs系统,以前是用户使用lib_burst也就是JobsUtility直接使用容易出现CPU过高问题Unity系统使用多个线程,线程数=CPU核心-1,代码不好容易......
  • 26 | Superscalar和VLIW:如何让CPU的吞吐率超过1
    到今天为止,专栏已经过半了。过去的20多讲里,我给你讲的内容,很多都是围绕着怎么提升CPU的性能这个问题展开的。第4讲程序的CPU执行时间=指令数×CPI×......
  • 18 | 建立数据通路(中):指令+运算=CPU
    组合逻辑电路但是,光有组合逻辑电路是不够的。你可以想一下,如果只有组合逻辑电路,我们的CPU会是什么样的?电路输入是确定的,对应的输出自然也就确定了。那么,我们要进行不......
  • 19 | 建立数据通路(下):指令+运算=CPU
    上一讲,我们讲解了时钟信号是怎么实现的,以及怎么利用这个时钟信号,来控制数据的读写,可以使得我们能把需要的数据“存储”下来。那么,这一讲,我们要让计算机“自动”跑起来。......
  • 使用cgroup限制CPU核数
    在性能测试的时候,有的时候需要限制CPU为指定核数,我们很容易想到docker,其实还可以通过cgroup来实现。关于cgroupcgroups全称controlgroups,是Linux内核提供的物理资源隔......
  • CPU中断
    什么是中断假设你在玩王者荣耀,突然一个电话过来…,这就是​​中断​​!对CPU来说就是:CPU在执行某一段程序的时候收到某些特定信号转而去执行另一段特定程序的过程。那为......