CPU 100%问题排查总结

举报
程序员进阶 发表于 2024/11/11 22:55:23 2024/11/11
【摘要】 排查思路【1】定位高负载进程 pid:登录进服务器使用top或top -c命令[ps -ef | grep xxx 命令]查看当前CPU消耗过高的进程,从而得到进程id。观察各个进程资源使用情况,可以看出进程id为18571的进程,有着较高的CPU占比。按P(大写)可以倒序查看占CPU占用率。【定位具体的异常业务】:使用pwdx pid命令[查看当前pid进程启动时的工作目录]根据pid找...

排查思路

【1】定位高负载进程 pid:登录进服务器使用toptop -c命令[ps -ef | grep xxx 命令]查看当前CPU消耗过高的进程,从而得到进程id。观察各个进程资源使用情况,可以看出进程id为18571的进程,有着较高的CPU占比。按P(大写)可以倒序查看占CPU占用率。

image.png

【定位具体的异常业务】:使用pwdx pid命令[查看当前pid进程启动时的工作目录]根据pid找到业务进程路径,进而定位到负责人和项目。

【2】根据Pid查出消耗cpu最高的线程号:top -Hp 18571,按下P,进程按照Cpu使用率排序。找出最耗Cpu的线程,结果发现18584是就耗了99.9%。一般超过80%就是比较高的,80%左右是合理情况。这样我们就能得到CPU消耗比较高的线程id

image.png

【将十进制转化为十六进制】:printf "0x%x\n" 18584

[root@mysql ~]# printf "0x%x\n" 18584
0x4898

【3】根据线程号查出对应的java线程:jstack 18571 | vim +/0x4898 -查看线程的堆栈信息。也可以通过 jstack -l 18571 > ./18571.stack 将线程的信息导出到 18571.statck 文件。然后执行grep命令,看线程0x4898 做了什么 。cat 18571.stack | grep '0x4898' -C 8 查看文件中线程的堆栈信息。这里我们就可以区分导致CPU过高的原因具体是Full GC次数过多还是代码中有比较耗时的计算了。如果是Full GC次数过多,那么通过jstack得到的线程信息会是类似于VM Thread之类的线程,而如果是代码中有比较耗时的计算,那么我们得到的就是一个线程的具体堆栈信息如下:

image.png

【版权声明】本文为华为云社区用户原创内容,未经允许不得转载,如需转载请自行联系原作者进行授权。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。