2020-12-28:java中,生产环境服务器变慢,如何诊断处理?

举报
福大大架构师每日一题 发表于 2020/12/28 22:31:16 2020/12/28
【摘要】 福哥答案2020-12-28:答案1:使用 top 指令,服务器中 CPU 和 内存的使用情况,-H 可以按 CPU 使用率降序,-M 内存使用率降序。排除其他进程占用过高的硬件资源,对 Java 服务造成影响。如果发现 CPU 使用过高,可以使用 top 指令查出 JVM 中占用 CPU 过高的线程,通过 jstack 找到对应的线程代码调用,排查出问题代码。如果发现内存使用率比较高,可以...

福哥答案2020-12-28:
答案1:
使用 top 指令,服务器中 CPU 和 内存的使用情况,-H 可以按 CPU 使用率降序,-M 内存使用率降序。排除其他进程占用过高的硬件资源,对 Java 服务造成影响。

如果发现 CPU 使用过高,可以使用 top 指令查出 JVM 中占用 CPU 过高的线程,通过 jstack 找到对应的线程代码调用,排查出问题代码。

如果发现内存使用率比较高,可以 dump 出 JVM 堆内存,然后借助 MAT 进行分析,查出大对象或者占用最多的对象来自哪里,为什么会长时间占用这么多;如果 dump 出的堆内存文件正常,此时可以考虑堆外内存被大量使用导致出现问题,需要借助操作系统指令 pmap 查出进程的内存分配情况、gdb dump 出具体内存信息、perf 查看本地函数调用等。

如果 CPU 和 内存使用率都很正常,那就需要进一步开启 GC 日志,分析用户线程暂停的时间、各部分内存区域 GC 次数和时间等指标,可以借助 jstat 或可视化工具 GCeasy 等,如果问题出在 GC 上面的话,考虑是否是内存不够、根据垃圾对象的特点进行参数调优、使用更适合的垃圾收集器;分析 jstack 出来的各个线程状态。如果问题实在比较隐蔽,考虑是否可以开启 jmx,使用 visualmv 等可视化工具远程监控与分析。


答案2:[答案来自此链接:](http://bbs.xiangxueketang.cn/question/904)
首先通过top命令查看服务器负载,并定位负载较高的进程。
应用响应慢,一般有几种可能:
1.线程大量积压,导致请求响应慢
解决思路,通过jstack导出线程栈,查看等待状态的线程等待的资源,比如在等待数据库连接,那么就有可能是长事务导致连接被占用、sql查询耗时过长或者连接池大小设置不合理。
2.jvm内存分配不合理,导致GC频繁
通过开启开启gc日志,查看gc频率,如果老年代空间增长过快,full gc频率过高,可能是由于新生代空间不够,对象过早晋升造成的,考虑增大jvm内存。
3.jvm GC参数设置不合理,导致GC频繁
通过gc日志看到,minor gc频繁,但是老年代空间仍然快速增长,并且每次full gc后,老年代存活对象较少,在保证足够jvm内存空间的前提下,可以适当增大新生代比例,并且调整survirorRatio参数。
4.内存泄漏,导致GC频繁,并且老年代回收效率低下
通过gc日志看到,老年代空间回收效率低下,考虑可能存在内存泄漏或者大对象未及时释放的情况,可以通过jmap导出dump文件,并通过MAT工具分析是否存在内存泄漏。
***
[评论](https://user.qzone.qq.com/3182319461/blog/1609110818)

【版权声明】本文为华为云社区用户原创内容,转载时必须标注文章的来源(华为云社区)、文章链接、文章作者等基本信息, 否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。