K8S环境的Jenkin性能问题处理

举报
程序员欣宸 发表于 2022/11/19 00:25:18 2022/11/19
【摘要】 通过helm部署的jenkins,在实际使用过程中时常出现响应变慢的问题,本文回顾了问题的分析和处理过程,希望能给您一些参考

欢迎访问我的GitHub

这里分类和汇总了欣宸的全部原创(含配套源码):https://github.com/zq2599/blog_demos

环境信息

  • 在K8S环境通过helm部署了Jenkins(namespace为helm-jenkins),用于日常Java项目构建:
  1. kubernetes:1.15
  2. jenkins:2.190.2
  3. helm版本:2.16.1

问题描述

  • 当Jenkins任务密集时,Jenkins页面响应缓慢,偶尔有白屏情况发生(稍后自动恢复),且构建速度明显变缓,此时去后台看一下环境信息:

  • K8S环境已装了metrics-server,用命令kubectl top pod --all-namespaces可以看到Jenkins所占内存仅有410兆,如下图:
    在这里插入图片描述

  • Jenkins是Java应用,在处理大量任务的时候,410兆的内存应该是不够的,JVM内存不足会导致频繁的垃圾回收,接下来顺着这个思路去看JVM内存情况;

  • 由上图可知pod名为my-jenkins-74bcdfc566-lmhnw,通过kubectl describe pod my-jenkins-74bcdfc566-lmhnw -n helm-jenkins查看此pod详情:
    在这里插入图片描述

  • 由上图红框1可知此pod运行在node3节点,红框2显示对应的docker容器ID为f9ae211abe99(前12位);

  • 去node3机器上执行docker ps,果然发现了ID为f9ae211abe99的容器,如下图:
    在这里插入图片描述

  • 执行命令docker exec f9ae211abe99 jps查看容器内所有java进程的PID,如下图,可见Jenkins服务在容器内的PID等于6:
    在这里插入图片描述

  • 知道了容器ID和java进程的PID,就可以查看JVM信息了,执行命令docker exec f9ae211abe99 jstat -gcutil 6 3s 99查看GC情况,如下图,除了YGC频繁,还出现了FGC:
    在这里插入图片描述

  • 再用命令docker exec f9ae211abe99 jmap -heap 6查看JVM内存情况,如下图,年轻代太小了,只有100兆:
    在这里插入图片描述

  • 最后用命令docker exec f9ae211abe99 ps -ef | grep java查看该进程的启动命令,如下图,可见启动该java进程时没有指定内存参数:
    在这里插入图片描述

  • 在观察的过程中,ID为f9ae211abe99的容器突然不见了,取而代之的是一个ID为7f1f94d79e46新容器,如下图所示:
    在这里插入图片描述

  • 执行命令kubectl get event -n helm-jenkins查看该命名空间的所有事件,如下图红框所示,发现原来是探针不响应迫使K8S重启该pod:
    在这里插入图片描述

  • 诊断完成,根据前面的信息可以推测:JVM内存太小,YGC频繁,甚至会有FGC出现,系统响应过慢还可能导致K8S探针判断容器不健康,引发docker容器被删除后重新创建;

  • 基于上述结果制定的应对措施:调整JVM参数,减少GC;

调整参数

  • 宿主机节点有16G物理内存,没有其他业务,因此打算划分8G内存给Jenkins;
  • 执行命令kubectl edit deployment my-jenkins -n helm-jenkins,编辑jenkins的deployment,找到JAVA_OPTS参数的位置,在下面增加value,如下图红框所示:
    在这里插入图片描述
  • 就像vi工具编辑文本文件那样操作,保存退出后,pod被重建;
  • 找到docker容器ID后,执行命令docker exec 591dc47d4d57 jmap -heap 6查看JVM内存,如下图所示,堆上限已经达到8G,年轻代是3686兆(调整前只有106兆):
    在这里插入图片描述
  • 并发执行任务一段时间后,观察GC情况发现并不频繁:
    在这里插入图片描述
  • 再来看看该进程的启动命令,执行命令docker exec 591dc47d4d57 ps -ef|grep java,如下图红框所示 ,刚才设置的内存参数已经被用在启动命令中了:
    在这里插入图片描述
  • 运行一段时间,确认任务可正常执行,页面操作也比较流畅,查看K8S事件,再也没有出现pod重启的事件;

关于修改参数的方法

  • 除了kubectl edit命令,还可以将helm的Jenkins配置信息全部下载到本地,修改后再部署Jenkins服务,如果您想了解更多,请参考《Helm部署的服务如何修改配置》

  • 至此,K8S环境下Jenkins性能问题处理已经完成,希望能给您带来一些参考;

欢迎关注华为云博客:程序员欣宸

学习路上,你不孤单,欣宸原创一路相伴…

【版权声明】本文为华为云社区用户原创内容,转载时必须标注文章的来源(华为云社区)、文章链接、文章作者等基本信息, 否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。