调优介绍
使用系统性能分析工具对目标环境的空载系统执行系统性能全景分析、进程线程分析,找到性能瓶颈点,并根据分析结果进行优化修改,从而实现系统的性能增强或降低系统资源的消耗。
组网环境
说明:本实践以TaiShan 200服务器(型号2280)+CentOS7.6组网举例,Hyper Tuner在其他鲲鹏平台和操作系统上的操作类似。
表格1 测试环境
项目 |
说明 |
服务器 |
TaiShan 200 服务器(型号2280) |
CPU |
Kunpeng 920 4826 |
OS |
CentOS 7.6 |
应用 |
系统空载情况下,不运行应用 |
性能分析工具 |
Hyper Tuner2.2.T2.SPC100 |
前提条件
1. 服务器和操作系统正常运行。
2. PC端已经安装SSH远程登录工具。
3. 目标环境上HyperTuner工具已经安装完成,并正常运行。
调优思路
1. 在进行调优之前,先用HyperTuner工具对目标环境的空载系统进行全局的系统性能分析。
2. 对全景性能分析中,有异常的指标进一步分析,并根据优化建议进行优化修改。
3. 对优化后的系统再次进行全景性能分析,验证调优后的效果。
操作步骤
系统全景分析
执行性能全景分析
1. 登录系统性能调优工具。
2. 创建工程。
3. 创建全景分析任务,配置参数如下图所示。
4. 任务分析成功后,在分析结果的“性能”页签中用列表方式查看CPU的利用率信息。
5. 依次对%usr(用户态CPU利用率)、%sys(内核态CPU利用率)、%soft(软中断CPU利用率)等指标进行排序,找出控制状态下,CPU利用率较高的指标。
经过排序发现,在128核的空载系统上,有12个核的软中断占用率均达到96%以上,整体占128核的9.27%,说明该空载系统上存在软中断的性能问题。
性能瓶颈分析
在性能全景分析的结果中,发现有12个核的软中断占用率在96%以上,整体占CPU(128核)利用率的9.27%,但目前系统是空载状态,没有运行其他应用,所以系统存在软中断的性能问题。
但目前仅仅通过全景分析,定位不到具体是哪一个进程发生了软中断,定位不到性能的瓶颈点。所以需要进步执行进程线程分析任务,定位出具体是那些进行或线程发生了软中断。
执行进程线程分析
1. 创建进程线程分析任务,配置参数如下所示。
2. 任务分析成功后,查看分析结果。
从分析结果中可以看到有12个ksoftirqd进程的CPU的占用率在99%以上。
性能瓶颈分析和优化
分析12个ksoftirqd进程对应的内核空间占用率均为99%以上,远超基准值,提示建议为:“检查网络或驱动器堆栈是否存在瓶颈。“
所以初步判断是应该是TaiShan服务器的SP580(IN200)网卡驱动问题,可以尝试通过安装或升级高版本网卡驱动解决问题。
安装SP580网卡驱动步骤如下:
1. 下载网卡驱动包。
下载地址:https://support.huawei.com/enterprise/zh/software/250631875-ESW2000134264
2. 上传网卡驱动包软件并解压。
driver为kmod驱动存放目录,本次选择driver/linux/nic/CentOS7.6_arm/kmod-hinic-2.3.2.1_4.14.0_115-1.el7.aarch64.rpm
firmware为网卡固件存放目录
tools为hinicadm网卡工具目录
在安装驱动时,根据实际情况选择配套的工具和驱动包。
3. 安装网卡工具hinicadm
执行rpm –ivh tools/linux_arm/nic/hinicadm-2.3.2.1-1.aarch64.rpm命令,显示如下信息表示网卡工具安装成功。
4. 卸载自带网卡驱动包
rmmod hinic
5. 安装网卡驱动包
进入驱动包路径driver/linux/nic/CentOS7.6_arm/,执行如下命令安装网卡驱动。
rpm -ivh kmod-hinic-2.3.2.1_4.14.0_115-1.el7.aarch64.rpm
显示如下信息表示网卡安装成功
6. 加载驱动包
modprobe hinic
7. 查看驱动版本信息
执行hinicadm version -i hinic0命令,查看驱动版本信息。
重新执行性能分析
重启全景分析任务,查看%soft指标已经降到0%,释放了被ksoftirqd占用的12个核,资源消耗降低9.27%
调优结果分析
本实践中,通过对TaiShan上CentOS7.6空载系统全景分析,发现有性能问题后,经过进程线程分析进步一步定位问题的瓶颈点,并通过安装高版本网卡驱动后,解决软中断问题,降低系统整体资源消耗。
在进行其他TaiShan+CentOS7.6上的应用调优之前,可以参考本实践,对系统进行整体的性能分析,降低不必要的资源消耗。