- 微信
- 微博
  
  分享文章到微博
- 复制链接
  
  复制链接到剪贴板

内核不躺平，系统才高效：openEuler 内核性能分析的那些事儿【华为根技术】

Echo_Wish 发表于 2025/05/17 20:05:28 2025/05/17

【摘要】内核不躺平，系统才高效：openEuler 内核性能分析的那些事儿

内核不躺平，系统才高效：openEuler 内核性能分析的那些事儿

一、说在前面：别再“拍脑袋优化”了

说句心里话，在我入坑 openEuler 的第一个月里，最痛苦的事不是不会写脚本，不是不会调参数，而是——性能问题来了，完全不知道从哪下手。

服务慢，是 CPU 问题还是 I/O 问题？
内存飙升，是泄露了还是缓存太猛了？
top、htop 看了一堆，CPU 占用飘忽不定，内核态还占一堆，怎么分析，怎么解决，完全是“靠感觉走”。

后来我才发现，性能调优不是拍脑袋，是讲究“证据链”的技术活。

而 **openEuler 这套国产根正苗红的操作系统，早就给我们准备了一整套“内核分析工具箱”。**今天，咱就好好聊聊——怎么用 openEuler 的利器，搞定内核性能瓶颈！

二、先认清战场：什么叫“内核性能”？

我们常说的“系统性能”大概分三层：

应用层（进程调度、内存占用）
系统调用层（libc、系统调用开销）
内核层（I/O、进程切换、中断、调度器、锁竞争）

大多数人只盯着应用层卡顿，却忽视了内核层才是真正的“水下冰山”。

举个简单的例子：你某个服务“偶尔卡顿”，怀疑是“网络慢”导致。结果一分析发现，是内核在处理网卡中断时 CPU 占用爆炸，调度延迟太大，导致包丢了。

这就说明，我们得下潜到内核，才能抓住真凶！

三、openEuler 自带的性能神器都有哪些？

openEuler 社区非常给力，为我们集成了大量可用于内核性能分析的工具，下面挑几个实战常用的讲讲。

1）`perf`：Linux 原生的内核性能分析刀锋

perf top

实时看哪个函数（包括内核函数）最耗资源。

perf record -g ./your_program
perf report

配合火焰图，就能看到函数调用路径的性能瓶颈。

特别注意：openEuler 默认启用了 CONFIG_FRAME_POINTER，这让 perf 可以准确采样内核函数栈，很良心。

2）`ftrace`：内核的“摄像头”

这是 Linux 内核自带的 trace 工具，openEuler 已经集成好，我们直接用：

echo function > /sys/kernel/debug/tracing/current_tracer
echo 'do_sys_openat2' > /sys/kernel/debug/tracing/set_ftrace_filter
cat /sys/kernel/debug/tracing/trace

比如上面这个例子可以追踪文件打开的内核调用，非常适合定位慢系统调用、频繁 context switch、锁竞争等问题。

3）`bcc` 和 `bpftrace`：现代内核观测“望远镜”

如果你想实现更高级的定制 trace，比如：

跟踪哪些 PID 调用了某个内核函数？
查看哪段时间锁竞争最激烈？

就得用 bcc 或者 bpftrace 了，openEuler 的 BPF 支持也是全套开箱即用。

比如这个经典的 runqlat 工具，用来分析进程排队时间分布：

runqlat 1

再比如用 bpftrace 看某个内核函数被谁调用最多：

bpftrace -e 'kprobe:do_sys_openat2 { @[comm] = count(); }'

4）`tuned + tuna`：软硬调优组合拳

openEuler 集成了 tuned 服务，你可以选择：

tuned-adm profile latency-performance

或者自己用 tuna 把中断绑到某些核上，减少 cache 抖动和核间干扰。

tuna -t irq -c 3-4 --move

这一套用得好，能把你 CPU 使用率稳定性提升一个档次。

四、实战案例：某网关服务 CPU 飙高

某次客户反馈：“一个流量网关程序 CPU 时不时飙升，影响转发。”

调查步骤：

perf top：看到内核函数 net_rx_action 占比非常高
ethtool -S eth0：发现丢包率很高，中断风暴导致的
绑核优化：

tuna -t irq -c 4 --move

关闭 CPU C-state 深度休眠，避免唤醒延迟

echo 1 > /sys/devices/system/cpu/intel_pstate/no_turbo

结果：CPU 占用下降 30%，系统延迟显著下降

五、性能分析，不只是工具，更是思维

很多朋友一说起“性能调优”就想着调 sysctl.conf、加 ulimit、改 swappiness，其实这些都只是表象。

真正的内核性能优化，核心是：

定位瓶颈 → 建立数据链 → 精准干预 → 实时验证

openEuler 提供了一整套完整链条的工具和接口，能让你从“凭感觉拍脑袋”进化成“数据驱动下刀”。

六、我对 openEuler 的一些个人看法

讲真，作为一个长期用 Ubuntu、CentOS、RHEL 的老用户，我刚接触 openEuler 时，是带着怀疑的。

但深入调研后，我发现：

它的内核调优接口 不仅齐全，而且文档超接地气
BPF 子系统开箱即用，开发体验比 Ubuntu 更现代化
很多高频使用的 trace 工具、火焰图脚本，社区都做了本地化封装

尤其是当你想搞一些“系统级性能实验”的时候，openEuler 的兼容性、包依赖清晰程度，真的让我安心很多。

七、结语：别让内核的“黑盒”耽误你的系统表现

性能问题，不是优化那两个 for 循环就能解决的。底层问题、从根查起、从证据出发，是每一个 DevOps / 运维 / 平台工程师都该具备的基本素养。

【声明】本内容来自华为云开发者社区博主，不代表华为云及华为云开发者社区的观点和立场。转载时必须标注文章的来源（华为云社区）、文章链接、文章作者等基本信息，否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容，欢迎发送邮件进行举报，并提供相关证据，一经查实，本社区将立刻删除涉嫌侵权内容，举报邮箱： cloudbbs@huaweicloud.com

点赞
收藏
关注作者

0/1000

抱歉，系统识别当前为高风险访问，暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称，即可参与社区互动！

*长度不超过10个汉字或20个英文字符，设置后3个月内不可修改。

确认取消

加入云驻计划，成为创作者

华为云周边好礼
免费体验产品
特殊身份标识
线下官方门票
内部专家零距离
与10000+优质创作者共同成长

立即加入

内核不躺平，系统才高效：openEuler 内核性能分析的那些事儿【华为根技术】

内核不躺平，系统才高效：openEuler 内核性能分析的那些事儿

一、说在前面：别再“拍脑袋优化”了

二、先认清战场：什么叫“内核性能”？

三、openEuler 自带的性能神器都有哪些？

1）`perf`：Linux 原生的内核性能分析刀锋

2）`ftrace`：内核的“摄像头”

3）`bcc` 和 `bpftrace`：现代内核观测“望远镜”

4）`tuned + tuna`：软硬调优组合拳

四、实战案例：某网关服务 CPU 飙高

调查步骤：

五、性能分析，不只是工具，更是思维

六、我对 openEuler 的一些个人看法

七、结语：别让内核的“黑盒”耽误你的系统表现

全部回复

设置昵称

关于作者

目录

加入云驻计划，成为创作者

内核不躺平，系统才高效：openEuler 内核性能分析的那些事儿【华为根技术】

内核不躺平，系统才高效：openEuler 内核性能分析的那些事儿

一、说在前面：别再“拍脑袋优化”了

二、先认清战场：什么叫“内核性能”？

三、openEuler 自带的性能神器都有哪些？

1）perf：Linux 原生的内核性能分析刀锋

2）ftrace：内核的“摄像头”

3）bcc 和 bpftrace：现代内核观测“望远镜”

4）tuned + tuna：软硬调优组合拳

四、实战案例：某网关服务 CPU 飙高

调查步骤：

五、性能分析，不只是工具，更是思维

六、我对 openEuler 的一些个人看法

七、结语：别让内核的“黑盒”耽误你的系统表现

全部回复

设置昵称

关于作者

目录

热门推荐查看更多

相关文章

加入云驻计划，成为创作者

相关产品

1）`perf`：Linux 原生的内核性能分析刀锋

2）`ftrace`：内核的“摄像头”

3）`bcc` 和 `bpftrace`：现代内核观测“望远镜”

4）`tuned + tuna`：软硬调优组合拳