- 微信
- 微博
  
  分享文章到微博
- 复制链接
  
  复制链接到剪贴板

卡在哪儿就戳哪儿！——鸿蒙系统性能监控与调优，从 HiTrace 到 HiPerf 的实战路线图！

喵手发表于 2025/10/31 17:15:40 2025/10/31

【摘要】开篇语哈喽，各位小伙伴们，你们好呀，我是喵手。运营社区：C站/掘金/腾讯云/阿里云/华为云/51CTO；欢迎大家常来逛逛今天我要给大家分享一些自己日常学习到的一些知识点，并以文字的形式跟大家一起交流，互相学习，一个人虽可以走的更快，但一群人可以走的更远。我是一名后端开发爱好者，工作日常接触到最多的就是Java语言啦，所以我都尽量抽业余时间把自己所学到所会的，通过文章的形式进行输出，...

开篇语

哈喽，各位小伙伴们，你们好呀，我是喵手。运营社区：C站/掘金/腾讯云/阿里云/华为云/51CTO；欢迎大家常来逛逛

今天我要给大家分享一些自己日常学习到的一些知识点，并以文字的形式跟大家一起交流，互相学习，一个人虽可以走的更快，但一群人可以走的更远。

我是一名后端开发爱好者，工作日常接触到最多的就是Java语言啦，所以我都尽量抽业余时间把自己所学到所会的，通过文章的形式进行输出，希望以这种方式帮助到更多的初学者或者想入门的小伙伴们，同时也能对自己的技术进行沉淀，加以复盘，查缺补漏。

小伙伴们在批阅的过程中，如果觉得文章不错，欢迎点赞、收藏、关注哦。三连即是对作者我写作道路上最好的鼓励与支持！

前言

应用卡顿、耗电飙升、内存咕噜咕噜上涨？别急着“感觉对了就上线”。鸿蒙（HarmonyOS / OpenHarmony）给了我们一整套观测 + 诊断 + 优化的工具链：HiTrace/Bytrace 把系统通路“拉成谱”、HiPerf 把 CPU 热点“点成图”、DevEco Profiler 盯住内存/线程/网络、再配Hilog/HiviewDFX做日志与故障归档。本文给你一条可复用的调优 SOP：先度量、再定位、后优化，最后用案例把闭环跑通。

01｜工具速览：谁负责“看”、谁负责“查”、谁负责“证据链”
02｜HiTrace / Bytrace 入门到上手：把关键路径“画出来”
03｜HiPerf“画像”CPU：采样、火焰图、热点判读
04｜内存与 CPU 优化清单（ArkUI/ArkTS & 服务侧）
05｜实操攻略：从 60FPS 掉到 25FPS 的“列表页卡顿”修复记
06｜一站式调优 SOP（可打印版）
结语：性能不是玄学，是一套可复用的流程

01｜工具速览：看清—锁定—证据链

工具	作用	典型场景	你会拿到什么
HiTrace / Bytrace	系统级时间线追踪（调度、I/O、绘制、Binder/IPC、渲染等）	首屏慢、滑动掉帧、跨进程调用慢	带时序的 trace 文件，可在 DevEco/trace viewer 里看关键通道耗时
HiPerf	采样型 CPU 分析（perf 风格），支持用户/内核栈	CPU 占用高、掉帧、UI 卡顿	火焰图/热点函数占比，帮助确认“谁在烧 CPU”
DevEco Studio Profiler	内存/对象、线程、网络、帧率、GPU	内存涨、频繁 GC、网络尖峰	实时曲线 + 堆快照（泄漏对象路径）
Hilog / HiviewDFX	结构化日志、崩溃/卡死/ANR 归档	线上问题定位	带 tag/级别的日志与故障包
FaultLogger / dump 工具	发生崩溃时导出上下文	罕见/线上仅复现一次	栈回溯、寄存器、so 版本

小贴士：HiTrace 更像“航拍全局”，HiPerf 是“微距看 CPU”。先全景，后特写，优先排除“非你代码”的瓶颈（调度/IO/渲染队列），再进函数级分析。

02｜HiTrace / Bytrace：把关键路径“画出来”

2.1 代码里埋“可视锚点”（HiTrace 标记）

ArkTS/TS（API 名称以你 SDK 版本为准，常见形态是 @ohos.hiTraceMeter 或类似能力）

import hiTrace from '@ohos.hiTraceMeter'  // 以实际包名为准

function renderFeedOnce() {
  const tid = hiTrace.startTrace('FeedRender',  // tag
                                 0x01 /*flags*/, 
                                 3000 /*timeoutMs 可选*/)

  // 关键阶段打点
  hiTrace.count('FeedRender.inflate', 1)   // 布局阶段
  // ... inflate 视图
  hiTrace.count('FeedRender.bind', 1)      // 数据绑定
  // ... 绑定数据
  hiTrace.finishTrace(tid)                 // 别忘了收尾
}

为什么要自己打点？
系统 trace 渠道很多（调度、gfx、ipc…），你的业务阶段名能让瀑布图好读 10 倍：布局、数据、渲染、网络归一到统一词表，团队对齐。

2.2 抓系统级 trace（Bytrace/命令行）

以设备/模拟器运行示例，实际命令可能存在细微差别。

# 1) 拉起采集 5 秒，关注调度/图形/视图/IPC 通道
bytrace -c -t 5 gfx view sched binder freq idle workq disk

# 2) 或者 DevEco Studio 里用“System Trace”一键采集，更友好

打开 trace viewer 你能看到：

主线程（UI）帧时间：是否 > 16.6ms（60Hz）或 > 8.3ms（120Hz）；
Choreographer/RenderThread 类似分工（ArkUI 渲染通道）；
IPC/Binder 槽点：谁在阻塞；
你的 HiTrace 标记：FeedRender.inflate/bind/... 穿插在系统轨道中，定位“长板/短板”。

判读要点

若每帧都被 某固定子阶段顶住（比如 bind），优先进入 CPU 级分析（HiPerf）。
若是 偶发高峰，看看同时间段是否有 GC/磁盘/网络 尖峰或 主线程被其他 IPC 占用。

03｜HiPerf：CPU 热点“画像”（火焰图好朋友）

3.1 采样与报告（命令行）

# 获取目标进程 pid
pidof com.demo.app

# 采样 15 秒，记录调用栈（-g），输出到 perf.data
hiperf record -p <PID> -g -f perf.data -d 15

# 生成文本报告（按占比排序）
hiperf report -i perf.data --sort period,dso,symbol | head -n 50

# 生成可视化（若支持导出火焰图原始栈）
hiperf report -i perf.data --call-graph > stacks.folded
# 借助 FlameGraph 脚本（本地）生成 SVG
flamegraph.pl stacks.folded > flame.svg

读火焰图的小诀窍

越上层越“调用者”，越底部越“被调者”；横向宽度 = CPU 时间占比。
主线程热点是 JSON 解析/图像解码/字符串拼接？那就要么移动到工作线程，要么降复杂度/缓存。
热点在 锁等待/互斥？看看有没有把 UI 线程阻塞在临界区。

04｜内存与 CPU 优化清单（ArkUI/服务侧通吃）

4.1 内存（ArkUI/ArkTS）

避免在 build() 里做副作用：网络/IO/昂贵计算一律移到 aboutToAppear() 或后台任务。
订阅要解绑：DataShare/事件总线/定时器在 aboutToDisappear() 清理，否则泄漏 + 重复回调。
长列表：List/LazyForEach + 稳定 key + cachedCount；行内避免创建大对象。
图片：按需解码（目标尺寸），滚动时降级质量，停稳后替换高清；启用占位骨架。
对象池：复用临时对象（尤其是频繁创建的格式化对象）。
堆快照：用 Profiler 抓泄漏，沿 引用链找到“最后持有者”。

4.2 CPU（UI/服务侧）

主线程只管“拍板”：布局/动画/轻计算；重活→工作线程/PA。
节流/防抖：拖拽、滚动、输入事件；节流周期 16ms 左右与帧同步。
字符串/JSON 热路优化：预分配 buffer、使用原生序列化、避免级联 replace/split。
算法与数据结构：热点路径避免 O(n²)；能用 Map/索引就别线性扫。
锁与临界区：细化锁粒度；读多写少用 RWLock；避免 UI 线程跨锁等待。
JIT/解释边界：热路径尽量用稳定 API，减少动态反射/代理成本。

05｜实操案例：“列表页掉到 25FPS”怎么救？

现象：瀑布流列表快速滑动卡顿，CPU 飙升，偶发掉帧到 25FPS。

Step 1：抓系统 trace（Bytrace + 自埋 HiTrace）

看到每帧的 FeedRender.bind 阶段占 10~~14ms，再叠加 图片解码 6~~10ms → 总帧时长 20ms+，掉帧。

Step 2：HiPerf 锁定热点

Hotspot 1：formatPrice()、joinTags() 等字符串处理占比 18%。
Hotspot 2：图片 decode 占 22%，且在主线程。

Step 3：改造与验证

数据预处理前移：在数据到达时（PA/数据层）把 formatPrice/joinTags 处理好，UI 只展示。
图片异步：滚动时加载 缩略图（小尺寸），停住后异步替换高清。
品类标签缓存：为常见组合建立 LRU 缓存。
ArkUI 结构：行组件稳定 key，减少重建；build() 只拼 UI。

Step 4：复测 & 回归

Bytrace：bind 降到 3~~5ms，图片解码不在主线程；总帧时长回到 10~~13ms，>60FPS。
HiPerf 热点：字符串处理降到 4% 内，CPU 总占用下降约 30%。
Profiler：GC 次数降低，堆高更平滑。

06｜一站式调优 SOP（可打印）

A. 立案（复现 & 度量）

录屏 + 设备型号/OS 版本/帧率；
Bytrace：抓 5–10 秒系统 trace（含你自埋的 HiTrace）；
Profiler：内存/线程/网络曲线，抓一次堆快照。

B. 初判（归类）

主线程被谁占？（布局/绑定/解码/IPC/锁）
是否伴随 GC/磁盘/网络尖峰？
渲染线程是否饱和？

C. 放大镜（HiPerf/堆快照）

hiperf record -p <pid> -g -d 15 → 报告/火焰图；
堆快照看大对象/泄漏路径；
把怀疑函数列成清单。

D. 手术（优化策略）

UI：轻 build、稳定 key、Lazy 列表、异步图片；
CPU：预处理、缓存、批处理、降维（O(n²)→O(nlogn)）；
内存：生命周期管理、解绑订阅、复用缓冲；
线程：把重活放工作线程/PA，避免主线程锁等待。

E. 验收（回归与守护）

重跑 Bytrace/HiPerf，对比前后量化指标；
加入 基准测试 与 CI 性能阈值（如首屏 < 800ms、滑动掉帧率 < 1%）；
上线后用 HiviewDFX 指标 + 日志守护回归。

结语：性能是文化，更是流程

当你习惯了“HiTrace 看通路、HiPerf 看热点、Profiler 看堆/线程、Hilog 看证据”，团队就有了共同语言：先测后改，先证据后判断。把本文 SOP 贴到项目 wiki，给页面/模块设定“性能门禁”，你会发现——卡顿不再靠玄学，是工程问题。😉

附：常用命令/片段速查（收藏）

# Bytrace 5 秒多通道
bytrace -c -t 5 gfx view sched binder freq idle workq disk

# HiPerf 采样 15 秒（带调用栈）
hiperf record -p <PID> -g -f perf.data -d 15
hiperf report -i perf.data --sort period,dso,symbol | head -n 50

# （可选）火焰图
hiperf report -i perf.data --call-graph > stacks.folded
flamegraph.pl stacks.folded > flame.svg

ArkTS：HiTrace 标记模板

import hiTrace from '@ohos.hiTraceMeter'

export function traced<T>(name: string, fn: () => T): T {
  const id = hiTrace.startTrace(name, 0x1)
  try { return fn() } finally { hiTrace.finishTrace(id) }
}

// 使用
traced('FeedRender.bind', () => {
  // 绑定数据，禁止放重 IO
})

… …

文末

好啦，以上就是我这期的全部内容，如果有任何疑问，欢迎下方留言哦，咱们下期见。

… …

学习不分先后，知识不分多少；事无巨细，当以虚心求教；三人行，必有我师焉！！！

wished for you successed ！！！

⭐️若喜欢我，就请关注我叭。

⭐️若对您有用，就请点赞叭。
⭐️若有疑问，就请评论留言告诉我叭。

版权声明：本文由作者原创，转载请注明出处，谢谢支持！

【声明】本内容来自华为云开发者社区博主，不代表华为云及华为云开发者社区的观点和立场。转载时必须标注文章的来源（华为云社区）、文章链接、文章作者等基本信息，否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容，欢迎发送邮件进行举报，并提供相关证据，一经查实，本社区将立刻删除涉嫌侵权内容，举报邮箱： cloudbbs@huaweicloud.com

点赞
收藏
关注作者

0/1000

抱歉，系统识别当前为高风险访问，暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称，即可参与社区互动！

*长度不超过10个汉字或20个英文字符，设置后3个月内不可修改。

确认取消

加入云驻计划，成为创作者

华为云周边好礼
免费体验产品
特殊身份标识
线下官方门票
内部专家零距离
与10000+优质创作者共同成长

立即加入

卡在哪儿就戳哪儿！——鸿蒙系统性能监控与调优，从 HiTrace 到 HiPerf 的实战路线图！

开篇语

前言

目录

01｜工具速览：看清—锁定—证据链

02｜HiTrace / Bytrace：把关键路径“画出来”

2.1 代码里埋“可视锚点”（HiTrace 标记）

2.2 抓系统级 trace（Bytrace/命令行）

03｜HiPerf：CPU 热点“画像”（火焰图好朋友）

3.1 采样与报告（命令行）

04｜内存与 CPU 优化清单（ArkUI/服务侧通吃）

4.1 内存（ArkUI/ArkTS）

4.2 CPU（UI/服务侧）

05｜实操案例：“列表页掉到 25FPS”怎么救？

Step 1：抓系统 trace（Bytrace + 自埋 HiTrace）

Step 2：HiPerf 锁定热点

Step 3：改造与验证

Step 4：复测 & 回归

06｜一站式调优 SOP（可打印）

结语：性能是文化，更是流程

附：常用命令/片段速查（收藏）

文末

全部回复

设置昵称

关于作者

目录

加入云驻计划，成为创作者

卡在哪儿就戳哪儿！——鸿蒙系统性能监控与调优，从 HiTrace 到 HiPerf 的实战路线图！

开篇语

前言

目录

01｜工具速览：看清—锁定—证据链

02｜HiTrace / Bytrace：把关键路径“画出来”

2.1 代码里埋“可视锚点”（HiTrace 标记）

2.2 抓系统级 trace（Bytrace/命令行）

03｜HiPerf：CPU 热点“画像”（火焰图好朋友）

3.1 采样与报告（命令行）

04｜内存与 CPU 优化清单（ArkUI/服务侧通吃）

4.1 内存（ArkUI/ArkTS）

4.2 CPU（UI/服务侧）

05｜实操案例：**“列表页掉到 25FPS”**怎么救？

Step 1：抓系统 trace（Bytrace + 自埋 HiTrace）

Step 2：HiPerf 锁定热点

Step 3：改造与验证

Step 4：复测 & 回归

06｜一站式调优 SOP（可打印）

结语：性能是文化，更是流程

附：常用命令/片段速查（收藏）

文末

全部回复

设置昵称

关于作者

目录

热门推荐查看更多

相关文章

加入云驻计划，成为创作者

相关产品

05｜实操案例：“列表页掉到 25FPS”怎么救？