- 微信
- 微博
  
  分享文章到微博
- 复制链接
  
  复制链接到剪贴板

干 HPC 的都懂：CPU 算到发烫，资源却总闲着？openEuler 来治！【华为根技术】

Echo_Wish 发表于 2025/11/28 21:28:10 2025/11/28

【摘要】干 HPC 的都懂：CPU 算到发烫，资源却总闲着？openEuler 来治！

干 HPC 的都懂：CPU 算到发烫，资源却总闲着？openEuler 来治！

作者：Echo_Wish

一、引子：为什么 HPC 环境资源总是“不够用”？

很多做高性能计算（HPC）的朋友都有过这样的体验：

集群上明明上百节点，但作业排队排成长龙
有的节点 CPU 99%，有的节点却像空调一样“风扇呼呼吹但啥也不干”
GPU 明明装了一堆，却经常只有一半在干活
MPI 作业卡住、NUMA 亲和性没调好、I/O 僵死……各种看似小问题最后都演变成——资源利用率低

更让人揪心的是：

服务器很贵
电费更贵
资源闲着，就是在烧钱

于是大家纷纷问：有没有一套系统，让 HPC 的资源调度真正智能起来？

答案是：openEuler，可以。

二、原理讲解：openEuler 如何帮 HPC 提升资源利用率？（通俗易懂版）

openEuler 作为一款面向服务器、云和数字基础设施的开源操作系统，在 HPC 场景下主要解决三个核心痛点：

① 异构资源管理：让 CPU、GPU、NPU 用到爽

HPC 早就不只是 CPU 时代了，各种 GPU、NPU 设备满天飞。
openEuler 提供：

统一驱动框架（UADK、iGPU 驱动、Ascend AI 生态）
容器 + 物理混合调度能力
NUMA-aware（NUMA 感知机制）

让不同计算设备都能“按能力分配、按需调度”。

② 调度优化：把每一核 CPU 都压榨到极致

openEuler 的 HPC 优化包括：

Cgroup v2 自动资源隔离
调度器自动根据负载迁移任务
I/O 调度策略优化（mq-deadline/none）
NUMA 亲和性自动绑定
优先级队列 + 计算作业类型识别

简单说就是：

让系统比人更懂该把作业丢给哪个 CPU、哪个 NUMA 节点。

③ HPC 特化优化子系统：A-Tune 智能调优神器

openEuler 的 A-Tune 是个自动化系统调优工具，它能做：

系统自动基线采集
负载识别
自动调优
架构自适应参数修改

一句话：

A-Tune 就是 HPC 的“老司机”，知道啥负载该用啥配置。

三、实战代码：一看就懂，一用就爽

下面给你展示几个最实用的 openEuler HPC 调优示例。

1. NUMA 感知调度 —— 必须打开

# 查看 NUMA 拓扑结构
numactl --hardware

# 运行程序绑定 NUMA 节点，提高内存访问效率
numactl --cpunodebind=0 --membind=0 ./hpc_app

适用场景：
MPI 程序、科学计算、矩阵计算场景。

很简单，但能提升 10%～30% 性能，尤其在大核节点上特别明显。

2. 使用 A-Tune 自动调优 HPC 节点

# 安装 A-Tune
yum install -y atune

# 启动服务
systemctl start atuned

# 使用 HPC 场景模板调优
atune-adm tuning --project hpc_optimize --template hpc-scenario

几分钟后，A-Tune 自动帮你调整：

CPU governor
I/O 调度算法
HugePage 大页
内核队列长度
NUMA 调度策略

你不需要懂所有内核参数，A-Tune 会帮你调好。

3. GPU / NPU 调度与隔离

GPU 隔离示例（CUDA）：

# 限制程序只使用 GPU 0
export CUDA_VISIBLE_DEVICES=0
./gpu_task

对于异构加速器（如昇腾 Atlas，NPU）：

npu-smi info
npu-smi topo -m

openEuler 对 NPU 驱动本地支持好，调度和容器也友好。

四、场景应用：openEuler 在 HPC 里的 3 大典型落地方式

① 科学计算场景：MPI、CFD、仿真

问题：

NUMA 乱绑
MPI 通信延迟高
CPU 负载不均

openEuler 的优势：

NUMA 感知调度 + 大页优化
A-Tune 为 MPI 提供专项优化策略
内核针对 RDMA 网络做了性能补丁

实际效果：

整体任务执行效率提升 15%～35%

② AI + HPC 融合场景：GPU/NPU 异构调度

AI 工程师最怕：

GPU 卡着不跑
物理机资源浪费
多用户争抢 GPU

openEuler 方案：

GPU 分片（MPS、MIG）
openEuler 容器生态支持 GPU 隔离
统一调度框架管理异构设备

结果：

GPU 利用率从 40% 抬到 80%+，成本等于直接砍半。

③ 金融计算、大规模实时计算

痛点：

对延迟极其敏感
多作业抢 I/O、Cache
内核默认调度无法保证稳定性

openEuler 提供：

低延迟内核
CPU 亲和绑定
cache 分离策略

机构实测：

延迟抖动下降 40%，性能提升 20%

五、Echo_Wish 式思考：为什么我强烈推荐 HPC 场景用 openEuler？

写到这里，我想说一个真实的感受：

HPC 是最能体现“系统底层功力”的场景。

你可以在云原生环境里不关心 NUMA，可以忽略 CPU Cache，但在 HPC 里：

每个核的忙闲
每条内存总线的延迟
调度器的每个策略选项
大页是否开启
IO scheduler 是否合适

都有可能决定你的任务是 1 小时跑完还是 10 小时跑完。

openEuler 给我的感觉就是：

它是一套很“懂硬件”的操作系统，尤其在国产 CPU、国产 GPU、国产 NPU 上表现特别好。

这种软硬协同，不是简单增加几个配置项，而是内核、驱动、调度器一起调优的结果。

更关键的是，它有：

A-Tune 这种智能调优神器
异构加速的深度支持
针对 HPC 的深层内核优化

当别人还在调 sysctl 的时候，openEuler 已经实现自动调优了。

最后总结：openEuler 为 HPC 带来的核心价值

✔ 更高资源利用率（CPU/GPU/NPU）
✔ 更少作业排队时间
✔ 更稳定的任务执行效率
✔ 更低的集群运维成本
✔ 更强的软硬件协同能力

一句话：

HPC 的未来一定不是堆服务器，而是提升利用率；openEuler 正是在这条路上走得最稳的那一个。

【声明】本内容来自华为云开发者社区博主，不代表华为云及华为云开发者社区的观点和立场。转载时必须标注文章的来源（华为云社区）、文章链接、文章作者等基本信息，否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容，欢迎发送邮件进行举报，并提供相关证据，一经查实，本社区将立刻删除涉嫌侵权内容，举报邮箱： cloudbbs@huaweicloud.com

点赞
收藏
关注作者

0/1000

抱歉，系统识别当前为高风险访问，暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称，即可参与社区互动！

*长度不超过10个汉字或20个英文字符，设置后3个月内不可修改。

确认取消

加入云驻计划，成为创作者

华为云周边好礼
免费体验产品
特殊身份标识
线下官方门票
内部专家零距离
与10000+优质创作者共同成长

立即加入

干 HPC 的都懂：CPU 算到发烫，资源却总闲着？openEuler 来治！【华为根技术】

干 HPC 的都懂：CPU 算到发烫，资源却总闲着？openEuler 来治！

一、引子：为什么 HPC 环境资源总是“不够用”？

二、原理讲解：openEuler 如何帮 HPC 提升资源利用率？（通俗易懂版）

① 异构资源管理：让 CPU、GPU、NPU 用到爽

② 调度优化：把每一核 CPU 都压榨到极致

③ HPC 特化优化子系统：A-Tune 智能调优神器

三、实战代码：一看就懂，一用就爽

1. NUMA 感知调度 —— 必须打开

2. 使用 A-Tune 自动调优 HPC 节点

3. GPU / NPU 调度与隔离

四、场景应用：openEuler 在 HPC 里的 3 大典型落地方式

① 科学计算场景：MPI、CFD、仿真

② AI + HPC 融合场景：GPU/NPU 异构调度

③ 金融计算、大规模实时计算

五、Echo_Wish 式思考：为什么我强烈推荐 HPC 场景用 openEuler？

最后总结：openEuler 为 HPC 带来的核心价值

全部回复

设置昵称

关于作者

目录

加入云驻计划，成为创作者

干 HPC 的都懂：CPU 算到发烫，资源却总闲着？openEuler 来治！【华为根技术】

干 HPC 的都懂：CPU 算到发烫，资源却总闲着？openEuler 来治！

一、引子：为什么 HPC 环境资源总是“不够用”？

二、原理讲解：openEuler 如何帮 HPC 提升资源利用率？（通俗易懂版）

① 异构资源管理：让 CPU、GPU、NPU 用到爽

② 调度优化：把每一核 CPU 都压榨到极致

③ HPC 特化优化子系统：A-Tune 智能调优神器

三、实战代码：一看就懂，一用就爽

1. NUMA 感知调度 —— 必须打开

2. 使用 A-Tune 自动调优 HPC 节点

3. GPU / NPU 调度与隔离

四、场景应用：openEuler 在 HPC 里的 3 大典型落地方式

① 科学计算场景：MPI、CFD、仿真

② AI + HPC 融合场景：GPU/NPU 异构调度

③ 金融计算、大规模实时计算

五、Echo_Wish 式思考：为什么我强烈推荐 HPC 场景用 openEuler？

最后总结：openEuler 为 HPC 带来的核心价值

全部回复

设置昵称

关于作者

目录

热门推荐查看更多

相关文章

加入云驻计划，成为创作者

相关产品