- 微信
- 微博
  
  分享文章到微博
- 复制链接
  
  复制链接到剪贴板

模拟 CPU 负载脚本实现与应用场景

William 发表于 2025/05/12 09:25:03 2025/05/12

【摘要】模拟 CPU 负载脚本实现与应用场景引言 (Foreword/Motivation)在系统管理、性能测试或故障排查过程中，有时我们需要模拟一个高 CPU 负载的环境。这有助于我们：测试系统稳定性: 评估系统在高负载下的运行情况，发现潜在的稳定性问题。验证应用性能: 模拟后端服务 CPU 密集型场景，测试应用的响应时间、吞吐量在高负载环境下的表现。监控系统行为: 观察监控系统在高 CPU 负载...

模拟 CPU 负载脚本实现与应用场景

引言 (Foreword/Motivation)

在系统管理、性能测试或故障排查过程中，有时我们需要模拟一个高 CPU 负载的环境。这有助于我们：

测试系统稳定性: 评估系统在高负载下的运行情况，发现潜在的稳定性问题。
验证应用性能: 模拟后端服务 CPU 密集型场景，测试应用的响应时间、吞吐量在高负载环境下的表现。
监控系统行为: 观察监控系统在高 CPU 负载发生时是否能及时发出警报，并分析资源使用情况。
压力测试: 对服务器或特定服务进行压力测试，评估其承载能力。
重现问题: 模拟特定的高 CPU 场景，以便重现和调试在此情况下才会出现的问题。

为了实现这一目的，我们可以编写一个简单的脚本，通过执行计算密集型任务来持续占用 CPU 资源。

环境准备 (Environment Setup)

实现本指南中的脚本，您只需要：

一台计算机或服务器: 操作系统可以是 Linux、Windows 或 macOS 等。
安装 Python 环境: 脚本将使用 Python 编写。请确保您的系统上安装了 Python 3。可以通过在终端运行 python3 --version 或 python --version 来检查。如果未安装，请访问 Python 官方网站下载并安装。

完整代码实现 (Full Code Implementation)

我们将使用 Python 的 multiprocessing 模块来创建多个进程，每个进程都会在一个 CPU 核心上执行计算密集型任务，从而将整个 CPU 的负载提升到较高水平。为了模拟 90% 左右的负载（而不是 100% 死循环），我们可以在每个工作进程的循环中加入一个非常短暂的睡眠时间，让出一点 CPU 时间片。但这不能精确控制到 90%，只能达到“较高”或“接近 100%”的负载，具体取决于系统的核心数和后台进程情况。下面的代码是模拟较高负载的通用方法。

# -*- coding: utf-8 -*-
# filename: cpu_load_simulator.py

import multiprocessing # 导入多进程模块
import time            # 导入时间模块
import sys             # 导入 sys 模块用于退出处理
import signal          # 导入信号处理模块

# 工作进程函数：模拟 CPU 密集型任务
def cpu_worker(stop_event):
    """
    这是一个会持续占用 CPU 的工作函数。
    它会在一个无限循环中执行简单的计算，直到收到停止信号。
    """
    print(f"进程 {multiprocessing.current_process().pid} 已启动，开始模拟CPU负载...")
    # 使用一个无限循环来持续执行任务
    while not stop_event.is_set(): # 检查停止事件是否被设置
        # 这里执行一些简单的计算，目的是消耗CPU时间片
        # 可以是任何计算密集型操作，例如：
        # x = 1 + 1
        # y = x * 2
        # z = y / 3
        # ... 重复更多计算 ...
        # 下面的循环是一个简单的计算示例
        for i in range(100000):
             _ = i * i # 执行乘法运算

        # 添加一个非常短暂的睡眠，模拟非100%的负载，并允许进程调度
        # 调整这里的睡眠时间可以微调负载，但精确控制很困难
        # 0.001 秒 (1毫秒) 通常能达到很高负载
        time.sleep(0.001) # 让出 CPU 时间片

    print(f"进程 {multiprocessing.current_process().pid} 接收到停止信号，正在退出。")


# 全局变量，用于在主进程和子进程之间同步停止信号
# 使用 Event 对象可以在进程间安全地传递信号
stop_event = multiprocessing.Event()

# 信号处理函数，用于捕获 Ctrl+C (SIGINT)
def signal_handler(signum, frame):
    print(f"\n接收到信号 {signum}，正在准备停止进程...")
    stop_event.set() # 设置停止事件，通知子进程退出

# 主程序入口
if __name__ == "__main__":
    # 注册信号处理函数，捕获 Ctrl+C
    signal.signal(signal.SIGINT, signal_handler)
    # 在 Windows 上，Ctrl+C 对应 SIGINT
    # 在 Linux/macOS 上，Ctrl+C 对应 SIGINT

    # 获取CPU核心数量
    # multiprocessing.cpu_count() 返回系统可用的CPU核心数
    num_cores = multiprocessing.cpu_count()
    print(f"检测到系统有 {num_cores} 个 CPU 核心。")

    # 创建并启动多个工作进程，数量与CPU核心数相同
    # 在每个核心上运行一个进程，旨在最大化CPU利用率
    processes = []
    for i in range(num_cores):
        # 创建一个进程，目标函数是 cpu_worker，并将 stop_event 作为参数传递
        p = multiprocessing.Process(target=cpu_worker, args=(stop_event,))
        processes.append(p)
        p.start() # 启动进程

    print(f"已启动 {num_cores} 个进程，正在模拟高CPU负载。")
    print("请打开您的系统资源监视器 (如 top, htop, 任务管理器) 查看CPU使用率。")
    print("按 Ctrl+C 停止脚本。")

    # 等待所有子进程结束
    # 如果没有这部分，主进程会立即退出，而子进程可能成为孤儿进程
    try:
        while True:
            # 检查是否有子进程仍在运行
            all_stopped = True
            for p in processes:
                if p.is_alive():
                    all_stopped = False
                    break
            if all_stopped:
                break # 所有子进程都已退出

            time.sleep(0.1) # 短暂休眠，避免主进程占用过多CPU

    except KeyboardInterrupt:
        # 理论上信号处理函数已经设置了 stop_event
        # 但为了确保，这里也可以再次设置，不过信号处理通常更及时
        print("\n主进程捕获到 KeyboardInterrupt (Ctrl+C)，通知子进程停止...")
        stop_event.set()

    finally:
        # 确保所有进程都被终止 (如果它们没有优雅退出的话)
        # 有时子进程可能因为某种原因没有响应信号处理
        for p in processes:
            if p.is_alive():
                print(f"正在终止进程 {p.pid}...")
                p.terminate() # 发送终止信号
        for p in processes:
             p.join(timeout=5) # 等待进程终止，设置超时

        print("所有进程已停止，脚本退出。")
        sys.exit(0) # 正常退出

运行结果 (Execution Results)

启动脚本: 在终端中运行脚本：
```
python cpu_load_simulator.py
```

控制台输出: 脚本会打印类似以下的信息：

检测到系统有 X 个 CPU 核心。
已启动 X 个进程，正在模拟高CPU负载。
请打开您的系统资源监视器 (如 top, htop, 任务管理器) 查看CPU使用率。
按 Ctrl+C 停止脚本。
进程 YYY 开始模拟CPU负载...
进程 ZZZ 开始模拟CPU负载...
... (每个启动的进程都会打印一行开始信息)

这里的 X 是您系统的 CPU 核心数，YYY, ZZZ 等是子进程的 ID。

系统资源监视器: 打开您系统的资源监视器：
- Linux: 打开终端，运行 top 或 htop 命令。
- Windows: 打开任务管理器 (Task Manager)，切换到“性能”标签页，查看 CPU 使用率。
- macOS: 打开活动监视器 (Activity Monitor)，切换到“CPU”标签页。
您会观察到 CPU 的总使用率显著升高，通常会达到接近 100%（取决于 time.sleep 的时长、核心数和后台进程）。每个由脚本启动的 Python 进程（或在 Windows 任务管理器中可能是多个同名进程）的 CPU 使用率也会很高。
停止脚本: 在运行脚本的终端按下 Ctrl + C。
- 控制台会打印类似 接收到信号 2，正在准备停止进程... 的信息。
- 子进程会接收到停止信号并打印退出信息。
- 脚本会等待所有子进程退出后，最终打印 所有进程已停止，脚本退出。

测试步骤以及详细代码 (Testing Steps and Detailed Code)

测试这个脚本是否成功模拟了高 CPU 负载，主要步骤是运行脚本并监控系统资源使用情况。

保存脚本: 将上面的 Python 代码复制粘贴到一个文本文件，命名为 cpu_load_simulator.py。
打开终端: 打开您的命令行终端或 Shell。
运行脚本: 在终端中，进入保存脚本的目录，执行：
```
python cpu_load_simulator.py
```
(注意: 如果您的系统同时安装了 Python 2 和 Python 3，可能需要使用 python3 cpu_load_simulator.py 来确保运行的是 Python 3)。
打开资源监视器: 在脚本开始运行并打印出启动信息后，打开系统的资源监视器：
- Linux: 在 另一个 终端窗口运行 top 或 htop。htop 通常更直观，显示每个核心的使用率。
```
# 在另一个终端运行
top
# 或
htop
```
  观察顶部的总 CPU 使用率和每个核心的 CPU 使用率。您会看到 python 进程（或脚本名相关的进程）占用了大量的 CPU。
- Windows: 按 Ctrl + Shift + Esc 打开任务管理器，切换到“性能”标签页，点击 CPU 图表查看详细信息。切换到“进程”标签页，按 CPU 列排序，查看 Python 进程的 CPU 使用率。
- macOS: 使用 Spotlight 搜索并打开“活动监视器 (Activity Monitor)”，切换到“CPU”标签页，观察 CPU 负载图表和进程列表。
观察负载: 观察资源监视器中 CPU 的总使用率和各个核心（或进程）的使用率。确认它们显著升高。
测试停止: 在确认负载升高后，回到运行脚本的终端，按下 Ctrl + C。观察脚本和资源监视器中的变化，确认 CPU 使用率下降，脚本进程退出。
- 代码: 在运行脚本的终端按下 Ctrl+C。
- 验证: 在资源监视器中看到 python 进程的 CPU 使用率迅速下降并最终消失。脚本终端打印退出信息。

部署场景 (Deployment Scenarios)

这种模拟 CPU 负载的脚本本身通常不作为生产应用的一部分进行“部署”，而是在特定的场景下被执行：

服务器性能基线测试: 在新的服务器部署后，运行此脚本一段时间，观察 CPU 是否能稳定运行在高负载下，以及服务器的散热和电源系统是否能承受。
应用压力测试准备: 在进行应用层面的压力测试前，先使用此类脚本模拟一个基础的高 CPU 环境，然后测试应用在高系统负载下的表现。
监控系统验证: 运行此脚本，检查监控系统（如 Prometheus, Zabbix, Nagios 等）是否能正确采集到 CPU 使用率飙升的数据，并根据配置发出警报。
自动扩缩容测试 (云环境): 在支持自动扩缩容的云环境中，运行此脚本提高节点 CPU 负载，验证自动扩缩容策略是否按预期触发了新节点的创建。
调试高 CPU 问题: 如果某个应用在高 CPU 场景下行为异常或崩溃，可以使用此脚本快速创建高 CPU 环境，然后运行有问题的应用，尝试重现和调试。
演示系统监控工具: 向用户演示监控面板或工具时，通过运行此脚本快速生成可观测的高负载数据。

疑难解答 (Troubleshooting)

脚本无法运行:
- 问题: command not found: python 或 No module named multiprocessing 等错误。
- 排查: 确保 Python 已正确安装，并且 python 命令在 PATH 环境变量中。确保安装的是 Python 3（multiprocessing 是标准库，但需要 Python 3）。
CPU 使用率没有升高:
- 问题: 脚本运行但 CPU 使用率变化不大。
- 排查:
  - 确认脚本进程是否正在运行（使用资源监视器查找 Python 进程）。如果进程不在列表里，脚本可能立即退出了（检查代码逻辑或是否有未捕获的异常）。
  - 确认启动的进程数量与 CPU 核心数匹配。
  - 检查 cpu_worker 函数中的计算循环是否足够密集。有时候太简单的循环会被编译器优化掉或运行太快。可以增加计算量。
  - 检查 time.sleep() 的时长。如果睡眠时间太长，整体负载会降低。尝试减小睡眠时间。
  - 系统可能有其他进程占用了大量 CPU。
脚本无法优雅停止 (Ctrl+C 无效):
- 问题: 按 Ctrl+C 后，脚本进程仍在运行，CPU 负载不下降。
- 排查:
  - 检查信号处理函数 signal_handler 是否正确注册。
  - 检查在 cpu_worker 函数中是否正确检查了 stop_event.is_set()。
  - 检查 stop_event 是否正确地在进程间共享（multiprocessing.Event() 创建的 Event 对象是可以在进程间共享的）。
  - 在极端情况下，如果系统负载过高导致 OS 调度器异常，进程可能无法及时响应信号。可以尝试使用 kill 命令强制终止进程（如 kill -9 <进程ID>），但这会 abrupt termination。
  - 如果 finally 块中的 p.terminate() 和 p.join() 设置了超时，但子进程长时间不退出，需要检查子进程是否卡死在某个无法中断的操作中。
系统在高负载下不稳定或崩溃:
- 问题: 运行脚本导致系统死机、应用崩溃、硬件过热。
- 排查: 这是一个警告。高 CPU 负载会消耗大量计算和散热资源。不要在关键生产系统上随意运行此类脚本。确保系统有良好的散热。如果出现问题，立即停止脚本。考虑模拟较低一些的负载（例如，只启动 num_cores - 1 个进程，或者显著增加 time.sleep 的时长）。

未来展望 (Future Outlook)

CPU 负载模拟的基本原理（让 CPU 执行计算）不会改变，但其实现方式和工具将随着技术发展而演进：

更精细的负载控制: 未来的工具将能更精确地模拟特定百分比的 CPU 负载，而不仅仅是“高负载”。
更真实的负载模式: 模拟脚本将不仅仅是简单的计算循环，而是模拟特定应用类型（如 Web 服务器、数据库）的 CPU 访问模式。
容器化负载生成器: 负载生成工具将更易于部署在容器环境中，作为微服务架构下的负载测试组件。
云平台集成: 云服务商将提供更便捷的负载测试服务，直接在平台上模拟各种类型的负载。

技术趋势与挑战 (Technology Trends and Challenges)

技术趋势:

Serverless 计算: 在 Serverless 环境下，开发者通常无法直接访问或控制底层 CPU，负载模拟方式需要改变。
原生编译和 AOT: Python 代码通过原生编译运行可能改变其在高负载下的行为特性。
更复杂的硬件架构: CPU 架构日益复杂（多核、异构核心、缓存结构），精确模拟负载更具挑战。
自动化和编排: 在自动化运维和编排系统中，按需、自动地生成负载用于测试和验证将更常见。

挑战:

模拟真实负载: 合成负载与真实用户流量或应用工作负载有差异，如何模拟更真实的场景是挑战。
跨平台一致性: 不同的 OS 调度器、Python 解释器、硬件差异可能导致同一脚本在不同平台上的负载效果不同。
无干扰监控: 在生成负载的同时，如何准确监控系统资源使用，避免监控工具本身受到高负载影响。
副作用控制: 确保负载模拟不会对系统造成长期损害（如过热），或干扰其他关键应用。

总结 (Conclusion)

通过使用 Python 的 multiprocessing 模块，我们可以编写一个简单而有效的脚本来模拟系统的高 CPU 负载。脚本通过创建与 CPU 核心数量相等的进程，并在每个进程中执行计算密集型循环，从而达到提高整体 CPU 使用率的目的。这种脚本是进行系统稳定性测试、应用性能验证和监控告警测试的实用工具。

虽然通过 time.sleep 等方式可以尝试微调负载，但精确控制到特定百分比通常是困难的，脚本主要用于模拟“高负载”场景。在实际应用中，应谨慎使用此类脚本，并在受控的环境下进行，密切监控系统状态，避免对系统造成不必要的风险。理解其原理和适用场景，能够帮助您更好地利用它来完成系统测试和分析任务。

【声明】本内容来自华为云开发者社区博主，不代表华为云及华为云开发者社区的观点和立场。转载时必须标注文章的来源（华为云社区）、文章链接、文章作者等基本信息，否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容，欢迎发送邮件进行举报，并提供相关证据，一经查实，本社区将立刻删除涉嫌侵权内容，举报邮箱： cloudbbs@huaweicloud.com

点赞
收藏
关注作者

0/1000

抱歉，系统识别当前为高风险访问，暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称，即可参与社区互动！

*长度不超过10个汉字或20个英文字符，设置后3个月内不可修改。

确认取消

加入云驻计划，成为创作者

华为云周边好礼
免费体验产品
特殊身份标识
线下官方门票
内部专家零距离
与10000+优质创作者共同成长

立即加入

模拟 CPU 负载脚本实现与应用场景

全部回复

设置昵称

关于作者

目录

热门推荐查看更多

相关文章

加入云驻计划，成为创作者

相关产品