- 微信
- 微博
  
  分享文章到微博
- 复制链接
  
  复制链接到剪贴板

NVIDIA 首款智能体专用 CPU

叫我小刘就好了发表于 2026/05/28 18:33:17 2026/05/28

【摘要】 Vera 正式登场：NVIDIA 首款智能体专用 CPU，开启代理式 AI 新时代2026年5月，NVIDIA 超大规模与高性能计算副总裁 Ian Buck 亲自带队，将首批 NVIDIA Vera CPU 系统交付给 Anthropic、OpenAI、SpaceXAI 和 Oracle Cloud Infrastructure (OCI) 四大顶级 AI 实验室，标志着这款专为代理式 A...

Vera 正式登场：NVIDIA 首款智能体专用 CPU，开启代理式 AI 新时代

2026年5月，NVIDIA 超大规模与高性能计算副总裁 Ian Buck 亲自带队，将首批 NVIDIA Vera CPU 系统交付给 Anthropic、OpenAI、SpaceXAI 和 Oracle Cloud Infrastructure (OCI) 四大顶级 AI 实验室，标志着这款专为代理式 AI 设计的 CPU 正式从实验室走向大规模商业部署。

Vera CPU 自今年3月 GTC 2026 上首次亮相后，就被 NVIDIA 创始人兼 CEO 黄仁勋定位为公司 “下一个数十亿美元级的业务”。如今，它正以惊人的速度完成交付，驱动着全球顶尖 AI 实验室的智能体工作负载。

一、为什么 AI 智能体需要一款全新的 CPU？

代理式 AI 的工作模式，彻底改变了 CPU 的使用模式。AI 智能体并非仅靠 GPU 运行，背后每一个独立的“智能体沙盒环境”、每一次工具调用、每一层编排系统，以及长上下文检索操作，背后都是 CPU 在支撑。

这种高并发、实时运行的任务组合，对传统以核心密度为中心的 CPU 设计施加了前所未有的压力。NVIDIA 正是在这一现实需求下，推出了全新设计的 Vera CPU。

二、Vera CPU 的核心技术亮点

Vera CPU 集成了 88 颗由 NVIDIA 专门设计的 Olympus 核心，支持 176 线程并发处理，内存带宽高达 1.2 TB/s，单核性能相比前代提升 50%。即使在持续高负载的运行环境下，也能更快完成任务，显著提升 AI 工厂的运行效率。

1. 架构设计

Vera CPU 基于 ARMv9.2-A 指令集架构，采用了 NVIDIA 自主研发的 Olympus CPU 核心。
这与上代 Grace CPU 采用 Arm Neoverse V2 公版核心的设计截然不同，是 NVIDIA 在 CPU 领域的重大突破。
单颗 CPU 拥有 88 个核心、176 个线程，以及高达 162 MB 的三级缓存 (L3 Cache)。

2. 性能表现

相比上代 Grace CPU：Vera 的性能表现十分抢眼。在综合平均成绩上，比上一代 72 核 Grace 快 63%。在数据处理、压缩以及持续集成/持续交付 (CI/CD) 等关键任务上，可实现约 2 倍性能提升。
横向对比 x86 处理器：Vera 也展现出强大的竞争力。它比 64 核、主频 5.0 GHz 的 AMD EPYC 9575F 快 10%，对 128 核的 Intel Xeon 6980P 领先幅度更是高达 55%。
Linux 内核编译：效率更是达到了主流 x86 处理器的两倍。

3. 能效与互联

Vera 的 TDP 为 450W，搭配的 LPDDR5X 内存功耗不到 50W。
它支持 NVLink-C2C 互联技术，可为 GPU 提供高达 1.8 TB/s 的带宽，是上一代产品的两倍，运行速度是 PCIe Gen 6 的七倍。
同时，它还支持最新的 PCIe Gen 6 和 CXL 3.1 标准，为构建下一代数据中心提供了极高的扩展性。

三、顶级客户的背书与期待

此次交付的客户，无一不是 AI 领域的领导者，他们对 Vera 的评价也颇具参考价值。

Anthropic 计算负责人 James Bradbury 表示：“扩展算力是模型增长的重要加速器，在应对智能体工作负载的挑战时，我们很高兴看到 Vera 成为生态系统中一个充满潜力的新成员。”
OpenAI 计算基础设施负责人 Sachin Katti 对 Ian Buck 专程送来服务器表示感谢，NVIDIA 团队现场展示了系统内部构造。
SpaceXAI 方面，埃隆·马斯克在听取介绍后提出一连串问题，涵盖核心架构、内存布局以及散热设计等关键技术细节。目前，SpaceXAI 正在评估将 Vera 用于强化学习工作负载以及基于智能体的仿真流水线。
OCI 高级副总裁 Karan Batta 宣布了一项宏大计划：“OCI 计划从 2026 年开始部署数十万颗 NVIDIA Vera CPU，因为代理式 AI 需要在大规模下维持持续的性能。”

四、Vera CPU 的宏大部署版图

Vera 并非孤立的产品，它是 NVIDIA 最新 Vera Rubin 计算平台的核心组件。

在标准的 NVL72 机架配置中，可搭载 36 颗 Vera CPU 与 72 颗 Rubin GPU。而更强大的 NVL144 CPX 平台，则可集成 144 块 Rubin GPU 和 144 块 Rubin CPX GPU，配备 100 TB 高速内存和 1.7 PB/s 内存带宽，提供 8 EFLOPs 的 NVFP4 算力。

整个 Vera Rubin 平台预计于 2026 年下半年 开始大规模出货，届时，微软、谷歌、亚马逊、Meta 和甲骨文等云服务巨头将成为首批客户。

五、开启智能体 AI 的“CPU 时刻”

正如 Ian Buck 所言，“代理式 AI 正在 AI 工厂中催生一个全新的 CPU 时刻——随着模型从单纯的‘回答问题’转向主动‘采取行动’，Vera 正是为了保障这种工作负载在大规模下高效运转而量身打造的。”

Vera CPU 的正式交付，不仅意味着 NVIDIA 在 AI 计算版图上补上了一块关键拼图，更标志着 CPU 的角色正被重新定义，从传统的通用计算核心，演变为支撑智能体时代的关键底座。

未来，随着数十万颗 Vera CPU 在全球各大云数据中心部署到位，代理式 AI 的规模化应用将迎来真正的爆发期。

【声明】本内容来自华为云开发者社区博主，不代表华为云及华为云开发者社区的观点和立场。转载时必须标注文章的来源（华为云社区）、文章链接、文章作者等基本信息，否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容，欢迎发送邮件进行举报，并提供相关证据，一经查实，本社区将立刻删除涉嫌侵权内容，举报邮箱： cloudbbs@huaweicloud.com

点赞
收藏
关注作者

0/1000

抱歉，系统识别当前为高风险访问，暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称，即可参与社区互动！

*长度不超过10个汉字或20个英文字符，设置后3个月内不可修改。

确认取消

加入云驻计划，成为创作者

华为云周边好礼
免费体验产品
特殊身份标识
线下官方门票
内部专家零距离
与10000+优质创作者共同成长

立即加入

NVIDIA 首款智能体专用 CPU

Vera 正式登场：NVIDIA 首款智能体专用 CPU，开启代理式 AI 新时代

一、为什么 AI 智能体需要一款全新的 CPU？

二、Vera CPU 的核心技术亮点

1. 架构设计

2. 性能表现

3. 能效与互联

三、顶级客户的背书与期待

四、Vera CPU 的宏大部署版图

五、开启智能体 AI 的“CPU 时刻”

全部回复

设置昵称

关于作者

目录

加入云驻计划，成为创作者

NVIDIA 首款智能体专用 CPU

Vera 正式登场：NVIDIA 首款智能体专用 CPU，开启代理式 AI 新时代

一、为什么 AI 智能体需要一款全新的 CPU？

二、Vera CPU 的核心技术亮点

1. 架构设计

2. 性能表现

3. 能效与互联

三、顶级客户的背书与期待

四、Vera CPU 的宏大部署版图

五、开启智能体 AI 的“CPU 时刻”

全部回复

设置昵称

关于作者

目录

热门推荐查看更多

相关文章

加入云驻计划，成为创作者

相关产品