NVIDIA 首款智能体专用 CPU
Vera 正式登场:NVIDIA 首款智能体专用 CPU,开启代理式 AI 新时代
2026年5月,NVIDIA 超大规模与高性能计算副总裁 Ian Buck 亲自带队,将首批 NVIDIA Vera CPU 系统交付给 Anthropic、OpenAI、SpaceXAI 和 Oracle Cloud Infrastructure (OCI) 四大顶级 AI 实验室,标志着这款专为代理式 AI 设计的 CPU 正式从实验室走向大规模商业部署。
Vera CPU 自今年3月 GTC 2026 上首次亮相后,就被 NVIDIA 创始人兼 CEO 黄仁勋定位为公司 “下一个数十亿美元级的业务”。如今,它正以惊人的速度完成交付,驱动着全球顶尖 AI 实验室的智能体工作负载。
一、为什么 AI 智能体需要一款全新的 CPU?
代理式 AI 的工作模式,彻底改变了 CPU 的使用模式。AI 智能体并非仅靠 GPU 运行,背后每一个独立的“智能体沙盒环境”、每一次工具调用、每一层编排系统,以及长上下文检索操作,背后都是 CPU 在支撑。
这种高并发、实时运行的任务组合,对传统以核心密度为中心的 CPU 设计施加了前所未有的压力。NVIDIA 正是在这一现实需求下,推出了全新设计的 Vera CPU。
二、Vera CPU 的核心技术亮点
Vera CPU 集成了 88 颗由 NVIDIA 专门设计的 Olympus 核心,支持 176 线程并发处理,内存带宽高达 1.2 TB/s,单核性能相比前代提升 50%。即使在持续高负载的运行环境下,也能更快完成任务,显著提升 AI 工厂的运行效率。
1. 架构设计
- Vera CPU 基于 ARMv9.2-A 指令集架构,采用了 NVIDIA 自主研发的 Olympus CPU 核心。
- 这与上代 Grace CPU 采用 Arm Neoverse V2 公版核心的设计截然不同,是 NVIDIA 在 CPU 领域的重大突破。
- 单颗 CPU 拥有 88 个核心、176 个线程,以及高达 162 MB 的三级缓存 (L3 Cache)。
2. 性能表现
- 相比上代 Grace CPU:Vera 的性能表现十分抢眼。在综合平均成绩上,比上一代 72 核 Grace 快 63%。在数据处理、压缩以及持续集成/持续交付 (CI/CD) 等关键任务上,可实现约 2 倍性能提升。
- 横向对比 x86 处理器:Vera 也展现出强大的竞争力。它比 64 核、主频 5.0 GHz 的 AMD EPYC 9575F 快 10%,对 128 核的 Intel Xeon 6980P 领先幅度更是高达 55%。
- Linux 内核编译:效率更是达到了主流 x86 处理器的 两倍。
3. 能效与互联
- Vera 的 TDP 为 450W,搭配的 LPDDR5X 内存功耗不到 50W。
- 它支持 NVLink-C2C 互联技术,可为 GPU 提供高达 1.8 TB/s 的带宽,是上一代产品的两倍,运行速度是 PCIe Gen 6 的 七倍。
- 同时,它还支持最新的 PCIe Gen 6 和 CXL 3.1 标准,为构建下一代数据中心提供了极高的扩展性。
三、顶级客户的背书与期待
此次交付的客户,无一不是 AI 领域的领导者,他们对 Vera 的评价也颇具参考价值。
-
Anthropic 计算负责人 James Bradbury 表示:“扩展算力是模型增长的重要加速器,在应对智能体工作负载的挑战时,我们很高兴看到 Vera 成为生态系统中一个充满潜力的新成员。”
-
OpenAI 计算基础设施负责人 Sachin Katti 对 Ian Buck 专程送来服务器表示感谢,NVIDIA 团队现场展示了系统内部构造。
-
SpaceXAI 方面,埃隆·马斯克在听取介绍后提出一连串问题,涵盖核心架构、内存布局以及散热设计等关键技术细节。目前,SpaceXAI 正在评估将 Vera 用于强化学习工作负载以及基于智能体的仿真流水线。
-
OCI 高级副总裁 Karan Batta 宣布了一项宏大计划:“OCI 计划从 2026 年开始部署数十万颗 NVIDIA Vera CPU,因为代理式 AI 需要在大规模下维持持续的性能。”
四、Vera CPU 的宏大部署版图
Vera 并非孤立的产品,它是 NVIDIA 最新 Vera Rubin 计算平台的核心组件。
在标准的 NVL72 机架配置中,可搭载 36 颗 Vera CPU 与 72 颗 Rubin GPU。而更强大的 NVL144 CPX 平台,则可集成 144 块 Rubin GPU 和 144 块 Rubin CPX GPU,配备 100 TB 高速内存和 1.7 PB/s 内存带宽,提供 8 EFLOPs 的 NVFP4 算力。
整个 Vera Rubin 平台预计于 2026 年下半年 开始大规模出货,届时,微软、谷歌、亚马逊、Meta 和甲骨文等云服务巨头将成为首批客户。
五、开启智能体 AI 的“CPU 时刻”
正如 Ian Buck 所言,“代理式 AI 正在 AI 工厂中催生一个全新的 CPU 时刻——随着模型从单纯的‘回答问题’转向主动‘采取行动’,Vera 正是为了保障这种工作负载在大规模下高效运转而量身打造的。”
Vera CPU 的正式交付,不仅意味着 NVIDIA 在 AI 计算版图上补上了一块关键拼图,更标志着 CPU 的角色正被重新定义,从传统的通用计算核心,演变为支撑智能体时代的关键底座。
未来,随着数十万颗 Vera CPU 在全球各大云数据中心部署到位,代理式 AI 的规模化应用将迎来真正的爆发期。
- 点赞
- 收藏
- 关注作者
评论(0)