大模型堆到天花板,Agent 激烈竞争

举报
霍格沃兹测试学社 发表于 2025/12/30 15:08:35 2025/12/30
【摘要】 2025年AI行业正从追求模型规模转向注重实际应用能力。大模型进化更强调稳定执行而非参数比拼,Agent逐渐成为能拆解任务、调用工具的新软件形态。AI Native以渐进方式重构软件工程,而具身智能虽热但商业化路径尚不清晰。在金融、医疗等领域,AI正从工具转变为可部署、可治理的业务流程核心。行业洗牌的关键,在于能否将AI稳定嵌入真实系统并完成闭环交付。

2025 年,AI 行业表面上依旧喧闹: 新模型、新 Agent、新概念层出不穷。

但如果你把视线从发布会、榜单和融资新闻上移开,会发现一个更重要的变化正在发生——行业评判标准正在整体迁移

过去问的是:

谁的模型更大?谁的参数更多?谁的榜单更靠前?

现在越来越多人开始问:

这个东西,能不能稳定跑在真实系统里?


一、大模型还在进化,但已经不靠“震撼”取胜了

过去两年,大模型的主旋律是 Scaling: 堆参数、堆算力、堆数据,用规模换能力。

但到 2025 年,一个明显信号是:模型确实变强了,却很少再让人“被震到”。

真正的变化,不在训练阶段,而在使用阶段



越来越多的工程实践表明:

  • 多步推理的稳定性在提升
  • 模型对复杂指令的“跑偏率”在下降
  • 不再依赖极端 Prompt,也能完成完整任务链

这并不是模型突然“更聪明”, 而是模型开始被系统能力托住了

记忆管理、工具调用、推理结构、执行编排,正在成为模型能力上限的一部分。

一句话总结就是:

模型正在从“单次输出能力”,进化为“可持续运行能力”。


二、Agent 不再是 PPT,而是一种新软件形态

如果说 2024 年的 Agent 更像演示视频, 那么 2025 年,Agent 开始真正进入生产系统

变化的关键不在“能不能聊天”, 而在“能不能干活”。


Agent 带来的本质变化是:AI 从回答者,变成了执行者。

它开始具备三种能力:

  • 拆解任务
  • 调用真实工具和系统
  • 在复杂环境中持续运行

这也是为什么今年 Agent 技术出现明显分化:

  • 上层:编程、运维、客服、数据分析等场景,已经能算 ROI
  • 下层:沙箱、权限、隔离、成本控制,成为新的基础设施竞争点

一个现实也逐渐清晰:只卖“Agent 能力”,会越来越难活。

因为模型、框架、工具正在被快速开源, 真正值钱的,不是“会不会用 Agent”, 而是——能不能用 Agent 把事交付完


三、AI Native 正在重写软件工程,而不是重写 PPT

很多人把 AI Native 理解成: “在系统里接个大模型接口”。

但在工程侧,这种理解已经明显不够了。

AI Native 真正关心的问题是:

当 AI 是系统的默认能力,软件还该怎么设计?

2025 年的一个共识是:AI Native 不会推倒重来,而是渐进式侵入。

现实中的主流路径更像是:

  • 保留原有系统
  • 在其之上叠加 Agent、决策层、增强层
  • 逐步让 AI 接管“判断”和“执行”的一部分

这也解释了一个矛盾现象: AI 无处不在,但真正的 AI Native 系统仍然很少。

原因很简单: 系统复杂度、可控性、合规和成本,比模型难太多。

但有一件事已经不可逆——研发流程本身,正在被 AI 重构。


四、具身智能很热,但行业内部其实很冷静

2025 年,具身智能几乎是最“热闹”的赛道之一。

厂商数量暴涨、融资频繁、人形机器人刷屏不断。 但在行业内部,判断却异常谨慎。

多个共识正在形成:

  • 还没有真正的“ChatGPT 时刻”
  • 数据、模型、硬件路径远未收敛
  • 大多数本体厂商,很难长期存活

问题并不在“有没有技术进步”, 而在于:进步还不足以支撑规模化商业落地

世界模型被寄予厚望, 但它更像一条“长期正确”的路线,而非短期解药。

行业更现实的判断是: 谁能先在一个单一场景里跑通 净利润闭环, 谁才有资格进入下一轮。


五、金融、医疗、教育:AI 开始真正进入主流程

相比前沿技术的不确定性, 传统行业在 2025 年反而显得格外务实。

几个共同特征非常明显:

  • AI 不再只是工具,而是流程的一部分
  • 模型调用规模进入“基础设施级”
  • 成败标准从 Demo 效果,变成业务指标

在金融、医疗、教育这些领域, AI 正在从“提效插件”,走向“系统协作者”。

参数大小不再重要,能否低成本、可部署、可治理,才是核心竞争力。


结语:真正的洗牌,才刚刚开始

回看 2025 年,一个判断越来越清晰:

  • 赢的不是最会讲故事的
  • 也不是模型最大的
  • 而是能把 AI 稳定嵌入现实系统

大模型正在退居底座, Agent 开始进入执行层, 系统工程能力决定体验与成本。

AI 正在从“智能展示”,走向“智能执行”。

而这一次洗牌,不看热度, 只看一件事:你能不能在真实世界里,把事情做完。

【声明】本内容来自华为云开发者社区博主,不代表华为云及华为云开发者社区的观点和立场。转载时必须标注文章的来源(华为云社区)、文章链接、文章作者等基本信息,否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。