AI Agent 技术演进三问:从 Workflow 到 Skill-First 时代,我们该关注什么?
作者说在前面: 这不是一篇技术科普,而是一次认知复盘。上周我和几个 AI 圈的朋友聊到 Agent 开发范式的变迁,发现大家其实都在不自觉地经历同一件事——我们的开发心智模型,正在被彻底重构。以下是我对这场变局的三个判断,enjoy。
一、范式转移:为什么确定性 Workflow 已经不够用了?
2023 年到 2024 年上半年,几乎所有 AI 应用开发者的起点都是同一个:Workflow。
你写一个 prompt,让模型按步骤执行;你定义条件分支,处理不同的输出结果;你拼接 API,让大模型成为流程中的一个环节。这是一个确定性的世界——输入可以被预测,路径可以被穷举,错误可以被兜底。
这套范式撑起了第一批 AI 应用。但它的天花板也很清楚:它只擅长"执行已知路径",无法应对真正的未知。
举一个很直观的例子:帮用户订一场差旅。Workflow 的思路是"查天气→选航班→比价→下单",每一步都是预设的。可如果用户说"帮我约一个在客户办公室附近、预算内、最靠谱的会议时间"?这不是一条路径,而是一个目标。它需要 Agent 自己拆解、自己规划、自己试错、自己修正。
这才是真实世界的需求。
所以我们看到范式在转移:从"让 AI 按我们写好的路走",到"告诉 AI 你要达到什么目标,然后放手让它规划路径"。 这是从 Worklow 到 Agent 的本质跃迁。
后者没有确定的路径,没有确定的工具调用序列,甚至没有确定的成功标准。Agent 需要持续做决策:现在该查什么?下一步该调用哪个工具?结果够不够好?要不要重来?
这个跃迁,带来的是开发复杂度的指数级上升——但也打开了真正的智能上限。
二、技术亮点:AgentLoop、Agent Skills、记忆飞轮
如果说第一个问题是"方向对了",那第二个问题就是"怎么把它做对"。
过去半年,有两个技术信号值得所有 Agent 开发者高度关注。
第一个是 Anthropic 的 Agent Skills。
Anthropic 在 Claude 模型能力之上,抽象出了一套 Skill 框架。简单说,它把"让模型完成特定任务"这件事,从 prompt 级别的技巧,升级为了可复用、可组合、可评测的业务单元。开发者不再为每个任务写一整套提示词,而是调用、组合、配置已有的 Skill。这是一种能力抽象层的建立,是 AI 应用走向工程化的关键一步。
第二个是 OpenClaw 的爆发。
OpenClaw 的核心贡献在于:它把 Agent 的运行时架构,做成了一套可插拔的框架。它提出了 AgentLoop(思考-执行循环)、Agent Skill 体系、记忆飞轮(Memory Flywheel)等核心概念,让开发者不是从零搭一个 Agent,而是在一个经过设计的架构上,聚焦业务逻辑。
这两个技术放在一起看,透露出同一个信号:
Agent 开发正在从"艺术"走向"工程"。 过去的 AI 开发高度依赖个人经验和 prompt 调优;未来,框架会负责运行时,Skill 负责业务能力,开发者真正需要关注的,是"做什么"和"做到什么程度",而不是"怎么做"。
这里有一个词值得圈出来——AgentLoop。它的含义是:Agent 在执行过程中不断"思考-行动-观察-调整",形成闭环。这不是新概念,但过去半年我们终于有了成熟的工程实现。这让 Agent 从"一次调用返回结果",变成了"持续运转的智能体"。
而记忆飞轮解决的问题更根本:Agent 如何在多轮交互中积累上下文,把"短期记忆"转化为"长期能力"?OpenClaw 提供的记忆架构,本质上是给 Agent 装上了一个可持续进化的知识系统。这两个能力组合在一起,才是真正意义上的"智能体",而不是"高级聊天机器人"。
三、未来展望:开发者不再需要全栈?
这是最让我兴奋的一个判断。
今天的 AI Agent 开发者在做什么?写 System Prompt、选模型、调 RAG、配工具链、处理 AgentLoop、管理记忆层、做错误恢复……一个全栈 Agent 开发者,需要同时懂产品、懂模型、懂 Infra,这本身就是一个极高的人才标准。
但技术演进的历史告诉我们:每一轮技术革命,都会带来分工重新分化。
Web 开发早期,每个开发者都要懂服务器、数据库、前端、安全。后来有了 LAMP 栈、有了 Rails/Django、有了云服务,开发者开始聚焦业务逻辑,infra 交给平台。今天 AI Agent 开发正处于类似的拐点。
未来的 Agent 开发,很可能呈现这样的结构:
- 业务开发者
——聚焦业务 Skill 的构建,设计评测标准,定义"这个 Agent 要完成什么任务,做得好不好怎么衡量"。 - 框架开发者
——像今天的 OpenClaw、LangChain 一样,负责 Agent 运行时、记忆系统、工具调用、安全 Guardrail 等基础设施。
这意味着,评测能力(Evaluation)会成为下一个关键基础设施。当 Agent 的行为变得自主且多样,如何衡量它的输出质量?如何建立可信的评测体系?这将是决定 Agent 是否真正可信赖的核心问题。
技能化开发(Skill-First Development)则是另一条主线。未来的 Agent 开发,关键词不是"我用什么模型",而是"我有哪些 Skill,这些 Skill 够不够好、能不能组合"。这正是 Anthropic Agent Skills 和 OpenClaw Skill 体系所指向的方向。
写在最后
三个判断,拼在一起其实是一句话:AI Agent 正在从"我们告诉它怎么做",走向"我们告诉它做什么,然后相信它能想明白怎么做"。
这场转变还没有完成,但它已经足够清晰——确定性 Workflow 退出舞台中央,自主规划 Agent 成为新主流;AgentLoop、Agent Skills、记忆飞轮这些技术亮点,开始定义什么是合格的 Agent 架构;而未来的开发者,可能会像今天使用 React 一样使用 Agent 框架,聚焦业务 Skill,而非重复造轮子。
剩下的唯一问题是:你准备站在哪一层?
如果你也在关注 AI Agent 的技术演进,欢迎在评论区聊聊你的判断。如果你觉得这篇文章有帮助,欢迎转发。
转自:https://mp.weixin.qq.com/s/14AJiobi6E1Zginfod1QSA
- 点赞
- 收藏
- 关注作者
评论(0)