我如何用Skills+Postman,让接口测试用例自动生成、自动维护,半年零手工更新
很多人已经开始感觉到,接口测试用例写起来不难,难的是维护。
需求一周变三次,字段增减随心意,前端改了后端没改,后端改了文档没改。等到你发现用例红了,已经是凌晨两点,上线窗口还剩半小时。
更焦虑的是,AI来了。GitHub Copilot能帮你写代码,ChatGPT能帮你生成用例,但没人告诉你——用例生成之后,谁负责让它别死掉?
我去年下半年开始,用一套组合方式重构了团队的接口测试流程。到现在快六个月,Postman里的用例集合没有一次手工增删改。不是用例不变,是变化来了,它自己就同步了。
核心工具就两个:Postman + Skills(大模型的自定义能力)。
今天拆开讲,这套东西到底怎么转起来的。
目录
一、手工维护接口用例正在成为历史
二、Skill不是聊天助手,是执行链路
三、从变更到用例更新的闭环怎么搭
四、一个订单接口的对比实验
五、这套模式对三类人意味着什么
六、留一个问题
一、手工维护接口用例正在成为历史
接口测试领域有个隐性共识:用例的维护成本,已经超过了编写成本。
刚启动项目时,写一百个用例很快。但三个月后,业务迭代了十几个版本,接口字段改了五六轮,你再回头看那套用例——要么红一片,要么还在断言早就不存在的字段。
本质不是写用例的人不行,是手工维护跟不上变化的节奏。
最近半年,行业里开始推“AI生成用例”。但绝大多数方案停在第一步:给大模型一段接口文档,它给你吐一堆JSON。看起来漂亮,实际没法用。因为第二天接口变了,模型不知道。
真正要解决的问题不是“怎么生成”,而是“怎么在变化中持续同步”。
我选择的切入点是:把Postman当执行层,把Skills当决策层。两者之间不靠手工,靠一个自动化的反馈闭环。
二、Skill不是聊天助手,是执行链路
很多人对Skills的理解还停留在“高级提示词”。实际上,一个可用的Skill至少包含三层:
-
感知层:能读取接口定义(OpenAPI/Swagger)、代码变更记录、运行日志 -
决策层:能判断哪些用例需要更新、怎么更新、优先级如何 -
执行层:能调用Postman API,完成用例的增删改查
核心在于:Skill不是让你跟它聊天,而是让它直接操作工具。
我做的第一件事,是把接口文档的变更历史接入一个自定义Skill。每次代码合并后,CI会自动把变更的接口定义推给这个Skill。Skill对比新旧两份OpenAPI,输出三样东西:
-
哪些接口的字段发生了变化 -
哪些断言需要跟着改 -
生成一份可执行的Postman Collection Patch
然后通过Postman API直接应用这份Patch。整个过程没有人工打开Postman界面,没有复制粘贴,没有手改字段名。
本质上,我把“接口用例维护”从一个知识工作,变成了一个数据处理工作。Skill负责判断,机器负责执行。
三、从变更到用例更新的闭环怎么搭
这个机制能跑通,不是因为Skill有多聪明,是因为我把闭环设计清楚了。
下图是整个流程的骨架:

这里有几个关键设计,不是随便能省略的。
第一,Skills只处理结构变化,不处理业务逻辑。
如果接口字段从user_id改成userId,Skill直接批量替换所有用例里的断言。但如果业务规则从“金额必须大于0”变成“金额必须大于等于0.01”,Skill不会擅自改,而是标记出来,触发人工确认。
边界清晰,才不会搞出大面积误判。
第二,Postman的Collection被当作代码管理。
我们把所有Postman用例导出为JSON,放进Git仓库。Skill生成的Patch,本质上是对这个JSON的差异描述。这样任何改动都可以走Code Review,哪怕Skill自动生成的,也要经过PR评审才能合入。
半年零手工更新,不代表零审核。但审核成本从“逐条改用例”降到了“确认差异报告”,平均每次不超过两分钟。
第三,反馈闭环必须闭环到执行。
很多团队只做到“Skill生成用例建议”,然后发邮件通知人去改。这不是自动化,这是换了一种形式的通知。
我们的闭环终点是:Skill调Postman API完成更新后,自动触发Newman跑一遍该接口的回归测试。如果全绿,闭环结束。如果有失败,Skill再分析失败原因,判断是断言写错了还是接口真出了问题。
这套跑顺之后,我几乎不再打开Postman的界面。工具变成了后台服务。
四、一个订单接口的对比实验
去年三季度,我们有一个典型场景:订单详情接口。
版本1返回:
{"order_id": "123", "status": 1, "amount": 99.5}
版本2增加了sub_status和promotion_id,调整了amount为字符串类型。
手工维护的做法:打开Postman,找到十几个关联用例,挨个改断言,改变量引用,改Mock数据。全改完加测试,一个人一下午。
Skills+Postman的做法:
-
后端PR合并,OpenAPI更新 -
Skill在30秒内输出差异报告:新增两个字段,一个类型变更 -
自动生成Patch:涉及7个用例,断言从 amount == 99.5改为amount == "99.5",新增sub_status存在性断言 -
通过API应用到Collection,自动提交PR -
我花了不到一分钟看差异,确认无误后合并 -
Newman自动跑完全部用例,全绿
总耗时:我的时间不到两分钟,机器时间不到五分钟。
这不是省了多少小时的问题,是这类工作从此从我的任务清单里消失了。我可以去想测试策略、去分析线上问题,而不是反复打开JSON对比工具。
五、这套模式对三类人意味着什么
对在校生: 别再只学怎么手写测试用例了。工业级测试的核心矛盾已经从“怎么写”变成了“怎么维护”。你如果能说清楚“怎么让用例跟上代码”,面试官会高看你一眼。这套模式的本质,是把测试工程化,而不是手工化。
对初级工程师: 你可能会觉得“我连Postman API都没调过,怎么做”。没关系,这反而是切入点。先试着写一个脚本,从OpenAPI生成最简单的Postman Collection。然后加上增量更新。再然后,把Skill搭进去。每完成一层,你就从“执行者”往“设计者”走了一步。
对中级工程师: 你现在面临的不是用例写不完,是团队用例越堆越烂。与其花时间Review每个人写的断言,不如把“能自动化的判断”全部交给Skill。你要做的是定义规则,而不是替人干活。半年零手工更新,不是因为我勤快,是因为我把规则写死了。
一个可传播的观点句:
接口测试的未来不是更多的用例,而是更少的维护。
Skills的本质,是用代码执行能力填补大模型的确定性缺口。
你花在维护上的每一分钟,本可以用来发现一个线上缺陷。
六、留一个问题
你现在回头看一下自己的接口测试体系——从接口变更发生,到用例被更新、断言被修正、回归被执行——这条链路上,有没有任何一个环节是自动闭环的?
如果没有,那“用例失效”就不是偶然,而是必然。
一个更扎心的问题:你现在的系统,允许用例自己“看到”接口变化吗?
欢迎在评论区聊一聊,你团队里的接口用例,最长连续不用手工维护的记录是多久。
- 点赞
- 收藏
- 关注作者
评论(0)