从人工到AI驱动:天猫测试全流程自动化变革实践

简介: 天猫技术质量团队探索AI在测试全流程的落地应用,覆盖需求解析、用例生成、数据构造、执行验证等核心环节。通过AI+自然语言驱动,实现测试自动化、可溯化与可管理化,在用例生成、数据构造和执行校验中显著提效,推动测试体系从人工迈向AI全流程自动化,提升效率40%以上,用例覆盖超70%,并构建行业级知识资产沉淀平台。

在AI时代天猫技术质量同学在质量保障方面也不断探索AI在测试全流程提效的落地方案,传统测试工作链条拆解为“需求解析 → 用例生成 → 数据构造 → 执行验证 → 对比校验”五大核心阶段,而我们的目标是通过AI+自然语言驱动,实现全流程自动化、可溯化、可管理化。而最AI参与到测试中来,最主要的目标就是提效,目前几个月的实践下来发现在用例生成、测试数据构造和交易链路数据执行的过程中提效明显,下面来给大家简单介绍一下AI参与在测试流程中的实践方案。


一、测试体系变革:从人工到AI自动化


1. 传统手工测试的痛点

在传统模式下,测试链路主要靠人工推动,流程分散、效率低下、数据覆盖不全且复用性差。人工设计用例容易受主观影响,测试数据构造耗时且易遗漏,结果校验繁琐且易出错,测试报告依赖人工整理,迭代响应迟缓。


2. 从纯手工测试到AI辅助的转变

1. 手工测试 → AI辅助半自动化:以数据与校验为突破口在手工测试阶段,所有环节(用例设计、数据构造、执行与校验、报告生成)完全依赖人工,测试效率受限于人力投入,且数据构造易出现覆盖不全、校验结果易受主观判断干扰。 向AI辅助半自动化阶段的转变,首次突破点在于测试数据构造与结果校验的提效:

  • 数据构造:通过引入AI生成工具(如交易测试数据批量构造),在人工定义核心规则后,AI可快速辅助进行数据对比,大幅减少人工构造重复性数据的时间成本。 校验环节:利用自动化脚本配置(结算数据批量校验等工具),例如通过预设的汇金收款账号、出款账号信息进行批量对比,显著降低人工校验的漏检率与耗时。 同时,测试报告生成实现完全自动化,但用例设计仍依赖人工经验,这一阶段标志着测试流程从“全人工”向“人与AI协作”的初步过渡。


2. AI辅助半自动化 → AI全流程自动化:在交易链路测试的探索及实践的过程中,AI辅助的半自动化阶段,虽然数据构造与校验效率已提升,但测试用例的设计由人工设计。

这个阶段探索通过使用AI的介入实现全环节自动化:

  • 用例设计:AI通过分析用户对需求文档的核心内容解析,自动生成覆盖核心功能用例,由人机交互补充异常case,极大提升测试用例的设计效率。
  • 数据构造升级:基于自动生成的测试用例模板,进行大模型训练自动生成匹配的测试数据。减少人工构造测试数据的时间成本。
  • 经过多次的训练、模型的选择、自然语言的调试,实现了简单需求的全流程自动化测试:从需求输入到测试执行,虽然人在这个过程中仍然处于主导作用,但是人工介入的成本非常低,而AI则承担核心的执行能力,人工仅需介入异常复核或策略优化,实现测试效率的指数级提升与质量的持续优化。


3. 智能流程融合与持续优化:在AI辅助流程半自动化过程中我们发现AI虽然深入参与了需求测试的全流程,但是用例资产无法沉淀、测试数据无法构造等问题限制了后续能力的拓展,所以在第三阶段我们通过多个工程系统对接(用例管理平台、测试数据构造平台、知识库沉淀)实现了真正的数据变为资产、AI全流程驱动的工程化模式

  • AI生成用例同步至用例管理平台,实现团队多角色协作、历史用例沉淀。
  • AI结合数据工厂和工具编排,自动感知业务变更,快速调整测试范围与策略,知识资产不断沉淀。


4.实践效果展示:

  • 用例生成及编辑:根据用户输入的测试分析进行测试用例组装,并支持人机交互式修改;


  • 测试数据构建:通过调用底层测试数据数据平台通过关键词匹配获取测试数据,批量构建测试数据;

  • 测试数据执行:通过从提示词中获取用户指令将测试数据推进到指定状态,支持批量执行;


二、AI全链路自动化测试所需关键能力

通过不断的摸索与探索,我们总结出了一套可复用、可实现的思路及方案。

1. 流程编排与统一入口

  • 平台实现用例设计、数据生成、测试执行、校验、报告归档“一站式”自动编排。
  • 工作流引擎支持分支条件、异常管理,提升复杂链路测试的灵活性与准确率。
  • 打通内部用例管理与外部数据源,支持历史场景回溯与快速应对新业务。

2. AI智能理解与场景建模

  • 支持自然语言输入业务需求,AI自动拆解为结构化测试场景和执行步骤。
  • 基于GPT等大模型持续训练,提升语义理解和场景覆盖能力。
  • 高级异常场景推理,覆盖边界case与特殊类型,防止因场景遗漏产生业务风险。

3. 自动化工具集成与API调用

  • 支持用例管理平台、数据构造平台、数据结果校验能力 等核心平台及API能力串联,完成数据自动化执行及校验的闭环。

4. 测试数据工厂及智能分配

  • 根据测试用例及关键信息由AI自动匹配高质量测试商品、买家、卖家、门店等数据。
  • 自动校验数据有效性与覆盖率,平台自动预警数据孤岛和缺失场景。
  • 动态维护实时商品池,支持数据历史追溯与用例复用。

5. 智能校验、报告与归档能力

  • 自动解析交易链路回流数据,关键字段自动比对(如资金分账、退款、账单等)。
  • 校验方案高度可配置,支持跨平台、跨链路数据的多维对比。
  • 报告自动化输出,支持Markdown表格、XMind脑图、用例平台同步,实现一键推送业务与管理团队。

6. 用例协作与行业知识资产沉淀

  • 提供用例规划管理、版本归档、需求变更自动跟进、多团队复盘协作。
  • 实现测试经验沉淀与共享,推动知识资本化与持续创新,提高团队测试能力基线。
  • 支持AI驱动的用例复用与补全,让平台成为行业方案孵化的智库。


三、技术架构实践与数据流示意

基于以上基础思路将知识库、数据构造平台、测试用例管理平台通过AI进行连接,实现需求的全链路自动化测试。

平台能力及功能介绍


四、落地收获与未来趋势

效果与现状:

  • 已在多业务线实现自动化测试全链路落地,需求-用例-数据-执行-校验贯穿周期缩短40%。
  • AI自动生成用例覆盖度超过70%,极大释放产力。

创新展望:

  • 拓展AI在需求测试中的覆盖范围,构建行业级测试知识库,平台用例、自动化工具、AI模型双向沉淀,推动三方协作与方案共建。
  • 驱动研发/测试一体化自动化运转。



来源  |  阿里云开发者公众号

作者  |  千流

相关文章
|
14天前
|
数据采集 存储 人工智能
从0到1:天猫AI测试用例生成的实践与突破
本文系统阐述了天猫技术团队在AI赋能测试领域的深度实践与探索,讲述了智能测试用例生成的落地路径。
从0到1:天猫AI测试用例生成的实践与突破
|
16天前
|
存储 人工智能 安全
云栖大会|AI驱动的智能数据湖仓,高性能实时分析与深度洞察
2025云栖大会“AI驱动的智能数据湖仓”专场,汇聚夺畅、聚水潭、零跑汽车等企业及阿里云瑶池团队,分享AI时代下数据管理到分析的全链路实践,涵盖智能计算、弹性架构、多模态处理与数据安全,共探Data+AI融合新范式。
|
16天前
|
人工智能 运维 关系型数据库
云栖大会|AI时代的数据库变革升级与实践:Data+AI驱动企业智能新范式
2025云栖大会“AI时代的数据库变革”专场,阿里云瑶池联合B站、小鹏、NVIDIA等分享Data+AI融合实践,发布PolarDB湖库一体化、ApsaraDB Agent等创新成果,全面展现数据库在多模态、智能体、具身智能等场景的技术演进与落地。
|
17天前
|
人工智能 自然语言处理 Shell
我们开源了一款 AI 驱动的用户社区
KoalaQA 是一款开源的 AI 驱动用户社区,支持智能问答、语义搜索、自动运营与辅助创作,助力企业降低客服成本,提升响应效率与用户体验。一键部署,灵活接入大模型,快速构建专属售后服务社区。
我们开源了一款 AI 驱动的用户社区
|
20天前
|
人工智能 自然语言处理 测试技术
让AI帮你跑用例-重复执行,不该成为测试工程师的主旋律
测试不该止步于重复执行。测吧科技推出用例自动执行智能体,通过AI理解自然语言用例,动态规划路径、自主操作工具、自动重试并生成报告,让测试工程师从“点点点”中解放,专注质量思考与创新,提升效率3倍以上,节约人力超50%,重构测试生产力。
|
10月前
|
数据可视化 前端开发 测试技术
接口测试新选择:Postman替代方案全解析
在软件开发中,接口测试工具至关重要。Postman长期占据主导地位,但随着国产工具的崛起,越来越多开发者转向更适合中国市场的替代方案——Apifox。它不仅支持中英文切换、完全免费不限人数,还具备强大的可视化操作、自动生成文档和API调试功能,极大简化了开发流程。
|
5月前
|
Java 测试技术 容器
Jmeter工具使用:HTTP接口性能测试实战
希望这篇文章能够帮助你初步理解如何使用JMeter进行HTTP接口性能测试,有兴趣的话,你可以研究更多关于JMeter的内容。记住,只有理解并掌握了这些工具,你才能充分利用它们发挥其应有的价值。+
868 23
|
7月前
|
SQL 安全 测试技术
2025接口测试全攻略:高并发、安全防护与六大工具实战指南
本文探讨高并发稳定性验证、安全防护实战及六大工具(Postman、RunnerGo、Apipost、JMeter、SoapUI、Fiddler)选型指南,助力构建未来接口测试体系。接口测试旨在验证数据传输、参数合法性、错误处理能力及性能安全性,其重要性体现在早期发现问题、保障系统稳定和支撑持续集成。常用方法包括功能、性能、安全性及兼容性测试,典型场景涵盖前后端分离开发、第三方服务集成与数据一致性检查。选择合适的工具需综合考虑需求与团队协作等因素。
915 24
|
7月前
|
SQL 测试技术
除了postman还有什么接口测试工具
最好还是使用国内的接口测试软件,其实国内替换postman的软件有很多,这里我推荐使用yunedit-post这款接口测试工具来代替postman,因为它除了接口测试功能外,在动态参数的支持、后置处理执行sql语句等支持方面做得比较好。而且还有接口分享功能,可以生成接口文档给团队在线浏览。
276 2