《全球机器学习技术大会:阿里云张玉明解密通义灵码AI程序员》

本文涉及的产品
应用实时监控服务-应用监控,每月50GB免费额度
函数计算FC,每月15万CU 3个月
任务调度 XXL-JOB 版免费试用,400 元额度,开发版规格
简介: 4月18日至19日,2025全球机器学习技术大会(ML-Summit)在上海成功举办。大会聚焦人工智能与机器学习前沿技术,吸引了众多行业精英参与。阿里巴巴高级技术专家张玉明以“通义灵码 AI 程序员解密”为主题发表演讲,分享了AI辅助编程工具如何重塑软件开发范式。通义灵码通过大模型和Agent技术,实现从辅助编码到对话式编程的跨越,未来将进入AI自主编程阶段。张玉明还介绍了通义灵码的核心技术架构及典型应用场景,并展望了智能编程的未来发展。

4 月 18 日 - 19 日,由 CSDN & Boolan 联合举办的 2025 全球机器学习技术大会(ML-Summit)于上海顺利举行。大会聚焦人工智能与机器学习前沿技术,汇聚了来自科技与人工智能领域的数位顶尖专家以及数千名开发者和研究者,吸引了来自电商、金融、汽车、智能制造、通信、工业互联网、医疗、教育等众多行业的精英参会听众,共同探讨人工智能领域的前沿发展和行业最佳实践。

1.jpeg

阿里巴巴高级技术专家张玉明作为特邀讲师,以通义灵码 AI 程序员解密:AI Agent 在软件研发领域的落地实践为主题的演讲,成为本次大会的一大亮点。

阿里巴巴高级技术专家张玉明围绕主题阐述了随着大语言模型技术的快速发展,AI 辅助编程工具正在重塑软件开发范式。深入剖析了通义灵码 AI 程序员的技术架构与实践经验,探讨如何通过 AI Agent 技术突破传统智能编码助手的能力边界。演讲重点分享了基于大模型的代码全工程理解与代码生成、Agent 框架设计、模型训练等关键技术,以及在需求理解、多文件代码变更、单测生成等场景的创新应用。

2.jpeg


AI 编码工具的发展情况


阿里巴巴高级技术专家张玉明从 2020 年到 2022 年期间是如何通过智能化手段面向代码编写、代码评审以及代码检测这三个核心研发场景进行能力建设引出 AI 2.0 时代的到来。近年 AI 编码工具产品飞速演进,AI Coding 俨然已成为大模型落地的最佳应用场景。

3.jpg

以通义灵码为例,从工具的使用角度出发讲述 AI 与人的协同编码模式,主要会经历三个阶段:辅助编码阶段,这一阶段灵码的代码生成占比平均能超过 30%;当前所处在的是面向任务的协同编程阶段,这一阶段程序员的主要工作是任务的澄清、过程的干预和结果的审查,灵码的代码生成占比差不多是 50%;并表示未来会进入 AI 自主编程的高级阶段,AI 的代码生成占比将会超过人类,具体形式是通过多 Agent 协同来完成端到端的需求级任务开发,人在里面负责的工作是创意、需求的澄清和结果的验收。灵码的规划目标是尽快越过当前协同编程阶段,率先进入自主编程的高级阶段。

4.jpg


大语言模型下的软件研发新范式


阿里巴巴高级技术专家张玉明提到从场景上讲辅助编码和协同编程的区别在于,开发者从专注于 IDE Edit 区在编码时基于大语言模型生成的代码提示按下 Tab 键进行确认,逐步过渡到将更多的关注和操作放到了 IDE 会话区基于 Agent 模式的对话式编程,这时的 IDE 的智能辅助已超越传统补全,演变为自主决策规划型协作者,环境感知 + 自主决策将成为后续智能编码工具的标配。而对话式编程简单讲就是人类通过自然语言描述,与工具以对话的方式进行交互,从而完成代码的编写。张玉明表示:"编程发展到这一步既是突破也是顺理成章,就像从一开始的机器语言到汇编再到现在的高级编程语言。高级编程语言帮我们屏蔽掉了汇编语言的使用复杂度,类推自然语言也迟早会屏蔽掉高级编程语言,这一天的到来相信并不遥远。"


编码智能体从产品层面可以如何更好支持对话式编程

基于 AI AgentAI 编码能力将从行级、片段级生成跨越到面向工程的多文件生成;可以进一步实现上下文自动感知、编程工具自动使用、自动功能验证、自我反思迭代等自动化能力。进而支持开发者只需要输入准确的需求和上下文,AI 可自主完成从需求理解、任务规划、代码生成、DIFF 应用全过程。开发者无需从零开始编码,而是基于 AI 生成结果完成任务。随着模型能力、Agent 能力的成熟,开发者可以更加信任 AI,并倾向于将尽可能多的编码任务交给 AI 完成。此时称之为的信任拐点已经到来,AI 更加拟人,从一个辅助生成功能,变成了可以交流沟通的编程伙伴。

5.png


通义灵码 AI 程序员核心技术能力构建



从工程实现角度来讲张玉明认为有三个关键能力至关重要,即:

6.jpg


通义灵码 AI 程序员系统流程设计

结合对话式交互,在开发者输入具体需求描述后,AI 程序员结合用户手动引入的上下文、Codebase 检索结果、长短期记忆等进行提示词组装,然后经过服务端大模型的意图识别及推理规划,触发客户端本地 Agent 工具调用,基于工具执行结果进行推理或反思迭代,进而生成编码方案并将代码 diff 自动 Apply 到本地工程文件实现文件改写,最后由用户针对改动进行审查。

7.jpg


通义灵码 AI 程序员 Agent 框架

其设计上整体分为三层:

Core 层主要由 Graph、Memory、Tool 等核心模块组成。其中 Graph 模块主要包含 State、Node、Edge 等组件,负责 workflow 和 agent 的编排。Memory 模块负责处理长短期记忆。Tool 模块负责模型工具的定义和调用。

中间是 Extension 层,主要在 LangChain 和 LangGraph 的 Chain 和 Node 的基础上再抽象一层来支持 Agent 的实现,目的是能够更便捷的实现 Agent 和 Multi Agent;另外是可以友好的支持工具、大语言模型和 RAG 的扩展。

最上面是 Manager 层,主要负责 Agent 注册、维护,会话管理,多 Agent 编排及 Agent 框架和外部交互的接口。

8.jpg

在理想情况下,基于工程感知能力基础上的一次需求实现的流程时序如图所示:首先由用户在 IDE 插件端输入需求描述,Lingma Agent 将可用的检索工具信息及必要的工程上下文给到大模型,大模型综合上下文理解需求和工程结构,生成规划,通过调用向量检索工具召回与需求语义相似的代码片段,通过关键字检索工具返回相关代码,通过引用关系检索工具查看依赖调用关系并进一步返回相关代码,合并、去重、排序后返回最相关的上下文,进而让大模型生成代码编辑方案,再由 Lingma Agent 完成源文件的变更,最终实现用户需求。

9.jpg

10.jpg


AI 程序员典型使用场景


  • 新功能开发:基于自定义的应用框架,结合任务描述,快速完成工程文件初始化;基于已有工程进行功能迭代,进行批量代码修改,帮助开发者快速完成研发任务。
  • 跨语言编程:让开发者跨越编程语言的边界,拥有全栈能力,如 Java 开发者也可以与 AI 程序员协同,进行前端开发,或使用 PythonJavaScript 等多种语言,快速编写小工具、小游戏。
  • 单元测试编写:结合被测函数和文件,帮助开发者批量生成单元测试,并完成编译和运行,比如针对每天完成的新增代码,进行单元测试覆盖,大幅提效。
  • 错误排查及修复:当开发者遇到编译、调试错误,可以在 IDE 中选择错误信息,或者直接提交报错信息截图,灵码可自动进行分析,给出解决方案和代码修改建议,帮助开发者快速进行问题排查修复。

11.jpg


下一步展望:持续构建智能编程的未来


阿里巴巴高级技术张玉明表示下一阶段,在 IDE 侧会秉承简单、智能、主动学习三个核心原则去打造通用研发智能体。

简单指的是产品交互简洁,用户理解、使用门槛低;智能指的是完全由模型驱动,不做工作流式的解决方案,完全基于模型的自主规划、反思及工具使用能力打造 ReAct 模式智能体;主动学习指的是能够根据用户行为偏好总结用户画像、将成功经验自动沉淀以应用于未来相似的任务,进而形成智能体长期记忆,使通用研发智能体越来越聪明、越来越懂开发者。除了以上三个核心原则,在产品功能建设层面,加入更多IDE 原生工具能力,如 Lint 工具、Debug 工具等,使其与 Agent 无缝结合,进一步提升编码效率和质量;同时通过 MCP 工具市场接入丰富的三方工具,不断扩展 Agent 能力边界;另外通过自定义规则及工具配置支持用户定制符合个性化研发场景的自定义智能体。

12.jpg

13.jpg

阿里巴巴高级技术专家张玉明的演讲引发了参会者的广泛关注和热烈讨论。通义灵码 AI 程序员不仅提高了开发效率和质量,降低了开发成本,还为开发者提供了更加便捷和高效的开发体验。相信在未来,随着技术的不断进步和应用场景的不断拓展,通义灵码 AI 程序员可以为开发者带来更多的可能性。

14.jpg

最后阿里巴巴高级技术专家张玉明表示:"人工智能技术正在重塑千行百业,希望通过我们的不断努力和探索,能够将软件研发这项工作变得更简单、更有趣且更有价值。"

相关文章
|
7月前
|
机器学习/深度学习 人工智能 程序员
《全球机器学习技术大会:阿里云张玉明解密通义灵码AI程序员》
4月18日至19日,2025全球机器学习技术大会(ML-Summit)在上海成功举办。大会聚焦人工智能与机器学习前沿技术,吸引了众多行业精英参与。阿里巴巴高级技术专家张玉明以“通义灵码 AI 程序员解密”为主题发表演讲,分享了AI辅助编程工具如何重塑软件开发范式。通义灵码通过大模型和Agent技术,实现从辅助编码到对话式编程的跨越,未来将进入AI自主编程阶段。张玉明还介绍了通义灵码的核心技术架构及典型应用场景,并展望了智能编程的未来发展。
《全球机器学习技术大会:阿里云张玉明解密通义灵码AI程序员》
|
7月前
|
人工智能 自然语言处理 运维
Bolt.diy 一键部署,“一句话”实现全栈开发
Bolt.diy 是 Bolt.new 的开源版本,提供更高灵活性与可定制性。通过自然语言交互简化开发流程,支持全栈开发及二次开发,使零基础开发者也能实现从创意到云端部署的完整链路。本方案基于阿里云函数计算 FC 搭建,集成百炼模型服务,快速完成云端部署。用户可通过对话开启首个项目,两步完成部署并获300社区积分。方案优势包括多模型适配、高度定制化、全栈开发支持及智能化辅助工具,助力高效开发与创新。
770 102
|
人工智能 运维 监控
支付宝技术风险负责人陈亮:把事情做到极致,技术的差异性才会体现出来
只有真正做到极致,技术的差异性才会体现出来。
6399 0
|
7月前
|
存储 Kubernetes 对象存储
StrmVol 存储卷:解锁 K8s 对象存储海量小文件访问性能新高度
本文介绍了阿里云容器服务(ACK)支持的StrmVol存储卷方案,旨在解决Kubernetes环境中海量小文件访问性能瓶颈问题。通过虚拟块设备与内核态文件系统(如EROFS)结合,StrmVol显著降低了小文件访问延迟,适用于AI训练集加载、时序日志分析等场景。其核心优化包括内存预取加速、减少I/O等待、内核态直接读取避免用户态切换开销,以及轻量索引快速初始化。示例中展示了基于Argo Workflows的工作流任务,模拟分布式图像数据集加载,测试结果显示平均处理时间为21秒。StrmVol适合只读场景且OSS端数据无需频繁更新的情况,详细使用方法可参考官方文档。
735 144
|
7月前
|
消息中间件 人工智能 运维
乐言科技:云原生加速电商行业赋能,云消息队列助力降本 37%
乐言科技依托云原生架构及阿里云云原生产品体系,实现基础设施与业务解耦以及弹性调度,在提升业务稳定性的同时,显著增加研发效能并降低运维成本,加速电商客户定制化需求交付,推动云计算与 AI 技术在电商领域的深度融合。
482 102
|
7月前
|
缓存 JavaScript 前端开发
|
7月前
|
消息中间件 人工智能 Kafka
【云故事探索】NO.14:乐言科技——云原生加速电商行业赋能,云消息队列助力降本 37%
上海乐言科技股份有限公司专注于AI技术,提供电商、金融等领域的整体解决方案。其核心产品“乐语助人”智能客服机器人日均服务超千万人次,助力六万余家电商客户数智化转型。为解决自建消息队列痛点,乐言科技采用阿里云消息队列RocketMQ版Serverless系列,实现业务稳定、开发成本降低、运维效率提升及资源弹性降本37%。通过云原生架构,乐言科技推动AI与电商深度融合,助力行业创新突破。
|
7月前
|
存储 人工智能 测试技术
DeepWiki:告别迷茫!AI轻松解析Github代码库
DeepWiki 的核心目标是帮助开发者快速理解复杂的代码仓库。无论是公共仓库还是私有项目,它都可以通过简单的操作生成类似 Wikipedia 的文档页面。
|
人工智能 弹性计算 Cloud Native
超强辅助,Bolt.diy 一步搞定创意建站
Bolt.new 是 stackblitz 推出的一款 AI 编辑器,结合人工智能与 WebContainers 技术,支持无需复杂配置的完整开发环境。其开源版本 Bolt.diy 基于阿里云百炼模型服务和函数计算 FC,提供灵活定制、全栈开发支持及多模型适配能力。