加速智能体开发:从 Serverless 运行时到 Serverless AI 运行时

本文涉及的产品
函数计算FC,每月15万CU 3个月
Serverless 应用引擎免费试用套餐包,4320000 CU,有效期3个月
简介: 在云计算与人工智能深度融合的背景下,Serverless 技术作为云原生架构的集大成者,正加速向 AI 原生架构演进。阿里云函数计算(FC)率先提出并实践“Serverless AI 运行时”概念,通过技术创新与生态联动,为智能体(Agent)开发提供高效、安全、低成本的基础设施支持。本文从技术演进路径、核心能力及未来展望三方面解析 Serverless AI 的突破性价值。

作者:洪晓龙(墨飏)


1761102307590_B3F2D28F-235A-44ff-A264-7AB273AA55EA.png

本文整理自 2025 云栖大会,阿里云智能集团产品专家,洪晓龙演讲议题《函数计算:AI 时代的最佳运行时》


在云计算与人工智能深度融合的背景下,Serverless 技术作为云原生架构的集大成者,正加速向 AI 原生架构演进。阿里云函数计算(FC)率先提出并实践“Serverless AI 运行时”概念,通过技术创新与生态联动,为智能体(Agent)开发提供高效、安全、低成本的基础设施支持。本文从技术演进路径、核心能力及未来展望三方面解析 Serverless AI 的突破性价值。


01 从 Serverless 到 Serverless AI:技术演进的必然选择


在 AI 时代,Serverless 正经历从 Serverless 到 Serverless AI 的进化。这一转变是由于 AI 应用对基础设施的新要求,包括围绕 Agent 为中心的开发范式变化、状态持久化需求、任务驱动协作方式以及容错自愈能力等四个主要方面。AI 原生范式下,Agent 的开发方式从服务化或 API 为中心转向以 Agent 为核心,且要求基础设施支持多样化任务、弹性扩展、数据隔离安全特性及主动任务协同调用方式。


AI 原生应用开发的四大核心需求

1761102413500_4A171050-20B4-4100-B214-6961D4FB640E.png

  1. Agent 中心化开发范式
  • 传统 API 驱动模式已无法满足 Agent 自主决策、主动执行任务的需求。AI 原生开发需围绕 Agent 生命周期设计,强调任务驱动协作而非被动响应。
  1. 状态持久化支持
  • Agent 需保存对话记忆、人格设定等状态信息,要求基础设施原生支持状态管理,避免依赖外部存储组件。
  1. 动态任务执行能力
  • Agent 需执行代码、浏览器操作、工具调用等多样化任务,运行时需具备轻量化、强扩展性,适配不可预测的流量模式。
  1. 容错与自愈机制
  • 面对大模型生成代码的不确定性,需从防御性编程转向运行时自愈能力,降低安全风险对开发效率的影响。


技术架构对比:Serverless vs. 传统容器/虚拟机

AI 原生架构的演进主要有两条路径,一是通过虚拟机/容器运行时逐渐演变为以智能体运行时为代表的 AI 原生架构;二是直接从 Serverless 运行时进化为以智能体运行时为代表的 AI 原生架构。


而 Serverless 架构与 AI 时代需求具有天然契合性,其具备任务类型多样、流量突发性强、数据安全隔离以及轻量级、高弹性等优势,使得 Serverless 架构在状态管理、资源分配和运维方面展现出优势,成为 AI 时代最短的技术进化的路径。

1761102456629_00ABF27A-EC03-48f4-BA8C-886B5FA04DC3.png

维度

传统架构(容器/虚拟机)

Serverless AI 运行时

资源分配

静态资源分配,弹性不足

动态弹性伸缩,按需调用

状态管理

依赖 Redis/DB 等外部组件,跨节点迁移困难

天然支持状态持久化与会话亲和性

调用模式

被动响应式 API 调用

主动规划式任务协同

运维成本

需投入大量人力运维

免运维,零服务器管理


Serverless 架构因其动态弹性、免运维特性,成为 AI 原生架构的最短路径。开发者可专注于业务创新,无需关注基础设施细节。


02 Serverless AI 运行时

1761102498572_68A158BD-C55A-4174-8D96-BA9F1F2D648E.png

作为 AI 时代的最佳运行时,函数计算 FC 业界首推从 Serverless 进化为 Serverless AI,推出三大核心运行时底座:


1. Serverless 模型运行时:

支持超 20,000 + 热门开源模型一键部署为生产级 API。通过异构算力池、请求感知调度、毫秒级闲置唤醒、1/N 卡切分技术实现实时/准实时推理场景冷启动加速,实现 RT 抖动减少 80%,最高降本 93.75%。

1761102525042_4DF24D62-5B96-43fc-9834-56BEAB1977D6.png

2. 智能体与工具运行时

1761102554209_F31B3DFB-EB68-4e07-8FA9-B86A545426E2.png

  • 首创 Serverless 级会话亲和/隔离架构,通过毫秒级启动和上下文保持大幅提升智能体开发、部署和运行效率,性能超越传统方案 100 倍。
  • 率先推出十万函数、百万实例级别的大规模沙箱服务(如 Code Interpreter API ),并内置 Python/Node.js/Java/PHP/Shell/.NET 等 50 余种多语言环境,支持 OCI 标准镜像,原生兼容 MCP 和 Function Call 协议标准。


这三大运行时均基于函数计算构建,为开发者提供 0 运维、极致弹性、成本最优的 AI 原生基础设施,并联动阿里云、通义实验室、魔搭社区等生态,全面加速 AI 应用创新。


Serverless AI 的实践验证与生态联动

1761102630280_7BF7D732-F477-42d4-AEA5-527F9CA147BC.png

1. 魔搭社区:模型托管的标杆案例

  • 应用场景:支持 2 万个热门模型一键托管,用户无需关注底层集群配置,30 秒内生成生产级 API。
  • 技术支撑:依托 Serverless 模型运行时,实现自动弹性伸缩与高可用性。

2. Qwen3 Coder 训练:沙箱环境的高效利用

  • 强化学习:通过函数计算沙箱环境,Qwen3 Coder 的代码生成能力显著提升,无需维护训练集群。
  • 多语言支持:内置运行时环境适配模型生成代码的直接运行需求,零运维、毫秒级计费。

3. 百炼 MCP 市场:工具服务的原子化部署

  • 功能亮点:开发者可通过 Serverless 运行时将工具服务部署为企业级 MCP,支持冷门工具低频调用与热门工具高频响应的灵活适配。

4. 全链路 Serverless 生态联动

  • 产品协同:整合阿里云日志、网关等产品,实现端到端链路追踪、全栈可观测性及精细化成本控制。
  • 开发效率:AI 网关提供多模型协议适配与语义缓存,模型调用成功率提升至99.9%。


03 未来展望:Serverless AI 的无限可能

1761102720064_8B018943-0668-4ffb-BC5A-B80C55E2956A.png

  1. 智能体应用的普惠化
  • 非技术开发者可通过 Serverless 平台快速构建智能体应用,降低 AI 开发门槛。
  1. 全栈弹性与原子化能力
  • 通过 Serverless AI 运行时,实现从模型、智能体到工具的全链路弹性资源调度与原子化服务编排。
  1. 生态开放与行业落地
  • 推动 Serverless AI 技术标准化,助力企业实现 AI 原生应用规模化落地,覆盖智能座舱、工业自动化等场景。


Serverless AI 运行时的诞生,标志着云计算与 AI 技术的深度耦合。阿里云函数计算通过三大核心技术(请求感知调度、毫秒级唤醒、异构算力切分),为 AI 应用开发开发提供了免运维、高弹性、低成本的基础设施。随着生态不断完善,Serverless AI 将持续为企业和个人创造更多价值,驱动更多创新应用的诞生。

相关实践学习
【AI破次元壁合照】少年白马醉春风,函数计算一键部署AI绘画平台
本次实验基于阿里云函数计算产品能力开发AI绘画平台,可让您实现“破次元壁”与角色合照,为角色换背景效果,用AI绘图技术绘出属于自己的少年江湖。
从 0 入门函数计算
在函数计算的架构中,开发者只需要编写业务代码,并监控业务运行情况就可以了。这将开发者从繁重的运维工作中解放出来,将精力投入到更有意义的开发任务上。
相关文章
|
14天前
|
人工智能 运维 Kubernetes
Serverless 应用引擎 SAE:为传统应用托底,为 AI 创新加速
在容器技术持续演进与 AI 全面爆发的当下,企业既要稳健托管传统业务,又要高效落地 AI 创新,如何在复杂的基础设施与频繁的版本变化中保持敏捷、稳定与低成本,成了所有技术团队的共同挑战。阿里云 Serverless 应用引擎(SAE)正是为应对这一时代挑战而生的破局者,SAE 以“免运维、强稳定、极致降本”为核心,通过一站式的应用级托管能力,同时支撑传统应用与 AI 应用,让企业把更多精力投入到业务创新。
186 20
|
16天前
|
人工智能 安全 API
20 万奖金池就位!Higress AI 网关开发挑战赛参赛指南
本次赛事共设三大赛题方向,参赛者可以任选一个方向参赛。本文是对每个赛题方向的参赛指南。
122 10
|
13天前
|
人工智能 测试技术 API
构建AI智能体:二、DeepSeek的Ollama部署FastAPI封装调用
本文介绍如何通过Ollama本地部署DeepSeek大模型,结合FastAPI实现API接口调用。涵盖Ollama安装、路径迁移、模型下载运行及REST API封装全过程,助力快速构建可扩展的AI应用服务。
283 6
|
13天前
|
机器学习/深度学习 人工智能 Serverless
吉利汽车携手阿里云函数计算,打造新一代 AI 座舱推理引擎
当前吉利汽车研究院人工智能团队承担了吉利汽车座舱 AI 智能化的方案建设,在和阿里云的合作中,基于星睿智算中心 2.0 的 23.5EFLOPS 强大算力,构建 AI 混合云架构,面向百万级用户的实时推理计算引入阿里云函数计算的 Serverless GPU 算力集群,共同为智能座舱的交互和娱乐功能提供大模型推理业务服务,涵盖的场景如针对模糊指令的复杂意图解析、文生图、情感 TTS 等。
|
18天前
|
人工智能 搜索推荐 数据可视化
当AI学会“使用工具”:智能体(Agent)如何重塑人机交互
当AI学会“使用工具”:智能体(Agent)如何重塑人机交互
238 115
|
17天前
|
人工智能 运维 Java
Spring AI Alibaba Admin 开源!以数据为中心的 Agent 开发平台
Spring AI Alibaba Admin 正式发布!一站式实现 Prompt 管理、动态热更新、评测集构建、自动化评估与全链路可观测,助力企业高效构建可信赖的 AI Agent 应用。开源共建,现已上线!
1473 39
|
19天前
|
人工智能 自然语言处理 JavaScript
VTJ.PRO如何利用AI实现低代码开发
VTJ.PRO深度集成AI,实现设计稿转代码、自然语言生成组件等功能,显著提升低代码开发效率。支持双向代码穿梭、企业级工程化与多模型协同决策,兼顾开发速度与代码自由度,助力项目周期大幅压缩。
138 43
VTJ.PRO如何利用AI实现低代码开发
|
14天前
|
人工智能 API 开发工具
构建AI智能体:一、初识AI大模型与API调用
本文介绍大模型基础知识及API调用方法,涵盖阿里云百炼平台密钥申请、DashScope SDK使用、Python调用示例(如文本情感分析、图像文字识别),助力开发者快速上手大模型应用开发。
487 16
构建AI智能体:一、初识AI大模型与API调用
|
12天前
|
存储 机器学习/深度学习 人工智能
构建AI智能体:三、Prompt提示词工程:几句话让AI秒懂你心
本文深入浅出地讲解Prompt原理及其与大模型的关系,系统介绍Prompt的核心要素、编写原则与应用场景,帮助用户通过精准指令提升AI交互效率,释放大模型潜能。
203 5

热门文章

最新文章

相关产品

  • 函数计算