谷歌DeepMind联手牛津推出Bolt3D:AI秒速3D建模革命!单GPU仅需6秒生成3D场景

本文涉及的产品
视觉智能开放平台,图像通用资源包5000点
视觉智能开放平台,分割抠图1万点
视觉智能开放平台,视频通用资源包5000点
简介: 牛津大学与谷歌联合推出的Bolt3D技术,能在单个GPU上仅用6.25秒从单张或多张图像生成高质量3D场景,基于高斯溅射和几何多视角扩散模型,为游戏、VR/AR等领域带来革命性突破。

❤️ 如果你也关注 AI 的发展现状,且对 AI 应用开发感兴趣,我会每日分享大模型与 AI 领域的开源项目和应用,提供运行实例和实用教程,帮助你快速上手AI技术!

🥦 AI 在线答疑 -> 智能检索历史文章和开源项目 -> 丰富的 AI 工具库 -> 每日更新 -> 尽在微信公众号 -> 搜一搜:蚝油菜花 🥦


🕶️ 「别让显卡燃烧生命!谷歌把3D建模压缩到一次深呼吸」

大家好,我是蚝油菜花。这些数字创作的至暗时刻你是否经历过——

  • 👉 为游戏场景建模连续渲染48小时,显卡哀嚎到能煎牛排
  • 👉 客户临时要改建筑方案,传统流程直接让deadline提前升天
  • 👉 VR内容制作成本高到让投资人瞳孔地震...

今天要炸裂3D界的 Bolt3D ,正在重写物理法则!谷歌这柄「时空剪刀」:

  • ✅ 光年加速:6.25秒吃图吐3D,比泡面计时还快3倍
  • ✅ 量子塌缩术:单张照片自动补全360°细节,连阴影角度都符合物理
  • ✅ 平民造物主:浏览器直接操作3D高斯粒子,无需专业工作站

已有游戏厂用它日更场景,建筑师靠AI实时修改方案——你的创造力,是时候突破「三维速度禁区」了!

🚀 快速阅读

Bolt3D是由牛津大学和谷歌联合开发的3D场景生成技术。

  1. 核心功能:支持从单张/多张图像6秒生成高保真3D场景,具备多视角泛化能力
  2. 技术原理:结合几何多视角扩散模型+高斯溅射技术,通过三阶段训练实现高效生成

Bolt3D 是什么

bolt3d-cover

Bolt3D 是谷歌研究院、牛津大学 VGG 团队和谷歌 DeepMind 联合推出的新型 3D 场景生成技术,采用潜在扩散模型架构。它能在单个 GPU 上,仅需不到七秒的时间,直接从一张或多张图像中采样出完整的3D场景表示。

该技术的突破性在于将传统需要数小时甚至数天的3D建模过程压缩到秒级。在英伟达 H100 图形处理单元上的实测显示,Bolt3D 仅需 6.25 秒就能将普通照片处理成可交互的三维场景,为游戏开发、虚拟现实等领域带来革命性变化。

Bolt3D 的主要功能

  • 极速生成:前馈式生成架构,单GPU 6.25秒完成3D场景构建
  • 多视图兼容:支持1-N张输入图像,自动补全未观测区域内容
  • 高保真输出:基于高斯溅射技术,每个3D高斯函数记录位置/颜色/透明度等完整属性
  • 实时交互:生成场景可直接在浏览器中查看和渲染

Bolt3D 的技术原理

  • 多视角扩散模型:联合建模图像和3D点图,学习目标图像与点图的联合分布
  • 几何VAE编码:通过特定几何损失函数压缩点图数据,保持高精度
  • 高斯头部模型:输出3D高斯的细化颜色/不透明度/协方差矩阵
  • 三阶段训练:依次训练几何VAE、高斯头部和潜在扩散模型
  • 大规模数据集:应用SOTA密集重建技术生成多视图一致训练数据

资源


❤️ 如果你也关注 AI 的发展现状,且对 AI 应用开发感兴趣,我会每日分享大模型与 AI 领域的开源项目和应用,提供运行实例和实用教程,帮助你快速上手AI技术!

🥦 AI 在线答疑 -> 智能检索历史文章和开源项目 -> 丰富的 AI 工具库 -> 每日更新 -> 尽在微信公众号 -> 搜一搜:蚝油菜花 🥦

相关文章
|
22天前
|
人工智能 中间件 数据库
沐曦 GPU 融入龙蜥,共筑开源 AI 基础设施新底座
沐曦自加入社区以来,一直与龙蜥社区在推动 AIDC OS 的开源社区建设等方面保持合作。
|
19天前
|
人工智能 自然语言处理 安全
从工具到伙伴:AI代理(Agent)是下一场革命
从工具到伙伴:AI代理(Agent)是下一场革命
207 117
|
16天前
|
人工智能 文字识别 自然语言处理
从“看见”到“预见”:合合信息“多模态文本智能技术”如何引爆AI下一场革命。
近期,在第八届中国模式识别与计算机视觉学术会议(PRCV 2025)上,合合信息作为承办方举办了“多模态文本智能大模型前沿技术与应用”论坛,汇聚了学术界的顶尖智慧,更抛出了一颗重磅“炸弹”——“多模态文本智能技术”概念。
74 1
|
1月前
|
人工智能 并行计算 PyTorch
以Lama Cleaner的AI去水印工具理解人工智能中经常会用到GPU来计算的CUDA是什么? 优雅草-卓伊凡
以Lama Cleaner的AI去水印工具理解人工智能中经常会用到GPU来计算的CUDA是什么? 优雅草-卓伊凡
151 4
|
2月前
|
机器学习/深度学习 人工智能 自然语言处理
AIGC技术深度解析:生成式AI的革命性突破与产业应用实战
蒋星熠Jaxonic,AI技术探索者,深耕生成式AI领域。本文系统解析AIGC核心技术,涵盖Transformer架构、主流模型对比与实战应用,分享文本生成、图像创作等场景的实践经验,展望技术趋势与产业前景,助力开发者构建完整认知体系,共赴AI原生时代。
|
2月前
|
机器学习/深度学习 人工智能 容灾
硅谷GPU云托管:驱动AI革命的下一代计算基石
在人工智能与高性能计算席卷全球的今天,硅谷作为科技创新的心脏,正通过GPU云托管服务重新定义计算能力的边界。无论您是初创公司的机器学习工程师,还是跨国企业的研究团队,硅谷GPU云托管已成为实现突破性创新的关键基础设施。
|
16天前
|
人工智能 运维 Kubernetes
Serverless 应用引擎 SAE:为传统应用托底,为 AI 创新加速
在容器技术持续演进与 AI 全面爆发的当下,企业既要稳健托管传统业务,又要高效落地 AI 创新,如何在复杂的基础设施与频繁的版本变化中保持敏捷、稳定与低成本,成了所有技术团队的共同挑战。阿里云 Serverless 应用引擎(SAE)正是为应对这一时代挑战而生的破局者,SAE 以“免运维、强稳定、极致降本”为核心,通过一站式的应用级托管能力,同时支撑传统应用与 AI 应用,让企业把更多精力投入到业务创新。
226 28
|
2月前
|
人工智能 安全 中间件
阿里云 AI 中间件重磅发布,打通 AI 应用落地“最后一公里”
9 月 26 日,2025 云栖大会 AI 中间件:AI 时代的中间件技术演进与创新实践论坛上,阿里云智能集团资深技术专家林清山发表主题演讲《未来已来:下一代 AI 中间件重磅发布,解锁 AI 应用架构新范式》,重磅发布阿里云 AI 中间件,提供面向分布式多 Agent 架构的基座,包括:AgentScope-Java(兼容 Spring AI Alibaba 生态),AI MQ(基于Apache RocketMQ 的 AI 能力升级),AI 网关 Higress,AI 注册与配置中心 Nacos,以及覆盖模型与算力的 AI 可观测体系。
641 36
|
30天前
|
消息中间件 人工智能 安全
云原生进化论:加速构建 AI 应用
本文将和大家分享过去一年在支持企业构建 AI 应用过程的一些实践和思考。
304 20

热门文章

最新文章