1. 什么是 Marble
Marble 是由斯坦福大学教授 李飞飞 创立的 World Labs 推出的首款商用 3D 世界生成模型。它基于大规模多模态自回归架构和稀疏混合专家(MoE)技术,模型参数高达 2.4 万亿,在激活时仅使用不到 3% 的参数,能够在保持高效推理的同时实现极高的生成质量。Marble 的核心目标是 “构建空间智能的基础”,让机器能够从文本、图片或短视频等任意提示快速生成 持久、可导航、可编辑 的三维场景。
2. 公测时间与入口
- 公测启动:2025 年 11 月 12 日正式开启公测,面向全球用户限量开放测试版预览模型。
- 试用地址:
https://marble.worldlabs.ai(用户可直接在网页上上传文本、图片或视频进行生成)。
3. 主要功能与特性
| 功能 | 说明 | 参考 |
|---|---|---|
| 多模态输入 | 支持 单张图片、多个视角图片、短视频 以及 自然语言文本 作为提示,模型会自动“脑补”未见的 360° 场景。 | |
| 持久化 3D 场景 | 生成的世界具备 一致性、无形变、无时间限制,可长期保存、下载并在不同平台复用。 | |
| 高质量输出 | 支持 高斯 splats、网格(mesh)以及渲染视频 等多种格式,满足游戏、影视、VR 等不同需求。 | |
| AI 原生编辑(Chisel) | 内置编辑工具 Chisel,实现 结构与风格分离编辑,用户可以交互式地扩展、组合、微调场景。 | |
| 场景扩展与组合 | 支持将已有场景进行 扩展、拼接,实现更大规模的虚拟世界构建。 | |
| 订阅方案 | 提供 免费版(4 次生成)、标准版(12 次)、专业版(25 次)、旗舰版(75 次) 四档套餐,满足从个人创意到商业落地的不同需求。 |
4. 技术亮点
- 统一语义表征:在底层实现不同模态(文本、图像、音频)之间的统一语义映射,使得跨模态提示能够自然转化为三维结构。
- 稀疏 MoE 结构:通过 超稀疏混合专家,在保持 2.4 万亿 参数规模的同时,仅激活极少部分参数,显著降低计算成本。
- 持久化渲染:生成的 3D 场景在 几何结构、材质、光照 上保持一致,避免了传统 3D 生成模型常见的 形变与不一致 问题。
5. 应用场景
- 游戏开发:快速生成关卡原型、场景素材,缩短美术制作周期。
- 影视特效(VFX):提供高保真数字孪生环境,用于前期概念设计与后期合成。
- 虚拟现实(VR)/增强现实(AR):即时构建沉浸式交互空间。
- 机器人仿真:为机器人训练提供真实感的三维环境。
- 建筑与城市规划:从概念图快速生成可视化的三维模型,辅助设计评审。
6. 使用流程(简要)
- 登录试用平台 → 进入 Marble 主界面。
- 选择输入方式(文本、单张图片、多个视角图片或短视频)。
- 填写提示词(可自由描述场景风格、布局、细节)。
- 点击生成 → 系统返回 3D 场景预览,并提供 下载链接(支持 mesh、splats 等格式)。
- 如需进一步编辑,可使用 Chisel 进行结构或风格的微调。
7. 发展前景
World Labs 创始人李飞飞将 Marble 定位为 “空间智能的基础设施”,认为它是实现 机器对三维世界理解与交互 的关键一步。随着模型规模和编辑能力的提升,预计将在 游戏、影视、VR、机器人 等行业形成 新一代内容创作与仿真平台,推动创意生产从“手工建模”向“AI 生成+人类微调”转型。
小结:Marble 通过大规模多模态模型、稀疏 MoE 架构以及 AI 原生编辑工具,实现了从任意提示到高质量、持久化 3D 世界的“一键生成”。公测已开放,用户可通过官方试用链接免费体验基础功能,亦可根据需求选择付费套餐,快速落地游戏、影视、VR 等多场景应用。
声明:文章均为AI生成,请谨慎辨别信息的真伪和可靠性!