M3DLayout 是一个面向文本驱动 3D 场景生成的 大规模多源室内布局数据集,旨在为研究者提供丰富的几何与语言配对,以便学习从自然语言描述到 3D 布局的映射。
关键特性
- 规模与多样性
- 包含 15 080 条室内布局,超过 258 k 个物体实例。
- 数据来源分为三类:真实世界扫描、专业 CAD 设计、程序化生成场景,显著提升空间布局的多样性和真实感。
- 结构化文本描述
- 每个布局配有层次化的文字标注,涵盖:
- 全局场景概述
- 大件家具的相对位置关系
- 小件物体的细粒度摆放信息
- 这种结构化描述帮助模型捕捉语义层次,实现更精准的语言‑几何对齐。
- 每个布局配有层次化的文字标注,涵盖:
- 子集划分
- Inf3DLayout 子集专注于小物体的丰富标注,提升模型在细节生成上的能力。
- 基准与评估
- 作者基于文本条件扩散模型构建了一个基准,实验表明该数据集能够显著提升 3D 布局生成的质量和多样性。
- 开放获取
- 数据集及相关论文均在 arXiv 上公开,可直接下载使用。
适用场景
- 文本‑到‑3D 生成模型的训练与评估
- 室内场景理解、布局规划与交互编辑
- 多模态学习(语言、几何、视觉)研究
相关链接
- 论文标题:M3DLayout: A Multi-Source Dataset of 3D Indoor Layouts and Structured Descriptions for 3D Generation
- 论文作者:Yiheng Zhang, Zhuojiang Cai, Mingdao Wang, Meitong Guo, Tianxiao Li, Li Lin, Yuwang Wang
- 项目主页:https://graphic-kiliani.github.io/M3DLayout/
- 论文地址:https://arxiv.org/abs/2509.23728
通过上述特性,M3DLayout 为推动文本驱动的 3D 场景合成提供了坚实的数据基础,尤其在提升模型对复杂室内布局的理解与生成方面具有重要价值。
声明:文章均为AI生成,请谨慎辨别信息的真伪和可靠性!