什么是M3DLayout数据集

AI解读 1个月前硕雀

19 0 0

M3DLayout 是一个面向文本驱动 3D 场景生成的 大规模多源室内布局数据集，旨在为研究者提供丰富的几何与语言配对，以便学习从自然语言描述到 3D 布局的映射。

关键特性

规模与多样性
- 包含 15 080 条室内布局，超过 258 k 个物体实例。
- 数据来源分为三类：真实世界扫描、专业 CAD 设计、程序化生成场景，显著提升空间布局的多样性和真实感。
结构化文本描述
- 每个布局配有层次化的文字标注，涵盖：
  - 全局场景概述
  - 大件家具的相对位置关系
  - 小件物体的细粒度摆放信息
- 这种结构化描述帮助模型捕捉语义层次，实现更精准的语言‑几何对齐。
子集划分
- Inf3DLayout 子集专注于小物体的丰富标注，提升模型在细节生成上的能力。
基准与评估
- 作者基于文本条件扩散模型构建了一个基准，实验表明该数据集能够显著提升 3D 布局生成的质量和多样性。
开放获取
- 数据集及相关论文均在 arXiv 上公开，可直接下载使用。

适用场景

文本‑到‑3D 生成模型的训练与评估
室内场景理解、布局规划与交互编辑
多模态学习（语言、几何、视觉）研究

相关链接

论文标题：M3DLayout: A Multi-Source Dataset of 3D Indoor Layouts and Structured Descriptions for 3D Generation
论文作者：Yiheng Zhang, Zhuojiang Cai, Mingdao Wang, Meitong Guo, Tianxiao Li, Li Lin, Yuwang Wang
项目主页：https://graphic-kiliani.github.io/M3DLayout/
论文地址：https://arxiv.org/abs/2509.23728

通过上述特性，M3DLayout 为推动文本驱动的 3D 场景合成提供了坚实的数据基础，尤其在提升模型对复杂室内布局的理解与生成方面具有重要价值。

M3DLayout数据集

声明：文章均为AI生成，请谨慎辨别信息的真伪和可靠性！