什么是M3DLayout数据集

AI解读 1个月前 硕雀
19 0

M3DLayout 是一个面向文本驱动 3D 场景生成的 大规模多源室内布局数据集,旨在为研究者提供丰富的几何与语言配对,以便学习从自然语言描述到 3D 布局的映射。

关键特性

  1. 规模与多样性
    • 包含 15 080 条室内布局,超过 258 k 个物体实例。
    • 数据来源分为三类:真实世界扫描、专业 CAD 设计、程序化生成场景,显著提升空间布局的多样性和真实感。
  2. 结构化文本描述
    • 每个布局配有层次化的文字标注,涵盖:
      • 全局场景概述
      • 大件家具的相对位置关系
      • 小件物体的细粒度摆放信息
    • 这种结构化描述帮助模型捕捉语义层次,实现更精准的语言‑几何对齐。
  3. 子集划分
    • Inf3DLayout 子集专注于小物体的丰富标注,提升模型在细节生成上的能力。
  4. 基准与评估
    • 作者基于文本条件扩散模型构建了一个基准,实验表明该数据集能够显著提升 3D 布局生成的质量和多样性。
  5. 开放获取
    • 数据集及相关论文均在 arXiv 上公开,可直接下载使用。

适用场景

  • 文本‑到‑3D 生成模型的训练与评估
  • 室内场景理解、布局规划与交互编辑
  • 多模态学习(语言、几何、视觉)研究

相关链接

通过上述特性,M3DLayout 为推动文本驱动的 3D 场景合成提供了坚实的数据基础,尤其在提升模型对复杂室内布局的理解与生成方面具有重要价值。

来源:www.aiug.cn
声明:文章均为AI生成,请谨慎辨别信息的真伪和可靠性!