什么是Flying Chairs数据集

Flying Chairs 数据集概述

Flying Chairs 是光流Optical Flow)估计领域的经典合成数据集,最早由 FlowNet 论文的作者在 2015 年提出,用于为大规模卷积神经网络提供充足的标注训练样本。该数据集的核心特点如下:

项目 内容
规模 22 872 对图像(每对包含前后两帧)及对应的光流真值
图像分辨率 512 × 384(由原始 1024 × 768 的 Flickr 背景裁剪得到)
背景来源 Flickr 上的 964 张图片,分别来自 “city”(321)、 “landscape”(129) 与 “mountain”(514) 三类
前景对象 公开的 3D 椅子模型(共 809 种椅子,每种 62 个视角)
合成方式 对背景和椅子分别施加随机仿射变换(平移、旋转、缩放),再叠加生成前后两帧;光流通过已知的几何变换精确计算得到
文件格式 图像为 .ppm,光流为 .flo(Middlebury 格式)
划分 提供 train-validation split txt,其中 22 232 对用于训练,640 对用于验证
主要用途 ① 训练光流网络(如 FlowNet、RAFT 等) ② 评估光流算法的基准 ③ 研究合成数据对真实场景迁移的影响

数据获取与官方链接

关键技术细节

  1. 随机运动分布:仿射参数的采样遵循与 MPI‑Sintel 类似的直方图分布,使得运动幅度、方向、遮挡等情况在统计上更接近真实视频。
  2. 遮挡与边界:由于椅子在前景,背景被部分遮挡,生成的光流包含自然的遮挡边界,帮助模型学习遮挡处理。
  3. 多样性:通过组合不同背景、不同椅子模型、不同视角以及随机变换,数据集覆盖了大范围的纹理、光照和运动模式,提升了模型的泛化能力

在研究中的影响

  • 基准地位:自发布以来,Flying Chairs 成为光流研究的“预训练”基准,大多数后续光流网络(如 PWC‑Net、RAFT)均在该数据集上进行预训练后再迁移到真实数据(如 Sintel、KITTI)。
  • 扩展工作:基于 Flying Chairs 的思路,后续出现了更大规模的 FlyingThings3DFlyingThings 等数据集,进一步加入视差和场景流信息。

小结
Flying Chairs 是一个规模为 22 872 对、由 Flickr 背景与合成椅子前景通过随机仿射变换构造的光流合成数据集。它提供了高质量、精确的光流真值,已成为光流学习与评估的标准基准,并在多个后续研究中发挥了重要作用。若需下载或查看详细说明,可访问官方页面或 Papers with Code 链接。

来源:www.aiug.cn
声明:文章均为AI生成,请谨慎辨别信息的真伪和可靠性!