Flying Chairs 是光流(Optical Flow)估计领域的经典合成数据集,最早由 FlowNet 论文的作者在 2015 年提出,用于为大规模卷积神经网络提供充足的标注训练样本。该数据集的核心特点如下:
| 项目 | 内容 |
|---|---|
| 规模 | 22 872 对图像(每对包含前后两帧)及对应的光流真值 |
| 图像分辨率 | 512 × 384(由原始 1024 × 768 的 Flickr 背景裁剪得到) |
| 背景来源 | Flickr 上的 964 张图片,分别来自 “city”(321)、 “landscape”(129) 与 “mountain”(514) 三类 |
| 前景对象 | 公开的 3D 椅子模型(共 809 种椅子,每种 62 个视角) |
| 合成方式 | 对背景和椅子分别施加随机仿射变换(平移、旋转、缩放),再叠加生成前后两帧;光流通过已知的几何变换精确计算得到 |
| 文件格式 | 图像为 .ppm,光流为 .flo(Middlebury 格式) |
| 划分 | 提供 train-validation split txt,其中 22 232 对用于训练,640 对用于验证 |
| 主要用途 | ① 训练光流网络(如 FlowNet、RAFT 等) ② 评估光流算法的基准 ③ 研究合成数据对真实场景迁移的影响 |
数据获取与官方链接
- 官方页面(Freiburg):
https://lmb.informatik.uni-freiburg.de/resources/datasets/FlyingChairs.en.html - Papers with Code 数据集页(包含下载链接、基准榜单):
https://paperswithcode.com/dataset/flyingchairs - 原始论文(FlowNet)(详细描述数据生成过程):
https://doi.org/10.1109/ICCV.2015.316
关键技术细节
- 随机运动分布:仿射参数的采样遵循与 MPI‑Sintel 类似的直方图分布,使得运动幅度、方向、遮挡等情况在统计上更接近真实视频。
- 遮挡与边界:由于椅子在前景,背景被部分遮挡,生成的光流包含自然的遮挡边界,帮助模型学习遮挡处理。
- 多样性:通过组合不同背景、不同椅子模型、不同视角以及随机变换,数据集覆盖了大范围的纹理、光照和运动模式,提升了模型的泛化能力。
在研究中的影响
- 基准地位:自发布以来,Flying Chairs 成为光流研究的“预训练”基准,大多数后续光流网络(如 PWC‑Net、RAFT)均在该数据集上进行预训练后再迁移到真实数据(如 Sintel、KITTI)。
- 扩展工作:基于 Flying Chairs 的思路,后续出现了更大规模的 FlyingThings3D、FlyingThings 等数据集,进一步加入视差和场景流信息。
小结
Flying Chairs 是一个规模为 22 872 对、由 Flickr 背景与合成椅子前景通过随机仿射变换构造的光流合成数据集。它提供了高质量、精确的光流真值,已成为光流学习与评估的标准基准,并在多个后续研究中发挥了重要作用。若需下载或查看详细说明,可访问官方页面或 Papers with Code 链接。
声明:文章均为AI生成,请谨慎辨别信息的真伪和可靠性!