什么是Vimeo‑90K数据集

AI解读 4个月前 硕雀
46 0

Vimeo‑90K 数据集概览

项目 说明 主要来源
全称 Vimeo‑90K (Video Enhancement with Task‑Oriented Flow)
创建者 Tianfan Xue、Baian Chen、Jiajun Wu、Donglai Wei、William T. Freeman 等
发布时间 2019 年(论文《Video Enhancement with Task‑Oriented Flow》)
规模 约 89 800 条短视频片段,来源于 Vimeo 网站的公开视频
每条片段帧数 7 帧(Septuplet 子集)或 3 帧(Triplet 子集)
分辨率 448 × 256(Triplet)或 256 × 448(Septuplet)
任务划分 Triplet dataset:73 171 条 3‑帧序列,用于 时间帧插值
Septuplet dataset:91 701 条 7‑帧序列,用于 视频去噪 / 去块 与 视频超分辨率
训练/测试划分 训练集 64 612 条,测试集 7 824 条(Vimeo‑90K‑T)
下载入口 官方主页 http://toflow.csail.mit.edu/ ,提供 Triplet 与 Septuplet 的完整压缩包(分别约 17 GB 与 82 GB)
常用基准 在视频帧插值、去噪、去块、超分辨率等低层视频处理任务中被广泛采用,已成为 Papers with CodeCVPR/ICCV 等会议的标准基准
引用论文 Xue, T., Chen, B., Wu, J., Wei, D., & Freeman, W. T. (2019). Video Enhancement with Task‑Oriented Flow. IEEE Transactions on Pattern Analysis and Machine Intelligence (TPAMI).

详细说明

  1. 数据来源与质量
    • 视频片段均从 vimeo.com 上公开的完整视频中截取,经过统一裁剪、去噪、帧对齐等预处理,保证每帧画质均为 高清(HD)‍,适合高精度视觉任务。
    • 数据集覆盖 多种场景与动作(人物、车辆、自然风光、文字、二维码等),能够检验模型在复杂运动和细节恢复方面的鲁棒性
  2. 子集结构
    • Triplet dataset(3 帧)专为 时间帧插值 设计,提供前后两帧与中间真实帧的配对,常用于训练插值网络(如 CAIN、AdaCoF 等)。
    • Septuplet dataset(7 帧)用于 去噪 / 去块 与 超分辨率,其中前 4 帧可作为低分辨率输入,后 3 帧作为目标高分辨率帧,支持多帧信息融合的模型(如 RBPN、EDVR 等)。
  3. 下载与使用
    • 官方页面提供 两种下载方式
      • 仅测试集(约 17 GB) → 适合快速评估。
      • 完整训练+测试集(约 33 GB) → 适合完整训练。
    • 也可通过 Papers with Code 的数据集页面获取镜像链接和 MD5 校验信息,确保下载完整性。
  4. 在学术与工业中的影响
    • 超过 170 篇 论文在该数据集上报告实验结果,涵盖 视频帧插值、去噪、去块、超分辨率 四大方向。
    • 多家企业(如百度、阿里、腾讯)在视频增强产品中也采用该数据集进行模型预训练与基准评估。

关键链接(直接可点击)

  • 官方主页 & 下载页面:
  • 原始论文 PDF(arXiv):<https://arxiv.org/abs/1711.09078 >(对应《Video Enhancement with Task‑Oriented Flow》)
  • Papers with Code 数据集页:
  • 数据集在 GitHub 上的常用加载脚本(PaddleGAN 示例):

小结:Vimeo‑90K 是目前视频低层处理任务中最权威、规模最大的公开基准之一,提供了从 帧插值 到 超分辨率 的完整数据支撑,且拥有明确的下载渠道与丰富的文献引用,是进行相关研究与工业落地的首选数据集。

来源:www.aiug.cn
声明:文章均为AI生成,请谨慎辨别信息的真伪和可靠性!