什么是VIPeR数据集

VIPeR 数据集概览

项目 内容
全称 VIPeR (Viewpoint Invariant Pedestrian Recognition)
领域 行人再识别(Person Re‑Identification
发布机构 加州大学圣克鲁兹分校视觉实验室(UCSC Vision Lab)
发布时间 2008 年(原始论文)
数据规模 632 名行人,每人 2 张图像,共 1 264 张图片
图像分辨率 128 × 48 像素(统一裁剪后尺寸)
摄像头视角 两个不相交的摄像头(Camera A、Camera B),分别捕获同一行人的不同视角
变化因素 视角、姿态、光照、背景等多样性,构成了该数据集的高挑战性

1. 数据集的设计初衷

VIPeR 是首批专门用于 跨摄像头行人再识别 的公开基准。它通过在两个相隔较远的摄像头下拍摄同一行人,模拟真实监控场景中的视角和光照变化,旨在推动对跨视角特征匹配的研究。

2. 主要特征与使用方式

特征 说明
单张图像 每个摄像头仅提供一张图像,属于 single‑shot 场景,要求算法在极少信息下完成匹配。
随机划分 常用的评估协议是将 632 人随机分为 316 人训练、316 人测试,重复 10 次取平均,以降低划分偶然性带来的波动。
评价指标 常用 CMC(Cumulative Matching Characteristic)曲线的 Rank‑1、Rank‑5、Rank‑10 等指标来衡量匹配准确率
挑战性 由于仅有两张图像且视角差异大,VIPeR 被视为 最具挑战 的小规模 Re‑ID 基准之一,常用于验证新特征或深度模型的鲁棒性

3. 下载与获取渠道

使用提示:下载后请遵守原作者的许可协议,仅用于学术研究或非商业目的。

4. 关键参考文献

  1. Gray, D., Tao, H., & Tao, Y. “Person Re-identification by Probabilistic Relative Distance Comparison.” CVPR 2008.(首次提出 VIPeR 数据集)
  2. Zheng, L., et al. “Person Re-identification: A Benchmark.” IEEE TPAMI 2015.(对 VIPeR 及其他 Re‑ID 数据集进行系统评测)
  3. Liming Zhao et al. “Deeply-Learned Part-Aligned Representations for Person Re-identification.” ICCV 2017.(在 VIPeR 上的实验结果展示)

5. 在研究中的典型应用

  • 特征学习:传统手工特征(如 ELF、 LOMO)与深度特征的对比实验。
  • 度量学习:如 XQDA、KISSME 等方法在 VIPeR 上的基准评估。
  • 跨视角对齐:利用姿态估计或部件对齐提升跨摄像头匹配性能。

小结
VIPeR 以其 小规模、单张图像、跨视角 的独特属性,成为行人再识别领域的经典基准。尽管数据量有限,但其高难度的视角和光照变化仍然是检验算法鲁棒性的有效手段。研究者在进行新特征、度量学习或深度模型设计时,常以 VIPeR 作为首选评测平台,并通过官方提供的下载渠道获取原始图像进行实验。

来源:www.aiug.cn
声明:文章均为AI生成,请谨慎辨别信息的真伪和可靠性!