项目 | 内容 |
---|---|
全称 | VIPeR (Viewpoint Invariant Pedestrian Recognition) |
领域 | 行人再识别(Person Re‑Identification) |
发布机构 | 加州大学圣克鲁兹分校视觉实验室(UCSC Vision Lab) |
发布时间 | 2008 年(原始论文) |
数据规模 | 632 名行人,每人 2 张图像,共 1 264 张图片 |
图像分辨率 | 128 × 48 像素(统一裁剪后尺寸) |
摄像头视角 | 两个不相交的摄像头(Camera A、Camera B),分别捕获同一行人的不同视角 |
变化因素 | 视角、姿态、光照、背景等多样性,构成了该数据集的高挑战性 |
1. 数据集的设计初衷
VIPeR 是首批专门用于 跨摄像头行人再识别 的公开基准。它通过在两个相隔较远的摄像头下拍摄同一行人,模拟真实监控场景中的视角和光照变化,旨在推动对跨视角特征匹配的研究。
2. 主要特征与使用方式
特征 | 说明 |
---|---|
单张图像 | 每个摄像头仅提供一张图像,属于 single‑shot 场景,要求算法在极少信息下完成匹配。 |
随机划分 | 常用的评估协议是将 632 人随机分为 316 人训练、316 人测试,重复 10 次取平均,以降低划分偶然性带来的波动。 |
评价指标 | 常用 CMC(Cumulative Matching Characteristic)曲线的 Rank‑1、Rank‑5、Rank‑10 等指标来衡量匹配准确率。 |
挑战性 | 由于仅有两张图像且视角差异大,VIPeR 被视为 最具挑战 的小规模 Re‑ID 基准之一,常用于验证新特征或深度模型的鲁棒性。 |
3. 下载与获取渠道
- 官方页面:<https://vision.soe.ucsc.edu/node/178/ >(提供数据集简介、下载链接及使用协议)
- 直接下载链接(需填写使用协议):<https://vision.soe.ucsc.edu/datasets/viper >
使用提示:下载后请遵守原作者的许可协议,仅用于学术研究或非商业目的。
4. 关键参考文献
- Gray, D., Tao, H., & Tao, Y. “Person Re-identification by Probabilistic Relative Distance Comparison.” CVPR 2008.(首次提出 VIPeR 数据集)
- Zheng, L., et al. “Person Re-identification: A Benchmark.” IEEE TPAMI 2015.(对 VIPeR 及其他 Re‑ID 数据集进行系统评测)
- Liming Zhao et al. “Deeply-Learned Part-Aligned Representations for Person Re-identification.” ICCV 2017.(在 VIPeR 上的实验结果展示)
5. 在研究中的典型应用
- 特征学习:传统手工特征(如 ELF、 LOMO)与深度特征的对比实验。
- 度量学习:如 XQDA、KISSME 等方法在 VIPeR 上的基准评估。
- 跨视角对齐:利用姿态估计或部件对齐提升跨摄像头匹配性能。
小结
VIPeR 以其 小规模、单张图像、跨视角 的独特属性,成为行人再识别领域的经典基准。尽管数据量有限,但其高难度的视角和光照变化仍然是检验算法鲁棒性的有效手段。研究者在进行新特征、度量学习或深度模型设计时,常以 VIPeR 作为首选评测平台,并通过官方提供的下载渠道获取原始图像进行实验。
声明:文章均为AI生成,请谨慎辨别信息的真伪和可靠性!