1. 数据集简介
Market‑1501 是在 2015 年由清华大学发布的行人重识别(Person Re‑Identification)基准数据集,旨在提供大规模、真实场景下的行人图像,以推动跨摄像头行人匹配算法的研究。该数据集在 ICCV 2015 论文 Scalable Person Re‑identification: A Benchmark 中首次提出。
2. 规模与结构
- 身份数:1501 位行人。
- 图像总量:约 32 668 张检测框(每张 128 × 64 像素)。
- 摄像头:6 台摄像头(5 台高清、1 台低清),在清华大学校园的超市前采集。
- 检测方式:使用 Deformable Part Model(DPM)行人检测器自动生成边界框。
3. 数据划分
划分 | 身份数 | 图像数 | 说明 |
---|---|---|---|
训练集 (bounding_box_train) | 751 | 12 936 | 用于模型训练 |
测试集 / Gallery (bounding_box_test) | 750 | 19 732 | 用于检索库 |
查询集 (query) | 750 | 3 368 | 人工标注的查询图像 |
文件结构典型为 bounding_box_train/
, bounding_box_test/
, query/
, gt_bbox/
, gt_query/
等,文件命名遵循 ID_cX_sY_fZ_01.jpg
规则,便于解析摄像头、片段和帧信息。
4. 评估协议
- 检索任务:使用查询图像在 Gallery 中检索同一身份的图像。
- 主要指标:Rank‑1 准确率(第一匹配是否正确)和 mAP(Mean Average Precision)。
- 单帧 / 多帧:支持 single‑shot 与 multi‑shot 两种评估模式。
5. 研究与应用
Market‑1501 已成为行人重识别领域最常用的基准,几乎所有新算法都会在该数据集上报告 Rank‑1 / mAP 结果。它的规模、真实检测框以及 500 K 干扰图像(噪声)使其更贴近实际监控场景,推动了跨视角、跨光照、跨姿态的鲁棒特征学习。常见的研究方向包括:深度特征学习、注意力机制、度量学习、无监督/自监督学习等。
6. 获取方式与资源链接
资源 | 链接 | 说明 |
---|---|---|
官方论文(ICCV 2015) | https://doi.org/10.1109/ICCV.2015.133 | 数据集提出与基准说明 |
GitHub 原始代码/下载脚本 | https://github.com/zhunzhong07/Market-1501 (或 https://github.com/layumi/HQ-Market ) | 包含数据处理脚本与下载说明 |
其他社区镜像(niruhan) | https://github.com/niruhan/market1501 | 结构化的文件夹示例 |
Papers with Code Benchmark | https://paperswithcode.com/sota/unsupervised-person-re-identification-on-4 | 汇总最新方法、代码与排行榜 |
CSDN 详细介绍与下载链接 | https://blog.csdn.net/gitblog_06504/article/details/143388296 | 包含项目地址与使用指南 |
资源聚合(GitCode) | https://gitcode.com/Resource-Bundle-Collection/31953 | 直接下载数据集压缩包 |
使用提示:下载后请保持原始文件夹结构,以便常用的 Re‑ID 框架(如 Torchreid、OpenReID)直接读取。评估时建议使用官方提供的
gt_query.txt
与gt_bbox.txt
进行匹配判断,确保与论文中的评测协议保持一致。
小结
Market‑1501 以其大规模、真实检测框和标准化评估协议,成为行人重识别研究的“金标准”。了解其采集背景、数据划分以及获取渠道,有助于快速搭建实验基线并对比最新算法的性能。
声明:文章均为AI生成,请谨慎辨别信息的真伪和可靠性!