什么是Market‑1501数据集

Market‑1501数据集概览

1. 数据集简介
Market‑1501 是在 2015 年由清华大学发布的行人重识别(Person Re‑Identification)基准数据集,旨在提供大规模、真实场景下的行人图像,以推动跨摄像头行人匹配算法的研究。该数据集在 ICCV 2015 论文 Scalable Person Re‑identification: A Benchmark 中首次提出。

2. 规模与结构

  • 身份数:1501 位行人。
  • 图像总量:约 32 668 张检测框(每张 128 × 64 像素)。
  • 摄像头:6 台摄像头(5 台高清、1 台低清),在清华大学校园的超市前采集。
  • 检测方式:使用 Deformable Part Model(DPM)行人检测器自动生成边界框

3. 数据划分

划分 身份数 图像数 说明
训练集 (bounding_box_train) 751 12 936 用于模型训练
测试集 / Gallery (bounding_box_test) 750 19 732 用于检索库
查询集 (query) 750 3 368 人工标注的查询图像

文件结构典型为 bounding_box_train/bounding_box_test/query/gt_bbox/gt_query/ 等,文件命名遵循 ID_cX_sY_fZ_01.jpg 规则,便于解析摄像头、片段和帧信息。

4. 评估协议

  • 检索任务:使用查询图像在 Gallery 中检索同一身份的图像。
  • 主要指标:Rank‑1 准确率(第一匹配是否正确)和 mAP(Mean Average Precision)。
  • 单帧 / 多帧:支持 single‑shot 与 multi‑shot 两种评估模式。

5. 研究与应用
Market‑1501 已成为行人重识别领域最常用的基准,几乎所有新算法都会在该数据集上报告 Rank‑1 / mAP 结果。它的规模、真实检测框以及 500 K 干扰图像(噪声)使其更贴近实际监控场景,推动了跨视角、跨光照、跨姿态的鲁棒特征学习。常见的研究方向包括:深度特征学习、注意力机制度量学习、无监督/自监督学习等。

6. 获取方式与资源链接

资源 链接 说明
官方论文(ICCV 2015) https://doi.org/10.1109/ICCV.2015.133 数据集提出与基准说明
GitHub 原始代码/下载脚本 https://github.com/zhunzhong07/Market-1501 (或 https://github.com/layumi/HQ-Market ) 包含数据处理脚本与下载说明
其他社区镜像(niruhan) https://github.com/niruhan/market1501 结构化的文件夹示例
Papers with Code Benchmark https://paperswithcode.com/sota/unsupervised-person-re-identification-on-4 汇总最新方法、代码与排行榜
CSDN 详细介绍与下载链接 https://blog.csdn.net/gitblog_06504/article/details/143388296 包含项目地址与使用指南
资源聚合(GitCode) https://gitcode.com/Resource-Bundle-Collection/31953 直接下载数据集压缩包

使用提示:下载后请保持原始文件夹结构,以便常用的 Re‑ID 框架(如 Torchreid、OpenReID)直接读取。评估时建议使用官方提供的 gt_query.txt 与 gt_bbox.txt 进行匹配判断,确保与论文中的评测协议保持一致。


小结
Market‑1501 以其大规模、真实检测框和标准化评估协议,成为行人重识别研究的“金标准”。了解其采集背景、数据划分以及获取渠道,有助于快速搭建实验基线并对比最新算法的性能。

来源:www.aiug.cn
声明:文章均为AI生成,请谨慎辨别信息的真伪和可靠性!