什么是BDD100K MOT数据集

AI解读 2个月前 硕雀
52 0

BDD100K MOT多目标跟踪数据集概览

项目 说明 参考
数据集全称 Berkeley DeepDrive 100KBDD100K
数据规模 100 000 条 40 s、720p、30 fps 的驾驶视频,约 1100 h,超过 1 亿帧
任务覆盖 图像标签、目标检测、车道标记、可行驶区域、语义/实例分割目标跟踪(MOT)‍、MOTS、模仿学习等 10 大任务
MOT 子集 2 000 条视频(约 400 K 帧),标注频率 5 fps(约 200 帧/视频)
数据划分 训练 1 400 条、验证 200 条、测试 400 条
轨迹数量 130.6 K 条身份(track IDs)
边框总数 3.3 M 个 bounding box
规模优势 与已有 MOT 数据集(如 KITTI‑MOTS、MOTS‑Challenge)相比,序列数、帧数、身份数、标注密度均显著更大
挑战特性 ① 目标尺度分布广(从小行人到大卡车)
② 频繁出现遮挡与再出现(约 49 418 次遮挡,约每 3.5 条轨迹出现一次)
③ 多样的天气、时间、地理环境导致外观变化
评价指标 常用 MOT 指标:MOTA、MOTP、ID‑Switch、FAF 等;MOTS 额外提供 MOTSA、MOTSP

关键资源与获取方式

资源 链接 说明
官方网站 & 下载页面 https://bdd-data.berkeley.edu/ 提供数据集注册、分块下载(视频、图像、标注)以及最新更新信息
原始论文(arXiv) https://arxiv.org/abs/1805.04687 详细阐述数据采集、标注体系、任务划分,包含 MOT 章节
数据集文档(PDF) https://bdd-data.berkeley.edu/documents/bdd100k.pdf (可在官网获取) 包含标注格式、使用协议、统计表等
官方 GitHub Toolkit https://github.com/bdd100k/bdd100k 提供数据解析、转换、可视化脚本,支持 MOT、MOTS 等子任务
MOT 转换/训练示例(FairMOT‑BDD100K) https://github.com/dingwoai/FairMOT-BDD100K 将 BDD100K 转为 MOT 标准格式,提供训练/评估代码
目标检测+跟踪示例(KITTI‑BDD100K) https://github.com/haofengac/faster-rcnn-KITTI-BDD100K 基于 Faster‑RCNN 的检测+MOT 联合训练示例
数据统计可视化(DatasetNinja) https://datasetninja.com/bdd100k 交互式热图、对象分布统计,帮助了解 MOT 中各类目标的空间分布

使用建议

  1. 下载与准备
    • 在官网注册后,先下载 track 子集(bdd100k/images/track 与对应 labels-20/box-track),再使用官方 Toolkit 将其转换为标准 MOT 文件结构(images/ + labels/)。
  2. 基准模型
    • FairMOT‑BDD100K(GitHub)提供了即插即用的 FairMOT 实现,已适配 BDD100K 的多类 MOT(车辆、行人、骑行者等)。
    • 若需结合检测,可参考 faster‑rcnn‑KITTI‑BDD100K,实现检测‑跟踪联合训练,提升 MOTA 与 ID‑Switch。
  3. 评估
    • 使用官方提供的 eval_mot.py(Toolkit 中)计算 MOTA、MOTP、ID‑Switch、FAF。对 MOTS 任务则使用 eval_mots.py,得到 MOTSA、MOTSP。
  4. 跨任务研究
    • BDD100K 的多任务标注使得可以在同一视频上同时训练检测、分割、跟踪等,探索 异构多任务学习(如在检测上预训练再迁移到 MOT,已在论文中证明可提升 AP 与 MOTA)。

小结

  • 规模:BDD100K MOT 是目前公开的最大规模多目标跟踪子集,拥有 2 000 条视频、400 K 帧、130 K 条身份、3.3 M 个框。
  • 多样性:覆盖多种天气、时间、城市/郊区场景,目标尺度与遮挡情况丰富,能够真实检验算法的鲁棒性
  • 资源完整:官方提供完整下载、文档、Python Toolkit;社区有多套成熟的检测/跟踪实现(FairMOT、Faster‑RCNN 等),便于快速上手和基准复现。
  • 研究价值:在单一数据集上实现 检测 + 分割 + 跟踪 的联合学习,是评估异构多任务学习策略的理想平台。
来源:www.aiug.cn
声明:文章均为AI生成,请谨慎辨别信息的真伪和可靠性!