什么是BDD100K 数据集

AI解读 5小时前 硕雀
2 0

BDD100K 数据集概览

内容 说明
全称 Berkeley DeepDrive 100K(BDD100K
发布机构 加州大学伯克利分校 AI 实验室(BAIR)联合 Nexar 等合作伙伴
发布时间 2018 年 5 月首次公开发布
规模 约 100 000 条 40 s 长的高分辨率视频(720p,30 fps),对应超过 1 亿帧图像;其中约 70 k 张图像用于训练,10 k 张用于验证,20 k 张用于测试
采集范围 美国多个城市(旧金山湾区、纽约、洛杉矶等),覆盖多种道路类型(城市街道、住宅区、高速公路、停车场、隧道)
天气/时间多样性 晴天、阴天、雨天、雪天、雾天等 6 种天气;白天、黄昏、夜晚等 4 种时段
传感器信息 RGB 视频外,还提供 GPSIMU、时间戳等元数据
标注任务 - 图像级标签(天气、时间、场景)
- 目标检测(10 类道路目标)
- 语义分割实例分割
- 车道标记、可行驶区域分割
- 多目标跟踪(MOT)
- 领域适应、模仿学习等十余任务
主要应用 自动驾驶感知算法研发、跨任务多模态学习、模型鲁棒性评估、迁移学习、仿真数据生成等

1. 数据集的核心特点

  1. 大规模且多样:100 k 条视频覆盖不同城市、天气、光照和道路类型,能够帮助模型学习更广泛的驾驶场景。
  2. 多任务标注:同一帧图像同时提供检测、分割、车道、可行驶区域等多种标注,适合异构多任务学习研究。
  3. 丰富的元数据:GPS/IMU 信息为行为克隆(imitation learning)和轨迹预测提供了高精度的定位参考。
  4. 开放且可扩展:官方提供了可下载的原始视频、标注文件(JSON/COCO 格式)以及后续扩展的 LiDAR、雷达等传感器数据计划。

2. 获取方式与重要链接

链接 说明
官方数据主页 https://bdd-data.berkeley.edu (提供数据概览、下载入口、使用协议)
论文(arXiv) https://arxiv.org/pdf/1805.04687.pdf 《BDD100K: A Diverse Driving Video Database with Scalable Annotation Tooling》
数据下载入口 https://bdd-data.berkeley.edu/dataset.html (包括视频、图像、标注、GPS/IMU)
快速下载镜像 https://hyper.ai/datasets/5570 (国内镜像,加速下载)
使用教程 https://developer.aliyun.com/article/798817 (详细的下载、解压、读取示例)

注意:下载前需阅读并同意数据使用协议,非商业研究请注明数据来源。


3. 常见研究方向示例

方向 示例任务
目标检测 检测行人、车辆、交通灯、交通标志等 10 类目标
语义/实例分割 像素级分割道路、车道线、行人等
车道与可行驶区域 预测车辆可行驶的区域,辅助路径规划
目标跟踪(MOT) 在视频序列中持续追踪车辆、行人等对象
跨任务学习 同时训练检测、分割、跟踪,实现共享特征表示
模仿学习 / 行为克隆 利用 GPS/IMU 轨迹学习人类驾驶策略

4. 小结

BDD100K 是目前公开的、规模最大且最具多样性的自动驾驶视觉数据集之一。它不仅提供了丰富的图像/视频资源,还配套了多任务标注和精准的定位元数据,已成为学术界和工业界进行感知算法研发、跨任务学习以及模型鲁棒性评估的标准基准。研究者可以通过官方主页或国内镜像快速获取数据,并在遵守使用协议的前提下开展各类自动驾驶相关研究。


参考文献

  1. Fisher Yu 等. BDD100K: A Diverse Driving Dataset for Heterogeneous Multitask Learning. CVPR 2018.
  2. Bair 项目博客. BDD100K: A Large-scale Diverse Driving Video Database. 2018.
  3. 官方数据下载页面. https://bdd-data.berkeley.edu .
  4. 其他技术教程与数据统计. https://developer.aliyun.com/article/798817 .
来源:www.aiug.cn
声明:文章均为AI生成,请谨慎辨别信息的真伪和可靠性!