内容 | 说明 |
---|---|
全称 | Berkeley DeepDrive 100K(BDD100K) |
发布机构 | 加州大学伯克利分校 AI 实验室(BAIR)联合 Nexar 等合作伙伴 |
发布时间 | 2018 年 5 月首次公开发布 |
规模 | 约 100 000 条 40 s 长的高分辨率视频(720p,30 fps),对应超过 1 亿帧图像;其中约 70 k 张图像用于训练,10 k 张用于验证,20 k 张用于测试 |
采集范围 | 美国多个城市(旧金山湾区、纽约、洛杉矶等),覆盖多种道路类型(城市街道、住宅区、高速公路、停车场、隧道) |
天气/时间多样性 | 晴天、阴天、雨天、雪天、雾天等 6 种天气;白天、黄昏、夜晚等 4 种时段 |
传感器信息 | 除 RGB 视频外,还提供 GPS、IMU、时间戳等元数据 |
标注任务 | - 图像级标签(天气、时间、场景) - 目标检测(10 类道路目标) - 语义分割、实例分割 - 车道标记、可行驶区域分割 - 多目标跟踪(MOT) - 领域适应、模仿学习等十余任务 |
主要应用 | 自动驾驶感知算法研发、跨任务多模态学习、模型鲁棒性评估、迁移学习、仿真数据生成等 |
1. 数据集的核心特点
- 大规模且多样:100 k 条视频覆盖不同城市、天气、光照和道路类型,能够帮助模型学习更广泛的驾驶场景。
- 多任务标注:同一帧图像同时提供检测、分割、车道、可行驶区域等多种标注,适合异构多任务学习研究。
- 丰富的元数据:GPS/IMU 信息为行为克隆(imitation learning)和轨迹预测提供了高精度的定位参考。
- 开放且可扩展:官方提供了可下载的原始视频、标注文件(JSON/COCO 格式)以及后续扩展的 LiDAR、雷达等传感器数据计划。
2. 获取方式与重要链接
链接 | 说明 |
---|---|
官方数据主页 | https://bdd-data.berkeley.edu (提供数据概览、下载入口、使用协议) |
论文(arXiv) | https://arxiv.org/pdf/1805.04687.pdf 《BDD100K: A Diverse Driving Video Database with Scalable Annotation Tooling》 |
数据下载入口 | https://bdd-data.berkeley.edu/dataset.html (包括视频、图像、标注、GPS/IMU) |
快速下载镜像 | https://hyper.ai/datasets/5570 (国内镜像,加速下载) |
使用教程 | https://developer.aliyun.com/article/798817 (详细的下载、解压、读取示例) |
注意:下载前需阅读并同意数据使用协议,非商业研究请注明数据来源。
3. 常见研究方向示例
方向 | 示例任务 |
---|---|
目标检测 | 检测行人、车辆、交通灯、交通标志等 10 类目标 |
语义/实例分割 | 像素级分割道路、车道线、行人等 |
车道与可行驶区域 | 预测车辆可行驶的区域,辅助路径规划 |
多目标跟踪(MOT) | 在视频序列中持续追踪车辆、行人等对象 |
跨任务学习 | 同时训练检测、分割、跟踪,实现共享特征表示 |
模仿学习 / 行为克隆 | 利用 GPS/IMU 轨迹学习人类驾驶策略 |
4. 小结
BDD100K 是目前公开的、规模最大且最具多样性的自动驾驶视觉数据集之一。它不仅提供了丰富的图像/视频资源,还配套了多任务标注和精准的定位元数据,已成为学术界和工业界进行感知算法研发、跨任务学习以及模型鲁棒性评估的标准基准。研究者可以通过官方主页或国内镜像快速获取数据,并在遵守使用协议的前提下开展各类自动驾驶相关研究。
参考文献
- Fisher Yu 等. BDD100K: A Diverse Driving Dataset for Heterogeneous Multitask Learning. CVPR 2018.
- Bair 项目博客. BDD100K: A Large-scale Diverse Driving Video Database. 2018.
- 官方数据下载页面. https://bdd-data.berkeley.edu .
- 其他技术教程与数据统计. https://developer.aliyun.com/article/798817 .
声明:文章均为AI生成,请谨慎辨别信息的真伪和可靠性!