什么是BDD100K 数据集

AI解读 5个月前硕雀

35 0 0

BDD100K 数据集概览

内容	说明
全称	Berkeley DeepDrive 100K（BDD100K）
发布机构	加州大学伯克利分校 AI 实验室（BAIR）联合 Nexar 等合作伙伴
发布时间	2018 年 5 月首次公开发布
规模	约 100 000 条 40 s 长的高分辨率视频（720p，30 fps），对应超过 1 亿帧图像；其中约 70 k 张图像用于训练，10 k 张用于验证，20 k 张用于测试
采集范围	美国多个城市（旧金山湾区、纽约、洛杉矶等），覆盖多种道路类型（城市街道、住宅区、高速公路、停车场、隧道）
天气/时间多样性	晴天、阴天、雨天、雪天、雾天等 6 种天气；白天、黄昏、夜晚等 4 种时段
传感器信息	除 RGB 视频外，还提供 GPS、IMU、时间戳等元数据
标注任务	- 图像级标签（天气、时间、场景） - 目标检测（10 类道路目标） - 语义分割、实例分割 - 车道标记、可行驶区域分割 - 多目标跟踪（MOT） - 领域适应、模仿学习等十余任务
主要应用	自动驾驶感知算法研发、跨任务多模态学习、模型鲁棒性评估、迁移学习、仿真数据生成等

1. 数据集的核心特点

大规模且多样：100 k 条视频覆盖不同城市、天气、光照和道路类型，能够帮助模型学习更广泛的驾驶场景。
多任务标注：同一帧图像同时提供检测、分割、车道、可行驶区域等多种标注，适合异构多任务学习研究。
丰富的元数据：GPS/IMU 信息为行为克隆（imitation learning）和轨迹预测提供了高精度的定位参考。
开放且可扩展：官方提供了可下载的原始视频、标注文件（JSON/COCO 格式）以及后续扩展的 LiDAR、雷达等传感器数据计划。

2. 获取方式与重要链接

链接	说明
官方数据主页	https://bdd-data.berkeley.edu （提供数据概览、下载入口、使用协议）
论文（arXiv）‍	https://arxiv.org/pdf/1805.04687.pdf 《BDD100K: A Diverse Driving Video Database with Scalable Annotation Tooling》
数据下载入口	https://bdd-data.berkeley.edu/dataset.html （包括视频、图像、标注、GPS/IMU）
快速下载镜像	https://hyper.ai/datasets/5570 （国内镜像，加速下载）
使用教程	https://developer.aliyun.com/article/798817 （详细的下载、解压、读取示例）

注意：下载前需阅读并同意数据使用协议，非商业研究请注明数据来源。

3. 常见研究方向示例

方向	示例任务
目标检测	检测行人、车辆、交通灯、交通标志等 10 类目标
语义/实例分割	像素级分割道路、车道线、行人等
车道与可行驶区域	预测车辆可行驶的区域，辅助路径规划
多目标跟踪（MOT）‍	在视频序列中持续追踪车辆、行人等对象
跨任务学习	同时训练检测、分割、跟踪，实现共享特征表示
模仿学习 / 行为克隆	利用 GPS/IMU 轨迹学习人类驾驶策略

4. 小结

BDD100K 是目前公开的、规模最大且最具多样性的自动驾驶视觉数据集之一。它不仅提供了丰富的图像/视频资源，还配套了多任务标注和精准的定位元数据，已成为学术界和工业界进行感知算法研发、跨任务学习以及模型鲁棒性评估的标准基准。研究者可以通过官方主页或国内镜像快速获取数据，并在遵守使用协议的前提下开展各类自动驾驶相关研究。

参考文献

Fisher Yu 等. BDD100K: A Diverse Driving Dataset for Heterogeneous Multitask Learning. CVPR 2018.
Bair 项目博客. BDD100K: A Large-scale Diverse Driving Video Database. 2018.
官方数据下载页面. https://bdd-data.berkeley.edu .
其他技术教程与数据统计. https://developer.aliyun.com/article/798817 .

BDD100K BDD100K 数据集自动驾驶数据集

声明：文章均为AI生成，请谨慎辨别信息的真伪和可靠性！