1. 背景与定位
CARLA 是一个开源的自动驾驶仿真平台,提供多个预设城镇(Town01‑Town10 等)供研究者生成合成感知数据。Town01 是平台中最早、最小的城镇,常被用作基准训练与评估场景。围绕 Town01 采集的合成数据统称 CARLA Town01 数据集,是学术界和工业界进行感知、规划、控制等任务的常用基准之一。
2. Town01 场景特征
- 地图规模:约 3.7 km 的城市道路网络,包含单向/双向车道、交叉口、红绿灯、行人道等基本要素。
- 道路布局:以单车道为主,转向、左转、右转均可实现,但不支持复杂的多车道换道操作。
- 天气与光照:支持多种预设天气(ClearNoon、ClearSunset、HardRainNoon、WetNoon 等),可在同一地图上切换以生成多样化的感知条件。
3. 数据内容与标注
| 类型 | 说明 | 常见标注 |
|---|---|---|
| RGB 图像 | 前视、侧视、鸟瞰等多视角摄像头,分辨率可自定义(常用 800×600) | - |
| 深度图 | 与 RGB 同步的深度信息 | - |
| 语义分割 | 12 类(道路、车道线、交通灯、行人、车辆等) | 像素级标签 |
| 实例分割 | 区分同类不同实例的标注 | - |
| 点云(LiDAR) | 360° 激光雷达点云(可选) | - |
| 传感器元数据 | GPS、IMU、速度、加速度、碰撞传感器等 | - |
| 控制指令 | 方向盘、油门、刹车等车辆控制信号(用于行为克隆) | - |
4. 规模与采集方式
- 图像数量:单城镇(Town01)约 60 000 张合成图像(训练+验证+测试);在更大规模的 D4RL 任务中,Town01‑full‑v0 包含约 2 百万张图像。
- 采集时长:典型采集 15 小时、10 fps,约 540 k 帧(每个摄像头视角)。
- 采集脚本:官方提供
data-collector仓库,可通过CarlaUE4.sh /Game/Maps/Town01启动仿真并运行 Python 脚本collect.py自动记录传感器数据。 - 同步模式:推荐使用同步模式(
fixed_delta_seconds = 0.05)确保传感器帧对齐。
5. 常见应用与基准任务
| 任务 | 说明 | 参考数据集 |
|---|---|---|
| 语义分割 | 像素级道路/车辆/行人分割 | CARLA Town01(60k 图像) |
| 车道检测 | 车道线提取与方向估计 | Town01 采集的多天气序列 |
| 行为克隆 / 端到端控制 | 通过视觉输入预测转向、油门、刹车 | LMDrive 中的 Town01 子集 |
| 强化学习 / 轨迹规划 | 通过离线数据训练导航策略 | D4RL carla-town-v0(100k 图像) |
| SLAM / 位姿估计 | 多传感器(RGB、深度、LiDAR)同步数据用于定位 | CARLA‑Loc 包含 Town01 在不同天气下的 6 条序列 |
6. 获取方式与使用注意
- 获取代码:在 GitHub 上的
carla-simulator/data-collector仓库中下载对应版本(建议使用 CARLA 0.9.13 以上)。 - 数据下载:部分公开数据集(如 LMDrive、D4RL)提供直接下载链接;也可自行运行采集脚本在本地生成。
- 版权与引用:数据为合成数据,使用时请注明来源(如引用对应论文或数据集文档)。
- 兼容性:不同 CARLA 版本的地图文件可能略有差异,采集时请确保使用与数据集对应的版本(如 Town01 在 0.9.x 系列中保持不变)。
小结
CARLA Town01 数据集是基于开源仿真平台 CARLA 的核心合成感知数据集合,涵盖 RGB、深度、语义分割、点云、传感器元数据以及控制指令等多模态信息。它规模从数万到数百万张图像不等,支持多天气、多传感器配置,已被广泛用于语义分割、车道检测、行为克隆、强化学习和 SLAM 等自动驾驶研究任务。通过官方采集脚本即可自行生成或下载已有公开子集,使用时请遵循相应的引用规范。
声明:文章均为AI生成,请谨慎辨别信息的真伪和可靠性!