1. 什么是 KITTI 数据集
KITTI(全称 “Karlsruhe Institute of Technology and Toyota Technological Institute at Chicago Dataset”)是由德国卡尔斯鲁厄理工学院(KIT)与丰田美国技术研究院(TTIC)联合创建的、面向自动驾驶和机器人视觉的多模态基准数据集。它旨在提供真实、复杂的道路场景,以评估和推动立体视觉、光流、视觉里程计、3D 目标检测与跟踪等技术在实际车载环境中的表现。
2. 数据采集平台与传感器
- 平台:装配在大众帕萨特 B6(或类似的标准汽车)上。
- 传感器:
3. 数据内容与规模
- 图像:高分辨率 RGB 与灰度立体图像,分辨率约 1242 × 375 像素。
- 点云:Velodyne 采集的 3D 激光点云。
- 标注:包括 2D/3D 边界框、语义分割标签、光流、相机标定文件等。
- 规模:约 7 481 帧训练数据、7 518 帧测试数据,超过 200 k 条 3D 标注目标,涵盖车辆、行人、骑行者等 8 类对象。
4. 主要任务与基准
KITTI 为以下任务提供标准评测基准:
- 立体匹配(Stereo)
- 光流估计(Optical Flow)
- 视觉里程计(Visual Odometry)
- 3D 目标检测(Object Detection)
- 3D 多目标跟踪(Tracking)
每个任务都有官方评测脚本和评价指标(如 AP、IoU、精确度‑召回率曲线),便于不同算法的公平比较。
5. 下载与使用
官方主页提供完整的下载入口与文档,地址为:
- 官方网站:The KITTI Vision Benchmark Suite
- 对象检测下载页(含 3D 标注):
下载前需注册并同意使用条款。数据以压缩包形式提供,解压后即得到 image_2
、velodyne
、label_2
、calib
等目录结构,配套的 MATLAB / Python 开发工具包也可从官网获取,帮助快速读取和可视化。
6. 参考文献
- Geiger, A., Lenz, P., Stiller, C., & Urtasun, R. “Vision meets Robotics: The KITTI Dataset”, IJRR 2013。
- KITTI 官方文档与数据说明(上述链接)。
KITTI 数据集凭借真实的车载传感器融合数据和丰富的标注,已成为自动驾驶研究的事实标准基准,广泛用于学术论文、工业算法评估以及教学实验。
声明:文章均为AI生成,请谨慎辨别信息的真伪和可靠性!