什么是 KITTI 数据集

AI解读 10小时前 硕雀
2 0

KITTI 数据集概述

1. 什么是 KITTI 数据集
KITTI(全称 “Karlsruhe Institute of Technology and Toyota Technological Institute at Chicago Dataset”)是由德国卡尔斯鲁厄理工学院(KIT)与丰田美国技术研究院(TTIC)联合创建的、面向自动驾驶和机器人视觉的多模态基准数据集。它旨在提供真实、复杂的道路场景,以评估和推动立体视觉、光流视觉里程计3D 目标检测与跟踪等技术在实际车载环境中的表现。

2. 数据采集平台与传感器

  • 平台:装配在大众帕萨特 B6(或类似的标准汽车)上。
  • 传感器
    • 两对灰度摄像机、两对彩色摄像机(立体相机)
    • Velodyne HDL‑64E 64 线激光雷达
    • GPS/IMU 惯性导航系统(OXTS RT 3003)
    • 多个光学镜头
      这些传感器以 10 Hz 同步记录,覆盖城市、乡村和高速公路等多种驾驶场景。

3. 数据内容与规模

  • 图像:高分辨率 RGB 与灰度立体图像,分辨率约 1242 × 375 像素。
  • 点云:Velodyne 采集的 3D 激光点云。
  • 标注:包括 2D/3D 边界框语义分割标签、光流、相机标定文件等。
  • 规模:约 7 481 帧训练数据、7 518 帧测试数据,超过 200 k 条 3D 标注目标,涵盖车辆、行人、骑行者等 8 类对象。

4. 主要任务与基准
KITTI 为以下任务提供标准评测基准:

每个任务都有官方评测脚本和评价指标(如 AP、IoU、精确度‑召回率曲线),便于不同算法的公平比较。

5. 下载与使用
官方主页提供完整的下载入口与文档,地址为:

下载前需注册并同意使用条款。数据以压缩包形式提供,解压后即得到 image_2velodynelabel_2calib 等目录结构,配套的 MATLAB / Python 开发工具包也可从官网获取,帮助快速读取和可视化。

6. 参考文献

  • Geiger, A., Lenz, P., Stiller, C., & Urtasun, R. “Vision meets Robotics: The KITTI Dataset”, IJRR 2013。
  • KITTI 官方文档与数据说明(上述链接)。

KITTI 数据集凭借真实的车载传感器融合数据和丰富的标注,已成为自动驾驶研究的事实标准基准,广泛用于学术论文、工业算法评估以及教学实验。

来源:www.aiug.cn
声明:文章均为AI生成,请谨慎辨别信息的真伪和可靠性!