什么是KITTI MOT数据集

KITTI MOT(Multi‑Object Tracking)数据集概览

内容 说明
定位 KITTI 是由德国卡尔斯鲁厄理工学院(KIT)和丰田技术研究院(TUM)联合创建的自动驾驶视觉基准。其 MOT 子集专门用于 多目标跟踪(车辆、行人等)任务。
任务范围 3D 目标跟踪(3‑D MOT)和 2D 目标跟踪(2‑D MOT),评估对象主要是 Car 与 Pedestrian 两类。
数据组成 序列:21 条训练序列、29 条测试序列(官方评测使用私有标签)。
帧数:训练 8 008 帧、测试 11 095 帧。
标注:共 30 601 个目标实例,形成 636 条完整轨迹。
模态:左侧彩色图像、对应的 3‑D 点云、校准文件、GPS/IMU 信息等。
标注格式 每帧的标签文件包含 17 列信息,常用列包括 frame、track_id、type、occluded、bbox 等;DontCare 区域表示不参与评估。
评估指标 采用 HOTA(Higher Order Tracking Accuracy)指标,同时提供 DetA(检测精度)、IDSW(ID 切换次数)和 MOTA(多目标跟踪精度)等传统指标。
下载与使用 官方下载页面:<http://www.cvlibs.net/datasets/kitti/ >(可直接获取图像、点云、标注及校准文件)。
评测服务器地址(提交结果):The KITTI Vision Benchmark Suite(同上)。
常用基准与基线 - KITTI MOT 评测在 KITTI MOTS(MOT + Segmentation)任务中使用 HOTA 作为主要评分标准。
- 多篇近期论文(如 LiDAR‑MOT‑DETR)在该数据集上报告了 HOTA≈0.95DetA≈0.82 等成绩,表明该基准仍是 3‑D 跟踪研究的核心。
相关资源 官方文档:<https://github.com/kitti-vision/kitti >(代码、说明)
数据集说明页面(中文):<https://zhuanlan.zhihu.com/p/576347805 >(详细读取与可视化示例)
常用论文:Geiger et al., “Vision meets Robotics: The KITTI Dataset” (IJRR 2013);最新评测可参考 arXiv:2505.12753(LiDAR‑MOT‑DETR)

简要结论
KITTI MOT 数据集是自动驾驶领域最具影响力的多目标跟踪基准之一,提供了真实城市、乡村和高速路场景的同步图像、点云和精细轨迹标注。它的 训练/测试划分、完整的标注格式以及统一的 HOTA 评估体系 为学术与工业界的跟踪算法研发提供了统一、可复现的实验平台。通过官方链接即可免费下载并在评测服务器提交结果,广泛用于 2‑D/3‑D 跟踪、跟踪‑分割(MOTS)以及跨模态感知研究。

来源:www.aiug.cn
声明:文章均为AI生成,请谨慎辨别信息的真伪和可靠性!