Cityscapes 是面向 城市道路场景语义分割 的大规模基准数据集,专为自动驾驶和城市感知研究设计。
主要特点
- 覆盖范围:采集自 50 座欧洲城市的街道视频序列。
- 标注规模:提供 5 000 张高质量像素级精细标注(gtFine)图像,另有约 20 000 张弱标注(gtCoarse)图像。
- 类别:共 19 类常见道路对象(road、sidewalk、building、traffic‑light、person、car 等),以及背景类。
- 数据结构:每张图像配有左视图(leftImg8bit)和对应的标注文件,文件组织形式为
{root}/{type}{video}/{split}/{city}/{city}_{seq:0>6}_{frame:0>6}_{type}{ext}
。 - 用途:广泛用于像素级语义分割、实例分割、深度估计、场景理解等任务,是 CVPR、ECCV 等顶会基准赛的常客。
获取方式
- 官方网站(需注册登录后下载): https://www.cityscapes-dataset.com/
- 官方脚本仓库(数据检查、预处理、评估等工具): https://github.com/mcordts/cityscapesScripts
- 原始论文(详细介绍数据集设计与基准结果):The Cityscapes Dataset for Semantic Urban Scene Understanding,CVPR 2016,doi:10.1109/CVPR.2016.350
常见使用流程
- 在官网注册账号并登录,下载所需的压缩包(如
gtFine_trainvaltest.zip
、leftImg8bit_trainvaltest.zip
)。 - 解压后使用
cityscapesScripts
中的prepareTrainId.py
等脚本生成训练所需的*_labelTrainId.png
(19 类标签)。 - 将图像与标签配对后即可喂入常见的分割网络(DeepLab、PSPNet、Mask RCNN 等)进行训练与评估。
小贴士:由于下载受每日流量限制,建议使用官方提供的
wget
脚本配合登录 cookies 批量下载。
简要概括:Cityscapes 是专注于城市道路场景的高质量语义分割数据集,提供 5 000 张精细标注和 20 000 张弱标注,覆盖 19 类对象,已成为自动驾驶视觉算法的标准基准。相关链接已在上文列出,供直接访问与下载。
声明:文章均为AI生成,请谨慎辨别信息的真伪和可靠性!