什么是Cityscapes数据集

AI解读 3小时前硕雀

2 0 0

Cityscapes 是面向 城市道路场景语义分割 的大规模基准数据集，专为自动驾驶和城市感知研究设计。

覆盖范围：采集自 50 座欧洲城市的街道视频序列。
标注规模：提供 5 000 张高质量像素级精细标注（gtFine）图像，另有约 20 000 张弱标注（gtCoarse）图像。
类别：共 19 类常见道路对象（road、sidewalk、building、traffic‑light、person、car 等），以及背景类。
数据结构：每张图像配有左视图（leftImg8bit）和对应的标注文件，文件组织形式为 {root}/{type}{video}/{split}/{city}/{city}_{seq:0>6}_{frame:0>6}_{type}{ext}。
用途：广泛用于像素级语义分割、实例分割、深度估计、场景理解等任务，是 CVPR、ECCV 等顶会基准赛的常客。

官方网站（需注册登录后下载）： https://www.cityscapes-dataset.com/
官方脚本仓库（数据检查、预处理、评估等工具）： https://github.com/mcordts/cityscapesScripts
原始论文（详细介绍数据集设计与基准结果）：The Cityscapes Dataset for Semantic Urban Scene Understanding，CVPR 2016，doi:10.1109/CVPR.2016.350

在官网注册账号并登录，下载所需的压缩包（如 gtFine_trainvaltest.zip、leftImg8bit_trainvaltest.zip）。
解压后使用 cityscapesScripts 中的 prepareTrainId.py 等脚本生成训练所需的 *_labelTrainId.png（19 类标签）。
将图像与标签配对后即可喂入常见的分割网络（DeepLab、PSPNet、Mask RCNN 等）进行训练与评估。

小贴士：由于下载受每日流量限制，建议使用官方提供的 wget 脚本配合登录 cookies 批量下载。

简要概括：Cityscapes 是专注于城市道路场景的高质量语义分割数据集，提供 5 000 张精细标注和 20 000 张弱标注，覆盖 19 类对象，已成为自动驾驶视觉算法的标准基准。相关链接已在上文列出，供直接访问与下载。

声明：文章均为AI生成，请谨慎辨别信息的真伪和可靠性！