IOCfish5K 数据集概述
| 项目 | 内容 | 参考来源 |
|---|---|---|
| 数据集全称 | Indiscernible Object Counting in Underwater Scenes (IOCfish5K) | |
| 研究背景 | 为了解决水下伪装/不可分辨目标计数(Indiscernible Object Counting, IOC)缺乏合适数据的问题,提出的大规模基准数据集。 | |
| 图像数量 | 5 637 张高分辨率水下图像 | |
| 标注数量 | 659 024 个中心点(每个鱼体的计数标注) | |
| 场景特点 | 主要是水下场景,包含大量难以从背景中区分的鱼类(如海马、礁石鱼、狮子鱼、叶海龙等),图像分辨率高、密度大、遮挡严重。 | |
| 数据划分 | - 训练集:3 137 张 - 验证集:500 张 - 测试集:2 000 张 |
|
| 标注格式 | 每张图像对应的 XML(或 txt)文件记录鱼体的中心点坐标;同时提供 train_id.txt、val_id.txt、test_id.txt 列出各子集的图像 ID。 |
|
| 主要用途 | - 不可辨识目标计数(IOC)基准 - 密集目标计数(DOC)研究 - 水下视觉增强、伪装目标检测、跨模态学习等方向的实验平台 |
|
| 下载链接 | GitHub 项目页面:<https://github.com/GuoleiSun/Indiscernible-Object-Counting >(包含数据下载脚本、说明文档) | |
| 其他获取渠道 | CCF 计算机视觉专委会简报中提供的 PDF 附件也列出了数据集地址。 |
详细说明
- 数据采集与质量控制
- 图像来源于公开的水下摄影平台(如 YouTube、海洋科研数据库),经过约 200 小时的筛选与人工审查,剔除质量不达标或目标稀疏的图片。
- 为保证标注的一致性,6 名专业标注员对所有图像进行中心点标注,并对密度较高的场景(每图 >200 条实例)进行二次检查。
- 标注难点
- 鱼类在水草、岩石等背景中高度伪装,视觉上与环境几乎不可区分,导致中心点标注工作比普通目标计数更具挑战性。
- 为此,标注流程采用“先粗后细”策略:先定位大致区域,再精确标记中心点,最终形成密集的点云标注。
- 基准评估
- 论文中选取了 14 种主流密集计数方法(包括基于密度图、回归模型等)在 IOCfish5K 上进行评测,展示了该数据集对现有方法的挑战性。
- 同时提出了专门针对不可辨识场景的基线模型 IOCFormer,在该数据集上取得了最先进的性能。
- 研究价值
- 规模优势:相较于之前的不可辨识计数数据集,IOCfish5K 在图像数量、分辨率、标注密度上均有显著提升。
- 场景独特:聚焦水下伪装目标,填补了海洋视觉任务的空白,为海洋生态监测、渔业资源评估等实际应用提供了数据支撑。
如何获取与使用
- 访问 GitHub 项目页面(上表中的下载链接),按照 README 中的说明执行
download.sh脚本即可下载完整数据集(约数十 GB)。 - 数据结构如下:
IOCfish5K/ ├── images/ # 原始 JPG/PNG 图像 ├── annotations/ # 对应的 XML/JSON 标注文件(中心点坐标) ├── train_id.txt # 训练集图像 ID 列表 ├── val_id.txt # 验证集图像 ID 列表 └── test_id.txt # 测试集图像 ID 列表 - 推荐使用 Python 的
xml.etree.ElementTree或json库读取标注,结合torchvision、mmcv等框架构建数据加载器。
总结:IOCfish5K 是目前规模最大、标注最密集的水下不可辨识目标计数数据集,提供了 5 637 张高分辨率图像和 659 024 条中心点标注,分为训练/验证/测试三套标准划分。它不仅推动了伪装场景计数算法的研发,也为海洋生态监测等实际应用提供了宝贵的视觉数据资源。若需获取数据,请直接访问上述 GitHub 链接。
声明:文章均为AI生成,请谨慎辨别信息的真伪和可靠性!