什么是IOCfish5k数据集

IOCfish5K 数据集概述

项目 内容 参考来源
数据集全称 Indiscernible Object Counting in Underwater Scenes (IOCfish5K)
研究背景 为了解决水下伪装/不可分辨目标计数(Indiscernible Object Counting, IOC)缺乏合适数据的问题,提出的大规模基准数据集。
图像数量 5 637 张高分辨率水下图像
标注数量 659 024 个中心点(每个鱼体的计数标注)
场景特点 主要是水下场景,包含大量难以从背景中区分的鱼类(如海马、礁石鱼、狮子鱼、叶海龙等),图像分辨率高、密度大、遮挡严重。
数据划分 - 训练集:3 137 张
- 验证集:500 张
- 测试集:2 000 张
标注格式 每张图像对应的 XML(或 txt)文件记录鱼体的中心点坐标;同时提供 train_id.txtval_id.txttest_id.txt 列出各子集的图像 ID。
主要用途 - 不可辨识目标计数(IOC)基准
- 密集目标计数(DOC)研究
- 水下视觉增强、伪装目标检测、跨模态学习等方向的实验平台
下载链接 GitHub 项目页面:<https://github.com/GuoleiSun/Indiscernible-Object-Counting >(包含数据下载脚本、说明文档)
其他获取渠道 CCF 计算机视觉专委会简报中提供的 PDF 附件也列出了数据集地址。

详细说明

  1. 数据采集与质量控制
    • 图像来源于公开的水下摄影平台(如 YouTube、海洋科研数据库),经过约 200 小时的筛选与人工审查,剔除质量不达标或目标稀疏的图片。
    • 为保证标注的一致性,6 名专业标注员对所有图像进行中心点标注,并对密度较高的场景(每图 >200 条实例)进行二次检查。
  2. 标注难点
    • 鱼类在水草、岩石等背景中高度伪装,视觉上与环境几乎不可区分,导致中心点标注工作比普通目标计数更具挑战性。
    • 为此,标注流程采用“先粗后细”策略:先定位大致区域,再精确标记中心点,最终形成密集的点云标注。
  3. 基准评估
    • 论文中选取了 14 种主流密集计数方法(包括基于密度图、回归模型等)在 IOCfish5K 上进行评测,展示了该数据集对现有方法的挑战性。
    • 同时提出了专门针对不可辨识场景的基线模型 IOCFormer,在该数据集上取得了最先进的性能。
  4. 研究价值
    • 规模优势:相较于之前的不可辨识计数数据集,IOCfish5K 在图像数量、分辨率、标注密度上均有显著提升。
    • 场景独特:聚焦水下伪装目标,填补了海洋视觉任务的空白,为海洋生态监测、渔业资源评估等实际应用提供了数据支撑。

如何获取与使用

  1. 访问 GitHub 项目页面(上表中的下载链接),按照 README 中的说明执行 download.sh 脚本即可下载完整数据集(约数十 GB)。
  2. 数据结构如下:
    IOCfish5K/
    ├── images/          # 原始 JPG/PNG 图像
    ├── annotations/     # 对应的 XML/JSON 标注文件(中心点坐标)
    ├── train_id.txt    # 训练集图像 ID 列表
    ├── val_id.txt      # 验证集图像 ID 列表
    └── test_id.txt     # 测试集图像 ID 列表
    
  3. 推荐使用 Python 的 xml.etree.ElementTree 或 json 库读取标注,结合 torchvisionmmcv 等框架构建数据加载器。

总结:IOCfish5K 是目前规模最大、标注最密集的水下不可辨识目标计数数据集,提供了 5 637 张高分辨率图像和 659 024 条中心点标注,分为训练/验证/测试三套标准划分。它不仅推动了伪装场景计数算法的研发,也为海洋生态监测等实际应用提供了宝贵的视觉数据资源。若需获取数据,请直接访问上述 GitHub 链接。

来源:www.aiug.cn
声明:文章均为AI生成,请谨慎辨别信息的真伪和可靠性!