什么是ISIC数据集

AI解读 5小时前 硕雀
4 0

ISIC 数据集概览

内容 说明 主要来源
全称 International Skin Imaging Collaboration(国际皮肤影像协作组织)发布的皮肤镜图像库
目标 为皮肤癌(尤其是黑色素瘤)检测、分割、特征提取等医学图像分析提供大规模、标准化、公开的高质量数据
数据类型 高分辨率皮肤镜(Dermoscopic)彩色图像 + 结构化元数据(病变诊断、患者信息)+ 像素级分割掩码/边界框
主要任务 1. 病变分类(良性/恶性、多类别)
2. 病变分割(像素级掩码
3. 特征检测(网络状结构、负网络、条纹等)
评价指标 常用 F1‑score、AUC、Dice 系数等
发行年份 2016 年首次发布挑战赛,随后每年更新(2016‑2024)
规模(以 2024 年为例) 约 40 万张 3D‑SLICE 图像(ISIC‑2024 Challenge)+ 过去年度累计超过 30 万张皮肤镜图像
许可 CC‑0(公共领域)或 CC‑BY/CC‑BY‑NC,需注明出处
常用下载渠道 - 官方网站 ISIC Archive(<https://www.isic-archive.com/ >)
- 挑战赛页面(<https://challenge.isic-archive.com/ >)
- Kaggle 公开赛(如 “ISIC 2019 – Skin Lesion Classification”)
- GitHub 下载脚本(<https://github.com/GalAvineri/ISIC-Archive-Downloader >)

1. 什么是 ISIS 数据集

ISIC 数据集是由 International Skin Imaging Collaboration(国际皮肤影像协作组织)维护的全球最大公开皮肤病变图像库。它收集了来自多家医院和研究机构的皮肤镜照片,覆盖多种肤色、年龄、部位和病变类型,旨在推动皮肤癌(尤其是黑色素瘤)自动诊断技术的发展。

2. 主要版本与规模

版本 发布年份 图像数量 任务类型
ISIC‑2016 2016 1,278 分类、分割
ISIC‑2017 2017 2,000+(含分割掩码) 分类、分割、特征检测
ISIC‑2018 2018 2,594 分类、分割
ISIC‑2019 2019 25,331(8 类) 分类
ISIC‑2020 2020 33,126 分类
ISIC‑2024 2024 约 400,000(3D‑SLICE) 分类、分割、定位

近年来,数据集规模呈指数增长,尤其是 2024 年引入的 3D‑SLICE 子集,使得训练深度学习模型的样本量大幅提升。

3. 数据内容与标注

  • 原始图像:彩色皮肤镜图,分辨率常在 1024×1024 像素以上。
  • 元数据:包括患者年龄、性别、病变部位、临床诊断(良性/恶性)等结构化信息。
  • 像素级掩码:由皮肤科专家手工标注的病变边界,用于分割任务。
  • 特征标注:网络状结构、负网络、条纹、粟丘疹样囊肿等细粒度特征(主要在 2017 年挑战中提供)。

4. 常用评估指标

这些指标在 ISIC 官方挑战赛的评审报告中都有明确说明。

5. 获取方式与使用许可

  1. 官方主页:<https://www.isic-archive.com/ >(提供数据浏览、下载链接、API 文档)。
  2. 挑战赛页面:<https://challenge.isic-archive.com/ >(每年发布新任务和对应数据集)。
  3. GitHub 下载脚本:<https://github.com/GalAvineri/ISIC-Archive-Downloader >,可批量下载全部公开图像。
  4. Kaggle:搜索 “ISIC” 可找到历届挑战赛的镜像数据集,适合快速实验。

数据均采用 CC‑0 或 CC‑BY 许可,使用时需在论文或项目中注明来源(如 “Data from ISIC Archive (https://www.isic-archive.com/ )”)。

6. 研究与应用现状

  • 多篇综述和基准评测表明,ISIC 数据集是皮肤癌自动诊断领域最常用的基准,已推动了大量深度学习模型(ResNetEfficientNetVision Transformer 等)的创新。
  • 2024 年的 3D‑SLICE 子集进一步促进了 3D 病变定位 与 跨模态学习 的研究方向。

关键链接(可直接点击访问)

以上即为 ISIC 数据集的详细介绍,涵盖了其定义、规模、内容、任务、获取方式以及主要研究进展。希望对你的学习或项目开展有所帮助。

来源:www.aiug.cn
声明:文章均为AI生成,请谨慎辨别信息的真伪和可靠性!