| 内容 | 说明 | 主要来源 |
|---|---|---|
| 全称 | International Skin Imaging Collaboration(国际皮肤影像协作组织)发布的皮肤镜图像库 | |
| 目标 | 为皮肤癌(尤其是黑色素瘤)检测、分割、特征提取等医学图像分析提供大规模、标准化、公开的高质量数据 | |
| 数据类型 | 高分辨率皮肤镜(Dermoscopic)彩色图像 + 结构化元数据(病变诊断、患者信息)+ 像素级分割掩码/边界框 | |
| 主要任务 | 1. 病变分类(良性/恶性、多类别) 2. 病变分割(像素级掩码) 3. 特征检测(网络状结构、负网络、条纹等) |
|
| 评价指标 | 常用 F1‑score、AUC、Dice 系数等 | |
| 发行年份 | 2016 年首次发布挑战赛,随后每年更新(2016‑2024) | |
| 规模(以 2024 年为例) | 约 40 万张 3D‑SLICE 图像(ISIC‑2024 Challenge)+ 过去年度累计超过 30 万张皮肤镜图像 | |
| 许可 | CC‑0(公共领域)或 CC‑BY/CC‑BY‑NC,需注明出处 | |
| 常用下载渠道 | - 官方网站 ISIC Archive(<https://www.isic-archive.com/ >) - 挑战赛页面(<https://challenge.isic-archive.com/ >) - Kaggle 公开赛(如 “ISIC 2019 – Skin Lesion Classification”) - GitHub 下载脚本(<https://github.com/GalAvineri/ISIC-Archive-Downloader >) |
1. 什么是 ISIS 数据集?
ISIC 数据集是由 International Skin Imaging Collaboration(国际皮肤影像协作组织)维护的全球最大公开皮肤病变图像库。它收集了来自多家医院和研究机构的皮肤镜照片,覆盖多种肤色、年龄、部位和病变类型,旨在推动皮肤癌(尤其是黑色素瘤)自动诊断技术的发展。
2. 主要版本与规模
| 版本 | 发布年份 | 图像数量 | 任务类型 |
|---|---|---|---|
| ISIC‑2016 | 2016 | 1,278 | 分类、分割 |
| ISIC‑2017 | 2017 | 2,000+(含分割掩码) | 分类、分割、特征检测 |
| ISIC‑2018 | 2018 | 2,594 | 分类、分割 |
| ISIC‑2019 | 2019 | 25,331(8 类) | 分类 |
| ISIC‑2020 | 2020 | 33,126 | 分类 |
| ISIC‑2024 | 2024 | 约 400,000(3D‑SLICE) | 分类、分割、定位 |
近年来,数据集规模呈指数增长,尤其是 2024 年引入的 3D‑SLICE 子集,使得训练深度学习模型的样本量大幅提升。
3. 数据内容与标注
- 原始图像:彩色皮肤镜图,分辨率常在 1024×1024 像素以上。
- 元数据:包括患者年龄、性别、病变部位、临床诊断(良性/恶性)等结构化信息。
- 像素级掩码:由皮肤科专家手工标注的病变边界,用于分割任务。
- 特征标注:网络状结构、负网络、条纹、粟丘疹样囊肿等细粒度特征(主要在 2017 年挑战中提供)。
4. 常用评估指标
- 分类:AUC、准确率、召回率、F1‑score。
- 分割:Dice 系数、IoU(Intersection over Union)。
- 特征检测:平均精度(mAP)等。
这些指标在 ISIC 官方挑战赛的评审报告中都有明确说明。
5. 获取方式与使用许可
- 官方主页:<https://www.isic-archive.com/ >(提供数据浏览、下载链接、API 文档)。
- 挑战赛页面:<https://challenge.isic-archive.com/ >(每年发布新任务和对应数据集)。
- GitHub 下载脚本:<https://github.com/GalAvineri/ISIC-Archive-Downloader >,可批量下载全部公开图像。
- Kaggle:搜索 “ISIC” 可找到历届挑战赛的镜像数据集,适合快速实验。
数据均采用 CC‑0 或 CC‑BY 许可,使用时需在论文或项目中注明来源(如 “Data from ISIC Archive (https://www.isic-archive.com/ )”)。
6. 研究与应用现状
- 多篇综述和基准评测表明,ISIC 数据集是皮肤癌自动诊断领域最常用的基准,已推动了大量深度学习模型(ResNet、EfficientNet、Vision Transformer 等)的创新。
- 2024 年的 3D‑SLICE 子集进一步促进了 3D 病变定位 与 跨模态学习 的研究方向。
关键链接(可直接点击访问)
- 官方数据门户:<https://www.isic-archive.com/ >
- 挑战赛主页(历届任务):<https://challenge.isic-archive.com/ >
- GitHub 下载脚本:<https://github.com/GalAvineri/ISIC-Archive-Downloader >
- Kaggle 公开赛(如 “ISIC 2019 – Skin Lesion Classification”):<https://www.kaggle.com/competitions/isic-2019 >
以上即为 ISIC 数据集的详细介绍,涵盖了其定义、规模、内容、任务、获取方式以及主要研究进展。希望对你的学习或项目开展有所帮助。
声明:文章均为AI生成,请谨慎辨别信息的真伪和可靠性!