LUNA16(Lung Nodule Analysis 2016)数据集概述
| 项目 | 内容 |
|---|---|
| 全称 | Lung Nodule Analysis 2016(简称 LUNA16) |
| 来源 | 由 LIDC‑IDRI(Lung Image Database Consortium‑Image Database Resource Initiative)数据集精选而成,专用于肺结节检测的基准评估 |
| 数据规模 | 888 例低剂量胸部 CT 扫描(每例为 3D .mhd/.raw 文件),共标注 1 186 个直径 ≥ 3 mm 的肺结节 |
| 标注方式 | 由 4 位放射科专家独立标注,至少 3 位专家认定为结节即保留;对同一结节若中心距离小于半径则合并,合并后位置取均值 |
| 文件结构 | - CT 图像:.mhd(元数据)+ .raw(体素数据) - 标注 CSV: • annotations.csv(结节中心坐标、直径、患者 ID)• candidates.csv(所有候选结节,含假阳性)• sampleSubmission.csv(竞赛提交模板) |
| 预处理 | 统一切片厚度 ≤ 3 mm、像素间距一致;提供肺部掩码(seg-lungs-LUNA16)供去除非肺区;像素强度已转换为 Hounsfield Unit(HU)并归一化 |
| 评价指标 | 采用 Free‑Response Receiver Operating Characteristic(FROC)曲线,计算不同假阳性率下的灵敏度,以衡量检测算法的召回率和误报率 |
| 使用场景 | - 自动肺结节检测模型的训练与验证 - 结节大小、形态特征的统计分析 - 计算机辅助诊断(CAD)系统的基准测试 - 多模态、3D 卷积网络等前沿医学影像研究 |
| 许可证 | Creative Commons Attribution 3.0(CC‑BY‑3.0),可自由下载、使用和再分发,需保留原始版权声明 |
| 获取方式 | 官方下载页面:https://luna16.grand-challenge.org/ (页面提供数据说明、下载链接及 10‑fold 交叉验证划分) |
| 相关文献 | - Armato III 等,2011,LIDC‑IDRI 数据集介绍 - Setio 等,2017,LUNA16 基准评估论文 - Wang Nan,2025,IEEE Dataport 上的 LUNA16 数据集描述 |
关键特点简述
- 高质量、标准化的 CT 数据
所有扫描均为低剂量、切片厚度 ≤ 3 mm,保证了图像的一致性和临床可用性。 - 严格的结节筛选
只保留直径 ≥ 3 mm、且至少 3 位专家一致认定的结节,排除了噪声和小结节,提高了检测任务的可靠性。 - 完整的标注信息
除了正例结节,还提供了大量假阳性候选(candidates.csv),便于训练检测模型时进行负样本采样。 - 公开基准与竞赛
LUNA16 作为 2016 年肺结节检测大赛的官方数据集,已被数千篇学术论文引用,成为肺结节检测领域的事实标准。 - 易于使用的文件格式
.mhd/.raw兼容 SimpleITK、ITK、VTK 等医学影像库,配套 CSV 可直接用 pandas、numpy 读取,降低了数据预处理门槛。
推荐阅读与资源
- 官方文档与下载: https://luna16.grand-challenge.org/
- 数据使用指南(PDF): https://luna16.grand-challenge.org/documents/LUNA16_Manual.pdf (可在官网获取)
- 常用代码示例(Python + SimpleITK)
import SimpleITK as sitk import pandas as pd # 读取 CT image = sitk.ReadImage('LUNA16/01/0001.mhd') array = sitk.GetArrayFromImage(image) # (z, y, x) # 读取标注 ann = pd.read_csv('LUNA16/annotations.csv')该示例在多篇博客与教程中出现,可直接用于快速上手。
总结
LUNA16 是目前肺结节检测研究中最权威、最广泛使用的公开医学影像基准数据集。它基于 LIDC‑IDRI,经过严格筛选和标准化处理,提供了 888 例高质量低剂量 CT 与 1 186 条专家标注结节,配套完整的候选结节列表和肺部掩码,支持 FROC 评估。研究者可通过官方链接免费下载,遵循 CC‑BY‑3.0 许可证进行学术或商业开发,是构建、评估和比较肺结节自动检测算法的首选资源。
声明:文章均为AI生成,请谨慎辨别信息的真伪和可靠性!