什么是LUNA16数据集

AI解读 20小时前 硕雀
4 0

LUNA16Lung Nodule Analysis 2016数据集概述

项目 内容
全称 Lung Nodule Analysis 2016(简称 LUNA16)
来源 LIDC‑IDRI(Lung Image Database Consortium‑Image Database Resource Initiative)数据集精选而成,专用于肺结节检测的基准评估
数据规模 888 例低剂量胸部 CT 扫描(每例为 3D .mhd/.raw 文件),共标注 1 186 个直径 ≥ 3 mm 的肺结节
标注方式 由 4 位放射科专家独立标注,至少 3 位专家认定为结节即保留;对同一结节若中心距离小于半径则合并,合并后位置取均值
文件结构 CT 图像:.mhd(元数据)+ .raw(体素数据)
标注 CSV
• annotations.csv(结节中心坐标、直径、患者 ID)
• candidates.csv(所有候选结节,含假阳性)
• sampleSubmission.csv(竞赛提交模板)
预处理 统一切片厚度 ≤ 3 mm、像素间距一致;提供肺部掩码seg-lungs-LUNA16)供去除非肺区;像素强度已转换为 Hounsfield Unit(HU)并归一化
评价指标 采用 Free‑Response Receiver Operating Characteristic(FROC)曲线,计算不同假阳性率下的灵敏度,以衡量检测算法的召回率误报率
使用场景 - 自动肺结节检测模型的训练与验证
- 结节大小、形态特征的统计分析
- 计算机辅助诊断(CAD)系统的基准测试
- 多模态、3D 卷积网络等前沿医学影像研究
许可证 Creative Commons Attribution 3.0(CC‑BY‑3.0),可自由下载、使用和再分发,需保留原始版权声明
获取方式 官方下载页面:https://luna16.grand-challenge.org/
(页面提供数据说明、下载链接及 10‑fold 交叉验证划分)
相关文献 - Armato III 等,2011,LIDC‑IDRI 数据集介绍
- Setio 等,2017,LUNA16 基准评估论文
- Wang Nan,2025,IEEE Dataport 上的 LUNA16 数据集描述

关键特点简述

  1. 高质量、标准化的 CT 数据
    所有扫描均为低剂量、切片厚度 ≤ 3 mm,保证了图像的一致性和临床可用性。
  2. 严格的结节筛选
    只保留直径 ≥ 3 mm、且至少 3 位专家一致认定的结节,排除了噪声和小结节,提高了检测任务的可靠性。
  3. 完整的标注信息
    除了正例结节,还提供了大量假阳性候选(candidates.csv),便于训练检测模型时进行负样本采样。
  4. 公开基准与竞赛
    LUNA16 作为 2016 年肺结节检测大赛的官方数据集,已被数千篇学术论文引用,成为肺结节检测领域的事实标准。
  5. 易于使用的文件格式
    .mhd/.raw 兼容 SimpleITK、ITK、VTK 等医学影像库,配套 CSV 可直接用 pandas、numpy 读取,降低了数据预处理门槛。

推荐阅读与资源

  • 官方文档与下载: https://luna16.grand-challenge.org/
  • 数据使用指南(PDF)‍: https://luna16.grand-challenge.org/documents/LUNA16_Manual.pdf (可在官网获取)
  • 常用代码示例(Python + SimpleITK)
    import SimpleITK as sitk
    import pandas as pd
    
    # 读取 CT
    image = sitk.ReadImage('LUNA16/01/0001.mhd')
    array = sitk.GetArrayFromImage(image)   # (z, y, x)
    
    # 读取标注
    ann = pd.read_csv('LUNA16/annotations.csv')
    

    该示例在多篇博客与教程中出现,可直接用于快速上手。


总结
LUNA16 是目前肺结节检测研究中最权威、最广泛使用的公开医学影像基准数据集。它基于 LIDC‑IDRI,经过严格筛选和标准化处理,提供了 888 例高质量低剂量 CT 与 1 186 条专家标注结节,配套完整的候选结节列表和肺部掩码,支持 FROC 评估。研究者可通过官方链接免费下载,遵循 CC‑BY‑3.0 许可证进行学术或商业开发,是构建、评估和比较肺结节自动检测算法的首选资源。

来源:www.aiug.cn
声明:文章均为AI生成,请谨慎辨别信息的真伪和可靠性!