什么是MedSegBench数据集

AI解读 4小时前 硕雀
6 0

MedSegBench 简介
MedSegBench 是一个面向医学图像分割的综合基准数据集,旨在为不同模态(CT、X‑ray、MRI、超声、内镜、显微镜等)的分割任务提供统一、标准化的评估平台。它汇集了 35 个公开的 2D 医学图像分割子集,覆盖 12 种成像模态,包含超过 60 000 张图像,支持二分类和多分类(最多 19 类)任务。

组成与规模

模态 子集数量 图像总数(约) 任务类型
超声 (Ultrasound) 多个子集(如 AbdomenUSMSBench、BusiMSBench) 12 482 二分类 / 多分类
MRI Promise12MSBench、MosMedPlusMSBench 等 1 473 二分类
X‑ray Covid19RadioMSBench、PandalentMSBench 等 24 194 二分类
内镜 (Endoscopy) KvasirMSBench、PolygGenMSBench 等 4 526 二分类
显微镜 (Microscopy) Bbbc010MSBench、MonusaMSBench 等 2 281 多分类
眼底 (Fundus) ChaseDB1MSBench、ChuacMSBench 等 312 二分类
其他(OCT、Pathology、Dermoscopy 等) 多个子集 约 10 000 二分类 / 多分类

每个子集均提供 train / validation / test 三划分(常用比例 7:1:2),并统一采用 MedMNIST v2 的 .npz Numpy 格式存储,图像尺寸统一为 128×128、256×256、512×512 三种分辨率。

数据格式与分割任务

  • 二分类:如肺部病灶、乳腺结节等,仅需区分前景/背景。
  • 多分类:如细胞核分割(19 类)、胃肠道息肉(3 类)等,标签映射为整数 0~(N‑1)。
  • 所有标签均使用 整数映射,便于直接加载到深度学习框架中。

评估基准与模型
MedSegBench 采用统一的评估指标:PrecisionRecall、F1‑score、Intersection‑over‑Union(IoU)。在基准实验中,以 U‑Net 为主干,分别使用 ResNet‑18、ResNet‑50、DenseNet‑121、EfficientNetMobileNet‑v2、Mix Vision Transformer 等六种编码器进行对比,结果显示 DenseNet‑121 与 EfficientNet 在多数子集上表现最佳。

获取方式与重要链接

使用建议

  1. 通过 GitHub 提供的 medsegbench Python 包直接 pip install medsegbench,即可一键下载并加载指定子集。
  2. 若只需特定模态或分辨率,可在下载页面选择对应的 .npz 文件(128、256、512 三种尺寸)。
  3. 评估时建议使用官方提供的 metrics.py 脚本,以保证指标计算方式一致。

MedSegBench 为医学图像分割研究提供了统一、规模化且跨模态的基准资源,帮助研究者公平比较模型、推动通用医学分割模型的研发。

来源:www.aiug.cn
声明:文章均为AI生成,请谨慎辨别信息的真伪和可靠性!