MedSegBench 简介
MedSegBench 是一个面向医学图像分割的综合基准数据集,旨在为不同模态(CT、X‑ray、MRI、超声、内镜、显微镜等)的分割任务提供统一、标准化的评估平台。它汇集了 35 个公开的 2D 医学图像分割子集,覆盖 12 种成像模态,包含超过 60 000 张图像,支持二分类和多分类(最多 19 类)任务。
组成与规模
| 模态 | 子集数量 | 图像总数(约) | 任务类型 |
|---|---|---|---|
| 超声 (Ultrasound) | 多个子集(如 AbdomenUSMSBench、BusiMSBench) | 12 482 | 二分类 / 多分类 |
| MRI | Promise12MSBench、MosMedPlusMSBench 等 | 1 473 | 二分类 |
| X‑ray | Covid19RadioMSBench、PandalentMSBench 等 | 24 194 | 二分类 |
| 内镜 (Endoscopy) | KvasirMSBench、PolygGenMSBench 等 | 4 526 | 二分类 |
| 显微镜 (Microscopy) | Bbbc010MSBench、MonusaMSBench 等 | 2 281 | 多分类 |
| 眼底 (Fundus) | ChaseDB1MSBench、ChuacMSBench 等 | 312 | 二分类 |
| 其他(OCT、Pathology、Dermoscopy 等) | 多个子集 | 约 10 000 | 二分类 / 多分类 |
每个子集均提供 train / validation / test 三划分(常用比例 7:1:2),并统一采用 MedMNIST v2 的 .npz Numpy 格式存储,图像尺寸统一为 128×128、256×256、512×512 三种分辨率。
数据格式与分割任务
- 二分类:如肺部病灶、乳腺结节等,仅需区分前景/背景。
- 多分类:如细胞核分割(19 类)、胃肠道息肉(3 类)等,标签映射为整数 0~(N‑1)。
- 所有标签均使用 整数映射,便于直接加载到深度学习框架中。
评估基准与模型
MedSegBench 采用统一的评估指标:Precision、Recall、F1‑score、Intersection‑over‑Union(IoU)。在基准实验中,以 U‑Net 为主干,分别使用 ResNet‑18、ResNet‑50、DenseNet‑121、EfficientNet、MobileNet‑v2、Mix Vision Transformer 等六种编码器进行对比,结果显示 DenseNet‑121 与 EfficientNet 在多数子集上表现最佳。
获取方式与重要链接
- 官方主页(数据概览、下载入口): https://medsegbench.github.io/
- Zenodo 数据仓库(完整数据、模型权重): https://zenodo.org/records/13381081
- GitHub 代码与 API(Python 数据加载、基准脚本): https://github.com/zekikus/MedSegBench
- 论文(详细描述与基准结果): 预印本可在 medRxiv 获取,标题为 “MedSegBench: A Comprehensive Benchmark for Medical Image Segmentation in Diverse Data Modalities”
使用建议
MedSegBench 为医学图像分割研究提供了统一、规模化且跨模态的基准资源,帮助研究者公平比较模型、推动通用医学分割模型的研发。
声明:文章均为AI生成,请谨慎辨别信息的真伪和可靠性!