CIFAR‑100 是由加拿大高级研究院(Canadian Institute for Advanced Research)在 2009 年发布的图像分类基准数据集,最初由 Alex Krizhevsky、Vinod Nair 与 Geoffrey Hinton 从 Tiny‑Images 数据库中抽取而来。它是 CIFAR‑10 的扩展版,专为评估卷积神经网络(CNN)等视觉模型的细粒度分类能力而设计。
1. 数据规模与基本结构
| 项目 | 说明 |
|---|---|
| 图像数量 | 60 000 张(训练 50 000 张,测试 10 000 张) |
| 图像尺寸 | 32 × 32 像素,RGB 三通道 |
| 类别层次 | 细粒度 100 个类别(每类 600 张,其中 500 张用于训练,100 张用于测试) |
| 超类层次 | 20 个超类(每个超类包含 5 个细粒度类别),每张图像同时拥有“精细标签”(所属细类)和“粗糙标签”(所属超类) |
2. 类别划分示例
- 超类:aquatic mammals、fish、flowers、fruit & vegetables、large carnivores、vehicles 1、vehicles 2 等。
- 细类:海狸、海豚、金鱼、玫瑰、苹果、狮子、卡车等(共 100 种)。
3. 主要用途与研究价值
- 模型基准:常用于评估图像分类、特征学习、迁移学习、对抗样本、少样本学习等任务的算法性能。
- 细粒度挑战:相比 CIFAR‑10,类别更多且更细分,提升了对模型辨别细微差别的要求,是检验网络泛化能力的经典“小规模”基准。
- 教学与实验:因数据量适中、加载方便,广泛出现在深度学习教材、框架示例(如 PyTorch、TensorFlow)以及学术论文中。
4. 下载与获取方式
- 官方页面(包含数据说明、引用信息、下载链接):
https://www.cs.toronto.edu/\~kriz/cifar.html - 直接下载链接(Python 版压缩包):
https://www.cs.toronto.edu/\~kriz/cifar-100-python.tar.gz
建议使用官方提供的
cifar-100-python.tar.gz,解压后即可得到train、test两个二进制文件,配套的meta文件中包含类别名称与超类信息。
5. 引用格式(示例)
Krizhevsky A., Nair V., Hinton G. (2009). Learning Multiple Layers of Features from Tiny Images. Technical Report, University of Toronto.
在学术写作中,可使用上述技术报告或直接引用官方页面。
小结
CIFAR‑100 以其 100 类、20 超类的层次结构和 32×32 小尺寸图像,成为深度学习领域评估细粒度视觉模型的标准基准。通过官方页面即可免费下载并在主流深度学习框架中快速加载使用。
声明:文章均为AI生成,请谨慎辨别信息的真伪和可靠性!