什么是CIFAR‑100数据集

CIFAR‑100 数据集概述

CIFAR‑100 是由加拿大高级研究院（Canadian Institute for Advanced Research）在 2009 年发布的图像分类基准数据集，最初由 Alex Krizhevsky、Vinod Nair 与 Geoffrey Hinton 从 Tiny‑Images 数据库中抽取而来。它是 CIFAR‑10 的扩展版，专为评估卷积神经网络（CNN）等视觉模型的细粒度分类能力而设计。

1. 数据规模与基本结构

项目	说明
图像数量	60 000 张（训练 50 000 张，测试 10 000 张）
图像尺寸	32 × 32 像素，RGB 三通道
类别层次	细粒度 100 个类别（每类 600 张，其中 500 张用于训练，100 张用于测试）
超类层次	20 个超类（每个超类包含 5 个细粒度类别），每张图像同时拥有“精细标签”（所属细类）和“粗糙标签”（所属超类）

2. 类别划分示例

超类：aquatic mammals、fish、flowers、fruit & vegetables、large carnivores、vehicles 1、vehicles 2 等。
细类：海狸、海豚、金鱼、玫瑰、苹果、狮子、卡车等（共 100 种）。

3. 主要用途与研究价值

模型基准：常用于评估图像分类、特征学习、迁移学习、对抗样本、少样本学习等任务的算法性能。
细粒度挑战：相比 CIFAR‑10，类别更多且更细分，提升了对模型辨别细微差别的要求，是检验网络泛化能力的经典“小规模”基准。
教学与实验：因数据量适中、加载方便，广泛出现在深度学习教材、框架示例（如 PyTorch、TensorFlow）以及学术论文中。

4. 下载与获取方式

官方页面（包含数据说明、引用信息、下载链接）：
https://www.cs.toronto.edu/\~kriz/cifar.html
直接下载链接（Python 版压缩包）：
https://www.cs.toronto.edu/\~kriz/cifar-100-python.tar.gz

建议使用官方提供的 cifar-100-python.tar.gz，解压后即可得到 train、test 两个二进制文件，配套的 meta 文件中包含类别名称与超类信息。

5. 引用格式（示例）

Krizhevsky A., Nair V., Hinton G. (2009). Learning Multiple Layers of Features from Tiny Images. Technical Report, University of Toronto.

在学术写作中，可使用上述技术报告或直接引用官方页面。

小结
CIFAR‑100 以其 100 类、20 超类的层次结构和 32×32 小尺寸图像，成为深度学习领域评估细粒度视觉模型的标准基准。通过官方页面即可免费下载并在主流深度学习框架中快速加载使用。