支撑集(Support Set)概念概述
- 基本定义
支撑集是指在少样本学习(Few‑Shot Learning)或元学习(Meta‑Learning)任务中,提供给模型的少量带标签的样本集合。模型在看到支撑集后,需要快速适应并在同一任务的查询集(Query Set)上完成预测。支撑集的出现是为了解决“训练集与测试集类别不重叠、标注成本高”的情形。 - 支撑集与训练集的区别
- 训练集(Training Set):规模大、类别固定,用于学习通用特征或初始化模型参数。
- 支撑集(Support Set):规模极小、类别在训练阶段未出现,仅在任务推理阶段提供少量标注,用于快速微调或直接推理。
- 支撑集往往在每一次“episode”(训练或测试的一个小任务)中重新抽取,以模拟真实的少样本情境。
- 典型使用场景
- 支撑集的构造方式
- 随机抽样:从大规模基类数据中随机抽取 类、每类 张标注样本,形成支撑集。
- 任务模拟:在训练阶段通过 episodic training(任务式训练)不断生成支撑集‑查询集对,以逼近测试时的真实分布。
- 领域特定:在医学、遥感等专业领域,支撑集往往由专家手工标注的少量病例或图像组成,强调“少量高质量”。
- 支撑集的评价指标
- 常见的 N‑way K‑shot 设定
- 1‑way 1‑shot:仅有一个类别、一个样本,极端少样本情形。
- 5‑way 5‑shot:常见的基准设置,支撑集包含 5 类、每类 5 张标注样本,总计 25 张。
- 更大规模:如 20‑way 10‑shot,用于评估模型在更复杂任务下的适应能力。
- 支撑集在整体学习流程中的位置
预训练阶段(可选) → 任务抽取 → 构造支撑集 S 与查询集 Q ↓ ↓ 元学习/原型学习/微调 → 在 S 上快速适应 → 在 Q 上评估/推理
支撑集是连接“通用知识”(预训练)与“任务特定知识”(快速适应)的桥梁,使模型能够在仅有极少标注的情况下实现有效推断。
小结
支撑集(Support Set)是少样本学习中核心的“小型标注数据块”。它通过 N‑way K‑shot 的结构提供有限的类别信息,帮助模型在新任务上快速适应。支撑集的设计、抽样方式以及与查询集的配合,直接决定了少样本学习方法的效果和鲁棒性。
声明:文章均为AI生成,请谨慎辨别信息的真伪和可靠性!