什么是支撑集(Support Set)

支撑集Support Set)概念概述

  1. 基本定义
    支撑集是指在少样本学习(Few‑Shot Learning)或元学习Meta‑Learning)任务中,提供给模型的少量带标签的样本集合。模型在看到支撑集后,需要快速适应并在同一任务的查询集Query Set上完成预测。支撑集的出现是为了解决“训练集测试集类别不重叠、标注成本高”的情形。
  2. 支撑集与训练集的区别
    • 训练集(Training Set:规模大、类别固定,用于学习通用特征或初始化模型参数。
    • 支撑集(Support Set):规模极小、类别在训练阶段未出现,仅在任务推理阶段提供少量标注,用于快速微调直接推理
    • 支撑集往往在每一次“episode”(训练或测试的一个小任务)中重新抽取,以模拟真实的少样本情境。
  3. 典型使用场景
    • 原型网络(Prototypical Networks):计算支撑集每类的原型向量,再依据原型与查询样本的距离进行分类。
    • 模型微调(Fine‑tuning):在支撑集上对预训练模型的最后几层进行少量梯度更新(如 MAML、Meta‑OptNet)。
    • 跨模态任务:如少样本图像分割、医学影像诊断、语音识别等,都把支撑集视为提供少量标注的“参考”样本。
  4. 支撑集的构造方式
    • 随机抽样:从大规模基类数据中随机抽取  类、每类  张标注样本,形成支撑集。
    • 任务模拟:在训练阶段通过 episodic training(任务式训练)不断生成支撑集‑查询集对,以逼近测试时的真实分布。
    • 领域特定:在医学、遥感等专业领域,支撑集往往由专家手工标注的少量病例或图像组成,强调“少量高质量”。
  5. 支撑集的评价指标
    • 支撑集准确率(Support Set Accuracy, SSA):在支撑集本身上评估模型的拟合程度,常用于检验模型是否过拟合支撑集。
    • 支撑集置信度(Support Set Confidence, SSC):衡量支撑集内部样本聚类紧密度,为后续查询预测提供置信度参考。
  6. 常见的 N‑way K‑shot 设定
    • 1‑way 1‑shot:仅有一个类别、一个样本,极端少样本情形。
    • 5‑way 5‑shot:常见的基准设置,支撑集包含 5 类、每类 5 张标注样本,总计 25 张。
    • 更大规模:如 20‑way 10‑shot,用于评估模型在更复杂任务下的适应能力。
  7. 支撑集在整体学习流程中的位置
    预训练阶段(可选) → 任务抽取 → 构造支撑集 S 与查询集 Q
           ↓                         ↓
    元学习/原型学习/微调 → 在 S 上快速适应 → 在 Q 上评估/推理
    

    支撑集是连接“通用知识”(预训练)与“任务特定知识”(快速适应)的桥梁,使模型能够在仅有极少标注的情况下实现有效推断。

小结
支撑集(Support Set)是少样本学习中核心的“小型标注数据块”。它通过 N‑way K‑shot 的结构提供有限的类别信息,帮助模型在新任务上快速适应。支撑集的设计、抽样方式以及与查询集的配合,直接决定了少样本学习方法的效果和鲁棒性

来源:www.aiug.cn
声明:文章均为AI生成,请谨慎辨别信息的真伪和可靠性!