什么是少样本学习（Few-Shot Learning, FSL）

AI解读 2个月前硕雀

18 0 0

少样本学习（Few-Shot Learning, FSL）‍是一种机器学习范式，旨在让模型在仅有极少量（通常为1到10个）标注样本的情况下，快速学习并准确执行新任务。

它的核心目标是克服传统深度学习模型对大规模标注数据的依赖，使AI系统能够更像人类一样，通过少量例子就能进行概念迁移和知识泛化。

少样本学习的定义通常涉及以下关键要素：

任务级别（Task-Level）‍：学习的对象是任务（Task），而不是单一的类别。模型在训练阶段学习如何学习（Meta-Learning），在测试阶段利用这种学习能力快速适应新任务。
N-Way K-Shot：常用的实验设置是N类（Way）任务中，每类只提供K个支持样本（Shot）。例如，5-Way 1-Shot 表示模型需要区分5个新类别，而每个类别仅有1个训练样本。
支持集与查询集（Support & Query）‍：在每个任务中，少量样本组成“支持集”用于学习，“查询集”用于评估模型的泛化能力。

少样本学习的技术实现主要分为以下几类：

这是最早期且最经典的方法。模型学习一个嵌入空间（Embedding Space），使得同类样本在空间中更接近，不同类样本更远离。

关注于学习一个能快速适应新任务的优化器或初始化参数。

MAML（Model-Agnostic Meta-Learning）‍：学习一个模型的初始化参数，使得模型只需经过极少量的梯度更新（如1-5次）即可适应新任务。
基于梯度的优化器学习：学习一个专门的梯度更新规则，而非通用的梯度下降。

通过生成额外的训练数据或增强现有数据来缓解样本不足的问题。

随着大模型的兴起，少样本学习逐渐向“提示学习（Prompt Learning）”演进。

提示工程（Prompt Engineering）‍：通过设计少量示例（Few-Shot Prompt）来引导大语言模型或多模态模型完成任务，这是2024-2025年非常主流的少样本方法。
跨模态少样本学习：利用语言模型对视觉模型进行指导，实现跨领域的知识迁移。

少样本学习在许多实际场景中发挥着关键作用，特别是标注成本高昂或数据稀缺的领域：

进入2025-2026年，少样本学习的研究热点主要集中在以下几个方面：

声明：文章均为AI生成，请谨慎辨别信息的真伪和可靠性！