什么是度量学习(Metric Learning)?
度量学习(Metric Learning)是一类机器学习技术,旨在学习一种距离度量函数(Metric Function),使得在该函数下,相似的样本对距离更近,不相似的样本对距离更远。其核心目标是通过学习一个“衡量标准”,来优化数据点之间的相似性度量,从而提升后续任务(如检索、聚类、分类)的性能。
核心原理:从数据中“学会”相似
传统机器学习中,我们通常使用固定的距离度量(如欧氏距离)来计算样本之间的相似性,但这种“一刀切”的方式往往忽略了特定任务的语义差异。度量学习通过训练,让模型根据具体的任务需求,自动调整特征空间,使得:
- 相同类别(或相似属性)的样本对:在特征空间中被压缩得更靠近。
- 不同类别(或不同属性)的样本对:在特征空间中被拉伸得更远。
这种学习得到的距离度量往往比传统的固定度量更具判别性,能更好地反映数据的潜在结构。
关键技术与模型
度量学习主要有两大类方法:
1. 基于对比学习(Contrastive Learning)的模型
这些模型通过对比不同的样本对来学习特征空间的结构。
- Siamese Network(孪生网络)
- 原理:由两个权重共享的子网络组成,分别处理两个输入样本。
- 目标:通过“对比损失”(Contrastive Loss)来优化:相似样本对的特征距离减小,不相似样本对的特征距离增大。
- Triplet Network(三元组网络)
2. 基于深度嵌入(Deep Embedding)的模型
关键指标:What to Optimize
在度量学习中,常见的优化目标是间距(Margin)。为了确保模型学到的距离度量具有良好的判别性,我们通常希望:
- 相似样本对(Positive Pair):它们之间的距离尽可能小。
- 不相似样本对(Negative Pair):它们之间的距离尽可能大。
应用场景
度量学习因其能够有效处理相似性比较的问题而被广泛应用于以下领域:
声明:文章均为AI生成,请谨慎辨别信息的真伪和可靠性!