什么是曝光偏差(Exposure Bias)

AI解读 2个月前 硕雀
73 0

曝光偏差Exposure Bias)概述

曝光偏差是指在自回归生成模型(如语言模型、机器翻译、文本摘要、推荐系统等)训练与推断阶段使用的输入分布不一致所导致的系统性误差。

  • 训练阶段:模型每一步的输入都是来自真实数据(ground‑truth)‍的前缀。
  • 推断阶段:模型只能使用自身生成的前缀作为输入。

这种“训练‑测试分布不匹配”会使模型在生成长序列时出现错误累计(error propagation),导致生成质量下降,甚至产生与真实数据分布显著偏离的输出。


1. 曝光偏差的产生原因

原因 说明
输入不一致 训练时使用真实词,推断时使用模型预测词,导致模型未学会纠正自身错误。
模型分布与真实分布差异 生成过程中的条件分布
推荐系统中的曝光限制 用户只能看到系统推荐的物品,未曝光的物品既可能不感兴趣,也可能是系统未能展示的潜在兴趣,从而在隐式反馈中引入曝光偏差。

2. 曝光偏差的影响

  1. 错误传播:一次预测错误会被后续步骤继续使用,导致序列质量快速下降。
  2. 生成分布偏离:模型生成的句子、段落或推荐列表的统计特性与真实数据不一致,影响评估指标(如BLEUROUGE、点击率等)。
  3. 学习偏差:极大似然训练只在真实前缀上优化,忽视了模型在生成过程中的错误分布,限制了模型的泛化能力

3. 常见的缓解方法

方法 核心思路 适用场景
Scheduled Sampling 在训练时以一定概率混合使用真实前缀和模型生成前缀,逐步降低对真实前缀的依赖。
强化学习 / GAN 通过奖励函数或对抗训练直接在生成序列上优化,避免仅依赖极大似然估计,如 SeqGAN、RL‑based 训练。
混合损失 损失函数中加入对生成前缀的约束(如 KL 散度、对比学习),提升模型对错误前缀的鲁棒性
模型结构改进 引入双向或非自回归解码器(如 BERT‑style 预训练掩码语言模型),在训练时模拟生成过程的噪声。
后处理校正 使用束搜索、重排模型或置信度校准,对生成结果进行二次筛选,降低错误累计的影响。
推荐系统专用纠偏 通过逆向模型估计未曝光物品的潜在兴趣,或使用因果推断方法消除曝光偏差的影响。

4. 研究前沿

  • 从泛化视角审视曝光偏差:最新工作把曝光偏差视为模型泛化能力不足的表现,提出在无条件生成任务上评估模型的“真实”泛化水平。
  • 扩散模型中的曝光偏差:在多步采样的扩散模型里,同样存在预测误差导致的分布偏差,研究者提出 “Epsilon Scaling” 等技术进行度量与缓解。

5. 小结

曝光偏差是生成模型在训练‑推断阶段输入分布不匹配的根本问题,导致错误传播和生成质量下降。通过 Scheduled Sampling、强化学习/对抗训练、结构改进 等方法可以在不同层面上缓解该偏差。随着对模型泛化能力和因果推断的深入研究,未来的解决方案将更加系统化、理论化。

来源:www.aiug.cn
声明:文章均为AI生成,请谨慎辨别信息的真伪和可靠性!