什么是曝光偏差（Exposure Bias）

AI解读 2个月前硕雀

73 0 0

曝光偏差是指在自回归生成模型（如语言模型、机器翻译、文本摘要、推荐系统等）训练与推断阶段使用的输入分布不一致所导致的系统性误差。

这种“训练‑测试分布不匹配”会使模型在生成长序列时出现错误累计（error propagation），导致生成质量下降，甚至产生与真实数据分布显著偏离的输出。

原因	说明
输入不一致	训练时使用真实词，推断时使用模型预测词，导致模型未学会纠正自身错误。
模型分布与真实分布差异	生成过程中的条件分布
推荐系统中的曝光限制	用户只能看到系统推荐的物品，未曝光的物品既可能不感兴趣，也可能是系统未能展示的潜在兴趣，从而在隐式反馈中引入曝光偏差。

方法	核心思路	适用场景
Scheduled Sampling	在训练时以一定概率混合使用真实前缀和模型生成前缀，逐步降低对真实前缀的依赖。
强化学习 / GAN	通过奖励函数或对抗训练直接在生成序列上优化，避免仅依赖极大似然估计，如 SeqGAN、RL‑based 训练。
混合损失	在损失函数中加入对生成前缀的约束（如 KL 散度、对比学习），提升模型对错误前缀的鲁棒性。
模型结构改进	引入双向或非自回归解码器（如 BERT‑style 预训练、掩码语言模型），在训练时模拟生成过程的噪声。
后处理校正	使用束搜索、重排模型或置信度校准，对生成结果进行二次筛选，降低错误累计的影响。
推荐系统专用纠偏	通过逆向模型估计未曝光物品的潜在兴趣，或使用因果推断方法消除曝光偏差的影响。

曝光偏差是生成模型在训练‑推断阶段输入分布不匹配的根本问题，导致错误传播和生成质量下降。通过 Scheduled Sampling、强化学习/对抗训练、结构改进 等方法可以在不同层面上缓解该偏差。随着对模型泛化能力和因果推断的深入研究，未来的解决方案将更加系统化、理论化。

声明：文章均为AI生成，请谨慎辨别信息的真伪和可靠性！