什么是对偶变量(Dual Variables)

AI解读 14小时前 硕雀
6 0

对偶变量Dual Variables)概念概述

对偶变量是优化理论(尤其是线性规划、凸优化以及拉格朗逊对偶)中的核心概念。它们并不是原始决策变量本身,而是与约束条件相对应的辅助变量,用来衡量约束在最优解处对目标函数的影响。下面从定义、数学形式、经济解释以及常见性质四个方面进行系统阐述,并辅以典型例子。


1. 经济学解释——影子价格

对偶变量常被称为 影子价格(shadow price)‍,它表示在最优解处,若把某一约束右端常数(资源量)微增一个单位,目标函数值将提升的幅度。

  • 当约束 未被紧绑定(即松弛变量 > 0)时,对偶变量为 0,说明该资源的额外供给对目标没有边际贡献。
  • 当约束 紧绑定(资源已完全利用)时,对偶变量为正,反映该资源的稀缺价值。
    这种解释在生产计划、运输问题以及成本-收益分析中尤为重要。

2. 关键性质

性质 含义 备注
弱对偶性 任意原始可行解的目标值 ≤ 任意对偶可行解的目标值 直接由拉格朗日函数的构造得到
强对偶性 当原始问题和对偶问题都有最优解时,两者的目标值相等 线性规划、凸问题在满足一定条件(如 Slater 条件)下成立
互补松弛(Complementary Slackness) 对每个约束,原始变量与对应对偶变量中至少有一个为零 用于从对偶解恢复原始最优解,或检验解的最优性
对偶变量的可行性 对偶变量必须满足对偶约束(如非负、线性不等式) 求解器常报告 “dual infeasibility” 来指示对偶变量是否可行

3. 常见应用场景

  1. 线性规划:对偶变量提供约束的影子价格,帮助进行灵敏度分析。
  2. 整数规划 / 组合优化:通过对偶松弛得到上界,用于分支定界(branch‑and‑bound)算法。
  3. 支持向量机SVM‍:原始的软间隔最大化问题的对偶形式只涉及拉格朗日乘子(即对偶变量),从而可以使用核函数实现非线性分类。
  4. 网络流、运输问题:对偶变量对应于网络中每条弧的费用或每个节点的供需平衡。
  5. 经济学模型:资源约束的对偶变量即为资源的边际价值,常用于成本‑收益分析与资源配置决策。

4. 小结

  • 对偶变量是 与约束对应的拉格朗日乘子,在数学上把约束转化为目标函数的系数。
  • 其 经济意义 为资源的影子价格,帮助解释约束的稀缺程度。
  • 通过 弱/强对偶性 与 互补松弛,对偶理论为求解和分析优化问题提供了强有力的工具。
  • 在实际工程、金融、机器学习等众多领域,对偶变量都是进行 灵敏度分析、上界估计、模型转化 的关键。
来源:www.aiug.cn
声明:文章均为AI生成,请谨慎辨别信息的真伪和可靠性!