- 基本定义
倾向性得分是指在给定一组观察到的协变量X条件下,个体被分配到处理(或暴露)组的概率。 - 历史渊源
倾向性得分概念由 Rosenbaum 和 Rubin 在 1983 年提出,旨在为观察性研究提供一种“事后随机化”(事后模拟随机对照试验)的手段。 - 核心目的
- 平衡协变量:在非随机的观察性数据中,处理组与对照组的协变量分布往往不均衡,导致混杂偏差。通过倾向性得分可以在统计上实现两组在协变量上的平衡,从而降低选择偏差。
- 因果推断:在满足“无混杂”(unconfoundedness)和“共同支持”(overlap)假设的前提下,倾向性得分使得处理效应的估计不受观测协变量的影响,接近随机实验的因果解释能力。
- 估计方法
- 常见应用策略
- 倾向性得分匹配(PSM):在倾向性得分相近的个体之间进行一对一或多对一匹配,使得匹配后样本在协变量上基本平衡。常用最近邻匹配、卡皮尔匹配、半径匹配等方法。
- 倾向性得分分层(Stratification):将倾向性得分划分为若干层(如五分位),在每层内部比较处理效应,再对层效应加权汇总。
- 倾向性得分加权(IPW):对每个样本赋予逆概率权重 ,使加权后整体协变量分布平衡。
- 倾向性得分作为协变量直接进入回归模型:在回归分析中加入倾向性得分,以控制混杂。
- 关键假设
- 无混杂(Unconfoundedness):在给定协变量X的条件下,处理指示T(未接受处理)与潜在结果独立。
- 共同支持(Overlap):所有个体的倾向性得分均落在 (0,1) 区间,即每个协变量组合下都有接受和未接受处理的可能性。
这两个假设是倾向性得分方法能够提供无偏因果估计的前提。
- 优势与局限
- 实施步骤(典型流程)
- 明确研究问题与处理变量。
- 收集并整理协变量(可能的混杂因素)。
- 估计倾向性得分(Logistic/Probit 或机器学习模型)。
- 评估平衡性:使用标准化差异(Standardized Mean Difference)或可视化(倾向性得分密度图)检查匹配/加权前后的协变量分布。
- 选择平衡方法(匹配、分层、加权或回归调整)。
- 估计处理效应:在平衡后的样本上进行因果效应估计。
- 敏感性分析:检验未观测混杂对结果的潜在影响。
- 常见应用领域
- 医学/公共卫生:评估药物、手术或干预措施的真实效果(如曲马多 vs. NSAIDs 的死亡率研究)。
- 经济学与政策评估:衡量教育、培训、税收政策等对收入或就业的因果影响。
- 社会科学:研究教育水平、婚姻状态等对健康或行为的影响。
- 推荐系统与机器学习:通过逆倾向性得分进行样本加权,降低数据偏差。
小结:倾向性得分是一种基于协变量的概率度量,旨在通过统计手段在观察性研究中实现组间平衡,从而提供更可靠的因果效应估计。它的核心在于“把非随机的处理转化为条件随机”,但其有效性依赖于充分的协变量信息、合理的模型设定以及满足关键假设。
声明:文章均为AI生成,请谨慎辨别信息的真伪和可靠性!