什么是倾向性得分（Propensity Score）

AI解读 5个月前硕雀

81 0 0

倾向性得分（Propensity Score，PS）概述

基本定义
倾向性得分是指在给定一组观察到的协变量X条件下，个体被分配到处理（或暴露）组的概率。
历史渊源
倾向性得分概念由 Rosenbaum 和 Rubin 在 1983 年提出，旨在为观察性研究提供一种“事后随机化”（事后模拟随机对照试验）的手段。
核心目的
- 平衡协变量：在非随机的观察性数据中，处理组与对照组的协变量分布往往不均衡，导致混杂偏差。通过倾向性得分可以在统计上实现两组在协变量上的平衡，从而降低选择偏差。
- 因果推断：在满足“无混杂”（unconfoundedness）和“共同支持”（overlap）假设的前提下，倾向性得分使得处理效应的估计不受观测协变量的影响，接近随机实验的因果解释能力。
估计方法
- 常用 Logistic 回归 或 Probit 回归 将处理指示变量  作为因变量，所有观测协变量  作为自变量，得到每个样本的预测概率，即倾向性得分。
- 也可以使用机器学习模型（如随机森林、梯度提升树）来提高预测精度，但仍需检验模型的可解释性和倾向性得分的分布特性。
常见应用策略
1. 倾向性得分匹配（PSM）‍：在倾向性得分相近的个体之间进行一对一或多对一匹配，使得匹配后样本在协变量上基本平衡。常用最近邻匹配、卡皮尔匹配、半径匹配等方法。
2. 倾向性得分分层（Stratification）‍：将倾向性得分划分为若干层（如五分位），在每层内部比较处理效应，再对层效应加权汇总。
3. 倾向性得分加权（IPW）‍：对每个样本赋予逆概率权重，使加权后整体协变量分布平衡。
4. 倾向性得分作为协变量直接进入回归模型：在回归分析中加入倾向性得分，以控制混杂。
关键假设
- 无混杂（Unconfoundedness）‍：在给定协变量X的条件下，处理指示T(未接受处理)与潜在结果独立。
- 共同支持（Overlap）‍：所有个体的倾向性得分均落在 (0,1) 区间，即每个协变量组合下都有接受和未接受处理的可能性。
  这两个假设是倾向性得分方法能够提供无偏因果估计的前提。
优势与局限
- 优势
  - 能在高维协变量下实现整体平衡，避免逐一匹配的维度灾难。
  - 通过匹配或加权后，可直接使用标准的统计检验（如 t 检验、线性回归）评估处理效应。
  - 在医学、公共卫生、经济、教育等众多领域已得到广泛验证和应用。
- 局限
  - 只能控制已观测的混杂因素，未观测的混杂仍可能导致偏差。
  - 需要足够的样本量和良好的共同支持，否则会出现匹配失败或权重极端。
  - 结果对倾向性得分模型的设定较为敏感，模型选择不当会影响平衡性和效应估计的稳健性。
实施步骤（典型流程）‍
1. 明确研究问题与处理变量。
2. 收集并整理协变量（可能的混杂因素）。
3. 估计倾向性得分（Logistic/Probit 或机器学习模型）。
4. 评估平衡性：使用标准化差异（Standardized Mean Difference）或可视化（倾向性得分密度图）检查匹配/加权前后的协变量分布。
5. 选择平衡方法（匹配、分层、加权或回归调整）。
6. 估计处理效应：在平衡后的样本上进行因果效应估计。
7. 敏感性分析：检验未观测混杂对结果的潜在影响。
常见应用领域
- 医学/公共卫生：评估药物、手术或干预措施的真实效果（如曲马多 vs. NSAIDs 的死亡率研究）。
- 经济学与政策评估：衡量教育、培训、税收政策等对收入或就业的因果影响。
- 社会科学：研究教育水平、婚姻状态等对健康或行为的影响。
- 推荐系统与机器学习：通过逆倾向性得分进行样本加权，降低数据偏差。

小结：倾向性得分是一种基于协变量的概率度量，旨在通过统计手段在观察性研究中实现组间平衡，从而提供更可靠的因果效应估计。它的核心在于“把非随机的处理转化为条件随机”，但其有效性依赖于充分的协变量信息、合理的模型设定以及满足关键假设。

Propensity Score 倾向性得分

声明：文章均为AI生成，请谨慎辨别信息的真伪和可靠性！

什么是倾向性得分（Propensity Score）

什么是样本重加权（Sample Re‑weighting）

什么是PhysCtrl