本章介绍倾向得分的几个应用:
- 在回归中将倾向得分作为一个协变量;
- 用逆倾向得分作为回归权重.
这是基于下面的原因:
- 易于实现, 回归中只包含标准的统计库;
- 效果和很多复杂方法相当;
- 能轻松扩展到其他模型, 包括机器学习算法.
1 在回归中将倾向得分作为一个协变量
根据 这个定理, 如果 条件下可忽略性成立, 则在 下也成立: 类似 (2.2), 也可以无参数地表示为 这启发了 在 上回归的算法. 最简单的 OLS 就是 在 上的回归. 这里 的系数 作为估计量. 为了简单起见, 我们讨论群体 OLS: 然后定义 为 的系数. 如果我们有一个正确的倾向得分模型, 且结果模型却是关于 是线性的, 那它关于 是一致的. 更有趣的是, 可以估计 前面 提到的 , 如果我们有一个正确的倾向得分模型, 即使结果模型完全错误.
如果 , 则 在 上的群体 OLS 拟合下, 的系数是 回顾一下 , .
这说明重合度条件再也不需要了. 即使有些单元的 为 , 它们的权重都是 , 所以它们不用为 贡献任何东西.
根据 FWL 定理, 我们可以通过两步得到 :
- 在 上 OLS, 得到 ;
- 在 上 OLS, 得到 .
则 所以截距 , 残差为 . 这样我们能得到 化简分母 分子为 这里 (*) 是因为 , (**) 是因为塔式法则和可忽略性.
从证明看出, 我们可以简单的把 在 上跑 OLS. 进一步地, 我们可以把 包括进 OLS 拟合, 它在有限样本中可能能提升精度. 不过这不会改变待估计量就是 . 我们把这些结果总结如下:
如果 , 则
- 在 或者 上的群体 OLS 中, 的系数是 ;
- 在 上的群体 OLS 中, 的系数是 .
- 第一个结果就是定理 1.1 证明中的一步; 第二个结果成立是因为不管是 还是 , 都不改变 的系数, 因为均值为 .
- 我们可以再次用 FWL 定理. 我们首先从 在 上的群体 OLS, 得到残差 则 在 上群体 OLS 下 的系数就和 上群体 OLS 的系数一样.
定理 1.1 启发了一个两步的 的估计方法:
- 拟合倾向得分模型来得到 ;
- 在 上跑 OLS, 得到 的系数.
推论 的 (1) 启发了:
- 拟合 ;
- 在 上跑 OLS, 得到 的系数.
推论的 (2) 启发了:
- 拟合 ;
- 在 上跑 OLS, 得到 的系数.
尽管 OLS 对点估计很方便, 但是标准误差会是错误的, 因为第一步倾向得分估计的不确定性. 我们可以用 bootstrap 来近似估计标准误差.
2 用逆倾向得分作为回归权重
2.1 平均因果效应
我们再来看一下 hajek估计量 这等于实验/对照组的结果加权均值之差. 数值上, 它等于 在 上 WLS 的 系数:
等于如下 WLS 产生的 : 这里
从这个命题看出, 我们可以通过 WLS 容易地得到 . 当然因为倾向得分估计的不确定性, 我们同样要用 bootstrap 来估计标准误差.
为什么 WLS 能给出 的一致估计量?
在 CRE 中, 我们直接 然后用 的系数估计 . 在观察性研究中, 各个样本进对照/实验组的概率是不同的, 但如果我们用 去加权处理组, 去加权对照组, 则它们都能代表总体. 通过加权, 实际上我们人为制造了一个"伪随机实验".
此外, 基于 WLS 的这个估计量还是双重稳定的.
记 为拟合的倾向得分, 是结果均值在 WLS 下的拟合值. 结果回归估计量为
而 的双重稳定估计量为
一个有趣的结果将两者关联:
如果 , , 基于 在 以及 (2.1) 权重下的 WLS, 则 也是 WLS 拟合中 的系数.
在 上的 WLS 拟合, 等价于在实验/对照组上的两个 WLS 拟合. 两个 WLS 都有截距, 所以加权残差为 : 所以 的差就是 . 两个估计量都为 这样它们都等于 在 的 WLS 下 的系数.
我们用下表总结因果效应的各种回归估计量.
|
CRE |
没有混杂变量的观察性实验 |
| 没有 |
|
, 有权重 |
| 有 |
|
, 有权重 |
2.2 实验单元的平均因果效应
的结果和 的是平行的. 首先是 的 Hajek 估计量 这里 , 等于 在 的如下 WLS 中, 的系数.
在数值上等于如下 WLS 得到的 : 权重为
如果我们中心化协变量: , 则可以用 (2.2) 的 下 的系数. 类似地, 它等于回归估计量 也等于双重稳健估计量
如果 , (基于 , 权重来自 (2.2)), 则 也就是 的系数.
基于实验/对照组的 WLS 拟合: 这里第二个结果保证了 . 两者都得到
因为协变量被中心化了, 所以第一个结果推出 , 进而得到 .