在前面的章节中我们分别讨论了不同实验下的 Fisher, Neyman 推断:
- Fisher 关注在强 下, 有限样本算出来的 p 值;
- Neyman 关注对平均因果效应的无偏估计和相对保守的置信区间.
由于它们都基于物理的随机化, 它们都被叫做基于随机化/实验设计的推断. 因为他们都关于有限的总体, 所以也可以叫有限总体推断.
本章我们将试图统一这两者.
1 CRE 下检验强和弱零假设
回顾 , 它的 值在 这里 介绍过. 由于假设检验和置信区间的对偶性, Neyman 给出了 基于 . 基于 的 CLT 和方差估计量的保守性, 我们有
进一步的如果我们定义学生 检验量作为 FRT, 则有以下对偶性质:
- 在 是有限样本 #? 精确的 ;
- 在 下渐近保守.
这只是 统计量的特性, 其他检验量就没有这个特性了.
在 下
在 下用 表示随机打乱, 则随机化分布 满足 这里 是观测结果的样本方差. 基于 (3.1),
这和 的渐近分布不匹配. 理想上说, 我们希望计算 下的 值的时候基于 的真实分布, 但它依赖于未知的潜在结果. 相反地, 我们用 FRT 基于 的 计算, 却不和真实的 下的 匹配. 从而, 的 FRT 可能法控制 下的 I 类错误.
幸运的是, 我们可以用 检验量. 下 (等号当且仅当 .) FRT 假定 , 得到打乱后的分布 .
这里方差为 , 是因为 FRT 用的 潜在结果表 的个体因果效应为 . 在 下, 因为 的真实分布比打乱分布更分散, 因此基于 的 更加渐近保守.
2 CRE 中协变量调整的 FRT
现在我们推广到协变量. 我们在 FRT 中用学生化 Lin 估计: (见 回归调整). 它是 上 OLS 拟合后 的系数, 并转化得到的稳健的 统计量. 下的 FRT 有以下特点:
- 在 下是有限样本精确的;
- 在 下是渐近保守的;
- 相比 不成立下 的 FRT, 更有渐近功效;
- 这些性质在我们用错误的 OLS 模型下依然成立.
3 通用建议
如果没有协变量, 通常使用 的 FRT; 有协变量时, 使用 的 FRT.