2.3 随机实验中的分层与后分层

1 分层

CRE 可能会给出不理想的分组方式. 定义一个离散的协变量 Xi{1,,K}, 并定义 n[k]=#{i:Xi=k}, π[k]=n[k]nXi=k 的个数和比例. 在这里我们相当于借助某个协变量, 对实验单元进行了分层. 在实验组、对照组中, n[k]1=#{i:Xi=k,Zi=1},n[k]0=#{i:Xi=k,Zi=0}.
自然 n[k]=n[k]1+n[k]0. 平均来说 E(n[k]1n1n[k]0n0)=0, 但是一般来说在实验组、对照组中它们的差值是显著的.

为了让协变量保持均衡, 我们定义 分层随机化实验 (stratified randomized experiments, SRE)

SRE

固定 n[k]1,n[k]0. 在协变量 XK 个分层中, 我们分别执行一次独立的 CRE.

因此在 CRE 中, 总的随机化个数为 k=1K(n[k]n[k]1), 每一个随机化等可能. 在每一个分层 k 中, 实验组的比例为 e[k]=n[k]1n[k], 这称为 倾向得分 (propensity score).

有了协变量, 我们知道 SRE 只是 CRE 的子集, 也即 k=1K(n[k]n[k]1)<(nn1). 此外 SRE 中 e[k] 是固定的, 而 CRE 中是随机的.

同样可以定义潜在输出 Yi(1),Yi(0) 和个体因果效应 τi=Yi(1)Yi(0). 对分层 k, 定义分层平均因果效应 τ[k]=1n[k]Xi=kτi, 因此有 τ=1ni=1nτi=1nk=1KXi=kτi=k=1Kπ[k]τ[k].
接下来我们讨论对 τ 的统计推断.

2 FRT

同样我们考虑 SRE 中的 FRT. 零假设依然为 H0F:Yi(1)=Yi(0),i=1,,n.
同样地我们可以取任何检验量 T=T(Z,Y,X). 下面是一些常用的.

分层估计量(stratified estimator)

τ^S=k=1Kπ[k]τ^[k],$$$$τ^[k]=1n[k]1i=1n1{Xi=k,Zi=1}Yi1n[k]0i=1n1{Xi=k,Zi=0}Yi.

t 分层估计量 (studentized stratified estimator)

tS=τ^SV^S,$$$$V^S=k=1Kπ[k]2(S^[k]2(1)n[k]1+S^[k]2(0)n[k]0).

组合 Wilcoxon 秩和统计量

首先计算 k 层的 Wilcoxon秩和统计量 W[k], 组合为 WS=k=1Kc[k]W[k]. 两个可行的权重系数为 c[k]=1n[k]1n[k]0,c[k]=1n[k]+1.

3 Neyman 推断

SRE 本质上是 K 个独立的 CRE, 因此沿用 Neyman定理, Var(τ^[k])=S[k]2(1)n[k]1+S[k]2(0)n[k]0S[k]2(τ)n[k]. 这样 τ^S=k=1Kπ[k]τ^[k]τ=k=1Kπ[k]τ[k] 的无偏估计, 且 Var(τ^S)=k=1Kπ[k]2Var(τ^[k]).

3.1 比较 SRE 与 CRE

为了公平对比, 我们让所有的 k 都有相同的倾向得分 e[k]=e.

下面比较样本方差. 首先S2(1)=1n1i=1n{Yi(1)Y(1)}2=1n1k=1KXi=k{Yi(1)Y[k](1)+Y[k](1)Y(1)}2=1n1k=1KXi=k[{Yi(1)Y[k](1)}2+{Y[k](1)Y(1)}2]=k=1K[n[k]1n1S[k]2(1)+n[k]n1{Y[k](1)Y(1)}2]. 类似地 S2(0)=k=1K[n[k]1n1S[k]2(0)+n[k]n1{Y[k](0)Y(0)}2],S2(τ)=k=1K[n[k]1n1S[k]2(τ)+n[k]n1{τ[k]τ}2].
回顾 CRE 的方差 (还是在 Neyman定理 中) 然后代入上面的结果: VarCRE(τ^)=S2(1)n1+S2(0)n0S2(τ)n=k=1K[n[k]1(n1)n1S[k]2(1)+n[k]1(n1)n0S[k]2(0)n[k]1(n1)nS[k]2(τ)+n[k]1(n1)n1{Y[k](1)Y(1)}2+n[k]1(n1)n0{Y[k](0)Y(0)}2n[k]1(n1)n{τ[k]τ}2]k=1K[π[k]n1S[k]2(1)+π[k]n0S[k]2(0)π[k]nS[k]2(τ)+π[k]n1{Y[k](1)Y(1)}2+π[k]n0{Y[k](0)Y(0)}2π[k]n{τ[k]τ}2].
(近似发生在 n[k] 很大的时候).
而在 SRE 中, 由于 π[k]n[k]1=1ne, π[k]n[k]0=1n(1e), π[k]n[k]=1n, 因此 VarSRE(τ^S)=k=1Kπ[k]2[S[k]2(1)n[k]1+S[k]2(0)n[k]0S[k]2(τ)n[k]]=k=1K[π[k]n1S[k]2(1)+π[k]n0S[k]2(0)π[k]nS[k]2(τ)],
因此在 n[k] 很大的时候 VarCRE(τ^)VarSRE(τ^S)=k=1Kπ[k][{Y[k](1)Y(1)}2n1+{Y[k](0)Y(0)}2n0(τ[k]τ)2n]=k=1Kπ[k]n[n0n1{Y[k](1)Y(1)}+n1n0{Y[k](0)Y(0)}]20.

这说明 SRE 总是有一个更小的方差, 结果更加稳定.

4 CRE 的后分层

如果给定 n={n[k]1,n[k]0}k=1K, CRE 成为 SRE: PCRE(Z=z|n)=PCRE(Z=z,n)PCRE(n)=(k=1K(n[k]n[k]1))1.
也即这和 SRE 中 Z 的分布完全一致. 也即在 n 上做条件概率, 可以把 CRE 当成 SRE 来做. 此时 FRT 变成条件 FRT, Neyman 分析变成后分层: τ^PS=k=1Kπ[k]τ^[k]. 这与 τ^S 形式相同, Var(τ^PS|n) 也和 τS^ 一样.