4.2 E值:有不可观测混杂变量的观察性实验中的因果性证据

第三部分讨论的所有方法都极其依赖于可忽略性假设. 它们要求控制处理变量和结果变量之间的所有混杂因素. 然而我们无法用数据来验证可忽略性假设. 由于存在不可观测混杂因素, 观察性研究经常受到批评. Yule-Simpson悖论表明, 一个未测量的二元混杂因素可以完全推翻观察到的处理与结果之间的关联. 然而, 要推翻一个更大的观察关联, 这个未测量的混杂因素必须与处理和结果具有更强的关联. 换句话说, 并非所有的观察性研究都是生而平等的. 有些研究能比其他研究提供更强的因果证据.
接下来的三节将讨论各种敏感性分析技术, 它们能够在存在未测量混杂因素的情况下, 量化基于观察性研究的因果证据.

1 Cornfield 型敏感性分析

尽管我们不假定给定 X 时的可忽略性: Z⊥̸{Y(1),Y(0)}|X, 但我们仍然假设在给定 X 和某个不可观测的混淆变量 UZ{Y(1),Y(0)}|(X,U). 我们先对二元的 Y 讨论 (后续可以延拓到其他非负结果). 定义风险比的真实条件因果效应观测到的条件风险比

RRZY|xtrue=P(Y(1)=1|X=x)P(Y(0)=1|X=x).RRZY|xobs=P(Y=1|Z=1,X=x)P(Y=1|Z=0,X=x).

一般来说, 如果有不可观测的 U, 它们是不相等的, 因为RRZY|xtrue=P(Y=1|Z=1,X=x,U=u)f(u|X=x)duP(Y=1|Z=0,X=x,U=u)f(u|X=x)du,RRZY|xobs=P(Y=1|Z=1,X=x,U=u)f(u|Z=1,X=x)duP(Y=1|Z=0,X=x,U=u)f(u|Z=0,X=x)du, 是在关于 U 的不同分布上平均的.

回顾 前面的吸烟的例子. 这里的基因同时导致吸烟和肺癌被称为 共同的原因猜想. Cornfield 以一个更有建设性的视角看待这个问题, 并提问: 这个未观测的混淆变量需要多强才能否决吸烟和肺癌的关系?
考虑如下在 X 条件下的因果图
Pasted image 20260330233202.png|200

我们有 ZY|(X,U). 在 X,U 条件下, Z,Y 并无关联. 但是 X 下, Z,Y 有关联了. 我们假定 U 是二元的, 来简化问题.
定义两个敏感性参数RRZU|x=P(U=1|Z=1,X=x)P(U=1|Z=0,X=x),RRUY|x=P(Y=1|U=1,X=x)P(Y=1|U=0,X=x). 前者衡量实验处理-混杂变量的关联, 后者衡量混杂变量-结果的关联, 都在 X=x 条件下.

定理 1.1

ZY|(X,U) 下, 假设 (1.0)RRZY|xobs>1,RRZU|x,RRUY|x>1,我们有 (1.1)RRZY|xobsRRZU|xRRUY|xRRZU|x+RRUY|x1.

这里的假设是不失一般性的.

这个定理给出了观测到的风险比的上界.

在上面的证明中我们得到一个恒等式 (1.2)RRZY|xobs=(RRUY|x1)f1,x+1RRUY|x1RRZU|xf1,x+1. 但这个恒等式包含了三个参数 {f1,x,RRZU|x,RRUY|x}. 作为对比, 定理 1.1 中只有两个参数 {RRZU|x,RRUY|x} 用来描述混杂变量的强度. 从数学上, (1.2) 比 (1.1) 强. 但是 (1.2) 包含了更多的参数, 所以我们面临了一个取舍, 是要更高的精度 ((1.2)) 还是要更方便的分析 ((1.1)).

2 E 值

根据 定理1.1 和引理 (3), 我们有RRZU|xRRZY|xobs,RRUY|xRRZY|xobsmin(RRZU|x,RRUY|x)RRZY|xobs.
因此要否决观测到的风险比, RRZU|xRRUY|x 都至少要和 RRZY|xobs 一样大. 这些和信息论中的数据处理不等式[1]相关.
如果我们定义 ω=max(RRZU|x,RRUY|x), 则我们利用 定理1.1 和引理得到 ω22ω1β(RRZU|x,RRUY|x)RRZY|xobsω22RRZY|xobsω+RRZY|xobs0, 这是一个二次不等式. 它的小根小于等于 1, 所以 ω=max(RRZU|x,RRUY|x)RRZY|xobs+RRZY|xobs(RRZY|xobs1).
因此要否决观测到的风险比, RRZU|xRRUY|x 中的较大值都至少要和 RRZY|xobs+RRZY|xobs(RRZY|xobs1) 一样大.

E 值

如果观察到条件风险比 RRZY|xobs, 定义 E 值RRZY|xobs+RRZY|xobs(RRZY|xobs1).

E 值是为参数 RRZY|xobs 定义的. 实际上 RRZY|xobs 被采样误差估计. 通过估计的 RRZY|xobs 我们能计算 E 值和对应的置信极限.
Fisher 的 p 值衡量了随机化实验中因果效应的证据强度 (参见 FRT). 但是在样本量巨大的观察性实验中, p 值就可能表现很糟糕了. 即使因果效应真的为 0, 微小的不可观测混杂变量也可能让估计值产生偏差, 而基于抽样的不确定性, 会导致较小的 p 值.
在大样本的观察性研究中, 抽样不确定性是次要的, 不可观测混杂变量的不确定性才是主要的. E 值是观察性研究中因果效应证据的更好指标.

3 扩展讨论

3.1 E 值和因果性的 Bradford Hill 标准

E 值为因果性提供了证据, 但证据不是证明. 大的 E 值下, 我们需要更强的未观测混杂变量来否决观察到的风险比, 因此本身因果的证据更强; 反之小的 E 值下, 我们需要更弱的未观测混杂变量, 因果的证据更弱.

Bradford 的九个因果性标准

  1. Strength (强度): E 值
  2. Consistency (一致性): 结论能否复现
  3. Specificity (特异性): 一对一精准打击
  4. Temporality (暂时性): 原因必须发生在结果之前
  5. Biological gradient (生物学梯度): 剂量-反应关系
  6. Plausibility (合理性): 业务逻辑/科学机制上说得通
  7. Coherence (连贯性): 不与客观事实规律冲突
  8. Experiment (实验): 随机化实验
  9. Analogy (类比): 之前有过类似的成功经验

E 值可以用来说明他的第一条标准: 更强的联系通常提供更强的因果性, 因为要否决更强的联系, 我们需要更强的混杂变量. 而第二部分随机化实验则说明了他的第八条标准.

3.2 Logistic 回归后的 E 值

如果结果是二元的, 流行病学家们就可以用 YiZi,Xi 上的 Logistic 回归: P(Yi=1|Zi,Xi)=eβ0+β1Zi+β2TXi1+eβ0+β1Zi+β2TXi. 这里 Zi 的系数 β1=logP(Yi=1|Zi=1,X=x)P(Yi=0|Zi=1,X=x)P(Yi=1|Zi=0,X=x)P(Yi=0|Zi=0,X=x) 是几率比值的对数. Logistic 回归模型假设对于所有的协变量取值都有共同的几率比值. 此外, 当结果很罕见 (P(Yi=1|Zi=1,Xi=x, P(Yi=1|Zi=0,Xi=x) 接近 0), 条件几率比值约等于条件风险比 β1logP(Yi=1|Zi=1,Xi=x)P(Yi=1|Zi=0,Xi=x)=logRRZY|xobs.
因此, 基于 Logistic 回归系数的估计量和对应的置信极限, 我们可以立即计算 E 值, 这也是它的一个主要应用.

3.3 非零真实因果效应

定理1.1 假设实验对结果没有真的因果效应, 即 RRZY|xtrue=1. 我们有一个更一般的结果, 允许有一个非零的真实因果效应.

定理 2.1

修改定义为 RRUY|x=maxz=0,1P(Y=1|Z=z,U=1,X=x)P(Y=1|Z=z,U=0,X=x). 假设 (1.0) 成立. 我们有 RRZY|xtrueRRZY|xobs/RRZU|xRRUY|xRRZU|x+RRUY|x1.

定理 1.1 是它在 RRZY|xtrue=1 下的特例. 在没有额外的假设下, 定理 2.1 给出了一个更低的下界.
当处理是预防性的, 观察到的风险比小于 1. 此时这两个定理不再直接有用, 我们要重新标记实验/对照单元, 在 1RRZY|xobs 上重新计算 E 值.

4 一些批评和回应

4.1 E 值只是风险比的单调变换?

这是部分正确的. 但是更重要的是它解释了: 为了否决观测到的风险比, 混杂变量至少要和 E 值一样大.

4.2 E 值的校准

E 值依赖的混杂性本质上是潜在的, 我们没办法直接决定一个 E 值是大还是小. 另一个问题是 E 值取决于我们已经控制了多少 X. 所以不同实验的 E 值没法直接比较.
我们可以采用如下的"去掉一个协变量"方法. 设 X=(X1,,Xp), 我们假装 Xj 没有被观测到, 然后计算 ZXj, XjY 风险比, 给定其他观测到的协变量.

4.3 对二元结果和风险比效果最好

其他的方法不如二元结果那么优雅. 下一章我们会介绍一种简单的敏感性分析方法, 可以包含结果回归、IPW、双重稳健估计量.


  1. 信息论中, 互信息 I(A,B)=p(a,b)log2p(a,b)p(a)p(b)dadb 衡量了随机变量 A,B 的相关性. 数据处理不等式的结果是: 如果 ZY|U, 则 I(Z,Y)min(I(Z,U),I(U,Y)). ↩︎