3.5 正态分布参数的检验

很多时候我们假设试验的随机误差服从正态分布, 由此我们有著名的一样本、两两本 t 检验.
但是有些时候我们也怀疑正态分布假设是否正确, 因此也需要有检验是否为正态分布的方法.

1 一样本 t 检验

假设样本 X1,,XnN(a,σ2), a,σ 都是未知参数. 考虑检验问题 (1.1)H0:a=a0H1:aa0. 也即我们好奇均值是否是指定的值. (特别地, 有些时候 a0=0, 一般在两组实验单元可以一一配对、判断均值是否相等时使用.)
考虑 (1.1) 的水平 α 似然比检验.

一样本 t 检验

(1.1), 令 T=n|Xa0|S, 其中 S=i=1n(XiX)2n1 是样本方差. 则 |T|>tn1(α2) 时拒绝 H0, 否则接受 H0.

从而对数似然比为 lnLR(x1,,xn)=lnsupσ>0,af(x1,,xn,a,σ)supσ>0f(x1,,xn,a0,σ)=[i=1n(xia0)2i=1n(xix)2]n2=[1+n(xa0)2i=1n(xix)2]n2, 从而似然比检验有否定域 {|Xa0|i=1n(XiX)2>C}. 为了确定常数 C, 考虑统计量 (1.3)T=n(n1)|Xa0|i=1n(XiX)2.
根据 定理3.1t分布的定义, 当 a=a0Ttn1, 即自由度 n1t 分布. 给定 α(0,1), 从 t 分布表查出 P(tn1>tn1(α2)) 的值 tn1(α2). 根据 t 分布对称性, 它也满足 P(|tn1|>tn1(α2))=α. 从而, |T|>tn1(α2) 时拒绝 H0, 否则接受 H0.

这里 T 称为一样本 t 统计量, 上述加粗的检验称为一样本 t 检验. [1]

1.1 单边情形

有些时候假设检验问题是单边形式 H0:aa0K:a>a0.
这个时候只需要修改为 lnLR(x1,,xn)={[i=1n(xia0)2i=1n(xix)2]n2,x>a0,1,xa0.
从而当 0<α12 时, T>tn1(α) 时拒绝 H0, 否则接受 H0.

可以证明, 单/双边一样本 t 检验是检验问题的 UMPU检验.

2 对比试验的其他检验法

(1.1) 中当 a0=0, 也即通常是两个组两两配对进行对比试验, 此时如果没有把握认为误差是正态的, 则需要其他检验方法.

2.1 符号检验

每对单元中有时候两个对比对象无法量化差距, 则可以定义"+"为甲比乙好, ""为乙比甲好, 0 为难以区别. 我们根据各种符号的多少来检验"甲乙一样"这个假设.
设有 n 对单元, "+"出现了 n+ 次, ""出现了 n 次, 其余为 "0". 如果甲乙一样, 则在非零的 n=n++n 个结果中, 每个是 +, 机会等同. 从而 n+Binom(n,12). 而如果甲乙确实不一样, 那取"+"的概率为 p12. 记 X=n+, 则问题转化为 XBinom(n,p)(p[0,1]),H0:p=12H1:p12.
一个合适的检验为: |Xn2|>C 时, 否定 H0, 否则接受.
当然也可以替换为单边的检验, 这里略去.

2.2 Fisher 置换检验

这里我们对所有的 AB 进行了符号的置换, 得到各种排列组合, 因此称为置换检验.
事实上在 n 很大的时候, 置换检验就可以简化为通常的 t 检验.

3 两样本 t 检验

X1,,XmN(a,σ2), Y1,,YnN(b,σ2), 且全体样本独立. 这里 a,b,σ 未知. 注意方差相同. 考虑 (3.1)H0:a=bH1:ab.

两样本 t 检验

对于 (3.1), 令 T1=mn(m+n2)m+nXYS1tm+n2,
这里 S1=i=1m(xix)2+j=1n(yjy)2, 则 |T1|>tm+n2(α2) 时拒绝 H0, 否则接受 H0.

可以证明它是 UMPU 检验. 这里 T1 称为两样本统计量, 上述检验称为两样本 t 检验.

如果是检验 H0:ab=cH1:abc, 则只需在 T1 中把 XY 改成 XYc.

3.1 单边情形

如果是 H0:ab0H1:ab>0, 则 LR(x,y)={1,yx,(S2S1)m+n2,y<x.

因此若 α12, 则有否定域 T1>tm+n2(α).

如果方差不同且未知, 这个问题将在 这里 讨论.

4 两样本问题的其他检验法

4.1 置换检验法

置换检验的例子类似. 把两种处理的全部试验结果, 即 X1,,Xm,Y1,,Yn 改为 Z1,,Zm+n. 如果两种处理无差别, 则 Z1,,Zm+n 的差别来自于这 m+n 个试验单元的分配, 有 (m+nm) 种. 每种分配下都计算 g=1m(甲处理试验值之和)1n(), 一共有 N=(m+nm) 个值: g1,g2,,gN. (|g1||gN|) 根据实际样本算出 g=XY. 给定水平 α 后, 检验方法为 |g|>|g[Nα]| 时拒绝 H0, 否则接受.
如果是单边, 则改为直接按照原始值排序, 而非绝对值.

4.2 Wilcoxon 秩和检验

回到假设 (3.1). 记 θ=ba, 第一总体 N(a,σ2) 的分布函数为 F(x), 则第二总体 N(b,σ2) 的可以表示为 F(xθ). 如果我们免除 F(x) 是正态分布这一假设, 把它当作完全未知的, 则得到这样一个问题: X1,,XmF(x), Y1,,YnF(xθ), 检验 H0:θ=0H1:θ0. (F 完全未知.)
假设 X1,,Xm,Y1,,Yn 两两不同, 排列为 Z1<<ZN, N=m+n, 则每个 Yi 必是序列中的某一个, 记 Yi=ZRi. 称 Yi 在合并的样本中的Ri.
W=R1++RnWilcoxon 两样本秩和统计量. [2]
现在这样推理: 每个 Ri 可取 1,,N 为值, 平均值为 1N(1++N)=N+12. 若 θ=0, 样本来自同一分布, 则 W 应该在平均值 nN+12 附近; 如果 θ>0, 则 W 会更大; 若 θ<0, 则 W 会更小. 总之, θ0 时, |Wn(N+1)2| 倾向于大值. 因此我们的检验规则是: |Wnn(N+1)2|>C 时拒绝 θ=0, 否则接受.
确定 C: 事实上, 当 m,n 较大, Cuα2112mn(N+1).

对于单边情形 H0:θ0H1:θ>0, 修改为**Wn(N+1)2>C 时拒绝 H0 否则接受**, Cuα112mn(N+1).

5 正态分布方差的检验

5.1 一样本情况

X1,,XnN(a,σ2), a,σ 未知. 考虑 (5.1)H0:σ2=σ02H1:σ2σ02, 这里 σ0>0 已知. 对此给出似然比检验. 不难得出似然比为 LR(x1,,xn)=(eξ)n2eξ2,ξ=1σ02i=1n(xix)2.ξχn12, 不难得到似然比检验**k1ξk2 时接受 H0, 否则拒绝它**, 其中 k1,k2 是下面方程的解: {k1n2ek12=k2n2ek22,P(χn12<k1)+P(χn12>k2)=α.
它不是 UMPU, 但是差距不大. 如果改第一个方程里的 nn1, 则新的 k1,k2 的似然比检验就是 UMPU. 但方程组一般不容易解, 所以我们取 k1=χn12(1α2),k2=χn12(α2).

单侧情况 #? .

5.2 两样本情况

X1,,XmN(a,σ12), Y1,,YnN(b,σ22). a,b,σ12,σ22 未知. 样本相互独立. 考虑 (5.2)H0:σ12σ22H1:σ12>σ22 或者双边问题 (5.3)H0:σ12=σ22H1:σ12σ22. 给出前者的似然比 F=(m1)1i=1m(XiX)2(n1)1j=1n(YjY)2. 原假设成立时 FFm1,n1. 定义 Fm1,n1(α) 满足 P(Fm1,n1>Fm1,n1(α))=α. 则问题变为F>Fm1,n1(α) 时拒绝 H0, 否则接受.
对于后者 (5.3), 似然比为 LR(x1,,xm,y1,,yn)=C(1+F)n2(1+1F)m2, 这里 F=m1n1F, F 定义同上. 则似然比检验为f1Ff2 时接受 H0, 否则拒绝. f1,f2 是下面方程的解{(1+m1n1f1)n2(1+n1(m1)f1)m2=(1+m1n1f2)n2(1+n1(m1)f2)m2P(Fm1,n1<f1)+P(Fm1,n1>f2)=α.
同样它不是 UMPU, 但是把 m2,n2 换成 m12,n12 就行. 方程组的解我们一般取 f1=Fm1,n1(1α2),f2=Fm1,n1(α2).


  1. 我们经常听到 student t test, 这里的 student 是发现者的笔名. ↩︎

  2. 也被叫做 Mann-Whitney 检验. ↩︎