7.1 多元正态总体的抽样分布和参数推断

1 多元正态分布

回顾一元正态分布 N1(μ,σ2) 有密度函数 f(x)=(2πσ2)12exp{12σ2(xμ)2}. 而如果 X1,,Xpi.i.dN1(μ,σ2), 则 X=(X1,,Xp)T 的密度函数为 f(x1,,xn)=(2πσ2)p2exp{12σ2i=1p(xiμ)2}.
下面给出一般的多元正态分布的定义:

多元正态分布

如果 X=(X1,,Xp)Tp 维随机向量, aRp, 都有 aTX 是正态随机变量, 则 X正态随机向量, 它的分布是 p 元正态分布.
EX=μ, CovX=Σ, 则 XNp(μ,Σ).

多元正态分布的基本性质

  1. (正态变量的线性函数也是正态的) 设 XNp(μ,Σ), ARq×p, bRq, 则 Y=AX+bNq(Aμ+b,AΣAT).
  2. (正态分布总是存在) μRp, ΣRp×p, Σ0, XN(μ,Σ).
  3. 任意 p 维正态向量, 可以表示为 Np(0,Ip) 的线性函数.
  4. XNp(μ,Σ). Σ>0 时称 X 是非退化的. 此时 (1.1)f(x)=(2π)p2(detΣ)12exp{12(xμ)TΣ1(xμ)}.
  5. XNp(μ,Σ). 剖分为 X=(X(1)X(2)),μ=(μ(1)μ(2)),Σ=(Σ11Σ12Σ21Σ22), 其中 X(i)pi 维的, p1+p2=p. 则
    1. 如果 Σ12=Σ21T=0, 则 X(1)X(2).
    2. 如果 Σ11 可逆, 则 X(2)|X(1)Np2(μ2+Σ21Σ111(X(1)μ(1)),Σ22Σ21Σ111Σ12).

性质 5 (1) 表明, 不相关的正态变量一定独立, 反之也成立.
5 (2) 的特殊情形 p1=p1, p2=1 在多元分析中很有用.

2 正态总体的抽样分布

设总体 G 有分布 Np(μ,Σ), x1,,xnG: xαNp(μ,Σ),Cov(xα,xβ)=0,α,β=1,,n,αβ.
X=(x1T,,xnT)T. 我们来研究 X 的分布. 容易得知 EXT=(μT,,μT),CovX=(Σ00Σ), 从而 X 遵从 np 元正态分布. 设 Σ=BTB, 则由 性质2, ziji.i.dN(0,1) 相互独立构成的矩阵 Z: X=ZB+M, 这里 M=EX.
推广到 Y=AZB+M: Z=(zij)Rn×p, ziji.i.dN(0,1), ARm×n, BRp×q, MRm×q. 记 AAT=V=(vij), BTB=Σ=(σij). 则 Y 遵从 mq 元正态分布: Eyij=mij,Var(yij)=Var(α,βaiαzαβbβj)=α,βaiα2bβj2=αaiα2βbβj2=viiσjj,Cov(yij,ykh)=Cov(α,βaiαzαβbβj,α,βakαzαβbβh)=α,βaiαbβjakαbβh=vikσjh, 这里 i,k=1,,m;h,j=1,,q. 注意到 Y 的分布只和 M,V,Σ 有关, 因此记 (2.1)YNmq(M,V,Σ).
此时前面的 XNnp(M,I,Σ).

定理 2.1

YNmq(M,V,Σ). 任给 CRk×m, DRq×r: X=CYDNkr(CMD,CVCT,DTΣD).

接下来研究 W=XTX 的分布, 作为 χ2 分布的推广. 这里 XNnp(M,I,Σ), MT=(μ1,,μn). 习惯上称为 Wishart 分布. 它的密度函数比较复杂, 这里只讨论它的一些性质.
不难验算 EW=i=1nE(xixjT)=nΣ+MTM.
Δ=MTM, 则这样的矩阵仅依赖于 p,n,Σ,Δ. 称 p维数, n自由度, Σ协方差矩阵, Δ非中心矩阵. 记 WWp(n,Σ,Δ). 依据 Δ 是否为 0, 区分中心/非中心 Wishart 分布.

定理 2.2

WWp(n,Σ,Δ). 则

  1. 如果 p=1,Σ=σ2, 则 Wσ2χn2(Δ12σ).
  2. ARk×p, 有 AWATWk(n,AΣAT,AΔAT).
定理 2.3

XNnp(M,I,Σ), C 对称, 则

  1. W=XTCXWp(k,Σ,MTCM), 等价于 C 为正投影阵, 其中 k=rankC.
  2. AXBXABT=0. 从而由 B0, AB=0, 推出 AXXTBX; 由 A0,B0, AB=0 推出 XTAXXTBX.
定理 2.4

WWp(n,Σ,Δ), np, Σ>0, 则 P(W>0)=1.

根据定理 2.4, 当 np,Σ>0 时, 几乎可以认为 W 是可逆的, 称 W 有非退化 Wishart 分布. 当 n<pdetΣ=0 时, 则为退化的 Wishart 分布.
作为 Cochran定理 的矩阵二次型的推广:

定理 2.5

XNnp(M,I,Σ), A1,,An0, 满足 XTX=i=1kXTAiX. 记 rankAi=ni, 则 XTAiXWp(ni,Σ,MTAiM)n=i=1kni.

引理 2.1

WWp(n,Σ), np, Σ>0. 剖分 W=(W11W12W21W22),Σ=(Σ11Σ12Σ21Σ22), 其中 W11,Σ11q 阶方阵. 记 W11,2=W11W12W221W21, Σ11,2=Σ11Σ12Σ221Σ21. 则有 W22Wpq(n,Σ22), 且(W221W21|W22)Npq,q(Σ221Σ21,W221,Σ11,2),(W11,2|(W221W21,W22))Wq(np+q,Σ11,2).

定理 2.6

WWp(n,Σ), np, Σ>0. 则

  1. aRp: aTΣ1aaTW1aχnp+12.
  2. xNp(0,Σ), xW, 有 xTW1xnp+1pFp,np+1.

T2=xTW1x, 称为Hotelling T2 统计量.
W1Wp(k1,Σ), W2Wp(k2,Σ), W1W2, 令 Λ=detW1det(W1+W2), 称为Wilks统计量, 它的分布仅依赖于 p,k1,k2, 记为 Λ(p,k1,k2).
下面是关于 Wilks 统计量的一些信息. 它的分布非常复杂.

p k2 F 分布 自由度
1 1ΛΛk1p+1p p,k1p+1
2 1ΛΛk1pp p,k1p
1 1ΛΛk1k2 k2,k1
2 1ΛΛk11k2 2k2,2(k11)

3 正态总体的参数统计推断

设总体 GNp(μ,Σ), y1,,yni.i.dG. 记 YT=(y1,,yn), 则有 YNnp(M,I,Σ),M=(μ,,μ)T.
类似一元统计分析, 令样本均值和协方差矩阵为 (3.1)y=1nα=1nyα,S=1n1α=1n(yαy)(yαy)T.
用矩阵记法: (3.2)y=YT1n1n,S=YTP1nY1n1.

定理 3.1

y,Sμ,Σ 的无偏估计, 且在 μ 的一切线性无偏估计 {YTa}Cov(YTa)Cov(y)0 (也即非负定).

定理 3.2

如果 Σ>0, 则 (y,S) 对于分布族 {Nnp(μ,I,Σ)} 是充分完备统计量. 因此 (y,S)(μ,Σ) 的 UMVUE.

定理 3.3

Σ>0, 则 (y,Wn)(μ,Σ) 的极大似然估计, 这里 W=YTP1Y.

下面给出 y,W 的分布.

定理 3.4

YNnp(M,I,Σ), 其中 MT=(μ,,μ). 记 y=YT1n1n, W=YTP1Y, 则有

  1. yNp(μ,Σn).
  2. WWp(n1,Σ).
  3. yW.

3.1 假设检验

3.1.1 μ=μ0 的检验

现在讨论假设检验 H0:μ=μ0.
Σ>0 已知, 取检验量 T=n(yμ0)TΣ1(yμ0). 显然 Tχn2(δ), δ2=n(μμ0)TΣ1(μμ0). 因此拒绝域为 {Tχn,α2}.
如果 Σ>0 未知, 考虑似然比 λ=MMH=max{L(Y;μ,Σ)|μ,Σ}max{L(Y;μ0,Σ)|Σ},
定理3.2的推导: λ=(detnW1)n2exp(n2){detn[W+n(yμ0)(yμ0)T]1}n2exp(n2)={det[W+n(yμ0)(yμ0)T]detW}n2.
D=(Wyμ0(yμ0)T1n). 由 这里, detD=detW(1n(yμ0)TW1(yμ0))=1ndet[W+n(yμ0)(yμ0)T], 从而 λ=[1+n(yμ0)TW1(yμ0)]n2.
(3.4)T2=n(yμ0)TW1(yμ0),λT2 的严格单增函数, 故拒绝域为 {T2C}. 由 定理2.6(2): H0 成立时 T2nppFp,np, 从而取 C=pnpFp,np,α.

T2 检验正是一元统计中 t 检验的推广.

3.1.2 μi 全部相等的检验

k 个独立的总体分布分别为 Np(μi,Σ), i=1,,k, Σ>0 未知. 现在检验 H0:μ1==μk.
i 中取 ni 个样本: Y(i)=(y1(i)T,,yni(i)T). 记 Y=(Y(1),,Y(k))T, n=i=1kni. 有似然函数L(Y,μ1,,μk,Σ)=C(detΣ)n2exp{12i=1kα=1ni(yα(i)μi)TΣ1(yα(i)μi)}, 从而得到似然比 λ=max{L|μ1,,μk,Σ}max{L|μ1==μk,Σ}=[det(W1++Wk)detW]n2. 其中 Wi=Y(i)TP1nY(i), W=YTP1nY.
Λ=det(W1++Wk)detW. 注意到 W=i=1kα=1ni(yα(i)y)(yα(i)y)T=i=1kα=1ni(yα(i)y(i))(yα(i)y(i))T+i=1kni(y(i)y)(y(i)y)T=i=1kWi+B.
显然 i=1kWiB, WWp(n1,Σ,Δ), WiWp(ni1,Σ). 由 定理2.5, BWp(k1,Σ,Δ). 从而 H0 成立时 Δ=0, ΛΛ(p,nk,k1). 得拒绝域 {Λλα}.

现在研究特殊情形 k=2. 此时B=i=12ni(y(i)y)(y(i)y)T=i=12ni(y(i)ninn3iny(3i))(y(i)ninn3iny(3i))T=i=12ni2n3in2(y(i)y(3i))(y(i)y(3i))T=n1n2n(y(1)y(2))(y(1)y(2))T.
ΛT2=n1n2n(y(1)y(2))TW1(y(1)y(2)) 的严格下降函数, 得拒绝域 {T2pnp1Fp,np1,α}.

3.1.3 协方差矩阵的检验

Y 容量为 n. 检验 H0:Σ=Σ0>0, 令似然比λ=max{L(Y,μ,Σ)|μ,Σ>0}max{L(Y,μ,Σ0)|μ}=(detWn)n2exp{n2}(detΣ0)n2exp{12tr(Σ01W)}=exp{n2}nnp2[det(WΣ01)]n2exp{12tr(Σ01W)}.
根据 定理, 2lnλχp(p+1)22, 因此 n 较大时给出渐进拒绝域 {2lnλχp(p+1)2,α2}.