2.2 无偏估计

1 无偏估计 一致最小方差无偏估计

无偏估计

样本X的分布依赖于参数θΘ, g(θ)是定义在Θ上的已知函数, g^(X)g(θ)的一个估计量. 如果(1.1)Eθ[g^(X)]=g(θ),则称g^(X)g(θ)的一个无偏估计.

Eθ指在θ下计算期望.

一个参数的无偏估计可能不止一个, 也可能根本没有.

为了应对无偏估计不唯一的问题, 采用均方误差准则来从中挑选最佳的. 设g(θ)是一维的.

均方误差

均方误差(Mean Square Error)为MSEθ(g^)=Eθ[g^(X)g(θ)]2.
g^是无偏估计, 则MSEθ(g^)=Varθ(g^).

一致最小方差无偏估计 UMVUE

g^g(θ)的一个无偏估计, 使得任一无偏估计g^1都满足(1.2)Varθ(g^)Varθ(g^1),
g^g(θ) 的一个一致最小方差无偏估计( #UMVUE , Uniformly Minimum Variance Unbiased Estimate).

在讨论 UMVUE 求法前, 先给出一个引理

引理说明, 当有充分统计量T时, 只需考虑能表示为T的函数的无偏估计类.

2 零无偏估计法

定理 2.1

g^(X)g(θ)的一个无偏估计, Varθ(g^(X))<, 对任意满足Eθ(l(X))=0,θΘ的统计量l, 有(2.1)Covθ(g^(X),l(X))=Eθ(g^(X)l(X))=0,g^(X)g(θ)的 UMVUE.

条件Eθ(l(X))=0意味着l是零的无偏估计, 因此得名.

零无偏估计法通常会和 引理1.1 一起使用. 首先引入充分统计量T=T(X), 并据此将检索范围缩小到可表为T的函数的无偏估计类. 再根据T来构造 UMVUE 的表达式.

3 充分-完备统计量法

本方法是 定理2.1 的特例, 将它摆在与之平行的地位.

完备统计量

T是一个统计量 (不必充分). 若对任意(3.1)Eθ(l(T(X)))=0,θΘl(T), 都有(3.2)Pθ(l(T(X))=0)=1,则称T是一个完备统计量.

T(X)有概率密度hθ(t), 则 (3.1) 可以进一步写成(3.3)l(t)hθ(t)dt=0. 因此可以理解为l{hθ|θΘ}正交.

定理 3.1

T是一个完备充分统计量, g^(T(X))g(θ)的一个无偏估计, 满足Varθ(g^(T(X)))<, 则g^(T(X))g(θ)的唯一的 UMVUE.
唯一性是指, 若g^,g^1都是 UMVUE, 则Pθ(g^g^1)=0,θΘ.

这个例子这个例子T是充分、完备的.
定理 3.2 充分完备统计量的判定

设样本 X 有概率函数 (3.4)f(x,θ)=C(θ)exp[T1(x)Q1(θ)++Tk(x)Qk(θ)]h(x), (这被称为 指数型分布族 ( #ExponentialFamily ) )则 T(X)=(T1(X),,Tk(X)) 为充分统计量.
{(Q1(θ),,Qk(θ))|θΘ}Rk有内点, 则T是完备的.

4 C-R 不等式法

C-R 不等式给出了估计方差的下界; 如果找到一个无偏估计使得方差正好取得下界, 那么它就是 UMVUE.

定理 4.1 Cramer-Rao 不等式

X有概率密度函数f(x,θ)(离散情形同理) θΘ=(a,b)是一维的参数, g(θ)为待估函数. 设g^(x)g(θ)的一个无偏估计, 则(4.1)Varθ(g^(X))[g(θ)]2Eθ(lnf(x,θ)θ)2.特别地, 当g(θ)=θ时, (4.2)Varθ(g^(X))1Eθ(lnf(X,θ)θ)2.

为了使证明成立, 需要给出一些光滑性的假设, 比如g(θ)要存在, 以及几个积分、求导交换的操作需要成立.

推论 4.1

X1,,Xn独立同分布, 且总体概率函数为fθ, 则f(x,θ)=i=1nfθ(xi). 此时依据 (4.2) 的情形, 有(4.3)Varθ(g^(X))1nI(θ),
其中(4.4)I(θ)=Eθ(lnfθ(X1)θ)2=1fθ(t)(fθ(t)t)2dt.

定理 4.1 的约束条件不仅与样本分布f(x,θ)有关, 还与g^有关. 可以建立某种较易验证的充分条件, 例如

定理 4.2

X1,,Xn是简单随机样本, 总体有fθ. θΘ=(a,b), g(θ)Θ上可微的待估函数. 设存在G(t,θ)满足: (1)Eθ(G2(X1,θ))<; (2)θΘ,ε0>0,|ψθ|<ε0:|fψ(t)ψ/fθ(t)|G(t,θ).则当g^(X)g(θ)的一个无偏估计时, (4.1) 成立.

Poisson 分布

Pθ(X=x)=1x!eθθx.(xN,0<θ<)

4.1 估计的效率和有效估计

效率 有效估计

eθ^(θ)=1nI(θ)/Varθ(θ^)=1nI(θ)Varθ(θ^)[0,1]为无偏估计θ^效率.
eθ^(θ)=1(θ), 则θ^为 UMVUE, 称θ^有效估计 (与 UMVUE 等价, 是一回事).

这个定义的缺点是有些时候不存在无偏估计能达到 C-R 不等式的下界; 有些时候 C-R 不等式的成立条件无法满足.

4.2 Fisher 信息量

Fisher 信息量

(4.4)I(θ)称为该分布族的Fisher 信息量.

对于多维, 有这样的结论

定理 4.3 多维 C-R 不等式

定义Iij(θ)=Eθ[lnfθ(X1)θilnfθ(X1)θj],I(θ)=(Iij(θ)),(I(θ)称为 Fisher信息阵) 则Covθ(θ^)(nI(θ))1.
若记(Iij(θ))=(I(θ))1, 则有Varθ(θ^i)Iii(θ)n,1ik.