很多时候我们假设试验的随机误差服从正态分布, 由此我们有著名的一样本、两两本 t 检验.
但是有些时候我们也怀疑正态分布假设是否正确, 因此也需要有检验是否为正态分布的方法.
1 一样本 t 检验
假设样本 , 都是未知参数. 考虑检验问题 也即我们好奇均值是否是指定的值. (特别地, 有些时候 , 一般在两组实验单元可以一一配对、判断均值是否相等时使用.)
考虑 (1.1) 的水平 似然比检验.
对 (1.1), 令 其中 是样本方差. 则 时拒绝 , 否则接受 .
的似然函数为
由于
设 , . 则 它有零点 . 从而
从而对数似然比为 从而似然比检验有否定域 . 为了确定常数 , 考虑统计量
根据 定理3.1 和 t分布的定义, 当 时 , 即自由度 的 分布. 给定 , 从 t 分布表查出 的值 . 根据 t 分布对称性, 它也满足 . 从而, 当 时拒绝 , 否则接受 .
这里 称为一样本 t 统计量, 上述加粗的检验称为一样本 t 检验.
1.1 单边情形
有些时候假设检验问题是单边形式
这个时候只需要修改为
从而当 时, 当 时拒绝 , 否则接受 .
可以证明, 单/双边一样本 t 检验是检验问题的 UMPU检验.
2 对比试验的其他检验法
在 (1.1) 中当 , 也即通常是两个组两两配对进行对比试验, 此时如果没有把握认为误差是正态的, 则需要其他检验方法.
2.1 符号检验
每对单元中有时候两个对比对象无法量化差距, 则可以定义""为甲比乙好, ""为乙比甲好, 为难以区别. 我们根据各种符号的多少来检验"甲乙一样"这个假设.
设有 对单元, ""出现了 次, ""出现了 次, 其余为 "". 如果甲乙一样, 则在非零的 个结果中, 每个是 机会等同. 从而 . 而如果甲乙确实不一样, 那取""的概率为 . 记 , 则问题转化为
一个合适的检验为: 时, 否定 , 否则接受.
当然也可以替换为单边的检验, 这里略去.
2.2 Fisher 置换检验
现在有 两种施肥方法, 选择 快地, 每块均分为形状大小一样的两小块, 分给 . 产量如下:

算出 . 假设 效果一样. 在 成立时, 每块内 的值可能来自两块小地的差别. 但随机化会让每一块地等可能地分给 . 因此对第一块地, 可以是 或者 . 这样, 全部的 的值可能有 个: 如果 差别较大, 应该取大值; 于是按照绝对值大小进行排列: 然后看一下比 还要大的值的比例. 在这里, , 因此我们拒绝 .
这里我们对所有的 进行了符号的置换, 得到各种排列组合, 因此称为置换检验.
事实上在 很大的时候, 置换检验就可以简化为通常的 t 检验.
3 两样本 t 检验
设 , , 且全体样本独立. 这里 未知. 注意方差相同. 考虑
对于 (3.1), 令
这里 , 则 时拒绝 , 否则接受 .
给出似然函数
类似 (1.2), 这里 . 同样 这里 , . 因此似然比为
注意到 从而似然比为 , 这样否定域 .
事实上, 当 ,
我们可以改写
由
- 两组样本独立,
- 由 定理3.1 (3), 与 独立, 与 独立;
得 独立. 从而 与 独立.
当 时 , , , 且两者独立, 则根据 定理3.1 和 推论, .
可以证明它是 UMPU 检验. 这里 称为两样本统计量, 上述检验称为两样本 t 检验.
如果是检验 , 则只需在 中把 改成 .
3.1 单边情形
如果是 , 则
回顾似然函数 (3.2). 当 , 类似上面, 这样 . 而当 , 首先注意 一定在 时达到. (因为任取 , 若 , 则 若 , 则 时可以改为 、 时改 为 , 都可以增大上述值.)
由此可知最大值在 的时候取到:
因此若 , 则有否定域 .
如果方差不同且未知, 这个问题将在 这里 讨论.
4 两样本问题的其他检验法
4.1 置换检验法
和 置换检验的例子类似. 把两种处理的全部试验结果, 即 改为 . 如果两种处理无差别, 则 的差别来自于这 个试验单元的分配, 有 种. 每种分配下都计算 甲处理试验值之和乙处理试验值之和 一共有 个值: . () 根据实际样本算出 . 给定水平 后, 检验方法为 当 时拒绝 , 否则接受.
如果是单边, 则改为直接按照原始值排序, 而非绝对值.
4.2 Wilcoxon 秩和检验
回到假设 (3.1). 记 , 第一总体 的分布函数为 , 则第二总体 的可以表示为 . 如果我们免除 是正态分布这一假设, 把它当作完全未知的, 则得到这样一个问题: , , 检验 ( 完全未知.)
假设 两两不同, 排列为 , , 则每个 必是序列中的某一个, 记 . 称 在合并的样本中的秩为 .
记 为Wilcoxon 两样本秩和统计量.
现在这样推理: 每个 可取 为值, 平均值为 . 若 , 样本来自同一分布, 则 应该在平均值 附近; 如果 , 则 会更大; 若 , 则 会更小. 总之, 时, 倾向于大值. 因此我们的检验规则是: 当 时拒绝 , 否则接受.
确定 : 事实上, 当 较大, .
当 , 根据对称性为彼此不同的不超过的自然数,其他
这样不难写出 的分布, 再根据 确定 . 但当 较大, 需要依据极限结果: 这样就确定了 .
对于单边情形 , 修改为** 时拒绝 否则接受**, .
5 正态分布方差的检验
5.1 一样本情况
设 , 未知. 考虑 这里 已知. 对此给出似然比检验. 不难得出似然比为 而 , 不难得到似然比检验** 时接受 , 否则拒绝它**, 其中 是下面方程的解:
它不是 UMPU, 但是差距不大. 如果改第一个方程里的 为 , 则新的 的似然比检验就是 UMPU. 但方程组一般不容易解, 所以我们取
单侧情况 #? .
5.2 两样本情况
设 , . 未知. 样本相互独立. 考虑 或者双边问题 给出前者的似然比 原假设成立时 . 定义 满足 . 则问题变为当 时拒绝 , 否则接受.
对于后者 (5.3), 似然比为 这里 , 定义同上. 则似然比检验为当 时接受 , 否则拒绝. 是下面方程的解
同样它不是 UMPU, 但是把 换成 就行. 方程组的解我们一般取