1 问题提法 原假设与对立假设
有样本. 只知道的分布属于分布族. 是的一个非空真子集, 则(存在, 使的分布为)称为一个**(原/零)假设**. 记, 则称为的对立/备选假设.
表述称为一个假设检验问题. 我们需要根据样本的取值选择接受或否定(也即接受中的一个).
与前面的提法不同的是, 这里明确提出了对立假设, 可以对同一假设不同检验的优劣进行比较.
继续考虑 这个例子. 用表示女士说对的杯数. 若成立, 有超几何分布如何提出对立假设? 一种可能的提法为,其中等号至少对中的一个成立. 再比如说, 可以提.
2 否定域 检验函数
(1.1) 的假设检验事实上就是寻找一个法则, 根据样本决定接受或者否定. 因此可以把分解为互不相交的, 样本属于时接受, 属于时否定. 因此称为检验的否定域; 称为接受域.
进一步推广为: 检验是函数. 表示有了样本后否定的概率, 称为检验函数. 如果, 否定; , 接受; , 安排随机试验, 使其中某个事件的概率为, 看是否发生.
- 如果取值只有, 称为非随机检验, 否定域就是.
- 否则存在, 称为随机检验, 在实际中不常用.
3 两类错误与功效函数
将
- 正确但被否定的检验称为第一类错误(弃真);
- 不正确但被接受的检验称为第二类错误(采伪).
我们希望检验方法犯错误的概率尽可能的小.
设是检验 (1.1) 的一个检验函数, 称否定称为的功效函数.
如果为非随机检验, 否定域为, 则
知道功效函数后, 可以计算出犯第一类错误的概率犯第二类错误的概率
4 检验水平 真实水平 限定第一类错误概率的原则
犯第一类错误的概率如果总不超过(), 则称是检验的一个水平, 称为水平检验.
由 (3.2), 得 是水平 检验的充要条件是 检验的水平自然不唯一, 把一个检验的最小水平 (取 的上确界 ) 称为真实水平.
我们当然希望一个检验犯两类错误的概率都很小, 但是这不可能同时兼得. 因此我们通常限定第一类错误的概率上界为 (设置门槛如 等, 而又以 最多), 然后尽可能减小第二类错误的发生概率.