1 序贯检验
我们前面的假设检验都是基于样本数 固定的假设, 这就是固定样本检验. 但有些时候 由抽样的过程决定. 例如我们先抽样 个, 得到样本 , 然后再去决定是否是否继续抽样. 这被称为序贯检验.
使用序贯检验的原因:
- 所抽的样本难以作出决定, 比如检验 的假设 , 但得到了一个 极小, 需要继续抽样.
- 节省试验次数以节省费用.
2 序贯概率比检验定义
设总体分布有概率函数 , . 要检验
若给定了样本大小 , 抽样得到 iid 的 , 则根据 NP引理, UMP 检验有否定域 . 但是用 作为一个绝对的界限有些太绝对化, 因此 Wald 引入了一种序贯检验:
定义下面的检验程序:
- 指定常数 , ().
- 样本 一个一个抽. 如果得到了 还不能停止, 则抽 , 然后计算 , 且当 时接受 , 时拒绝 .
- 若 , 继续抽样 , 然后计算 并进行判断.
把这种程序称为序贯概率比检验 (Sequential Probability Ratio Test, SPRT).
也就是说它提供了一种"容错机制", 只有在显著地偏向某一边时才做决定.
引进记号 , , 则 SPRT 可以表示为: 时接受 , 时否定 ; 时继续观察 .
总体分布为两点分布 , . 设 , 检验 .
此时 , 故 记 则 SPRT 为: 时接受 , 时拒绝 , 时继续抽样.
总体分布为 , 检验 .
此时 , 有 则
设 是 (2.1) 的任意一个检验 (序贯或非序贯), 抽样次数记为 , 犯 第一、第二类错误 的概率记为 , 而 SPRT 对应的错误为 .
如果 , 则 , .
也就是说, 在不超过某个错误概率的情况下, SPRT 的抽样次数最少.
现在给定了 , 如何确定 的值, 使得对应的 SPRT 的两个错误概率恰好是 ?
这个问题的确切解答只对部分分布族适用, 且形式很复杂.
下面我们给一个近似结果: 可以用 近似 , 且犯错误的概率 满足
设概率密度为 . 记
在 中, 前 次抽样都不做出决定, 在第 次后拒绝 . 因此 因为 上有 , 故有
类似的,
从而 因此我们可以近似 , . 因此我们用近似解 , 则它同样满足上述不等式: 推出
这说明单个错误可能会增大, 但不会变得太大, 而两个错误之和只会下降.
4 复合假设的情况
现在将假设检验推广为
我们可以指定 满足 , 使得 时, 拒绝 是严重错误; 时接受 是严重错误; 时接不接受都没有什么影响. 这样一来可以改写为 而在 的范围里, 只有 这个点和 最近, 因此它在某种程度上可以作为原假设的代表, 类似. 所以我们有理由希望 SPRT 也可以用语复合假设检验.
此时, 我们希望维持关于犯错误概率的性质, 也即如果有 功效函数 则是否有 (按照 的取法我们有 . ) 从而如果 关于 单增, 则上面的不等式必然成立. 对于 指数分布族, 这是成立的.