容忍区间和区间估计并没有共同之处, 只是解有形式上的相似性.
1 背景与定义
如果某工厂生产一种产品, 质量指标 (假设都已知). 给定 (通常很小). 以 记 的分布函数, 则可以找到很多 : 如 . 又可以定义 : 如 .
这个例子的意义是, 如果指定某个指标需要满足要求在 之间才算合格, 且指定 (合格率至少为 ), 则能否找到 , 使得 (1.1) 成立, 且 ?
如果 已知, 则这里没有统计问题. 否则, 需要根据 来估计. 比如如果有估计量 , 则能否有 ? 由于随机性, 我们只能降低到这个事件的概率 . 这就引导出容忍区间/容忍限的概念.
设 , 分布未知. . 给定 . 设 为统计量, .
是 的一个 容忍区间, 如果 称 为 的** 容忍上/下限**, 如果
形式上容忍区间和置信区间相似, 但它们实质不同. 后者是为了估计分布中的未知参数, 而前者中 无穷多, 我们并不关心某对确定的 , 而是关心 这件事是否成立.
2 容忍区间、容忍限的求法
设一维变量 , 处处连续, 则 .
由于 , 只需对 证明 . 记 , 则因为 处处连续、非降, , 以及 从而
现设 为 的独立观察值, 次序统计量为 . 根据引理, 若 , 则 . 因此若 , 则 . 记 , 则 的密度已经在 这里 给出. 则
如果选择了 让积分不小于 , 则根据定义 就是 的 容忍区间. 一般地, 选择 (或者 ), 这样得到的区间稍微短一点.
同样地对容忍上下限, 代入 , 得
选择 让右边的积分 , 则 就是 的 容忍上/下限.
2.2 正态分布
正态分布函数处处连续, 所以可以用上一节的结果. 但它比较粗糙, 因此这里把它精细化.
设 , 未知. (如果已知, 前面已经介绍了结果.) 由于估计的随机性, 容忍上限不见得是 , 而需要加入修正系数 . 记分布函数 , 则 从而问题转化为求 : 记 , , 则 由于 , , , 从而 如果能确定 , 使 , 则 就满足 (2.1) 了. 这样容忍上下限就是 .
对于容忍区间, 首先得到上面的容忍限, 然后根据下面的引理得到:
若 是 的 的容忍上下限, 且总有 , 则 是 的 容忍区间.
近似解法: 是 的分布函数, 找 使 再算出 , 则 近似地为 的 容忍区间.