1 模型 统计背景
回顾 前面的定义, 协方差分析组合了方差分析和回归分析. 它的模型形如 这里 对应属性因子的部分 ( 是 矩阵), 称为方差分析部分; 对应数量因子部分, 称为回归分析部分. 假设 , 满列秩.
从试验角度, 反映了人们精心设计、严格控制的部分, 则是人们无法掌控的因素.
最简单的例子就是在 单向分类模型 中添加一个因子的回归项: 这里 .
对于写方差模型中的回归项, 我们可以定义为干扰变量. 它在 因果推断 中有进一步的讨论. 例如, 处理对茶树产量影响模型中, 干扰变量可以是接受处理前的产量; 饲料对小猪增重影响的模型中, 可以是小猪的初重.
2 基本方法
修改模型 (1.1) 为 其中 . 这里 含了未知参数 , 所以不能视为观察值向量. 处理方法是我们给 一个适当的估计量 来代替, 从而得到 这里 .
对于 的估计, 可以由消去方差分析部分的 (1.1) 估出. 它的正规方程是 不难看出 从而
因此 已经被消除, 可以用纯方差分析模型 (2.1) 进行. 此时剩余平方和为 这里 .
如果不引进协同变量, 相当于在最开始令 , 此时 , 故 这一项可以看作引进协同变量后精度方面的收获. 而对 (2.1) 做分析时候一定会出现 这样的量, 就像 的样本协方差, 所以也称为协方差分析.
2.1 显著性检验
设 为 列, 则同样可以考虑假设 记 , 其中 为 列. 则 成立时, 模型为 它的剩余平方和 . 而 (1.1) 的剩余平方和为 .
令 , 知 .
记 , 则 为检验量. 成立时 . 得到拒绝域 .