One-Way ANOVA:两两比较检验后,务必进行Post Hoc检验,也称事后分析,或称为两两比较分析。但具体算法有很多种,各自有哪些差别呢?
一旦确定均值间存在差值,两两范围检验和成对多重比较就可以确定哪些均值存在差值了。范围检验识别彼此间没有差值的同类均值子集。成对多重比较检验每一对均值之间的差分,并得出一个矩阵,其中星号指示在 0.05 的 alpha 水平上的组均值明显不同。
一、假定方差齐性
Tukey's 真实显著性差异检验、Hochberg’s GT2、Gabriel 和 Scheffé 是多重比较检验和范围检验。其他可用的范围检验为 Tukey 的 b、S-N-K (Student-Newman-Keuls)、Duncan、R-E-G-W F(Ryan-Einot-Gabriel-Welsch F 检验)、R-E-G-W Q(Ryan-Einot-Gabriel-Welsch 范围检验)和 Waller-Duncan。可用的多重比较检验为 Bonferroni、Tukey's 真实显著性差异检验、Sidak、Gabriel、Hochberg、Dunnett、Scheffé 和 LSD(最小显著性差异)。
详细剖析
• 最小显著差法(LSD)
. 使用 t 检验执行组均值之间的所有成对比较。对多个比较的误差率不做调整。
LSD法侧重于减少第二类错误,此法精度较差,易把不该判断为显著的差异错判为显著,敏感度最高。
LSD法的使用: 在进行试验设计时就确定各处理只是固定的两个两个相比,每个处理平均数在比较中只比较一次。例如,在一个试验中共有4个处理, 设计时已确定只是处理1与处理2、处理3与处理4(或1与3、2与4;或1与4、2与3)比较,而其它的处理间不进行比较。因为这种比较形式实际上不涉及多个均数的极差问题,所以不会增大犯I型错误的概率。
• Bonferroni法.
Bonferroni[1]提出,设H0为真,如果进行m次显著性水准为α的假设检验时,犯Ⅰ类错误的累积概率α’不超 过mα,即有Bonferroni不等式 α’ ≤mα成立。所以令各次比较的显著性水准为a=0.05/m,并规定P≤0.05/m时拒 绝H0,基于这样的做法,就可以把Ⅰ类错误的累积概率控制在0.05。这种对检验水准进行修正的方法叫做 Bonferroni调整 (Bonferroni adjustment)法,简称Bonferroni法。使用 t 检验在组均值之间执行成对比较,但通过将每次检验的错误率设置为实验性质的错误率除以检验总数来控制总体误差率。这样,根据进行多个比较的实情对观察的显著性水平进行调整。
换句话来说, Bonferroni法由LSD修正而来,通过设置每个检验的 α水准来控制总的α水准。但是比较的次数越多,比较的结果越保守。
Bonferroni法的应用指征:(1)各组的样本数无论相等还是不等;(2)计划好的某两个组间或几个组间作两两比较;(4)当比较次数不多时,Bonferroni法的效果较好;(5)但当比较次数较多(例如在10次以上)时 ,则由于其检验水准选择得过低,结论偏于保守,犯Ⅱ类错误的概率增加,即出现较多的假阴性结果;(6) Bonferroni法比LSD法、Duncan法、SNK法偏于保守,不过,它比Tukey法、Scheffe法要敏感。
• Sidak.
基于 t 统计量的成对多重比较检验。Sidak 调整多重比较的显著性水平,并提供比 Bonferroni 更严密的边界。
• Scheffe.
(最常用,不需要样本数目相同)为均值的所有可能的成对组合执行并发的联合成对比较。使用 F 取样分布。 可用来检查组均值的所有可能的线性组合,而非仅限于成对组合。
Scheffe的应用指征:(1)各组样本数相等或不等均可以,但是以各组样本数不相等使用较多;(2)如果比较的 次数明显地大于均数的个数时,Scheffe法的检验功效可能优于Bonferroni法和Sidak法。如均数的个数等于或小于比较 的次数,Bonferroni方法较 Scheff’e方法佳。
• R-E-G-W F.
基于 F 检验的 Ryan-Einot-Gabriel-Welsch 多步进过程。
• R-E-G-W Q.
基于学生化范围的 Ryan-Einot-Gabriel-Welsch 多步进过程。
• S-N-K.
使用学生化的范围分布在均值之间进行所有成对比较。它还使用步进式过程比较具有相同样本大小的同类子集内的均值对。均值按从高到低排序,首先检验极端差分。
• Tukey.
(最常用,需要样本数目相同)使用学生化的范围统计量进行组间所有成对比较。将试验误差率设置为所有成对 比较的集合的误差率。
Tukey的应用指征:(1)所有各组的样本数相等;(2)各组样本均数之间的全面比较;( 3)可能产生较 多的假阴性结论。
• Tukey's b.
使用学生化的范围分布在组之间进行成对比较。临界值是 Tukey's 真实显著性差异检验的对应值与 Student-Newman-Keuls 的平均数。
• Duncan.
使用与 Student-Newman-Keuls 检验所使用的完全一样的逐步顺序成对比较,但要为检验的集合的错误率设置保护 水平,而不是为单个检验的错误率设置保护水平。使用学生化的范围统计量。
• Hochberg's GT2.
使用学生化最大模数的多重比较和范围检验。与 Tukey's 真实显著性差异检验相似。
• Gabriel.
使用学生化最大模数的成对比较检验,并且当单元格大小不相等时,它通常比 Hochberg's GT2 更为强大。当单元大小变化过大时,Gabriel 检验可能会变得随意。
• Waller-Duncan.
基于 t 统计的多比较检验;使用 Bayesian 方法。
• Dunnett.
将一组处理与单个控制均值进行比较的成对多重比较 t 检验。 最后一类是缺省的控制类别。另外,您还可以选择第一个类别。双面检验任何水平(除了控制类别外)的因子的均值是否不等于控制类别的均值。<控制检验任何水平的因子的均值是否小于控制类别的均值。>控制检验任何水平的因子的均值是否大于控制类别的均值。
二、未假定方差齐性
不假设方差相等的多重比较检验有 Tamhane's T2、Dunnett's T3、Games-Howell(常用) 和 Dunnett's C。
详细信息
• Tamhane's T2.
基于 t 检验的保守成对比较。当方差不相等时,适合使用此检验。
• Dunnett's T3.
基于学生化最大值模数的成对比较检验。当方差不相等时,适合使用此检验。
• Games-Howell.
有时会变得随意的成对比较检验。当方差不相等时,适合使用此检验。
• Dunnett's C.
基于学生化范围的成对比较检验。当方差不相等时,适合使用此检验。
注意:如果取消选择“表格属性”对话框(在激活的枢轴表中,从“格式”菜单选择表格属性)中的隐藏空行列,可能更容易看懂两两比较检验的输出。