(1)问题的提出:在对均值进行假设检验时,一般有两种参数检验方法,即t检验与方差分析。t检验仅用在单因素两水平设计(包括配对设计和成组设计)和单组设计(给出一组数据和一个标准值的资料)的定量资料的均值检验场合;而方差分析用在单因素k水平设计(k≥3)和多因素设计的定量资料的均值检验场合。应当进一步说明的是,方差分析有十几种,不同的方差分析取决于不同的设计类型。值得指出的是有一种不好的倾向,即大多数医学科研工作者习惯于用t检验取代一切方差分析。有些人的辩解是,若方差分析得到差别有显著性意义的结论,不还需要用t检验进行两两比较吗?不如一开始就进行多次t检验更方便。其实,这种认识是不妥当的。现分两种情形讨论如下。
(2)不能用t检验取代方差分析的理由
①单因素k(k≥3)水平设计时的情形。为了便于读者理解,从分析具体问题入手。
[实例]研究单味中药对小鼠细胞免疫机能的影响,把40只小鼠随机均分为4组,每组10只,雌雄各半,用药15d后测定E-玫瑰结成率(%),结果如下,试比较各组总体均值之间的差别有无显著性意义?
对照组: 14 10 12 16 13 14 12 10 13 9
党参组: 21 24 18 17 22 19 18 23 20 18
黄芪组: 24 20 22 18 17 21 18 22 19 23
淫羊藿组: 35 27 23 29 31 40 35 30 28 36
由于测定指标是“率”,一般不符合“正态性”要求,故常作“平方根反正弦变换”,将其转变成近似服从正态分布的“弧度值”。此处仅为了说明t检验与方差分析的区别,姑且将数据看作定量的观测值,并直接检验资料的前提条件,得知该资料满足正态性和方差齐性,故直接进行有关的假设检验。
处理本例资料,通常人们错误的做法是,重复运用成组设计资料的t检验对4个组的均值进行6次两两比较;而正确的做法是,先进行单因素4水平设计资料的方差分析,若4个总体均值之间的差别有显著性意义,再用q检验等方法进行多个均值之间的两两比较。下面将从多个方面来说明上述两种分析方法之间的差异(表1)。
表1 用t检验与方差分析处理[实例]资料的区别
比较的内容 | t检验 | 方差分析加q检验 |
资料的利用率 | 低:每次仅用两组 | 高:每次要用全部数据 |
对原实验设计的影响 | 残:割裂了整体设计 | 全:与原实验设计相呼应 |
犯假阳性错误的概率 | 大:1-(1-0.05)6 = 0.265 | 小:0.05(假定α=0.05) |
结论的可靠性 | 低:统计量的自由度小(υ=18) | 高:统计量的自由度大(υ=36) |
注:自由度大,所对应的统计量的可靠性就高,它相当于“权重”,也类似于产生“代表”的基数,基数越大,所选出的“代表”就越具有权威性。
②多因素设计时的情形。为了便于读者理解,仍从分析具体问题入手(表2)。
表2 注射氯化锂或烟碱后不同时间大鼠体温的下降值
使用氯化锂与否 | 使用烟碱与否 | 第二次注射后不同时间体温下降值(摄氏度) |
时间: 0.7 | 1.5 | 3 | 5 |
- | - | 0.0±0.4 | 0.2±0.5 | 0.1±0.4 | 0.3±0.5 |
+ | - | 0.7±0.5 | 0.1±0.5 | 0.1±0.6 | 0.2±0.5 |
- | + | 1.2±0.8 | 0.1±0.6 | 0.4±0.5 | 0.4±0.3 |
+ | + | 1.7±0.6 | 0.7±0.6 | 0.3±0.6 | 0.1±0.5 |
显然,表2中涉及到的3个实验因素(即”使用氯化锂与否”、“使用烟碱与否”、“药物在体内作用时间”)。这些因素之间一般都存在不同程度的交互作用,应当选用与设计类型(本例为具有一个重复测量的三因素设计)相对应的方差分析方法。然而,对于处置复杂的实验设计问题,人们常犯的错误是在;其一,将多因素各水平的不同组合(本例中共有16种不同的组合,相当于16种不同的实验条件)、简单地看作单因素的多个水平(即视为单因素16水平),混淆了因素与水平之间的区别,从而错误地确定了实验设计类型;其二,分析资料时,常错误用单因素多水平设计或仍采用多次t检验进行两两比较。误用这两种方法的后果是,不仅无法分析因素之间的交互作用的大小,而且,由于所选用的数学模型与设计不匹配,易得出错误的结论。