![统计学习理论与方法:R语言版](https://wfqqreader-1252317822.image.myqcloud.com/cover/449/34061449/b_34061449.jpg)
4.5 克鲁斯卡尔-沃利斯检验
如果从总体1中随机抽取了一组样本,又从总体2中随机抽取了一组样本;威尔科克森秩和检验就可以用来分析这两个样本所代表的总体1和总体2是否具有相同的分布。现在如果有来自三个或更多独立总体的样本数据,能否用一种方法来分析它们所代表的总体是否具有相同的分布呢?这时所采用的方法就是克鲁斯卡尔-沃利斯(Kruskal-Wallis)检验,又称H检验。本书后面还会介绍到单向方差分析(ANOVA),该方法可以用来检验一些样本均值之间的差别是否显著,但方差分析要求所有有关的总体都是正态分布的。如同其他非参数检验一样,克鲁斯卡尔-沃利斯检验并不要求总体服从正态分布或者任意其他的特殊分布。
克鲁斯卡尔-沃利斯检验的原假设和备择假设一般如下:
H0:样本来自于具有相同分布的总体。
H1:样本来自于具有不同分布的总体。
克鲁斯卡尔-沃利斯检验的统计量定义为
![](https://epubservercos.yuewen.com/0D99D6/18225431901802606/epubprivate/OEBPS/Images/Figure-P115_33553.jpg?sign=1738891050-udABRvMdOQXcYM2kAx0M6MFIt18TQ8IC-0-3e76590bbfb31d92c5c4b19b816294e6)
其中ni是样本i的观察值数量,i=1,2,…,k,k是样本的个数,nT是混合后的总样本容量,即
![](https://epubservercos.yuewen.com/0D99D6/18225431901802606/epubprivate/OEBPS/Images/Figure-P115_33555.jpg?sign=1738891050-A0K0BvgCMmXxunbXQhYnmBm55YH9yavO-0-08f784d7268523ecd3e976c731582cf0)
另外,Ti是样本i在总的样本观察值中的秩和。对于给定的显著水平α,如果统计量H超过自由度为k-1的χ2的临界值,则拒绝原假设。
通常要求每个样本中至少有5个观察值,这样检验统计量H的分布才能用χ2分布来近似。这个检验统计量H其实就是本书后面将要讨论的方差分析中检验统计量F的秩形式。当对秩进行处理,而非对原始值进行处理时,许多量是已经预先知道的。例如,所有秩的和可以表示为nT(nT+1)/2。表达式
![](https://epubservercos.yuewen.com/0D99D6/18225431901802606/epubprivate/OEBPS/Images/Figure-P115_33558.jpg?sign=1738891050-w5n03xGrkyq6QNSKyv8cGJ2jNrYQAnHC-0-616c79e431a58f910e5ef7681354cda8)
其中
![](https://epubservercos.yuewen.com/0D99D6/18225431901802606/epubprivate/OEBPS/Images/Figure-P115_33559.jpg?sign=1738891050-J5admdBtaDVanPk8PUHM8FmXV8aQ8wIc-0-b130e4456962bbd1cd6dceb9c6b34e0a)
合并了秩的加权方差,以得到这里的给出的检验统计量H。这个H的表达式与前面给出的表达式在代数上是相等的。但前面H的形式处理起来更加简便。尽管克鲁斯卡尔-沃利斯检验计算起来非常容易,但它并没有F检验那样有效,因此它可能会需要更加明显的差别来拒绝零假设。
当样本观察值的秩有大量相等时,用
![](https://epubservercos.yuewen.com/0D99D6/18225431901802606/epubprivate/OEBPS/Images/Figure-P115_33561.jpg?sign=1738891050-iJPPd3E6nnaT46sGWR0g65wzxGXQz26R-0-3382ca7ce6c24518cf6146221e2d40c0)
来进行修正,其中tj是第j个相等秩组中的观察值数量。
下面结合一个例子来演示使用克鲁斯卡尔-沃利斯检验的基本方法。为研究煤矿粉尘作业环境对尘肺的影响,将18只大鼠随机分到X、Y和Z三个组,每组6只,分别在地面办公楼、煤炭仓库和矿井下,12周后测量大鼠全肺湿重(单位:g),数据见表4-21,问不同环境下大鼠全肺湿重有无差别?
表4-21 大鼠全肺湿重数据/g
![](https://epubservercos.yuewen.com/0D99D6/18225431901802606/epubprivate/OEBPS/Images/Figure-T115_33566.jpg?sign=1738891050-ELnDSy52NjIl3sOKUq468RtHPYctY74f-0-47064964e2a221209b1a20968aa6be25)
首先,根据描述提出下列原假设和备择假设:
H0:三组没有差异(即它们来自同一总体)。
H1:三组中至少有一个和其他组不同。
在计算统计量H之前,首先从低到高排列18个样本数据,并编秩。中间数据的处理结果如表4-22所示。其中处理相等数据时的方法前面已经多次讲到,这里不再赘述。
表4-22 中间数据处理结果
![](https://epubservercos.yuewen.com/0D99D6/18225431901802606/epubprivate/OEBPS/Images/Figure-T116_33569.jpg?sign=1738891050-4mUPHKMtMMnWsz5tBGdWpbKKFl5WeGtc-0-2c5c5dd31af6c820530ae73b7d6fb6e5)
计算三组秩和的结果如下
TX=1.5+1.5+5+6+8+10=32
TY=3+8+8+11+12.5+14=56.5
TZ=4+12.5+15+16+17+18=82.5
根据三组秩的和可以对统计量H进行计算
![](https://epubservercos.yuewen.com/0D99D6/18225431901802606/epubprivate/OEBPS/Images/Figure-P116_33577.jpg?sign=1738891050-cmYcKnx55HQfHkkCnXXIPjZKU8NL6HfO-0-bb8fb6ee261de762fbdf7a4aa13d69ac)
因为含有相同大小的数据,所以使用H′,对H进行修正。其中
![](https://epubservercos.yuewen.com/0D99D6/18225431901802606/epubprivate/OEBPS/Images/Figure-P116_33578.jpg?sign=1738891050-B6r5I7IeJGdHqsVbfF6miEs5CkS9uH04-0-4a22f3bacc866a2cd2e62787ae50ca89)
将该值代入到H′,于是可得
![](https://epubservercos.yuewen.com/0D99D6/18225431901802606/epubprivate/OEBPS/Images/Figure-P116_33579.jpg?sign=1738891050-eUvJDO7TtPjPPYuKKpI38tF4GDTdbo1y-0-6ebc1f5ca4b8bdd1584f5c2ff7f53751)
可见,尽管涉及相等的秩几乎占到总数的一半,H′的值和H仍然非常相近。由于自由度为k-1=2,所以可在R中使用下面的代码来计算P值。
![](https://epubservercos.yuewen.com/0D99D6/18225431901802606/epubprivate/OEBPS/Images/Figure-P116_33580.jpg?sign=1738891050-BYDmQi885EfaDuu84ajHGh2idECnS1Vu-0-ab136fdbf00493b9260cca38cd3a8ce0)
由于P值小于0.05,所以拒绝原假设,认为三个组的测试结果之间存在有显著的差异。
上述计算结果在R中可以使用非常简单的代码来得到,下面的代码同样得出了7.5055的H′统计量以及0.023 45的P值。
![](https://epubservercos.yuewen.com/0D99D6/18225431901802606/epubprivate/OEBPS/Images/Figure-P116_33581.jpg?sign=1738891050-8p9fACMAmuXuNSUqO5B5yAiuxNjM7w3r-0-b4cfbf6df359ba6abec0d0dc8950db2b)
本章向读者介绍了几种常用的非参数检验方法。与参数检验方法相比,非参数检验方法不受总体分布的限制,适用范围更广,使用起来也更简便。但还需指出,当测量的数据能够满足参数统计的所有假设时,非参数检验方法虽然也可以使用,但效果远不如参数检验方法。当数据满足假设条件时,参数统计检验方法能够从其中广泛地充分地提取有关信息。非参数统计检验方法对数据的限制较为宽松,只能从中提取一般的信息,相对参数统计检验方法会浪费一些信息。所以对于参数检验方法而言,应该注意把握它们适用的条件,在具有应用时,更应审慎检查这些条件是否满足。针对具体问题,要注意分析问题本身所提供的信息,审慎选择检验方法。