4.5 克鲁斯卡尔-沃利斯检验_统计学习理论与方法：R语言版-QQ阅读历史男生网

上QQ阅读APP看书，第一时间看更新

4.5　克鲁斯卡尔-沃利斯检验

如果从总体1中随机抽取了一组样本，又从总体2中随机抽取了一组样本；威尔科克森秩和检验就可以用来分析这两个样本所代表的总体1和总体2是否具有相同的分布。现在如果有来自三个或更多独立总体的样本数据，能否用一种方法来分析它们所代表的总体是否具有相同的分布呢？这时所采用的方法就是克鲁斯卡尔-沃利斯（Kruskal-Wallis）检验，又称H检验。本书后面还会介绍到单向方差分析（ANOVA），该方法可以用来检验一些样本均值之间的差别是否显著，但方差分析要求所有有关的总体都是正态分布的。如同其他非参数检验一样，克鲁斯卡尔-沃利斯检验并不要求总体服从正态分布或者任意其他的特殊分布。

克鲁斯卡尔-沃利斯检验的原假设和备择假设一般如下：

H₀：样本来自于具有相同分布的总体。

H₁：样本来自于具有不同分布的总体。

克鲁斯卡尔-沃利斯检验的统计量定义为

其中n_i是样本i的观察值数量，i=1，2，…，k，k是样本的个数，n_T是混合后的总样本容量，即

另外，T_i是样本i在总的样本观察值中的秩和。对于给定的显著水平α，如果统计量H超过自由度为k-1的χ²的临界值，则拒绝原假设。

通常要求每个样本中至少有5个观察值，这样检验统计量H的分布才能用χ²分布来近似。这个检验统计量H其实就是本书后面将要讨论的方差分析中检验统计量F的秩形式。当对秩进行处理，而非对原始值进行处理时，许多量是已经预先知道的。例如，所有秩的和可以表示为n_T（n_T+1）/2。表达式

其中

合并了秩的加权方差，以得到这里的给出的检验统计量H。这个H的表达式与前面给出的表达式在代数上是相等的。但前面H的形式处理起来更加简便。尽管克鲁斯卡尔-沃利斯检验计算起来非常容易，但它并没有F检验那样有效，因此它可能会需要更加明显的差别来拒绝零假设。

当样本观察值的秩有大量相等时，用

来进行修正，其中t_j是第j个相等秩组中的观察值数量。

下面结合一个例子来演示使用克鲁斯卡尔-沃利斯检验的基本方法。为研究煤矿粉尘作业环境对尘肺的影响，将18只大鼠随机分到X、Y和Z三个组，每组6只，分别在地面办公楼、煤炭仓库和矿井下，12周后测量大鼠全肺湿重（单位：g），数据见表4-21，问不同环境下大鼠全肺湿重有无差别？

表4-21　大鼠全肺湿重数据/g

首先，根据描述提出下列原假设和备择假设：

H₀：三组没有差异（即它们来自同一总体）。

H₁：三组中至少有一个和其他组不同。

在计算统计量H之前，首先从低到高排列18个样本数据，并编秩。中间数据的处理结果如表4-22所示。其中处理相等数据时的方法前面已经多次讲到，这里不再赘述。

表4-22　中间数据处理结果

计算三组秩和的结果如下

T_X=1.5+1.5+5+6+8+10=32

T_Y=3+8+8+11+12.5+14=56.5

T_Z=4+12.5+15+16+17+18=82.5

根据三组秩的和可以对统计量H进行计算

因为含有相同大小的数据，所以使用H′，对H进行修正。其中

将该值代入到H′，于是可得

可见，尽管涉及相等的秩几乎占到总数的一半，H′的值和H仍然非常相近。由于自由度为k-1=2，所以可在R中使用下面的代码来计算P值。

由于P值小于0.05，所以拒绝原假设，认为三个组的测试结果之间存在有显著的差异。

上述计算结果在R中可以使用非常简单的代码来得到，下面的代码同样得出了7.5055的H′统计量以及0.023 45的P值。

本章向读者介绍了几种常用的非参数检验方法。与参数检验方法相比，非参数检验方法不受总体分布的限制，适用范围更广，使用起来也更简便。但还需指出，当测量的数据能够满足参数统计的所有假设时，非参数检验方法虽然也可以使用，但效果远不如参数检验方法。当数据满足假设条件时，参数统计检验方法能够从其中广泛地充分地提取有关信息。非参数统计检验方法对数据的限制较为宽松，只能从中提取一般的信息，相对参数统计检验方法会浪费一些信息。所以对于参数检验方法而言，应该注意把握它们适用的条件，在具有应用时，更应审慎检查这些条件是否满足。针对具体问题，要注意分析问题本身所提供的信息，审慎选择检验方法。