統計ER

R, EZR, SPSS, KH Coder を使ったデータ分析方法を紹介するブログ。ニッチな内容が多め

クラスカルウォリス Kruskal-Wallis検定、マンホイットニー Mann-Whitney検定は何の差を見ているのか?

ノンパラメトリック検定の場合、平均値の差を使っているわけではないが、では何の差なのか?

Kruskal-Wallis検定は何の差を見ているのか?

Kruskal-Wallis検定は、3群以上の連続量を比較するノンパラメトリック検定である。

Kruskal-Wallis検定における、「差」に当たる部分は、検定統計量から考えると

「全体の平均順位とグループの平均順位の差」

である。

Kruskal-Wallis検定は、順位に変更した分散分析のようなもので、この場合の差は、シンプルに「グループの平均順位の差」と言ってよさそうである。

Mann-Whitney-Wilcoxon検定は何の差を見ているのか?

Mann-Whitney-Wilcoxon検定は、Mann-WhitneyのU検定か、Wilcoxon順位和検定で知られている2群の連続量を比較するノンパラメトリック検定である。Mann-WhitneyもWilcoxon順位和も計算上同じであるため、3人の名前をつなげて呼ばれることもある。

この場合の差は、

「どちらかの群で順位和(順位の合計)が小さいほうの順位和 と 順位和の平均(全データ順位和の半分)との差」

である。

Mann-Whitney-Wilcoxon検定の場合は、どちらかのグループの順位和と2群の順位和の平均値(期待値)の差と理解できる。

2つのカテゴリ変数で、関連がなく独立だった場合の期待値をカイ2乗検定で計算するが、それと同様言える。

つまり、差がなかった時の期待順位和との比較である。

差がないという期待順位和からどれだけ離れているかという観点で検定している。

Kruskal-Wallis検定とMann-Whitney-Wilcoxon検定の関係

さらに突っ込んで考えると、順位の合計は、サンプルサイズで割れば平均順位になる。

順位和でも平均順位でも同じようなものだと考えられる。

とすると、グループの平均順位が、全体の平均順位からどれだけ離れているかと考えられ、Mann-Whitney-Wilcoxon検定は2群でKruskal-Wallis検定を行っているのと同様と考えられる。

となれば、「グループの平均順位の差」を検定しているとも言える。

まとめ

ノンパラメトリック検定は何の差を見ているのか?という疑問に対して、Kruskal-Wallis検定とMann-Whitney-Wilcoxon検定について見てみた。

端的に言えば、グループの平均順位の差を見ている。

そういうことである。

参考サイト

Kruskal–Wallis one-way analysis of variance - Wikipedia

Mann–Whitney U test - Wikipedia