統計ER

R, EZR, SPSS, KH Coder を使ったデータ分析方法を紹介するブログ。ニッチな内容が多め

クラスカルウォリス検定 わかりやすく解説

クラスカルウォリス検定を、原著に立ち返って、わかりやすく解説。

>>もう統計で悩むのを終わりにしませんか?


↑1万人以上の医療従事者が購読中

クラスカルウォリス検定とは?

クラスカルウォリス検定とは、3群以上の群があったときの順位を用いたノンパラメトリックな分散分析と考えればよい。

各群の平均順位を比較していると理解すればOKである。

以下も参照のこと。

toukeier.hatenablog.com

検定統計量  H を計算して、有意確率を求めることになる。

\begin{equation} H = \frac{12}{N(N+1)} \sum \frac{R^2}{n} - 3(N+1) \end{equation}

ここで、 N は全群を合わせたサンプルサイズ、 R^2 は各群の順位の合計の2乗、 n は各群のサンプルサイズ、 \sumは添え字を省略しているが、各群の値が計算されたら、全群を合計する意味である。

この検定統計量は以下のようにも書ける。

\begin{equation} H = \frac{N-1}{N} \sum \frac{n (\bar{R} - \frac{1}{2} (N + 1))^2}{(N^2-1)/12} \end{equation}

ここで、上の式と同じ記号は同じものを指していて、上には登場しなかった  \bar{R} は各群の平均順位を表している。

 \frac{1}{2} (N+1) は、 N 個の順位の平均順位の公式である。

なので、 (\bar{R} - \frac{1}{2}(N+1))^2の部分は、各群の平均順位と全体の平均順位の差の2乗を計算していることがわかる。

まさにこの部分が平均順位を使った群間比較という形の分散分析と理解できるゆえんである。

この式にすると、各群の平均順位を比べていることが良くわかる。

そして、この検定統計量が 自由度 群の数ー1 (例えば全3群であれば2)の \chi^2 分布に従うという性質を使って有意確率を求める。

有意水準(例えば5%)よりも有意確率が小さければ、比較した群たちは、統計学的有意に異なると言える。

クラスカルウォリス検定は各群のサンプルサイズが同程度であることが条件か?

ネット上には、各群のサンプルサイズが異なることを心配して相談している相談者が散見されたが、クラスカルウォリス検定において、各群のサンプルサイズが同程度であることが条件であるという記述は見つからなかった。

原著論文の計算式を確認しても、そのような条件は書いていない。

したがって、各群のサンプルサイズが同程度であることが条件であるとは言えない。

>>もう統計で悩むのを終わりにしませんか?


↑1万人以上の医療従事者が購読中

クラスカルウォリス検定における タイデータの支障の程度はどのくらいか?

タイ (tie) データというのは、連続データで同じ値のデータで、順位に変換すると同順位になるデータのこと。

タイデータがある場合は、その数に応じて検定統計量を調整することになる。

タイデータは、以下の式で調整値を計算して、その値で検定統計量  H を割る。

\begin{equation} 1 - \frac{\sum T}{N^3-N} \end{equation}

ここで、 T = (t-1)t(t+1) = t^3-t と計算するのだが、 t は、タイ順位グループ内の個数である。

5個タイがある順位があるとするとその時の  T は、 5^3-5 = 125 - 5 = 120 となる。

10個タイがある順位の場合は、 T = 10^3-10 = 1000 - 10 = 990 となり、タイが増えると T はどんどん大きくなるが、分子が分母を超えることはない。

 N は、すべての群の例数を足し合わせた総サンプルサイズである。

タイの数が大きくなればなるほど、分子が大きくなり、式全体の値は1より小さくなっていく。

1より小さい値で検定統計量を割ると、検定統計量は大きくなる。

つまりは、より統計学的有意に近くなるわけである。

ということは、タイデータが増えても、少なくとも統計学的に不利となることはなさそうだ。

まとめ

クラスカルウォリス検定を原著に立ち返って、少々の計算式を交えながら、わかりやすく解説した。

クラスカルウォリス検定が適切である条件として、各群のサンプルサイズが同程度であることが必要かどうか確認したところ、そのような記載は見つけることができなかった。

また、タイデータが増えることが何か支障があるかどうかを確認したところ、支障をきたすという証拠は得られなかった。

したがって、クラスカルウォリス検定は、各群のサンプルサイズの大きさが異なっていても心配せず実施できるし、タイデータが多くても心配せずに実施できると言える。

原著論文リンク

William H. Kruskal and W. Allen Wallis. Use of Ranks in One-Criterion Variance Analysis

https://people.ucalgary.ca/~jefox/Kruskal%20and%20Wallis%201952.pdf

参考リンク

Kruskal Wallis test for unequal group size?

https://www.researchgate.net/post/Kruskal_Wallis_test_for_unequal_group_size

spss - Non-parametric test for unequal samples with subsequent post-hoc analysis? - Cross Validated