相関係数を求める際のサンプルサイズ計算。
計算根拠は、母集団の相関係数がゼロでないことを示すためには、何例必要かというもの。
ゼロじゃないというだけなら、いかに人数が少なくてよいかがわかる。
慣例的な相関係数の意味合い
母集団の相関係数がゼロではない、いわゆる統計学的有意が前提で、そのうえで、サンプルでの相関係数がどのくらいのときに、どんな意味を持つか。
これが重要だ。
慣例として、以下のような目安がある。
相関係数の絶対値 | 解釈 |
---|---|
0.0~0.2 | ほとんど相関関係がない |
0.2~0.4 | やや相関関係がある |
0.4~0.7 | かなり相関関係がある |
0.7~1.0 | 強い相関関係がある |
相関係数のサンプルサイズ計算の実際
統計ソフトRで計算する場合のスクリプトは以下の通り。
samplesize.cor.test <- function(r, sig.level=.05, power=.8){ Za <- qnorm(sig.level/2, lower.tail=FALSE) Zb <- qnorm(power) C <- 0.5*log((1+r)/(1-r)) N <- ((Za+Zb)/C)^2 + 3 c(N=N, r=r, alpha=sig.level, Power=power) }
相関係数のサンプルサイズとは、要するにいくつの相関係数が統計学的有意すなわち母相関係数がゼロでないと言えるかを計算するものだ、
サンプルの相関係数が0.2だった場合に、母相関係数がゼロではないと統計学的に証明するには、194例必要と計算される。
> samplesize.cor.test(0.2) N r alpha Power 193.968 0.200 0.050 0.800
0.3ならば85例でよいと計算される。
> samplesize.cor.test(0.3) N r alpha Power 84.92781 0.30000 0.05000 0.80000
0.4であれば、47例。
> samplesize.cor.test(0.4) N r alpha Power 46.73161 0.40000 0.05000 0.80000
0.5なら、30例でよい。
> samplesize.cor.test(0.5) N r alpha Power 29.0123 0.5000 0.0500 0.8000
0.6になると、20例でよくなる。
> samplesize.cor.test(0.6) N r alpha Power 19.33641 0.60000 0.05000 0.80000
0.7に至っては、たったの14例でOKなのだ。
> samplesize.cor.test(0.7) N r alpha Power 13.43442 0.70000 0.05000 0.80000
まとめ
相関係数は統計学的有意(母集団の相関係数がゼロではない)の上で、相関係数の大きさ自体を評価する。
慣例としてかなり相関関係があるという0.4以上が意味があるといえる。
大前提として相関係数のサンプルサイズ計算は見積もっておきたいものである。
参考書籍
エクセルでサンプルサイズ計算
エクセルで計算できるようにした。よければ以下からどうぞ。
https://happyhappygk.base.ec/items/26107523
使い方は、YouTubeで解説してる。