統計ER

統計ソフトRの使い方を中心に、統計解析方法の解説をするブログ。ありそうでなかなか見つからないサンプルサイズ計算などニッチな方法について紹介しています。

相関係数のサンプルサイズ計算はどうやる?

ブログランキングに参加しています。
まずはぽちぽちっとお願いします。
↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓
にほんブログ村 科学ブログ 数学へ

相関係数を求める際のサンプルサイズ計算。

計算根拠は、母集団の相関係数がゼロでないことを示すためには、何例必要かというもの。

ゼロじゃないというだけなら、いかに人数が少なくてよいかがわかる。

慣例的な相関係数の意味合い

母集団の相関係数がゼロではない、いわゆる統計学的有意が前提で、そのうえで、サンプルでの相関係数がどのくらいのときに、どんな意味を持つか。

これが重要だ。

慣例として、以下のような目安がある。

相関係数の絶対値 解釈
0.0~0.2 ほとんど相関関係がない
0.2~0.4 やや相関関係がある
0.4~0.7 かなり相関関係がある
0.7~1.0 強い相関関係がある

相関係数のサンプルサイズ計算の実際

統計ソフトRで計算する場合のスクリプトは以下の通り。

samplesize.cor.test <- function(r, sig.level=.05, power=.8){
 Za <- qnorm(sig.level/2, lower.tail=FALSE)
 Zb <- qnorm(power)
 C <- 0.5*log((1+r)/(1-r))
 N <- ((Za+Zb)/C)^2 + 3
 c(N=N, r=r, alpha=sig.level, Power=power)
}

相関係数のサンプルサイズとは、要するにいくつの相関係数統計学的有意すなわち母相関係数がゼロでないと言えるかを計算するものだ、

サンプルの相関係数が0.2だった場合に、母相関係数がゼロではないと統計学的に証明するには、194例必要と計算される。

> samplesize.cor.test(0.2)
      N       r   alpha   Power 
193.968   0.200   0.050   0.800 

0.3ならば85例でよいと計算される。

> samplesize.cor.test(0.3)
       N        r    alpha    Power 
84.92781  0.30000  0.05000  0.80000 

0.4であれば、47例。

> samplesize.cor.test(0.4)
       N        r    alpha    Power 
46.73161  0.40000  0.05000  0.80000 

0.5なら、30例でよい。

> samplesize.cor.test(0.5)
      N       r   alpha   Power 
29.0123  0.5000  0.0500  0.8000 

0.6になると、20例でよくなる。

> samplesize.cor.test(0.6)
       N        r    alpha    Power 
19.33641  0.60000  0.05000  0.80000 

0.7に至っては、たったの14例でOKなのだ。

> samplesize.cor.test(0.7)
       N        r    alpha    Power 
13.43442  0.70000  0.05000  0.80000 

まとめ

相関係数統計学的有意(母集団の相関係数がゼロではない)の上で、相関係数の大きさ自体を評価する。

慣例としてかなり相関関係があるという0.4以上が意味があるといえる。

大前提として相関係数のサンプルサイズ計算は見積もっておきたいものである。

参考書籍

エクセルでサンプルサイズ計算

エクセルで計算できるようにした。よければ以下からどうぞ。

https://happyhappygk.base.ec/items/26107523

使い方は、YouTubeで解説してる。