統計ER

R, EZR, SPSS, KH Coder を使ったデータ分析方法を紹介するブログ。ニッチな内容が多め

相関係数の求め方 R の場合

例えば、身長が高いと体重が重いとか、年齢が高いと血圧も高いとか、関係している二つの事柄は多い。

これを相関関係という。

R で、散布図、相関係数計算、相関係数検定をやってみた。

>>もう統計で悩むのを終わりにしませんか?


↑1万人以上の医療従事者が購読中

相関係数を求める前に散布図を書く方法

散布図は、相関関係があるかどうかを確認する図。

相関係数を求める前には、必ず確認する必要がある。

中間テストと期末テストの点数には、相関性があるか?

見てみる。

chukan と kimatu のデータを読み込み、plot() で散布図を書く。

chukan <- c(64,40,71,33,30,71,92,23,41,55,93,74)

kimatu <- c(55,52,76,24,48,87,100,30,35,67,86,81)

plot(chukan, kimatu, xlim=c(0,100), ylim=c(0,100), pch=16, cex=1.3)

こんなふうに書ける。

中間テストの点が高いと期末テストの点も高いことが見てわかる。

こんな感じの直線的な関係の場合は、相関係数も意味がある。

相関係数の求め方と検定の仕方

相関係数は、相関関係の強さを数字で表したもの。

1と-1が一番強い。

0が一番弱い。

1は片方が大きいときはもう片方も大きい。

-1は片方が大きいときはもう片方は小さい。

0は関係が見られない。

cor.test() で相関係数が計算できる。

cor.test(chukan, kimatu) 

相関係数を計算すると、相関係数0.92の強い相関。

> cor.test(chukan, kimatu)

        Pearson's product-moment correlation

data:  chukan and kimatu
t = 7.3927, df = 10, p-value = 2.335e-05
alternative hypothesis: true correlation is not equal to 0
95 percent confidence interval:
 0.7314858 0.9775232
sample estimates:
      cor 
0.9194158 

相関係数がゼロの帰無仮説は棄却。

p値は0.00002335で統計学的有意。

>>もう統計で悩むのを終わりにしませんか?


↑1万人以上の医療従事者が購読中

まとめ

二つの連続データの相関を見るのが、散布図と相関係数

plot()で散布図が描ける。

cor.test()で相関係数の計算と検定ができる。

参考になれば。