統計ER

統計ソフトRの使い方を中心に、統計解析方法の解説をするブログ。ありそうでなかなか見つからないサンプルサイズ計算などニッチな方法について紹介しています。

統計ソフトRで相関係数を計算するには?

ブログランキングに参加しています。
まずはぽちぽちっとお願いします。
↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓
にほんブログ村 科学ブログ 数学へ

例えば、身長が高いと体重が重いとか、年齢が高いと血圧も高いとか、関係している二つの事柄は多い。これを相関関係という。

統計ソフトRで、散布図、相関係数計算、相関係数検定をやってみた。

統計ソフトRで散布図を描くには?

散布図は、相関関係があるかどうかを確認する図。

中間テストと期末テストの点数には、 相関性があるか? 見てみよう。

chukan <- c(64,40,71,33,30,71,92,23,41,55,93,74)

kimatu <- c(55,52,76,24,48,87,100,30,35,67,86,81)

plot(chukan, kimatu, xlim=c(0,100), ylim=c(0,100), pch=16, cex=1.3)

f:id:toukeier:20180829194700p:plain

統計ソフトRで相関係数の計算と母相関係数ゼロの検定は?

相関係数は、相関関係の強さを数字で表したもの。1と-1が一番強い。0が一番弱い。1は片方が大きいときはもう片方も大きい。-1は片方が大きいときはもう片方は小さい。0は関係が見られない。

相関係数を計算すると、 相関係数0.92の強い相関。

相関係数がゼロの帰無仮説はもちろん棄却。 p値は0.00002335で統計学的有意。

cor.test(chukan, kimatu) 
> cor.test(chukan, kimatu)

        Pearson's product-moment correlation

data:  chukan and kimatu
t = 7.3927, df = 10, p-value = 2.335e-05
alternative hypothesis: true correlation is not equal to 0
95 percent confidence interval:
 0.7314858 0.9775232
sample estimates:
      cor 
0.9194158 

まとめ

二つのデータの相関を見るのが、散布図と相関係数

plot()で散布図が描ける。

cor.test()で相関係数の計算と検定ができる。