統計ER

統計ソフトRの使い方を中心に、統計解析方法の解説をするブログ。ありそうでなかなか見つからないサンプルサイズ計算などニッチな方法について紹介しています。

Pearson ピアソン にすべきか、Spearman スピアマン にすべきか、それが問題だ。

ブログランキングに参加しています。
まずはぽちぽちっとお願いします。
↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓
にほんブログ村 科学ブログ 数学へ

相関係数について。順位相関係数にすべきかどうか。順位相関係数は偏相関係数が計算できるか。

質問

1.偏相関係数

新規の検査値Aと既存の検査値Bの関連性を検討したい。

nは40例程度。

解析するに当たり、患者背景が問題になると思っている。

既存の検査値 Bと身長が関連することが知られており(相関係数0.7)、AとBの関連性を検討するためには、身長で補正する必要があると思う。新規の検査値 Aと身長は有意な相関がある(相関係数0.4)。

データはすべて連続変数のため、二変量の相関をPearsonの相関係数で検討したい。

偏相関で制御変数に身長を入れればよいのか?

2.変数の正規性と相関係数の種類

既存の検査値 B が正規分布していないと思われるのだが、このような場合、PearsonではなくSpearmanの順位相関係数で検討すべきだろうか?また、Spearmanの順位相関係数は、偏相関係数を計算できるか?

回答

1.偏相関係数について

偏相関で制御変数に身長を入れる方法は、解析方法の一つとして適切と思う。

2.変数の正規性と相関係数の種類について

変数の正規性にはとらわれないほうが良い。

まず散布図を眺めるのがよいだろう。散布図を眺めて、直線的な関係が想定できれば、Pearsonの積率相関係数が適切だろう。直線的な関係ではなさそうであれば、Spearmanの順位相関係数のほうがよいだろう。

Spearmanの順位相関係数でも、偏相関係数を計算できる。

こちらの記事も参照のこと。

toukeier.hatenablog.com