統計ER

R, EZR, SPSS, KH Coder を使ったデータ分析方法を紹介するブログ。ニッチな内容が多め

相関比とは?

順序がないカテゴリカルデータと連続データの「相関」が相関比である

>>もう統計で悩むのを終わりにしませんか?


↑1万人以上の医療従事者が購読中

相関比 2 群と連続データの相関

相関比とは、2値のカテゴリカルデータを0と1のダミー変数にして、連続データとPearsonの積率相関係数を計算する。

計算結果の絶対値が相関比である。

ギリシャ文字ではイータ  \eta と表現する。

相関比 3 群以上と連続データの相関

相関比は、一元配置分散分析の分散分析表に登場するグループ間平方和と全平方和の比の平方根に等しい。

分散分析のグループ間平方和と全平方和の比は、SPSSではイータ2乗と出力される。

これは以下の分散分析表のグループ間と全体の平方和の比である。

つまり 2034.259 / 9232.815 = 0.2203292 となる。

このイータ2乗の平方根が 相関比 イータ というわけである。

エクセルにコピペして =SQRT() で計算すれば、算出できる。

計算式

計算結果

分散分析の結果から計算されるということは、2 群でも 3 群以上でも相関比は計算できる。

ただし、3 群以上になると、もはや群自体には大きいも小さいもないので、「相関」なのかどうかよくわからない指標になる。

互いに「相関する(あいかんする)」ということで、大きいとか小さいとかは超越していると、無理やり考えれば考えられなくもない。

相関比とはそういう指標である。

>>もう統計で悩むのを終わりにしませんか?


↑1万人以上の医療従事者が購読中

まとめ

カテゴリカルデータと連続データの「相関」である相関比を紹介した。

ゼロ1のダミー変数と連続データの相関係数の絶対値が相関比 イータ である。

分散分析表のグループ間平方和と全平方和の比(イータ2乗)の平方根であるので、3 群以上でも計算できる。

ただし、3 群以上になると、名義尺度には大きい・小さいがないため、互いに関連している指標という意味合いになる。

参考サイト

統計学入門−第5章