統計ER

統計ソフトRの使い方を中心に、統計解析方法の解説をするブログ。ありそうでなかなか見つからないサンプルサイズ計算などニッチな方法について紹介しています。

決定係数はいくつならよいか?

kaiseki daiko banner

重回帰分析の当てはまりの良さを示す決定係数。

ゼロから1の範囲をとるわけだが、いくつなら良いのか?

決定係数の判断基準は?

決定係数は、重回帰分析の当てはまりの良さ、適合度の良さとして使えるわけだが、いくつなら当てはまりが良くて、いくつならあまりよくないなどの基準はあるのだろうか?

0.5を超えると当てはまりが良いとされることが多いですが、残念ながら絶対的な基準はありません。

というWeb記事がある。

しかも、分野によっては、決定係数0.5は難しい。

こちらのサイトでは、絶対的な使い方より、相対的な使い方をお勧めしている。

出典:

決定係数(寄与率)とは?高い場合と低い場合の解釈と相関との関係をわかりやすく|いちばんやさしい、医療統計

絶対的な基準ではありませんが,R ^2 ≧0.5であれば適合度が高い,つまり重回帰式の予測制度が高いといえます.

と同様の記載をしているサイトもある。

出典:

http://jspt.japanpt.or.jp/ebpt_glossary/coefficient-of-determination.html

0.8と0.5に区切りを設けて説明しているサイトもある。

f:id:toukeier:20211226211025p:plain

出典:

重回帰分析(2/3) :: 株式会社アイスタット|統計分析研究所

0.9、0.7、0.5に区切りを設けて説明している記事もある。

f:id:toukeier:20211226211354p:plain

出典:

回帰分析

結局どう判断すればよいのか?

決定係数は、平方根をとると、相関係数と同じような意味合いになる。

なのでその値を見てみると、イメージがつかめると思う。

0.5の平方根は約0.7。

相関係数0.7は、慣例で行けば、かなり~強い相関関係となる。

そういう観点から、決定係数0.5は一つの目安になる。

ただし、分野によっては、強い相関関係が得られることが少ないため、もっと低めでも良しとする。

こんなふうに考えればよいのではないだろうか?

相関関係の強さの目安はこちら。

toukeier.hatenablog.com

まとめ

重回帰分析の当てはまりの指標としての決定係数は、いくつなら当てはまりが良いと言えるのか?

0.5が一つの基準と言えそうだが、分野によっては必ずしもそのようには言い切れない。

絶対的な良さに関して一応の基準は念頭に置くものの、モデル1とモデル2の決定係数を相対的に比較するなど、相対的に活用すると考えるのが良い。