統計ER

R, EZR, SPSS, KH Coder を使ったデータ分析方法を紹介するブログ。ニッチな内容が多め

決定係数が小さいが大丈夫か?

重回帰分析の評価指標の一つ、決定係数が小さいときに、どう考えたらよいか

どのくらいの数値であったら、大丈夫なのだろうか

>>もう統計で悩むのを終わりにしませんか?


↑1万人以上の医療従事者が購読中

決定係数がどのくらいであれば意味があるか?

決定係数は、0.7 以上欲しいとか、0.5 でもよいとか、分野によっては 0.3 でもよいとか、いくつならよいかの決め手がない評価指標である

以下は、参考過去記事

toukeier.hatenablog.com

しかし、現実的にはもっと小さい値、例えば、0.1 くらいのときもある

こういう場合、意味がないのだろうか?

どのくらいの数値であれば、意味があると言えるのだろうか?

測定に誤差を大きく含むような分野、厳密な数値では表せないような事象を測定する分野、具体的には、心理学、社会学、人間科学などでは、あまり高い決定係数を得るのは難しいと考えられる

こういう場合、どんな考え方があるのだろうか?

少なくとも 0.1 あればよい説

ある書籍の一部のようであるが、少なくとも 0.1 あればよいという論説がある

重回帰モデルにおいて、いくつかの、もしくは、多くの説明変数が統計学的に有意であるのが条件ではある

参考文献:

The acceptable R-square in empirical modelling for social science research Munich Personal RePEc Archive

>>もう統計で悩むのを終わりにしませんか?


↑1万人以上の医療従事者が購読中

慣例として 0.13 が Medium Effect 説

サンプルサイズ計算のバイブルの一つ、Jacob Cohen の書籍にある、重回帰分析のためのサンプルサイズ計算における慣例的な基準が、決定係数 0.13で medium effect である

参考文献:

https://www.utstat.toronto.edu/~brunner/oldclass/378f16/readings/CohenPower.pdf

PDF 413 ページ目

参考過去記事: GPower の使い方 重回帰分析の場合 - 統計ER

まとめ

重回帰分析で算出された決定係数が一般的に言われている数値と比べて小さいがどうなんだろうというときの目安として、2 つの説を説明した

どちらの説も、0.1 程度でも意味があることを示唆している

なので、決定係数が 0.1 程度の場合であっても、仮説を後押しするような有用な結果が得られているのであれば、上記の説を味方に何とか世に出す努力をする価値はあると考える

何らか参考になれば幸い

参考文献

The acceptable R-square in empirical modelling for social science research Munich Personal RePEc Archive

https://www.utstat.toronto.edu/~brunner/oldclass/378f16/readings/CohenPower.pdf

参考過去記事

toukeier.hatenablog.com

toukeier.hatenablog.com