統計ER

統計ソフトRの使い方を中心に、統計解析方法の解説をするブログ。ありそうでなかなか見つからないサンプルサイズ計算などニッチな方法について紹介しています。

「目的変数が正規分布していないのであれば重回帰分析は不適切」への対処法

ブログランキングに参加しています。
まずはぽちぽちっとお願いします。
↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓
にほんブログ村 科学ブログ 数学へ

重回帰分析の前提は、残差が正規分布していることであって、目的変数、説明変数が正規分布していることではない。ゆえに指摘は誤っているが、結果的に残差も正規分布していなかった。その場合の対処法。

質問

多変量解析でロジスティック解析を用いて検討を行ったところ、論文査読者から目的変数と説明変数を逆にすべきという指摘をうけた。

目的変数が連続変数になったため、重回帰分析をしてみたところ、今度は同じ査読者から目的変数が正規分布していないのであれば重回帰分析は不適切という指摘をうけた。

SPSSで目的変数の正規性を調べたところ、たしかに正規分布はしていないようで、また、残差の正規性があればよいはずなのでそれも調べたが、残念ながら正規分布ではなかった。

ちなみに、共線性に関しては問題なかった。

目的変数あるいは残差が正規分布していない場合の重回帰分析は適当ではないのか?

その場合ほかにどのような解析方法が考えられるか??

回答

目的変数が正規分布していない場合の対処法として、ひとつには対数変換してみる方法がある。医学分野では、対数変換によって正規分布に近づくデータは多い。

もう一つは目的変数を高い低いの二値にしてロジスティック回帰を使う方法がある。しかしながら、高い低いの二値にするときの閾値(しきいち)をどうするかという問題と、二値にしたときに情報が失われる問題(かなり高い、ちょっと高い、ちょっと低い、かなり低いなどが客観的にわかる数値データがなくなる)のため、二値にする決断は慎重に行うべき。

関連記事

toukeier.hatenablog.com