回帰分析で正規分布していない目的変数の場合はどうすればよいか?
残差も正規分布していない場合はどうしたらよいか?
質問
多変量解析でロジスティック解析を用いて検討を行ったところ、論文査読者から目的変数と説明変数を逆にすべきという指摘をうけた。
目的変数が連続変数になったため、重回帰分析をしてみたところ、今度は同じ査読者から目的変数が正規分布していないのであれば重回帰分析は不適切という指摘をうけた。
SPSSで目的変数の正規性を調べたところ、たしかに正規分布はしていないようで、また、残差の正規性があればよいはずなのでそれも調べたが、残念ながら正規分布ではなかった。
ちなみに、共線性に関しては問題なかった。
目的変数あるいは残差が正規分布していない場合の重回帰分析は適当ではないのか?
その場合ほかにどのような解析方法が考えられるか??
回答
目的変数が正規分布していない場合の対処法として、ひとつには対数変換してみる方法がある。
医学分野では、対数変換によって正規分布に近づくデータは多い。
もう一つは目的変数を高い低いの二値にしてロジスティック回帰を使う方法がある。
しかしながら、高い低いの二値にするときの閾値(しきいち)をどうするかという問題と、二値にしたときに情報が失われる問題(かなり高い、ちょっと高い、ちょっと低い、かなり低いなどが客観的にわかる数値データがなくなる)のため、二値にする決断は慎重に行うべき。
回帰分析に正規分布が必要か?
大事なポイントなので改めて言うと、回帰分析において必要な前提は、残差が正規分布していることである。
もしも残差が正規分布していなければ、目的変数を対数変換などで正規分布に近づけると、残差が正規分布に近づくこともある。
大事なのは、残差の正規性を見ることである。
それも検定ではなく、グラフでよい。
以下の関連記事を参照のこと。