統計ER

統計ソフトRの使い方を中心に、統計解析方法の解説をするブログ。ありそうでなかなか見つからないサンプルサイズ計算などニッチな方法について紹介しています。

SPSSのロジスティック回帰で方程式中にない変数とは何か?

Toukei Consul Banner

KH Coder Consul Banner

SPSSでロジスティック回帰を実行すると方程式中にない変数という表が現れる。

あれはいったい何なのだろうか?

SPSSでロジスティック回帰に説明変数を投入すると

SPSSではまず定数項だけでロジスティック回帰を実施する。

変数を投入したモデルと比較するための何もなし(null ヌル)モデルである。

ブロック1で投入予定であったすべての変数が「方程式中にない変数」としてリストされる。

SPSSではこのような仕様になっている。

SPSSでロジスティック回帰をしたときに現れる方程式中にない変数とは何か?

方程式中にない変数というタイトルの表が現れるがこれは何を意味しているのか?

f:id:toukeier:20211117193502p:plain
方程式中にない変数

これはそれぞれの独立変数のスコア検定の結果が示されている。

SPSSでロジスティック回帰の際に登場する「スコア」とは何か?

SPSSでロジスティック回帰を実行した際に方程式中にない変数というタイトルの表中の「スコア」とは何を意味しているか?

この「スコア」とはスコア検定を意味している。

スコア検定とは、独立変数の目的変数への関連性を検討する統計学的検定の一つだ。

スコア検定のためにスコア関数があり、これは対数尤度を偏回帰係数で一回微分したもの(一次導関数)で、スコア検定は、偏回帰係数がゼロの時に、一次導関数がゼロかどうかの検定を行うものである。

偏回帰係数がゼロのとき、一次導関数もゼロとすると、その点つまり偏回帰係数ゼロが尤度最大となり、独立変数としては意味のない変数となる。

つまり、その時は独立変数が統計学的に有意ではないという結論になる。

逆に一次導関数がゼロでない場合は、尤度最大の偏回帰係数はゼロではなく、独立変数に意味があるという結論になる。

このあたりは、下記参考サイトの尤度比検定、Wald検定、スコア検定の違いを示している図を参照するとよくわかると思う。

ちなみに、二値の場合は、2x2のいわゆるカイ二乗検定になる。

結論としては、スコア検定の結果は、それぞれ単変量解析の結果と同様と考えればよい。

まとめ

SPSSでロジスティック回帰を実行すると最初に登場する「方程式中にない変数」という表の意味をお伝えした。

SPSSではまず定数項のみのnull モデルを計算し、その時モデルに投入しなかった全変数が「方程式中にない変数」となる。

方程式中にない変数の表中の「スコア」は、スコア検定の統計量で独立変数の目的変数に対する統計学的有意性が検定されている。

独立変数が二値の場合は2x2のカイ二乗検定となる。

参考サイト

浜田先生 ロジスティック回帰入門 https://www.croit.com/wp_croit2/wp-content/uploads/2018/12/04_01.pdf

古谷先生 統計解析 http://web.sfc.keio.ac.jp/~maunz/DSB19/DSB19_06.pdf

ロジスティック回帰における検定と線形重回帰との比較 - Qiita

EZR公式マニュアル

SPSSは素晴らしい統計解析ソフトだが、価格が高くて個人で導入するにはハードルが高いことが問題だ。

EZRは無料で利用できる。

世界一の無料統計ソフトRを医療統計向けに簡単に利用できるように改良されたものだ。

一度ご検討を。