統計ER

R, EZR, SPSS, KH Coder を使ったデータ分析方法を紹介するブログ。ニッチな内容が多め

SPSSで多項ロジスティック回帰を実施する方法

目的変数が連続データの時は重回帰分析、2値データの場合は、いわゆるロジスティック回帰分析。

では、3値以上のカテゴリカルデータの場合はどうすれば?

答え。多項ロジスティック回帰分析を行えばよい。

多項ロジスティック回帰分析とは?

3値以上のカテゴリカルデータが目的変数の場合の、ロジスティック回帰分析である。

通常の2値が目的変数の場合は、二項ロジスティック回帰分析と呼ばれることもある。

3値以上は、「多い」ので、多項だ。

SPSSでは多項ロジスティック回帰はどうすればよいか?

データを準備した後、分析→回帰→多項ロジスティックだ。

今回使用したサンプルデータは、以下のリンク先で提供されているデータである。

Multinomial Logistic Regression | SPSS Data Analysis Examples

ウェブサイトの解説をなぞって同じように実行してみる。

ダイアログボックスが開いたら、従属変数、因子(カテゴリカルデータ)、共変量(連続データ)を投入する。

従属変数の設定にポイントがある。

従属変数にも参照カテゴリを設定しないといけない。

3値以上あるからだ。

参照カテゴリをクリックして、ユーザー指定を選択し、2(academic)を入力。

3値のカテゴリの真ん中を参照カテゴリにした。

最初のカテゴリ(一番小さい数値)や最後のカテゴリ(一番大きい数値)でもどれでも参照にできる。

ちなみに、独立変数の因子の参照カテゴリは選べず、最後のカテゴリ(一番大きい数値)で固定だ。

あとはOKをクリックするだけで、計算結果が出てくる。

SPSSの多項ロジスティック回帰の結果の読み方

まずは解析したデータの要約である。

type of programが従属変数、sesが因子型の説明変数。

連続データの説明変数、つまり共変量のwriting scoreの情報はない。

次に、モデルの適合度の検定である。

統計学的有意であれば、今回解析したモデルは意味があると言える。

疑似R2乗は参考程度に。

重回帰分析の決定係数のような数値と思えばよい。

尤度比検定の結果は、どの変数を増やすと、意味があるかどうかの検定をしている。

どちらの変数も統計学的有意で、モデル内で意味があると言える。

メインの結果が以下である。

academicを参照としたときのgeneralとvocationのオッズ比がExp(B)の列に出力されている。

オッズ比の95%信頼区間が標準で出力されるのは助かる。

論文にこのままの表を貼り付けてもいいくらいコンパクトできれいにまとまっていると思う。

結果の読み方の一例として、例えば以下のとおりである。

academicと比べてgeneralであるオッズ比は、writing scoreが上がるごとに0.944(95%信頼区間:0.905-0.984)と下がっていく。

ses=3 (high) に比べて、ses=1 (low) のオッズ比が大きく、3.199(95%信頼区間:1.168-8.764)であった。

同様にacademicに比べてvocationであるオッズ比は、writing scoreが上がるごとに0.893(95%信頼区間:0.855-0.932)と下がっていく。

ses=3 (high) に比べて、ses=2 (middle) のオッズ比は大きく、3.575 (95%信頼区間:1.313-9.736)であった。

まとめ

目的変数が3値以上のカテゴリカルデータの場合、多変量調整回帰分析は、どうしたらよいか?

答えは、多項ロジスティック回帰分析を行う。

SPSSでの実施方法を解説した。

参考サイト

Multinomial Logistic Regression | SPSS Data Analysis Examples

参考書籍

SPSSによる応用多変量解析