統計ER

統計ソフトRの使い方を中心に、統計解析方法の解説をするブログ。ありそうでなかなか見つからないサンプルサイズ計算などニッチな方法について紹介しています。

Cox回帰において変数選択はどうやればいい?カテゴリ変数の設定は? - SPSSで統計解析

ブログランキングに参加しています。
まずはぽちぽちっとお願いします。
↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓
にほんブログ村 科学ブログ 数学へ

SPSSで、Coxの比例ハザードモデル、いわゆるCox回帰を実施したいという要望は多い。SPSSはクリック、クリックで解析が進められる扱いやすいソフトウェアだ。

変数選択に悩むことは多い。また、カテゴリ変数の設定に悩むこともある。どうやればいいか?

質問

SPSSでのCox回帰分析で不明点が多いので、相談した。

心臓カテーテル治療(PCI)を何度も経てから冠動脈バイパス術 (CABG) を行う患者の長期成績は不良かというテーマ。

  • A群:PCI歴0回のCABG患者
  • B群:PCI歴1回のCABG患者
  • C群:PCI歴2回以上のCABG患者

の3群に分け、

検討する因子は

  1. 年齢
  2. 性別
  3. 高血圧症
  4. コレステロール血症
  5. 慢性腎臓病
  6. 心機能低下(LVEF:40%未満)

など。

生存フォロー日数と状態変数は死亡とし3群でのCox回帰分析をしたい。

質問内容は

  • (1) 強制投入法と変数増加法とどちらを使用すれば良いのか?
  • (2) ハザード比を求めるためにA群:3、B群:2、C群:1とし「カテゴリ…」というボタンをクリックし、参照カテゴリのラジオボタンの「最初」を選んでいるが、これは正しいか?

である。

回答

いずれの質問も解析者が決めることであるが、求められているであろう答えを回答する。

回答1 強制投入法か変数増加法か?

結論として、強制投入法である。

モデルを検討している段階では、変数増加法などの変数選択の方法を使ってもかまわない。その結果を踏まえるのは意義がある。大事なのは、先行研究の調整変数を踏まえること。そして、最終的に解析者自らが決めて、強制投入法を使って最終的な解析をする。

回答2 カテゴリ変数の設定は?

A群を1、B群を2、C群を3にして参照カテゴリを「最初」にする方法がやりたいことだと想像する。

おそらく、PCIが0回よりも1回、さらに2回以上が、長期予後が悪く、リスクが高いという結果を導きたいのだと想像する。

つまり、A群(PCI 0回)を基準として、PCI 1回、PCI 2回以上のハザード比を計算したいのであろう。

いま設定している条件では、PCI 2回以上が基準になって、1回、0回のハザード比を計算することになっている。きっとハザード比がどんどん小さくなっているのではないだろうか?

A群、B群、C群を3,2,1とするなら「最後」のままに、A群、B群、C群を1,2,3と変更すれば「最初」に変更して解析するというのがやりたいことなのだろうと想像する。

まとめ

Cox回帰の変数選択は、変数増加法等を使って事前に検討しても構わないが、最終的には解析者が変数セット決めて、強制投入で解析を行うのがよい。

カテゴリ設定は、基準としたいカテゴリに小さい値を割り当て、基準を「最初」とするのが一番覚えやすく混乱しない方法である。

関連記事

こちらの過去記事が参考になるかもしれない。

toukeier.hatenablog.com

toukeier.hatenablog.com