統計ER

統計ソフトRの使い方を中心に、統計解析方法の解説をするブログ。ありそうでなかなか見つからないサンプルサイズ計算などニッチな方法について紹介しています。

二値の変数が連続変数の予測因子と考えられる場合

ブログランキングに参加しています。
まずはぽちぽちっとお願いします。
↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓
にほんブログ村 科学ブログ 数学へ

多変量解析の基本は、重回帰分析だ。

 

 

質問

いくつかのチェック項目のうちひとつでも該当する場合、疾病Aのリスクありと判定される。

これによって集団をリスクあり群となし群に分けられる。

このリスクありとQOL指標2つが関連あるかどうかを調査した。

単変量解析をしたところ、QOL指標以外に、年齢と性別が有意であったため、多変量ロジスティック解析を行いQOL指標2つがともに年齢と性別とは関連なく疾病Aのリスクと関連していることを示した。

しかし、論文査読者から以下のコメントが来た。

1)多変量解析について、目的変数が疾病Aリスクの有無であり、説明変数にQOLが含まれていますが、この関係は正しいものでしょうか?リスクありだとQOLが低い、といった関係であれば分かりやすいのですが、、。統計学的にこの手法が正しいか否かの検討が必要です。 

論文査読者が言うように、この場合、「疾病AリスクがあるとQOLは低い」という解釈は難しいのか?

解析は、ロジスティック回帰モデルの目的変数を疾病Aリスクありなしとして、説明変数をQOLとした。

もしこれが逆なのだとすると、QOLの指標を目的変数にするわけだが、いずれも連続した変数で、リスクあり・なしのように二値変数としてロジスティック回帰分析の目的変数にはできないと思う。

このような場合は、どうすればよいのか??

回答

重回帰分析をすべし。

 

関連記事