統計ER

R, EZR, SPSS, KH Coder を使ったデータ分析方法を紹介するブログ。ニッチな内容が多め

統計学的に2値に分ける方法

統計学的に適切に 2値 二値 Yes/No Low/High にわける方法はあるか?

質問

連続量を2値にしてロジスティック回帰分析で検討してみたいと思うが、 高い低いの2値にする場合、 何を基準に2値にわけるのがよいのかわからない。

統計学でよく使用されるわけ方はあるのか?

もしそのような手段があるようであれば教えてほしい。

回答

統計学的に2値に分ける基準があるか?

統計学的に何かを求めているようだが、 残念ながら、統計学では指針はない。

当該分野において、意味があるカットオフ(分け目、切れ目、区切りという意味)で2つに分けるしかない。

統計学をつかう場面でよく使われるカットオフ

統計学的かどうかわからないが、 あえて言えば、 平均や中央値は2値の分け目になる。

2値にすることは価値があるか?

2値にする前によく考える必要がある。

本当に2値にしていいのかどうか。

2値にするということは情報が失われる。

その方法が本当に適切なのか、

立ち止まって考える必要がある。