教科書的には何を計算するかは決まっているが、論文にどの数値を掲載するかは決まっていない。
そういうときは、実例をもとに、まねするのが良いが、最低限の目安を示す。
回帰分析の結果の書き方の基本
一番大事な要素は、点推定値と95%信頼区間である。
検定統計量(t値とか、F値とか、カイ二乗値とか)は本来不要である。
だが、検定統計量が掲載されている論文は多い。
それにならって検定統計量を書き入れてもよいだろう。
p値は、観察研究の場合、おまけであるので、95%信頼区間があれば、書かなくてもよいのだが、これも通常書かれているので、書いておいたほうが無難である。
研究ごとに示すべき数値を挙げる。
- 重回帰分析:推定値(非標準化、標準化)、p値、自由度調整済み決定係数
- ロジスティック回帰分析:オッズ比、オッズ比の95%信頼区間
- 線形混合モデル:推定値、p値
- 一般化線形混合モデル(logitの場合):オッズ比、オッズ比の95%信頼区間
あとは同じ分野の先行研究のまねをして、最低限必要と思う計算値を足す。
重回帰分析
よく記載されている数値は、
偏回帰係数、標準誤差、標準化偏回帰係数、t値、p値
というところである。
偏回帰係数をベータと記載したり、標準化偏回帰係数をベータと記載したりしているので、Statistical MethodのセクションとTableの脚注をよく読んで、確認する必要がある。
ただし、標準化偏回帰係数を掲示している研究は多くない印象。
https://journals.plos.org/plosone/article/file?type=printable&id=10.1371/journal.pone.0233410
https://www.nature.com/articles/ijo2017122.pdf?origin=ppub
日本語の論文は例えばこちら。
共働きの父親、共働きの母親それぞれの成人愛着スタイルがコペアレンティングに及ぼす影響
ロジスティック回帰分析
掲載されている数値セットごとに実例を挙げる。
偏回帰係数、p値、オッズ比、オッズ比の95%信頼区間。
偏回帰係数、標準偏差、Wald検定統計量、自由度、p値、オッズ比、オッズ比の95%信頼区間というフルパッケージの論文もある。
シンプルにオッズ比、オッズ比の95%信頼区間、p値の論文。
もっとシンプルにオッズ比とオッズ比の95%信頼区間といわゆる星(*)
ポアソン回帰分析
偏回帰係数、SE、真数の偏回帰係数、p値、95%信頼区間を挙げている論文がある。
偏回帰係数、SE、95%信頼区間、検定統計量、p値を挙げている論文もある。
https://icpaceruet.org/wp-content/uploads/2021/01/CE_60.pdf
負の二項回帰分析
偏回帰係数、SE、検定統計量、p値が挙げられている。
ポアソン回帰分析を同時に行っていて、結果の書き方は同じである。
線形混合モデル
偏回帰係数、標準誤差、95%信頼区間、p値を示している論文。
偏回帰係数、標準誤差、t値、p値のみを提示している論文。
数値をこまごまと書かずに、グラフ表示をメインにしている論文が多い印象である。
日本語の文献の例で、グラフ表示があり、数値はF値とp値の掲載。
https://core.ac.uk/download/pdf/228806911.pdf
こちらも日本語の文献の例で、推定平均、標準誤差、F値とp値の表示。
一般化線形混合モデル
偏回帰係数、標準誤差、t値、p値という例がある。
まとめ
重回帰分析、ロジスティック回帰分析、線形混合モデル、一般化線形混合モデルのそれぞれの結果の書き方について、どの数値を論文に掲載すべきかという観点で、例示してみた。
絶対的なルールはなく、同じ分野の先行研究の真似をするのが一番適切である。
おすすめ書籍(日本語での書き方例が載っている)
SPSSで学ぶ医療系多変量データ解析 第2版
レポート・論文への記載というセクションがある親切な書籍。