統計ER

R, EZR, SPSS, KH Coder を使ったデータ分析方法を紹介するブログ。ニッチな内容が多め

重回帰分析の結果の書き方 ― 論文に書くときどの数値を書くべきか?

教科書的には何を計算するかは決まっているが、論文にどの数値を掲載するかは決まっていない。

そういうときは、実例をもとに、まねするのが良いが、最低限の目安を示す。

>>もう統計で悩むのを終わりにしませんか?


↑1万人以上の医療従事者が購読中

回帰分析の結果の書き方の基本

一番大事な要素は、点推定値と95%信頼区間である。

p値は、観察研究の場合、おまけであるので、95%信頼区間があれば、書かなくてもよいのだが、これも通常書かれているので、書いておいたほうが無難である。

p 値が書いてあれば、検定統計量(t値とか、F値とか、カイ二乗値とか)は本来不要である。

p 値、検定方法、自由度がわかれば、検定統計量は逆算できるからである。

昔のように、α 水準別の検定統計表の数値と照らし合わせて、p 値が、0.05 未満とか、0.01 未満とかそういう判定はせずに、直接 p 値を計算するようになっているので、その点でも検定統計量の数値自体を報告する意義は薄いと思う。

また、検定統計量は、メタアナリシスなどに使用するわけではないため、個々の論文で報告しておく必要性は低い。

だが、検定統計量が掲載されている論文は多い。

それにならって検定統計量を書き入れてもよいだろう。

研究ごとに示すべき数値を挙げる。

  • 重回帰分析:推定値(非標準化、標準化)、p値、自由度調整済み決定係数
  • ロジスティック回帰分析:オッズ比、オッズ比の95%信頼区間
  • 線形混合モデル:推定値、p値
  • 一般化線形混合モデル(logitの場合):オッズ比、オッズ比の95%信頼区間

あとは同じ分野の先行研究のまねをして、最低限必要と思う計算値を足す。

重回帰分析

よく記載されている数値は、

偏回帰係数、標準誤差、標準化偏回帰係数、t値、p値

というところである。

偏回帰係数をベータと記載したり、標準化偏回帰係数をベータと記載したりしているので、Statistical MethodのセクションとTableの脚注をよく読んで、確認する必要がある。

ただし、標準化偏回帰係数を掲示している研究は多くない印象。

The psychological distress and coping styles in the early stages of the 2019 coronavirus disease (COVID-19) epidemic in the gereral mainland Chinese population: A web-based survey

Social, Environmental and Psychological Factors Associated with Objective Physical Activity Levels in the Over 65s | PLOS ONE

Adiposity and grip strength as long-term predictors of objectively measured physical activity in 93015 adults: the UK Biobank study

https://journals.lww.com/nsca-jscr/Fulltext/2018/09000/Physical_Fitness_Predictors_of_a_Warrior_Task.18.aspx

共分散分析(Analysis of covariance)という記述になると、最小二乗平均(Least square mean)が示される方向性。

JCM | Free Full-Text | Effects of Acupuncture on Lowering Blood Pressure in Postmenopausal Women with Prehypertension or Stage 1 Hypertension: A Propensity Score-Matched Analysis

重回帰分析:日本語論文の例

日本語の論文は例えばこちら。

共働きの父親、共働きの母親それぞれの成人愛着スタイルがコペアレンティングに及ぼす影響

母親による感情の社会化と幼児の心理的適応─他者のネガティブ感情への対処に着目して─

性別ダイバーシティの高い職場における職務特性の心理的影響

3歳未満の子どもを養育する父親におけるコペアレンティングの影響要因に関する横断研究

いずれも、階層的重回帰分析を行っている。

>>もう統計で悩むのを終わりにしませんか?


↑1万人以上の医療従事者が購読中

二元配置分散分析(二要因分散分析)

二要因がともに独立のいわゆる二元配置分散分析の論文は、探してもなかなか見つからない

たいていは、二元配置分散分析を対応ありデータ、すなわち、反復測定データに適用している

二要因のうち一要因は対応あり(反復測定分散分析)

主効果及び交互作用の検定の有意確率 P 値とグラフを表示している例

うつむき姿勢保持に対する温罨法およびマッサージによる苦痛緩和効果

背部温罨法の温度の相違による効果の検討

新型コロナウイルス感染症拡大下における大学生のメンタルヘルスと社会的スキルに関する調査研究:

F 値、ES(Effect size)、P 値(*で表示)及びグラフを表示している例

高等専門学校生の体力における発達傾向の差異−1990年および2000年に入学した男子学生を対象として−

自由度、F 値、P 値を示している例(グラフなし)

知的障害者入所施設からの地域生活移行が移行者に及ぼす影響に関する研究

ロジスティック回帰分析

掲載されている数値セットごとに実例を挙げる。

偏回帰係数、p値、オッズ比、オッズ比の95%信頼区間

Availability of exercise facilities and physical activity in 2,037 adults: Cross-sectional results from the Swedish neighborhood and physical acitivity (SNAP) study

偏回帰係数、SE、オッズ比、95% 信頼区間、P 値

Recent Trends in the Prevalence of Coronary Disease: A Population-Based Autopsy Study of Nonnatural Deaths

偏回帰係数、標準偏差、Wald検定統計量、自由度、p値、オッズ比、オッズ比の95%信頼区間というフルパッケージの論文もある。

Exercise and Use of Enhancement Drugs at the Time of the COVID-19 Pandemic: A Multicultural Study on Coping Strategies During Self-Isolation and Related Risks

シンプルにオッズ比、オッズ比の95%信頼区間、p値の論文。

Predictors of severity and development of critical illness of Egyptian COVID-19 patients: A multicenter study | PLOS ONE

Levels and predictors of anxiety, depression and health anxiety during COVID-19 pandemic in Turkish society: The importance of gender - PMC

The prevalence, incidence, prognosis and risk factors for symptoms of depression and anxiety in a UK cohort during the COVID-19 pandemic | BJPsych Open | Cambridge Core

Prevalence and associated factors of refractive error among adults in South Ethiopia, a community-based cross-sectional study | PLOS ONE

Frontiers | Effectiveness and safety of glucagon-like peptide 1 receptor agonists in patients with type 2 diabetes: evidence from a retrospective real-world study

もっとシンプルにオッズ比とオッズ比の95%信頼区間といわゆる星(*)

Prevalence and predictors of depression and anxiety among medical students in Addis Ababa, Ethiopia | International Journal of Mental Health Systems | Full Text

Psychiatric history and subthreshold symptoms as predictors of the occurrence of depressive or anxiety disorder within 2 years

一番シンプルに、P 値に触れず、オッズ比と 95 %信頼区間のみの論文

Metformin Plus Insulin for Preexisting Diabetes or Gestational Diabetes in Early Pregnancy: The MOMPOD Randomized Clinical Trial | Diabetes | JAMA | JAMA Network

日本語の論文の例

オッズ比、95 % 信頼区間、P 値の表示

新型コロナウイルス感染症流行下におけるバス事業労働者のメンタルヘルスと新型コロナウイルス恐怖および雇用の不安定性との関連

修正ポアソン回帰分析

相対リスク(Relative Risk)と絶対リスク差(Absolute Risk Difference)の点推定値と 95 % 信頼区間を表示している論文例

Strategies to Increase Cervical Cancer Screening With Mailed Human Papillomavirus Self-Sampling Kits: A Randomized Clinical Trial | Cervical Cancer | JAMA | JAMA Network

相対リスクと 95 %信頼区間のみの論文

Cannabis Exposure and Adverse Pregnancy Outcomes Related to Placental Function | Substance Use and Addiction Medicine | JAMA | JAMA Network

ポアソン回帰分析

偏回帰係数、SE、真数の偏回帰係数、p値、95%信頼区間を挙げている論文がある。

High Profile Football Matches in Europe are Associated with Traffic Accidents in Asia: An Archival Study

偏回帰係数、SE、95%信頼区間、検定統計量、p値を挙げている論文もある。

Accident Prediction by Using Poisson Regression for Unsignalised Junction in Khulna Metropolitan City, Bangladesh

負の二項回帰分析

偏回帰係数、SE、検定統計量、p値が挙げられている。

ポアソン回帰分析を同時に行っていて、結果の書き方は同じである。

Analysis of highway crash data by Negative Binomial and Poisson regression models

線形混合モデル

偏回帰係数、標準誤差、95%信頼区間、p値を示している論文。

Muscle mass, strength and functional outcomes in critically ill patients after cardiothoracic surgery: Does neuromuscular electrical stimulation help? The Catastim 2 randomized controlled trial

Table 5 | Postoperative Complications and Long-Term Quality of Life After Multimodality Treatment for Esophageal Cancer: An Analysis of the Prospective Observational Cohort Study of Esophageal-Gastric Cancer Patients (POCOP) | Annals of Surgical Oncology

偏回帰係数、標準誤差、t値、p値のみを提示している論文。

Physical Predictors of Cognitive Performance in Healthy Older Adults: A Cross-Sectional Analysis | PLOS ONE

調整平均差の点推定値、95 % 信頼区間、P 値、及びグラフという論文もある

Long-Term Blood Pressure Control After Hypertensive Pregnancy Following Physician-Optimized Self-Management: The POP-HT Randomized Clinical Trial | Cardiology | JAMA | JAMA Network

Single-Dose Psilocybin Treatment for Major Depressive Disorder: A Randomized Clinical Trial | Depressive Disorders | JAMA | JAMA Network

Long-Term Outcomes of Medical Management vs Bariatric Surgery in Type 2 Diabetes | Diabetes | JAMA | JAMA Network

調整平均差の点推定値、95 %信頼区間、P 値のみというシンプルな論文

Adenotonsillectomy for Snoring and Mild Sleep Apnea in Children: A Randomized Clinical Trial | Sleep Medicine | JAMA | JAMA Network

数値をこまごまと書かずに、グラフ表示をメインにしている論文が多い印象である。

Long-term health-related quality of life after pancreatic resection for malignancy in patients with and without severe postoperative complications

Long-term quality of life after laparoscopic distal gastrectomy for early gastric cancer: results of a prospective multi-institutional comparative trial | Gastric Cancer

日本語の文献の例で、グラフ表示があり、数値はF値とp値の掲載。

中高年を対象とした運動介入プログラムによる健康増進効果:平成 16 年度札幌市国保ヘルスアップモデル事業の結果から

こちらも日本語の文献の例で、推定平均、標準誤差、F値とp値の表示。

職場における対人的援助向上プログラムの効果評価

こちらは、平均値、標準誤差、F 値、P 値、効果量 d、d の 95 % 信頼区間という組み合わせ

強み介入が中学生の精神的健康に及ぼす効果に関する検討

一般化線形混合モデル

偏回帰係数、標準誤差、t値、p値という例がある。

Factors That Influence the Rating of Perceived Exertion After Endurance Training

動物実験の結果に適用した例

Figure 6 が結果と思われる

図のみであり、Table は提示されていない

Frontiers | Retinal alpha-synuclein accumulation correlates with retinal dysfunction and structural thinning in the A53T mouse model of Parkinson’s disease

特定の統計解析手法を使っている論文を探す方法

まず、統計解析手法名検索エンジンや Perplexity AI で検索する

手法を使用している論文がすぐに見つかれば OK

統計解析手法の論文が検索されてきた場合、Pubmed にあるような「Cited by(引用されている論文リスト)」セクションを探す

Cited by セクションの論文にあたると、探していた統計解析手法を使っている論文であることが多い

その論文の記載を参考にできる

日本語の論文を検索する場合は、J-Stage の検索窓に、統計解析手法を入力して検索すると、その手法を使った論文が簡単に見つかる

全文が PDF で取得でき、全文検索可能な論文が多いからではなかろうか

J-Stage はおすすめ

まとめ

重回帰分析、ロジスティック回帰分析、線形混合モデル、一般化線形混合モデルのそれぞれの結果の書き方について、どの数値を論文に掲載すべきかという観点で、例示してみた。

絶対的なルールはなく、同じ分野の先行研究の真似をするのが一番適切である。

おすすめ書籍(日本語での書き方例が載っている)

SPSSで学ぶ医療系多変量データ解析 第2版

レポート・論文への記載というセクションがある親切な書籍。