統計ER

統計ソフトRの使い方を中心に、統計解析方法の解説をするブログ。ありそうでなかなか見つからないサンプルサイズ計算などニッチな方法について紹介しています。

EZRで反復測定分散分析を線形混合モデルで行うとどうなるか?

complete pack banner

text data complete pack banner

繰り返し測定した連続データを群間比較したい場合、反復測定分散分析が用いられるが、線形混合モデルでも同じことができる。

線形混合モデルを用いたほうが、欠測値があっても、その症例の全データを削除する必要がなくなり、欠測値に強いと言われている。

実際どのような違いが出るのか確認してみた。

反復測定データを反復測定分散分析すると・・・

解析の実践はEZRを使って行っていく。

使うデータは、EZR公式マニュアル付属の FCZ_CSA.rda である。

反復測定データ CDratio1, CDratio2, CDratio3を目的変数に、群別変数はFCZを設定して、反復測定分散分析を実行すると以下のようになる。

f:id:toukeier:20220312175714p:plain
反復測定データと群別変数を選択する

f:id:toukeier:20220312175900p:plain
結果出力のメインの部分

3回測定の時間の項 Time が統計学的有意で、群別変数と交互作用(群ごとの時間の影響)は有意でなかった。

線形混合モデルで同じ反復測定データを解析してみる

公式マニュアルどおりに横持ちのデータを縦持ちのデータに変換する。

f:id:toukeier:20220312184909p:plain
「複数の変数を縦に積み重ねたデータセットを作成する」を用いる

時間の因子をカテゴリカルデータとして投入したとき

EZRのメニューから線形混合モデルを選択し、以下のように入力する。

f:id:toukeier:20220312180354p:plain
モデル式を入力したところ

モデル式は以下の通りである。

CDratio ~ FCZ * Weeks + (1 | id)

チルダ(~)の左側が目的変数 CDratio 、右側が独立変数で、グループ変数のFCZと時間の変数Weeksを、主効果と交互作用をいっぺんにアスタリスク(*)でつないで投入している。

さらに、プラスでつないで、カッコ内に 1 と id が バーティカルバー (vertical bar) ( | ) をはさんで投入されている。

このカッコ内は、変量効果を指定する変数名を書き入れるところで、バーティカルバーの左は、変量効果と考える傾きとなる連続データの変数を指定する。

1の場合は、傾きの変動効果は考えないモデルとなる。

バーティカルバーの右側は、切片の変動効果で、反復測定データの場合、症例個人を表すIDを入れることが多い。

症例ごとの個人差を、回帰直線の切片が異なると考えることで、考慮する方法である。

この点が、線形混合モデルのすごいところ。

分散分析はこの個人差は考慮できないからだ。

これでOKをクリックすると以下の結果が出力される。

f:id:toukeier:20220312183521p:plain
結果の主要な部分

FCZの群間には差がなく、Weeks1と3が有意に異なるという結果だ。

群間と時間の交互作用もない。

時間の項を連続量で投入した場合

この結果は、時間の項を因子で投入したが、連続量で投入することもできる。

直線的な関係があると考えられれば、連続量で投入してもよい。

Week1と2は、約13異なり、Week2と3は、約20異なる。

厳密には直線的とは言い難いが、連続でもやってみると、以下のようになる。

f:id:toukeier:20220312183940p:plain
時間の項を連続量にした

WeeksNumのEstimateを見ると、Week2の推定値約13とWeek3の推定値約33の平均の約16.7となった。

有意確率は因子で投入した場合と変わらなかった。

切片だけでなく傾き(時間の項)も変量効果と考える

さらに、傾きも変量効果を考えると、公式マニュアルと同じ結果になる。

傾きに変量効果を考える場合は、モデル式を以下のようにする。

CDratio ~ FCZ * WeeksNum + (WeeksNum | id)

バーティカルバーの左側に傾きの変量効果を考慮する変数、今回はWeeksNumを投入した。

f:id:toukeier:20220312184544p:plain
傾きにも変量効果を想定した場合の結果

その結果、時間の効果は、0.05を少し下回るくらいになった。

このモデルが適切と考えられれば、これが最終的なモデルで、この結果を報告することになる。

まとめ

EZRで反復測定データを、線形混合モデルで解析してみた。

今回のデータでは、反復測定分散分析と比較して極端に異なる点はなかった。

しかし、線形混合モデルの利点として、欠測値があってもそれほど気にせず解析できることが挙げられる。

今後は、反復測定データの際には、線形混合モデルを使用する方向でやっていこうと思う。

EZR公式マニュアル