統計ER

統計ソフトRの使い方を中心に、統計解析方法の解説をするブログ。ありそうでなかなか見つからないサンプルサイズ計算などニッチな方法について紹介しています。

分散分析のサンプルサイズ計算をSPSSで行う方法

complete pack banner

text data complete pack banner

分散分析のサンプルサイズ計算はあまり知られていないが、多くの人に探されている方法である。

SPSSで計算する方法を紹介する。

分散分析のサンプルサイズ計算はSPSSのどのメニューから実行するか?

メニューは、分析→検定力分析→平均→一元配置分散分析、でたどり着ける。

SPSSの分散分析のサンプルサイズ計算メニューにたどり着いた後はどうすればいいのか?

計算メニューにはたどり着いたものの、開いた窓には何が書いてあるのか、よくわからずどんな数値を入れるのかさっぱりわからない、というのが本音ではないだろうか?

必要な個所を一つ一つ見ていく。

単一べき乗値とは?

ここには検出力を入力する。

通常は0.8でよい。

単一べき乗値は、Single power valueの訳と思われる。

Powerは、べき乗ではなく、検出力だ。

指定はCohenのfかイータ2乗を使う

例えば2群の平均値の差であれば、標準偏差で割った標準化した差を効果サイズ(effect size)というが、それと同等の標準化した効果サイズを指定するのがよい。

Cohenのfとイータ2乗が選べる。

この2つが何なのか、どうすればよいかを解説する。

Cohenのfは慣例の値がある

先行研究やパイロット研究の結果などの情報が一切ないために、エイヤで決めなければならない場合は、Cohenが提唱してくれている慣例がある。

  • Small Effect: f=0.1
  • Medium Effect: f=0.25
  • Large Effect: f=0.4

これを使うことができる。

イータ2乗はSPSSで分散分析を実施すると計算される

イータ2乗は、SPSSで分散分析を実行すると自動的に計算される。

例えば3群で体重の変化量を比較した試験において分散分析を実行すると以下のような表が出力される。

今回の例では0.136である。

パイロット研究データが利用可能な場合は、このようにイータ2乗が計算できるので、本番の試験のためのサンプルサイズ計算ができるというわけである。

イータ2乗は、群間の平方和と全体の平方和の比であるので、先行研究の論文に分散分析表が掲載されていれば、そこから計算できる。

今回の例の分散分析表は以下のとおりである。

ここでグループ間の平方和 614.644 と合計の平方和 4525.386 の比を計算すると、0.1358213と計算され、先ほどのイータ2乗 0.136 に一致する。

> 614.644/4525.386
[1] 0.1358213

このように分散分析表からイータ2乗は計算できる。

ちなみに、イータ  \eta 2乗とfの間には、以下のような関係があるので、イータ2乗がわかればfも計算できる。

今回の場合は、ほぼ0.4でMedium Effectくらいであることがわかる。

 \displaystyle f = \sqrt{\frac{\eta^{2}}{(1-\eta^{2})}}

> eta2 <- 0.136
> f <- sqrt(eta2/(1-eta2))
> f
[1] 0.396746

イータ2乗=0.136を入力して、話を進めていく。

群の数とサンプルサイズ比を入力する

その下のセクションで群の数を必要に応じて追加し、ケースの重みというカラムにサンプルサイズ比を入力する。

今回は3群なので、追加をクリックし、3群にした。

サンプルサイズ比は、特に意図がない限り、全群同数がよく、3群であれば1:1:1がよい。

ケースの重みに1を入力した後、タブを押すと、OKがクリックできるようになる。

フォーカスのセルが、例えば右に移ることが、入力されたという合図と思われる。

あとはOKをクリックすると計算される。

(ただし、バグなのか、OKをクリックしても計算されないことがあるので、そういう場合は、いったんキャンセルし、もう一度窓を開いて、同じことを入力してOKをクリックすると計算されたりする。このように、何度が実行してみることが必要な場合がある)

(また、Cohenのfに何か入力して計算してみて、実行できることを確認した後、イータ2乗に値を入れて計算したり、まず2群で計算しておいて、計算ができることを確認した後、3群に増やして計算してみたり、いろいろと試行錯誤が必要な場合もある)

出力の解釈

検出力の計算結果と、サンプルサイズの計算結果が同時に出力される。

全体の検定用のグループ サイズ割り振りというタイトルの表に1群あたりの必要サンプルサイズが表示されている。

今回の例では1群22例、合計で66例必要と計算された。

検出力は80%で計算したわけだが、このサンプルサイズで実際に検定するとした場合の、実際の検出力(SPSSでは検定力と表示されている)が0.811 (81.1%)と計算されている。

ちなみに、今回使用した例題は、1群、17例、26例、29例であり、1群22例必要という条件におおよそあっていたと言える。

今回使用したデータは、統計ソフトRのMASSパッケージに含まれる、anorexiaというデータセットである。

統計ソフトRからSPSS形式に移植して用いた。

まとめ

SPSSで分散分析のサンプルサイズ計算を実行する方法を紹介した。

ポイントは、効果サイズをどのように決めるかである。

まったく見積もれない場合はCohenが提唱した慣例を用いるという方法がある。

先行研究やパイロット研究が利用可能な場合は、イータ2乗を計算して、それを用いるという方法もある。

なんらか、お役に立てば。

参考書籍・サイト

Jacob Cohen. Statistical Power Analysis for the Behavioral Sciences.

https://www.utstat.toronto.edu/~brunner/oldclass/378f16/readings/CohenPower.pdf

多標本のデータ処理 | 我楽多頓陳館--雑学と統計学の館

http://www.snap-tck.com/room04/c01/stat/stat04/stat0401.html

SPSSによる分散分析・混合モデル・多重比較の手順