統計ER

R, EZR, SPSS, KH Coder を使ったデータ分析方法を紹介するブログ。ニッチな内容が多め

2群共通の標準偏差とは何か?

2群の平均値比較、いわゆるt検定のためのサンプルサイズ計算の際の2群共通の標準偏差とは何か?

2群共通の標準偏差とは、サンプルサイズで重み付けした、標準偏差の重み付け平均のことである。

2群共通の標準偏差の計算式

2群共通の標準偏差のもととなる、2群共通の不偏分散とは、以下の式で計算できる。

 \displaystyle s^2 = \frac{(n_A-1)S^2_A+(n_B-1)S^2_B}{(n_A-1)+(n_B-1)}

AとBは、それぞれの群の名前である。

 n_A,  n_Bは、それぞれの群のサンプルサイズである。

 S^2_A,  S^2_Bは、各群の不偏分散である。

計算されたs2平方根を計算すると、2群共通の標準偏差となる。

2群共通の標準偏差計算例

先行研究から、以下の情報が得られたとする。

この時の2群共通の標準偏差を計算してみる。

  • A群のサンプルサイズが16例、B群のサンプルサイズが21例
  • A群の標準偏差が6.5、B群の標準偏差が5.2

このときまず両群の不偏分散を計算すると、それぞれ42.25、27.04と計算される。

> sd <- c(6.5, 5.2)
> sd^2
[1] 42.25 27.04

上記の式に代入して、2群共通の不偏分散を計算する。

まず分子を計算してみる。

> (16-1)*42.25 + (21-1)*27.04
[1] 1174.55

分母は、16-1+21-1 = 35である。

> (16-1)+(21-1)
[1] 35

分子÷分母で、2群共通の不偏分散が計算できる。

> 1174.55/35
[1] 33.55857

2群共通の不偏分散の平方根が、2群共通の標準偏差である。

> sqrt(33.55857)
[1] 5.792976

この場合、小数点以下二桁くらいで、5.79 が2群共通の標準偏差の推定値ということでよいだろう。

もともとが小数点以下一桁だったので、二桁で十分だ。

まとめ

2群の平均値比較、いわゆるt検定のサンプルサイズ計算の際に必要になる2群共通の標準偏差とは何か?どのように計算するのかを紹介した。

追伸

ここまで説明してきて、全部ひっくり返すようで申し訳ないが、実際のところ、必ずしもこれほどまで厳密に計算する必要はない。

大きいほうの標準偏差を共通の標準偏差としておけば、必要サンプルサイズが大きくなるので、より確実に統計学的有意を検出できることになり、それでもよい。

2つの値の中間とか、ちょうど真ん中とかでもよい。

実際、今回計算で求めたサンプルサイズ重み付け平均の5.79は、6.5と5.2の単純平均の5.85と大して変わらない。

要は、だいたいでいいのである。

サンプルサイズ計算とはそういうものである。

参考書籍

新版 無作為化比較試験(サンプルサイズ計算の計算式掲載)

EZR公式マニュアル(EZRは、2群の平均値の比較、いわゆるt検定のためのサンプルサイズ計算が可能)