級内相関係数 (ICC) Case2のサンプルサイズ計算はどうやる?

にほんブログ村 科学ブログ 数学へ

級内相関係数 Intra-class Correlation Coefficient Case2
ICC Case2は検者間信頼性の指標。

患者さんを数名の検査者(または評価者)で検査(または評価)して、
その測定値の一致性を見るのが主目的。

ICC Case2の計算とサンプルサイズ計算を
統計ソフトRでやってみた。

検者間信頼性 ICC(2,1)の計算例

9人の患者さんをA~Eの5人の検査者で1回ずつ検査した時

irrパッケージのicc()を使う。

最初一回だけインストールする。

install.packages("irr")

 

データ拝借元:級内相関係数|統計解析ソフト エクセル統計

A <- c(0,2,2,1,3,0,4,4,6)
B <- c(0,4,1,2,3,1,5,4,6)
C <- c(0,2,0,0,3,0,4,4,6)
D <- c(0,2,2,1,3,0,4,5,4)
E <- c(0,3,2,1,3,0,4,4,6)

dat.twoway <- cbind(A,B,C,D,E)
rownames(dat.twoway) <- c(1:9)

dat.twoway

library(irr)

icc(dat.twoway, model="twoway", type="agreement")

 

ICC(2,1)は、0.906と計算される。

高い一致度だ。

> library(irr)

> icc(dat.twoway, model="twoway", type="agreement")
 Single Score Intraclass Correlation

   Model: twoway 
   Type : agreement 

   Subjects = 9 
     Raters = 5 
   ICC(A,1) = 0.906

 F-Test, H0: r0 = 0 ; H1: r0 > 0 
  F(8,32.8) = 55.6 , p = 6.98e-17 

 95%-Confidence Interval for ICC Population Values:
  0.783 < ICC < 0.974

 

患者さん10人をA~Dの4人の検査者で膝関節屈曲可動域を検査した時

別のデータでICC(2,1)を計算してみる。

患者さん10人、A~Dの4人の検査者で、
膝関節屈曲可動域を検査したデータだ。

データ拝借元:信頼性指標としての級内相関係数

A <- c(126,137,113,153,146,161,110,145,126,114)
B <- c(122,143,119,143,157,157,109,151,141,126)
C <- c(131,141,115,135,150,160,105,152,132,130)
D <- c(125,141,105,144,149,160,113,156,122,125)

dat.twoway <- cbind(A,B,C,D)

rownames(dat.twoway) <- c(1:10)

dat.twoway

icc(dat.twoway, model="twoway", type="agreement")

 

ICC(2,1)は0.909と計算された。

こちらも一致度が高い。

> icc(dat.twoway, model="twoway", type="agreement")
 Single Score Intraclass Correlation

   Model: twoway 
   Type : agreement 

   Subjects = 10 
     Raters = 4 
   ICC(A,1) = 0.909

 F-Test, H0: r0 = 0 ; H1: r0 > 0 
    F(9,30) = 40.4 , p = 2.46e-14 

 95%-Confidence Interval for ICC Population Values:
  0.788 < ICC < 0.973

 

irrパッケージのanxietyデータを使った例

20人の患者さんを3人の評価者が評価した結果のICC

data(anxiety)
icc(anxiety, model="twoway", type="agreement")

 

ICC(2,1)は0.198とかなり低い一致度。

> icc(anxiety, model = "twoway", type = "agreement")
 Single Score Intraclass Correlation

   Model: twoway 
   Type : agreement 

   Subjects = 20 
     Raters = 3 
   ICC(A,1) = 0.198

 F-Test, H0: r0 = 0 ; H1: r0 > 0 
 F(19,39.7) = 1.83 , p = 0.0543 

 95%-Confidence Interval for ICC Population Values:
  -0.039 < ICC < 0.494

 

irrパッケージのDiagnosesデータを使った場合

精神科領域の疾患の診断が評価者によってどれだけ一致するかというデータ。

患者さん30人、評価者6人のデータ。

diagnoses.rev <- matrix(c(diagnoses[,1],diagnoses[,2],diagnoses[,3],diagnoses[,4],diagnoses[,5],diagnoses[,6]),nr=30)

icc(diagnoses.rev, model = "twoway", type = "agreement")

 

ICC(2,1)はあまり高くなく0.373にとどまった。

> icc(diagnoses.rev, model = "twoway", type = "agreement")
 Single Score Intraclass Correlation

   Model: twoway 
   Type : agreement 

   Subjects = 30 
     Raters = 6 
   ICC(A,1) = 0.373

 F-Test, H0: r0 = 0 ; H1: r0 > 0 
 F(29,33.7) = 7.03 , p = 1.21e-07 

 95%-Confidence Interval for ICC Population Values:
  0.196 < ICC < 0.572

 

ICC(2,1)のサンプルサイズ計算

ICC(2,1)のサンプルサイズ計算はどうやるのだろうか?

参考文献 Doros G. and Lew R. Design Based on Intra-Class Correlation Coefficients. Am J Biostatistics 2010: 1 (1); 1-8.に計算結果が掲載されている。

検査者が3人、5人、7人、10人のとき、
信頼区間全体の幅が0.2、0.3、0.4のときの
サンプルサイズが計算されている。

信頼区間有意水準が10%のときと5%の時が計算されている。

ICC(2,1)の推定値 \rho が0.6、0.7、0.8のときがそれぞれ
計算されている。

例えば、検査者が3人(k=3)で、信頼区間幅が0.4で推定したいとする。

有意水準5%つまり95%信頼区間で推定するとして、
\rhoが0.8と推定されるとすると、
必要なサンプルサイズ(患者さんの人数)は14人である。

参考文献にはスクリプトの請求が可能と書いてあった。

筆頭著者のDr. Dorosに連絡したところ、
スクリプトをいただいた。

論文には掲載されていないk=2の計算をしてみると、
以下のようになった。

Doros博士の偉大な仕事に敬意を表したい。

  \rho    
\Delta 0.6 0.7 0.8
k=2      
0.2 >50 >50 >50
0.3 >50 >50 31
0.4 >50 >50 20
0.5 >50 30 15
0.6 32 18 11

 

Sample Size Determination for ICC(2,1)

How should we calculate sample size for ICC(2,1) analysis?

A part of sample size calculation for ICC(2,1) with certain conditions
were published in the following scientific article:

Doros G. and Lew R. Design Based on Intra-Class Correlation Coefficients. Am J Biostatistics 2010: 1 (1); 1-8.

The article showed results of sample size calculation under the condition
estimating the confidence intervals of 0.2, 0.3, or 0.4 with two, three, or four raters.

Results with 10% and 5% of alpha levels were exhibited in Table 2 of the article. 

Estimates \rho of 0.6, 0.7, or 0.8 were demonstrated. 

For example, if you would estimate \rho=0.8 with 0.4 of 95% confidence interval
rated by four examiners, 14 patients would be needed as we can see a highlighted number
in the following.

The reference said anyone can request R scripts for the calculation.

Dr. Gheorghe Doros, the first author, kindly provided his script for my reference. 

The following table which includes numbers not calculated in the paper
was generated by using the script.

I would like to really thank Dr. Doros and express my acknowledgement of his work. 

 

  \rho    
\Delta 0.6 0.7 0.8
k=2      
0.2 >50 >50 >50
0.3 >50 >50 31
0.4 >50 >50 20
0.5 >50 30 15
0.6 32 18 11

 

参考文献

Doros G. and Lew R. Design Based on Intra-Class Correlation Coefficients. Am J Biostatistics 2010: 1 (1); 1-8.