統計ER

統計ソフトRの使い方を中心に、統計解析方法の解説をするブログ。ありそうでなかなか見つからないサンプルサイズ計算などニッチな方法について紹介しています。

EZRで分散の信頼区間を計算する方法

Toukei Consul Banner

KH Coder Consul Banner

EZRで分散の信頼区間を計算するにはどうしたらよいか?

メニューから計算する方法はないので、Rスクリプトを使う。

Rスクリプトの紹介。

EZRで分散の信頼区間を計算するスクリプト

Rスクリプトは以下の通り。

Rスクリプト窓に以下をコピペして使う。

全体を選択して実行をクリックする。

var.interval <- function(data, conf.level=0.95){
    df <- length(data) - 1
    chilower <- qchisq((1-conf.level)/2, df)
    chiupper <- qchisq((1-conf.level)/2, df, lower.tail=FALSE)
    v <- var(data)
    c(df * v/chiupper, df * v/chilower)
}

var.interval()のカッコ内に、分散の信頼区間を計算したい変数名を書いて実行する。

95%信頼区間の場合は、それ以外何も指定しなくてOK。

> var.interval(Imatinib_Stop$Age)
[1] 202.3442 354.2129

90%信頼区間が計算したい場合は、conf.level=0.90をカッコ内に書き足す。その際、変数名とは半角カンマで区切る。

> var.interval(Imatinib_Stop$Age, conf.level=0.90)
[1] 210.8776 337.2703

EZRで分散を計算する方法

ちなみに、EZRで分散を計算する方法もご紹介。

分散自身は、「統計解析」→「連続変数の解析」→「連続変数の要約」メニューを使用する。

f:id:toukeier:20211028201339p:plain

ダイアログボックスで分散にチェック入れると、計算できる。

f:id:toukeier:20211028201427p:plain

出力窓に結果が出力される。

不偏分散というのが、いわゆるサンプルのデータを用いて計算する分散である。

母分散を推定するのに、偏りがなく性能が良い推定値である。

> #####連続変数の要約#####

> res <- numSummary2(Imatinib_Stop[,"Age"], statistics=c("mean", "u.sd", "u.var", 
+   "quantiles"), quantiles=c(0,.25,.5,.75,1))

> colnames(res$table) <- gettext(domain="R-RcmdrPlugin.EZR", colnames(res$table))

> res
  平均 不偏標準偏差 不偏分散 0% 25% 50% 75% 100%   n
 50.16     16.20121 262.4792 17  37  51  62   88 100

まとめ

EZRで分散の信頼区間を求めたい場合は、Rスクリプトで計算するのが良い。

Rスクリプトは上記に掲示しているので、コピペで使える。

参考文献

Using R to Find Confidence Intervals

http://pages.stat.wisc.edu/~yandell/st571/R/append7.pdf

EZR公式マニュアル

EZRを使いこなしたいならぜひ。