統計ER

統計ソフトRの使い方を中心に、統計解析方法の解説をするブログ。ありそうでなかなか見つからないサンプルサイズ計算などニッチな方法について紹介しています。

分散の加法性を変化量の標準偏差推定に使えないか

連続量の前後比較の際に、先行研究のデータ等から、変化量の標準偏差を得たいと思うことがある。 しかし、たいていは変化量の標準偏差は掲載されていない。 前と後、別々の標準偏差から、変化量の標準偏差が分散の加法性を使って推定できないか?

Comparative Interrupted Time Series CITS とは?

Comparative interrupted time series (CITS) は、どんな分析方法で、どんなときに使うのが良いか?

EZRで ggplot2 を使って95%信頼区間と回帰式付き回帰直線を描く方法

EZRで回帰直線に95%信頼区間を描きたい場合どうするか? ggplot2 を使うと簡単・きれいに描ける。

EZRで散布図の中に相関係数と95%信頼区間を書く方法

EZRで散布図内に相関係数と95%信頼区間を書き入れることはできるか? がんばれば、できる。

EZRで回帰直線のグラフに95%信頼区間を付ける方法

EZRで回帰直線のグラフに95%信頼区間を付けるにはどうしたらよいか? predict()を使う。

同等性の検定のサンプルサイズ計算

積極的に同等であることを証明していく同等性の検定。 サンプルサイズ計算はどのようにすればよいか?

SPSSでマンホイットニーのU検定を実施する方法

SPSSでマンホイットニーのU検定を実施するにはどうすればよいか?

指数関数的に上昇するデータの共分散分析

指数関数的に上昇するデータを共分散分析したい場合どのようにすればよいか? ガンマ分布の一般化線形モデルを使えばできる。

ANOVAのタイプとは?どんな時どれを使う?

ANOVAには3つのタイプがある。 Type I, II, IIIの3つ。 どんな時にどれを使えばよいか?

メタアナリシスの重みはどんな計算をしているのか?

複数の研究を統合するメタアナリシス。 固定効果モデルと変量効果モデルが存在する。 統合する際の重みが異なるのが一番の違い。 どんな重み計算をしているのか?

逆確率重み付けを目的変数が連続データの場合にも使用することはできるか?

逆確率重み付けとは、傾向スコアの逆数を用いて、人数があまり多くない層を厚くする方法で、処方の有無の背景をそろえる方法である。 目的変数が連続データの場合でも利用可能だろうか? 答えはYesである。

傾向スコアマッチングのキャリパーの標準は0.2SDなのか?

傾向スコアマッチングのキャリパーは何が正解か? ネット上にある情報をまとめてみた。

EZRで描いたROC曲線のX軸の表示を調整する方法

EZRを使うとROC曲線はとても簡単に描けるが一つ困ったことがある。 X軸が1 - Specificity ではない点だ。 これを修正することはできないだろうか?

ログランク検定はどんな計算をしているのか?

生存時間解析に登場する群間比較検定のログランク検定。 いったいどんな計算をしているのか? 生存時間自体は使っていないことを知っているだろうか?

SPSSで反復測定分散分析を線形混合モデルで実施してみる

SPSSで、反復測定データを線形混合モデルで実施してみるとどうなるか? 欠測値があっても強い線形混合モデルで解析してみる。

EZRで反復測定分散分析を線形混合モデルで行うとどうなるか?

繰り返し測定した連続データを群間比較したい場合、反復測定分散分析が用いられるが、線形混合モデルでも同じことができる。 線形混合モデルを用いたほうが、欠測値があっても、その症例の全データを削除する必要がなくなり、欠測値に強いと言われている。 …

ブートストラップ ロジスティック回帰分析をEZRで行う方法

ブートストラップとは、小さいサンプルを復元抽出で何度もサンプリングして、疑似的に何度も試行したことにして、その結果から推定値の直接的な95%の範囲を求めたりする方法。 ブートストラップを使ったロジスティック回帰分析の方法をご紹介。

EZRで共分散分析を使った2つの回帰直線の差の検定

共分散分析を使えば、2つの回帰直線の傾きや切片が異なるかどうか検討できる。 直接的な傾きの差の検定や切片の差の検定ではないが、同様な結果が簡単に得られるので、共分散分析でよいと思っている。

EZRやSPSSで反復測定分散分析はどのように行えばよいか?

経時的に何回か測定した連続量を、群間比較したい、時点の多重比較をしたい。 こういう時によく取り上げられる手法として反復測定分散分析がある。 EZR公式マニュアルのデータを使って反復測定分散分析の例を紹介する。 EZRでのやり方と、SPSSでのやり方を列…

線形モデル linear model の分類が知りたい

回帰分析は、さまざまな種類があり、呼び名がわかりにくく混乱してしまう。 回帰分析を一般に線形モデルと呼ぶが、その線形モデルにいろいろな派生形があるということだ。 どれがどんな解析を指しているのか整理してみた。

EZRで多変量ROC曲線を比較するには?

ロジスティック回帰の回帰診断の一つにROC曲線を活用する方法がある。 ロジスティック回帰モデルを多変量で行えば多変量ROC曲線となる。 モデルごとに算出されるROC曲線を比較するにはどのようにすればよいか?

EZRやSPSSで平均値の折れ線グラフを描くにはどうすればよいか?

平均値の折れ線グラフとは、経時的な測定によって得た測定値の平均値を線で結んだグラフを指している。 EZRやSPSSでどのように描くか?

多重代入法においてデータセットはいくつ必要か?

欠測値があった場合、対処する方法がいくつかある。 そのうちの一つが多重代入法である。 多重代入法で作成すべき欠測値補完データの数はいくつがよいのか?

SPSSで残差分析はどうやるか?

3群以上の割合を比較する方法として、多重比較以外に残差分析がある。 残差分析とは何か? SPSSでできるか?

SPSSで適合度検定はどうやるか?

SPSSで適合度検定はできるか? できる。 ノンパラメトリック検定の1サンプルを使用する。

SPSSで3群以上の割合の比較はどうするか?

SPSSで3群以上の割合を比較するには、z検定を使って繰り返し検定し、Bonferroni調整を行う。 実際どのようにするか?

傾向スコアマッチングを目的変数が連続量の場合にも使用することはできるか?

傾向スコアマッチングは、ある因子についてランダム化していなかった観察研究データにおいて、そのある因子以外は同様にした2つのグループをマッチングで作成する方法である。 目的変数が連続量の場合でも利用可能だろうか? 答えはYesである。

AICとBICの違いは何か?

統計モデルの当てはまりの指標である、AICとBIC。 違いは何か?

決定係数はいくつならよいか?

重回帰分析の当てはまりの良さを示す決定係数。 ゼロから1の範囲をとるわけだが、いくつなら良いのか?

Kruskal-Wallis検定、Mann-Whitney-Wilcoxon検定は何の差を見ているのか?

ノンパラメトリック検定の場合、平均値の差を使っているわけではないが、では何の差なのか?