統計ER

R, EZR, SPSS, KH Coder を使ったデータ分析方法を紹介するブログ。ニッチな内容が多め

基礎知識

重回帰分析はどういう計算をしているのか?

重回帰分析は偏回帰係数を求めて予測式(回帰式)を作り、標準化偏回帰係数の計算、回帰式の有意性の分散分析、決定係数の算出、偏回帰係数の検定、など行うが、実際どんな計算をしているのか? 実際どんな計算をしているかわかると、偏回帰係数や標準化偏回…

クラスカルウォリス検定 Kruskal-Wallis検定が適切である条件

多群のノンパラメトリック検定であるKruskal-Wallis検定が適切に実施されるには、どんな条件があるか。 原著に立ち返って確認してみたい。

主成分分析はどんな計算をしているのか?

主成分分析は、多変量情報の縮約と言われるが、実際にはどんな計算をしているのか? 数学的に少し詳しくわかりたい人向け。

回帰分析に必要な仮定

目的変数が正規分布している必要はない。 説明変数も正規分布している必要はない。

EZRの集計結果・解析結果をエクセルに簡単きれいに貼り付ける方法

EZRの出力をExcelにきれいに貼り付ける方法。 標準の機能を使う方法と、テキストファイルウィザードを使う方法を紹介する。

重回帰モデルの評価としての決定係数と分散分析

重回帰モデルの評価指標の決定係数と分散分析の検定はどのように使い分ければよいのか?

交互作用・加法的交互作用・乗法的交互作用・相乗効果・拮抗効果・相殺効果・相加効果とは?

どうやら「交互作用」と言ったときに、何を指すかは、一意に決まっていないようだ。 ググって調べてみた。

2群共通の標準偏差とは何か?

2群の平均値比較、いわゆるt検定のためのサンプルサイズ計算の際の2群共通の標準偏差とは何か? 2群共通の標準偏差とは、サンプルサイズで重み付けした、標準偏差の重み付け平均のことである。

分散の加法性を変化量の標準偏差推定に使えないか

連続量の前後比較の際に、先行研究のデータ等から、変化量の標準偏差を得たいと思うことがある。 しかし、たいていは変化量の標準偏差は掲載されていない。 前と後、別々の標準偏差から、変化量の標準偏差が分散の加法性を使って推定できないか?

ANOVAのタイプとは?どんな時どれを使う?

ANOVAには3つのタイプがある。 Type I, II, IIIの3つ。 どんな時にどれを使えばよいか?

傾向スコアマッチングのキャリパーの標準は0.2SDなのか?

傾向スコアマッチングのキャリパーは何が正解か? ネット上にある情報をまとめてみた。

AICとBICの違いは何か?

統計モデルの当てはまりの指標である、AICとBIC。 違いは何か?

決定係数はいくつならよいか?

重回帰分析の当てはまりの良さを示す決定係数。 ゼロから1の範囲をとるわけだが、いくつなら良いのか?

クラスカルウォリス Kruskal-Wallis検定、マンホイットニー Mann-Whitney検定は何の差を見ているのか?

ノンパラメトリック検定の場合、平均値の差を使っているわけではないが、では何の差なのか?

EZRで連続量を正規分布にする方法 Box-Cox 変換

連続量を何らかの方法で正規分布に近づける方法はいくつかある。 よく使う方法は自然対数をとる方法だ。 ここではBox-Cox変換の方法をまとめてみた。

尤度(ゆうど)とは?

読み方も意味しているところも分かりにくい尤度(ゆうど)。 理解したところを共有したい。

傾向スコア(Propensity Score)を利用した解析

傾向スコア Propensity scoreを利用した解析とはどのようなものか?

統計学的に2値に分ける方法

統計学的に適切に 2値 二値 Yes/No Low/High にわける方法はあるか?