統計ER

R, EZR, SPSS, KH Coder を使ったデータ分析方法を紹介するブログ。ニッチな内容が多め

基礎知識

SPSS でグループごとの分析を行う方法

SPSS でグループごとの分析を行う場合、どのようにしたらよいか?

対数変換した値の要約値の書き方 論文の書き方

対数変換した後の数値の要約値の論文表への書き方

重回帰分析の計算方法

重回帰分析は偏回帰係数を求めて予測式(回帰式)を作り、標準化偏回帰係数の計算、回帰式の有意性の分散分析、決定係数の算出、偏回帰係数の検定、など行うが、実際どんな計算をしているのか? 実際どんな計算をしているかわかると、偏回帰係数や標準化偏回…

クラスカルウォリス検定 わかりやすく解説

クラスカルウォリス検定を、原著に立ち返って、わかりやすく解説。

主成分分析の計算方法 RとEZRの方法

主成分分析は、多変量情報の縮約と言われるが、実際にはどんな計算をしているのか? 数学的に少し詳しくわかりたい人向け。

回帰分析に必要な仮定

目的変数が正規分布している必要はない。 説明変数も正規分布している必要はない。

EZRの集計結果・解析結果をエクセルに簡単きれいに貼り付ける方法

EZRの出力をExcelにきれいに貼り付ける方法。 標準の機能を使う方法と、テキストファイルウィザードを使う方法を紹介する。

重回帰モデルの評価としての決定係数と分散分析

重回帰モデルの評価指標の決定係数と分散分析の検定はどのように使い分ければよいのか?

交互作用・加法的交互作用・乗法的交互作用・相乗効果・拮抗効果・相殺効果・相加効果とは?

どうやら「交互作用」と言ったときに、何を指すかは、一意に決まっていないようだ。 ググって調べてみた。

2群共通の標準偏差とは何か?

2群の平均値比較、いわゆるt検定のためのサンプルサイズ計算の際の2群共通の標準偏差とは何か? 2群共通の標準偏差とは、サンプルサイズで重み付けした、標準偏差の重み付け平均のことである。

分散の加法性を変化量の標準偏差推定に使えないか

連続量の前後比較の際に、先行研究のデータ等から、変化量の標準偏差を得たいと思うことがある。 しかし、たいていは変化量の標準偏差は掲載されていない。 前と後、別々の標準偏差から、変化量の標準偏差が分散の加法性を使って推定できないか?

ANOVAの種類

ANOVAには3つの種類がある。 Type I, II, IIIの3つ。 どんな時にどれを使えばよいか?

傾向スコアマッチングのキャリパーの標準は0.2SDなのか?

傾向スコアマッチングのキャリパーは何が正解か? ネット上にある情報をまとめてみた。

線形回帰の種類 回帰モデルの種類

線形回帰の種類をわかりやすく解説。

AICとBICの違いは何か?統計解析での特徴比較

統計モデルの当てはまりの指標である、AICとBIC。 違いは何か?

決定係数の目安 ― 決定係数 R2乗値はいくつならよいか?

重回帰分析の当てはまりの良さを示す決定係数。 決定係数はR2乗値ともいう。 決定係数の目安はあるのだろうか? ゼロから1の範囲をとるわけだが、いくつなら良いのか?

クラスカルウォリス Kruskal-Wallis検定、マンホイットニー Mann-Whitney検定は何の差を見ているのか?

ノンパラメトリック検定の場合、平均値の差を使っているわけではないが、では何の差なのか?

EZRで連続量を正規分布にする方法 Box-Cox 変換

連続量を何らかの方法で正規分布に近づける方法はいくつかある。 よく使う方法は自然対数をとる方法だ。 ここではBox-Cox変換の方法をまとめてみた。

尤度とは?わかりやすく解説

読み方も意味しているところも分かりにくい尤度(ゆうど)。 わかりやすく解説。

サポートベクターマシンとは?ごく簡単に解説

機械学習の分類手法の一つ、サポートベクターマシンとは何か?

ランダムフォレストとバギングの違い

ランダムフォレストとバギングは、決定木をより汎用化するために考えられた手法。 違いは何か? 概念的な簡単な説明。

決定木の過学習を防ぐ剪定とは? 剪定とは枝刈りのこと

決定木には剪定(せんてい)という過程がある。 剪定とは何か? 簡単に紹介。

機械学習の決定木とは? Gini不純度とは? わかりやすく解説

決定木の分岐(ノード)を作るときどのような計算をしているのか? Gini不純度を計算しているのだが、Gini不純度とは何か?

機械学習による決定木分析 ごく簡単な解説

機械学習をする方法はさまざまある。 代表的な方法は決定木分析である。 そもそも決定木とは何か? 基本的なことをごく簡単に解説。

傾向スコア(Propensity Score)を利用した解析

傾向スコア Propensity scoreを利用した解析とはどのようなものか?

R で割合を計算する方法

R でカテゴリデータを集計して、割合を計算する方法。

サンプルサイズが異なる比較は適切か? n数が異なる比較は問題ない? サンプル数が異なる比較はやってもいいの?

まれな疾患の患者さんのデータと、その疾患を持たない患者さんデータを比較しようとすると、人数が大きく異なる。 まれな疾患はデータが集まりにくい。 人数が小さなグループと大きなグループを比較することは問題ないのか?

正規分布表の見方 z値とは?課題の問題を解くには?

正規分布表って、どうやって見たらいいんだろうと、悩んでいるあなた。 そもそも何を意味しているのか、どんなときに使うのかさっぱりわからない、というあなた。 そんなあなたを助ける、正規分布表の見方。 よくある課題での使い方も公開。

統計学的に2値に分ける方法

統計学的に適切に 2値 二値 Yes/No Low/High にわける方法はあるか?