統計ER

R, EZR, SPSS, KH Coder を使ったデータ分析方法を紹介するブログ。ニッチな内容が多め

基礎知識

統計解析における各種変数・データの呼び方の整理

統計解析において、同じ意味合いで、違う呼び名が存在する それらを列挙して、整理したい

重回帰分析の目的変数は正規分布していなくて本当に大丈夫か?

以前に、重回帰分析の目的変数は正規分布している必要はないとのブログ記事を書いた しかし、本当にそうなのだろうか? 自信がなくなってきたので、調べてみた

エクセルにデータ分析がない場合どうすればよいか

エクセルでデータ分析をしたいが、データ分析というボタンが見つからない エクセルで、データ分析がない場合の対処法

欠損値のメカニズム

欠損値(欠測値も同じ)は、生じる理由や前提から考えて、3 つに分けられるという話

SPSS でグループごとの分析を行う方法

SPSS でグループごとの分析を行う場合、どのようにしたらよいか?

重回帰分析の計算方法

重回帰分析は偏回帰係数を求めて予測式(回帰式)を作り、標準化偏回帰係数の計算、回帰式の有意性の分散分析、決定係数の算出、偏回帰係数の検定、など行うが、実際どんな計算をしているのか? 実際どんな計算をしているかわかると、偏回帰係数や標準化偏回…

クラスカルウォリス検定 わかりやすく解説

クラスカルウォリス検定を、原著に立ち返って、わかりやすく解説。

主成分分析の計算方法 RとEZRの方法

主成分分析は、多変量情報の縮約と言われるが、実際にはどんな計算をしているのか? 数学的に少し詳しくわかりたい人向け。

回帰分析の仮定

目的変数が正規分布している必要はない。 説明変数も正規分布している必要はない。

EZRの集計結果・解析結果をエクセルに簡単きれいに貼り付ける方法

EZRの出力をExcelにきれいに貼り付ける方法。 標準の機能を使う方法と、テキストファイルウィザードを使う方法を紹介する。

重回帰モデルの評価 決定係数と分散分析

重回帰モデルの評価指標の決定係数と分散分析の検定はどのように使い分ければよいのか?

交互作用とは

どうやら「交互作用」と言ったときに、何を指すかは、人それぞれのようだ。

分散の加法性が成り立たない 変化量の標準偏差推定について

連続量の前後比較の際に、先行研究のデータ等から、変化量の標準偏差を知りたいと思うことがある。 しかし、たいていは変化量の標準偏差は掲載されていない。 前と後、別々の標準偏差から、変化量の標準偏差が分散の加法性を使って推定できないか?

ANOVAの種類

ANOVAには3つの種類がある。 Type I, II, IIIの3つ。 どんな時にどれを使えばよいか?

傾向スコアマッチングのキャリパーについて

傾向スコアマッチングのキャリパーはどのくらいが正解か? ネット上にある情報をまとめてみた。

線形回帰の種類 回帰モデルの種類

線形回帰の種類をわかりやすく解説。

AICとBICの違いは何か?統計解析での特徴比較

統計モデルの当てはまりの指標である、AICとBIC。 違いは何か?

決定係数の目安 ― 決定係数 R2乗値はいくつならよいか?

重回帰分析の当てはまりの良さを示す決定係数。 決定係数はR2乗値ともいう。 決定係数の目安はあるのだろうか? ゼロから1の範囲をとるわけだが、いくつなら良いのか?

クラスカルウォリス検定とマンホイットニーの U 検定は何を検定しているか

ノンパラメトリック検定の場合、平均値の差を使っているわけではないが、では何の検定なのか?

Box-Cox 変換を R で行う方法

連続量を何らかの方法で正規分布に近づける方法はいくつかある。 ここではBox-Cox変換の方法をまとめてみた。

EZRのフォントの変更方法

EZR のフォントやフォントサイズを変更するにはどうやったらいいか。

尤度とは?わかりやすく解説

読み方も意味しているところも分かりにくい尤度(ゆうど)。 わかりやすく解説。

R のパッケージをsourceからインストールする方法

R はパッケージを追加すると新しい機能が追加できる。 その方法もとても簡単だ。 R のパッケージの追加方法として source からインストールする方法があるので、その解説。

多変量解析の変数選択について

多変量モデルの変数選択について、悩まない人はいない。 どの変数を採用してどの変数を採用しないのか。 明確な基準はあるのか?

サポートベクターマシンとは?ごく簡単に解説

機械学習の分類手法の一つ、サポートベクターマシンとは何か?

ランダムフォレストとバギングの違い

ランダムフォレストとバギングは、決定木をより汎用化するために考えられた手法。 違いは何か? 概念的な簡単な説明。

決定木の過学習を防ぐ剪定とは? 剪定とは枝刈りのこと

決定木には剪定(せんてい)という過程がある。 剪定とは何か? 簡単に紹介。

機械学習の決定木とは? Gini不純度とは? わかりやすく解説

決定木の分岐(ノード)を作るときどのような計算をしているのか? Gini不純度を計算しているのだが、Gini不純度とは何か?

機械学習による決定木分析 ごく簡単な解説

機械学習をする方法はさまざまある。 代表的な方法は決定木分析である。 そもそも決定木とは何か? 基本的なことをごく簡単に解説。

R で割合を計算する方法

R でカテゴリデータを集計して、割合を計算する方法。