基礎知識
統計解析において、同じ意味合いで、違う呼び名が存在する それらを列挙して、整理したい
以前に、重回帰分析の目的変数は正規分布している必要はないとのブログ記事を書いた しかし、本当にそうなのだろうか? 自信がなくなってきたので、調べてみた
エクセルでデータ分析をしたいが、データ分析というボタンが見つからない エクセルで、データ分析がない場合の対処法
欠損値(欠測値も同じ)は、生じる理由や前提から考えて、3 つに分けられるという話
SPSS でグループごとの分析を行う場合、どのようにしたらよいか?
重回帰分析は偏回帰係数を求めて予測式(回帰式)を作り、標準化偏回帰係数の計算、回帰式の有意性の分散分析、決定係数の算出、偏回帰係数の検定、など行うが、実際どんな計算をしているのか? 実際どんな計算をしているかわかると、偏回帰係数や標準化偏回…
クラスカルウォリス検定を、原著に立ち返って、わかりやすく解説。
主成分分析は、多変量情報の縮約と言われるが、実際にはどんな計算をしているのか? 数学的に少し詳しくわかりたい人向け。
目的変数が正規分布している必要はない。 説明変数も正規分布している必要はない。
EZRの出力をExcelにきれいに貼り付ける方法。 標準の機能を使う方法と、テキストファイルウィザードを使う方法を紹介する。
重回帰モデルの評価指標の決定係数と分散分析の検定はどのように使い分ければよいのか?
どうやら「交互作用」と言ったときに、何を指すかは、人それぞれのようだ。
連続量の前後比較の際に、先行研究のデータ等から、変化量の標準偏差を知りたいと思うことがある。 しかし、たいていは変化量の標準偏差は掲載されていない。 前と後、別々の標準偏差から、変化量の標準偏差が分散の加法性を使って推定できないか?
ANOVAには3つの種類がある。 Type I, II, IIIの3つ。 どんな時にどれを使えばよいか?
傾向スコアマッチングのキャリパーはどのくらいが正解か? ネット上にある情報をまとめてみた。
線形回帰の種類をわかりやすく解説。
統計モデルの当てはまりの指標である、AICとBIC。 違いは何か?
重回帰分析の当てはまりの良さを示す決定係数。 決定係数はR2乗値ともいう。 決定係数の目安はあるのだろうか? ゼロから1の範囲をとるわけだが、いくつなら良いのか?
ノンパラメトリック検定の場合、平均値の差を使っているわけではないが、では何の検定なのか?
連続量を何らかの方法で正規分布に近づける方法はいくつかある。 ここではBox-Cox変換の方法をまとめてみた。
EZR のフォントやフォントサイズを変更するにはどうやったらいいか。
読み方も意味しているところも分かりにくい尤度(ゆうど)。 わかりやすく解説。
R はパッケージを追加すると新しい機能が追加できる。 その方法もとても簡単だ。 R のパッケージの追加方法として source からインストールする方法があるので、その解説。
多変量モデルの変数選択について、悩まない人はいない。 どの変数を採用してどの変数を採用しないのか。 明確な基準はあるのか?
機械学習の分類手法の一つ、サポートベクターマシンとは何か?
ランダムフォレストとバギングは、決定木をより汎用化するために考えられた手法。 違いは何か? 概念的な簡単な説明。
決定木には剪定(せんてい)という過程がある。 剪定とは何か? 簡単に紹介。
決定木の分岐(ノード)を作るときどのような計算をしているのか? Gini不純度を計算しているのだが、Gini不純度とは何か?
機械学習をする方法はさまざまある。 代表的な方法は決定木分析である。 そもそも決定木とは何か? 基本的なことをごく簡単に解説。
R でカテゴリデータを集計して、割合を計算する方法。