統計ER

R, EZR, SPSS, KH Coder を使ったデータ分析方法を紹介するブログ。ニッチな内容が多め

基礎知識

機械学習の決定木とは? Gini不純度とは? わかりやすく解説

決定木の分岐(ノード)を作るときどのような計算をしているのか? Gini不純度を計算しているのだが、Gini不純度とは何か?

機械学習による決定木分析 ごく簡単な解説

機械学習をする方法はさまざまある。 代表的な方法は決定木分析である。 そもそも決定木とは何か? 基本的なことをごく簡単に解説。

R で割合を計算する方法

R でカテゴリデータを集計して、割合を計算する方法。

R で skewness や kurtosis を計算する方法

R で skewness や kurtosis を計算する方法。

R の attach とは

R の attach とはどんな関数か?

R のライブラリとは

R でlibrary() ライブラリ はよく使う関数だ。 ライブラリとは?

R にパッケージをインストールする方法

Rは、最初からかなりいろいろなことができる無料統計ソフト。 もっとすごいのは、あとからパッケージをインストールして、さらにいろいろな解析ができるようになること。

R の引用の書き方

R の引用情報を参考文献リストに載せたい。 どのように記載すればよいか?

サンプルサイズが異なる比較は適切か? n数が異なる比較は問題ない? サンプル数が異なる比較はやってもいいの?

まれな疾患の患者さんのデータと、その疾患を持たない患者さんデータを比較しようとすると、人数が大きく異なる。 まれな疾患はデータが集まりにくい。 人数が小さなグループと大きなグループを比較することは問題ないのか?

QQ プロットを R で書く方法

正規確率プロット QQプロット は、正規分布をしているかどうか、目視で確認するための方法。

連続データの 2 群比較を R で行う方法

実験群とコントロール群、リスク因子あり群となし群、介入群と非介入群、など二群比較 を R で実行する方法。

正規分布表の見方 z値とは?課題の問題を解くには?

正規分布表って、どうやって見たらいいんだろうと、悩んでいるあなた。 そもそも何を意味しているのか、どんなときに使うのかさっぱりわからない、というあなた。 そんなあなたを助ける、正規分布表の見方。 よくある課題での使い方も公開。

正規分布のパーセンタイルを計算する方法

平均70点、標準偏差15点のテストの場合、90点以上の学生は上位何パーセントに当たるか? という問題に使うパーセンタイル percentile とクォンタイル quantile。 それぞれ百分位数と分位数ともいわれる。