基礎知識
決定木の分岐(ノード)を作るときどのような計算をしているのか? Gini不純度を計算しているのだが、Gini不純度とは何か?
機械学習をする方法はさまざまある。 代表的な方法は決定木分析である。 そもそも決定木とは何か? 基本的なことをごく簡単に解説。
R でカテゴリデータを集計して、割合を計算する方法。
R で skewness や kurtosis を計算する方法。
R の attach とはどんな関数か?
R でlibrary() ライブラリ はよく使う関数だ。 ライブラリとは?
Rは、最初からかなりいろいろなことができる無料統計ソフト。 もっとすごいのは、あとからパッケージをインストールして、さらにいろいろな解析ができるようになること。
R の引用情報を参考文献リストに載せたい。 どのように記載すればよいか?
まれな疾患の患者さんのデータと、その疾患を持たない患者さんデータを比較しようとすると、人数が大きく異なる。 まれな疾患はデータが集まりにくい。 人数が小さなグループと大きなグループを比較することは問題ないのか?
正規確率プロット QQプロット は、正規分布をしているかどうか、目視で確認するための方法。
実験群とコントロール群、リスク因子あり群となし群、介入群と非介入群、など二群比較 を R で実行する方法。
正規分布表って、どうやって見たらいいんだろうと、悩んでいるあなた。 そもそも何を意味しているのか、どんなときに使うのかさっぱりわからない、というあなた。 そんなあなたを助ける、正規分布表の見方。 よくある課題での使い方も公開。
平均70点、標準偏差15点のテストの場合、90点以上の学生は上位何パーセントに当たるか? という問題に使うパーセンタイル percentile とクォンタイル quantile。 それぞれ百分位数と分位数ともいわれる。