2018-09-01から1ヶ月間の記事一覧
部分的最小二乗回帰を R で実行する方法の解説
主成分分析は、たくさんの変数を、合成変数に集約する分析。 主役級の主成分から第一主成分、第二主成分、、、と呼ばれる。 たくさんの変数を、いくつかの主成分でまとめると、情報がまとまって考えやすくなる。
エラスティックネットを簡単に解説 R で実行する方法も解説
SVM(サポートベクターマシン)のコストパラメータ C について。
機械学習の分類手法の一つ、サポートベクターマシンとは何か?
ランダムフォレストはチューニングして最適化する。 チューニングは決定木を最適化する方法。 ランダムフォレストの場合は、決定木の数と特徴量(説明変数)の数を最適化する。
R でランダムフォレストを実行する方法。
バギングというアンサンブル学習を R でやってみる。
ランダムフォレストとバギングは、決定木をより汎用化するために考えられた手法。 違いは何か? 概念的な簡単な説明。
決定木分析をRで行う方法を紹介。 難しいプログラムが組めなくてもすぐに使える。
決定木には剪定(せんてい)という過程がある。 剪定とは何か? 簡単に紹介。
決定木の分岐(ノード)を作るときどのような計算をしているのか? Gini不純度を計算しているのだが、Gini不純度とは何か?
機械学習をする方法はさまざまある。 代表的な方法は決定木分析である。 そもそも決定木とは何か? 基本的なことをごく簡単に解説。
標本の大きさの求め方。エクセルを使う方法。 サンプルサイズ計算をエクセルで行う方法。 なかなか探しても見つからないサンプルサイズ計算がここでは見つかる!!
機械学習で、よりよく推測できるモデルを選ぶ。 統計ソフトRのISLRパッケージのWeeklyデータで基礎的な機械学習を行ってみた。
R の ISLR パッケージの Auto データセットを使った分析例。