2018-01-01から1年間の記事一覧
Rでテキストマイニングするやり方。 ワードクラウドを描く方法。 >>もう統計で悩むのを終わりにしませんか? ↑1万人以上の医療従事者が購読中
KH Coderは、立命館大学の先生が作成し無料で提供しているソフトウェア。 特に、図示表現が秀逸。 難しいこと抜きでパッときれいな図ができる。
部分的最小二乗回帰を R で実行する方法の解説
主成分分析は、たくさんの変数を、合成変数に集約する分析。 主役級の主成分から第一主成分、第二主成分、、、と呼ばれる。 たくさんの変数を、いくつかの主成分でまとめると、情報がまとまって考えやすくなる。
エラスティックネットを簡単に解説 R で実行する方法も解説
SVM(サポートベクターマシン)のコストパラメータ C について。
機械学習の分類手法の一つ、サポートベクターマシンとは何か?
ランダムフォレストはチューニングして最適化する。 チューニングは決定木を最適化する方法。 ランダムフォレストの場合は、決定木の数と特徴量(説明変数)の数を最適化する。
R でランダムフォレストを実行する方法。
バギングというアンサンブル学習を R でやってみる。
ランダムフォレストとバギングは、決定木をより汎用化するために考えられた手法。 違いは何か? 概念的な簡単な説明。
決定木分析をRで行う方法を紹介。 難しいプログラムが組めなくてもすぐに使える。
決定木には剪定(せんてい)という過程がある。 剪定とは何か? 簡単に紹介。
決定木の分岐(ノード)を作るときどのような計算をしているのか? Gini不純度を計算しているのだが、Gini不純度とは何か?
機械学習をする方法はさまざまある。 代表的な方法は決定木分析である。 そもそも決定木とは何か? 基本的なことをごく簡単に解説。
標本の大きさの求め方。エクセルを使う方法。 サンプルサイズ計算をエクセルで行う方法。 なかなか探しても見つからないサンプルサイズ計算がここでは見つかる!!
機械学習で、よりよく推測できるモデルを選ぶ。 統計ソフトRのISLRパッケージのWeeklyデータで基礎的な機械学習を行ってみた。
R の ISLR パッケージの Auto データセットを使った分析例。
有害必要数(Number Needed to Harm, NNH)は、1人の有害事象が起こる人が出現するのに、何かの影響を受けた人が何人必要かという数。
罹患率比の計算は、どうやるのか? R での計算の方法。
回帰分析と相関分析はどう違うか? 両方とも2つのデータの関係性を見ているわけで、とても似ている。回帰分析と相関分析の違いについて、まとめてみる。
Rを使って、 多重ロジスティック回帰分析でBICを使って、 簡単に変数選択ができる。
R で重回帰分析を行った際の変数選択の方法の解説。
R で箱ひげ図を描くにはどうしたらいいか?
ログランク検定のサンプルサイズ計算を R で行う方法
級内相関係数 ICC Case2 の計算とサンプルサイズ計算を R でやってみた
ICC(1,1) の計算とサンプルサイズ計算を R で行う方法
トレンド検定のサンプルサイズ計算。
ダネット検定のサンプルサイズ計算を R で行う方法
三群以上の平均値を多重比較したい。 でも各群の背景因子がそろっていない。 背景因子を調整しながら三群以上の平均値を多重比較するにはどうすればいいか? R でのやり方を解説する。