統計ER

R, EZR, SPSS, KH Coder を使ったデータ分析方法を紹介するブログ。ニッチな内容が多め

2018-01-01から1年間の記事一覧

R のテキストマイニングのやり方

Rでテキストマイニングするやり方。 ワードクラウドを描く方法。 >>もう統計で悩むのを終わりにしませんか? ↑1万人以上の医療従事者が購読中

KHコーダーの使い方 ― インストール方法 データの読み込み 共起ネットワーク図

KH Coderは、立命館大学の先生が作成し無料で提供しているソフトウェア。 特に、図示表現が秀逸。 難しいこと抜きでパッときれいな図ができる。

部分的最小二乗回帰を R で実行する方法

部分的最小二乗回帰を R で実行する方法の解説

Rで主成分分析を行う方法

主成分分析は、たくさんの変数を、合成変数に集約する分析。 主役級の主成分から第一主成分、第二主成分、、、と呼ばれる。 たくさんの変数を、いくつかの主成分でまとめると、情報がまとまって考えやすくなる。

エラスティックネットを R で実行する方法

エラスティックネットを簡単に解説 R で実行する方法も解説

SVM の C パラメータについて

SVM(サポートベクターマシン)のコストパラメータ C について。

サポートベクターマシンとは?ごく簡単に解説

機械学習の分類手法の一つ、サポートベクターマシンとは何か?

ランダムフォレストの最適化

ランダムフォレストはチューニングして最適化する。 チューニングは決定木を最適化する方法。 ランダムフォレストの場合は、決定木の数と特徴量(説明変数)の数を最適化する。

Rでランダムフォレストを行う方法 重要度の可視化も

R でランダムフォレストを実行する方法。

バギング アンサンブル学習を R で

バギングというアンサンブル学習を R でやってみる。

ランダムフォレストとバギングの違い

ランダムフォレストとバギングは、決定木をより汎用化するために考えられた手法。 違いは何か? 概念的な簡単な説明。

決定木分析をRで行うには? partykitを使う方法

決定木分析をRで行う方法を紹介。 難しいプログラムが組めなくてもすぐに使える。

決定木の過学習を防ぐ剪定とは? 剪定とは枝刈りのこと

決定木には剪定(せんてい)という過程がある。 剪定とは何か? 簡単に紹介。

機械学習の決定木とは? Gini不純度とは? わかりやすく解説

決定木の分岐(ノード)を作るときどのような計算をしているのか? Gini不純度を計算しているのだが、Gini不純度とは何か?

機械学習による決定木分析 ごく簡単な解説

機械学習をする方法はさまざまある。 代表的な方法は決定木分析である。 そもそも決定木とは何か? 基本的なことをごく簡単に解説。

標本の大きさの求め方 エクセルを使う方法 サンプルサイズ計算をエクセルで

標本の大きさの求め方。エクセルを使う方法。 サンプルサイズ計算をエクセルで行う方法。 なかなか探しても見つからないサンプルサイズ計算がここでは見つかる!!

Rで機械学習 ロジスティック回帰 線形判別分析 二次判別分析 k近傍法

機械学習で、よりよく推測できるモデルを選ぶ。 統計ソフトRのISLRパッケージのWeeklyデータで基礎的な機械学習を行ってみた。

R の ISLR パッケージ Auto データセットを使った重回帰分析

R の ISLR パッケージの Auto データセットを使った分析例。

NNH 統計計算

有害必要数(Number Needed to Harm, NNH)は、1人の有害事象が起こる人が出現するのに、何かの影響を受けた人が何人必要かという数。

罹患率比の求め方

罹患率比の計算は、どうやるのか? R での計算の方法。

回帰分析と相関分析の違いは何か?

回帰分析と相関分析はどう違うか? 両方とも2つのデータの関係性を見ているわけで、とても似ている。回帰分析と相関分析の違いについて、まとめてみる。

R でロジスティック回帰分析の変数選択

Rを使って、 多重ロジスティック回帰分析でBICを使って、 簡単に変数選択ができる。

R の重回帰分析における変数選択の方法

R で重回帰分析を行った際の変数選択の方法の解説。

R で 箱ひげ図を書く方法

R で箱ひげ図を描くにはどうしたらいいか?

ログランク検定のサンプルサイズ計算

ログランク検定のサンプルサイズ計算を R で行う方法

級内相関係数のサンプルサイズ計算 ICC(2,1) の場合

級内相関係数 ICC Case2 の計算とサンプルサイズ計算を R でやってみた

級内相関係数のサンプルサイズ計算 ICC(1,1) の場合

ICC(1,1) の計算とサンプルサイズ計算を R で行う方法

トレンド検定のサンプルサイズ計算

トレンド検定のサンプルサイズ計算。

ダネット検定のサンプルサイズ計算

ダネット検定のサンプルサイズ計算を R で行う方法

共分散分析で多重比較をする方法

三群以上の平均値を多重比較したい。 でも各群の背景因子がそろっていない。 背景因子を調整しながら三群以上の平均値を多重比較するにはどうすればいいか? R でのやり方を解説する。