統計ER

R, EZR, SPSS, KH Coder を使ったデータ分析方法を紹介するブログ。ニッチな内容が多め

R

R coxph の使い方 ― 生存時間データの分析方法

Coxの比例ハザードモデル(コックスの比例ハザードモデル、Cox回帰、コックス回帰など表示・呼び名はたくさんあるが皆同じものを指している)は、生存時間とイベントデータを多変量解析できる統計モデルだ。 注目したい要因が、他の要因と相関があり、また他…

ログランク検定を R で行う方法

ログランク検定とは、生存時間解析で、二群以上のグループがある場合に、グループ間で統計学的に差があるかを検討する方法。 R での方法を解説。

R によるカプランマイヤー曲線の書き方 survfit を使ったグループごとの曲線 

Rでカプランマイヤー曲線を書く方法の紹介。 survfit を使ったグループごとの曲線の書き方。

R でクラスタリングを行う方法

R で階層型クラスタリングを行う方法。

ユークリッド距離 二次元表示

二次元でユークリッド距離を図示してみた。

ユークリッド距離とは? 求め方の例

ユークリッドは紀元前325年に生まれたギリシャの数学者。 著した著書は数学のなかでも特に幾何学の教科書として有名であった。 ユークリッドが考え出した「距離」とは?

カッパ係数 3 人以上の場合 フライスのカッパ係数 Fleiss' kappa

フライス(Fleiss)のカッパ係数(kappa)は、3人以上の評価者の評価が一致している度合いを測定する係数。

カッパ係数を R で計算する方法 Cohen’s Kappa

二人の評価者のカテゴリ評価の一致度を見るのがいわゆるカッパ係数だ。 カッパはギリシャ文字のkのカッパ(κ)のこと。 Jacob Cohen先生が発明したので、Cohen's Kappaと呼ばれる。 これを R で計算してみようと思う。

ブランド アルトマン 分析を R で行う方法

ブランド アルトマン 分析は、二つの測定系の結果が一致しているかどうかを確認する方法。 ブランド アルトマン プロットに、回帰直線を合わせると不一致に傾向がないかどうか確認できる。

ウィルソンのスコア法 信頼区間の計算方法

点推定値が100%に近いとき、より適切に割合の信頼区間を計算する方法 Wilson's score method(ウィルソンのスコア法)の解説。

R のグラフの一部を塗りつぶす方法

グラフを描いた後、一部を塗りつぶしたいときがある。 そんなときにどうしたらいいか?

Greenhouse-Geisser 補正と Huynh-Feldt 補正の違い

Greenhouse-Geisser 補正と Huynh-Feldt 補正の違いの解説。

二元配置分散分析で交互作用がある場合

二元配置分散分析で交互作用があるデータを R で分析する方法。

分割プロット分散分析 反復測定分散分析を R で行う方法

分割プロット分散分析 split-plot design 、群分けのある反復測定分散分析を R で行う方法。

Rで二元配置分散分析を行う方法

Rで二元配置分散分析 はどうやるか? 二元配置は、二つの要因があるという意味。 二つの要因があるというのは、例えば、要因Aは3グループにわかれて、各グループごとに要因Bが1から5を持っている、みたいな状態だ。 Step by step でやってみたのと、lm() で…

R で一元配置分散分析

Rで、一元配置分散分析を step by step で計算してみた。 lm() と Anova() を使えばあっという間だが、具体的な一つ一つの計算を自分で組み立ててみるとどうか? 教科書の例題に沿って確認した。

回帰直線の差の検定

二つのデータセットがあって、二つの回帰直線が描けたとき、そのあとどうすればいいか? そのあとは、傾きが同じと言えるか?さらには切片が同じと言えるか?と進んでいく。 二つの回帰直線の差を検定してみる。 >>もう統計で悩むのを終わりにしませんか?…

相関係数のメタアナリシス

相関係数を統合したい場合はどうやるか? R での方法。

相関係数の検定と信頼区間

R で相関係数の検定と推定は cor.test() でできるが、個々のデータが必要だ。 個々のデータを使わなくても、検定や推定はできないだろうか?

メタ解析のやり方 平均値の差のメタ解析

平均値の差のメタ解析のやり方を解説。

R のテキストマイニングのやり方

Rでテキストマイニングするやり方。 ワードクラウドを描く方法。 >>もう統計で悩むのを終わりにしませんか? ↑1万人以上の医療従事者が購読中

部分的最小二乗回帰を R で実行する方法

部分的最小二乗回帰を R で実行する方法の解説

Rで主成分分析を行う方法

主成分分析は、たくさんの変数を、合成変数に集約する分析。 主役級の主成分から第一主成分、第二主成分、、、と呼ばれる。 たくさんの変数を、いくつかの主成分でまとめると、情報がまとまって考えやすくなる。

エラスティックネットを R で実行する方法

エラスティックネットを簡単に解説 R で実行する方法も解説

SVM の C パラメータについて

SVM(サポートベクターマシン)のコストパラメータ C について。

ランダムフォレストの最適化

ランダムフォレストはチューニングして最適化する。 チューニングは決定木を最適化する方法。 ランダムフォレストの場合は、決定木の数と特徴量(説明変数)の数を最適化する。

Rでランダムフォレストを行う方法 重要度の可視化も

R でランダムフォレストを実行する方法。

バギング アンサンブル学習を R で

バギングというアンサンブル学習を R でやってみる。

決定木分析をRで行うには? partykitを使う方法

決定木分析をRで行う方法を紹介。 難しいプログラムが組めなくてもすぐに使える。

Rで機械学習 ロジスティック回帰 線形判別分析 二次判別分析 k近傍法

機械学習で、よりよく推測できるモデルを選ぶ。 統計ソフトRのISLRパッケージのWeeklyデータで基礎的な機械学習を行ってみた。