R
Coxの比例ハザードモデル(コックスの比例ハザードモデル、Cox回帰、コックス回帰など表示・呼び名はたくさんあるが皆同じものを指している)は、生存時間とイベントデータを多変量解析できる統計モデルだ。 注目したい要因が、他の要因と相関があり、また他…
ログランク検定とは、生存時間解析で、二群以上のグループがある場合に、グループ間で統計学的に差があるかを検討する方法。 R での方法を解説。
Rでカプランマイヤー曲線を書く方法の紹介。 survfit を使ったグループごとの曲線の書き方。
R で階層型クラスタリングを行う方法。
二次元でユークリッド距離を図示してみた。
ユークリッドは紀元前325年に生まれたギリシャの数学者。 著した著書は数学のなかでも特に幾何学の教科書として有名であった。 ユークリッドが考え出した「距離」とは?
フライス(Fleiss)のカッパ係数(kappa)は、3人以上の評価者の評価が一致している度合いを測定する係数。
二人の評価者のカテゴリ評価の一致度を見るのがいわゆるカッパ係数だ。 カッパはギリシャ文字のkのカッパ(κ)のこと。 Jacob Cohen先生が発明したので、Cohen's Kappaと呼ばれる。 これを R で計算してみようと思う。
ブランド アルトマン 分析は、二つの測定系の結果が一致しているかどうかを確認する方法。 ブランド アルトマン プロットに、回帰直線を合わせると不一致に傾向がないかどうか確認できる。
点推定値が100%に近いとき、より適切に割合の信頼区間を計算する方法 Wilson's score method(ウィルソンのスコア法)の解説。
グラフを描いた後、一部を塗りつぶしたいときがある。 そんなときにどうしたらいいか?
Greenhouse-Geisser 補正と Huynh-Feldt 補正の違いの解説。
二元配置分散分析で交互作用があるデータを R で分析する方法。
分割プロット分散分析 split-plot design 、群分けのある反復測定分散分析を R で行う方法。
Rで二元配置分散分析 はどうやるか? 二元配置は、二つの要因があるという意味。 二つの要因があるというのは、例えば、要因Aは3グループにわかれて、各グループごとに要因Bが1から5を持っている、みたいな状態だ。 Step by step でやってみたのと、lm() で…
Rで、一元配置分散分析を step by step で計算してみた。 lm() と Anova() を使えばあっという間だが、具体的な一つ一つの計算を自分で組み立ててみるとどうか? 教科書の例題に沿って確認した。
二つのデータセットがあって、二つの回帰直線が描けたとき、そのあとどうすればいいか? そのあとは、傾きが同じと言えるか?さらには切片が同じと言えるか?と進んでいく。 二つの回帰直線の差を検定してみる。 >>もう統計で悩むのを終わりにしませんか?…
相関係数を統合したい場合はどうやるか? R での方法。
R で相関係数の検定と推定は cor.test() でできるが、個々のデータが必要だ。 個々のデータを使わなくても、検定や推定はできないだろうか?
平均値の差のメタ解析のやり方を解説。
Rでテキストマイニングするやり方。 ワードクラウドを描く方法。 >>もう統計で悩むのを終わりにしませんか? ↑1万人以上の医療従事者が購読中
部分的最小二乗回帰を R で実行する方法の解説
主成分分析は、たくさんの変数を、合成変数に集約する分析。 主役級の主成分から第一主成分、第二主成分、、、と呼ばれる。 たくさんの変数を、いくつかの主成分でまとめると、情報がまとまって考えやすくなる。
エラスティックネットを簡単に解説 R で実行する方法も解説
SVM(サポートベクターマシン)のコストパラメータ C について。
ランダムフォレストはチューニングして最適化する。 チューニングは決定木を最適化する方法。 ランダムフォレストの場合は、決定木の数と特徴量(説明変数)の数を最適化する。
R でランダムフォレストを実行する方法。
バギングというアンサンブル学習を R でやってみる。
決定木分析をRで行う方法を紹介。 難しいプログラムが組めなくてもすぐに使える。
機械学習で、よりよく推測できるモデルを選ぶ。 統計ソフトRのISLRパッケージのWeeklyデータで基礎的な機械学習を行ってみた。