統計ER

R, EZR, SPSS, KH Coder を使ったデータ分析方法を紹介するブログ。ニッチな内容が多め

回帰分析・線形回帰

重回帰分析でカテゴリ変数を使う方法 SPSSの場合 ダミー変数の作り方

重回帰分析で、独立変数にカテゴリ変数を使う方法を解説する。 SPSSでは、ダミー変数を作成しておく必要がある。 ダミー変数とは何か? ダミー変数の作り方は?

重回帰分析の交互作用をSPSSで計算する方法 交互作用項の作り方

重回帰分析に交互作用を含んだ解析をSPSSで計算する方法。 SPSSの重回帰分析では、交互作用項を自動で作ってくれない。 どのように作って、どのように解析すればよいか?

重回帰分析の計算方法

重回帰分析は偏回帰係数を求めて予測式(回帰式)を作り、標準化偏回帰係数の計算、回帰式の有意性の分散分析、決定係数の算出、偏回帰係数の検定、など行うが、実際どんな計算をしているのか? 実際どんな計算をしているかわかると、偏回帰係数や標準化偏回…

回帰分析に必要な仮定

目的変数が正規分布している必要はない。 説明変数も正規分布している必要はない。

重回帰分析のサンプル数計算 サンプルサイズ計算と効果量の求め方

重回帰分析を実施するのにサンプル数はどのくらい必要か? ここでいうサンプル数とは、サンプルサイズのこと。 重回帰分析のサンプルサイズはどのように計算するのか? 重回帰分析の効果量とは何か? >>もう統計で悩むのを終わりにしませんか? ↑1万人以上…

重回帰分析の結果の書き方 ― 論文に書くときどの数値を書くべきか?

教科書的には何を計算するかは決まっているが、論文にどの数値を掲載するかは決まっていない。 そういうときは、実例をもとに、まねするのが良いが、最低限の目安を示す。

重回帰モデルの評価としての決定係数と分散分析

重回帰モデルの評価指標の決定係数と分散分析の検定はどのように使い分ければよいのか?

直交対比とは?

直交対比とは何か?

ggplot で回帰直線を書く方法 geom_smooth を使う方法 95 % 信頼区間を付ける方法

EZRで ggplot2 を使って95%信頼区間と回帰式付き回帰直線を描く方法。 EZRで回帰直線に95%信頼区間を描きたい場合どうするか? ggplot2 を使うと簡単・きれいに描ける。

EZRで回帰直線のグラフに95%信頼区間を付ける方法

EZRで回帰直線のグラフに95%信頼区間を付けるにはどうしたらよいか? predict()を使う。

逆確率重み付けを目的変数が連続データの場合にも使用することはできるか?

逆確率重み付けとは、傾向スコアの逆数を用いて、人数があまり多くない層を厚くする方法で、処方の有無の背景をそろえる方法である。 目的変数が連続データの場合でも利用可能だろうか? 答えはYesである。

線形回帰の種類 回帰モデルの種類

線形回帰の種類をわかりやすく解説。

傾向スコアマッチングを目的変数が連続量の場合にも使用することはできるか?

傾向スコアマッチングは、ある因子についてランダム化していなかった観察研究データにおいて、そのある因子以外は同様にした2つのグループをマッチングで作成する方法である。 目的変数が連続量の場合でも利用可能だろうか? 答えはYesである。

重回帰分析の残差は正規分布している必要がある―SPSSでの確認方法もあり

回帰分析をする際に、説明変数や目的変数が正規分布をしていないことで悩んでいる人は多い。 悩むところはそこじゃない。 重回帰分析では、残差が正規分布している必要がある。

回帰分析の推定値と寄与率の計算 - 単回帰分析

説明変数Xで、目的変数Yを予測する回帰式を作り、回帰分析を行いたい。説明変数Xの目的変数Yに対する寄与率を計算したい。計算式のまとめ。

分散分析と回帰分析の違い t検定と回帰分析の違い

分散分析と回帰分析とt検定は同じものである。

重回帰分析を行列で計算してみる

統計ソフトRで、重回帰分析をするには、lm() という関数を使えばあっという間だ。 しかし、あえて、教科書に載っている行列を使った計算をするとどうなるか? 改めて、重回帰分析がどんなふうに計算されているかがよくわかった。

真の要因か見かけの要因かを見分ける回帰直線の差の検定

ある健康指標が地域差がありそうだ。こんなとき健康指標の平均値の差の検定がしたくなるもの。しかし、健康指標の多くは年齢に関係している。そして地域も年齢構成が異なることが多い。 本当に健康指標に差があるのか、それとも単に年齢構成の違いだけか。そ…

回帰直線の差の検定

二つのデータセットがあって、二つの回帰直線が描けたとき、そのあとどうすればいいか? そのあとは、傾きが同じと言えるか?さらには切片が同じと言えるか?と進んでいく。 二つの回帰直線の差を検定してみる。 >>もう統計で悩むのを終わりにしませんか?…

回帰直線の検定と信頼区間を改めて計算してみる

統計ソフトRを使えば、回帰直線の分析、つまり単回帰モデルの分析は本当に簡単にできる。 基本に帰って、実際どんな計算をしているか改めて見てみるのもいいかなと思い立った。 単回帰モデルの計算を教科書に沿ってやってみた。

統計ソフトRのISLRパッケージCarseatsデータを使った重回帰モデル

チャイルドシートの売り上げを予測する重回帰モデルを作成した。 統計ソフトRのISLRパッケージCarseatsデータを用いた分析。

統計ソフトRのISLRパッケージAutoデータを使った重回帰モデル

燃費を推測する重回帰モデルを作成した。 交互作用項を検討したり、VIFを考慮したり。 統計ソフトRのISLRパッケージを使った分析例。

回帰分析と相関分析の違いは何か?

回帰分析と相関分析はどう違うか? 両方とも2つのデータの関係性を見ているわけで、とても似ている。回帰分析と相関分析の違いについて、まとめてみる。

二値の変数が連続変数の予測因子と考えられる場合

多変量解析の基本は、重回帰分析だ。

回帰分析で正規分布していない場合どうすればよいか?必要なのは残差の正規性

回帰分析で正規分布していない目的変数の場合はどうすればよいか? 残差も正規分布していない場合はどうしたらよいか? >>もう統計で悩むのを終わりにしませんか? ↑1万人以上の医療従事者が購読中