回帰分析・線形回帰
EZRで回帰直線に95%信頼区間を描きたい場合どうするか? ggplot2 を使うと簡単・きれいに描ける。
EZRで回帰直線のグラフに95%信頼区間を付けるにはどうしたらよいか? predict()を使う。
逆確率重み付けとは、傾向スコアの逆数を用いて、人数があまり多くない層を厚くする方法で、処方の有無の背景をそろえる方法である。 目的変数が連続データの場合でも利用可能だろうか? 答えはYesである。
回帰分析は、さまざまな種類があり、呼び名がわかりにくく混乱してしまう。 回帰分析を一般に線形モデルと呼ぶが、その線形モデルにいろいろな派生形があるということだ。 どれがどんな解析を指しているのか整理してみた。
傾向スコアマッチングは、ある因子についてランダム化していなかった観察研究データにおいて、そのある因子以外は同様にした2つのグループをマッチングで作成する方法である。 目的変数が連続量の場合でも利用可能だろうか? 答えはYesである。
回帰分析をする際に、説明変数や目的変数が正規分布をしていないことで悩んでいる人は多い。 どうして指導者は、「説明変数や目的変数が必ずしも正規分布していなくても大丈夫だよ」と教えてあげないのか?そして、論文査読者は「正規性はチェックしたのか?…
説明変数Xで、目的変数Yを予測する回帰式を作り、回帰分析を行いたい。説明変数Xの目的変数Yに対する寄与率を計算したい。計算式のまとめ。
t検定(平均値の差の検定)、回帰分析・線形回帰、ANOVA(一元配置分散分析)はまったく別物だと思っているならば、ぜひ読んでみてほしい。 きっと目から鱗が落ちるはず。
統計ソフトRで、重回帰分析をするには、lm() という関数を使えばあっという間だ。 しかし、あえて、教科書に載っている行列を使った計算をするとどうなるか? 改めて、重回帰分析がどんなふうに計算されているかがよくわかった。
ある健康指標が地域差がありそうだ。こんなとき健康指標の平均値の差の検定がしたくなるもの。しかし、健康指標の多くは年齢に関係している。そして地域も年齢構成が異なることが多い。 本当に健康指標に差があるのか、それとも単に年齢構成の違いだけか。そ…
二つのデータセットがあって、二つの回帰直線が描けたとき、そのあとどうすればいいか? そのあとは、傾きが同じと言えるか?さらには切片が同じと言えるか?と進んでいく。 二つの回帰直線の差を検定してみる。
統計ソフトRを使えば、回帰直線の分析、つまり単回帰モデルの分析は本当に簡単にできる。 基本に帰って、実際どんな計算をしているか改めて見てみるのもいいかなと思い立った。 単回帰モデルの計算を教科書に沿ってやってみた。
チャイルドシートの売り上げを予測する重回帰モデルを作成した。 統計ソフトRのISLRパッケージCarseatsデータを用いた分析。
燃費を推測する重回帰モデルを作成した。 交互作用項を検討したり、VIFを考慮したり。 統計ソフトRのISLRパッケージを使った分析例。
相関分析と回帰分析はどう違うか? 両方とも2つのデータの関係性を見ているわけで、とても似ている。 相関分析と回帰分析の違いについて、まとめてみる。
多変量解析の基本は、重回帰分析だ。
重回帰分析の前提は、残差が正規分布していることであって、目的変数、説明変数が正規分布していることではない。ゆえに指摘は誤っているが、結果的に残差も正規分布していなかった。その場合の対処法。