統計ER

R, EZR, SPSS, KH Coder を使ったデータ分析方法を紹介するブログ。ニッチな内容が多め

回帰分析・線形回帰

SPSSの重回帰分析での交互作用項の作り方と解析の仕方

SPSSの重回帰では、交互作用項を自動では作ってくれない。 どのように作って、どのように解析すればよいか?

重回帰分析はどういう計算をしているのか?

重回帰分析は偏回帰係数を求めて予測式(回帰式)を作り、標準化偏回帰係数の計算、回帰式の有意性の分散分析、決定係数の算出、偏回帰係数の検定、など行うが、実際どんな計算をしているのか? 実際どんな計算をしているかわかると、偏回帰係数や標準化偏回…

回帰分析に必要な仮定

目的変数が正規分布している必要はない。 説明変数も正規分布している必要はない。

重回帰分析の効果量とサンプルサイズ計算

重回帰分析のサンプルサイズはどのように計算するのか? 重回帰分析の効果量とは何か?

回帰分析の結果を論文に書くときどの数値を書くべきか?

教科書的には何を計算するかは決まっているが、論文にどの数値を掲載するかは決まっていないように思える。 そういうときは、実例をもとに、まねするのが良い。

重回帰モデルの評価としての決定係数と分散分析

重回帰モデルの評価指標の決定係数と分散分析の検定はどのように使い分ければよいのか?

直交対比 orthogonal contrast とは?

直交対比 orthogonal contrast とは何だろうか?

EZRで ggplot2 を使って95%信頼区間と回帰式付き回帰直線を描く方法

EZRで回帰直線に95%信頼区間を描きたい場合どうするか? ggplot2 を使うと簡単・きれいに描ける。

EZRで回帰直線のグラフに95%信頼区間を付ける方法

EZRで回帰直線のグラフに95%信頼区間を付けるにはどうしたらよいか? predict()を使う。

逆確率重み付けを目的変数が連続データの場合にも使用することはできるか?

逆確率重み付けとは、傾向スコアの逆数を用いて、人数があまり多くない層を厚くする方法で、処方の有無の背景をそろえる方法である。 目的変数が連続データの場合でも利用可能だろうか? 答えはYesである。

線形モデル linear model の分類が知りたい

回帰分析は、さまざまな種類があり、呼び名がわかりにくく混乱してしまう。 回帰分析を一般に線形モデルと呼ぶが、その線形モデルにいろいろな派生形があるということだ。 どれがどんな解析を指しているのか整理してみた。

傾向スコアマッチングを目的変数が連続量の場合にも使用することはできるか?

傾向スコアマッチングは、ある因子についてランダム化していなかった観察研究データにおいて、そのある因子以外は同様にした2つのグループをマッチングで作成する方法である。 目的変数が連続量の場合でも利用可能だろうか? 答えはYesである。

回帰分析の説明変数や目的変数は正規分布していなくてもよいか?

回帰分析をする際に、説明変数や目的変数が正規分布をしていないことで悩んでいる人は多い。 悩むところはそこじゃない。

回帰分析の推定値と寄与率の計算 - 単回帰分析

説明変数Xで、目的変数Yを予測する回帰式を作り、回帰分析を行いたい。説明変数Xの目的変数Yに対する寄与率を計算したい。計算式のまとめ。

t検定、回帰分析・線形回帰、ANOVAは、みなつながっている

t検定(平均値の差の検定)、回帰分析・線形回帰、ANOVA(一元配置分散分析)はまったく別物だと思っているならば、ぜひ読んでみてほしい。 きっと目から鱗が落ちるはず。

重回帰分析を行列で計算してみる

統計ソフトRで、重回帰分析をするには、lm() という関数を使えばあっという間だ。 しかし、あえて、教科書に載っている行列を使った計算をするとどうなるか? 改めて、重回帰分析がどんなふうに計算されているかがよくわかった。

真の要因か見かけの要因かを見分ける回帰直線の差の検定

ある健康指標が地域差がありそうだ。こんなとき健康指標の平均値の差の検定がしたくなるもの。しかし、健康指標の多くは年齢に関係している。そして地域も年齢構成が異なることが多い。 本当に健康指標に差があるのか、それとも単に年齢構成の違いだけか。そ…

二つの回帰直線の差の検定

二つのデータセットがあって、二つの回帰直線が描けたとき、そのあとどうすればいいか? そのあとは、傾きが同じと言えるか?さらには切片が同じと言えるか?と進んでいく。 二つの回帰直線の差を検定してみる。

回帰直線の検定と信頼区間を改めて計算してみる

統計ソフトRを使えば、回帰直線の分析、つまり単回帰モデルの分析は本当に簡単にできる。 基本に帰って、実際どんな計算をしているか改めて見てみるのもいいかなと思い立った。 単回帰モデルの計算を教科書に沿ってやってみた。

統計ソフトRのISLRパッケージCarseatsデータを使った重回帰モデル

チャイルドシートの売り上げを予測する重回帰モデルを作成した。 統計ソフトRのISLRパッケージCarseatsデータを用いた分析。

統計ソフトRのISLRパッケージAutoデータを使った重回帰モデル

燃費を推測する重回帰モデルを作成した。 交互作用項を検討したり、VIFを考慮したり。 統計ソフトRのISLRパッケージを使った分析例。

相関分析と回帰分析の違いは何か?

相関分析と回帰分析はどう違うか? 両方とも2つのデータの関係性を見ているわけで、とても似ている。 相関分析と回帰分析の違いについて、まとめてみる。

二値の変数が連続変数の予測因子と考えられる場合

多変量解析の基本は、重回帰分析だ。

「目的変数が正規分布していないのであれば重回帰分析は不適切」への対処法

重回帰分析の前提は、残差が正規分布していることであって、目的変数、説明変数が正規分布していることではない。ゆえに指摘は誤っているが、結果的に残差も正規分布していなかった。その場合の対処法。