統計ER

統計ソフトRの使い方を中心に、統計解析方法の解説をするブログ。ありそうでなかなか見つからないサンプルサイズ計算などニッチな方法について紹介しています。

尤度(ゆうど)とは?

Toukei Consul Banner

KH Coder Consul Banner

読み方も意味しているところも分かりにくい尤度(ゆうど)。

理解したところを共有したい。

尤度と似ている確率とは何か?

まず尤度は確率に似ているものだが、確率とは違う。

まず確率とは何かを、尤度との対比になるような説明を紹介したい。

統計学で考える場合、例えば正規分布しているデータが発生する確率というふうに考える。

この場合、正規分布の母数(パラメータ)として、母平均と母標準偏差(母分散の平方根)が決まっている。

このとき以下のように考えて記述する。確率は英語でProbabilityなので、Pr()と書くことがよくある。| は、その右側のものが得られているときという条件を表している。

 Pr(データ | 母平均, 母標準偏差)

つまり、パラメータが決まっているうえでのデータが発生する確率という記述や言い方、考え方になる。

例えば、偏差値は、平均が50、標準偏差が10の正規分布であるが、このとき偏差値70以上になる確率は、母平均が50、母標準偏差が10とみなしたときの正規分布上の確率という形で計算する。答えは0.023=2.3%である。

> pnorm(q=70, mean=50, sd=10, lower.tail=FALSE)
[1] 0.02275013

尤度を確率と対比するとどうなるか?

尤度は確率と逆の発想と言える。

尤度は、まず取得したデータから物事を考え始める。

あるデータが得られたときに、どんな母数であると、このデータが尤もらしい(もっともらしい)だろうかという度合いが尤度である。

尤度は英語ではLikelihoodと言われるので、L()と書くことがよくある。確率の時と同じく正規分布であることを想定すると以下のように記述できる。

 L(母平均, 母標準偏差 | データ)

つまり、データが得られたうえで、ある母平均や母標準偏差とすると、このくらい尤もらしいという記述、言い方、考え方になる。

尤度はどんなことに役立つのか?

尤度はどんなことに役に立つのだろうか?

尤度はデータの尤もらしさなので、尤もらしさを最大化することが求められるのは想像しやすい。

尤度を最大にするパラメータを探す方法を、最尤(さいゆう)推定法といい、最尤推定法で求められた推定値を最尤推定量と言う。

最尤推定法では、対数尤度(log likelihood,  lnL() または単に l())を使うことが多い。対数をとると計算がしやすくなるからだ。

尤度はデータ1が得られたときの尤度、データ2が得られた時の尤度・・・とすべてのデータにおける尤度を掛け算して計算している。その掛け算を足し算にすることができるのが対数変換である。

対数変換した尤度を、パラメータごとに対して偏微分し、その関数がゼロになる点が、まさに尤度が最大となる点であり、その時のパラメータが求める推定値である。

このように分布やモデルのパラメータを推定することに使っている便利な考え方なのである。

まとめ

尤度とは何かを確率との対比で紹介し、どんなことに役立っているかを説明した。尤度の理解が少しでも進めば。

参考資料

英語ではあるがとてもわかりやすい動画がある。参考まで。

youtu.be

youtu.be

youtu.be

最尤推定量や尤度について、日本語で簡潔に説明しているスライドも参考にした。スライド7枚目から。

http://matuisi.main.jp/wp-content/uploads/2013/05/AIC.pdf