2015年10月15日木曜日

ベイズの基礎:β 分布による推定

課題17-3 β 分布の決定方法 からの続き。

テキストの課題 17-4 の後にある "Inference using a beta curve" に沿って、ベータ分布を事前確率にした母集団の推定(事後確率の算出)を行う。算出方法は、これまで行ったベイズルールと変わらない。違うのは、事前確率と事後確率がベータ分布ということ。

課題は 17-3 を使う
ある特定の大学で欧州の国に行ったことがある生徒の割合を求める。

事前確率は beta(1, 4)、無作為抽出したデータから「10 人生徒のうち 人が行ったことがある」。


ベータ分布による推定

ベータ確率密度関数は
この関数から事後確率を求める。

事前確率:PRIOR = Beta(1, 4) = p1-1(1 - p)4-1
尤度  :LIKELIHOOD = p3(1 - p)7
事後確率:POST = PRIOR × LIKELIHOOD
           = p1-1(1 - p)4-1 ×  p3(1 - p)7
     p4-1(1 - p)11-1


この事後確率を簡単に求める方法は
beta(a, b) で、サンプルデータが (uccesses),  (ailures) の場合は beta(a+s, b+f)

よって今回は beta(1+3, 4+7) = beta(4, 11)求まる。

以下はベータ分布の例。 POST beta(4.11) で、10から 30近辺の確率が高いことが分かる。
> par(mfrow=c(2,1))
> curve(dbeta(x,1,4), from=0, to=1, n=101, xlab="p", ylab="")
> text(0.6,3,"PRIOR beta(1,4)")
> curve(dbeta(x,4,11), from=0, to=1, n=101, xlab="p", ylab="")
> text(0.6,3,"POST beta(4,11)")


トピック18へ

トピック17 Learning About a Proportion Using Continuous Models はこれで終わる。課題は 17-17 まであるが、解法や考え方は同じパターンなので、割愛することにした。とはいえそれらの課題は、ベータ分布を使ったベイズルールの適用、データ分析としての見方を訓練するには役立ちます。

正規分布は最初にあらず に続く。

0 件のコメント:

コメントを投稿