2015年10月18日日曜日

ベイズの基礎:課題19-1 連続型なら塗りつぶし

課題18-5,10 正規分布なの? からの続き。

ここからトピック19

Learning About a Mean Using Continuous Models

タイトルから分かるように、トピック18では離散型の正規分布を扱ったが、ここでは連続型。個人的には、離散型は抜きにこの連続型だけで良かったのではと思う。とはいえ、このような説明で理解が深まるのも確かだろう。連続型は最初は理解しにくい。


Activity 19-1: Finding Areas Under a Normal Curve

課題:平均 100、標準偏差 15IQ (Intelligence Quotients) 値の分布から、以下の確率を求める。
> length(seq(40,160,by=5))
[1] 25
> curve(dnorm(x,100,15),from=40,to=160,n=25)

IQ 90 より低い確率:約25.3%
> pnorm(90,100,15)
[1] 0.2525

IQ 110 より低い確率:約74.8%
> pnorm(110,100,15)
[1] 0.7475

IQ100 から 110 の確率:約49.5%
> pnorm(110,100,15) - pnorm(90,100,15)
[1] 0.495

IQ120 より高い確率:約9.1%
> 1 - pnorm(120,100,15)
[1] 0.09121

IQ85 から 120 の確率:約75.0%
> pnorm(120,100,15) - pnorm(85,100,15)
[1] 0.7501


塗りつぶし

トピック18の離散型と違って、連続型は分布を塗りつぶせます。課題17-2 でベータ分布の区間を塗りつぶした手順で、次の正規分布の「下位10%区間」「上位10%区間」を塗りつぶす。

平均 25, 標準偏差 8
> qnorm(c(0.1,0.9),25,8)
[1] 14.74759 35.25241
> curve(dnorm(x,25,8),from=0,to=50,n=51,xlab="M",ylab="",
        main="10th and 90th percentiles of a normal curve")
> m <- qnorm(c(0.1,0.9),25,8)
> m1 <- seq(0,m[1],by=m[1]/49)
> m2 <- seq(m[2],50,by=0.3)
> mval1 <- c(m1,rev(m1))
> yval1 <- c(rep(0,50),dnorm(rev(m1),25,8))
> polygon(mval1,yval1,col="red",density=20,angle=-45)
> mval2 <- c(m2,rev(m2))
> yval2 <- c(rep(0,50),dnorm(rev(m2),25,8))
> polygon(mval2,yval2,col="red",density=20,angle=-45)
> text(5,0.04,"Lower 10%", col="red")
> text(45,0.04,"Upper 10%", col="red")

事前確率に一様分布 に続く。

0 件のコメント:

コメントを投稿