りんだろぐ rindalog: 実習6.4-5 懐疑的なCEOの事前確率

「実習6.1-3 離散型でのR実装例」からの続き。

実習 6.4 ある情報によれば、選挙候補者A, B の支持状況は、無作為抽出した 100 人から 58 : 42 であった。この支持状況を知る前の候補者Aの予想は「一様分布」であったが、知った後では 95%HDI はどうなるか？また、その結果から支持状況が完全に二分されているといえるか？そして、再調査の A : B = 57 : 100 からどうなるか？

「実習5.2 HDI で候補者の支持率状況」と同じだが、ここでは離散型で求める。

> pTheta <- rep(1,1000)
> pTheta <- pTheta/sum(pTheta)
> width <- 1/length(pTheta)
> Theta <- seq(from=width/2,to=1-width/2,by=width)
> post <- BernGrid(Theta,pTheta,c(rep(1,58),rep(0,42)))
> post <- BernGrid(Theta,post,c(rep(1,57),rep(0,43)))

最初の調査の事後確率では、0.5 が 95%HDI に含まれるので、支持状況は二分しているとするのは妥当。方や 2 度目では含まれず、候補A有利に傾いている。

ここでの結果は、連続型で同じ問題を求めた実習5.2とほぼ一致している。

実習 6.5 ある工場で生産される部品の故障率が 10% 以下であることを会社の CEO に証明したい。無作為抽出した部品 500 個のうち 28 に欠陥があった。過去の稼働データはないものとして、故障率を求めよ。

ここで事前確率は一つには限定されない。今回は「工場の品質に懐疑的な CEO」を想定する。つまり「CEO はの工場の品質は高くない」という仮定。説得する相手が納得する事前確率でなければ説得力は低い。これは、臨機応変に設定できる事前確率の面白い点だと思う。

「頻度主義者」には、そんな事前確率に理解を示さない方々がいます。

ここでの事前確率は、1,000 個の θ が減少するモデルを仮定。

> pTheta <- 1000:1
> pTheta <- pTheta/sum(pTheta)
> width <- 1/length(pTheta)
> Theta <- seq(from=width/2,to=1-width/2,by=width)
> setwd("/Users/rinda/ProgramsDoingBayesianDataAnalysis")
> source(file="BernGrid.R")
> BernGrid(Theta,pTheta,c(rep(1,28),rep(0,500-28)))

左のグラフは、事後確率（上記グラフの 3 番目）を拡大したもの。

　95%HDI [ 0.038, 0.078 ] 、平均値 0.0577

故障率は約 5.8% で、10% 以下であることは HDI からも明らか（10% は HDI の外）。

「実習6.6-7 事後確率 Odds」に続く。

りんだろぐ rindalog

2015年10月31日土曜日

実習6.4-5 懐疑的なCEOの事前確率

0 件のコメント:

コメントを投稿