実習 6.4 ある情報によれば、選挙候補者A, B の支持状況は、無作為抽出した 100 人から 58 : 42 であった。この支持状況を知る前の候補者Aの予想は「一様分布」であったが、知った後では 95%HDI はどうなるか? また、その結果から支持状況が完全に二分されているといえるか? そして、再調査の A : B = 57 : 100 からどうなるか?
「実習5.2 HDI で候補者の支持率状況」と同じだが、ここでは離散型で求める。
> pTheta <- rep(1,1000)
> pTheta <- pTheta/sum(pTheta)
> width <- 1/length(pTheta)
> Theta <- seq(from=width/2,to=1-width/2,by=width)
> post <- BernGrid(Theta,pTheta,c(rep(1,58),rep(0,42)))
> post <- BernGrid(Theta,post,c(rep(1,57),rep(0,43)))
最初の調査の事後確率では、0.5 が 95%HDI に含まれるので、支持状況は二分しているとするのは妥当。方や 2 度目では含まれず、候補A有利に傾いている。
ここでの結果は、連続型で同じ問題を求めた実習5.2とほぼ一致している。
実習 6.5 ある工場で生産される部品の故障率が 10% 以下であることを会社の CEO に証明したい。無作為抽出した部品 500 個のうち 28 に欠陥があった。過去の稼働データはないものとして、故障率を求めよ。
ここで事前確率は一つには限定されない。今回は「工場の品質に懐疑的な CEO」を想定する。つまり「CEO はの工場の品質は高くない」という仮定。説得する相手が納得する事前確率でなければ説得力は低い。これは、臨機応変に設定できる事前確率の面白い点だと思う。
「頻度主義者」には、そんな事前確率に理解を示さない方々がいます。
ここでの事前確率は、1,000 個の θ が減少するモデルを仮定。
> pTheta <- 1000:1
> pTheta <- pTheta/sum(pTheta)
> width <- 1/length(pTheta)
> Theta <- seq(from=width/2,to=1-width/2,by=width)
> setwd("/Users/rinda/ProgramsDoingBayesianDataAnalysis")
> source(file="BernGrid.R")
> BernGrid(Theta,pTheta,c(rep(1,28),rep(0,500-28)))
左のグラフは、事後確率(上記グラフの 3 番目)を拡大したもの。
95%HDI [ 0.038, 0.078 ] 、平均値 0.0577
故障率は約 5.8% で、10% 以下であることは HDI からも明らか(10% は HDI の外)。
「実習6.6-7 事後確率 Odds」に続く。



0 件のコメント:
コメントを投稿