本投稿は「Doing Bayesian Data Analysis」の「5.3.1 Estimating the binomial proportion」を元にした。
次の二つのグラフ(Figure 5.2)のセットは、本書提供スクリプトの BernBeta.R の実行結果。二つの尤度、観測データは同じで、違いは事前確率 ベータ関数の引数。
> BernBeta(c(1,1),c(rep(1,11),rep(0,14-11)))
> BernBeta(c(100,100),c(rep(1,11),rep(0,14-11)))
HDIについては「HDI (Highest Density Interval)」を参照。
これは「コイン投げで表の出る確率の推定」。左の例では、事前確率が一様分布で「何の事前情報なし」。右の例では「0.5 を高く確信」している事前確率。観測データは「試行回数 14 のうち 表 (z) が 11 回」。左の事後確率は観測データの影響を受けて、右側に偏った(表が出やすい)分布となった。方や右側の事後確率は事前確率とほとんど変化はない。
ROPE
The 95% HDI is also one way for declaring which values of the parameter are deemed “credible”.
95%HDI はパラメーターの値として信頼できる値を判定する方法でもある。
"ROPE region of practical equivalence" とは、分かりやすい訳だと「実質的に同値とする範囲」なのだが、これ以降は ROPE と記す。
例えばコインに不正がないと、表の出る確率は θ = 0.5 で、この ROPE を [0.48, 0.52] とする。つまり「きっちり θ が 0.5 にならないまでも、0.48 と 0.52 の間であれば θ = 0.5 とみなす」ということ。そして、95%HDI に ROPE が納まらない場合、期待する θ は誤っていると判断(コインは不正)。逆に ROPE が納まれば θ であると確信する(コインに不正なし)。
このように HDI には以下の二つの役割がある
- 「90%の区間の値」という確率分布の要約
- 注目する θ が信頼できるか否か
後者の例は先の ROPE で、言うなれば「yes / no 判断」に使っている。但し、その判断だけに委ねるのは危険。その点は、本書「12章」で取り上げるとのこと。
「モデル評価:evidence, Bayes' Factor」に続く。

0 件のコメント:
コメントを投稿