りんだろぐ rindalog: HDI の役割（確率分布の要約、ROPE）

「HDI (Highest Density Interval)」からの続き。

本投稿は「Doing Bayesian Data Analysis」の「5.3.1 Estimating the binomial proportion」を元にした。

次の二つのグラフ（Figure 5.2）のセットは、本書提供スクリプトの BernBeta.R の実行結果。二つの尤度、観測データは同じで、違いは事前確率ベータ関数の引数。

> BernBeta(c(1,1),c(rep(1,11),rep(0,14-11)))
> BernBeta(c(100,100),c(rep(1,11),rep(0,14-11)))

HDIについては「HDI (Highest Density Interval)」を参照。

これは「コイン投げで表の出る確率の推定」。左の例では、事前確率が一様分布で「何の事前情報なし」。右の例では「0.5 を高く確信」している事前確率。観測データは「試行回数 14 のうち表 (z) が 11 回」。左の事後確率は観測データの影響を受けて、右側に偏った（表が出やすい）分布となった。方や右側の事後確率は事前確率とほとんど変化はない。

ROPE

The 95% HDI is also one way for declaring which values of the parameter are deemed “credible”.

95%HDI はパラメーターの値として信頼できる値を判定する方法でもある。

"ROPE region of practical equivalence" とは、分かりやすい訳だと「実質的に同値とする範囲」なのだが、これ以降は ROPE と記す。

例えばコインに不正がないと、表の出る確率は θ = 0.5 で、この ROPE を [0.48, 0.52] とする。つまり「きっちり θ が 0.5 にならないまでも、0.48 と 0.52 の間であれば θ = 0.5 とみなす」ということ。そして、95%HDI に ROPE が納まらない場合、期待する θ は誤っていると判断（コインは不正）。逆に ROPE が納まれば θ であると確信する（コインに不正なし）。

このように HDI には以下の二つの役割がある

「90%の区間の値」という確率分布の要約
注目する θ が信頼できるか否か

後者の例は先の ROPE で、言うなれば「yes / no 判断」に使っている。但し、その判断だけに委ねるのは危険。その点は、本書「12章」で取り上げるとのこと。

「モデル評価：evidence, Bayes' Factor」に続く。

りんだろぐ rindalog

2015年10月26日月曜日

HDI の役割（確率分布の要約、ROPE）

0 件のコメント:

コメントを投稿