2015年10月5日月曜日

ベイズの基礎:課題15-3 池の魚の数

課題15-2 不正なサイコロ? からの続き。

Activity 15-3: How Many Fish?
課題:池の魚の数を予測する。 
サンプリング方法:魚の数を予測する池から魚を一匹捕まえる、その魚に印を付けてから池に帰す。しばらく経ってから、その池から魚を一匹捕まえて「印の有り無し」を確認する。

池の大きさから、魚は多くても 4 匹と見積もる。この 1 から 4 匹の予測が各モデルとなる。他に何の情報もないので、各モデルの確率はそれぞれ 1/4、これが事前確率。

尤度(Likelihood)は「もし池の魚の数を知っていたら、印付き魚を捕まえる確率」になる。例えば「匹モデル」では、印付き魚しか捕まらないので尤度は 1.0 (100%),  印付き魚ではない確率は 0% 匹以上のモデルも同様に尤度を算出。

次の表が、以上の事前確率と尤度の一覧。

左の最初の表は、予測する池と同じような池を 1,000 面 (池は「面」と数えるらしい)仮定して、各モデルで「印付き魚」と「印無し魚」の出方を表す。

「捕まえた魚が印付き」の場合、一番目の表の tagged 行のみ注目して PROPORTION を算出したのが二番目の表。

この PROPROTIONPRIOR(事前確率)に対する POSTerior(事後確率)に相当する。三番目の表が事前確率と事後確率の比較。

よって、「捕まえた魚が印付き」の場合、事前確率と尤度によって上記のように事後確率が算出される。

左は、1,000 面の池を仮定せず直接 PROPORTION を算出。上記と同じ結果となる。


印無しの場合

これはテキストにはない課題、気になったのでやってみた。

「捕まえた魚が印無し」の場合の事後確率を算出したのが左。

「1匹いる」と仮定したモデルは、当然のように「有り得ない(0%)」となっている。面白いのは「捕まえた魚が印付き」の事後確率と比較して、2匹である確率の変化は少なく、3匹、4匹である確率の上昇具合が大きいこと。

これは人間の一般的な直感と比較してどうなのだろうか?

この結果を知らなければ、私の場合
  • この結果よりも 2匹の確率をより大きい
  • この結果よりも 3匹の確率をより大きい

と予測した。私の直感は誤りでした。

直感がこうして算出した確率と近い人もいるだろうが、いない人もいる。そんな直感が鋭い(この場合は、池の魚の数をだいたい知っている人、など)は、事前確率を全て 1/4 ではなく、直感に応じた確率にすれば、事後確率の精度はさらに高まる。

課題15-4&5 事後確率 = 事前確率 x 尤度 に続く。

0 件のコメント:

コメントを投稿