2015年10月8日木曜日

ベイズの基礎:課題15-9 尤度 = 確率(モデルが真の時にデータ出現)

課題15-7 どっちの鞄? からの続き。

Activity 15-9: Likelihoods

課題15-4&5 事後確率 = 事前確率 × 尤度 で紹介したように

POST is proportional to PRIOR × LIKELIHOOD
事後確率とは、事前確率と尤度の積の割合

この「尤度(ゆうど)」という言葉も分かりにくい。元の likelihood の言葉自体は単純だが、ベイズのルールでの意味は分かりにくいかもしれない。

ここで、再度本テキストの定義を引用する
What is a likelihood? This quantity relates the data that we observe with the models. Specifically, the likelihood for a model is the probability of the observed data assuming that the model is true. 
 LIKELIHOOD for MODEL = Probability(DATA if MODEL is true) 
We compute this probability for each model, obtaining a collection of likelihoods. 
 モデルの尤度 = 確率(モデルが真の時にデータ出現)
つまり「あるモデルの尤度とは、そのモデルが正しい場合に観測データが出る確率」。各モデル毎にその確率を算出して、尤度の集合を得る。

次の式が全てを言い表しています。

LIKELIHOOD for MODEL = Probability(DATA if MODEL is true)

本課題を、この尤度の定義を意識しながら取り上げる。


コインは正当か?

コインを次のように疑った
  • 正当なコイン(裏と表がある)
  • 不正なコイン(両面が表、両面が裏)
これが次の3つの「予測モデル」となる。

 MODELS = {FAIR, TWO-HEADED, TWO-TAILED}

左の表はそれぞれ

 DATA = "COIN FLIP IS HEADS"
 DATA = "COIN FLIP IS TAILS"

の「尤度」。

つまり、各モデルのコインの出方が尤度になる。FAIR モデル(一行目)が正しいなら「表」の確率は 1/2, 「裏」の確率は 1/2 TWO-HEADED モデル(二行目)が正しいなら、「表」の確率は 1, 「裏」の確率は 0, という具合。


男は何人?

課題:部屋に3人いることは分かっているが、性別は分からない。

この場合、男女の組合せは 通りある、これが つのモデル(つの可能性)となる。この部屋から無作為に 人を抽出した尤度は、例えば

 LIKELIHOOD = Prob("person chosen is male" if(one men, two women)) = 1/3

「男 人、女 人」モデルが正しい場合、男が選ばれる確率は 1/3

左は全ての尤度の一覧。上段は「男の確率」、下段は「女の確率」。

ここで、再度「ベイズのルール」の流れを復習する。

無作為に人を抽出する前の情報は次の二つ:

 PRIOR:4つのモデル(4つの可能性)の確率は同じ
 尤度 :各モデルで男、女の出る確率

尤度は「人の男女がいる」という情報から算出する。PRIOR(事前確率)は「可能性」であり同じである必要はないが、ここでは何の情報もないので平等な確率で、全て 1/4 (25%) とした。

無作為抽出の結果から、この PRIOR が更新されて POST(事後確率)になる。この無作為抽出の結果が「観察データ」で、それで事前確率が更新されるのが「ベイズのルール」。

「観測データ」が女性だった場合
女性ではなく、男性だった場合
無作為抽出された結果の違いで、つのモデルの可能性が異なっている。

尤度については、まだ少し気になる点はあるが、本テキストで理解が進んだことは間違いない。

課題15-11,12,13,14 診断結果, 不正コイン, 玉の数 に続く。

0 件のコメント:

コメントを投稿