2015年12月29日火曜日

Fallacy of Prosecutor & Defendant:検事と被告の誤謬

Bayesian の現実的な応用として、以下の確率問題を考える。

被告人 Fred に対する主な証拠は「現場にあった犯人の血液と Fred の血液が一致」というもの。この血液は「1,000 人に 1 人」のタイプ。これらの条件から Fred が「無実である確率」は?

これは、Norman Fenton, Martin Neil 著 "Risk Assessment and Decision Analysis with Bayesian Networks" の "5.4.2 The Prosecutor Fallacy Revisited", "5.4.3 The Defendant's Fallacy" をもとに記した。


条件から

 E: Evidence「証拠」は 「Fred の血液のタイプが現場にあった犯人のものと一致」
 H: Hypothesis「仮説」は「Fred は無実」

事前確率 P(H) を次のように考える

Fred が有罪である証拠は何もない場合、犯行があった町の成人男子が容疑者として疑われる確率

そのような成人男子が 10,000 人いるとして、P(H) = 9,999/10,000, P(not H) = 1/10,000 とする。

P(E | H):尤度は、「Fred は無実で、Fred の血液のタイプと現場の血液が一致」。これは、「1,000 人に 1 人の血液型のタイプ」の人が「偶然に現場にいる確率」で 1/1,000 となる。

not H は「Fred が犯人」なので、P(not H は「Fred が犯人で、血液のタイプが一致する確率」は 100% 、つまり P(not H とする。

求める「無実である確率」は、Bayes' rule から P(H | E) = { P(E | H) P(H) } / P(E) 、この分母は P(E) = P(E | H)P(H) + P(E | not H)P(not H)

 分子:P(E | HP(H = (1/1,000) × (9,999/10,000)
 分母:P(E | H)P(H) + P(E | not H)P(not H)
      = (1/1,000) × (9,999/10,000) + 1 × (1/10,000)

> ((1/1000)*(9999/10000)) / ((1/1000)*(9999/10000) + 1*(1/10000))
[1] 0.9090826

よって、求める確率は 約 91 %となる。

この結果は、「血液が 1,000 人に 1 人のタイプと一致」という証拠だけでは、Fred を有罪とするには確率的に不足することを示している。

検事の主張とは裏腹に、またこのように確率を算出しないと気づかない、無罪である確率が依然として高いことが "the prosecutor's fallacy" 。


誤る原因

下図は、今回の問題と同じことを表している。
つまり、the prosecutor's fallacy の主な原因は

P(H | E) = P(E | H)

と感じたためだろう。

言葉にすれば

 P(H) = Fred が無罪である場合、「1,000 人に 1 人」の事象が起こる確率
 P(H | E = 「1,000 人に 1 人」の事象が起こる場合、Fred が無罪である確率

なのだが、直感的には理解しにくい。表記を単純化して

 P(有罪 | 証拠) = P(証拠 | 有罪)

としたところで、依然として「成り立つような気がする」。

P(H | E = P(有罪 | 証拠) として加味されいない情報が、上図の例では

10,000人に1人のDNA」の証拠は、1,000,000 人の都市の場合、10,000/ 1,000,000 = 1/100 で依然として有罪である確率は 1 % しかない

というもの。

P(H | E) = P(Hが、常に成立しない例として「条件付き確率、ベイズの定理」で示した

 P(数学が得意 | 理科が得意) = P(理科が得意 | 数学が得意)

は直感的に納得できるだろう。


The Defendant's Fallacy:被告側の誤り

この確率の結果から、被告の弁護士は次のように主張した

検察側の証拠から、被告人が無罪である確率が極めて高い結論に至りました。よって、この証拠は検察側の主張を裏付けるものではなく、除外すべきものであります

この弁護士の主張は妥当だろうか?

この確率算出の結果、事前確率 P(H) = 1/10,000 は、事後確率 P(E | H) = 9/100 に変化した。つまり「10,000 人に 1 人から、100 人に 9 人の確率」へ 900 倍増えた。

つまり、900 倍に増えたことに加え、今回の証拠は単に「一つの証拠」に過ぎない。更に証拠が追加されると、事前確率は 9/100 からに有罪に傾く。

よって、被告弁護士の主張は誤りで、これが "the defendant's fallacy" 。

0 件のコメント:

コメントを投稿