りんだろぐ rindalog: オッヅ、ベイズルール、尤度比（ファスト＆スロー）

直感を頼らない（ファスト＆スロー） に続いて、本書から三度目の投稿。

ファスト&スロー(上) あなたの意思はどのように決まるか? (ハヤカワ・ノンフィクション文庫)

posted with amazlet at 17.02.09

ダニエル・カーネマン
早川書房
売り上げランキング: 347

Amazon.co.jpで詳細を見る

オッヅから確率へ

予想通り、本書「ファスト＆スロー」にベイズ・ルールが登場した。

たとえばあなたは、大学院生の 3 %（基準率）がコンピュータ・サイエンス専攻だと考えているとしよう。そしてトム・Wの人物描写（= 証拠）を読んだ後に、コンピュータ・サイエンス専攻の可能性は他分野より 4 倍高いと考えたとする。するとベイズ・ルールにより、トム・Wがコンピュータ・サイエンス専攻の確率（事後確率）は 11 % になる。もし基準率が 80% なら、事後確率は 94.1% になる。P.273

この解説は「原注 P.34」にある。

ベイズ・ルールは、最も単純には、事後確率=事前確率×尤度比という形で表される。尤度比は、２つの相反する仮説が現実であるオッヅ（それぞれの確率の比）を意味する。原注P.34

私にとって馴染みのベイズ・ルールは P(A|B) = P(A)P(B|A) / P(B) で、P(A) は事前確率、P(B|A) が尤度。よって、本書の尤度比とは P(B|A)/P(B) のこと。

診断の問題で考えてみよう。あなたの友人が、ある深刻な病気の検査で陽性反応が出た。この病気はきわめてめずらしく、精密検査送りになった人が実際にその病気だった例は、600 件に 1 件にすぎない。検査自体の精度は高く、的中率は 25:1 である。すなわち陽性反応が出た人がその病気にかかっている確率は、偽の陽性反応が出た確率の 25倍である。陽性反応が出たのは悪い知らせだが、あなたの友人が病気であるオッヅは 1/600 から 25/600 になったにすぎない。確率としては 4% である。原注P.34

「なぜ、オッヅが 25/600 の確率が 4%」はこの説明だけでは分かりにくいかもしれない。これに続く次の問題で説明。

主観確率の 3% に対する事前確率は、0.03/0.97 = 0 .031 となる。尤度を 4 と仮定すれば（トム・Wがコンピュータ科学者である可能性は、そうでない可能性の 4 倍）~~事後確率~~ オッヅは 4 × 0.031 = ~~12.4~~ 0.124となる。以上から、トム・Wがコンピュータ科学者である事後確率を計算すると、11％となる（12.4/112.4 = 0.11）。

注意：私が「事後確率」に取り消し線を入れた。これは事後確率でなくオッヅと思う。そのオッヅから事後確率を求める流れ。オッヅを「事後確率」とも呼ぶのかもしれないが、本来の求める「事後確率」とは別表記にしたほうが分かりやすい（「事後オッヅ」とすべきでは？）。他の箇所でも同様の記述があるので、その都度修正した。

この説明に補足すると、12.4/112.4 = 12.4/(100+12.4) = 0.11 、これは投稿済み「賭博と確率：オッヅ」の次式から。

よって、先の 4% の算出は (25/600)/(1+25/600) = 0.04 。

基準率（or 事前確率）が 80% の場合は

するとベイズ・ルールにより、トム・Wがコンピュータ・サイエンス専攻の確率（事後確率）は 11 % になる。もし基準率が 80% なら、事後確率は 94.1% になる。P.273

> 0.8/0.2*4/(1+0.8/0.2*4)
[1] 0.941

本来のベイズと違う？

ここまででは理解した。ところが、長いことやっている「本来のベイズの定理」と比較したら値が異なった。例えば、ベイズの定理の実践：経験に学ぶ（数学の言葉で世界を見たら by 大栗博司） の乳がんの例。

　P(乳がんあり）= 0.008
　P(陽性 | 乳がんあり) = 0.9
　P(陽性 | 乳がんなし) = 0.07

> odds<-0.008*(0.9/0.1)
> odds/(1+odds)
[1] 0.0672

本来は約 0.09 。長時間悩んだ挙句、おそらく尤度比の算出方法が違うのが原因だと思う。次の、｢尤度比、オッズ」「Bayesの定理」の計算と解説 の尤度比の解説では、尤度比は次の定義から x / (1 - y) とのこと。

検査の感受性 (sensitivity)：(有病者を検査して) 有病者が正しく陽性となる割合　x

検査の特異性 (specificity)：(無病者を検査して) 無病者が正しく陰性となる割合　y

つまり、ここでの尤度比は

有病者が正しく陽性となる割合 / (1 - 無病者が正しく陰性となる割合)

P(陰性 | 乳がんなし）の情報が与えられていない。そこで P(陽性 | 乳がんなし) = 0.07 から P(陰性 | 乳がんなし) = 1 - P(陽性 | 乳がんなし) = 1 - 0.07 = 0.93 として求めた

> odds<-0.008*0.9/(1 - 0.93)

> odds/(1+odds)
[1] 0.0933

この解法に自信はないが、約 0.09 に 0.0672 よりは近い数値となった。本書の尤度比の解説を引用する。

尤度比は、２つの相反する仮説が現実であるオッヅ（それぞれの確率の比）を意味する。

この乳がんの例では、「2つの相反する仮説」から尤度比は

有病者が正しく陽性となる割合 / 無病者が誤って陽性となる割合

0.9/(1-0.93) = 12.9

が正しいと（今のところ）認識した。次が最初に誤った？解釈による尤度比。

有病者が正しく陽性となる割合 / (1 - 有病者が正しく陽性となる割合)

0.9/(1-09)=9

12.9 と 9 の差は大きい。

要するに尤度比の「考え方」の違いという気がする（間違ってるかも）。もう少し突っ込んで調べればわかる気もするが、ここで止める。私の通常の分析では、事後オッヅから事後確率を求めることはしないから。よって、本書の解説に対して「本来のベイジアン」との比較はこれ以上はしない。

発見は驚き

次は本節の最後から。

「自分の見たものがすべて」に連想一貫性が重なると、自分がこしらえたストーリーを信じやすくなる。したがって、きちんとベイズ推定を行う基本は、次のように簡単にまとめることができる。

結果の確率を見積もるときは、妥当な基準率をアンカーにする。

証拠の診断結果を常に疑う。

P.274

アンカーは anchoring のことで、特定分野に Anchoring されない専門家 の投稿で取り上げたもの。その投稿は、本著者 Danny Kahneman とその「相棒」Amos Tversky を扱ったポッドキャストの番組を元にしたもの。

さらに、この引用に続く Danny の言葉は印象的。

じつに単純にして明快である。だが、この基本をどうやって実行したらいいのか、自分は一度も教わったことがない。しかもいまだに、よほど努力しないとこの基本を守れない。このことに気づいたとき、私は愕然としたものである。P.274

私が最初にベイズルールを理解した頃も同様の驚きをもった。そして、今でも驚かされることがある。こんな風に Danny のような愕然とする経験を踏んでいくこそが、新たな発見に繋がる。

青タクシーがひき逃げした確率

次は、第16章「原因と統計（驚くべき事実驚くべき事例）」から。

問題１：夜、一台のタクシーがひき逃げをしました。この市では、緑タクシーと青タクシーの二社が営業しています。事件とタクシー会社については、次の情報が与えられています。

市内を走るタクシーの 85% は緑タクシーで、15% が青タクシーである。

目撃者は、タクシーが青だったと証言している。裁判所は、事件当夜と同じ状況で目撃者の信頼性をテストした結果、この目撃者は青か緑かを 80% の頻度で正しく識別し、20% の頻度で識別できなかった。

では、ひき逃げをしたのが青タクシーである確率は何%でしょうか？

これは、先の解法と同様にして解ける、以下解説。

確率の形でベイズ・ルールを適用すると、事前確率とは、基準率から導いた青タクシーが犯人である確率である。尤度比は、証人が青タクシーを見て青と言った確率と緑を見て青と言った確率の比になる。~~事後確率~~ オッヅは、(0.15/0.85)×(0.80/0.20) = 0.706 となる。~~事後確率~~オッヅは、犯人が青の確率と緑の確率の比である。犯人が青である確率を計算すると、0.706/1.706 = 0.41 となる。よって、青タクシーが犯人である確率は、41% である。原注P.35

目撃者がいなければ、ひき逃げをしたのが青タクシーである確率は 15% で、これが起こりうる結果の基準率となる。もし二社のタクシー会社が同等のシェアを持っていたら、基準率には意味がなくなり、あなたは目撃証言の信頼性だけを考えればよい。すると、青タクシーである確率は 80% になる。P.296

オッヅは (0.5/0.5) × (0.80/0.20) = 4 で、事後確率は 4/(1+4) = 0.8 。計算するまでもなく、タクシー数の比率が同じなら、考慮されるのは目撃者の信頼性 80% のみ。

たぶんあなたは、この問題をだされた大勢の人がやったのと同じことをするだろう。つまり、基準率を無視して証言だけに注目する。この場合、最も多い答えは「80%」になる。P.296

タクシーの比率が無視されがちなのは、低い罹患率が考慮されないのと同様。

統計的基準率と因果的基準率

では、同じ問題の別バージョンを考えてみよう。この問題では、基準率の表現方法だけを変えてある。

問題２：事件とタクシー会社については次の情報が与えられています。

二つのタクシー会社が走らせている車の台数は等しい。ただし、過去に起きた事故の 85% には緑タクシーが関与している。

目撃証言は最初の問題と同じ。

タクシー問題の二つのバージョンは、数学的には同じだが、心理学的にはまったく意味が違ってくる。P.297

「数学的には同じ」なので、青タクシーが犯人である確率も同じ。事故率 85% と 15% では 5 倍以上の差がある。はたしてこれを、タクシー台数の比率が 85 : 15 と同等にヒトは扱えるのか？という問題。

タクシー問題を見ると、基準率には二種類あることがわかる。一つは「統計的基準率」で、これは母集団に関する事実である。しかしこの数字は、個々の予測では無視されがちである。もう一つは「因果的基準率」で、こちらは個々の予測を変える効果がある。二種類の基準率情報は次のように扱われる。

統計的基準率はおおむね過小評価され、ときには完全に無視される。予測するケースに固有の情報が提供されているときは、とくにその傾向が強い。

因果的基準率はそのケース固有の情報として扱われ、他の固有情報と容易に関連づけられる。

P.298

基準率は「前提条件」と解釈しても良い。緑と青タクシーの台数の比率などが「統計的基準率」、「因果的基準率」は「事故率が 5 倍以上の差なら、そのタクシー会社の運転は荒っぽい」とか考えること。

この「因果的基準率」の扱いは意外と難しいと思う。本書はこの後で「ステレオタイプ」と関連させている。世の裁判官や弁護士、政治家など、犯罪を扱ったり法律を制定するヒトらが、本書を読んでいることを祈るばかり。そうでなくとも、本書が指摘する内容はすでに知ってほしい。

日本の政治家が、ベイズルールを駆使してる姿が、まったく想像できないが残念で悲しいよ。

Paul E. Meehl に続く。

りんだろぐ rindalog

2017年2月9日木曜日

オッヅ、ベイズルール、尤度比（ファスト＆スロー）

0 件のコメント:

コメントを投稿