2015年10月2日金曜日

ベイズの基礎:Topic14 独立性の検証

Topic14 Two-Way確率テーブル からの続き。

このブログで少なくとも2回は取り上げている「独立性」について、今回は「Two-Way 確率テーブル」を用いて述べる。「独立性の有無」に拘るのは「データ分析とは『非独立性の分析』」の裏返しだから。

本投稿も前回同様 Workshop Statistics: Discovery with Data, A Bayesian Approach の Topic 14: Two-Way Probability Tables を元にした。


独立の例

Activity 14-4: Independent Events. (P.310) を元にした。

偏りのないコインを 回投げる試行を 1,000 回行ったのが次の表。

偏りのないコインを 2 回投げる試行を 1,000 回行ったのが左の表。次の確率を求める。

 a. 2 回目に裏が出る確率
 b. 1 回目が表の場合、2 回目に裏が出る確率

答え:
 a. (234 + 239) / 1000 =  0.473
 b. 234 / (261 + 234) =  0.4727273

ほぼ同じ値です。このことから、回目が表であっても、回目に裏が出る確率に影響しないことが伺える。つまり、この a, b の事象は独立(約 0.0003 偏って見えるのは無視)。

この問題を、次のように試行しないで、偏りのないコインという条件でセルを埋める。各2501 でもなんでも良い。この表で先の問題を解く。

 a. 500/1000 = 0.5 (オレンジ枠)
 b. 250/500 = 0.5 (赤枠)

どちらも同じ確率の 50%a, b の独立性は明確。


非独立の例

Independent Events (P.311) を元にした。

今回はコインより若干複雑なトランプゲーム「ブリッジ」で検証する。

 ルール:持ち手のカードの合計点の高さを競う
 エース:3点、キング:3点、クイーン:2点、ジャック:1点、その他:0点

1,000 回記録した持ち手の合計点と、エースの数の一覧が以下。
次の確率を求める。

 a. 合計点が 8 から12 点の確率
 b. エースが 2 枚あった時、合計点が 8 から12 点の確率

先のコインの例同様に、この二つの確率が同じであれば、a, b の事象は独立、異なれば非独立。少し冗長に、ベイズ的な用語を交えて言い換えると
エースが 2 枚(ある知識/情報)は、合計点が 8 から12 点の確率(別の事象)を変化させない/確率に影響しない

答え:
 a. (78 + 281 + 81 + 2) / 1000 = 0.442
 b. 81 / (81 + 127 + 2) ≈ 0.386

a, b の確率は異なり、この二つの事象は「独立ではない(依存している)」となった。

ポーカーをはじめ、多くのトランプゲームは「確率を計算できれば勝てる」とは分かっていたが、ここまでシッカリ計算したことはなかった。ただ、本当に確率を使って勝ちたい場合は、これらの計算を暗算する必要がある。たとえ暗算ができたとしても、状況を記憶する方が困難だろう。

前回の Two-Way 確率テーブル で「まとめの要約」で記したように、「Two-Way 確率テーブル」を使えば

  • ある行や列に限定して条件付確率を計算
  • その条件付確率からある事象と別の事象の依存具合を理解できる

こんなテーブルを使わなくても、独立性の検証はできるが、テーブルで明確になるのも事実。行数や列数が増えた場合でも、視覚的に条件付確率を容易に算出可能。

課題15-2 不正なサイコロ? に続く。

0 件のコメント:

コメントを投稿