このブログで少なくとも2回は取り上げている「独立性」について、今回は「Two-Way 確率テーブル」を用いて述べる。「独立性の有無」に拘るのは「データ分析とは『非独立性の分析』」の裏返しだから。
本投稿も前回同様 Workshop Statistics: Discovery with Data, A Bayesian Approach の Topic 14: Two-Way Probability Tables を元にした。
独立の例
Activity 14-4: Independent Events. (P.310) を元にした。
偏りのないコインを 2 回投げる試行を 1,000 回行ったのが次の表。
偏りのないコインを 2 回投げる試行を 1,000 回行ったのが左の表。次の確率を求める。
a. 2 回目に裏が出る確率
b. 1 回目が表の場合、2 回目に裏が出る確率
答え:
a. (234 + 239) / 1000 = 0.473
b. 234 / (261 + 234) = 0.4727273
ほぼ同じ値です。このことから、1 回目が表であっても、2 回目に裏が出る確率に影響しないことが伺える。つまり、この a, b の事象は独立(約 0.0003 偏って見えるのは無視)。
この問題を、次のように試行しないで、偏りのないコインという条件でセルを埋める。各250 は 1 でもなんでも良い。この表で先の問題を解く。
a. 500/1000 = 0.5 (オレンジ枠)
b. 250/500 = 0.5 (赤枠)
どちらも同じ確率の 50% で a, b の独立性は明確。
非独立の例
Independent Events (P.311) を元にした。
今回はコインより若干複雑なトランプゲーム「ブリッジ」で検証する。
ルール:持ち手のカードの合計点の高さを競う
エース:3点、キング:3点、クイーン:2点、ジャック:1点、その他:0点
1,000 回記録した持ち手の合計点と、エースの数の一覧が以下。
a. 合計点が 8 から12 点の確率
b. エースが 2 枚あった時、合計点が 8 から12 点の確率
先のコインの例同様に、この二つの確率が同じであれば、a, b の事象は独立、異なれば非独立。少し冗長に、ベイズ的な用語を交えて言い換えると
エースが 2 枚(ある知識/情報)は、合計点が 8 から12 点の確率(別の事象)を変化させない/確率に影響しない
答え:
a. (78 + 281 + 81 + 2) / 1000 = 0.442
b. 81 / (81 + 127 + 2) ≈ 0.386
a, b の確率は異なり、この二つの事象は「独立ではない(依存している)」となった。
ポーカーをはじめ、多くのトランプゲームは「確率を計算できれば勝てる」とは分かっていたが、ここまでシッカリ計算したことはなかった。ただ、本当に確率を使って勝ちたい場合は、これらの計算を暗算する必要がある。たとえ暗算ができたとしても、状況を記憶する方が困難だろう。
前回の Two-Way 確率テーブル で「まとめの要約」で記したように、「Two-Way 確率テーブル」を使えば
- ある行や列に限定して条件付確率を計算
- その条件付確率からある事象と別の事象の依存具合を理解できる
こんなテーブルを使わなくても、独立性の検証はできるが、テーブルで明確になるのも事実。行数や列数が増えた場合でも、視覚的に条件付確率を容易に算出可能。
課題15-2 不正なサイコロ? に続く。



0 件のコメント:
コメントを投稿