2015年12月13日日曜日

二項分布の例題:8人の子供が全員男の確率

「全米が泣いた」「世界が震撼した」とかいう表現が未だに使われているのか、よく分からない(国内メディアを可能な限り遮断している日々です)。そんなものは「死語」で「使い古された陳腐な表現」になっていてほしいものだ。

ちなみに、「全米という国」も「世界という国々」も泣いたり怖がったりしません、人じゃなから。メディアが泣かせよう、怖がらせようとする、チープな文句でしかない。マスメディアの「マス」の意味が、現代ではますます怪しくなっている。

商品やサービス宣伝には「誇張表現」が一般的なので無視すれば良いのだが、大手の新聞等の報道で、数値による「信ぴょう性の高そうな記事」にも「誇張表現」は少なくない。ていうか、「誇張」というより「誤り or 嘘」なのだ。

本投稿では、そんな誤りの紹介と正確な理解について、Norman Fenton, Martin Neil 著 "Risk Assessment and Decision Analysis with Bayesian Networks" の "4.5 Binomial Distribution" をもとに記した。

Risk Assessment and Decision Analysis with Bayesian Networks
Norman Fenton Martin Neil
CRC Press
売り上げランキング: 70,308
少なくとも本書の 1 〜 4 章は、「確率 ・統計」という分野を超えて、誰もが身につけておくべき「リスク評価」の知識 を、平易ながらも具体的な説明で提供する。そして「何のために確率や統計のことを学ぶのか?」を前提にした解説は素晴らしい。本来、学校の授業もこうあるべきだろう。


Binomial Distribution

確率 p で起こる事象が、n 回のサンプリングから r 回起こる確率は
各行は「組合せ」の表記方法が異なる。

これは General Formula for the Binomial Distribution(二項分布の一般式)。この式の前提条件は
前提条件:n 回の独立試行で、常に確率 p の事象が r 回起こる確率。この条件を満たさないのは、n 回の試行中に p の値が変化する場合、など。

本書の例題は、すべてこの式で求めることができる(よって、この前提条件を仮定する)。


例 4.19:8人の子供の家庭で、全員が男の確率は? また、二人が男の確率は?

条件:男女の違い確率は同じ。性別の表れ方は独立(「男の次は女生まれやすい」等はない)。

人全員が男である確率:

> (1/2)^8
[1] 0.00390625

これは「コインの裏が続けて 回出る」と同様。

8 人の内の 2 人が男の確率:

# Using factorial()
> (factorial(8)/(factorial(2)*factorial(6)))*(1/2)^2*(1-1/2)^6
[1] 0.109375

# Using choose()
> choose(8,2)*(1/2)^2*(1-1/2)^6
[1] 0.109375
例 4.21:10 億人に 1 人以下?

英国 Sun 紙が、英国のある女性が全員男の 8 人目の子供を出産したことを報じた。その出来事が起こる確率は「less one in a billion(10 億人に 1 人以下)」とのこと。

Sun 紙はタブロイド紙とのことだが、だからといって嘘は許されない。とはいえ、根拠のない 煽る報道(センセーショナルな報道)は毎度のことか?

この確率の計算には、英国のデータを元に以下の数値を使用

 (a) その年の出産数:700,000
 (b) その年の出産数の内で 8 人目の出産件数:1,000 (1000/700000 = 0.14%)
 (c) 8人子供全員が男の確率:1/256 = (1/2)^8

(b) の 1000 人の母親の内で「子供全員が男ではない確率」は、二項分布で n =  1000, p = 1/256 から

 (255/256)^1000 = 0.01996251 ≈ 2%

98 %の確率で、少なくとも 1 件は全員男の子供の 人目が誕生

「意外に多いな...」と思われるだろう。これは「誕生日 Puzzle」同様に「どの女性にも限定しない」という条件のため。

そこで、「ある特定の女性」と限定した確率を求める。つまり、もっと「起こりにくい条件」での確率を求める。

先の情報から

 8 人目の子供の確率  :1/700 = 1000/700000
 8 人子供全員が男の確率:1/256
 特定の女性がその年に出産する確率:
  英国の出産年齢の女性の数を 15×10^6 として、年間出産数 7×10^5 から
   (7*10^5)/(15*10^6) = 0.0466... ≈ 0.05 = 1/200

これら つの確率の分母をかけると 700 × 256 × 200 = 35,840,000

これでもニュースが報じた「10 億人に 人」よりは、30 倍ほど低い(「30 倍おおげさ」)。報道の通り「10 億人に 人以下」にするには、さらに「あなたの町、特定の日や週」などの限定要素を加えて、確率を下げる必要がある。


度目の Jackpot の確率」に続く。

/** tex **/

0 件のコメント:

コメントを投稿