前回の標準偏差の算出よりも「実践的」な方法を紹介。
ある地域の既婚者の男性の平均年齢を推定する際、サンプルデータを取得する前に、事前確率として「何も分からない」とはならないはず。友人や知人、親戚のことなどを考える、つまり「経験を元にして」求める平均年齢 M を仮定することができる。
そんな風に事前確率の平均値 m0、標準偏差 h0 の正規分布を仮定する。
この正規分布の中央に位置するのが、推定する平均値の best guess を m0 とする。かたや標準偏差の h0 は、m0 の確信の強さを示す。強い確信があれば h0 は小さく、弱い確信なら h0 は大きくなる。
次のように事前確率を想定した
- 仮定した M を28才とした。M が28才より大きい確率と小さい確率はほぼ同等と考えた。
- 平均年齢が35才である確率は、90%と比較的強い確信を持った。
1 は 28才 が「the 50th percentile 50%分位にある」で、2 は 35才が「the 90th percentile 90%分位にある」となる。推測値の 50% 値を m0、p%値の推測値を mp とする。正規分布における m0, mp, 標準偏差 h0 の関係は
zp は 平均 0, 標準偏差 1 の正規分布の p%値(左区間エリアが p%)。
m0 = 28, p = 0.9 の場合、zp を求めると
> (z90<-qnorm(0.9,0,1))
[1] 1.281552
よって h0 は
(h0 <- (35-28)/z90)
## [1] 5.462129
curve(dnorm(x,28,h0),
from=10,to=44,n=100,
xlab="M",ylab="",
main="Normal Prior for the Mean age of Grooms")
分かってしまえばそんなに難しいことじゃないが、単に標準偏差の意味を知っているだけではこの発想はナカナカ浮かばない。
課題19-4 標準偏差不明時の推定 で不明の標準偏差を求める左式を紹介したが、あくまでも標本データを使った「公式」。標本データによっては、母集団とはかけ離れた標準偏差になってしまう。
今回の求め方が非常に理にかなっていると思うのは、「経験を元」にしていること。「主観的すぎる」と非難されることもあるが、私はそう思わない。例えば、推定する地域と似た地域で、参考になる平均年齢の調査結果などは「客観的に有効な情報」で、そんな情報を織り込んだ「経験を元にした主観的な推測」が可能になる。
次回はここで求めた h0 = 5.46 を使って事後確率を求める。
標準偏差 for Normal Prior Part2 に続く。



0 件のコメント:
コメントを投稿