前回「 K がより大きいほど θ に近似する」と表した。これを逆に考えると、直感的に次のことが言える
異なるコインで表が出る割合が近似すると k は大きい値で、近似しないと k は小さい。
つまり、k はデータから導けるということ。ここで小文字 k としたように、今回はより現実的に変数 k とする( k が定数なのは非現実的)。
左は図 9.7 、前回の "Multiple Coins From A Single Mint" の図 9.4 との違いは、k が γ(ガンマ)関数を prior とする変数であること。
「なぜ γ 関数なのか」については割愛(本書には十分な説明あり)。
検証 Therapeutic Touch
本書の例は、Therapeutic Touch(セラピューティック・タッチ)の「信憑性」を検証するもの。こんな治療法は冗談かと思ったが、信じている人が少なからずいるそうだ。データは、9 歳の少女エミリー・ローザによる実際の観測データ。
ここでは、この治療法とエミリーの実験については触れず、観測データのみで Therapeutic Touch を検証する。
Therapeutic Touch を持つとされる 28 名が被験者。左が図 9.9 の観測データで「正解率のヒストグラム」。正解率が高い度数が大きいほど、この治療法の信憑性は高いと判断する。
以下は、本書提供のスクリプト Jags-Ydich-XnomSsubj-MbernBetaOmegaKappa.R の実行結果(本書では図 9.10 に相当、サンプリングなので本書とは値が異なる)。k と ω 、各 θ に分けて結果を検証する。
ω は mode = 0.438, 95%HDI [0.35 : 0.512] で「かろうじて半分正解かどうか」という結果。この結果は「当てずっぽう」のコインの裏表の予想と同じということ。Therapeutic Touch が存在するなら、少なくとも 95%HDI は 0.5 以上であるべきで、信憑性が高いとするには 0.7 以上は必要ではなかろうか?
というか、正解率が 51.2 % 以上の確率が 2.5 % 未満(100 人中 3 人未満)な主張を、あなたは信じますか?
次は、個々の θ 、そして θ 差の分布を見る。
上図では「赤字の +」が正解率、以下の観測データから、正解率が最低なのは θ1 、最高なのは θ28
> table(myData)
s
y S01 S02 S03 S04 ... S14 ... S27 S28
0 9 8 7 7 ... 6 ... 3 2
1 1 2 3 3 ... 4 ... 7 8
注目すべきは、θ1 の分布でピークの 0.30 近辺と正解率 0.10 が大きく外れていること。この理由は、θ1 を除く 27 名の被験者の正解率が θ1 に勝っているため。別の言い方をすれば、その被験者 27 名が「group-level parameters グループレベルのパラメータ」(ここでは k, ω)に影響し、group-level parameters は個々の θ を group の典型的な値に「引っ張る」。これは最大の正解率の θ28 でも同様で、0.80 の正解率にも関わらず、分布のピークは 0.55 近辺に「引っ張られて」いる。
Shrinkage
つまり、ここでは個々 θs の偏りは zs/Ns (例えば、データから得たコイン表の割合)ではなく、group-level mode の ω の方に近似するということ。
Thus, the variance between the estimated values θs is less than the variance between the data values zs/Ns .
したがって、推定値 θ の分散は、データ zs/Ns の分散より小さくなる。
This reduction of variance in the estimators, relative to the data is the general property referred to by the term "shrinkage."
データに対して、推定値の分散が縮小する一般的な性質を "shrinkage" と呼ぶ。
ちなみ "shrinkage" は、階層型モデルの特徴(Bayesian の特徴ではない)。
正解率が最小と最大の比較分布(θ1 - θ28)は、- 0.1 近辺のピーク、95%HDI [-0.401 : 0.121] で「ゼロを含む」。つまり「正解率の差が最大の場合でも、違いはない」ということ。先の ω の結果と合わせての結論は「Therapeutic Touch の存在は考えにくい」(簡潔に「そんなもんはない!」です)。
階層モデルの特徴
group-level の ω は、全体の分布を示すもの。それが mode = 0.438, 95%HDI [0.35 : 0.512] の分布から、全体的な傾向からも「その存在は考えにくい」と判断できる。
以下は本書からの引用で、階層モデルの目的と特徴を示す。
We used a hierarchical model because it is a reasonable way to capture individual differences and group-level tendencies. The model assumed that all individuals were representative of the same overarching group, and therefore all individuals mutually informed each other's estimates.
階層モデルを使う理由は、個々の違い、そしてグループレベルの傾向を捉える合理的な方法だから。このモデルが前提とするのは、個々が同じグループを表し、そして個々はお互いの推定値を伝達しあう。
「守備毎打撃力」に続く。




0 件のコメント:
コメントを投稿