りんだろぐ rindalog: 階層型モデル：Therapeutic Touch を検証

「Multiple Coins From A single Mint」からの続き。

前回「 K がより大きいほど θ に近似する」と表した。これを逆に考えると、直感的に次のことが言える

異なるコインで表が出る割合が近似すると k は大きい値で、近似しないと k は小さい。

つまり、k はデータから導けるということ。ここで小文字 k としたように、今回はより現実的に変数 k とする（ k が定数なのは非現実的）。

左は図 9.7 、前回の "Multiple Coins From A Single Mint" の図 9.4 との違いは、k が γ（ガンマ）関数を prior とする変数であること。

「なぜ γ 関数なのか」については割愛（本書には十分な説明あり）。

検証 Therapeutic Touch

本書の例は、Therapeutic Touch（セラピューティック・タッチ）の「信憑性」を検証するもの。こんな治療法は冗談かと思ったが、信じている人が少なからずいるそうだ。データは、9 歳の少女エミリー・ローザによる実際の観測データ。

ここでは、この治療法とエミリーの実験については触れず、観測データのみで Therapeutic Touch を検証する。

Therapeutic Touch を持つとされる 28 名が被験者。左が図 9.9 の観測データで「正解率のヒストグラム」。正解率が高い度数が大きいほど、この治療法の信憑性は高いと判断する。

以下は、本書提供のスクリプト Jags-Ydich-XnomSsubj-MbernBetaOmegaKappa.R の実行結果（本書では図 9.10 に相当、サンプリングなので本書とは値が異なる）。k と ω 、各 θ に分けて結果を検証する。

ω は mode = 0.438, 95%HDI [0.35 : 0.512] で「かろうじて半分正解かどうか」という結果。この結果は「当てずっぽう」のコインの裏表の予想と同じということ。Therapeutic Touch が存在するなら、少なくとも 95%HDI は 0.5 以上であるべきで、信憑性が高いとするには 0.7 以上は必要ではなかろうか？

というか、正解率が 51.2 % 以上の確率が 2.5 % 未満（100 人中 3 人未満）な主張を、あなたは信じますか？

次は、個々の θ 、そして θ 差の分布を見る。

上図では「赤字の＋」が正解率、以下の観測データから、正解率が最低なのは θ₁ 、最高なのは θ₂₈

> table(myData)
s
y S01 S02 S03 S04 ... S14 ... S27 S28
0 9 8 7 7 ... 6 ... 3 2
1 1 2 3 3 ... 4 ... 7 8

注目すべきは、θ₁ の分布でピークの 0.30 近辺と正解率 0.10 が大きく外れていること。この理由は、θ₁を除く 27 名の被験者の正解率が θ₁ に勝っているため。別の言い方をすれば、その被験者 27 名が「group-level parameters グループレベルのパラメータ」（ここでは k, ω）に影響し、group-level parameters は個々の θ を group の典型的な値に「引っ張る」。これは最大の正解率の θ₂₈ でも同様で、0.80 の正解率にも関わらず、分布のピークは 0.55 近辺に「引っ張られて」いる。

Shrinkage

つまり、ここでは個々 θ_sの偏りは z_s/N_s （例えば、データから得たコイン表の割合）ではなく、group-level mode の ω の方に近似するということ。

Thus, the variance between the estimated values θs is less than the variance between the data values z_s/N_s .

したがって、推定値 θ の分散は、データ z_s/N_s の分散より小さくなる。

This reduction of variance in the estimators, relative to the data is the general property referred to by the term "shrinkage."

データに対して、推定値の分散が縮小する一般的な性質を "shrinkage" と呼ぶ。

ちなみ "shrinkage" は、階層型モデルの特徴（Bayesian の特徴ではない）。

正解率が最小と最大の比較分布（θ₁ - θ₂₈）は、- 0.1 近辺のピーク、95%HDI [-0.401 : 0.121] で「ゼロを含む」。つまり「正解率の差が最大の場合でも、違いはない」ということ。先の ω の結果と合わせての結論は「Therapeutic Touch の存在は考えにくい」（簡潔に「そんなもんはない！」です）。

階層モデルの特徴

group-level の ω は、全体の分布を示すもの。それが mode = 0.438, 95%HDI [0.35 : 0.512] の分布から、全体的な傾向からも「その存在は考えにくい」と判断できる。

以下は本書からの引用で、階層モデルの目的と特徴を示す。

We used a hierarchical model because it is a reasonable way to capture individual differences and group-level tendencies. The model assumed that all individuals were representative of the same overarching group, and therefore all individuals mutually informed each other's estimates.

階層モデルを使う理由は、個々の違い、そしてグループレベルの傾向を捉える合理的な方法だから。このモデルが前提とするのは、個々が同じグループを表し、そして個々はお互いの推定値を伝達しあう。

「守備毎打撃力」に続く。

りんだろぐ rindalog

2015年12月2日水曜日

階層型モデル：Therapeutic Touch を検証

0 件のコメント:

コメントを投稿