2015年12月2日水曜日

階層型モデル:Therapeutic Touch を検証

Multiple Coins From A single Mint」からの続き。

前回「 K がより大きいほど θ に近似する」と表した。これを逆に考えると、直感的に次のことが言える

異なるコインで表が出る割合が近似すると k は大きい値で、近似しないと k は小さい。

つまり、k はデータから導けるということ。ここで小文字 k としたように、今回はより現実的に変数 k とする( k が定数なのは非現実的)。

左は図 9.7 、前回の "Multiple Coins From A Single Mint" の図 9.4 との違いは、kγ(ガンマ)関数を prior とする変数であること。

「なぜ γ 関数なのか」については割愛(本書には十分な説明あり)。


検証 Therapeutic Touch

本書の例は、Therapeutic Touchセラピューティック・タッチ)の「信憑性」を検証するもの。こんな治療法は冗談かと思ったが、信じている人が少なからずいるそうだ。データは、9 歳の少女エミリー・ローザによる実際の観測データ。

ここでは、この治療法とエミリーの実験については触れず、観測データのみで Therapeutic Touch を検証する。

Therapeutic Touch を持つとされる 28 名が被験者。左が図 9.9 の観測データで「正解率のヒストグラム」。正解率が高い度数が大きいほど、この治療法の信憑性は高いと判断する。

以下は、本書提供のスクリプト Jags-Ydich-XnomSsubj-MbernBetaOmegaKappa.R の実行結果(本書では図 9.10 に相当、サンプリングなので本書とは値が異なる)。kω 、各 θ に分けて結果を検証する。
ω は mode = 0.438, 95%HDI [0.35 : 0.512] で「かろうじて半分正解かどうか」という結果。この結果は「当てずっぽう」のコインの裏表の予想と同じということ。Therapeutic Touch が存在するなら、少なくとも 95%HDI0.5 以上であるべきで、信憑性が高いとするには 0.7 以上は必要ではなかろうか?

というか、正解率が 51.2 % 以上の確率が 2.5 % 未満(100 人中 人未満)な主張を、あなたは信じますか?

次は、個々の θ  、そして θ  差の分布を見る。
上図では「赤字の +」が正解率、以下の観測データから、正解率が最低なのは θ1 、最高なのは θ28

> table(myData)
   s
y   S01 S02 S03 S04 ... S14 ... S27 S28
  0   9   8   7   7 ...   6 ...   3   2
  1   1   2   3   3 ...   4 ...   7   8

注目すべきは、θ1 の分布でピークの 0.30 近辺と正解率 0.10 が大きく外れていること。この理由は、θを除く 27 名の被験者の正解率が θ1 に勝っているため。別の言い方をすれば、その被験者 27 名が「group-level parameters グループレベルのパラメータ」(ここでは k, ω)に影響し、group-level parameters は個々の θ を group の典型的な値に「引っ張る」。これは最大の正解率の θ28 でも同様で、0.80 の正解率にも関わらず、分布のピークは 0.55 近辺に「引っ張られて」いる。


Shrinkage

つまり、ここでは個々 θの偏りは zs/Ns (例えば、データから得たコイン表の割合)ではなく、group-level modeω の方に近似するということ。

Thus, the variance between the estimated values θs is less than the variance between the data values zs/Ns . 
したがって、推定値 θ の分散は、データ zs/Ns の分散より小さくなる。
This reduction of variance in the estimators, relative to the data is the general property referred to by the term "shrinkage."
データに対して、推定値の分散が縮小する一般的な性質を "shrinkage" と呼ぶ。

ちなみ "shrinkage" は、階層型モデルの特徴(Bayesian の特徴ではない)。

正解率が最小と最大の比較分布(θ1 - θ28)は、- 0.1 近辺のピーク、95%HDI [-0.401 : 0.121] で「ゼロを含む」。つまり「正解率の差が最大の場合でも、違いはない」ということ。先の ω の結果と合わせての結論は「Therapeutic Touch の存在は考えにくい」(簡潔に「そんなもんはない!」です)。


階層モデルの特徴

group-levelω は、全体の分布を示すもの。それが mode = 0.438, 95%HDI [0.35 : 0.512] の分布から、全体的な傾向からも「その存在は考えにくい」と判断できる。

以下は本書からの引用で、階層モデルの目的と特徴を示す。

We used a hierarchical model because it is a reasonable way to capture individual differences and group-level tendencies. The model assumed that all individuals were representative of the same overarching group, and therefore all individuals mutually informed each other's estimates. 
階層モデルを使う理由は、個々の違い、そしてグループレベルの傾向を捉える合理的な方法だから。このモデルが前提とするのは、個々が同じグループを表し、そして個々はお互いの推定値を伝達しあう。

守備毎打撃力」に続く。

0 件のコメント:

コメントを投稿