2015年12月2日水曜日

階層型モデル:Multiple Coins From A Single Mint

視覚化」からの続き。

階層モデルについて前回までは A Single Coin From a Single Mint 、つまり「1つの造幣局から1つのコインを観察」。今回は Multiple Coins From A single Mint 「1つの造幣局の複数コインの観察」。こちらの方がより現実的なのは明らか。

もっと具体的な例では「記憶力を向上させる薬の効果の分析」。「複数の被験者」が「複数コイン」に相当。それぞれの被験者が「単語をどれだけ記憶できるか」が観測データ。そのデータはが依存するのは被験者の θS だけで、この分析で最も注目すべきは ω の推定値。


ここでの最大の関心は、複数コインの偏りではなく全コインの偏りに影響する ω

左は図 9.4 で、A Single Coin From a Single Mint の図 9.1 と異なるのは観測データが yi から、複数コイン(Subject)のデータ yi | s の変更のみ。
これは図 9.5 と 図 9.6 、違いは priorK = 5 75 のみ。ここでは、両方の図を比べながらポイントを示す。以降、図 9.5 を左図、図 9.6 を右図と記す。

prior の違いは「等高線」(ここでは楕円の形のグラフ)。K が小さい左図に比べて、大きい右図では「狭い」等高線。これは、大きい  では θ が ω  に近似するから。また、ω の分布が「広い」のは Aω, Bω が小さいため(「確信のない」ω )。

左右の図で Likelihood は同じ、表の割合は D1: 3/15 = 0.2, D2: 4/5 = 0.8

posterior の両者の違いが興味深い。

先ずは左図の posterior p(θ1|D1)p(θ2|D2) は、Likelihood で表の割合 0.2, 0.8 の影響を受けた分布を示す(「確信のない」ω  が原因)。ただ、D1 が D2 よりデータ数が多い(15 > 5)ため、p(θ1|D1) の方が「狭い分布」を示す(より確信がある)。p(ω|D)prior からの変化は少ない。

次に右図の posterior の p(θ2|D2) は、データは 0.8 のピークにも関わらず、0.4 近辺でピークを示す分布。これはサンプル数が多い D1 の割合 0.2 の影響を受けた ω p(ω|D) ) 0.4 近辺で「狭い」ピーク)が、θ2 の見積りに影響を与えたため。D2 も ω , θ2 に影響はするが、D2 と比較して小さい。

左右の図における、この posterior の違いの原因は  の大きさ 5, 75 の違いから来ている( K が大きいほど θ に近似する)。

現実的なデータ分析において、 はこのように「定数」ではなく「変数 」である。次回は「変数 に拡張した階層モデルで、より現実的な分析を行う。


Therapeutic Touch を検証」に続く。

0 件のコメント:

コメントを投稿