2016年9月12日月曜日

ベイズ的検定:差を見ること

ROPEHDI」からの続き。

It is important to understand that the marginal distributions of two parameters do not reveal whether or not the two parameter values are different. 
二つのパラメータの確率分布が、その二つの値が異なっているかどうかを、明らかにはしない。

このことを、図 12.1 の分布で見る。

12.1 は、パラメータ θ1, θ2 の分布は図の左右で同じ。しかし θ1θ2 の相関関係と θ1 - θ2 の分布は異なる。画像が小さくて見にくいが左上は p(θ1θD) 。


図の左側で、個々のパラメータ分布だけを見ると、この二つは重なる部分が多い。それをもって「この二つパラメータが異なるとは言い難い、つまり同じである可能性が高い」と判断して良いのだろうか?

それは間違い。θ1θ2 の分布の 95%HDI はゼロを外している、つまり「θ1, θ2 は同じとは言い難い」(even taking into account MCMC sampling instability and a small ROPE「MCMCサンプリングの不安定性と、小さい ROPE を加味したとしても」)

Because of this high correlation, the points in the joint distribution fall almost all on one side of the line of equality. 
原因は、強い相関。

方や右側では、θ1 - θ2 の分布の 95%HDI はゼロを含んでいる。今度は「θ1, θ2 は同じとすべき」となった。

The negative correlation causes the joint distribution to straddle the line of equality. 
原因は、負の相関。

以上をまとめると
In summary, the marginal distributions of two parameters do not indicate the relationship between the parameter values. The joint distribution of the two parameters might have positive or negative correlation (or even a non-linear dependency), and therefore the difference of the parameter values should be explicitly examined. 
二つのパラメータの確率分布は、それらの値の」関係を示すものではない。二つのパラメータに正負の相関(あるいは、non-linear dependency「非線形依存」)の可能性がある。よって、パラメータ値の差は明らかにすべき。

スッキリしない...

以上が本書の内容だが、実はスッキリしない点がある。

 正の相関なら θ1 - θ2 = 0 に偏るのでは?
 負の相関なら θ1 - θ2 ≠ 0 に偏るのでは?


これは、以下のように解釈することにした。

正の相関の場合は θ1 - θ2 の分布が「狭い」ため、95%HDI が 0 を外すことが多くなる。かたや負の相関の場合、θ1 - θ2 の分布が「広い」ため、95%HDI が 0 を含みやすくなる。

実際、図 12.1 に「狭さ」の指摘がある。

When there is a positive correlation between parameters, as shown in the left quartet, the distribution of differences is narrower than when there is a negative correlation, as shown in the right quartet.

まぁ、これでちょっとはスッキリした。厳密に数学的に証明できそうな気がするが、遠慮する。ここで重要なのは「差を見る」ことだから。

0 件のコメント:

コメントを投稿