2015年11月10日火曜日

実習8.1,4 "Hot Hand"は存在するか?

JAGS, 離散型分析, Metropolis Algorithm , Gibbsサンプリング」からの続き。


実習8.1 バスケットボールの "hot hand" の有無を分析。"hot hand" とは「成功ショット(ゴール)は直前のショットの成功に依存する」というもの。ここでの分析方法は、フリースローで、1 回目が成功した後の 2 回目のショットは、1 回目で失敗した場合よりも成功するか否か。つまり、"hot hand" が存在する条件を「成功の後の成功の確率が、失敗の後の成功の確率よりも高いこと」とした。

標本データは、あるプロバスケットボール選手の 1980 〜 1982 年の全 338 回のフリースローの結果を使用

1回目の成功回数:285 
1回目の失敗回数:53 
1回目成功後の2回目成功回数:251
1回目成功後の2回目失敗回数:24
1回目失敗後の2回目成功回数:48
1回目失敗後の2回目失敗回数:5


標本データから、成功後の成功確率 251/285 と 失敗後の成功確率 48/53 の違いを分析する。

「成功後の成功割合」を θ1 、「失敗後の成功割合」を θ2 、事前確率確率はともに beta(θ| 30, 10) とする。これは、プロ選手であれば 75% の確率でフリースローは成功するという仮定から。

以下は、スクリプト BernTwoJags.R の変更点

model {
    # Likelihood. Each flip is Bernoulli.
    for ( i in 1 : N1 ) { y1[i] ~ dbern( theta1 ) }
    for ( i in 1 : N2 ) { y2[i] ~ dbern( theta2 ) }
    theta1 ~ dbeta( 30 , 10 )
    theta2 ~ dbeta( 30 , 10 )
}

dataList = list(
    N1 = 285 ,
    y1 = c( rep(1, 251), rep(0,285-251) ),
    N2 = 53 ,
    y2 = c( rep(1, 48), rep(0, 53-48) )
)

左が実行例。

θ1 - θ295%HDI 区間が [ -0.0548, 0.111 ] 、0 以下を含んでいるため、"hot hand" の存在を確信をもって主張はできない。

標本データの単純な確率計算

> 251/285; 48/53
[1] 0.8807018
[1] 0.9056604

の結果からも「"hot hand" なんて無い」と直感でも分かるが、事後確率の 95%HDI でより明確になる。


実習8.4  Metropolis algorithm で、提案値の分布の標準偏差の違いによる、ランダムウォークの結果を比較。

BernTwoMetropolis.Rsd1, sd2 の値を変更してスクリプトを実行。

適切な SD

sd1 = 0.2 ; sd2 = 0.2

小さすぎるSD

sd1 = 0.005 ; sd2 = 0.005

提案値の受入率が 0.978 と高すぎるし、SD が小さすぎるので、ランダムウォークが「塊すぎ」になっている。

このようなランダムウォークもあるかもしれないが、SD = 0.2 の場合と比較すると、信頼性に欠ける。


大きすぎるSD

sd1 = 5.0 ; sd2 = 5.0

提案値の受入率が 0.002 でほぼ皆無で、ランダムウォークになっていない。

本課題が示すのは、提案値の分布の調整の重要性。


実習8.5 Posterior Prediction」に続く。

0 件のコメント:

コメントを投稿