22
復元抽出乱数シミュレーションいた信頼区間検討

草薙 2013 nagoyar11 復元抽出と乱数シミュレーションによる信頼区間の検討

Embed Size (px)

DESCRIPTION

草薙邦広「復元抽出と乱数シミュレーションを用いた信頼区間の検討」2013年12月7日. Nagoya R #11, 名古屋大学国際開発研究科.

Citation preview

Page 1: 草薙 2013 nagoyar11 復元抽出と乱数シミュレーションによる信頼区間の検討

復元抽出と乱数シミュレーションを

⽤いた信頼区間の検討

Page 2: 草薙 2013 nagoyar11 復元抽出と乱数シミュレーションによる信頼区間の検討

[email protected] R #11

2013/12/5名古屋⼤学国際開発研究科

Page 3: 草薙 2013 nagoyar11 復元抽出と乱数シミュレーションによる信頼区間の検討

信頼区間• ⺟数がどのような数値の範囲にあるか

– Cf. 予測区間(標本値の推定範囲)– 統計量(標本から求められる⺟集団の⺟数の推定

量)– 確率

• 95%, 99%– 求め⽅

• パラメトリック• ノンパラメトリック• 確率分布に基づく計算• ブートストラップ

Page 4: 草薙 2013 nagoyar11 復元抽出と乱数シミュレーションによる信頼区間の検討

信頼区間• 情報量の多さ

– スケールが失われない– 推定の正しさも加味される

• APAでも報告を推奨されている(APA, 2009)

• 統計的仮説検定に依存せず,効果量,検定⼒などと合わせ吟味すべき

Page 5: 草薙 2013 nagoyar11 復元抽出と乱数シミュレーションによる信頼区間の検討

信頼区間• 確率分布に基づく⺟平均の計算例

– 正規分布を考える– 点推定:標本の平均値(M)→⺟平均(μ)の

推定値とみなす– 区間推定: M ± t(df, 任意の確率)×(SD/√N)– Nが∞時,t値は約1.96(95%)になる

Page 6: 草薙 2013 nagoyar11 復元抽出と乱数シミュレーションによる信頼区間の検討

信頼区間• Rで計算してみる

– ⾃作関数 pmci

pmci <‐ function(data){l1 <‐mean(data)‐qt(0.975, length(data)‐1)*(sd(data)/sqrt(length(data)))u1 <‐mean(data)+qt(0.975, length(data)‐1)*(sd(data)/sqrt(length(data)))l2 <‐mean(data)‐qt(0.995, length(data)‐1)*(sd(data)/sqrt(length(data)))u2 <‐mean(data)+qt(0.995, length(data)‐1)*(sd(data)/sqrt(length(data)))list("95%CI:lower"=l1, "95%CI:upper"=u1, "99%CI:lower"=l2, "99%CI:upper"=u2)

}

Page 7: 草薙 2013 nagoyar11 復元抽出と乱数シミュレーションによる信頼区間の検討

信頼区間• 可視化したり報告したり

– 95% CI [下限, 上限]

Page 8: 草薙 2013 nagoyar11 復元抽出と乱数シミュレーションによる信頼区間の検討

リサンプリング• 確率分布に基づく計算

– 条件が多い– 数学的にもやや複雑– 理想化が激しい– 条件を取っ払い計算機の⼒で代⽤しよう!

Page 9: 草薙 2013 nagoyar11 復元抽出と乱数シミュレーションによる信頼区間の検討

リサンプリング• リサンプリングとは

– 標本から再度標本を作り出す統計⼿法全般• 様々な⽅法

– パラメトリック• 標本値から得られた確率密度関数に従う乱数を⽣成す

る⽅法(モンテカルロ法)– ノンパラメトリック

• 元標本を複数抽出することによってブートストラップ標本を作り出す⼿法

• 復元抽出(replacement):– 抽出の重複を認めるか– 認める/認めない(ジャックナイフ法)

Page 10: 草薙 2013 nagoyar11 復元抽出と乱数シミュレーションによる信頼区間の検討

リサンプリング• 理屈

– 元標本から⽣成された⼤数のブートストラップ標本の分布は⺟分布に近似する

• 標本は⺟集団の⼀部• 標本値を再度選ぶのは⺟集団からもう⼀個取るの

と同じ

Page 11: 草薙 2013 nagoyar11 復元抽出と乱数シミュレーションによる信頼区間の検討

乱数シミュレーション• ⼿順

– あるテスト,30個の標本を得た– 元標本から推定されたμとσはそれぞれ,73.21,

10,24だった– その分布に従う30個(ブートストラップ標本サ

イズ)の乱数を1000個作る(ブートストラップ標本数,B)

– そのブートストラップ標本毎に平均値を求める– 1000個のブートストラップ平均値の分布は⺟平

均値の分布に近似するだろう→可視化したりできるし,順序区間を信頼区間と

みなすことによって区間を推定できる!

Page 12: 草薙 2013 nagoyar11 復元抽出と乱数シミュレーションによる信頼区間の検討

乱数シミュレーション• Rでやってみる

– bsm <- numeric(0)– for(i in 1:1000){bs <- rnorm(30,73.21,10.24); bsm[i] <- mean(bs)}– hist(bsm)

– quantile(bsm, c(0.025, 0.975))

Page 13: 草薙 2013 nagoyar11 復元抽出と乱数シミュレーションによる信頼区間の検討

復元抽出• ブートストラップ信頼区間の計算法

– パーセンタイル法• ⼀番シンプル• ブートストラップ標本それぞれにおける統計量の

順序区間を信頼区間とみなす– パーセンタイルt法– BCa法– ベーシック法…

Page 14: 草薙 2013 nagoyar11 復元抽出と乱数シミュレーションによる信頼区間の検討

復元抽出• ⼿順

– あるテスト,30個の標本(元標本)を得た– 30個から重複有りで,30個標本値を取り出す

(ブートストラップ標本)– そのブートストラップ標本毎に平均値を求め

る– 1000個のブートストラップ平均値の分布は⺟

平均値の分布に近似するだろう→可視化したりできるし,順序区間を信頼区間

とみなすことによって区間を推定できる!

Page 15: 草薙 2013 nagoyar11 復元抽出と乱数シミュレーションによる信頼区間の検討

復元抽出• Rでやってみよう!

– bsm <- numeric(0)– for(i in 1:1000){bs <- sample(dat, 30, replace=T);bsm[i]

<- mean(bs)}– quantile(bsm, c(0.025, 0.975))

Page 16: 草薙 2013 nagoyar11 復元抽出と乱数シミュレーションによる信頼区間の検討

応⽤• 基本的にどんな統計量でもできる

– 平均差– 平均差の検定のt値,有意確率– 効果量– 回帰係数– 相関係数– 信頼性係数

– 形態素習得研究におけるGSM(草薙, 2013a)

Page 17: 草薙 2013 nagoyar11 復元抽出と乱数シミュレーションによる信頼区間の検討

応⽤• ⼆変数の標準化平均差(Cohenʼs d)の

ブートストラップ信頼区間• bootd(tests, 1000, 10)

• $summary

• Min. 1st Qu.  Median    Mean 3rd Qu.    Max.

• ‐1.4590 ‐0.4546 ‐0.2484 ‐0.2233  0.0000  0.8784

•• $`95%CI`

• 2.5%      97.5%

• ‐0.8994050  0.5433483

bootd <‐ function(x, n.boot, n.sub){

meany = numeric(0)for(i in 1:n.boot){

subs <‐x[sample(nrow(x),n.sub,replace=TRUE),]

y[i] <‐ c((mean(subs[,1])‐mean(subs[,2]))/(sqrt((sd(subs[,1])^2+sd(subs[,2])^2)/2)))

meany[i] <‐mean(y)}par(mfrow=c(1,3))

boxplot(y, ylab="score") plot(meany, xlab="", ylab="score")hist(y, ylab="frequency", 

xlab="score", main="")list("summary"=summary(y),"95%CI"=quantile(y,p=c(

0.025,0.975)), "sd"=sd(y))}

Page 18: 草薙 2013 nagoyar11 復元抽出と乱数シミュレーションによる信頼区間の検討

応⽤• ブートストラップ標本における標準化平均差の累積順位

– 追⾏確率関数の推定• 上記のデータだと1000回中687個のデータが負の効果量を取った

ということ。• 同条件で実験した場合,⼤体69%は同じ符号の効果量を取りそう

だといえる

Page 19: 草薙 2013 nagoyar11 復元抽出と乱数シミュレーションによる信頼区間の検討

Point estimate 95% CI

Flat adverb 526 [492, 559]

Adj-ly adverb 509 [484, 538]

⺟平均値

効果量Point estimate 95% CI

Effect size d 0.19 [0.36, 0.74]

可視化草薙(2013b)

Page 20: 草薙 2013 nagoyar11 復元抽出と乱数シミュレーションによる信頼区間の検討

400

500

600

700

slow straight different late close quick deep safe

Rea

din

g ti

me

(ms)

Flat adverbly adverb

可視化草薙(2013b)

Page 21: 草薙 2013 nagoyar11 復元抽出と乱数シミュレーションによる信頼区間の検討

ただし• ブートストラップは元標本に依存する

– 適⽤でない場合も勿論ある• あくまでも,ひとつのシミュレーション

的データとして解釈すべき• ⼀回ごとに違う数値になる

Page 22: 草薙 2013 nagoyar11 復元抽出と乱数シミュレーションによる信頼区間の検討

復元抽出と乱数シミュレーションを

⽤いた信頼区間の検討やってみようず!

草薙邦広(2013a)「形態素習得研究とリサンプリング」 Nagoya R #10, 名古屋⼤学国際開発研究科.http://www.slideshare.net/Kunihiro_KUSANAGI/nagoyar‐24447878 

草薙邦広 (2013b) 「第⼆⾔語としての英語における単純形副詞のオンライン処理:⾃⼰ペース読み課題を⽤いた予備的検討」 第82回外国語教育メディア学会中部⽀部秋季研究⼤会. 中部⼤学.

http://www.slideshare.net/Kunihiro_KUSANAGI/let2013‐flatadverb