Upload
others
View
2
Download
0
Embed Size (px)
Citation preview
.
.
. ..
.
.
確率統計 bクラス
倉田 和浩
2011年 2月 15日
倉田 和浩 () 確率統計 bクラス 2011年 2月 15日 1 / 22
目次
目次
.. .1 期末試験(解説)
.. .2 適合度検定
倉田 和浩 () 確率統計 bクラス 2011年 2月 15日 2 / 22
期末試験(解説)
問題 1
確率変数 X は 2項分布 B(180, 16)に従うとする.
(1) ド・モアブル-ラプラスの定理によって X が近似的に従う正規分布を N(µ, σ2)としたときの µ, σ2 をそれぞれ求めよ.(2) 確率 P(20 ≤ X ≤ 35)の近似値を求めよ.
倉田 和浩 () 確率統計 bクラス 2011年 2月 15日 3 / 22
期末試験(解説)
問題 1の解答例.
(1) n = 180が十分大きいとして, ・モアブル-ラプラスの定理によって, 近似的に正規分布 N(180× 1
6, 180× 1
6× (1− 1
6)) = N(30, 25)に
従う. よって, µ = 30, σ2 = 25.(2)従って, 標準化した
Z =X − 30
5
は標準正規分布 N(0, 1)に近似的に従う. よって
P(20 ≤ X ≤ 35) = P(−2 ≤ X − 30
5≤ 1)
= 1− P(Z ≥ 1)− P(Z ≤ −2)
≃ 1− P(Z ≥ 1)− P(Z ≥ 2) ≃ 1− 0.1587− 0.0228 = 0.8185.
倉田 和浩 () 確率統計 bクラス 2011年 2月 15日 4 / 22
期末試験(解説)
問題 2
X1,X2, · · · ,Xn を, 正規母集団 N(µ, σ2)からの無作為抽出とする.(1) 標本平均 X = 1
n(X1 + X2 + · · ·+ Xn) の従う分布は何か?
(2) 母分散 σ2 = 52 は既知であるとする. 標本のサイズが n = 100で, 標本平均の実現値が x = 15であったという. このとき, 母平均 µの信頼係数 95%での信頼区間を求めよ.(3) 母分散 σ2 = 52 は既知であるとする. このとき母平均 µの信頼係数 95%での信頼区間の幅を 0.1以下にしたければ, 標本サイズ nをどのくらい大きく取ればよいか?
倉田 和浩 () 確率統計 bクラス 2011年 2月 15日 5 / 22
期末試験(解説)
問題 2の解答例:(母分散が既知の場合の母平均の区間推定)
(1) 正規分布 N(µ, σ2
n).
(2)α = 0.05のときの信頼区間は[x − z0.025 ×
σ√n, x + z0.025 ×
σ√n
]なので, 求める信頼区間は,z0.025 ≃ 1.96より
[15− 1.965
10, 15 + 1.96
5
10] ≃ [14.02, 15.98].
(3)信頼区間の幅は, 2z0.025σ√nなので条件より,
2× 1.96× 5√n≤ 0.1.
よって 196 ≤√n, すなわち 1962 = 38416 ≤ nなるよう十分大きな
nを取ればよい.倉田 和浩 () 確率統計 bクラス 2011年 2月 15日 6 / 22
期末試験(解説)
問題 3
X1,X2, · · · ,Xn を, 正規母集団 N(µ, σ2)からの無作為抽出とする.(1) 標本不偏分散 V とは何か?(2) X を標本平均, V を標本不偏分散とするとき, T = X−µ√
Vn
は自由度
(n − 1)の t-分布に従うことが知られている. ある工場で作っている製品の長さが正規分布に従うとして, 5個の製品を無作為に抽出してその長さを測定したところ,x1 = 10, x2 = 12, x3 = 9, x4 = 11, x5 = 8(cm)であったという. このとき母平均 µの信頼係数 95%での信頼区間を求めよ.
倉田 和浩 () 確率統計 bクラス 2011年 2月 15日 7 / 22
期末試験(解説)
問題 3の解答例:(母分散が未知の場合の母平均の区間推定)
(1) 標本不偏分散 V は V = 1n−1
∑ni=1(Xi − X )2 で定義される統計量
である. ( 分散について不偏性および一致性という良い性質をもつので, 分散の推定値(点推定)を求める際によく用いられる.)(2) 標本平均および標本不偏分散の実現値はそれぞれ次のとおり:x = 1
5(10 + 12 + 9 + 11 + 8) = 10,
v = 14
{(10−10)2+(12−10)2+(9−10)2+(11−10)2+(8−10)2
}= 2.5.
求める信頼区間は,[x − t(n − 1;
α
2)
√v
n, x + t(n − 1;
α
2)
√v
n
]なので, t(4; 0.025) = 2.776より
[10− 2.776×√
2.5
5, 10 + 2.776×
√2.5
5] ≃ [8.04, 11.96]
を得る.倉田 和浩 () 確率統計 bクラス 2011年 2月 15日 8 / 22
期末試験(解説)
問題 4
(1) ある会社の缶コーヒーの内容量 X の表示が 350mlと書いてある.X は正規分布に従い, 過去の経験から分散は σ2 = 16としてよいことが分かっている. 最近どうも内容量が少なくなっているのでは?という声がある. そこである日無作為に 100個の缶コーヒーを取り出して, 内容量の平均が 349mlであったという. 内容量がすくなっているといってよいか, 有意水準 5%で片側検定せよ.(2) コインを 200回投げて, 120回表がでたという. このコインは正しいコインと言えるか?有意水準 5%で片側検定せよ.
倉田 和浩 () 確率統計 bクラス 2011年 2月 15日 9 / 22
期末試験(解説)
問題 4(1)の解答例:(母分散は既知としての母平均の検定)
(1)内容量は変わっていないとして, 帰無仮説 H0 : µ = 350, 対立仮説 H1 : µ < 350として, 有意水準 5%で片側検定する.
√n
(x − 350
σ
)≤ −z0.05
なら仮説 H0 は棄却される. 今, z0.05 ≃ 1.64,
√100
(349− 350
4
)= −2.5
なので, 有意水準 5%で H0 は棄却される. 従って内容量は少なくなっていると言ってよい.
倉田 和浩 () 確率統計 bクラス 2011年 2月 15日 10 / 22
期末試験(解説)
問題 4(2)の解答例:(比率の検定)
(2) (表が多くでているので, 表が出る確率 p は 12より大きいのでは
ないか?と疑問視される状況であると理解しての片側検定を行う.)正しいコインであるとして, 帰無仮説 H0 : P = 1
2(= p0), 対立仮説
H1 : p > 12として, 有意水準 5%で片側検定する.
x − np0√np0(1− p0)
≥ z0.05
ならば H0 は棄却される. 今
120− 200× 12√
200× 12× 1
2
= 2√2 ≃ 2.82 > z0.05 = 1.65
となるので, 有意水準 5%で H0 は棄却される. 従って正しいコインと言えない.
倉田 和浩 () 確率統計 bクラス 2011年 2月 15日 11 / 22
期末試験(解説)
問題 5
X1,X2, · · · ,Xn を, 正規母集団 N(µ, σ2)からの無作為抽出とする. 確率変数 S を次にようにおく.
S =n∑
i=1
(Xi − X )2, X =1
n(X1 + X2 + · · ·+ Xn)
(1) Sσ2 の従う分布は何か?
(2) あるビニールハウスで生産しているミカンの重さが従来正規分布N(150, 102)に従っていた. 最近ミカンの重さの分散が大きくなっているかどうか調べるために 20個のミカンを無作為抽出して重さをはかってみたところ, その標本分散が 127であったという. このとき母分散 σ2 は従来とかわらず 102 であるといってよいか?有意水準 5%で片側検定せよ.
倉田 和浩 () 確率統計 bクラス 2011年 2月 15日 12 / 22
期末試験(解説)
問題 5の解答例:(母分散の検定)
(1) 自由度 (n − 1)の χ2 分布.(2)母分散は変わっていないとして, 帰無仮説 H0 : σ
2 = 102(= σ20),
対立仮説 H1 : σ2 > 102 として, 有意水準 5%で片側検定する.
S の実現値 s に対して
s
σ20
≥ χ2(19; 0.05)
なら H0 は棄却されることになる. 今の場合, 標本分散が 127なのでs = 127× 20. よって
s
σ20
=127× 20
102= 25.4 < χ2(19; 0.05) = 30.144
となるので H0 は棄却されない. 従って, ミカンの重さの母分散は従来と変わらず σ2 = 102 であるといってよい.
倉田 和浩 () 確率統計 bクラス 2011年 2月 15日 13 / 22
適合度検定
適合度検定
例題 1: サイコロを 120回投げたところ, 出た目の回数は次の通りであった.
サイコロの目 1 2 3 4 5 6 計出た目の回数 25 14 12 29 15 25 120
このサイコロのそれぞれの目のでる確率はすべて同じ 16であると
いってよいか?
例題 2: ある本によると血液型は A : B : O : AB = 2 : 3 : 3 : 2であるという. 今 100人を無作為抽出して調べてみたところ A,B,O, AB型の人数がそれぞれ順に 23, 32, 37, 8人であった. この本の主張は正しいと言えるか?
倉田 和浩 () 確率統計 bクラス 2011年 2月 15日 14 / 22
適合度検定
適合度検定
ある試行の結果, データが k 個のクラス A1,A2, · · · ,Ak のいずれかに入るとする.検定したい仮説 H0: Ai の起こる確率は pi である (i = 1, 2, · · · , k).実際に n回試行して, Ai の起こる回数(観測度数という)が xi であるとする. 仮説が正しいとすると, Ai の起こる回数の平均(期待度数という)は, npi に近いはず.
A1 A2 · · · Ak
観測度数 x1 x2 · · · xk期待度数 np1 np2 · · · npk
倉田 和浩 () 確率統計 bクラス 2011年 2月 15日 15 / 22
適合度検定
多項分布
Xi を n回のうち Ai の起こる回数を表す確率変数とするとき,X1,X2, · · · ,Xk は多項分布に従う:すなわち,
P(X1 = r1,X2 = r2, · · · ,Xk = rk) =n!
r1!r2! · · · rk !pr11 p
r22 · · · prk
k .
♣ なぜなら, P(X1 = r1,X2 = r2, · · · ,Xk = rk) は,
nCr1pr11 × n−r1Cr2p
r22 × n−r1−r2Cr3p
r33 × · · · × n−r1−r2−···−rk−1
Crkprkk
であって,次が成り立つため.
nCr1 × n−r1Cr2 × n−r1−r2Cr3 × · · · × n−r1−r2−···−rk−1Crk
=n!
(n − r1)!(r1)!
(n − r1)!
(n − r1 − r2)!(r2)!
(n − r1 − r2)!
(n − r1 − r2 − r3)!(r3)!· · ·
=n!
(r1)!(r2)! · · · (rk)!倉田 和浩 () 確率統計 bクラス 2011年 2月 15日 16 / 22
適合度検定
2項分布との関係
特に k = 2のとき,
P(X1 = r1,X2 = r2) =n!
(r1)!(r2)!pr11 p
r22 ,
ただし, p1 + p2 = 1, r1 + r2 = nなので,
(P(X1 = r1) =)P(X1 = r1,X2 = r2) =n!
(r1)!(n − r1)!pr11 (1− p1)
n−r1
となって, X1 はいわゆる2項分布に従う.
倉田 和浩 () 確率統計 bクラス 2011年 2月 15日 17 / 22
適合度検定
k = 2の場合:自由度 1(= k − 1)の χ2分布
このときの X1 の分散は np1(1− p1)であった. 十分大きな nに対して, X1−np1√
np1(1−p1)は近似的に N(0, 1)に従うことになる.
従って (X1−np1)2
np1(1−p1)は自由度 1の χ2 分布に従う. このとき,
X1 + X2 = n, p2 = 1− p1 より,
(X1 − np1)2
np1+
(X2 − np2)2
np2=
(X1 − np1)2
np1+
(n − X1 − n(1− p1))2
n(1− p1)
=(X1 − np1)
2
np1+
(X1 − np1)2
n(1− p1)=
(X1 − np1)2
np1(1− p1)
となることに注意. つまり,
(X1 − np1)2
np1+
(X2 − np2)2
np2
が自由度 1の χ2 分布に従うこととなる.倉田 和浩 () 確率統計 bクラス 2011年 2月 15日 18 / 22
適合度検定
自由度 (k − 1)の χ2分布
一般に次のことが成り立つことが知られている..定理..
.
. ..
.
.
nが十分に大きいとき,∑k
i=1(Xi−npi )
2
npiは自由度 (k − 1)の χ2 分布に
従う.
♣ これをもとに, Xi の実現値を xi として,
k∑i=1
(xi − npi)2
npi≥ χ2(k − 1;α)
ならば, 有意水準 100× α%で仮説 H0 が棄却されることとなる.♣ 今までは, 検定は主に帰無仮説 H0 の棄却が目的であったが, 適合度検定は適合度のチェックであり, 採択の方が主な目的となる.
倉田 和浩 () 確率統計 bクラス 2011年 2月 15日 19 / 22
適合度検定
適合度検定: 例題 1の解答例
例題 1:仮説 H0:サイコロのでる目の確率はすべて同じ 16であるを, 有
意水準 5%で検定する.
(25− 120× 16)2
120× 16
+(14− 120× 1
6)2
120× 16
+(12− 120× 1
6)2
120× 16
+(29− 120× 1
6)2
120× 16
+(15− 120× 1
6)2
120× 16
+(25− 120× 1
6)2
120× 16
=1
20
{(25− 20)2 + (14− 20)2 + (12− 20)2 + (29− 20)2
+(15− 20)2 + (25− 20)2}
倉田 和浩 () 確率統計 bクラス 2011年 2月 15日 20 / 22
適合度検定
=1
20(25 + 36 + 64 + 81 + 25 + 25) = 12.8.
一方, χ2(5; 0.05) = 11.07 なので, 有意水準 5%で仮説 H0 は棄却される. つまり, サイコロのでる目はすべて同じとはいえない.
倉田 和浩 () 確率統計 bクラス 2011年 2月 15日 21 / 22
適合度検定
例題 2の解答例
仮説 H0:
pA =1
5, pB =
3
10, pO =
3
10, pAB =
1
5
を有意水準 5%で検定する.
(23− 100× 15)2
100× 15
+(32− 100× 3
10)2
100× 310
+(37− 100× 3
10)2
100× 310
+(8− 100× 1
5)2
100× 15
=9
20+
4
30+
49
30+
122
20=
565
60≃ 9.4.
一方, χ2(3; 0.05) = 7.815なので, 有意水準 5%で仮説 H0 は棄却される. よって, この本の主張は正しくないと言える.
倉田 和浩 () 確率統計 bクラス 2011年 2月 15日 22 / 22