Upload
adna-eljsani
View
17
Download
1
Embed Size (px)
DESCRIPTION
optimizaciaj industrijskih procesa
Citation preview
1
Osnove tes*ranja hipoteze jednog uzorka
(nastavak)
Prof. dr. Mugdim Pašić
1
One-‐Tail Test • U prethodnim analizama primjera firme koja proizvodi žitarice HT metodologija je korištena da se ispita da li je aritme*čka sredina populacije količine žitarica u ku*ji 368 grama.
• Alterna*vna hipoteza, H1 : µ ≠ 368, sadrži dvije mogućnos*: – AS populacije < 368 i – AS populacije > 368
• Iz ovoga razloga područje odbacivanja je podijeljeno u dva repa sampling distribucije AS.
• U mnogim situacijama alterna*vna hipoteza se fokusira na određeni pravac (direc*on)
2
One-‐Tail Test – Lower Tail Test
• Npr. u našem primjeru firma je mogla samo da ispita da li je AS količine punjenja ku*jama žitaricama manja od 368, iz razloga da se kupci ne bi žalili.
• U ovom slučaju područje odbacivanja bi bilo locirano u samo donjem repu krive
• HT je: H0: µ ≥ 368 H1: µ < 368
3
z=0 µ = 368
α
Kri*čna vrijednost
Područje odbacivanja
One-‐Tail Test – Upper Tail Test
• Također firma je mogla samo da ispita da li je AS količine punjenja ku*jama žitaricama veća od 368, iz razloga da firma ne pravi gubitke.
• U ovom slučaju područje odbacivanja bi bilo locirano u samo gornjem repu krive
• HT je: H0: µ ≤ 368 H1: µ > 368
4
α
Kri*čna vrijednost
Područje odbacivanja
z=0 µ = 368
One-‐Tail Test– Lower Tail Test • Kompanija za proizvodnju sira otkupljuje mlijeko od individualnih dobavljača. Kompanija želi da se uvjeri da li dobavljači sipaju vodu u mlijeko, kako bi uvećali količinu mlijeka. Poznata je tačka smrzavanja prirodnog mlijeka µ = -‐0,545 , dok je standardna devijacija je σ = 0,008 .
• Kompanija je uzela uzorak od n=25 • α = 0,05 i ! = −0,540!
5
One-‐Tail Test– Lower Tail Test
• Pošto je kompanija zainteresirana samo da utvrdi da li je temperatura smrzavanja dostavljenog mlijeka veća od uobičajene temperature smrzavanja mlijeka, područje odbacivanja je locirano u gornjem repu krive distribucije.
6
2
One-‐Tail Test – Lower Tail Test
• H0 : µ ≤ -‐0,545 • H1 : µ > -‐0,545 • Alterna*vna hipoteza sadrži tvrdnju koju želimo dokaza*
• Ako je rezultat testa “Odbaci* H0 “ (“Reject H0“) postoji sta*s*čki dokaz da je prosječna temperatura smrzavanja mlijeka dobavljača veća od uobičajene prirodne temperature smrzavanja mlijeka.
7
One-‐Tail Test – Lower Tail Test • Pošto je poznata standardna devijacija populacije koris* se z test
• Područje odbacivanja je u potpunos* u gornjem repu krive jer će H0 bi* odbačena samo ako je AS uzorka signifikantno veća od -‐0,545
• Ovo je direkcioni test (One-‐Tail ili Direc7onal Test) • Kada H1 sadrži znak < onda z cri*cal mora bi* nega*vno.
• Kada H1 sadrži znak > onda z cri*cal mora bi* pozi*vno
8
Pošto je α = 0,05 Tražimo površinu: 0,5 – α = 0,45 Interpolacijom se dobije z=1,645
Standard Normal Curve Probability Distribution
Z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,091,0 0,3413 0,3438 0,3461 0,3485 0,3508 0,3531 0,3554 0,3577 0,3599 0,36211,1 0,3643 0,3665 0,3686 0,3708 0,3729 0,3749 0,3770 0,3790 0,3810 0,38301,2 0,3849 0,3869 0,3888 0,3907 0,3925 0,3944 0,3962 0,3980 0,3997 0,40151,3 0,4032 0,4049 0,4066 0,4082 0,4099 0,4115 0,4131 0,4147 0,4162 0,41771,4 0,4192 0,4207 0,4222 0,4236 0,4251 0,4265 0,4279 0,4292 0,4306 0,43191,5 0,4332 0,4345 0,4357 0,4370 0,4382 0,4394 0,4406 0,4418 0,4429 0,44411,6 0,4452 0,4463 0,4474 0,4484 0,4495 0,4505 0,4515 0,4525 0,4535 0,45451,7 0,4554 0,4564 0,4573 0,4582 0,4591 0,4599 0,4608 0,4616 0,4625 0,46331,8 0,4641 0,4649 0,4656 0,4664 0,4671 0,4678 0,4686 0,4693 0,4699 0,47061,9 0,4713 0,4719 0,4726 0,4732 0,4738 0,4744 0,4750 0,4756 0,4761 0,47672,0 0,4772 0,4778 0,4783 0,4788 0,4793 0,4798 0,4803 0,4808 0,4812 0,4817
9
One-‐Tail Test – Lower Tail Test
• Odbaci* H0 ako je zstat > 1,645 • U suprotnom Ne odbaci* H0
α= 0,05
Područje odbacivanja
0
0,95
Z crit = 1,645
!!"#" =! − !!!
= −0,540− (−0,545)0,00825
= 3,125!
Pošto je z stat > z crit Odbaci* H0
10
Z stat = -‐3,125
Zaključak
• Pošto je z stat > z crit • Odbaci* H0 • Dakle: • Postoji sta*s*čki dokaz da je prosječna temperatura smrzavanja mlijeka dobavljača signifikantno veća od prirodne temperature smrzavanja mlijeka -‐0,545
• Treba poduze* određene mjere
11 12
3
13
Z Test of Hypothesis for the Mean
Null Hypothesis µ= -0,545Level of Significance 0,05Population Standard Deviation 0,008Sample Size 25Sample Mean -0,55
Standard Error of the Mean 0,0016Z Test Statistic -3,125
Lower-Tail TestLower Critical Value -1,644853627p -Value 0,000889025
Reject the null hypothesis
Data
Intermediate Calculations
p-‐vrijednost pristup
• Pošto je područje odbacivanja u cjelos* u gornjem repu potrebno je naći vjerovatnoću da će z vrijednost bi* veća od z stat
14
Z crit = 1,645
Područje odbacivanja α= 0,05
0
p=?
Z stat = 3,125
!!"#" =! − !!!
= −0,540− (−0,545)0,00825
= 3,125!
p-‐vrijednost pristup
• Pošto je područje odbacivanja u cjelos* u gornjem repu potrebno je naći vjerovatnoću da će z vrijednost bi* veća od z stat
• Koristeći Tabelu ili funkciju Excel=1-‐NORMSDIT(3,125) dobije se vjerovatnoća p=0,0009
• Pošto je p < α (0,0009 < 0,05) ⟹ Odbaci* H0 • Postoji sta*s*čki dokaz da je prosječna temperatura smrzavanja mlijeka dobavljača signifikantno veća od prirodne temperature smrzavanja mlijeka -‐0,545
• Treba poduze* određene mjere.
!!"#" =! − !!!
= −0,540− (−0,545)0,00825
= 3,125!
15 16
Z crit = -‐1,645
Područje odbacivanja α= 0,05
0
p=0,0009
Z stat = 3,125
t – test za AS σ nepoznato
• U mnogim slučajevima nije poznata standardna devijacija populacije (σ)
• Pa se koris* standardna devijacija uzorka (s) • Sampling distribucija AS slijedi t distribuciju sa n-‐1 stepeni slobode (n=veličina uzorka)
• Ako populacija nije normalno distribuirana može se koris** t test ako je uzorak dovoljno velik (n ≥ 30)
17
t – test za AS σ nepoznato
• t-‐test hipoteze za AS, σ nepoznato:
𝑡𝑠𝑡𝑎𝑡 =�̅� − µμ𝑠√𝑛
18
4
t – test za AS σ nepoznato
• U zadnjih pet godina u jednom supermarketu prosječna potrošnja po računu je µ = 120 KM.
• Menadžer želi da utvrdi da li se ova potrošnja promijenila. Uzeo je uzorak od 12 računa i izabrao α=0,05.
19
t – test za AS σ nepoznato
• Podaci uzorka su da* niže Aritme*čka sredina je:
Standardna devijacija je:
Iznos računa (KM)
108,98 152,22 111,45 110,59 127,46 107,26
93,32 91,97
111,56 75,71
128,58 135,11
�̅� =∑𝑥𝑖𝑛
= 112,85 KM
𝑠 = #∑(𝑥𝑖−𝑥̅)2
𝑛−1= 20,80 KM
20
t – test za AS σ nepoznato
• H0: µ = 120 KM • H1: µ ≠ 120 KM • Alterna*vna hipoteza sadrži tvrdnju koju želimo dokaza*
• Ako se H0 odbaci onda postoji sta*s*čki dokaz da se AS populacije (prosječna potrošnja po računu) promijenila, odnosno da nije 120 KM.
• Ako je H0 ne odbaci onda ne postoji dovoljno dokaza da se prosječna potrošnja po računu promijenila odnosno da se razlikuje od dugogodišnjeg prosjeka od 120 KM.
21
t – test za AS σ nepoznato
• Kri*čna vrijednost t se nalazi iz tabele • tcrit=2,201
22
t – test za AS σ nepoznato
• Područje odbacivanja se dijeli na dva dijela • 0,025 u donjem repu i 0,025 u gornjem repu
t crit = -‐ 2,2010
0,4475 0,475
0,95 0,025 0,025
Područje odbacivanja
t crit = 2,2010
Područje odbacivanja
Područje neodbacivanja
120 KM
23
t – test za AS σ nepoznato
• Ako je tstat <-‐tcrit ili ako je tstat > tcrit Odbaci* H0 • U suprotnom ne odbaci* H0 • Pošto je -‐2,201 <tstat<2,201 • Ne odbaci* H0: µ = 120 KM • Nema dovoljno dokaza da se zaključi da se prosječna potrošnja po računu razlikuje od 120 KM.
𝑡𝑠𝑡𝑎𝑡 =�̅� − µμ𝑠√𝑛
=112,85 − 120
20,80√12
= −1,1908
24
5
25 26
t Test for Hypothesis of the Mean
Null Hypothesis µ= 120Level of Significance 0,05Sample Size 12Sample Mean 112,85Sample Standard Deviation 20,8
Standard Error of the Mean 6,0044428Degrees of Freedom 11t Test Statistic -1,19078493
Two-Tail TestLower Critical Value -2,200985159Upper Critical Value 2,200985159p -Value 0,258800339
Do not reject the null hypothesis
Data
Intermediate Calculations
p-‐value pristup • Koristeći funkciju Excela =TDIST(1,1908;11;2) dobije se vjerovatnoća p=0,2588
• Pošto je p > α (0,2588 > 0,05) ⟹ Ne odbaci* H0 • Nemate dovoljno dokaza da zaključite da se prosječna potrošnja po računu razlikuje od 120 KM.
• p vrijednost pokazuje da ako je H0: µ = 120 KM tačna, vjerovatnoća, da će uzorak od 12 računa ima* prosječnu vrijednost koja se razlikuje od 120 KM za 7,15 KM ili više, je 0,2588
• Drugim riječima, ako je AS računa tačno 120 KM, vjerovatnoća da ćemo dobi* promatranu AS uzorka od 12 računa manju od 112,85 ili veću od 127,15KM je 25,88%
27
Excel: p-‐vrijednost =TDIST(t;df;tails) =TDIST(1,1908;11;2) uporedi* p-‐vrijednost sa α Ako je p > α Ne odbaci* H0
t crit = -‐ 2,2010
0,4475 0,475
0,95 0,025
Područje odbacivanja
t crit = 2,2010
Područje odbacivanja
Područje neodbacivanja
28
tstat = -‐ 1,1908
p-‐vrijednost=0,2588 > 0,05
Provjera normaliteta distribucije • t test koris*mo ako je
– Nepoznata σ , standardna devijacija populacije – Uzorak je slučajni iz populacije koja je normalno distribuirana
• Provjera da li je populacija normalno distribuirana može se uradi* na osnovu toga da li je distribucija uzorka normalno distribuirana
• Ako je veličina uzorka mala (manja od 30) i ako ne možete provjeri* ili pretpostavi* da je populacija barem približno normalno distribuirana koriste se druge metode
29
z test HT za proporcije
• Ako je np ≥ 5, n(1-‐p) ≥ 5 • p može bi* aproksimirana sa normalnom distribucijom sa aritme*čkom sredinom i standardnom devijacijom
• Sampling distribucija p je normalno distribuirana
pµP = np)p(σ p
−=
1
30
6
z test HT za proporcije
• Gdje je:
𝑧 =�̅� − 𝑝
&𝑝(1 − 𝑝)𝑛
�̅� = 𝑝𝑟𝑜𝑝𝑜𝑟𝑐𝑖𝑗𝑎 𝑢𝑧𝑜𝑟𝑘𝑎 =𝑥𝑛 =
𝑏𝑟𝑜𝑗 uspjeha 𝑢 𝑢𝑧𝑜𝑟𝑘𝑢𝑛
𝑝 = ℎ𝑖𝑝𝑜𝑡𝑒𝑧𝑖𝑟𝑎𝑛𝑎 𝑝𝑟𝑜𝑝𝑜𝑟𝑐𝑖𝑗𝑎 uspjeha 𝑝𝑜𝑝𝑢𝑙𝑎𝑐𝑖𝑗𝑒
𝑛 = 𝑣𝑒𝑙𝑖č𝑖𝑛𝑎 𝑢𝑧𝑜𝑟𝑘𝑎
31
z test HT za proporcije • 50% vlasnika malih trgovačkih radnji je bilo mišljenja da su im veliki trgovački centri najveća opasnost za opstanak. Postavlja se pitanje, da li se taj procenat vlasnika malih radnji sa takvim mišljenjem promijenio.
• Napravljeno je istraživanje sa upitom šta vlasnici malih radnji smatraju najvećom opasnošću za svoj biznis. 78 od 151 vlasnika malih radnji je odgovorilo da su to veliki trgovački centri.
• Postavi* nultu i alterna*vnu hipotezu • Koris* se test u dva repa (two tailed test) • H0 : p = 0,5 • H1 : p ≠ 0,5
32
z test HT za proporcije
• Odaberete nivo signifikanotnos*, npr. α = 0,05
z = -‐ 1,96
0,475 0,475
0,95 0,025
Područje odbacivanja
z = 1,96
Područje odbacivanja
Područje neodbacivanja
33
0,025
z test HT za proporcije • Odbaci* H0: p = 0,5 ako je z < -‐1,96 ili ako je z > 1,96 • U suprotnom: Ne odbaci* H0 • H0 : p = 0,5 • H1 : p ≠ 0,5
• Pošto je -‐1,96 < Zstat=0,4069 < 1,96 • Ne odbaci7 H0: p = 0,5 •
�̅� =𝑥𝑛=78151
= 0,5166
𝑧 =�̅� − 𝑝
&𝑝(1 − 𝑝)𝑛
=0,5166 − 0,50
&0,50(1 − 0,50)151
=0,01660,0407
= 0,4069
50% vlasnika malih trgovačkih radnji misli da su im veliki trgovački centri najveća opasnost za opstanak. 34
z test HT za proporcije
• Odaberete nivo signifikanotnos*, npr. α = 0,05
ZCRIT = -‐ 1,96
0,4475 0,475
0,95 0,025
Područje odbacivanja
ZCRIT = 1,96
Područje odbacivanja
Područje neodbacivanja
ZSTAT = 0,4069
35
0,025
36
7
Z Test of Hypothesis for the Proportion
Data Null Hypothesis π = 0,5 Level of Significance 0,05 Number of Successes 78 Sample Size 151
Intermediate Calculations Sample Proportion 0,516556291 Standard Error 0,040689423 Z Test Statistic 0,406894229
Two-Tail Test Lower Critical Value -1,959963985 Upper Critical Value 1,959963985 p-Value 0,684085674
Do not reject the null hypothesis
37
p vrijednost pristup za proporcije
• Treba pronaći površinu (vjerovatnoću) iznad z=0,4069 i ispod z=-‐0,4069.
• Excel =2*(1-‐ NORMSDIST(0,4069))
• Ta vjerovatnoća je p=2(0,34205)=0,6841
38
Ne odbaci7 H0 Odbaci7 H0 Odbaci7 H0
α/2 = 0,025
1,96 0
z = -‐0,4069
Izračuna* p-‐value i uporedi* sa α. Treba pronaći površinu (vjerovatnoću) iznad z=0,4069 i ispod z=-‐0,4069.
6841,0)34205,0(2)0,157955,0(2
)4069,0P(z)4069,0P(z
=
=−=
≥+−≤
p-‐value = 0,6841
p vrijednost pristup za proporcije
Ne odbaci* H0 jer je p-‐value = 0,6841 >α = 0,05 z = 0,4069
-‐1,96
α/2 = 0,025
0,34205 0,34205
α/2 = 0,95
50% vlasnika malih trgovačkih radnji misli da su im veliki trgovački centri najveća opasnost za opstanak. 39
α, β
• Tip I greška: pojavljuje se ako se odbaci nulta hipoteza H0 kada je ona tačna i kada ne bi trebala bi* odbačena. – Vjerovatnoća da se pojavi Type I error je α
• Tip II greška: pojavljuje se ako se ne odbaci nulta hipoteza H0 kada je ona netačna i kada bi trebala bi* odbačena. – Vjerovatnoća da se pojavi Type II error je β
40
Odbaci7 H0: μ ≥ 52
Ne odbaci7 H0 : μ ≥ 52
Tip II greška -‐ β • Tip II greška je vjerovatnoća da se napravi greška da se ne odbaci netačna H0
52 50
Pretpostavimo da nismo odbacili H0: μ ≥ 52 Kada je stvarna aritme*čka sredina μ = 50
α
41
Odbaci7 H0: µ ≥ 52
Ne odbaci7 H0 : µ ≥ 52
Tip II greška -‐ β
Pretpostavimo da nismo odbacili H0: μ ≥ 52 Kada je stvarna aritme*čka sredina μ = 50
52 50
Ovo je stvarna distribucija x ako je µ = 50
Raspon x u kome H0 nije odbačena
42
8
Odbaci7 H0: μ ≥ 52
Ne odbaci7 H0 : μ ≥ 52
Tip II greška -‐ β
α
52 50
β
Ovdje, β = P( x ≥ odsječak ) ako je μ = 50
Pretpostavimo da nismo odbacili H0: μ ≥ 52 Kada je stvarna aritme*čka sredina μ = 50
43
Odbaci* H0: μ ≥ 52
Ne odbaci* H0 : μ ≥ 52
• Neka je n = 64 , σ = 6 , i α = 0,05 • Odsječak xα :
α
52 50
Stoga β = P( x ≥ 50,766 ) ako je μ = 50
Računanje β
50,7666461,64552
nσµ =−=−= αα zx
(za H0 : μ ≥ 52)
50,766
44
Odbaci* H0: μ ≥ 52
Ne odbaci* H0 : μ ≥ 52
P(x ≥ 50,766 | µ= 50) = P z ≥ 50,766− 506
64
#
$
%%%
&
'
(((= P(z ≥1,02) = 0,5− 0,3461= 0,1539
• Neka je n = 64 , σ = 6 , and α = 0,05
α
52 50
Računanje β
Vjerovatnoća Type II error:
β = 0,1539
45
β