Upload
buimien
View
245
Download
9
Embed Size (px)
Citation preview
Testiranje statistickih hipotezaMaterijali za nastavu iz Statistike
Kristina Krulic Himmelreich i Ksenija Smoljak
2012/13
1 / 39
Uvod
Osnovna zadaca Statistike je na temelju uzorka ocijeniti kakvu razdiobuima promatrano (populacijsko) statisticko obiljezje X .
svaka pretpostavka koja se odnosi na tu razdiobu je (statisticka)hipoteza
provjera istinitosti te hipoteze je testiranje (statisticki test)
hipotezu koju testiramo zovemo nulta hipoteza ili nul-hipoteza iobiljezavamo s H0
alternativnu hipotezu obiljezavamo s H1
2 / 39
Uvod
Vrste statistickih testova:
parametarski - testiramo hipotezu koja se odnosi na parametarpretpostavljene razdiobe
neparametarski - testiramo hipotezu koja se odnosi na tippretpostavljene razdiobe
Hipoteza je:
jednostavna ako jednoznacno odreduje razdiobu statistickogobiljezja X
slozena ako jednoznacno ne odreduje razdiobu statistickog obiljezja X
3 / 39
Uvod
Na temelju uzorka trebamo donijeti odluku o prihvacanju iliodbacivanju nulte hipoteze.
Niti jedan statisticki zakljucak o populaciji na bazi uzorka nijestopostotno siguran, tako i prihvacnje neke hipoteze na temeljuuzorka ne znaci da je ta hipoteza tocna.
Umjesto ”hipotezu prihvacamo” ispravnije je reci ”na osnovi uzorkane postoji razlog za odbacivanje hipoteze”.
4 / 39
Uvod
Prilikom donosenja odluke o istinitosti hipoteze postoje dvije vrstemogucih pogresaka :pogreska 1. vrste: odbacili smo nultu hipotezu ako je ona istinitapogreska 2. vrste: prihvatili smo nultu hipotezu ako je ona neistinita.Moguce situacije su prikazane tablicom:
H0 je tocna H0 je netocna
prihvacamo H0√
pogreska 2. vrste
odbacujemo H0 pogreska 1. vrste√
5 / 39
Uvod
Vjerojatnosti tih pogresaka oznacavamo s:α = P(pogreska 1. vrste)= P(odbacujemo H0 | H0 tocna) iβ = P(pogreska 2. vrste)= P(prihvacamo H0 | H0 netocna).Sljedeca tablica prikazuje vjerojatnosti mogucih situacija
H0 je tocna H0 je netocna
prihvacamo H0 1− α β
odbacujemo H0 α 1− β
α je nivo signifikantnosti ili razina znacajnosti, a 1-β=P(odbacujemoH0 | H0 netocna) snaga testa.
6 / 39
Uvod
Za testiranje hipoteze treba:
(1) Definirati H0 i H1 ;
(2) Definirati test-statistiku na osnovi cijih vrijednosti se donose odluke;
(3) Za zadanu razinu znacajnosti α odrediti kriticno podrucje - skupsvih mogucih vrijednosti test-statistike za koje se odbacuje nultahipoteza u korist alternativne;
(4) Ispitati da li se vrijednost test-statistike izracunate iz uzorka nalazi ukriticnom podrocju;
(5) Zakljuciti: Ako je izracunata vrijednost test-statistike u kriticnompodruju hipoteza H0 se odbacuje u korist alternativne hipoteze H1. Usuprotnom se H0 prihvaca, tj. na osnovi uzorka hipotezu ne mozemoodbaciti.
7 / 39
Testovi o parametrima normalne razdiobe N (µ, σ2)
Neka je θ nepoznati parametar o kojemu ovisi pretpostavljena razdioba.Ako je nulta hipoteza H0 : θ = θ0 (U pravilu, za nul-hipoteze se uzimajujednostavne hipoteze.), tada su moguce alternativne hipoteze :(i) H1 : θ 6= θ0, (ii) H1 : θ > θ0, (iii) H1 : θ < θ0,
Nulta hipoteza H0 : µ = µ0, σ2 poznato:Test statistika Alternativna hipoteza Kriticno podrucje
H1 : µ 6= µ0 C0 = 〈−∞, −zα2
]⋃
[zα2, ∞〉
Z = X−µσ
√n
Z ∼ N (0, 1) H1 : µ > µ0 C0 = [zα, ∞〉
H1 : µ < µ0 C0 = 〈−∞, −zα]
8 / 39
Parametarski testovi
Nulta hipoteza H0 : µ = µ0, σ2 nije poznato:
Test statistika Alternativna hipoteza Kriticno podrucje
H1 : µ 6= µ0 C0 = 〈−∞, −tα2
]⋃
[tα2, ∞〉
T = X−µS
√n
T ∼ t(n − 1) H1 : µ > µ0 C0 = [tα, ∞〉
H1 : µ < µ0 C0 = 〈−∞, −tα]
9 / 39
Zadaci
Zadatak
Promatramo obiljezje X koje ima normalnu razdiobu N(µ, 100). Naslucajan nacin odabran je uzorak od 105 elemenata. Uz razinu znacajnostiα = 0.01 testirajte hipotezu H0 : µ0 = 30 prema hipotezi H1 : µ1 = 38.
10 / 39
Zadaci
Zadatak
Prema standardima prosjecan broj nedostataka po 1m2 tkanine ne smijebiti veci od 5. Na slucajan nacin odabrano je 100m2 tkanine i na njimaizbrojan broj nedostataka. Dobiveni su rezultati:
broj nedostataka 1 2 3 4 5 6 7 8 9 10
broj m2 tkanine 15 12 15 22 15 8 5 3 3 2
Ako znamo da broj nedostataka na tkanini ima normalnu razdiobu svarijancom jednakom 4, uz razinu znacajnosti α = 0.01 testirajte hipotezuda ova vrsta tkanine zadovoljava uvjete standarda.
11 / 39
Zadaci
Zadatak
Proizvodac tvrdi da je dimenzija serijski radenog proizvoda 35mm.Mjerenjem 20 slucajno odabranih proizvoda dobiveni su rezultati:
dimenzija (mm) 34.8 34.9 35.0 35.1 35.3
broj proizvoda 2 3 4 6 5
Uz razinu znacajnosti α = 0.05 testirajte hipotezu H0 : µ = 35 uzalternativnu hipotezu H1 : µ 6= 35 (pretpostavljamo da promatranadimenzija ima normalnu razdiobu te je varijanca nepoznata).
12 / 39
Zadaci
Zadatak
Tvornica tvrdi da je prosjecan vijek trajanja proizvoda iz te tvornice 21.5sati. Na slucajnom uzorku od 6 proizvoda iz te tvornice laboratorijskimmjerenjima vijeka trajanja dobivene su vrijednosti od 19, 18, 22, 20, 16, 25sati. S razinom znacajosti α = 0.05, testirajte da li dobiveni uzorakindicira kraci prosjecan vijek trajanja proizvoda.
13 / 39
Test o proporciji
Bez obzira kakvu razdiobu ima statisticko obiljezje, sredina X , za dovoljnovelike uzorke, ima priblizno normalnu razdiobu. Promatramo statistickoobiljezje koje ima binomnu razdiobu : X ∼ B(n, p).Koristimo test- statistiku:
Z =X − p0√p0(1− p0)
√n ≈ N (0, 1).
Nulta hipoteza Alternativna hipoteza Kriticno podrucje
H1 : p 6= p0 C0 = 〈−∞, −zα2
]⋃
[zα2, ∞〉
H0 : p = p0
H1 : p > p0 C0 = [zα, ∞〉H1 : p < p0 C0 = 〈−∞, −zα]
14 / 39
Zadaci
Zadatak
Proizvodac tvrdi da njegove posiljke sadrze najvise 5% neispravnihproizvoda. Uzet je slucajni uzorak od 300 komada iz jedne posiljke i bilo je16 neispravnih. Da li mozemo prihvatiti tvrdnju proizvodaca uz razinuznacajnosti 0.05?
15 / 39
Usporedba ocekivanja dviju normalno distribuiranihpopulacija (t-test)
Promatramo statisticko obiljezje X na dvije razlicite populacije. Uz topretpostavimo da u obje populacije promatrano obiljezje ima normalnurazdiobu. Ako s X1 i X2 oznacimo obiljezje na prvoj, odnosno drugojpopulaciji, onda su pretpostavke:
X1 ∼ N (µ1, σ21) i X2 ∼ N (µ2, σ
22).
Neka su realizirani uzorci uzeti iz prve, odnosno druge populacije opsegan1 i n2 redom. Testiramo hipotezu
H0 : µ1 = µ2
u odnosu na jednu od alternativnih:
H1 : µ1 6= µ2, H1 : µ1 > µ2, H1 : µ1 < µ2.
16 / 39
Usporedba ocekivanja dviju normalno distribuiranihpopulacija (t-test)
Nulta hipoteza H0 : µ1 = µ2, σ21 i σ2
2 poznato:
Test statistika Alternativna Kriticno podrucjehipoteza
H1 : µ1 6= µ2 C0 = 〈−∞, −zα2
]⋃
Z = X1−X2√σ2
1n1
+σ2
2n2
[zα2, ∞〉
Z ∼ N (0, 1) H1 : µ1 > µ2 C0 = [zα, ∞〉H1 : µ1 < µ2 C0 = 〈−∞, −zα]
17 / 39
Usporedba ocekivanja dviju normalno distribuiranihpopulacija (t-test)
Nulta hipoteza H0 : µ1 = µ2, σ21 = σ2
2 = σ2 nije poznato:
Test statistika:T = X1−X2
S ·√
1n1
+ 1n2
S2 =(n1−1)S2
1 +(n2−1)S22
n1+n2−2T ∼ t(n1 + n2 − 2)
Alternativna Kriticno podrucjehipoteza
H1 : µ1 6= µ2 C0 = 〈−∞, −tα2
(n1 + n2 − 2)]⋃
[tα2
(n1 + n2 − 2), ∞〉H1 : µ1 > µ2 C0 = [tα(n1 + n2 − 2), ∞〉H1 : µ1 < µ2 C0 = 〈−∞, −tα(n1 + n2 − 2)]
18 / 39
Usporedba varijanci dviju normalno distribuiranihpopulacija (F-test)
Promatramo statisticko obiljezje X na dvije razlicite populacije. Uz topretpostavimo da u obje populacije promatrano obiljezje ima normalnurazdiobu. Ako s X1 i X2 oznacimo obiljezje na prvoj, odnosno drugojpopulaciji, onda su pretpostavke:
X1 ∼ N (µ1, σ21) i X2 ∼ N (µ2, σ
22).
Neka su realizirani uzorci uzeti iz prve, odnosno druge populacije opsegan1 i n2 redom. Testiramo hipotezu
H0 : σ21 = σ2
2
u odnosu na jednu od alternativnih:
H1 : σ21 6= σ2
2, H1 : σ21 > σ2
2
19 / 39
Usporedba varijanci dviju normalno distribuiranihpopulacija (F-test)
Test statistika je:
F =S2
1
S22
koja ima F (Fisherovu) razdiobu s n1 − 1, n2 − 1 stupnjeva slobode.Nulta hipoteza H0 : σ2
1 = σ22:
Alternativna hipoteza Kriticno podrucje
H1 : σ21 6= σ2
2 C0 = 〈0, f1−α2
(n1 − 1, n2 − 1)]⋃[fα
2(n1 − 1, n2 − 1), ∞〉
H1 : σ21 > σ2
2 C0 = [fα(n1 − 1, n2 − 1), ∞〉
20 / 39
Zadaci
Zadatak
Pomocu dvije razlicite metode mjerena je jedna te ista velicina. Rezultatimjerenja dani su u tablici:
1. metoda 9.4 10.0 9.8 10.2
2. metoda 10.4 9.7 10.0 10.3
Moze li se uz α = 0.1 zakljuciti da obje metode daju istu tocnost?
21 / 39
Zadaci
Zadatak
Iz dva cetvrta razreda neke skole izabrano je na slucajan nacin po 10ucenika i izmjerena je njihova masa (masa je normalno distribuirana), apodaci su dani u tablici. Uz razinu znacajnosti 0.02 testirajte hipotezu dasu varijance jednake
4.a 57 60 63 59 62 60 58 56 54 62
4.b 58 62 60 56 63 58 61 57 53 61
22 / 39
Zadaci
Zadatak
Psiholog je testirao dvije grupe ucenika. Grupu A od 7 ucenika i grupu Bod 6 ucenika. Broj bodova je:
A grupa 70 75 80 80 85 90 85
B grupa 75 90 95 100 80 85
Da li se uz razinu znacajnosti 0.1 moze smatrati da je uspjeh u obje grupeisti?
23 / 39
χ2 -test
χ2 -test
jedan od prvih statistickih testova
predlozio ga je K. Pearson 1900. godine, pa je poznat i pod nazivomPearsonov test
neparametarski test
pomocu χ2-testa testiramo nultu hipotezu da obiljezje X imaodredenu (teorijsku) razdiobu protiv alternativne da nema tu razdiobu
pomocu χ2-testa ispitujemo nezavisnost dva statisticka obiljezja, kao ihomogenost populacija
24 / 39
χ2 -test
Za sve navedeno test-statistika je (opcenito):
H =k∑
i=1
(fi − fti )2
fti
gdje su fi eksperimentalne, a fti teorijske frekvencije.
Ako je za neki i ocekivana (teorijska) frekvencija fti < 5 zdruzimo tajrazred sa susjednim(a) razredom(ima) tako da novodobiveni razredzadovoljava uvjet da mu je ocekivana frekvencija barem 5.
25 / 39
χ2 -test
Uz pretpostavku da je H0 tocna hipoteza za velike n (n→∞) vrijedi
H ≈ χ2(r − l − 1)
gdje χ2(r − l − 1) oznacava χ2−razdiobu s (r − l − 1) stupnjeva slobodeciju vrijednost citamo iz tablica.
r je (konacan) broj razreda u uzorku
l broj nepoznatih parametara.
26 / 39
χ2 -test
Za zadanu pogresku prve vrste α, kriticno podrucje odredujemo iz uvjeta
P(H > χ2(r − l − 1)|H0) = α.
Dakle, kriticno podrucje je:
C0 = [χ2α(r − l − 1),∞〉
Ako s h oznacimo vrijednost test statistike izracunate iz uzorka, ondanultu hipotezu odbacujemo ako
h ∈ C0 tj. h ≥ χ2α(r − l − 1).
27 / 39
Zadaci
Zadatak
Proizvodac tvrdi da je 5% njegovih proizvoda prve klase, 92% druge i 3%trece klase. U slucajnom uzorku od 500 proizvoda nadeno je 40 proizvodaprve, 432 druge i 28 trece klase. Uz razinu znacajnosti 0.05, testirajtehipotezu da je proizvodac u pravu.
Zadatak
Iz intervala [0, 1] generirano je 200 slucajnih brojeva koji su razvrstani u 5podintervala:
interval [0, 0.2) [0.2, 0.4) [0.4, 0.6) [0.6, 0.8) [0.8, 1]
broj br. 32 44 38 42 44
Da li su frekvencije ravnomjerno rasporedene po intervalima uz razinuznacajnosti α = 0.01 i α = 0.05?
28 / 39
Zadaci
Zadatak
Kocka se baca 90 puta. Rezultati su dani u tablici:
Broj na kocki 1 2 3 4 5 6
Broj pojavljivanja 15 13 16 20 14 12
Da li je kocka ispravna uz razinu znacajnosti α = 0.05?
29 / 39
Zadaci
Zadatak
U cilju ispitivanja nekog svojstva pamucnih vlakana mjerena je njihovaduljina i dobiveni su sljedeci rezultati:
duljina (u cm) 2-4 4-6 6-8 8-10 10-12
broj vlakana 10 47 63 30 20
Testirati hipotezu o normalnoj distribuciji uz razinu znacajnosti 0.05.
30 / 39
Zadaci
Zadatak
Anketirano je 100 radnika neke tvornice o udaljenosti od kuce do posla. Srazinom znacajnosti 0.05, testirajte hipotezu da se radi o uzorku izpopulacije s normalnom distribucijom.
udalj [0, 2〉 [2, 4〉 [4, 6〉 [6, 8〉 [8, 10〉 [10, 12〉 [12, 14〉br rad 5 10 20 33 18 10 4
31 / 39
Zadaci
Zadatak
U jednom trgovackom centru 200 puta je registriran broj kupaca u 10sekundi.Dobiveni su rezultati:
broj kupaca 0 1 2 3 4
broj mjerenja 109 65 22 3 1
Testirajte hipotezu da se radi o Poissonovoj razdiobi s vjerojatnoscu 0.9.
32 / 39
Zadaci
Zadatak
Provjerite da li se empirijska razdioba dana tablicom:
xi 0 1 2 3 4
fi 116 56 22 14 2
podudara s Poissonovom razdiobom, s pouzdanoscu 95%.
33 / 39
χ2 - test nezavisnosti dviju varijabli
Neka je (X1,Y1), (X2,Y2), . . . (Xn,Yn) slucajni uzorak zadvodimenzionalno diskretno statisticko obiljezje (X ,Y ) i neka je pritom:Skup vrijednosti obiljezja X :
R(X ) = {a1, . . . , ar};
Skup vrijednosti obiljezja Y :
R(Y ) = {b1, . . . , bs};
Skup vrijednosti obiljezja (X ,Y ) :
R[(X ,Y )] = {(ai , bj) : 1 ≤ i ≤ r , 1 ≤ j ≤ s}.
34 / 39
χ2 - test nezavisnosti dviju varijabli
fij : frekvencija od (ai , bj) u uzorkufi : (marginalna) frekvencija od ai u uzorkugj : (marginalna) frekvencija od bj u uzorkuVrijedi:
fi =s∑
j=1
fij , gj =r∑
i=1
fij
Oznacimo:
pij = P(X = ai , Y = bj)
pi = P(X = ai )
qj = P(X = bj)
35 / 39
χ2 - test nezavisnosti dviju varijabli
Kontingencijska frekvencijska tablica:
X
∖Y b1 b2 . . . bs Σ
a1 f11 f12 . . . f1s f1
a2 f21 f22 . . . f2s f2...
......
......
...ar fr1 fr2 . . . frs frΣ g1 g2 . . . gs n
36 / 39
χ2 - test nezavisnosti dviju varijabli
Hipoteze su:H0: X i Y su nezavisna obiljezja iH1: X i Y su zavisna obiljezja, tj.H0: pij = pi · qj za sve i i j , aH1: postoje i , j takvi da pij 6= pi · qj
Uz pretpostavku da je H0 tocna hipoteza , procjene za pi i qj su:
pi =fin, qj =
gjn
Ocekivane (teorijske) vrijednosti ftij od fij uz H0 su:
ftij = n pi qj = n · fin·
gjn
=fi · gj
n
Test-statistika je:
H =r∑
i=1
s∑j=1
(fij − ftij )2
ftij
37 / 39
χ2 - test nezavisnosti dviju varijabli
Ako je H0 istinita, tada za n→∞:
H ≈ χ2((r − 1) · (s − 1)),
gdje χ2((r − 1) · (s − 1)) oznacava χ2−razdiobu s ((r − 1) · (s − 1))stupnjeva slobode.Za zadanu pogresku prve vrste α, kriticno podrucje odredujemo iz uvjeta
P(H > χ2((r − 1) · (s − 1))|H0) = α.
Dakle, kriticno podrucje je:
C0 = [χ2α((r − 1) · (s − 1)),∞〉,
pritome χ2α((r − 1) · (s − 1)) citamo iz tablica. Ako s h oznaciimo
vrijednost test statistike izracunate iz uzorka, onda nultu hipotezuodbacujemo ako
h ∈ C0 tj. h ≥ χ2α((r − 1) · (s − 1)).
38 / 39
Zadaci
Zadatak
U cilju ispitivanja uspjesnosti na kolokvijima iz statistike interesira nas da liprolaznost na drugom kolokviju ovisi o prolaznosti na prvom kolokviju! Zaslucajno odabranih 120 studenata dobiveni su podaci dani u tablici.Mozete li na osnovu ovih podataka zakljuciti da uspjeh na drugomkolokviju ovisi o uspjehu na prvom kolokviju, uz razinu znacajnosti 0.01?
Kolokvij Polozili Pali∑
1. 45 25 70
2. 20 30 50∑65 55 120
39 / 39