Testiranje statistickih hipoteza Materijali za nastavu iz Statistike

Testiranje statistickih hipotezaMaterijali za nastavu iz Statistike

Kristina Krulic Himmelreich i Ksenija Smoljak

2012/13

1 / 39

Uvod

Osnovna zadaca Statistike je na temelju uzorka ocijeniti kakvu razdiobuima promatrano (populacijsko) statisticko obiljezje X .

svaka pretpostavka koja se odnosi na tu razdiobu je (statisticka)hipoteza

provjera istinitosti te hipoteze je testiranje (statisticki test)

hipotezu koju testiramo zovemo nulta hipoteza ili nul-hipoteza iobiljezavamo s H0

alternativnu hipotezu obiljezavamo s H1

2 / 39

Uvod

Vrste statistickih testova:

parametarski - testiramo hipotezu koja se odnosi na parametarpretpostavljene razdiobe

neparametarski - testiramo hipotezu koja se odnosi na tippretpostavljene razdiobe

Hipoteza je:

jednostavna ako jednoznacno odreduje razdiobu statistickogobiljezja X

slozena ako jednoznacno ne odreduje razdiobu statistickog obiljezja X

3 / 39

Uvod

Na temelju uzorka trebamo donijeti odluku o prihvacanju iliodbacivanju nulte hipoteze.

Niti jedan statisticki zakljucak o populaciji na bazi uzorka nijestopostotno siguran, tako i prihvacnje neke hipoteze na temeljuuzorka ne znaci da je ta hipoteza tocna.

Umjesto ”hipotezu prihvacamo” ispravnije je reci ”na osnovi uzorkane postoji razlog za odbacivanje hipoteze”.

4 / 39

Uvod

Prilikom donosenja odluke o istinitosti hipoteze postoje dvije vrstemogucih pogresaka :pogreska 1. vrste: odbacili smo nultu hipotezu ako je ona istinitapogreska 2. vrste: prihvatili smo nultu hipotezu ako je ona neistinita.Moguce situacije su prikazane tablicom:

H0 je tocna H0 je netocna

prihvacamo H0√

pogreska 2. vrste

odbacujemo H0 pogreska 1. vrste√

5 / 39

Uvod

Vjerojatnosti tih pogresaka oznacavamo s:α = P(pogreska 1. vrste)= P(odbacujemo H0 | H0 tocna) iβ = P(pogreska 2. vrste)= P(prihvacamo H0 | H0 netocna).Sljedeca tablica prikazuje vjerojatnosti mogucih situacija

H0 je tocna H0 je netocna

prihvacamo H0 1− α β

odbacujemo H0 α 1− β

α je nivo signifikantnosti ili razina znacajnosti, a 1-β=P(odbacujemoH0 | H0 netocna) snaga testa.

6 / 39

Uvod

Za testiranje hipoteze treba:

(1) Definirati H0 i H1 ;

(2) Definirati test-statistiku na osnovi cijih vrijednosti se donose odluke;

(3) Za zadanu razinu znacajnosti α odrediti kriticno podrucje - skupsvih mogucih vrijednosti test-statistike za koje se odbacuje nultahipoteza u korist alternativne;

(4) Ispitati da li se vrijednost test-statistike izracunate iz uzorka nalazi ukriticnom podrocju;

(5) Zakljuciti: Ako je izracunata vrijednost test-statistike u kriticnompodruju hipoteza H0 se odbacuje u korist alternativne hipoteze H1. Usuprotnom se H0 prihvaca, tj. na osnovi uzorka hipotezu ne mozemoodbaciti.

7 / 39

Testovi o parametrima normalne razdiobe N (µ, σ2)

Neka je θ nepoznati parametar o kojemu ovisi pretpostavljena razdioba.Ako je nulta hipoteza H0 : θ = θ0 (U pravilu, za nul-hipoteze se uzimajujednostavne hipoteze.), tada su moguce alternativne hipoteze :(i) H1 : θ 6= θ0, (ii) H1 : θ > θ0, (iii) H1 : θ < θ0,

Nulta hipoteza H0 : µ = µ0, σ2 poznato:Test statistika Alternativna hipoteza Kriticno podrucje

H1 : µ 6= µ0 C0 = 〈−∞, −zα2

]⋃

[zα2, ∞〉

Z = X−µσ

√n

Z ∼ N (0, 1) H1 : µ > µ0 C0 = [zα, ∞〉

H1 : µ < µ0 C0 = 〈−∞, −zα]

8 / 39

Parametarski testovi

Nulta hipoteza H0 : µ = µ0, σ2 nije poznato:

Test statistika Alternativna hipoteza Kriticno podrucje

H1 : µ 6= µ0 C0 = 〈−∞, −tα2

]⋃

[tα2, ∞〉

T = X−µS

√n

T ∼ t(n − 1) H1 : µ > µ0 C0 = [tα, ∞〉

H1 : µ < µ0 C0 = 〈−∞, −tα]

9 / 39

Zadaci

Zadatak

Promatramo obiljezje X koje ima normalnu razdiobu N(µ, 100). Naslucajan nacin odabran je uzorak od 105 elemenata. Uz razinu znacajnostiα = 0.01 testirajte hipotezu H0 : µ0 = 30 prema hipotezi H1 : µ1 = 38.

10 / 39

Zadaci

Zadatak

Prema standardima prosjecan broj nedostataka po 1m2 tkanine ne smijebiti veci od 5. Na slucajan nacin odabrano je 100m2 tkanine i na njimaizbrojan broj nedostataka. Dobiveni su rezultati:

broj nedostataka 1 2 3 4 5 6 7 8 9 10

broj m2 tkanine 15 12 15 22 15 8 5 3 3 2

Ako znamo da broj nedostataka na tkanini ima normalnu razdiobu svarijancom jednakom 4, uz razinu znacajnosti α = 0.01 testirajte hipotezuda ova vrsta tkanine zadovoljava uvjete standarda.

11 / 39

Zadaci

Zadatak

Proizvodac tvrdi da je dimenzija serijski radenog proizvoda 35mm.Mjerenjem 20 slucajno odabranih proizvoda dobiveni su rezultati:

dimenzija (mm) 34.8 34.9 35.0 35.1 35.3

broj proizvoda 2 3 4 6 5

Uz razinu znacajnosti α = 0.05 testirajte hipotezu H0 : µ = 35 uzalternativnu hipotezu H1 : µ 6= 35 (pretpostavljamo da promatranadimenzija ima normalnu razdiobu te je varijanca nepoznata).

12 / 39

Zadaci

Zadatak

Tvornica tvrdi da je prosjecan vijek trajanja proizvoda iz te tvornice 21.5sati. Na slucajnom uzorku od 6 proizvoda iz te tvornice laboratorijskimmjerenjima vijeka trajanja dobivene su vrijednosti od 19, 18, 22, 20, 16, 25sati. S razinom znacajosti α = 0.05, testirajte da li dobiveni uzorakindicira kraci prosjecan vijek trajanja proizvoda.

13 / 39

Test o proporciji

Bez obzira kakvu razdiobu ima statisticko obiljezje, sredina X , za dovoljnovelike uzorke, ima priblizno normalnu razdiobu. Promatramo statistickoobiljezje koje ima binomnu razdiobu : X ∼ B(n, p).Koristimo test- statistiku:

Z =X − p0√p0(1− p0)

√n ≈ N (0, 1).

Nulta hipoteza Alternativna hipoteza Kriticno podrucje

H1 : p 6= p0 C0 = 〈−∞, −zα2

]⋃

[zα2, ∞〉

H0 : p = p0

H1 : p > p0 C0 = [zα, ∞〉H1 : p < p0 C0 = 〈−∞, −zα]

14 / 39

Zadaci

Zadatak

Proizvodac tvrdi da njegove posiljke sadrze najvise 5% neispravnihproizvoda. Uzet je slucajni uzorak od 300 komada iz jedne posiljke i bilo je16 neispravnih. Da li mozemo prihvatiti tvrdnju proizvodaca uz razinuznacajnosti 0.05?

15 / 39

Usporedba ocekivanja dviju normalno distribuiranihpopulacija (t-test)

Promatramo statisticko obiljezje X na dvije razlicite populacije. Uz topretpostavimo da u obje populacije promatrano obiljezje ima normalnurazdiobu. Ako s X1 i X2 oznacimo obiljezje na prvoj, odnosno drugojpopulaciji, onda su pretpostavke:

X1 ∼ N (µ1, σ21) i X2 ∼ N (µ2, σ

22).

Neka su realizirani uzorci uzeti iz prve, odnosno druge populacije opsegan1 i n2 redom. Testiramo hipotezu

H0 : µ1 = µ2

u odnosu na jednu od alternativnih:

H1 : µ1 6= µ2, H1 : µ1 > µ2, H1 : µ1 < µ2.

16 / 39


Nulta hipoteza H0 : µ1 = µ2, σ21 i σ2

2 poznato:

Test statistika Alternativna Kriticno podrucjehipoteza

H1 : µ1 6= µ2 C0 = 〈−∞, −zα2

]⋃

Z = X1−X2√σ2

1n1

+σ2

2n2

[zα2, ∞〉

Z ∼ N (0, 1) H1 : µ1 > µ2 C0 = [zα, ∞〉H1 : µ1 < µ2 C0 = 〈−∞, −zα]

17 / 39


Nulta hipoteza H0 : µ1 = µ2, σ21 = σ2

2 = σ2 nije poznato:

Test statistika:T = X1−X2

S ·√

1n1

+ 1n2

S2 =(n1−1)S2

1 +(n2−1)S22

n1+n2−2T ∼ t(n1 + n2 − 2)

Alternativna Kriticno podrucjehipoteza

H1 : µ1 6= µ2 C0 = 〈−∞, −tα2

(n1 + n2 − 2)]⋃

[tα2

(n1 + n2 − 2), ∞〉H1 : µ1 > µ2 C0 = [tα(n1 + n2 − 2), ∞〉H1 : µ1 < µ2 C0 = 〈−∞, −tα(n1 + n2 − 2)]

18 / 39

Usporedba varijanci dviju normalno distribuiranihpopulacija (F-test)

Promatramo statisticko obiljezje X na dvije razlicite populacije. Uz topretpostavimo da u obje populacije promatrano obiljezje ima normalnurazdiobu. Ako s X1 i X2 oznacimo obiljezje na prvoj, odnosno drugojpopulaciji, onda su pretpostavke:

X1 ∼ N (µ1, σ21) i X2 ∼ N (µ2, σ

22).

Neka su realizirani uzorci uzeti iz prve, odnosno druge populacije opsegan1 i n2 redom. Testiramo hipotezu

H0 : σ21 = σ2

2

u odnosu na jednu od alternativnih:

H1 : σ21 6= σ2

2, H1 : σ21 > σ2

2

19 / 39

Usporedba varijanci dviju normalno distribuiranihpopulacija (F-test)

Test statistika je:

F =S2

1

S22

koja ima F (Fisherovu) razdiobu s n1 − 1, n2 − 1 stupnjeva slobode.Nulta hipoteza H0 : σ2

1 = σ22:

Alternativna hipoteza Kriticno podrucje

H1 : σ21 6= σ2

2 C0 = 〈0, f1−α2

(n1 − 1, n2 − 1)]⋃[fα

2(n1 − 1, n2 − 1), ∞〉

H1 : σ21 > σ2

2 C0 = [fα(n1 − 1, n2 − 1), ∞〉

20 / 39

Zadaci

Zadatak

Pomocu dvije razlicite metode mjerena je jedna te ista velicina. Rezultatimjerenja dani su u tablici:

1. metoda 9.4 10.0 9.8 10.2

2. metoda 10.4 9.7 10.0 10.3

Moze li se uz α = 0.1 zakljuciti da obje metode daju istu tocnost?

21 / 39

Zadaci

Zadatak

Iz dva cetvrta razreda neke skole izabrano je na slucajan nacin po 10ucenika i izmjerena je njihova masa (masa je normalno distribuirana), apodaci su dani u tablici. Uz razinu znacajnosti 0.02 testirajte hipotezu dasu varijance jednake

4.a 57 60 63 59 62 60 58 56 54 62

4.b 58 62 60 56 63 58 61 57 53 61

22 / 39

Zadaci

Zadatak

Psiholog je testirao dvije grupe ucenika. Grupu A od 7 ucenika i grupu Bod 6 ucenika. Broj bodova je:

A grupa 70 75 80 80 85 90 85

B grupa 75 90 95 100 80 85

Da li se uz razinu znacajnosti 0.1 moze smatrati da je uspjeh u obje grupeisti?

23 / 39

χ2 -test

χ2 -test

jedan od prvih statistickih testova

predlozio ga je K. Pearson 1900. godine, pa je poznat i pod nazivomPearsonov test

neparametarski test

pomocu χ2-testa testiramo nultu hipotezu da obiljezje X imaodredenu (teorijsku) razdiobu protiv alternativne da nema tu razdiobu

pomocu χ2-testa ispitujemo nezavisnost dva statisticka obiljezja, kao ihomogenost populacija

24 / 39

χ2 -test

Za sve navedeno test-statistika je (opcenito):

H =k∑

i=1

(fi − fti )2

fti

gdje su fi eksperimentalne, a fti teorijske frekvencije.

Ako je za neki i ocekivana (teorijska) frekvencija fti < 5 zdruzimo tajrazred sa susjednim(a) razredom(ima) tako da novodobiveni razredzadovoljava uvjet da mu je ocekivana frekvencija barem 5.

25 / 39

χ2 -test

Uz pretpostavku da je H0 tocna hipoteza za velike n (n→∞) vrijedi

H ≈ χ2(r − l − 1)

gdje χ2(r − l − 1) oznacava χ2−razdiobu s (r − l − 1) stupnjeva slobodeciju vrijednost citamo iz tablica.

r je (konacan) broj razreda u uzorku

l broj nepoznatih parametara.

26 / 39

χ2 -test

Za zadanu pogresku prve vrste α, kriticno podrucje odredujemo iz uvjeta

P(H > χ2(r − l − 1)|H0) = α.

Dakle, kriticno podrucje je:

C0 = [χ2α(r − l − 1),∞〉

Ako s h oznacimo vrijednost test statistike izracunate iz uzorka, ondanultu hipotezu odbacujemo ako

h ∈ C0 tj. h ≥ χ2α(r − l − 1).

27 / 39

Zadaci

Zadatak

Proizvodac tvrdi da je 5% njegovih proizvoda prve klase, 92% druge i 3%trece klase. U slucajnom uzorku od 500 proizvoda nadeno je 40 proizvodaprve, 432 druge i 28 trece klase. Uz razinu znacajnosti 0.05, testirajtehipotezu da je proizvodac u pravu.

Zadatak

Iz intervala [0, 1] generirano je 200 slucajnih brojeva koji su razvrstani u 5podintervala:

interval [0, 0.2) [0.2, 0.4) [0.4, 0.6) [0.6, 0.8) [0.8, 1]

broj br. 32 44 38 42 44

Da li su frekvencije ravnomjerno rasporedene po intervalima uz razinuznacajnosti α = 0.01 i α = 0.05?

28 / 39

Zadaci

Zadatak

Kocka se baca 90 puta. Rezultati su dani u tablici:

Broj na kocki 1 2 3 4 5 6

Broj pojavljivanja 15 13 16 20 14 12

Da li je kocka ispravna uz razinu znacajnosti α = 0.05?

29 / 39

Zadaci

Zadatak

U cilju ispitivanja nekog svojstva pamucnih vlakana mjerena je njihovaduljina i dobiveni su sljedeci rezultati:

duljina (u cm) 2-4 4-6 6-8 8-10 10-12

broj vlakana 10 47 63 30 20

Testirati hipotezu o normalnoj distribuciji uz razinu znacajnosti 0.05.

30 / 39

Zadaci

Zadatak

Anketirano je 100 radnika neke tvornice o udaljenosti od kuce do posla. Srazinom znacajnosti 0.05, testirajte hipotezu da se radi o uzorku izpopulacije s normalnom distribucijom.

udalj [0, 2〉 [2, 4〉 [4, 6〉 [6, 8〉 [8, 10〉 [10, 12〉 [12, 14〉br rad 5 10 20 33 18 10 4

31 / 39

Zadaci

Zadatak

U jednom trgovackom centru 200 puta je registriran broj kupaca u 10sekundi.Dobiveni su rezultati:

broj kupaca 0 1 2 3 4

broj mjerenja 109 65 22 3 1

Testirajte hipotezu da se radi o Poissonovoj razdiobi s vjerojatnoscu 0.9.

32 / 39

Zadaci

Zadatak

Provjerite da li se empirijska razdioba dana tablicom:

xi 0 1 2 3 4

fi 116 56 22 14 2

podudara s Poissonovom razdiobom, s pouzdanoscu 95%.

33 / 39

χ2 - test nezavisnosti dviju varijabli

Neka je (X1,Y1), (X2,Y2), . . . (Xn,Yn) slucajni uzorak zadvodimenzionalno diskretno statisticko obiljezje (X ,Y ) i neka je pritom:Skup vrijednosti obiljezja X :

R(X ) = {a1, . . . , ar};

Skup vrijednosti obiljezja Y :

R(Y ) = {b1, . . . , bs};

Skup vrijednosti obiljezja (X ,Y ) :

R[(X ,Y )] = {(ai , bj) : 1 ≤ i ≤ r , 1 ≤ j ≤ s}.

34 / 39


fij : frekvencija od (ai , bj) u uzorkufi : (marginalna) frekvencija od ai u uzorkugj : (marginalna) frekvencija od bj u uzorkuVrijedi:

fi =s∑

j=1

fij , gj =r∑

i=1

fij

Oznacimo:

pij = P(X = ai , Y = bj)

pi = P(X = ai )

qj = P(X = bj)

35 / 39


Kontingencijska frekvencijska tablica:

X

∖Y b1 b2 . . . bs Σ

a1 f11 f12 . . . f1s f1

a2 f21 f22 . . . f2s f2...

......

......

...ar fr1 fr2 . . . frs frΣ g1 g2 . . . gs n

36 / 39


Hipoteze su:H0: X i Y su nezavisna obiljezja iH1: X i Y su zavisna obiljezja, tj.H0: pij = pi · qj za sve i i j , aH1: postoje i , j takvi da pij 6= pi · qj

Uz pretpostavku da je H0 tocna hipoteza , procjene za pi i qj su:

pi =fin, qj =

gjn

Ocekivane (teorijske) vrijednosti ftij od fij uz H0 su:

ftij = n pi qj = n · fin·

gjn

=fi · gj

n

Test-statistika je:

H =r∑

i=1

s∑j=1

(fij − ftij )2

ftij

37 / 39


Ako je H0 istinita, tada za n→∞:

H ≈ χ2((r − 1) · (s − 1)),

gdje χ2((r − 1) · (s − 1)) oznacava χ2−razdiobu s ((r − 1) · (s − 1))stupnjeva slobode.Za zadanu pogresku prve vrste α, kriticno podrucje odredujemo iz uvjeta

P(H > χ2((r − 1) · (s − 1))|H0) = α.

Dakle, kriticno podrucje je:

C0 = [χ2α((r − 1) · (s − 1)),∞〉,

pritome χ2α((r − 1) · (s − 1)) citamo iz tablica. Ako s h oznaciimo

vrijednost test statistike izracunate iz uzorka, onda nultu hipotezuodbacujemo ako

h ∈ C0 tj. h ≥ χ2α((r − 1) · (s − 1)).

38 / 39

Zadaci

Zadatak

U cilju ispitivanja uspjesnosti na kolokvijima iz statistike interesira nas da liprolaznost na drugom kolokviju ovisi o prolaznosti na prvom kolokviju! Zaslucajno odabranih 120 studenata dobiveni su podaci dani u tablici.Mozete li na osnovu ovih podataka zakljuciti da uspjeh na drugomkolokviju ovisi o uspjehu na prvom kolokviju, uz razinu znacajnosti 0.01?

Kolokvij Polozili Pali∑

1. 45 25 70

2. 20 30 50∑65 55 120

39 / 39

Documents

Testiranje statistickih hipoteza Materijali za nastavu iz Statistike