34
TESTIRANJE HIPOTEZA

Testiranje Hipoteza

Embed Size (px)

DESCRIPTION

Slajdovi testiranje hipoteza verovatnoca i statistika

Citation preview

Page 1: Testiranje Hipoteza

TESTIRANJE HIPOTEZA

Page 2: Testiranje Hipoteza

• Kao što znamo, na osnovu slučajno izabranog uzorka neke populacije, stiču se saznanja o toj populaciji.

• Ona se koriste u postavljanju, prihvatanju ili odbacivanju nekih predpostavki koje se odnose na parametere obeležja X populacije i na njegovu raspodelu.

• Svaka predpostavka koja se odnosi na obeležje X zove se statistička hipoteza.

Page 3: Testiranje Hipoteza

• Postoje 2 vrste hipoteza:

1. Hipoteze koje se odnose na raspodele obeležja nazivaju se neparametarske hipoteze

2. paramerarske hipoteze odnose na karakteristične parametre.

Primer:

Ako naprimer bacamo kocku 1000 puta i ako se 6 pojavi 185 puta , parametarska hipoteza bi bila da je

neparametarska hipoteza bi bila da se verovatnoće pojave određenog broja raspoređuju po binomnoj raspodeli

1

6p

, ,

1, 1000, 185,6

1n kk

n k p

p n k

nP p p

k

Page 4: Testiranje Hipoteza

• Mi ćemo se baviti samo parametarskim hipotezama.

• Hipoteza može da bude pogrešna i tačna.

• Zato se postavljene hipoteze podvrgavaju se statističkom proveravanju , testiranju, verifikaciji, pomoću koga se donose odluke, da li sa određenom verovatnoćom, hipoteze se prihvataju ili odbacuju.

• Savremenu teoriju verifikacije dali su Nejman i Pirson (1928,1933 )

Page 5: Testiranje Hipoteza

• Potrebno je definisati dve hipoteze:

-Ho polaznu-nultu i H1 -suprotnu- alternativnu.

Zaključak testa za verifikaciju hipoteze može biti:

• Odbacujemo Ho, kao posledicu eksperimenta na uzorku i prihvatamo H1 .

• Ne odbacujemo Ho , jer nemamo dokaza protiv nje.

Primer:

• Ako se na tržištu pojavi nov proizvod, proizvođač mora da dokaže da je njegov proizvod bolji od postojećih.

• Polazna hipoteza Ho je da je novi proizvod najbolji, i da bi dokazao tu hipotezu, on mora da obori suprotnu, alternativnu H1 , da su stari proizvodi bolji od novog.

Page 6: Testiranje Hipoteza

• Treba imati na umu da je Ho slučajna promenljiva, sa svojom raspodelom, koja je definisana pomoću usvojenog uzorka.

• Ako znamo njenu raspodelu mi možemo da odredimo interval za koji možemo da tvrdimo da sa unapred poznatom verovatnoćom sadrži istraživani parametar, ako je hipoteza tačna.

• Granice ovog intervala zovu se donji i gornji prag značajnosti.

• Odluke se donose na osnovu vrednosti koje su rezultat eksperimenta na uočenom uzorku.

• Ako se izračunata vrednost parametara nađe u ovom intervalu nema razloga za dobacivanje polazne hipoteze, a ako je van intervala hipoteza se odbacuje.

X

Page 7: Testiranje Hipoteza

Testiranje na osnovunormalnog rasporeda

Uslov: 30n

Page 8: Testiranje Hipoteza

• Sa unapred zadatom verovatnoćom ( naprimer 0,95) možemo da odredimo neki interval i proverimo da li vrednost pripada tom intervalu.

• Tada odstupanja imaju slučajan karakter i nema razloga za odbacivanjem nulte hipoteze

• Za verovatnoću od 0,95 prag značajnosti je 0,05 , a to znači da postoji 5% rizika da posmatrana vrednosti ne pripada izračunatom intervalu i da nulta hipotezanije tačna.

• To znači da su ostupanja od početne hipoteze značajna.

• Znači radi testiranja hipoteze prvo treba odrediti kritičnu vrednost k, odnosno kako odrediti k, gde povući granicu između slučajnih i značajnih odstupanja????

X

Page 9: Testiranje Hipoteza

Dvostrani test

• Ukoliko je dobijamo oblast prihvatanja nulte hipoteze, interval ,k k

0H2

kk

o

kriticna oblast

oblast odbacivanja Hkriticna

oblast

1 2

tan ooblast prihva ja H

0 0 1 0: :H H

P X k

Page 10: Testiranje Hipoteza

• Jednostrani i test:

k

o

kriticna oblast

oblast odbacivanja H

1

tan ooblast prihva ja H

k

o

kriticna oblast

oblast odbacivanja H

1

tan ooblast prihva ja H

P X k

P X k

Page 11: Testiranje Hipoteza

GREŠKE TESTIRANJA HIPOTEZA

• Greške prvog tipa, greške nastaju kada nultu hipotezu odbacimo, a tačna je i prihvatimo alternativnu hipotezu

• Greške drugog tipa, greške nastaje kada nultu hipotezu ne obacimo, a pogrešna je

Page 12: Testiranje Hipoteza

GREŠKE TESTIRANJA HIPOTEZA

Testiranjem H0 se prihvata

Testiranjem H0 se odbacuje

H0 je istinita u osnovnom skupu

Dobra odluka,uz verovatnocu 1−

Greška prve vrste,uz verovatnocu

H0 je neistinita u osnovnom skupu

Greška druge vrste,uz uslovnu verovatnocu

Dobra odluka,uz verovatnocu 1−(ova verovatnoca se zove''jacina testa'' ili ''moc testa'')

Page 13: Testiranje Hipoteza

TESTIRANJE HIPOTEZE AKO SLUČAJNA PROMENLJIVA IMA NORMALNU RASPODELU, A JE POZNATO

• U slučaju testiranja nulte hipoteze Ho protiv alternativne hipoteze H1, ako slučajna promenljiva ima normalnu raspodelu , a disperzija je poznata , važi

• Ako promenljiva nema standardnu raspodelu, uvodimo statistiku

koja ima standardnu normalnu N(0,1) raspodelu .

aritmetička sredina dobijena na osnovu uzorka,

predpostavnjena vrednost sredine populacije,

standardno odstupanje populacije i n je obim uzorka.

0XZ

n

X

0

0 0H

P X z

Page 14: Testiranje Hipoteza

• Testovi mogu biti dvosmeri kada testiramo hipotezu protiv hipoteze

• Kritična oblast prihvatanja nulte hipoteze je na osnovu zadatog praga značajnosti

• a oblast odbacivanja

0 0H

1 0H

, ,z z

,z z

0 0 0k X kP

n n n

P z Z z

Page 15: Testiranje Hipoteza

• Verovatnoća prag značajnosti, obično se uzima da je 0,01 i 0,05, a za izračunavanje koriste se tablice normalne raspodele.

0H2

z 0kriticna oblast za H

oblast odbacivanja

kriticna

oblast

1 2

z

Page 16: Testiranje Hipoteza

z 0kriticna oblast za H

1

0

tan

XZ

noblast neprihva ja

P Z z

z

0kriticna oblast za H

0

tan

XZ

noblast neprihva ja

P Z z

taoblast neprihva anja

P Z z

Page 17: Testiranje Hipoteza

• Primer:• Za dozu nekog leka zna se da ima normalnu raspodelu . Uzet je

uzorak obima 10 i na osnovu dobijenih podataka dobijena srednja vrednost doze od 24,3gr.

• Sa pragom značajnosti od 5% testirati hipotezu za matematičko očekivanje od 24gr preko altetnativnog od 26gr.

,9N

Page 18: Testiranje Hipoteza

• hipotezu ne odbacujemo.

0 1

: ,9 , 24,3

3; 10; 0,05

24 ; 26

X N X

n

H H

0,95

ta

1

24,3 240,316

300

998561,64

0,316 1,64

oblast prihva anja

P Z z

X

nz z

0H 0,05

1,64z 0kriticna oblast za H

0,95

3,16

Page 19: Testiranje Hipoteza

• Iz populacije sa obeležjem X za koje se zna da je odstupanje 300, ne zna se raspodela, uzet je uzorak oblika 99856 i na osnovu njega je dobijena srednja vrednost 24,3. Sa nivoom značajnosti od 5% testirati hipotezu

prema alternativnim

0 24H

1

1

1

24

24

24

H

H

H

Page 20: Testiranje Hipoteza

• hipotezu Ho ne odbacujemo.

0 1

: ,300 , 24,3

9; 99856; 0,05

24 ; 24

X N X

n

H H

0

0,95

ta

1

1,64

241,64 25,56

300

99856

XZ

noblast prihva anja

P Z z

z z

kk

0H 0,05

1,64z 0kriticna oblast za H

0,95

24,3X

0 24H 1 24H

Page 21: Testiranje Hipoteza

• hipotezu Ho ne odbacujemo.

0 1

: ,300 , 24,3

9; 99856; 0,05

24 ; 24

X N X

n

H H

0

0,95

24,3 241,56

300

998561,64

1,56 1,64

X

nz z

0H 0,05

1,64z 0kriticna oblast za H

0,95

1,56Z

0 24H 1 24H

Page 22: Testiranje Hipoteza

• Hipotezu ne odbacujemo.

0 1

: ,300 , 24,3

9; 99856; 0,05

24 ; 24

X N X

n

H H

0

0,05

24,3 241,56

300

998561,64

1,64 1,56

X

nz z

0 24H 1 24H

0H0,05

1,64z

0kriticna oblast za H

0,95

1,56Z

Page 23: Testiranje Hipoteza

• hipotezu Ho ne odbacujemo.

0 1

: ,300 , 24,3

9; 99856; 0,05

24 ; 24

X N X

n

H H

0

0,95

ta

0,95

1,96

24,5 240,52 1,96;1,96

300

99856

XZ

noblast prihva anja

P Z z

z z

0 24H 1 24H 0 24H

0H2

z 0kriticna oblast za H

oblast odbacivanja

kriticna

oblast

1 2

z

Page 24: Testiranje Hipoteza
Page 25: Testiranje Hipoteza

TESTIRANJE HIPOTEZE AKO SLUČAJNA PROMENLJIVA IMA NORMALNU RASPODELU, A DISPERZIJA JE

NEPOZNATA.

• Postupak je identičan predhodnom slučaju, samo se sada koristi statistika

gde je S uzoračko standardno odstupanje, a slučajna promenljiva ima studentovu t(n-1) raspodelu.

• Dvostrana kritična oblast za nultu hipotezu bila bi , a dobija se na osnovu veze

gde se t izračunava iz tablica za studentovu raspodelu.

0XT

s

n

T t

P T t

0 0H

Page 26: Testiranje Hipoteza

• Primer:

• Mašina proizvodi kuglice prečnika debljine 0,5cm.Da bi proverili da li kuglice imaju prečnik propisane debljine uzima se uzorak od 10 kuglica. Ako je aritmetička sredina uzorka 0,53cm i uzoračko standardno odstupanje 0,03cm, testirati hipotezu da mašina proizvodi kuglice propisanog prečnika sa pragom značajnosti 0,05.

0,95

0 1 1

: 1 9 2,26

0,03, 10, 0,53

0,5 ; 0,53 0,5

X t n t

s n X

H H H

Page 27: Testiranje Hipoteza

• Kako je 24,3<25,56 hipotezu ne odbacujemo.

0

0,95

0,51

0,03

10

0,50,95, 9 2,26

0,03

10

0,52,26 25,56

0,03

10

X kP k T k P

s

n

kP T t

kk

Page 28: Testiranje Hipoteza

• Oblast prihvatanja hipoteze Ho

• hipotezu ne odbacujemo.

0

0,95

0,51 1

0,03

10

0,50,95, 9 2,26

0,03

10

2,26;2,26

0,53 0,53,16 2,26;2,26

0,03

10

X kP k T k P

s

n

kP T t

Page 29: Testiranje Hipoteza

• hipotezu ne odbacujemo.

0

0,95

0

0,51

0,03

10

9 1,833

1,833

3,16

X kP T k P

s

n

t

t

Xs

n

0 10,5 ; 0,5H H

Page 30: Testiranje Hipoteza

• Prosečan broj grešaka u radu jedne mašine je 8. Posle intervencije na mašini moguće je da dođe do povećanja broja grešaka. Da bi se to utvrdilo izvršeno je 100 merenja i dobijeni su sledeći rezultati:

Broj grešaka

0-10 10-20 20-30 30-40 >40

Broj merenja

60 20 10 5 5

Page 31: Testiranje Hipoteza

• Na osnovu zadate tablice izračuna se

• Hipoteza Ho se odbacuje

2

1

0.99

12,5 128,7 11,35

100; 0,01;

8 8

99 2,36

12,5 83,94 2,36

11,35

100

o

X s s

t raspodela

n

H H

t

T

Page 32: Testiranje Hipoteza

• Primer:

U uzorku od 3000 bacanja novčića dobijeno je 1578 grbova. Verovatnoća dobijanja grba je 0,5 i taj podatak uzimamo kao nultu hipotezu, a podatak da će se dobiti više grbova uzima se kao alternativna hipoteza. Testirati nultu hipotezu sa pragom značajnosti od 0,01.

• Slučajna promenljiva X predstavlja broj dobijenih grbova, sa binomnom raspodelom, koja se aproksimira normalnom raspodelm.

• Iz uslova zadatka dobijamo da je

0 10,5 , 0,5H p H p

0,5; 3000; 1500; 750; 0,01p n np npq

Page 33: Testiranje Hipoteza

• Potrebno je odrediti kritičnu vrednost k za nultu hipotezu, i ona u ovom primeru treba da bude veća od 1500, što odgovara verovatnoći od 0,5 grbova. Tada ako je broj izračunatih grbova veći od k, odbacujemo hipotezu, inače je prihvatamo.

• Ako bi koristili jednostrani test u našem primeru kritična oblast bila bi

• Kako je 1578>1564, izračunata vrednost pripada kritičnoj oblasti i odbacujemo nultu hipotezu .

1 0,01 0,99

1500 15000,99 0,99

750 750

15002,32 1564

750

P X k P X k P X k

X X k kP

npq

kk

Page 34: Testiranje Hipoteza

• Ovaj primer mogao se rešiti i na drugi način, samo izračunavanjem praga značajnosti. Takva izračunavanja imaju određene prednosti jer se kvantitativno može odrediti koliko nulta hipoteza protivreči hipotezi .

• Sada u izračunavanju ćemo koristiti dvostrani test i za raliku od predhodnog izračunavanja odrediti oblast prihvatanja nulte hipoteze.

0H

1500

I

1564k 1578

99% 1%