Upload
dejan032
View
59
Download
3
Embed Size (px)
DESCRIPTION
Slajdovi testiranje hipoteza verovatnoca i statistika
Citation preview
TESTIRANJE HIPOTEZA
• Kao što znamo, na osnovu slučajno izabranog uzorka neke populacije, stiču se saznanja o toj populaciji.
• Ona se koriste u postavljanju, prihvatanju ili odbacivanju nekih predpostavki koje se odnose na parametere obeležja X populacije i na njegovu raspodelu.
• Svaka predpostavka koja se odnosi na obeležje X zove se statistička hipoteza.
• Postoje 2 vrste hipoteza:
1. Hipoteze koje se odnose na raspodele obeležja nazivaju se neparametarske hipoteze
2. paramerarske hipoteze odnose na karakteristične parametre.
Primer:
Ako naprimer bacamo kocku 1000 puta i ako se 6 pojavi 185 puta , parametarska hipoteza bi bila da je
neparametarska hipoteza bi bila da se verovatnoće pojave određenog broja raspoređuju po binomnoj raspodeli
1
6p
, ,
1, 1000, 185,6
1n kk
n k p
p n k
nP p p
k
• Mi ćemo se baviti samo parametarskim hipotezama.
• Hipoteza može da bude pogrešna i tačna.
• Zato se postavljene hipoteze podvrgavaju se statističkom proveravanju , testiranju, verifikaciji, pomoću koga se donose odluke, da li sa određenom verovatnoćom, hipoteze se prihvataju ili odbacuju.
• Savremenu teoriju verifikacije dali su Nejman i Pirson (1928,1933 )
• Potrebno je definisati dve hipoteze:
-Ho polaznu-nultu i H1 -suprotnu- alternativnu.
Zaključak testa za verifikaciju hipoteze može biti:
• Odbacujemo Ho, kao posledicu eksperimenta na uzorku i prihvatamo H1 .
• Ne odbacujemo Ho , jer nemamo dokaza protiv nje.
Primer:
• Ako se na tržištu pojavi nov proizvod, proizvođač mora da dokaže da je njegov proizvod bolji od postojećih.
• Polazna hipoteza Ho je da je novi proizvod najbolji, i da bi dokazao tu hipotezu, on mora da obori suprotnu, alternativnu H1 , da su stari proizvodi bolji od novog.
• Treba imati na umu da je Ho slučajna promenljiva, sa svojom raspodelom, koja je definisana pomoću usvojenog uzorka.
• Ako znamo njenu raspodelu mi možemo da odredimo interval za koji možemo da tvrdimo da sa unapred poznatom verovatnoćom sadrži istraživani parametar, ako je hipoteza tačna.
• Granice ovog intervala zovu se donji i gornji prag značajnosti.
• Odluke se donose na osnovu vrednosti koje su rezultat eksperimenta na uočenom uzorku.
• Ako se izračunata vrednost parametara nađe u ovom intervalu nema razloga za dobacivanje polazne hipoteze, a ako je van intervala hipoteza se odbacuje.
X
Testiranje na osnovunormalnog rasporeda
Uslov: 30n
• Sa unapred zadatom verovatnoćom ( naprimer 0,95) možemo da odredimo neki interval i proverimo da li vrednost pripada tom intervalu.
• Tada odstupanja imaju slučajan karakter i nema razloga za odbacivanjem nulte hipoteze
• Za verovatnoću od 0,95 prag značajnosti je 0,05 , a to znači da postoji 5% rizika da posmatrana vrednosti ne pripada izračunatom intervalu i da nulta hipotezanije tačna.
• To znači da su ostupanja od početne hipoteze značajna.
• Znači radi testiranja hipoteze prvo treba odrediti kritičnu vrednost k, odnosno kako odrediti k, gde povući granicu između slučajnih i značajnih odstupanja????
X
Dvostrani test
• Ukoliko je dobijamo oblast prihvatanja nulte hipoteze, interval ,k k
0H2
kk
o
kriticna oblast
oblast odbacivanja Hkriticna
oblast
1 2
tan ooblast prihva ja H
0 0 1 0: :H H
P X k
• Jednostrani i test:
k
o
kriticna oblast
oblast odbacivanja H
1
tan ooblast prihva ja H
k
o
kriticna oblast
oblast odbacivanja H
1
tan ooblast prihva ja H
P X k
P X k
GREŠKE TESTIRANJA HIPOTEZA
• Greške prvog tipa, greške nastaju kada nultu hipotezu odbacimo, a tačna je i prihvatimo alternativnu hipotezu
• Greške drugog tipa, greške nastaje kada nultu hipotezu ne obacimo, a pogrešna je
GREŠKE TESTIRANJA HIPOTEZA
Testiranjem H0 se prihvata
Testiranjem H0 se odbacuje
H0 je istinita u osnovnom skupu
Dobra odluka,uz verovatnocu 1−
Greška prve vrste,uz verovatnocu
H0 je neistinita u osnovnom skupu
Greška druge vrste,uz uslovnu verovatnocu
Dobra odluka,uz verovatnocu 1−(ova verovatnoca se zove''jacina testa'' ili ''moc testa'')
TESTIRANJE HIPOTEZE AKO SLUČAJNA PROMENLJIVA IMA NORMALNU RASPODELU, A JE POZNATO
• U slučaju testiranja nulte hipoteze Ho protiv alternativne hipoteze H1, ako slučajna promenljiva ima normalnu raspodelu , a disperzija je poznata , važi
• Ako promenljiva nema standardnu raspodelu, uvodimo statistiku
koja ima standardnu normalnu N(0,1) raspodelu .
aritmetička sredina dobijena na osnovu uzorka,
predpostavnjena vrednost sredine populacije,
standardno odstupanje populacije i n je obim uzorka.
0XZ
n
X
0
0 0H
P X z
• Testovi mogu biti dvosmeri kada testiramo hipotezu protiv hipoteze
• Kritična oblast prihvatanja nulte hipoteze je na osnovu zadatog praga značajnosti
• a oblast odbacivanja
0 0H
1 0H
, ,z z
,z z
0 0 0k X kP
n n n
P z Z z
• Verovatnoća prag značajnosti, obično se uzima da je 0,01 i 0,05, a za izračunavanje koriste se tablice normalne raspodele.
0H2
z 0kriticna oblast za H
oblast odbacivanja
kriticna
oblast
1 2
z
z 0kriticna oblast za H
1
0
tan
XZ
noblast neprihva ja
P Z z
z
0kriticna oblast za H
0
tan
XZ
noblast neprihva ja
P Z z
taoblast neprihva anja
P Z z
• Primer:• Za dozu nekog leka zna se da ima normalnu raspodelu . Uzet je
uzorak obima 10 i na osnovu dobijenih podataka dobijena srednja vrednost doze od 24,3gr.
• Sa pragom značajnosti od 5% testirati hipotezu za matematičko očekivanje od 24gr preko altetnativnog od 26gr.
,9N
• hipotezu ne odbacujemo.
0 1
: ,9 , 24,3
3; 10; 0,05
24 ; 26
X N X
n
H H
0,95
ta
1
24,3 240,316
300
998561,64
0,316 1,64
oblast prihva anja
P Z z
X
nz z
0H 0,05
1,64z 0kriticna oblast za H
0,95
3,16
• Iz populacije sa obeležjem X za koje se zna da je odstupanje 300, ne zna se raspodela, uzet je uzorak oblika 99856 i na osnovu njega je dobijena srednja vrednost 24,3. Sa nivoom značajnosti od 5% testirati hipotezu
prema alternativnim
0 24H
1
1
1
24
24
24
H
H
H
• hipotezu Ho ne odbacujemo.
0 1
: ,300 , 24,3
9; 99856; 0,05
24 ; 24
X N X
n
H H
0
0,95
ta
1
1,64
241,64 25,56
300
99856
XZ
noblast prihva anja
P Z z
z z
kk
0H 0,05
1,64z 0kriticna oblast za H
0,95
24,3X
0 24H 1 24H
• hipotezu Ho ne odbacujemo.
0 1
: ,300 , 24,3
9; 99856; 0,05
24 ; 24
X N X
n
H H
0
0,95
24,3 241,56
300
998561,64
1,56 1,64
X
nz z
0H 0,05
1,64z 0kriticna oblast za H
0,95
1,56Z
0 24H 1 24H
• Hipotezu ne odbacujemo.
0 1
: ,300 , 24,3
9; 99856; 0,05
24 ; 24
X N X
n
H H
0
0,05
24,3 241,56
300
998561,64
1,64 1,56
X
nz z
0 24H 1 24H
0H0,05
1,64z
0kriticna oblast za H
0,95
1,56Z
• hipotezu Ho ne odbacujemo.
0 1
: ,300 , 24,3
9; 99856; 0,05
24 ; 24
X N X
n
H H
0
0,95
ta
0,95
1,96
24,5 240,52 1,96;1,96
300
99856
XZ
noblast prihva anja
P Z z
z z
0 24H 1 24H 0 24H
0H2
z 0kriticna oblast za H
oblast odbacivanja
kriticna
oblast
1 2
z
TESTIRANJE HIPOTEZE AKO SLUČAJNA PROMENLJIVA IMA NORMALNU RASPODELU, A DISPERZIJA JE
NEPOZNATA.
• Postupak je identičan predhodnom slučaju, samo se sada koristi statistika
gde je S uzoračko standardno odstupanje, a slučajna promenljiva ima studentovu t(n-1) raspodelu.
• Dvostrana kritična oblast za nultu hipotezu bila bi , a dobija se na osnovu veze
gde se t izračunava iz tablica za studentovu raspodelu.
0XT
s
n
T t
P T t
0 0H
• Primer:
• Mašina proizvodi kuglice prečnika debljine 0,5cm.Da bi proverili da li kuglice imaju prečnik propisane debljine uzima se uzorak od 10 kuglica. Ako je aritmetička sredina uzorka 0,53cm i uzoračko standardno odstupanje 0,03cm, testirati hipotezu da mašina proizvodi kuglice propisanog prečnika sa pragom značajnosti 0,05.
0,95
0 1 1
: 1 9 2,26
0,03, 10, 0,53
0,5 ; 0,53 0,5
X t n t
s n X
H H H
• Kako je 24,3<25,56 hipotezu ne odbacujemo.
0
0,95
0,51
0,03
10
0,50,95, 9 2,26
0,03
10
0,52,26 25,56
0,03
10
X kP k T k P
s
n
kP T t
kk
• Oblast prihvatanja hipoteze Ho
• hipotezu ne odbacujemo.
0
0,95
0,51 1
0,03
10
0,50,95, 9 2,26
0,03
10
2,26;2,26
0,53 0,53,16 2,26;2,26
0,03
10
X kP k T k P
s
n
kP T t
• hipotezu ne odbacujemo.
0
0,95
0
0,51
0,03
10
9 1,833
1,833
3,16
X kP T k P
s
n
t
t
Xs
n
0 10,5 ; 0,5H H
• Prosečan broj grešaka u radu jedne mašine je 8. Posle intervencije na mašini moguće je da dođe do povećanja broja grešaka. Da bi se to utvrdilo izvršeno je 100 merenja i dobijeni su sledeći rezultati:
Broj grešaka
0-10 10-20 20-30 30-40 >40
Broj merenja
60 20 10 5 5
• Na osnovu zadate tablice izračuna se
• Hipoteza Ho se odbacuje
2
1
0.99
12,5 128,7 11,35
100; 0,01;
8 8
99 2,36
12,5 83,94 2,36
11,35
100
o
X s s
t raspodela
n
H H
t
T
• Primer:
U uzorku od 3000 bacanja novčića dobijeno je 1578 grbova. Verovatnoća dobijanja grba je 0,5 i taj podatak uzimamo kao nultu hipotezu, a podatak da će se dobiti više grbova uzima se kao alternativna hipoteza. Testirati nultu hipotezu sa pragom značajnosti od 0,01.
• Slučajna promenljiva X predstavlja broj dobijenih grbova, sa binomnom raspodelom, koja se aproksimira normalnom raspodelm.
• Iz uslova zadatka dobijamo da je
0 10,5 , 0,5H p H p
0,5; 3000; 1500; 750; 0,01p n np npq
• Potrebno je odrediti kritičnu vrednost k za nultu hipotezu, i ona u ovom primeru treba da bude veća od 1500, što odgovara verovatnoći od 0,5 grbova. Tada ako je broj izračunatih grbova veći od k, odbacujemo hipotezu, inače je prihvatamo.
• Ako bi koristili jednostrani test u našem primeru kritična oblast bila bi
• Kako je 1578>1564, izračunata vrednost pripada kritičnoj oblasti i odbacujemo nultu hipotezu .
1 0,01 0,99
1500 15000,99 0,99
750 750
15002,32 1564
750
P X k P X k P X k
X X k kP
npq
kk
• Ovaj primer mogao se rešiti i na drugi način, samo izračunavanjem praga značajnosti. Takva izračunavanja imaju određene prednosti jer se kvantitativno može odrediti koliko nulta hipoteza protivreči hipotezi .
• Sada u izračunavanju ćemo koristiti dvostrani test i za raliku od predhodnog izračunavanja odrediti oblast prihvatanja nulte hipoteze.
0H
1500
I
1564k 1578
99% 1%