Upload
others
View
13
Download
0
Embed Size (px)
Citation preview
TESTIRANJE HIPOTEZA – OSNOVNI KONCEPTI I
TESTOVI POVEZANOSTI • Novembar 2014
Novembar 2014 Istraživanje tržišta Ekonomski fakultet, Beograd
2
X. Testiranje hipoteza
• Osnovni koncepti testiranja hipoteza • Unakrsno tabeliranje i hi-kvadrat • Testiranje hipoteza o srednjoj vrednosti i proporcijama
• ANOVA
Novembar 2014 Istraživanje tržišta Ekonomski fakultet, Beograd
3
Novembar 2014 Istraživanje tržišta Ekonomski fakultet, Beograd
4
Osnovni koncepti testiranja hipoteza
• Nulta i alternativna hipoteza • Izbor relevantnog statističkog testa i odgovarajućeg rasporeda verovatnoća
• Izbor kritične vrednosti
Novembar 2014 Istraživanje tržišta Ekonomski fakultet, Beograd
5
Izbor statističkog testa i odgovarajućeg rasporeda
• Izbor odgovarajućeg rasporeda verovatnoća zavisi od osnovnog cilja iz koga se hipoteza testira, npr.: – Poređenje uzorka i populacije po određenim
karakteristikama, ili – Poređenje dva uzorka po određenim karakteristikama
(srednje vrednosti, proporcije, varijanse,..) • Različiti statistički testovi se koriste u različite
svrhe, što zavisi i od: – Veličine uzorka, – Da li je poznata populacijska standardna devijacija.
Novembar 2014 Istraživanje tržišta Ekonomski fakultet, Beograd
6
Nulta i alternativna hipoteza
• Cilj je da se donese sud o razlici između statističkih pokazatelja uzorka i hipotetičkih vrednosti parametara populacije
Novembar 2014 Istraživanje tržišta Ekonomski fakultet, Beograd
7
Izbor kritične vrednosti • Nivo značajnosti, α, pokazuje procenat uzoračkih
realizacija koje se nalaze izvan definisanih granica – Greška I vrste – verovatnoća da se odbaci istinita nulta
hipoteza – Greška II vrste, β, verovatnoća neodbacivanja netačne
nulte hipoteze – Snaga testa hipoteze, 1-β, verovatnoća odbacivanja
netačne nulte hipoteze • Stepeni slobode • Jednostrani (jednosmerni) ili dvostrani (dvosmerni)
testovi
Novembar 2014 Istraživanje tržišta Ekonomski fakultet, Beograd
8
Unakrsno tabeliranje i hi-kvadrat testovi
• Hi-kvadrat test nezavisnosti • Mere povezanosti za nominalne varijable • Hi-kvadrat test prilagođenosti
Novembar 2014 Istraživanje tržišta Ekonomski fakultet, Beograd
9
Hi-kvadrat test nezavisnosti (1)
• Primenjuje se u tabelama kontingencije H0: Dve (nominalne) varijable su međusobno nezavisne Ha: Postoji zavisnost među dvema varijablama
• Hi-kvadrat raspored je određen svojim stepenima slobode, , r→br.redova, c→br.kolona – Hi-kvadrat-statistika, χ2, je mera razlike između stvarnog
broja opservacija u polju i, u oznaci Oi, i broja opservacija koji bi se očekivao da je nulta hipoteza istinita, to jest pod pretpostavkom statističke nezavisnosti, Ei.
( )∑ =
−=
k
ii
ii
EEO
1
22χ
)1()1( −⋅−= crv
Primer: Koliko često kupujete Politiku?
Pol
Svaki dan Najmanje jednom nedeljno
Najmanje jednom
mesečno
Ni jednom
mesečno
Muškarac
80
70
30
20
Žena
40
60
50
50
Novembar 2014 Istraživanje tržišta Ekonomski fakultet, Beograd
10
Pol
Svaki dan Najmanje jednom nedeljno
Najmanje jednom
mesečno
Ni jednom
mesečno
Muškarac
50
50
50
50
Žena
50
50
50
50
Primer: Koliko često kupujete Politiku?
Pol
Svaki dan Najmanje jednom nedeljno
Najmanje jednom
mesečno
Ni jednom
mesečno
Muškarac
80
70
30
20
Žena
40
60
50
50
Novembar 2014 Istraživanje tržišta Ekonomski fakultet, Beograd
11
Pol
Svaki dan Najmanje jednom nedeljno
Najmanje jednom
mesečno
Ni jednom
mesečno
Muškarac
50
50
50
50
Žena
50
50
50
50
Primer: Koliko često kupujete Politiku
Pol:
Svaki dan
Najmanje jednom nedeljno
Najmanje jednom
mesečno
Ni jednom
mesečno
Uk.
Muš-karac
80
70
30
20
200
Žena
40
60
50
50
200
Uk.
120
130
80
70
Novembar 2014 Istraživanje tržišta Ekonomski fakultet, Beograd
12
Primer: Koliko često kupujete Politiku
Pol:
Svaki dan
Najmanje jednom nedeljno
Najmanje jednom
mesečno
Ni jednom
mesečno
Uk.
Muš-karac
60
65
40
35
200
Žena
60
65
40
35
200
Uk.
120
130
80
70
Novembar 2014 Istraživanje tržišta Ekonomski fakultet, Beograd
13
Novembar 2014 Istraživanje tržišta Ekonomski fakultet, Beograd
14
Hi-kvadrat test nezavisnosti (2) • Ograničenja primene:
– Rezultati su validni samo ako je vrednost očekivane frekvencije u svakom polju tabele najmanje 5.
– Ako je vrednost hi-kvadrat statistike 0 treba proveriti rezult • Jačina povezanosti , C=0→nema zavisnosti C≠1 • Ograničenja C kao mere povezanosti
– Mera je proporcionalna veličini uzorka – Mera nema gornju granicu pa je teško tumačenje – Ne daje indikaciju KAKO su varijable povezane
nC
+= 2
2
χχ
Novembar 2014 Istraživanje tržišta Ekonomski fakultet, Beograd
15
Mere povezanosti za nominalne varijable (1)
• Mere bazirane na hi-kvadrat statistici – Koeficijent kontingencije, C – Fi-kvadrat: ,
– Kramerovo V,
– Sve navedene mere se lako računaju i teško tumače, uglavnom zato što ne postoji referentna gornja granica
n
22 χ
φ =
)1,1min(
2
−−=
crV φ
Novembar 2014 Istraživanje tržišta Ekonomski fakultet, Beograd
16
Mere povezanosti za nominalne varijable (2)
• Gudmanovo i Kruskalovo tau:
– Mera dozvoljava proporcionalno smanjenje greške – Ima teorijski smisao – Mera ima gornju granicu, koja je najviše jednaka 1, ali je
najčešće manja od 1 – Gornja granica se može izračunati i specifična je za svaku
tabelu
XXX
nepoznatozagrešakabroj)poznatozagrešakabroj()nepoznatozagrešakabroj(tau −
=
Novembar 2014 Istraživanje tržišta Ekonomski fakultet, Beograd
17
Hi-kvadrat test prilagođenosti
• Koristi se da se odredi da li populacijski raspored odgovara nekom konkretnom, očekivanom obliku rasporeda verovatnoća
• Koristi se u obliku: Oi = realizacija u polju i Ei = očekivana vrednosti u polju i k = broj međusobno odvojenih kategorija
– Broj stepeni slobode: v = (k – 1)
( )∑=
−=
k
i i
ii
EEO
1
22χ
Novembar 2014 Istraživanje tržišta Ekonomski fakultet, Beograd
18
Testiranje hipoteza o srednjoj vrednosti i proporcijama
• Testiranje hipoteza o srednjoj vrednosti • Testiranje hipoteza o razlici između dve srednje vrednosti • Testiranje hipoteza o proporcijama • Testiranje hipoteza o razlici između proporcija
Novembar 2014 Istraživanje tržišta Ekonomski fakultet, Beograd
19
Testiranje hipoteza o srednjoj vrednosti (1)
Poznata je populacijska standardna devijacija, σ – Dvostrani test:
H0: µ = µ0
Ha: µ ≠ µ0 – Standardna greška srednje vrednosti: – z-vrednost se izračunava kao: (µ= µ0) – Nulta hipoteza se odbacuje ako:
(primenom odgovarajućeg α)
nxσ
σ =
x
xZσµ−
=
.2/αZZizrač >
Novembar 2014 Istraživanje tržišta Ekonomski fakultet, Beograd
20
Testiranje hipoteza o srednjoj vrednosti (2)
Poznata je populacijska standardna devijacija, σ – Jednostrani test:
H0: µ ≥ µ0 Ha: µ < µ0
– Standardna greška srednje vrednosti: – z-vrednost se izračunava kao: (µ= µ0) – Nulta hipoteza se odbacuje ako je
(primenom odgovarajućeg α)
nxσ
σ =
x
xZσµ−
=
.αZZizrač −<
Novembar 2014 Istraživanje tržišta Ekonomski fakultet, Beograd
21
Testiranje hipoteza o srednjoj vrednosti (3)
Nije poznata populacijska standardna devijacija, σ – Uzoračka standardna devijacija, s, se koristi kao ocena
populacijske standardne devijacije – Standardna greška srednje vrednosti:
– Umesto normalnog, koristi se t-raspored:
– Broj stepeni slobode je n-1 – Sve ostalo je isto kao u prethodno navedenim
jednostranim, odnosno dvostranim testovima respektivno
nssx =
xizrač s
xt µ−=
Novembar 2014 Istraživanje tržišta Ekonomski fakultet, Beograd
22
Testiranje hipoteze o razlici između dve srednje vrednosti (1)
Dva nezavisna uzorka sa poznatim σ1 i σ2 – Dvostrani test:
H0: µ1 – µ2 = c Ha: µ1 – µ2 ≠ c
– Standardna greška:
– Z-vrednost se izračunava kao
– Ako se koriste veliki uzorci, σ se može aproksimirati sa s – Nulta hipoteza se odbacuje ako:
2
22
1
21
21 nnxxσσ
σ +=−
( ) ( )21
2121
xxizrač
xxZ−
−−−=
σµµ
2/αZZizrač >
Novembar 2014 Istraživanje tržišta Ekonomski fakultet, Beograd
23
Testiranje hipoteze o razlici između dve srednje vrednosti (2)
Dva nezavisna uzorka sa poznatim σ1 i σ2 – Jednostrani test:
H0: µ1 ≤ µ2
Ha: µ1 – µ2 > 0 – Standardna greška:
– Z-vrednost se izračunava kao
– Ako se koriste veliki uzorci, σ se može aproksimirati sa s – Nulta hipoteza se odbacuje ako:
2
22
1
21
21 nnxxσσ
σ +=−
( ) ( )21
2121
xxizrač
xxZ−
−−−=
σµµ
αZZizrač >
Novembar 2014 Istraživanje tržišta Ekonomski fakultet, Beograd
24
Testiranje hipoteze o razlici između dve srednje vrednosti (3)
Dva nezavisna uzorka sa nepoznatim σ1 i σ2, σ1=σ2 – Uzoračke standardne devijacije, s1 i s2, se koriste kao ocena – Koristi se t-raspored sa stepeni slobode i računa – Standardna greška iznosi:
– Pravila za odbacivanje nulte hipoteze su slične (samo se koristi t-vrednost umesto z-vrednosti)
( ) ( )21
2121
xxsxxt
−
−−−=
µµ
21
1121 nnss Pxx +=− 2
)1()1(21
222
2112
−+−+−
=nn
snsnsP
221 −+nn
Novembar 2014 Istraživanje tržišta Ekonomski fakultet, Beograd
25
Testiranje hipoteze o razlici između dve srednje vrednosti (4)
Dva nezavisna uzorka sa nepoznatim σ1 i σ2, σ1≠σ2 – Uzoračke standardne devijacije, s1 i s2, se koriste kao ocena
– Koristi se t-raspored sa st. slobode
– t-statistika iznosi
– Standardna greška iznosi:
– Pravila za odbacivanje nulte hipoteze su ista kao prethodno
( ) ( )21
2121
xxsxxt
−
−−−=
µµ
2
22
1
21
21 ns
nss xx +=− ( ) ( )22
2121
121
nsnsnsg
+=
)1)(1()1()1)(1(
122
2
21
−−+−
−−
nggnnn
Novembar 2014 Istraživanje tržišta Ekonomski fakultet, Beograd
26
Testiranje hipoteze o razlici između dve srednje vrednosti (5)
Dva zavisna uzorka – Kada su uzorci zavisni, može, na primer, da se pretpostavi
da se radi o istom uzorku, pa se računa D = x1 – x2:
, gde je:
– Odgovarajući test je: sa (n-1) stepeni slobode
– A standardna greška
dDH ≥:0dDHa <:
nsdDt
D
−=
∑=
=n
iiDn
D1
1
⎟⎠
⎞⎜⎝
⎛−
−= ∑
=
n
iiD DnD
ns
1
222
11
Novembar 2014 Istraživanje tržišta Ekonomski fakultet, Beograd
27
Testiranje hipoteza o proporcijama – Dvostrani test:
H0: p = p0
Ha: p ≠ p0 – Standardna greška srednje vrednosti: – Za velike uzorke se koristi normalna aproksimacija
binomnog rasporeda, i dobija se intervalna ocena:
– Odnosno, nulta hipoteza se odbacuje ako je izračunata proporcija van ovog intervala.
npp
p)1( 00 −
=σ
nppZpZp p)1( 00
2/02/0−
±=± αα σ