27
TESTIRANJE HIPOTEZA – OSNOVNI KONCEPTI I TESTOVI POVEZANOSTI Novembar 2014

TESTIRANJE HIPOTEZA – OSNOVNI KONCEPTI I TESTOVI … · frekvencije u svakom polju tabele najmanje 5. – Ako je vrednost hi-kvadrat statistike 0 treba proveriti rezult • Jačina

  • Upload
    others

  • View
    13

  • Download
    0

Embed Size (px)

Citation preview

Page 1: TESTIRANJE HIPOTEZA – OSNOVNI KONCEPTI I TESTOVI … · frekvencije u svakom polju tabele najmanje 5. – Ako je vrednost hi-kvadrat statistike 0 treba proveriti rezult • Jačina

TESTIRANJE HIPOTEZA – OSNOVNI KONCEPTI I

TESTOVI POVEZANOSTI •  Novembar 2014

Page 2: TESTIRANJE HIPOTEZA – OSNOVNI KONCEPTI I TESTOVI … · frekvencije u svakom polju tabele najmanje 5. – Ako je vrednost hi-kvadrat statistike 0 treba proveriti rezult • Jačina

Novembar 2014 Istraživanje tržišta Ekonomski fakultet, Beograd

2

X. Testiranje hipoteza

• Osnovni koncepti testiranja hipoteza • Unakrsno tabeliranje i hi-kvadrat • Testiranje hipoteza o srednjoj vrednosti i proporcijama

• ANOVA

Page 3: TESTIRANJE HIPOTEZA – OSNOVNI KONCEPTI I TESTOVI … · frekvencije u svakom polju tabele najmanje 5. – Ako je vrednost hi-kvadrat statistike 0 treba proveriti rezult • Jačina

Novembar 2014 Istraživanje tržišta Ekonomski fakultet, Beograd

3

Page 4: TESTIRANJE HIPOTEZA – OSNOVNI KONCEPTI I TESTOVI … · frekvencije u svakom polju tabele najmanje 5. – Ako je vrednost hi-kvadrat statistike 0 treba proveriti rezult • Jačina

Novembar 2014 Istraživanje tržišta Ekonomski fakultet, Beograd

4

Osnovni koncepti testiranja hipoteza

• Nulta i alternativna hipoteza •  Izbor relevantnog statističkog testa i odgovarajućeg rasporeda verovatnoća

•  Izbor kritične vrednosti

Page 5: TESTIRANJE HIPOTEZA – OSNOVNI KONCEPTI I TESTOVI … · frekvencije u svakom polju tabele najmanje 5. – Ako je vrednost hi-kvadrat statistike 0 treba proveriti rezult • Jačina

Novembar 2014 Istraživanje tržišta Ekonomski fakultet, Beograd

5

Izbor statističkog testa i odgovarajućeg rasporeda

•  Izbor odgovarajućeg rasporeda verovatnoća zavisi od osnovnog cilja iz koga se hipoteza testira, npr.: –  Poređenje uzorka i populacije po određenim

karakteristikama, ili –  Poređenje dva uzorka po određenim karakteristikama

(srednje vrednosti, proporcije, varijanse,..) •  Različiti statistički testovi se koriste u različite

svrhe, što zavisi i od: –  Veličine uzorka, –  Da li je poznata populacijska standardna devijacija.

Page 6: TESTIRANJE HIPOTEZA – OSNOVNI KONCEPTI I TESTOVI … · frekvencije u svakom polju tabele najmanje 5. – Ako je vrednost hi-kvadrat statistike 0 treba proveriti rezult • Jačina

Novembar 2014 Istraživanje tržišta Ekonomski fakultet, Beograd

6

Nulta i alternativna hipoteza

•  Cilj je da se donese sud o razlici između statističkih pokazatelja uzorka i hipotetičkih vrednosti parametara populacije

Page 7: TESTIRANJE HIPOTEZA – OSNOVNI KONCEPTI I TESTOVI … · frekvencije u svakom polju tabele najmanje 5. – Ako je vrednost hi-kvadrat statistike 0 treba proveriti rezult • Jačina

Novembar 2014 Istraživanje tržišta Ekonomski fakultet, Beograd

7

Izbor kritične vrednosti •  Nivo značajnosti, α, pokazuje procenat uzoračkih

realizacija koje se nalaze izvan definisanih granica –  Greška I vrste – verovatnoća da se odbaci istinita nulta

hipoteza –  Greška II vrste, β, verovatnoća neodbacivanja netačne

nulte hipoteze –  Snaga testa hipoteze, 1-β, verovatnoća odbacivanja

netačne nulte hipoteze •  Stepeni slobode •  Jednostrani (jednosmerni) ili dvostrani (dvosmerni)

testovi

Page 8: TESTIRANJE HIPOTEZA – OSNOVNI KONCEPTI I TESTOVI … · frekvencije u svakom polju tabele najmanje 5. – Ako je vrednost hi-kvadrat statistike 0 treba proveriti rezult • Jačina

Novembar 2014 Istraživanje tržišta Ekonomski fakultet, Beograd

8

Unakrsno tabeliranje i hi-kvadrat testovi

•  Hi-kvadrat test nezavisnosti •  Mere povezanosti za nominalne varijable •  Hi-kvadrat test prilagođenosti

Page 9: TESTIRANJE HIPOTEZA – OSNOVNI KONCEPTI I TESTOVI … · frekvencije u svakom polju tabele najmanje 5. – Ako je vrednost hi-kvadrat statistike 0 treba proveriti rezult • Jačina

Novembar 2014 Istraživanje tržišta Ekonomski fakultet, Beograd

9

Hi-kvadrat test nezavisnosti (1)

•  Primenjuje se u tabelama kontingencije H0: Dve (nominalne) varijable su međusobno nezavisne Ha: Postoji zavisnost među dvema varijablama

•  Hi-kvadrat raspored je određen svojim stepenima slobode, , r→br.redova, c→br.kolona –  Hi-kvadrat-statistika, χ2, je mera razlike između stvarnog

broja opservacija u polju i, u oznaci Oi, i broja opservacija koji bi se očekivao da je nulta hipoteza istinita, to jest pod pretpostavkom statističke nezavisnosti, Ei.

( )∑ =

−=

k

ii

ii

EEO

1

22χ

)1()1( −⋅−= crv

Page 10: TESTIRANJE HIPOTEZA – OSNOVNI KONCEPTI I TESTOVI … · frekvencije u svakom polju tabele najmanje 5. – Ako je vrednost hi-kvadrat statistike 0 treba proveriti rezult • Jačina

Primer: Koliko često kupujete Politiku?

Pol

Svaki dan Najmanje jednom nedeljno

Najmanje jednom

mesečno

Ni jednom

mesečno

Muškarac

80

70

30

20

Žena

40

60

50

50

Novembar 2014 Istraživanje tržišta Ekonomski fakultet, Beograd

10

Pol

Svaki dan Najmanje jednom nedeljno

Najmanje jednom

mesečno

Ni jednom

mesečno

Muškarac

50

50

50

50

Žena

50

50

50

50

Page 11: TESTIRANJE HIPOTEZA – OSNOVNI KONCEPTI I TESTOVI … · frekvencije u svakom polju tabele najmanje 5. – Ako je vrednost hi-kvadrat statistike 0 treba proveriti rezult • Jačina

Primer: Koliko često kupujete Politiku?

Pol

Svaki dan Najmanje jednom nedeljno

Najmanje jednom

mesečno

Ni jednom

mesečno

Muškarac

80

70

30

20

Žena

40

60

50

50

Novembar 2014 Istraživanje tržišta Ekonomski fakultet, Beograd

11

Pol

Svaki dan Najmanje jednom nedeljno

Najmanje jednom

mesečno

Ni jednom

mesečno

Muškarac

50

50

50

50

Žena

50

50

50

50

Page 12: TESTIRANJE HIPOTEZA – OSNOVNI KONCEPTI I TESTOVI … · frekvencije u svakom polju tabele najmanje 5. – Ako je vrednost hi-kvadrat statistike 0 treba proveriti rezult • Jačina

Primer: Koliko često kupujete Politiku

Pol:

Svaki dan

Najmanje jednom nedeljno

Najmanje jednom

mesečno

Ni jednom

mesečno

Uk.

Muš-karac

80

70

30

20

200

Žena

40

60

50

50

200

Uk.

120

130

80

70

Novembar 2014 Istraživanje tržišta Ekonomski fakultet, Beograd

12

Page 13: TESTIRANJE HIPOTEZA – OSNOVNI KONCEPTI I TESTOVI … · frekvencije u svakom polju tabele najmanje 5. – Ako je vrednost hi-kvadrat statistike 0 treba proveriti rezult • Jačina

Primer: Koliko često kupujete Politiku

Pol:

Svaki dan

Najmanje jednom nedeljno

Najmanje jednom

mesečno

Ni jednom

mesečno

Uk.

Muš-karac

60

65

40

35

200

Žena

60

65

40

35

200

Uk.

120

130

80

70

Novembar 2014 Istraživanje tržišta Ekonomski fakultet, Beograd

13

Page 14: TESTIRANJE HIPOTEZA – OSNOVNI KONCEPTI I TESTOVI … · frekvencije u svakom polju tabele najmanje 5. – Ako je vrednost hi-kvadrat statistike 0 treba proveriti rezult • Jačina

Novembar 2014 Istraživanje tržišta Ekonomski fakultet, Beograd

14

Hi-kvadrat test nezavisnosti (2) •  Ograničenja primene:

–  Rezultati su validni samo ako je vrednost očekivane frekvencije u svakom polju tabele najmanje 5.

–  Ako je vrednost hi-kvadrat statistike 0 treba proveriti rezult •  Jačina povezanosti , C=0→nema zavisnosti C≠1 •  Ograničenja C kao mere povezanosti

–  Mera je proporcionalna veličini uzorka –  Mera nema gornju granicu pa je teško tumačenje –  Ne daje indikaciju KAKO su varijable povezane

nC

+= 2

2

χχ

Page 15: TESTIRANJE HIPOTEZA – OSNOVNI KONCEPTI I TESTOVI … · frekvencije u svakom polju tabele najmanje 5. – Ako je vrednost hi-kvadrat statistike 0 treba proveriti rezult • Jačina

Novembar 2014 Istraživanje tržišta Ekonomski fakultet, Beograd

15

Mere povezanosti za nominalne varijable (1)

•  Mere bazirane na hi-kvadrat statistici –  Koeficijent kontingencije, C –  Fi-kvadrat: ,

–  Kramerovo V,

–  Sve navedene mere se lako računaju i teško tumače, uglavnom zato što ne postoji referentna gornja granica

n

22 χ

φ =

)1,1min(

2

−−=

crV φ

Page 16: TESTIRANJE HIPOTEZA – OSNOVNI KONCEPTI I TESTOVI … · frekvencije u svakom polju tabele najmanje 5. – Ako je vrednost hi-kvadrat statistike 0 treba proveriti rezult • Jačina

Novembar 2014 Istraživanje tržišta Ekonomski fakultet, Beograd

16

Mere povezanosti za nominalne varijable (2)

•  Gudmanovo i Kruskalovo tau:

–  Mera dozvoljava proporcionalno smanjenje greške –  Ima teorijski smisao –  Mera ima gornju granicu, koja je najviše jednaka 1, ali je

najčešće manja od 1 –  Gornja granica se može izračunati i specifična je za svaku

tabelu

XXX

nepoznatozagrešakabroj)poznatozagrešakabroj()nepoznatozagrešakabroj(tau −

=

Page 17: TESTIRANJE HIPOTEZA – OSNOVNI KONCEPTI I TESTOVI … · frekvencije u svakom polju tabele najmanje 5. – Ako je vrednost hi-kvadrat statistike 0 treba proveriti rezult • Jačina

Novembar 2014 Istraživanje tržišta Ekonomski fakultet, Beograd

17

Hi-kvadrat test prilagođenosti

•  Koristi se da se odredi da li populacijski raspored odgovara nekom konkretnom, očekivanom obliku rasporeda verovatnoća

•  Koristi se u obliku: Oi = realizacija u polju i Ei = očekivana vrednosti u polju i k = broj međusobno odvojenih kategorija

–  Broj stepeni slobode: v = (k – 1)

( )∑=

−=

k

i i

ii

EEO

1

22χ

Page 18: TESTIRANJE HIPOTEZA – OSNOVNI KONCEPTI I TESTOVI … · frekvencije u svakom polju tabele najmanje 5. – Ako je vrednost hi-kvadrat statistike 0 treba proveriti rezult • Jačina

Novembar 2014 Istraživanje tržišta Ekonomski fakultet, Beograd

18

Testiranje hipoteza o srednjoj vrednosti i proporcijama

• Testiranje hipoteza o srednjoj vrednosti • Testiranje hipoteza o razlici između dve srednje vrednosti • Testiranje hipoteza o proporcijama • Testiranje hipoteza o razlici između proporcija

Page 19: TESTIRANJE HIPOTEZA – OSNOVNI KONCEPTI I TESTOVI … · frekvencije u svakom polju tabele najmanje 5. – Ako je vrednost hi-kvadrat statistike 0 treba proveriti rezult • Jačina

Novembar 2014 Istraživanje tržišta Ekonomski fakultet, Beograd

19

Testiranje hipoteza o srednjoj vrednosti (1)

Poznata je populacijska standardna devijacija, σ –  Dvostrani test:

H0: µ = µ0

Ha: µ ≠ µ0 –  Standardna greška srednje vrednosti: –  z-vrednost se izračunava kao: (µ= µ0) –  Nulta hipoteza se odbacuje ako:

(primenom odgovarajućeg α)

nxσ

σ =

x

xZσµ−

=

.2/αZZizrač >

Page 20: TESTIRANJE HIPOTEZA – OSNOVNI KONCEPTI I TESTOVI … · frekvencije u svakom polju tabele najmanje 5. – Ako je vrednost hi-kvadrat statistike 0 treba proveriti rezult • Jačina

Novembar 2014 Istraživanje tržišta Ekonomski fakultet, Beograd

20

Testiranje hipoteza o srednjoj vrednosti (2)

Poznata je populacijska standardna devijacija, σ –  Jednostrani test:

H0: µ ≥ µ0 Ha: µ < µ0

–  Standardna greška srednje vrednosti: –  z-vrednost se izračunava kao: (µ= µ0) –  Nulta hipoteza se odbacuje ako je

(primenom odgovarajućeg α)

nxσ

σ =

x

xZσµ−

=

.αZZizrač −<

Page 21: TESTIRANJE HIPOTEZA – OSNOVNI KONCEPTI I TESTOVI … · frekvencije u svakom polju tabele najmanje 5. – Ako je vrednost hi-kvadrat statistike 0 treba proveriti rezult • Jačina

Novembar 2014 Istraživanje tržišta Ekonomski fakultet, Beograd

21

Testiranje hipoteza o srednjoj vrednosti (3)

Nije poznata populacijska standardna devijacija, σ –  Uzoračka standardna devijacija, s, se koristi kao ocena

populacijske standardne devijacije –  Standardna greška srednje vrednosti:

–  Umesto normalnog, koristi se t-raspored:

–  Broj stepeni slobode je n-1 –  Sve ostalo je isto kao u prethodno navedenim

jednostranim, odnosno dvostranim testovima respektivno

nssx =

xizrač s

xt µ−=

Page 22: TESTIRANJE HIPOTEZA – OSNOVNI KONCEPTI I TESTOVI … · frekvencije u svakom polju tabele najmanje 5. – Ako je vrednost hi-kvadrat statistike 0 treba proveriti rezult • Jačina

Novembar 2014 Istraživanje tržišta Ekonomski fakultet, Beograd

22

Testiranje hipoteze o razlici između dve srednje vrednosti (1)

Dva nezavisna uzorka sa poznatim σ1 i σ2 –  Dvostrani test:

H0: µ1 – µ2 = c Ha: µ1 – µ2 ≠ c

–  Standardna greška:

–  Z-vrednost se izračunava kao

–  Ako se koriste veliki uzorci, σ se može aproksimirati sa s –  Nulta hipoteza se odbacuje ako:

2

22

1

21

21 nnxxσσ

σ +=−

( ) ( )21

2121

xxizrač

xxZ−

−−−=

σµµ

2/αZZizrač >

Page 23: TESTIRANJE HIPOTEZA – OSNOVNI KONCEPTI I TESTOVI … · frekvencije u svakom polju tabele najmanje 5. – Ako je vrednost hi-kvadrat statistike 0 treba proveriti rezult • Jačina

Novembar 2014 Istraživanje tržišta Ekonomski fakultet, Beograd

23

Testiranje hipoteze o razlici između dve srednje vrednosti (2)

Dva nezavisna uzorka sa poznatim σ1 i σ2 –  Jednostrani test:

H0: µ1 ≤ µ2

Ha: µ1 – µ2 > 0 –  Standardna greška:

–  Z-vrednost se izračunava kao

–  Ako se koriste veliki uzorci, σ se može aproksimirati sa s –  Nulta hipoteza se odbacuje ako:

2

22

1

21

21 nnxxσσ

σ +=−

( ) ( )21

2121

xxizrač

xxZ−

−−−=

σµµ

αZZizrač >

Page 24: TESTIRANJE HIPOTEZA – OSNOVNI KONCEPTI I TESTOVI … · frekvencije u svakom polju tabele najmanje 5. – Ako je vrednost hi-kvadrat statistike 0 treba proveriti rezult • Jačina

Novembar 2014 Istraživanje tržišta Ekonomski fakultet, Beograd

24

Testiranje hipoteze o razlici između dve srednje vrednosti (3)

Dva nezavisna uzorka sa nepoznatim σ1 i σ2, σ1=σ2 –  Uzoračke standardne devijacije, s1 i s2, se koriste kao ocena –  Koristi se t-raspored sa stepeni slobode i računa –  Standardna greška iznosi:

–  Pravila za odbacivanje nulte hipoteze su slične (samo se koristi t-vrednost umesto z-vrednosti)

( ) ( )21

2121

xxsxxt

−−−=

µµ

21

1121 nnss Pxx +=− 2

)1()1(21

222

2112

−+−+−

=nn

snsnsP

221 −+nn

Page 25: TESTIRANJE HIPOTEZA – OSNOVNI KONCEPTI I TESTOVI … · frekvencije u svakom polju tabele najmanje 5. – Ako je vrednost hi-kvadrat statistike 0 treba proveriti rezult • Jačina

Novembar 2014 Istraživanje tržišta Ekonomski fakultet, Beograd

25

Testiranje hipoteze o razlici između dve srednje vrednosti (4)

Dva nezavisna uzorka sa nepoznatim σ1 i σ2, σ1≠σ2 –  Uzoračke standardne devijacije, s1 i s2, se koriste kao ocena

–  Koristi se t-raspored sa st. slobode

–  t-statistika iznosi

–  Standardna greška iznosi:

–  Pravila za odbacivanje nulte hipoteze su ista kao prethodno

( ) ( )21

2121

xxsxxt

−−−=

µµ

2

22

1

21

21 ns

nss xx +=− ( ) ( )22

2121

121

nsnsnsg

+=

)1)(1()1()1)(1(

122

2

21

−−+−

−−

nggnnn

Page 26: TESTIRANJE HIPOTEZA – OSNOVNI KONCEPTI I TESTOVI … · frekvencije u svakom polju tabele najmanje 5. – Ako je vrednost hi-kvadrat statistike 0 treba proveriti rezult • Jačina

Novembar 2014 Istraživanje tržišta Ekonomski fakultet, Beograd

26

Testiranje hipoteze o razlici između dve srednje vrednosti (5)

Dva zavisna uzorka –  Kada su uzorci zavisni, može, na primer, da se pretpostavi

da se radi o istom uzorku, pa se računa D = x1 – x2:

, gde je:

–  Odgovarajući test je: sa (n-1) stepeni slobode

–  A standardna greška

dDH ≥:0dDHa <:

nsdDt

D

−=

∑=

=n

iiDn

D1

1

⎟⎠

⎞⎜⎝

⎛−

−= ∑

=

n

iiD DnD

ns

1

222

11

Page 27: TESTIRANJE HIPOTEZA – OSNOVNI KONCEPTI I TESTOVI … · frekvencije u svakom polju tabele najmanje 5. – Ako je vrednost hi-kvadrat statistike 0 treba proveriti rezult • Jačina

Novembar 2014 Istraživanje tržišta Ekonomski fakultet, Beograd

27

Testiranje hipoteza o proporcijama –  Dvostrani test:

H0: p = p0

Ha: p ≠ p0 –  Standardna greška srednje vrednosti: –  Za velike uzorke se koristi normalna aproksimacija

binomnog rasporeda, i dobija se intervalna ocena:

–  Odnosno, nulta hipoteza se odbacuje ako je izračunata proporcija van ovog intervala.

npp

p)1( 00 −

nppZpZp p)1( 00

2/02/0−

±=± αα σ