Download ppt - Chi-i-anden Test

Transcript
Page 1: Chi-i-anden Test

Chi-i-anden Test

Repetition

Goodness of Fit

Uafhængighed i Kontingenstabeller

Page 2: Chi-i-anden Test

Chi-i-anden Test

Chi-i-anden test omhandler data, der har form af antal eller frekvenser.

Antag, at n observationer kan inddeles i k kategorier.

Lad Oi være antallet af observationer, der falder i den i’te kategori.

Lad Ei være det forventede antal obser-vationer i’te kategori under antagelse af, at en given H0 hypotese er sand.

Page 3: Chi-i-anden Test

Chi-i-anden Teststørrelse Oi er faktiske antal observationer i i’te kategori og Ei er

det forventede antal observationer under H0. Chi-i-anden teststørrelsen er givet ved

k

i i

ii

E

EOX

1

22 )(

Når stikprøvestørrelsen vokser og k fastholder, så nærmer X2 sig en Chi-i-anden fordeling.

Bemærk: For at chi-i-anden approksimationen er god skal alle Ei være mindst 5, dvs. vi forventer mindst 5 observationer i hver kategori.

Page 4: Chi-i-anden Test

Chi-i-anden Test for Goodness of Fit Vi opstiller en hypotese om at data x1,…,xn er en

stikprøve fra en bestemt fordeling, fx. multinomial- eller normalfordelingen.

Vi bestemmer, hvordan hvert xi tilhører en af k kategorier.

Under antagelse af at H0 er sand udregner vi hvor mange xi’er vi forventer falder i den j’te kategori, Ej.

Via X2-teststørrelsen sammenligner vi dette med det faktiske observerede antal Oi.

Page 5: Chi-i-anden Test

Goodness of Fit: Multinomial fordelingen Multinomial fordelingen er en udvidelse af binomial

fordelingen. For multinomial fordelingen gælder

at en observation kan falde i en af k forskellig kategorier. sandsynligheden for at en observation falder i den i’te

kategori er pi.

summen af pi’erne er 1.

Konsekvens: Har vi n observationer, så er det forventede antal observationer i den i’te kategori Ei=npi.

Page 6: Chi-i-anden Test

Goodness of Fit: Multinomial

Nul-hypotesen og alternativ hypotesen:H0: Sandsynligheden for hændelserne H1, H2...,Hk er givet ved p1,p2,...,pk

H1: Sandsynligheden for de k hændelser er ikke specificeret ved nul-hypotesen.

Nul-hypotesen og alternativ hypotesen:H0: Sandsynligheden for hændelserne H1, H2...,Hk er givet ved p1,p2,...,pk

H1: Sandsynligheden for de k hændelser er ikke specificeret ved nul-hypotesen.

H0: Antag ens sandsynligheder, p1= p2 = p3 = p4 =0.25 og n=80Preference Tan Brown Maroon Black TotalObserved 12 40 8 20 80Expected(np) 20 20 20 20 80(O-E) -8 20 -12 0 0

3449.112)3,01.0(

4.3020

2)0(20

2)12(20

2)20(20

2)8(

1

2)(2

k

i iEiEiO

H0 afvises på signifikansniveau 0.01.H0 afvises på signifikansniveau 0.01.

Page 7: Chi-i-anden Test

Goodness of Fit: Multinomial

SPSS: Analyze → Nonparametric Tests → Chi-square…

Hvis de ’expected counts’ er forskellige, så kan de indsættrs her

Page 8: Chi-i-anden Test

Goodness of Fit: Multinomial SPSS:

Observede og forventede ’counts’

Teststørrelse og p-værdi

Page 9: Chi-i-anden Test

Goodness of Fit: Normalfordeling Hypotese: Data x1,…,xn, følger en en standard

normalfordeling (N(0,σ2) ). Ide: Vi inddeler normalfordelingen i k ”bidder”.

50-5

0.4

0.3

0.2

0.1

0.0z

f(z)

Partitioning the Standard Normal Distribution

-1 1

-0.44 0.44

0.1700

0.1713

0.15870.1587

0.1700

0.1713

Vi udregner sandsynligheden for at standard normalfordelt tal falder i den j’te ”bid”.

Dernæst kan vi ”genbruge” multinomal eksemplet.

Page 10: Chi-i-anden Test

Goodness of Fit: Normalfordeling Vi anvender følgende inddeling: -1, -0.44, 0, 0.44 og 1. Vi har da 6 kategorier:

1. kategori: Z ≤ -1 2. kategori: -1 < Z ≤ -0.44 3. kategori: -0.44 < Z ≤ 0 4. kategori: 0 < Z ≤ 0.44 5. kategori: 0.44 < Z ≤ 1 6. kategori: 1 < Z

Hvad er sandsynligheden for at Z er i 5. kategori? Det samme som P[0.44 < Z ≤ 1] = ”Areal af 5. område i

figuren” = 0,1713. (Kan findes vha. tabel)

50-5

0.4

0.3

0.2

0.1

0.0z

f(z)

Partitioning the Standard Normal Distribution

-1 1

-0.44 0.44

0.1700

0.1713

0.15870.1587

0.1700

0.1713

Page 11: Chi-i-anden Test

Goodness of Fit: Normalfordeling Vi kan bestemme sandsynligheden pi for den i’te

kategori. Vi har da 6 sandsynligheder

1. kategori: p1 = 0,1578 2. kategori: p2 = 0,1713 3. kategori: p3 = 0,1700 4. kategori: p4 = 0,1700 5. kategori: p5 = 0,1713 6. kategori: p6 = 0,1578

Har vi n observationer, forventer vi Ei=npi observationer i den i’te kategori.

Vi kan nu udregne X2 teststørrelsen.

50-5

0.4

0.3

0.2

0.1

0.0z

f(z)

Partitioning the Standard Normal Distribution

-1 1

-0.44 0.44

0.1700

0.1713

0.15870.1587

0.1700

0.1713

Page 12: Chi-i-anden Test

Kontingenstabeller

Hidtil: Følger en kategorisk variabel en given fordeling?

Nu: Er to kategoriske variable uafhængige? Fx uafhængighed mellem følgende to kategoriske

variable: Jobtype (4 kategorier, Uden, Lavt-, mellem og højtlønnet)

Helbred (5 kategorier: meget dårligt til meget godt)

Værktøj: Kontingenstabeller (cross-tabs) I en kontingenstabel er hver ”celle” et antal /

frekvens.

Page 13: Chi-i-anden Test

Kontingenstabeller

Første kategoriske variable (Helbred) Anden

kategoriske variable

(Jobtype)

1

2

3

4

c = 5

Række Total

1 O11 O12 O13 O14 O15 R1 2 O21 O22 O23 O24 O25 R2 3 O31 O32 O33 O34 O35 R3

r = 4 O41 O42 O43 O44 O45 R4 kolonne

Total

C1

C2

C3

C4

C5

n

Første kategoriske variable (Helbred) Anden

kategoriske variable

(Jobtype)

1

2

3

4

c = 5

Række Total

1 O11 O12 O13 O14 O15 R1 2 O21 O22 O23 O24 O25 R2 3 O31 O32 O33 O34 O35 R3

r = 4 O41 O42 O43 O44 O45 R4 kolonne

Total

C1

C2

C3

C4

C5

n

Kontingstabellen består af r rækker og c kolonner. Første kategoriske variabel (Helbred) har c kategorier. Anden kategoriske variabel (Jobtype) har r kategorier.

Oij er antallet af observationer (personer), hvor Helbred er tilhører i’te Helbreds-kategori og Jobtype j’te Jobtype.

Celle (3,4)

Page 14: Chi-i-anden Test

Kontingenstabel Første kategoriske variable (Helbred)

Anden kategoriske

variable (Jobtype)

1

2

3

4

c = 5

Række Total

1 O11 O12 O13 O14 O15 R1 2 O21 O22 O23 O24 O25 R2 3 O31 O32 O33 O34 O35 R3

r = 4 O41 O42 O43 O44 O45 R4 kolonne

Total

C1

C2

C3

C4

C5

n

Første kategoriske variable (Helbred) Anden

kategoriske variable

(Jobtype)

1

2

3

4

c = 5

Række Total

1 O11 O12 O13 O14 O15 R1 2 O21 O22 O23 O24 O25 R2 3 O31 O32 O33 O34 O35 R3

r = 4 O41 O42 O43 O44 O45 R4 kolonne

Total

C1

C2

C3

C4

C5

n

Ri er rækketotalen, dvs. totale antal observationer af Jobtype = i.

P( i ) = P( Jobtype = i ) = ”Sandsynlighed for at en tilfældig valgt person har Jobtype i”

P( i ) = Ri / n = ”antal med Jobtype = i / total antal personer”.

Page 15: Chi-i-anden Test

Kontingenstabel Første kategoriske variable (Helbred)

Anden kategoriske

variable (Jobtype)

1

2

3

4

c = 5

Række Total

1 O11 O12 O13 O14 O15 R1 2 O21 O22 O23 O24 O25 R2 3 O31 O32 O33 O34 O35 R3

r = 4 O41 O42 O43 O44 O45 R4 kolonne

Total

C1

C2

C3

C4

C5

n

Første kategoriske variable (Helbred) Anden

kategoriske variable

(Jobtype)

1

2

3

4

c = 5

Række Total

1 O11 O12 O13 O14 O15 R1 2 O21 O22 O23 O24 O25 R2 3 O31 O32 O33 O34 O35 R3

r = 4 O41 O42 O43 O44 O45 R4 kolonne

Total

C1

C2

C3

C4

C5

n

Cj er kolonnetotalen, dvs. totale antal observationer af Helbred = j.

P( j ) = P( Helbred = j ) = ”Sandsynlighed for at en tilfældig valgt person har Helbred=j”

P( j ) = Cj / n = ”antal med Helbred = j / total antal personer”.

Page 16: Chi-i-anden Test

Test for uafhængighed

X2 teststørrelsen er

dvs. en sum over alle rækker og søjler. X2 følger approksimativt en Χ2-fordeling med (r-1)(c-1)

frihedsgrader. Eij er det forventede antal observationer i celle (i,j) under

antagelse af, at H0 er sand (uafhængighed). Hvis P( i ∩ j ) er sandsynligheden for at en tilfældig valgt

person er i celle (i,j), da er Eij = n P( i ∩ j ).

c

j

r

i ij

ijij

E

EOX

1 1

22 )(

Page 17: Chi-i-anden Test

Kontingenstabel: Uafhængighed Lad P( i ∩ j ) = P( Jobtype = i og Helbred = j ) Under H0 (uafhængighed) gælder (pr definition):

P( i ∩ j ) = P( i )P( j ) Forventede frekvens er (som ved multinomial)

Eij = n P( i ∩ j ) Fra før har vi: P( i ) = Ri / n og P( j ) = Cj / n .

Dvs. Eij = n (Ri / n )( Cj / n ) = RiCj / n.

Page 18: Chi-i-anden Test

Kontingenstabel: Eksempel To kategoriske variabel:

Industry: Service eller Nonservice Result: Profit eller LossResult * Industry Crosstabulation

42 18 60

28,8 31,2 60,0

70,0% 30,0% 100,0%

6 34 40

19,2 20,8 40,0

15,0% 85,0% 100,0%

48 52 100

48,0 52,0 100,0

48,0% 52,0% 100,0%

Count

Expected Count

% within Result

Count

Expected Count

% within Result

Count

Expected Count

% within Result

Profit

Loss

Result

Total

Service Nonservice

Industry

Total

SPSS: Analyze → Descriptive Statistics → Crosstabs Forventede frekvenser og række procenter tilvælges under ’Cells’.

Page 19: Chi-i-anden Test

Kontingenstabel: Eksempel H0: Industry og Result er uafhængige

H1: Der er en sammenhæng ml Industry og Result. For 2×2 tabeller anvendes en kontinuitets korrektion

(såkaldt Yates korrektion) af teststørrelsen X2:

c

j

r

i ij

ijij

E

EOX

1 1

2

25.0

c=2 kolonner og r=2 rækker: (c-1)(r-1)=1 frihedsgrader. Yates korrigeret X2 = 26,92. Kritisk værdi: Χ2

0.05(1) = 3,84

Da 29,92 > 3,84 forkaster vi H0 – dvs. vi accepterer hypotesen om, at Industry og Result er afhængige.

Page 20: Chi-i-anden Test

Kontingenstabel: Eksempel I SPSS vælges ’Chi-square’ i ’Statistics’ menuen i

’Crosstabs’.

Chi-Square Tests

29,087b 1 ,000

26,925 1 ,000

31,349 1 ,000

,000 ,000

28,796 1 ,000

100

Pearson Chi-Square

Continuity Correctiona

Likelihood Ratio

Fisher's Exact Test

Linear-by-LinearAssociation

N of Valid Cases

Value dfAsymp. Sig.

(2-sided)Exact Sig.(2-sided)

Exact Sig.(1-sided)

Computed only for a 2x2 tablea.

0 cells (,0%) have expected count less than 5. The minimum expected count is19,20.

b.

Resultat i SPSS. Bemærk ’Continuity Correction’:

Page 21: Chi-i-anden Test

Chi-i-anden Test af Andele

Hidtil: Vi har spurgt n personer og analyseret sammenhængen mellem to kategoriske variable, fx helbred og jobtype.

Nu: Er andelen af forskellige af bestemte kategorier ens for en række forskellige populationer?

Eksempler: Er andelen der stemmer hhv, ”til venstre”, ”i midten”,

”til højre” den samme for 18-25 årige, 26-35 årige, 36-65 årige og over 65 år?

Er andelen af personer med grøn tandbørste den samme blandt hjemløse og ikke-hjemløse?

Page 22: Chi-i-anden Test

Chi-i-anden Test af Andele

Fremgangsmåde: Vi bestemmer hvor mange tilfældigt udvalgte vi vil spørge i hver population (fx i hver aldersgruppe).

Dvs. vi fastlægger kolonne-totalerne. Meget nyttig, hvis en af populationerne naturligt er

meget mindre end de andre, fx hjemløse.

Page 23: Chi-i-anden Test

Chi-i-anden Test af Andele

Selvom vi kolonne totalerne er fastlagte ændrer ikke ved udregning af teststørrelsen eller antal frihedsgrader!!

Vi har stadig

Hvor Eij er udregnet som før og X2 følger en Χ2 fordeling med (r-1)(c-1) frihedsgrader.

Dvs. Eij = RiCj / n.

c

j

r

i ij

ijij

E

EOX

1 1

22 )(

Page 24: Chi-i-anden Test

Test af andele: Eksempel Er andelen af skades-anmeldelser den samme i tre

aldersgrupper? 100 tilfældige kunder udvalgt i hver aldersgruppe. Claim * Age Crosstabulation

40 35 60 135

45,0 45,0 45,0 135,0

60 65 40 165

55,0 55,0 55,0 165,0

100 100 100 300

100,0 100,0 100,0 300,0

Count

Expected Count

Count

Expected Count

Count

Expected Count

Skade

Skadefri

Claim

Total

Alder<=25 25<Alder<50 Alder>=50

Age

Total

Forventede frekvenser: Eij = RiCj / n. Antal frihedsgrader: (c-1)(r-1) = (3-1)(2-1) = 2 Kritisk værdi: Χ2

0,05(2) = 5,99. Teststørrelse: X2 =

Page 25: Chi-i-anden Test

Uduelige piger… eller…? Vi har spurgt 1000 kvinde og 1000 mandlige

kandidater om de har gennemførte deres studie på normeret tid.

Resultat: Mænd 72,5% Kvinder 57,5%

Forskellen er statistisk signifikant!

Page 26: Chi-i-anden Test

Stratificeret Analyse Vi har også spurgte om hvilket fakultet folk har

studeret ved (INS eller Samf). Vi udfører nu analyses separat for hvert fakultet: (Vi siger vi stratificerer efter fakultet)

Page 27: Chi-i-anden Test

Simpsons Paradoks

Internt på de to fakulteter er der ingen forskel mellem mænds og kvinders gennem-førsels procent!

Bemærk: Kvinder vil hellere læse et studie, der er svært at gennemføre på tid.

Mænd er lige modsat…

Page 28: Chi-i-anden Test

Flyskræk! Passer overskriften?

Politiken 6/12-’07

Er du tryg ved at flyve? Ja: 86% i 2005 og 83% i

2007 Vi antager de har spurgt

1000 tilfældige personer begge år.

Dvs. 860 svarede ja i 2005 og 830 i 2007.

H0 hypotese: Andelen af utrygge er den samme de to år!

Page 29: Chi-i-anden Test

Flyskræk! Da det er en 2×2 tabel

bruger vi Yates korrektionen:

Kritisk værdi:

Χ20,05(1) = 3,84

Teststørrelse:

X2 =

Observerede frekvenser Oij

Tryg? 2005 2007 Total

Ja 830 860 1690

Nej 170 140 310

Total 1000 1000 2000

Forventede frekvenser Eij

Tryg? 2005 2007 Total

Ja 845 845 1690

Nej 155 155 310

Total 1000 1000 2000

c

j

r

i ij

ijij

E

EOX

1 1

2

25.0