26
1 Generelle lineære modeller Regressionsmodeller: Én kvantitativ afhængig variabel: Y En eller flere uafhængige variable: X 1 ,..,X k Uafhængige variable Analyse Én binær variabel t-test Én kategorivariabel med mere end to kategorier Ensidet variansanalyse To eller flere kategorivariable To- eller flersidede variansanalyser En eller flere kvantitative variable Lineær regression Kategorivariable og kvantitative variable Generelle lineære modeller

Generelle lineære modellerstaff.pubhealth.ku.dk/~jhp/KandidatFSV/aar17/Forelaesninger/ttest.pdf · Generelle lineære modeller : 2 . Læseprøve resultater . OS400. 0 0 0 0 0. Kontrolklasse

  • Upload
    others

  • View
    7

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Generelle lineære modellerstaff.pubhealth.ku.dk/~jhp/KandidatFSV/aar17/Forelaesninger/ttest.pdf · Generelle lineære modeller : 2 . Læseprøve resultater . OS400. 0 0 0 0 0. Kontrolklasse

1

Generelle lineære modeller

Regressionsmodeller:

Én kvantitativ afhængig variabel: Y

En eller flere uafhængige variable: X1,..,Xk

Uafhængige variable Analyse

Én binær variabel t-test Én kategorivariabel med mere end to kategorier

Ensidet variansanalyse

To eller flere kategorivariable

To- eller flersidede variansanalyser

En eller flere kvantitative variable

Lineær regression

Kategorivariable og kvantitative variable

Generelle lineære modeller

Page 2: Generelle lineære modellerstaff.pubhealth.ku.dk/~jhp/KandidatFSV/aar17/Forelaesninger/ttest.pdf · Generelle lineære modeller : 2 . Læseprøve resultater . OS400. 0 0 0 0 0. Kontrolklasse

2

Læseprøve resultater

OS400

400.0300.0

200.0100.0

0.0

Kontrolklasse - maj 1972An

tal e

leve

r7

6

5

4

3

2

1

0

OS400

400.0300.0

200.0100.0

0.0

Forsøgsklasse - maj 1972

Anta

l ele

ver

7

6

5

4

3

2

1

0

Figur 10.5 Læseprøveresultater i kontrol- og forsøgsklassen før

forsøg med undervisning i Danmark

Page 3: Generelle lineære modellerstaff.pubhealth.ku.dk/~jhp/KandidatFSV/aar17/Forelaesninger/ttest.pdf · Generelle lineære modeller : 2 . Læseprøve resultater . OS400. 0 0 0 0 0. Kontrolklasse

3

OS400

400.0300.0

200.0100.0

0.0

Kontrolklasse - oktober 1973

Anta

l ele

ver

7

6

5

4

3

2

1

0

OS400

400.0300.0

200.0100.0

0.0

Forsøgsklasse - oktober 1973

Anta

l ele

ver

6

5

4

3

2

1

0

Figur 10.6 Læseprøveresultater i kontrol- og forsøgsklasse efter

forsøgsundervisning i Danmark

Page 4: Generelle lineære modellerstaff.pubhealth.ku.dk/~jhp/KandidatFSV/aar17/Forelaesninger/ttest.pdf · Generelle lineære modeller : 2 . Læseprøve resultater . OS400. 0 0 0 0 0. Kontrolklasse

4

1981

Venstre-højre position

højre98765432venstre

Proc

ent

40

30

20

10

0

1990

Venstre-højre position

højre98765432venstre

Proc

ent

40

30

20

10

0

Ændrede danskernes politiske holdninger sig i perioden 1981 – 1990?

Når det drejer sig om politik, tale man om ”venstreorienteret” og ”højreorienteret”. Hvor på denne skala ville De placere Dem selv?

Page 5: Generelle lineære modellerstaff.pubhealth.ku.dk/~jhp/KandidatFSV/aar17/Forelaesninger/ttest.pdf · Generelle lineære modeller : 2 . Læseprøve resultater . OS400. 0 0 0 0 0. Kontrolklasse

5

Tilfredshed med jobbet i 1981 og 1990

1981

Tilfredshed med job

tilfreds9.00

8.007.00

6.005.00

4.003.00

2.00utilfreds

Proc

ent

40

30

20

10

0

1990

Tilfredshed med job

tilfreds9.00

8.007.00

6.005.00

4.003.00

2.00utilfreds

Proc

ent

40

30

20

10

0

Page 6: Generelle lineære modellerstaff.pubhealth.ku.dk/~jhp/KandidatFSV/aar17/Forelaesninger/ttest.pdf · Generelle lineære modeller : 2 . Læseprøve resultater . OS400. 0 0 0 0 0. Kontrolklasse

6

Student’s t-test Det overordnede problem:

Sammenligning af middelværdier i to grupper Formelle modelforudsætninger: • Fordelingerne antages at være normalfordelte inden

for hver gruppe • Spredningen antages at være den samme inden for

hver gruppe Et ekstra problem:

Sammenligning af spredningen i to grupper Yderligere: • Er modelforudsætningerne kritiske? • Hvordan kan de kontrolleres? • Hvad gør man, hvis de ikke holder?

Page 7: Generelle lineære modellerstaff.pubhealth.ku.dk/~jhp/KandidatFSV/aar17/Forelaesninger/ttest.pdf · Generelle lineære modeller : 2 . Læseprøve resultater . OS400. 0 0 0 0 0. Kontrolklasse

7

Figur 10.9 Den ideelle t-test problematik: To varianshomogene normalfordelinger med forskellige

middelværdier.

Page 8: Generelle lineære modellerstaff.pubhealth.ku.dk/~jhp/KandidatFSV/aar17/Forelaesninger/ttest.pdf · Generelle lineære modeller : 2 . Læseprøve resultater . OS400. 0 0 0 0 0. Kontrolklasse

8

t-test

Baseret på forholdet mellem forskellen mellem gruppernes gennnemsnit og dennes standard error:

t M MVn

Vn

M M

Vn n

=−

+=

+

1 2

1 2

1 2

1 2

1 1

t M Mn V n V

n n n n

=−

− + −+ −

+

1 2

1 1 2 2

1 2 1 2

1 12

1 1( ) ( )( )

Hvis observationerne er normalfordelte i hver af de to grup-per er den eksakte fordelt en såkaldt t-fordeling. Hvis observationerne ikke er normalfordelte er t-testet kun approksimativt t-fordelt.

t-testet er derfor robust overfor afvigelser fra normal-fordelingen

Page 9: Generelle lineære modellerstaff.pubhealth.ku.dk/~jhp/KandidatFSV/aar17/Forelaesninger/ttest.pdf · Generelle lineære modeller : 2 . Læseprøve resultater . OS400. 0 0 0 0 0. Kontrolklasse

9

Tabel 10.7 Fordelingsindikatorer for læseprøveresultater

fra forsøget med undervisning af grønlandske elever i Danmark.

Tidspunkt Klasse n Middel-

værdi Standard- afvigelse

Maj 1972 Kontrol 28 117.25 42.31 Forsøg 35 113.20 43.04

Oktober 1973

Kontrol 28 145.04 42.70

Forsøg 35 176.83 55.83

t-tests

t p Læseprøveresultater før forsøg 0.374 0.710 Læseprøveresultater efter forsøg -2.490 0.016

Spørgsmål: Er varianserne (spredningerne) ens?

Page 10: Generelle lineære modellerstaff.pubhealth.ku.dk/~jhp/KandidatFSV/aar17/Forelaesninger/ttest.pdf · Generelle lineære modeller : 2 . Læseprøve resultater . OS400. 0 0 0 0 0. Kontrolklasse

10

Læseprøveresultater før forsøgsundervisning.

Tabel 10.10 Levenes test. Et t-test for absolutte forskelle

Klasse

Elevnummer.

OS400 oktober 1973

Middelværdi

Absolut forskel

Kontrol 1 211 145.04 65.96 2 156 145.04 10.96 3 103 145.04 42.04 . . . . . . . . 28 191 145.04 45.96

Middelværdi 35.25 Standard afv. 23.13

Forsøg 1 262 176.83 85.17 2 132 176.83 44.83 3 213 176.83 36.17 . . . . . . . . 35 205 176.83 28.17 Middelværdi 45.77 Standard afv. 31.00

t = -1.493 p = 0.141

Levenes teststørrelse rapporteres sometider som en kvadreret teststørrelse,

F = t2 = 2.229, p = 0.141,

Page 11: Generelle lineære modellerstaff.pubhealth.ku.dk/~jhp/KandidatFSV/aar17/Forelaesninger/ttest.pdf · Generelle lineære modeller : 2 . Læseprøve resultater . OS400. 0 0 0 0 0. Kontrolklasse

11

t-testet for forskellige varianser

Middelværdier, M1 og M2, og tilhørende varianser, V1 og V2, i to forskellige grupper.

Var(M1) = V1/n1 Var(M2) = V2/n2

Variansen på forskellen på de to middelværdier er lig med

Var(M2-M1) = V2/n1+ V1/n2 Nul-hypotesen:

E(M1) = E(M2) ⇔ E(M2 –M1)= E(M2)-E(M1) = 0

Var(M2 –M1) = 2

2

1

1

nV

nV

+

hvor

Vi er lig variansen i gruppe nr.i ni er lig antallet af personer i gruppe nr. i

Page 12: Generelle lineære modellerstaff.pubhealth.ku.dk/~jhp/KandidatFSV/aar17/Forelaesninger/ttest.pdf · Generelle lineære modeller : 2 . Læseprøve resultater . OS400. 0 0 0 0 0. Kontrolklasse

12

Teststørrelse

2

2

1

1

21

nV

nV

MMt+

−=

t er en standardiseret teststørrelse:

Variansen er lig med 1 Middelværdien er lig med 0, hvis hypotesen holder

t er tilnærmelsesvist fordelt som en såkaldt t-fordeling, hvis antallet af personer i de to grupper er stort

Page 13: Generelle lineære modellerstaff.pubhealth.ku.dk/~jhp/KandidatFSV/aar17/Forelaesninger/ttest.pdf · Generelle lineære modeller : 2 . Læseprøve resultater . OS400. 0 0 0 0 0. Kontrolklasse

13

Tabel 10.7 Fordelingsindikatorer for læseprøveresultater

fra forsøget med undervisning af grønlandske elever i Danmark.

Tidspunkt Klasse n Middel-

værdi Standard- afvigelse

Maj 1972 Kontrol 28 117.25 42.31 Forsøg 35 113.20 43.04

Oktober 1973

Kontrol 28 145.04 42.70

Forsøg 35 176.83 55.83

Tallene fra tabel 10.7 i formlen for t-testet.

2

2

1

1

21

nV

nV

MMt+

−=

F.eks.

t = − + =( . . ) . . .117 25 11320 42 3128

43 0435

0 3752 2

som er klart insignifikant p = 0.709.

Page 14: Generelle lineære modellerstaff.pubhealth.ku.dk/~jhp/KandidatFSV/aar17/Forelaesninger/ttest.pdf · Generelle lineære modeller : 2 . Læseprøve resultater . OS400. 0 0 0 0 0. Kontrolklasse

14

t-testets nul-hypotese

Figur 10.8 Hypotesestrukturen bag t-testet

En strategi for t-test

1) I det første trin testes det, om de to varianser er ens. 2) I det andet trin afprøves middelværdihypotesen.

Måden det sker på afhænger af, om varianshypotesen blev forkastet eller accepteret.

• Hvis spredningshypotesen blev forkastet,

foretages et t-test baseret på separate estimater af de to forskellige varianser.

• Hvis spredningshypotesen blev accepteret, foretages et t-test med et fælles variansestimat

Nul-hypotese: Ingen ændringer i fordelingen af jobtilfredsheden fra 1981 til 1990

Middelværdihypotese: Den gennemsnitlige jobtilfredshed er den samme i 1981 og 1990

Spredningshypotese: Variansen i fordelingen af jobtil-fredsheden er den samme i 1981 og 1990.

Page 15: Generelle lineære modellerstaff.pubhealth.ku.dk/~jhp/KandidatFSV/aar17/Forelaesninger/ttest.pdf · Generelle lineære modeller : 2 . Læseprøve resultater . OS400. 0 0 0 0 0. Kontrolklasse

15

Tabel 10.8 Fordelingsindikatorer for to spørgsmål fra

værdiundersøgelserne i 1981 og 1990

Spørgsmål År n Middel-værdi

Standard-afvigelse

Hvor tilfreds er De med Deres arbejde?

1981 697 8.30 1.91

1990 655 8.24 1.66

Placering på politisk venstre-højre skala?

1981 974 5.63 1.88

1990 934 5.74 1.90

T-test resultater for forskelle på middelværdierne. Levenes test t-test t p Læseprøve før forsøg

F = 2.29 p = 0.141 samme varians

0.374 0.710

Læseprøve efter forsøg

F = 2.23 p = 0.141 samme varians

-2.490 0.016

Jobtilfredshed F = 14.21 p = 0<0.0005 forsk.

varians 0.634 0.526

Politisk holdning

F = 6.10 p = 0.014 forsk. varians

-1.329 0.184

Page 16: Generelle lineære modellerstaff.pubhealth.ku.dk/~jhp/KandidatFSV/aar17/Forelaesninger/ttest.pdf · Generelle lineære modeller : 2 . Læseprøve resultater . OS400. 0 0 0 0 0. Kontrolklasse

16

Reformulering af t-testet

2121

2211

21

n1

n1

)2nn(V)1n(V)1n(

MMt+

−+−+−−

=

Bemærk, at

21

21

21

1

21

2

21 nnnn

nnn

nnn

n1

n1 +

=+=+

Det samlede gennemsnit kan beregnes som et vægtet gen-nemsnit af gennemsnitsværdierne for de enkelte grupper,

21

2211

nnMnMnM

++

=

Page 17: Generelle lineære modellerstaff.pubhealth.ku.dk/~jhp/KandidatFSV/aar17/Forelaesninger/ttest.pdf · Generelle lineære modeller : 2 . Læseprøve resultater . OS400. 0 0 0 0 0. Kontrolklasse

17

t M Mn V n V

n nn n

n n

2 1 22

1 1 2 2

1 2

1 2

1 2

=−

++

+

( )

M M M n M n Mn n

nn n

M M1 11 1 2 2

1 2

2

1 21 2− = −

++

=+

−( )

M M M n M n Mn n

nn n

M M2 21 1 2 2

1 2

1

1 22 1− = −

++

=+

−( )

Således, at

n

n nM M n n

nM M2

1 21 2

2 1 2

21

2

+− =

+−( ) ( ) ( )

og n

n nM M n n

nM M1

1 21 2

2 1 2

12

2

+− =

+−( ) ( ) ( )

Page 18: Generelle lineære modellerstaff.pubhealth.ku.dk/~jhp/KandidatFSV/aar17/Forelaesninger/ttest.pdf · Generelle lineære modeller : 2 . Læseprøve resultater . OS400. 0 0 0 0 0. Kontrolklasse

18

( ) ( ) ( ) ( ) ( )M M n nn

M M n nn

M M1 22 1 2

21

2 1 2

12

2− =+

− ++

=+

− + −( ) ( ( ) ( ) )n n

n nn M M n M M1 2

1 21 1

22 2

2

t2 er derfor lig med

t

n nn n

n M M n M M

n V n Vn n

n nn n

2

1 2

1 21 1

22 2

2

1 1 2 2

1 2

1 2

1 2

1 12

=

+

− + −

− + −+ −

+

( ( ) ( ) )

( ) ( )

Dvs.

t n M M n M Mn V n V

n n

2 1 12

2 22

1 1 2 2

1 2

1 12

=− + −− + −

+ −

( ( ) ( ) )( ) ( )

t-testet kan derfor udtrykkes som en funktion af forskellene mellem middelværdierne indenfor grupperne og den samle-de middelværdi.

Page 19: Generelle lineære modellerstaff.pubhealth.ku.dk/~jhp/KandidatFSV/aar17/Forelaesninger/ttest.pdf · Generelle lineære modeller : 2 . Læseprøve resultater . OS400. 0 0 0 0 0. Kontrolklasse

19

Fra t-testet til den ensidede variansanalyse

Formlen for t2 kan umiddelbart generaliseres til situationer hvor man skal sammenligne mere end to grupper. I den forbindelse foretages der flere terminologiske skift:

1) Analysen omtales som en ensidig variansanalyse. 2) Antallet af grupper minus 1, ng-1, omtales som

antallet af frihedsgrader mellem grupperne. Antallet af frihedsgrader mellem grupperne i et t-test er altså lig med 1.

3) Antallet af personer minus antallet af grupper omtales

som antallet af frihedsgrader mellem personerne. 4) t2 omdøbes til en F-test størrelse, idet der samtidig

divideres med antallet af frihedsgrader mellem grupperne, F = t2/(ng-1).

5) Tælleren i F omtales som variationen mellem

grupperne. 6) Tælleren i nævneren omtales som variationen

indenfor grupperne. Selvom der tales om en variansanalyse, er der altså stadig tale om en analyse af forskelle mellem middelværdier i forskellige grupper.

Page 20: Generelle lineære modellerstaff.pubhealth.ku.dk/~jhp/KandidatFSV/aar17/Forelaesninger/ttest.pdf · Generelle lineære modeller : 2 . Læseprøve resultater . OS400. 0 0 0 0 0. Kontrolklasse

20

Den ensidede variansanalyse.

Tabel 10.13 Den gennemsnitlige politiske holdning i tre aldersgrupper i 1981 og 1990

Alder Antal Middelværdi Stand.afv. 18-29 332 5.57 1.80 30-60 1110 5.48 1.86 61+ 466 6.26 1.88

Er der forskellig politisk holdning i forskellige aldersgrupper?

Et typisk variansanalyse problem. Variansanalysens forudsætning:

1) Normalfordelinger inden for grupperne. 2) Varianshomogenitet.

Analysen er robust overfor afvigelser fra 1), men ikke overfor afvigelser fra 2). Antagelsen om varianshomogenitet kan afprøves ved hjælp af Levenes test på samme måde som for t-testet.

Page 21: Generelle lineære modellerstaff.pubhealth.ku.dk/~jhp/KandidatFSV/aar17/Forelaesninger/ttest.pdf · Generelle lineære modeller : 2 . Læseprøve resultater . OS400. 0 0 0 0 0. Kontrolklasse

21

Konventionel afrapportering af resultater fra en variansanalyse:

Tabel 10.14 Variansanalyse af sammenhængen mellem alder og politisk holdning

Uafhængig variabel

Sum af kvadrat-

afvigelser

df

gennem-snitlig

kvadrat-afvigelse

F

p

Alder Mellem grupper

202.38

2

101.19

29.3

.000

Indenfor grupper

6578.94

1905

3.45

Total

6781.32

1907

Alt andet end F-testværdien og p-værdien

skal betragtes som uinteressante mellemregninger. Konklusion: Højsignifikant forskel på grupperne Hvad med varianshomogeniteten:

Levenes test: F = 0.314. p = 0.73. Varianshomogeniteten accepteres.

Page 22: Generelle lineære modellerstaff.pubhealth.ku.dk/~jhp/KandidatFSV/aar17/Forelaesninger/ttest.pdf · Generelle lineære modeller : 2 . Læseprøve resultater . OS400. 0 0 0 0 0. Kontrolklasse

22

Multiple (post hoc) sammenligninger Figur 10.10 Fire alternativer til nul-hypotesen om uafhængighed

mellem alder og politiske holdning MCA-analysen

Tabel 10.15 Parvise sammenligninger af aldersgrupper mht. politisk holdning

Sammenligning

af t-test df p konklusion

18-29 mod 30-60

0.796 1440 0.426 De to grupper er ens

18-29 mod 61+ -5.143 796 0.000 de to grupper er forskellige

30-60 mod 61+ -7.510 1574 0.000 de to grupper er forskellige

Nul-hypotesens alternativer

Alle tre aldersgrupper er forskellige

De 18-29 - åri-ge og de 30-60-årige er hold-ningsmæssigt ens, men afvi-ger fra den æld-ste gruppe

Den yngste og den ældste grup-pe er holdnings-mæssigt ens, men afviger fra de 30-60-årige

De 30-60 årige ligger på samme niveau, som den ældste gruppe, men afviger fra den yngste

Page 23: Generelle lineære modellerstaff.pubhealth.ku.dk/~jhp/KandidatFSV/aar17/Forelaesninger/ttest.pdf · Generelle lineære modeller : 2 . Læseprøve resultater . OS400. 0 0 0 0 0. Kontrolklasse

23

Tabel 10.16 Gennemsnitlig politisk holdning i to aldersgrupper

Alder Middelværdi Standardfejl 95 % konfidensinterval 18-60 5.50 0.0487 5.40 – 5.60 61+ 6.26 0.0872 6.09 – 6.43

Problemer med multiple test

Tabel 10.17 Antal parvise sammenligninger i en MCA-analyse

Antal grupper Antal parvise sammenligninger 3 3 4 6 5 10 6 15 7 21 8 28 9 36 10 45

Stor risiko for fejl af type I, når der er mange grupper

Page 24: Generelle lineære modellerstaff.pubhealth.ku.dk/~jhp/KandidatFSV/aar17/Forelaesninger/ttest.pdf · Generelle lineære modeller : 2 . Læseprøve resultater . OS400. 0 0 0 0 0. Kontrolklasse

24

Bonferroni metoden

Acceptabel samlet risiko for type I fejl = α

Samlet antal parvise sammenligninger = k ⇔

Risiko for type I fejl for et enkelt test = α/k

Page 25: Generelle lineære modellerstaff.pubhealth.ku.dk/~jhp/KandidatFSV/aar17/Forelaesninger/ttest.pdf · Generelle lineære modeller : 2 . Læseprøve resultater . OS400. 0 0 0 0 0. Kontrolklasse

25

Endnu et eksempel

Tabel 10.18 Den gennemsnitlige politiske holdning i fem aldersgrupper i 1981 og 1990

Alder Antal Middelværdi Stand.afv. 18-29 332 5.57 1.80 30-44 663 5.16 1.84 45-60 447 5.96 1.80 61-75 297 6.29 1.86 76+ 169 6.20 1.93

Levenes test:

F = 0.94, p = 0.44 Variansanalysen:

F = 27.87, p = 0.000

Page 26: Generelle lineære modellerstaff.pubhealth.ku.dk/~jhp/KandidatFSV/aar17/Forelaesninger/ttest.pdf · Generelle lineære modeller : 2 . Læseprøve resultater . OS400. 0 0 0 0 0. Kontrolklasse

26

Tabel 10.19 LSD- og Bonferroni analyser Sammenligning

p-værdi Forskel i flg. LSD

Forskel i flg. Bonferroni

18-29 & 30-44 0.001 ja ja 18-29 & 45-60 0.004 ja ja 18-29 & 61-75 0.000 ja ja 18-29 & 76+ 0.000 ja ja

30-44 & 45-60 0.000 ja ja 30-44 & 61-75 0.000 ja ja 30-44 & 76+ 0.000 ja ja

45-60 & 61-75 0.018 ja nej 45-60 & 76+ 0.145 nej nej 61-75 & 76+ 0.631 nej nej

LSD-metodens resultater tegner et logisk inkonsistent bille-de af sammenhængen mellem alder og politisk holdning:

1) De 61-75-årige og de ældste er holdningsmæssigt

ens 2) De 45-60-årige og de ældste er holdningsmæssigt

ens

Tabel 10.20 Gennemsnitlig politisk holdning i tre aldersgrupper

Alder Middelværdi Standardfejl 95 % konfidensinterval 18-29 5.57 0.0989 5.38 – 5.76 30-44 5.16 0.0714 5.02 – 5.30 45+ 6.11 0.0612 5.99 – 6.23