25
Vorlesung: Biometrie für Studierende der Veterinärmedizin 15.12.2005 1 Nachtrag zur Vorlesung vom 8.12.2005, allgemeine IxJ- Kontingenztafel I i J j ij ij ij I i J j j i j i ij e e n n n n n n n n 1 1 2 1 1 2 2

Nachtrag zur Vorlesung vom 8.12.2005, allgemeine IxJ-Kontingenztafel

  • Upload
    rae

  • View
    22

  • Download
    0

Embed Size (px)

DESCRIPTION

Nachtrag zur Vorlesung vom 8.12.2005, allgemeine IxJ-Kontingenztafel. Korrelation zweier stetiger Merkmale X und Y. Grafische Darstellung zweier Merkmale als Punktewolke / Scatterplot / Streudiagramm / X-Y-Diagramm - PowerPoint PPT Presentation

Citation preview

Page 1: Nachtrag zur Vorlesung vom 8.12.2005, allgemeine IxJ-Kontingenztafel

Vorlesung: Biometrie für Studierende der Veterinärmedizin

15.12.2005

1

Nachtrag zur Vorlesung vom 8.12.2005, allgemeine IxJ-Kontingenztafel

I

i

J

j ij

ijijI

i

J

j ji

ji

ij

e

en

n

nnn

nnn

1 1

2

1 1

2

2

Page 2: Nachtrag zur Vorlesung vom 8.12.2005, allgemeine IxJ-Kontingenztafel

Vorlesung: Biometrie für Studierende der Veterinärmedizin

15.12.2005

2

Korrelation zweier stetiger Merkmale X und Y

• Grafische Darstellung zweier Merkmale als Punktewolke / Scatterplot / Streudiagramm / X-Y-Diagramm

• Geht man davon aus, dass X auf Y wirkt im Sinne einer Ursache-Wirkungs-Beziehung, so ist es sinnvoll, X auf der x-Achse und Y auf der y-Achse der Grafik abzutragen (wie bei einer mathematischen Funktion)

• Beispiel: siehe Vorlesung vom 20.10.2005, EKG bei Leguanen

• X: Temperatur, Y: Elek. Herzachse

Page 3: Nachtrag zur Vorlesung vom 8.12.2005, allgemeine IxJ-Kontingenztafel

Vorlesung: Biometrie für Studierende der Veterinärmedizin

15.12.2005

3

Scatterplot / Streudiagramm

15,0 20,0 25,0 30,0 35,0

Temperatur

0,0

50,0

100,0

150,0

Ele

k. H

erza

chse

Page 4: Nachtrag zur Vorlesung vom 8.12.2005, allgemeine IxJ-Kontingenztafel

Vorlesung: Biometrie für Studierende der Veterinärmedizin

15.12.2005

4

Korrelation nach Bravais-Pearson

• Die Korrelation nach Bravais-Pearson ist ein Maß für den linearen Zusammenhang von X und Y

• Exakter linearer Zusammenhang: y = a + bx (Gerade)• Exakte lineare Zusammenhänge sind bei empirischen

Daten nicht zu erwarten. Bestenfalls erhält man eine Punktewolke, die einen approximativen linearen Zusammenhang nahe legt

• Beispiel (nächste Folie): Linearer Zusammenhang in rechter Grafik „stärker“ als in linker Grafik

Page 5: Nachtrag zur Vorlesung vom 8.12.2005, allgemeine IxJ-Kontingenztafel

Vorlesung: Biometrie für Studierende der Veterinärmedizin

15.12.2005

5

Korrelation nach Bravais-Pearson II

0,00 1,00 2,00 3,00

Gewicht

0,200000

0,400000

0,600000

0,800000

1,000000

II R

T In

terv

all

15,0 20,0 25,0 30,0 35,0

Temperatur

0,0

50,0

100,0

150,0

Ele

k. H

erza

chse

Page 6: Nachtrag zur Vorlesung vom 8.12.2005, allgemeine IxJ-Kontingenztafel

Vorlesung: Biometrie für Studierende der Veterinärmedizin

15.12.2005

6

Korrelation nach Bravais-Pearson III

• Visuelle Beurteilung genügt nicht. Wir brauchen eine Maßzahl• Der Korrelationskoeffizient nach Bravais-Pearson ist eine

solche normierte Maßzahl• Definition:

n

i

n

iii

n

iii

XY

yyxx

yyxxr

1 1

22

1

Page 7: Nachtrag zur Vorlesung vom 8.12.2005, allgemeine IxJ-Kontingenztafel

Vorlesung: Biometrie für Studierende der Veterinärmedizin

15.12.2005

7

Korrelation nach Bravais-Pearson IV

• Der Korrelationskoeffizient nimmt Werte im Bereich

-1 ≤ rXY ≤ +1

an.

• rXY = +1 : Perfekter positiver linearer Zusammenhang, d.h. alle Punkte liegen exakt auf einer Geraden y = a+bx mit b>0

• rXY = -1 : Perfekter negativer linearer Zusammenhang, d.h. alle Punkte liegen exakt auf einer Geraden y = a+bx mit b<0

Y von Mittel chesArithmetis :y

X von Mittel chesArithmetis:x

Page 8: Nachtrag zur Vorlesung vom 8.12.2005, allgemeine IxJ-Kontingenztafel

Vorlesung: Biometrie für Studierende der Veterinärmedizin

15.12.2005

8

Korrelation nach Bravais-Pearson V

• rXY=0: Die Merkmale sind linear unabhängig

• Hypothetische Datenbeispiele zur Veranschaulichung

Page 9: Nachtrag zur Vorlesung vom 8.12.2005, allgemeine IxJ-Kontingenztafel

Vorlesung: Biometrie für Studierende der Veterinärmedizin

15.12.2005

9

Beispiel 1: rXY=+1, exakter positiver linearer Zusammenhang

Daten:x y

1 122 143 164 185 206 22

y=10+2 x

Page 10: Nachtrag zur Vorlesung vom 8.12.2005, allgemeine IxJ-Kontingenztafel

Vorlesung: Biometrie für Studierende der Veterinärmedizin

15.12.2005

10

Beispiel 2: rXY=-1, exakter negativer linearer Zusammenhang

Daten:x y1 82 63 44 25 06 -2

y=10-2 x

Page 11: Nachtrag zur Vorlesung vom 8.12.2005, allgemeine IxJ-Kontingenztafel

Vorlesung: Biometrie für Studierende der Veterinärmedizin

15.12.2005

11

Beispiel 3: rXY=0.72, starker positiver linearer Zusammenhang

Daten:x y

1 122 153 134 185 176 16

Page 12: Nachtrag zur Vorlesung vom 8.12.2005, allgemeine IxJ-Kontingenztafel

Vorlesung: Biometrie für Studierende der Veterinärmedizin

15.12.2005

12

Beispiel 4: rXY≈ 0, kein linearer Zusammenhang

Daten:x y1 102 123 94 105 8.336 12

Page 13: Nachtrag zur Vorlesung vom 8.12.2005, allgemeine IxJ-Kontingenztafel

Vorlesung: Biometrie für Studierende der Veterinärmedizin

15.12.2005

13

Beispiel 5: rXY= 0, kein linearer Zusammenhang

Daten:x y1 3.1252 1.1253 0.1254 0.1255 1.1256 3.125

2)(5.0 xxy

Page 14: Nachtrag zur Vorlesung vom 8.12.2005, allgemeine IxJ-Kontingenztafel

Vorlesung: Biometrie für Studierende der Veterinärmedizin

15.12.2005

14

Alternative: Rangkorrelationskoeffizient nach Spearman rSp

• Alternative zum Korrelationskoeffizienten nach Bravais-Pearson, wenn– X metrisch, Y ordinal– Y metrisch, X ordinal– X ordinal, Y ordinal– der Fokus nicht auf der Linearität des

Zusammenhangs liegt, sondern nur interessiert, ob der Zusammenhang monoton ist

Page 15: Nachtrag zur Vorlesung vom 8.12.2005, allgemeine IxJ-Kontingenztafel

Vorlesung: Biometrie für Studierende der Veterinärmedizin

15.12.2005

15

Definition von rSp

• Vorarbeit: Die Originaldaten werden durch Rangzahlen ersetzt

• Die Berechnung erfolgt wie beim Korrelationskoeffizienten nach Bravais-Pearson, indem statt den Originaldaten ihre Ränge verwendet werden:

n

i

n

iii

n

iii

XY

yyxx

yyxxr

1 1

22

1

)Rang()Rang()Rang()Rang(

)Rang()Rang()Rang()Rang(

Page 16: Nachtrag zur Vorlesung vom 8.12.2005, allgemeine IxJ-Kontingenztafel

Vorlesung: Biometrie für Studierende der Veterinärmedizin

15.12.2005

16

Fortsetzung Beispiel 3 (Seite 11)

i Originaldaten Rangdaten

x y Rang(x) Rang(y)

1 1 12 1 1

2 2 15 2 3

3 3 13 3 2

4 4 18 4 6

5 5 17 5 5

6 6 16 6 4

Page 17: Nachtrag zur Vorlesung vom 8.12.2005, allgemeine IxJ-Kontingenztafel

Vorlesung: Biometrie für Studierende der Veterinärmedizin

15.12.2005

17

Fortsetzung Beispiel 3 (II)

71.05.17/5.12

5.1717.517.5

:Nenner

5.121.25 2.25 1.25 0.75 0.75 6.25

)5.34()5.36()5.35()5.35()5.36()5.34(

)5.32()5.33()5.33()5.32()5.31()5.31(

:Zähler

6/)654321(5.3)Rang()Rang(

Spr

yx

Page 18: Nachtrag zur Vorlesung vom 8.12.2005, allgemeine IxJ-Kontingenztafel

Vorlesung: Biometrie für Studierende der Veterinärmedizin

15.12.2005

18

Hinweise

• -1 ≤ rSp ≤ +1

• Sind alle (Original-)Werte von X und Y verschieden, so sind die Rangzahlen eindeutig zu vergeben. Man sagt: es treten keine Bindungen (no ties) auf

• Kommen (Original-)Werte von X und/oder Y doppelt oder mehrmals vor, so wird folgender „Trick“ angewendet (Verwendung von Durchschnittsrängen):

Datenreihe y: 12 13 13 14 15 15 15 16

Rangzahlen : 1 2.5 2.5 4 6 6 6 8

Page 19: Nachtrag zur Vorlesung vom 8.12.2005, allgemeine IxJ-Kontingenztafel

Vorlesung: Biometrie für Studierende der Veterinärmedizin

15.12.2005

19

Hinweise (II)

• Kommen keine Bindungen vor, so kann rSp einfacher berechnet werden:

iii

n

ii

Sp

yxd

nn

dr

RangRangmit

)1(

61

21

2

Page 20: Nachtrag zur Vorlesung vom 8.12.2005, allgemeine IxJ-Kontingenztafel

Vorlesung: Biometrie für Studierende der Veterinärmedizin

15.12.2005

20

Fortsetzung (II) Beispiel 3 (Seite 11)

71.0)16(6

1061

10

404110

)46()55()64(

)23()32()11(

2

222

2226

1

2

Sp

ii

r

d

Page 21: Nachtrag zur Vorlesung vom 8.12.2005, allgemeine IxJ-Kontingenztafel

Vorlesung: Biometrie für Studierende der Veterinärmedizin

15.12.2005

21

Noch ein Beispiel

• Datenreihe x: 1 2 3 4 5 6• Datenreihe y: 1 4 9 16 25 36• y=x2

• Zusammenhang ist monoton (quadratisch), aber nicht linear

• Rang(xi)=Rang(yi)

• rSp=1 (da di=0 für alle Paare i)

• r nach Bravais-Pearson ist 0.98

Page 22: Nachtrag zur Vorlesung vom 8.12.2005, allgemeine IxJ-Kontingenztafel

Vorlesung: Biometrie für Studierende der Veterinärmedizin

15.12.2005

22

Scheinkorrelationen (Nonsens-Korr.)

• Klassiker: Positive Korrelation zwischen der Anzahl beobachteter Störche und der Anzahl der Geburten in Regionen in Deutschland (Korrelation ≠ Kausalität)

• Confounder-Problematik (u.a.)• Im Storchenbeispiel: es gibt andere Variablen

(Urbanität, Sozialverhalten), die ihrerseits assoziert sein können und mit den untersuchten Variablen (Anzahl Störche, Anzahl Geburten) in Verbindung stehen

Page 23: Nachtrag zur Vorlesung vom 8.12.2005, allgemeine IxJ-Kontingenztafel

Vorlesung: Biometrie für Studierende der Veterinärmedizin

15.12.2005

23

Weitere Anmerkungen

• Auch das Gegenteil von Scheinkorrelation kann auftreten: Tatschlich vorhandene Korrelationen werden nicht erkannt

• Vorzeichenumkehr: in der Gesamtpopulation wird eine (z.B.) positive Korrelation beobachtet. Zerlegt man die Gesamtpopulationen in Teilpopulationen, so kann der Fall eintreten, dass in jeder Teilpopulation eine negative Korrelation beobachtet wird

Page 24: Nachtrag zur Vorlesung vom 8.12.2005, allgemeine IxJ-Kontingenztafel

Vorlesung: Biometrie für Studierende der Veterinärmedizin

15.12.2005

24

Zusammenfassung I (was Sie wissen sollten)

• Der Korrelationskoeffizient nach Bravais-Pearson ist ein Maß für den linearen Zusammenhang von zwei stetigen Merkmalen (grafisch: Streudiagramm). Wert in [-1;1]

• Der Rangkorrelationskoeffizient nach Spearman ist ein Maß für den monotonen Zusammenhang. Die beiden Merkmale können stetig und ordinal sein (alle Kombinationen erlaubt: stetig/stetig, stetig/ordinal, ordinal/ordinal). Er verwendet Ränge statt Originalwerte (Berechnungsformel wie bei Bravais-Pearson bzw. vereinfachte Formel, wenn keine Bindungen vorkommen)

• Problematik: Schein-/verdeckte Korr., Vorzeichen

Page 25: Nachtrag zur Vorlesung vom 8.12.2005, allgemeine IxJ-Kontingenztafel

Vorlesung: Biometrie für Studierende der Veterinärmedizin

15.12.2005

25

Zusammenfassung II (was Sie können sollten)

• Streudiagramm zeichnen• Korrelationskoeffizient nach Bravais-Pearson

berechnen• Ränge bilden (auch: bei Bindungen)• Korrelationskoeffizient nach Spearman berechnen• Interpretation: linearer Zusammenhang, monotoner

Zusammenhang, positiver/negativer Zusammenhang