33
Methoden der Politikwissenschaft II Weitere Zusammenhangsmaße Siegfried Schumann

Methoden der Politikwissenschaft II Weitere Zusammenhangsmaße Siegfried Schumann

Embed Size (px)

Citation preview

Page 1: Methoden der Politikwissenschaft II Weitere Zusammenhangsmaße Siegfried Schumann

Methoden der Politikwissenschaft II

Weitere Zusammenhangsmaße

Siegfried Schumann

Page 2: Methoden der Politikwissenschaft II Weitere Zusammenhangsmaße Siegfried Schumann

2

Phi-Koeffizient: Alternative Berechnungsart

Auto Puppe ΣJungen a b 50Mädchen

c d 50

Σ 60 40 100

Auto Puppe ΣJungen 35 15 50Mädchen

25 25 50

Σ 60 40 100

ad – bc√ (a+b) (c+d) (a+c) (b+d)

ad – bc√ (35+15) (25+25) (35+25) (15+25)

= 0.204124

(nach Clauß u.a. 1994: 82-83; 294-295)

Page 3: Methoden der Politikwissenschaft II Weitere Zusammenhangsmaße Siegfried Schumann

3

Phi-Koeffizient: Bekannte Berechnungsart (Aufgabe)

observed - expectedAuto Puppe Σ

Jungen 5 -5 50Mädchen

-5 5 50

Σ 60 40 100

expectedAuto Puppe Σ

Jungen 30 20 50Mädchen

30 20 50

Σ 60 40 100

(observed – expected)2

Auto Puppe ΣJungen 25 25 50Mädchen

25 25 50

Σ 60 40 100

(observed – expected)2 / expected

Auto Puppe ΣJungen 0.83 1.25 50Mädchen

0.83 1.25 50

Σ 60 40 100Σ= 4.16; Φ = √ 4.16 / 100

= 0.204124

Page 4: Methoden der Politikwissenschaft II Weitere Zusammenhangsmaße Siegfried Schumann

4

Beispiele für Werte 1, -1 und 0:

Φ = -1Auto Puppe Σ

Jungen 0 60 60Mädchen

40 0 40

Σ 40 60 100

Φ = 1Auto Puppe Σ

Jungen 60 0 60Mädchen

0 40 40

Σ 60 40 100

Φ = 0 (Beispiel 1)Auto Puppe Σ

Jungen 30 20 50Mädchen

30 20 50

Σ 60 40 100

Φ = 0 (Beispiel 2)Auto Puppe Σ

Jungen 15 10 25Mädchen

45 30 75

Σ 60 40 100„expected“ aus vorherigem Beispiel!

Page 5: Methoden der Politikwissenschaft II Weitere Zusammenhangsmaße Siegfried Schumann

5

Phi-Koeffizient: Signifikanzprüfung (Beispiel)

• Voraussetzung: Erwartete absolute Häufigkeiten in der Indifferenztabelle > 5

• Hypothesen: H0: ρxy = 0H1: ρxy ≠ 0

• Signifikanzniveau festlegen: α = 0.01

• Prüfgröße: χ2 =

• Berechnung: χ2 = = 4.17

• Kritischer Wert χ2(α=0.01; df=1) = ?

N · (ad – bc)2

(a+b) (c+d) (a+c) (b+d)

100 · (35 · 25 – 15 · 25)2

50 · 50 · 60 · 40

Page 6: Methoden der Politikwissenschaft II Weitere Zusammenhangsmaße Siegfried Schumann

6

Chi-Quadrat-Verteilungen

aus: Bortz 2005: 80

1 %

99 %

krit. Wert

Page 7: Methoden der Politikwissenschaft II Weitere Zusammenhangsmaße Siegfried Schumann

7

Kritische Werte der Chi-Quadrat-Verteilung

α

f 0.10 0.05 0.01 0.001

1 2.71 3.84 6.64 10.8 2 4.61 5.99 9.21 13.8 3 6.25 7.81 11.3 16.3 4 7.78 9.49 13.3 18.5 5 9.24 11.1 15.1 20.5 6 10.6 12.6 16.8 22.5 7 12.0 14.1 18.5 24.3 8 13.4 15.5 20.1 26.1 9 14.7 16.9 21.7 27.9

10 16.0 18.3 23.2 29.6 11 17.3 19.7 24.7 31.3 12 18.5 21.0 26.2 32.9

.. .. .. .. ..

.. .. .. .. .. 70 85.5 90.5 100.4 112.3 75 91.1 96.2 106.4 118.6 80 96.6 101.9 112.3 124.8 85 102.1 107.5 118.2 131.0 90 107.6 113.1 124.1 137.2 95 113.0 118.8 130.0 143.3

100 118.5 124.3 135.8 149.4

Empirischer Chi-Quadrat Wert(Prüfgröße)Im Beispiel: 4.17Bei: α = 0.01

Zusatzbeispiel

Kritischer (Chi-Quadrat-) Wert

4.17 < 6.64 → nicht signifikant

Page 8: Methoden der Politikwissenschaft II Weitere Zusammenhangsmaße Siegfried Schumann

8

Kontingenzkoeffizient: Berechnung

χ2 = 2.036

VorgehenStrategie

1Strategie

2Strategie

3Strategie 4 Σ

Instruktionfrei 6 3 3 4 16Regel 1 5 5 4 2 16Regel 2 2 3 2 1 8

Σ 13 11 9 7 40

nχχC 2

2

(nach Clauß u.a. 1994: 85-87; 295-297)

= 0.22 df.: 6

Page 9: Methoden der Politikwissenschaft II Weitere Zusammenhangsmaße Siegfried Schumann

9

Kontingenzkoeffizient: Signifikanzprüfung

• Voraussetzung: Erwartete absolute Häufigkeiten in der Indifferenztabelle > 5

• Hypothesen: H0: ρxy = 0H1: ρxy ≠ 0

• Signifikanzniveau festlegen: α = 0.01

• Prüfgröße: χ2 = 2.036

• Kritischer Wert χ2(α=0.01; df=6) = 16.8

• 2.036 < 16.8; → nicht signifikant

Kritischer (Chi-Quadrat-) Wert

Page 10: Methoden der Politikwissenschaft II Weitere Zusammenhangsmaße Siegfried Schumann

10

Korrelationsanalyse

Interpretation des Korrelationskoeffizienten rxy

– direkt interpretierbare Werte: +1, 0, -1

– Regressionskoeffizient bei z-standardisierten Werten

– geometrische Interpretation

– geometrisches Mittel zweier „zusammengehöriger“ Regressionskoeffizienten

– Wurzel aus „Bestimmtheitsmaß“ plus Vorzeichen des Regressionskoeffizienten

– Quadrat: Gemeinsame Varianz der beiden Variablenrxy ±.0

0±.10

±20

±.30

±.40

±.50

±.60

±.70

±.80

±.90

± 1

rxy2

.00 .01 .04 .09 .16 .25 .36 .49 .64 .81 1.00

Page 11: Methoden der Politikwissenschaft II Weitere Zusammenhangsmaße Siegfried Schumann

11

Geometrische Interpretation (1)

aus: Krämer 1994: 135

Page 12: Methoden der Politikwissenschaft II Weitere Zusammenhangsmaße Siegfried Schumann

12

Geometrische Interpretation (2)

aus: Krämer 1994: 138

Page 13: Methoden der Politikwissenschaft II Weitere Zusammenhangsmaße Siegfried Schumann

13

Geometrische Interpretation (3)

aus: Krämer 1994: 140

Page 14: Methoden der Politikwissenschaft II Weitere Zusammenhangsmaße Siegfried Schumann

14

Formeln zur Berechnung von rxy

yx

xy SAQSAQSAPr

yx

xyxy ss

sr

s SAPn

s SAQn

sSAQ

nxy xx

yy ; ;mit:

Page 15: Methoden der Politikwissenschaft II Weitere Zusammenhangsmaße Siegfried Schumann

15

Signifikanzprüfung für H0: ρxy = 0 (Beispiel)

• Voraussetzungen: metrische Daten mit (annähernd) Normalverteilung; n ≥ 10

• Hypothesen i.d.R.: H0: ρxy = 0 (Abweichung: s. Seite 300 Mitte, 301 unten - 302 oben, 364, 441) H1: ρxy ≠ 0

• Signifikanzniveau festlegen: α = 0.01

• Prüfgröße: r hier: r = 0.713 (Korrelationskoeffizient)

• Freiheitsgrade (df.) ermitteln: N – 2 hier: 10 – 2 = 8

• Zufallshöchstwert (kritischen Wert) r(α; N-2) ermitteln: Zufallshöchstwert von r für α = 0.01: bei df. = 5: 0.87 bei df. = 10: 0.71 bei df. = 8: 0.774 (Interpolation; Tafel 8, S. 381)

• 0.713 < 0.774; → nicht signifikant (nach Clauß u.a. 1994: 299-301; 381)

Page 16: Methoden der Politikwissenschaft II Weitere Zusammenhangsmaße Siegfried Schumann

16

Zufallshöchstwert von r + lineare Interpolation

df = 5 df = 8 df = 10

0.87 ? 0.71

3/5 der Differenz 2/5 der Differenz

Differenz: 0.16

2/5 ∙ 0.16 = 0.064

0.71 + 0.064 = 0.774

Tabellenwert für df = 8 ?

Tafel 8 aus Clauß u.a. 1994: 381

!

Page 17: Methoden der Politikwissenschaft II Weitere Zusammenhangsmaße Siegfried Schumann

17

Signifikanzprüfung für H0: ρxy ≠ 0 (Beispiel)

• Voraussetzungen: metrische Daten mit (annähernd) Normalverteilung; n ≥ 10 • Hypothese z.B.: H0: ρxy = 0.9500

H1: ρxy ≠ 0.9500• Signifikanzniveau festlegen: α = 0.05• Fisher´sche z-Transformation für Korrelationskoeffizienten

empirisch auftretender Koeffizient: r = 0.9882 → z = 2.5634 Koeffizient gemäß H0: ρxy= 0.9500 → z0 = 1.8318 (Werte grob aus Tafel 24 auf S. 441 ablesbar)

• t-verteilte Prüfgröße: hier: 1.9356 (bei n = 10)

• Wenn Prüfgröße ≥ t(α; N-2), dann ist H0 abzulehnen.• Freiheitsgrade (df.): N – 2 (hier: 10 – 2 = 8) • t(0.05; 8) = 2.31 (t-Verteilung aus Tabelle 4, S. 364)

• 1.9356 < 2.31; → nicht signifikant

r1r1ln

21z

3Nzz 0

(nach Clauß u.a. 1994: 300 Mitte, 301 unten – 302 oben, 364, 441)

(aus: Bleymüller u.a. 1992: 63)

Page 18: Methoden der Politikwissenschaft II Weitere Zusammenhangsmaße Siegfried Schumann

18

Tabelle zur Umrechnung: r → z

Tafel 24 aus Clauß u.a. 1994: 441

Differenz der r-Werte aus der Tabelle: 0.95080 -0.94983 = 0.00097

z-Wert für r = 0.95 ?

z-Wert für r = 0.94983: 1.83 z-Wert für r = 0.95080: 1.84

Differenz der r-Werte „0.95“ und „0.94983: 0.95000 -0.94983 = 0.00017

1.83 + (0.00017 / 0.00097 ∙ 0.01) = 1.83175

Differenz der z-Werte: 1.84 – 1.83 = 0.01

Page 19: Methoden der Politikwissenschaft II Weitere Zusammenhangsmaße Siegfried Schumann

19

Wdh: Signifikanzprüfung für H0: ρxy ≠ 0 (Beispiel)

• Voraussetzungen: metrische Daten mit (annähernd) Normalverteilung; n ≥ 10 • Hypothese z.B.: H0: ρxy = 0.9500

H1: ρxy ≠ 0.9500• Signifikanzniveau festlegen: α = 0.05• Fisher´sche z-Transformation für Korrelationskoeffizienten

empirisch auftretender Koeffizient: r = 0.9882 → z = 2.5634 Koeffizient gemäß H0: ρxy= 0.9500 → z0 = 1.8318 (Werte grob aus Tafel 24 auf S. 441 ablesbar)

• t-verteilte Prüfgröße: hier: 1.9356 (bei n = 10)

• Wenn Prüfgröße ≥ t(α; N-2), dann ist H0 abzulehnen.• Freiheitsgrade (df.): N – 2 (hier: 10 – 2 = 8) • t(0.05; 8) = 2.31 (t-Verteilung aus Tabelle 4, S. 364)

• 1.9356 < 2.31; → nicht signifikant

r1r1ln

21z

3Nzz 0

(nach Clauß u.a. 1994: 300 Mitte, 301 unten – 302 oben, 364, 441)

(aus: Bleymüller u.a. 1992: 63)

Page 20: Methoden der Politikwissenschaft II Weitere Zusammenhangsmaße Siegfried Schumann

20

Kritische Werte der t-Verteilung

Tafel 4 aus: Clauß u.a. 1994: 364-365

→ SNV

Page 21: Methoden der Politikwissenschaft II Weitere Zusammenhangsmaße Siegfried Schumann

21

Sonderfälle beim Kontingenzkoeffizienten

• Punktbiserialer Koeffizient rpbis

(Zweizeilenkoeffizient)– Variable X alternativ (dichotom)– Variable Y metrisch + normalverteilt

• Beispiel: Körpergrößen in cm

• falls Variable X ebenfalls normalverteilt:

biserialer Koeffizient rbis (→ Lieraturverweis!)

2

1121

21pbis f

fs

xxoderffs

xxr

155

160

165

170

175

180

185

n

Männer 3 3 11 15 19 21 12 84Frauen 17 21 16 15 11 4 2 86

AM Männer: 174.2 cmAM Frauen: 165.1 cmAM insgesamt: 169.6 cm

SD aller Werte: 9.09 cm

rpbis = 0.50 nach Clauß u.a. 1994: 87/88

f1 / f2: relative Häufigkeiten!

(84 / 170 bzw. 86 / 170)

Page 22: Methoden der Politikwissenschaft II Weitere Zusammenhangsmaße Siegfried Schumann

22

Rangkorrelationskoeffizient R (Spearman)

• Daten: zwei Rangreihen ohne Bindungen

• Beispiel: Rainer Horst Klaus Mario Peter Tilo Σ

Leistung 1 2 3 4 5 6 21 Sympathie 2 3 1 4 6 5 21

di (absolut) 1 1 2 0 1 1 di

2 1 1 4 0 1 1 8•

• Interpretation der Werte: +1: zwei identische Rangreihen -1: zwei gegenläufige Rangreihen Vorzeichen: zeigt die Richtung des Zusammenhangs

• Vorteil: leicht zu berechnen• Nachteil: Zwischen den Rangplätzen werden gleiche Abstände unterstellt (aus r

ableitbar!) Abhilfe: Rangkorrelationskoeffizient τ (Tau) berechnen (aber: aufwendiger)

1)(nn

d61R 2

2i

77.01)(366

861R

später!

Page 23: Methoden der Politikwissenschaft II Weitere Zusammenhangsmaße Siegfried Schumann

23

Signifikanzprüfung für R (Beispiel), Rkorr oder Rg

• Voraussetzungen: ordinale Daten; n ≥ 6

• Hypothesen: H0: ρxy = 0 H1: ρxy ≠ 0

• Signifikanzniveau festlegen: hier: α = 0.01

• Prüfgröße: Rangkorrelationskoeffizient (R, Rkorr oder Rg) hier: R = 0.77 • Für N ≤ 30: Wenn ≥ R(α; N) (lt. Tafel 18), dann ist H0 abzulehnen.

Für N > 30: Wenn ≥ r(α; N-2) (lt. Tafel 8), dann ist H0 abzulehnen.

• Im Beispiel: n = 6R(0.01; 6) = 1.00 (nach Tafel 18)

< 1.00; → nicht signifikant

Prüfgröße

(nach Clauß u.a. 1994: 88-89, 297-298, 381, 435)

Prüfgröße

0.77

siehe oben!

Page 24: Methoden der Politikwissenschaft II Weitere Zusammenhangsmaße Siegfried Schumann

24

Kritische Werte Rα;N für den Rangkorr.koeffizienten

Tafel 18 aus Clauß u.a. 1994: 435

R(0.01; 6) = 1.00

Page 25: Methoden der Politikwissenschaft II Weitere Zusammenhangsmaße Siegfried Schumann

25

Rangkorrelationskoeffizient Tau (Kendall) - Beispiel

• Vier Objekte (O) werden von 2 Gutachtern (A und B) beurteilt (Rangfolge)O1 O2 O3 O4

Rangfolge von Gutachter A: 3 4 2 1Rangfolge von Gutachter B: 3 1 4 2

• Bestimmung von Konkordanzen (Wert: „1“) und Diskordanzen (Wert: -1):O1-O2: -1; O1-O3: -1; O1-O4: +1; O2-O3: -1; O2-O4: -1; O3-O4: +1Summe der Diskordanzen (Vertauschungen): nd = 4

• Kendall-Summe: Maximum bei nd = 0, d.h.

• Normierung, um Werte zwischen „-1“ und „+1“ zu erhalten:

• Im Beispiel: Achtung: Keine Bindungen! nur monotoner Zusammenhangsanteil!

dn22

1)(nnS

21)(nnSmax

1)(nnn41

SSτ d

max

0.333312

44162-τ

(nach Hochstädter 1991: 158-161)

n = Anzahl d. Beobachtungspaare; hier: 4

Anzahl der Paarvergleiche

Page 26: Methoden der Politikwissenschaft II Weitere Zusammenhangsmaße Siegfried Schumann

26

Eta → Varianzanalyse

Beispiel: Sympathie für den Papst x Konfession

andere Konfesions- Katholiken Protestanten Konfessionen lose

insgesamtSAQSAQerklärteEta

Page 27: Methoden der Politikwissenschaft II Weitere Zusammenhangsmaße Siegfried Schumann

27

λ-Maßzahlen für den Zusammenhangzwischen

zwei diskreten Variablen

Page 28: Methoden der Politikwissenschaft II Weitere Zusammenhangsmaße Siegfried Schumann

28

Beispiel zur Konstruktion von λ-Maßzahlen

Anordnung innerhalb der Zellen: observed expected (observed – expected) (observed – expected)2 (observed – expected)2 / expected

Kirchgangshäufigkeit:

Konfession:

(fast) jeden Sonntag

ab und zu

etwa einmal im Jahr

seltener

SUMME

↓ katholisch

1391 936.9 454.1

206206.8 220.1

1800 1846.7

-46.7 2180.9

1.2

478 625.4

-147.4 21726.8

34.7

1422 1682.0 -260.0

67600.0 40.2

5091

evangelisch

467 967.1

-500.1 250100.0

258.6

1980 1906.2

73.8 5446.4

2.9

803 645.6 157.4

24774.8 38.4

2005 1736.2

268.8 72253.4

41.6

5255

andere Konfession oder konfessionslos

76 30.0 46.0

2116.0 70.5

32 59.1

-27.1 734.4

12.4

10 20.0

-10.0 100.0

5.0

45 53.9 -8.9 79.2 1.5

163

SUMME 1934 3812 1291 3472 10509

Empirischer Chi-Quadrat-Wert: 727.1

Page 29: Methoden der Politikwissenschaft II Weitere Zusammenhangsmaße Siegfried Schumann

29

Berechnung der λ-Maßzahlen

18.05000.0

4120.05000.0abhängigKonfession

18.05254

43305254abhängigKonfession

ZIohne

ZImitZIohne

keitscheinlichFehlerwahrkeitscheinlichFehlerwahrkeitscheinlichFehlerwahr

01.06373.0

6307.06373.0abhängighäufigkeitKirchgangs

01.06697

66286697abhängighäufigkeitKirchgangs

0.080.63730.5000

0.6307)(0.41200.6373)(0.5000λ hsymmetrisc

08.066975254

)66284330()66975254(hsymmetrisc

ZI = Zusatzinformation

Page 30: Methoden der Politikwissenschaft II Weitere Zusammenhangsmaße Siegfried Schumann

30

Beispiel zur Konstruktion von λ-Maßzahlen

Anordnung innerhalb der Zellen: observed expected (observed – expected) (observed – expected)2 (observed – expected)2 / expected

Kirchgangshäufigkeit:

Konfession:

(fast) jeden Sonntag

ab und zu

etwa einmal im Jahr

seltener

SUMME

↓ katholisch

1391 936.9 454.1

206206.8 220.1

1800 1846.7

-46.7 2180.9

1.2

478 625.4

-147.4 21726.8

34.7

1422 1682.0 -260.0

67600.0 40.2

5091

evangelisch

467 967.1

-500.1 250100.0

258.6

1980 1906.2

73.8 5446.4

2.9

803 645.6 157.4

24774.8 38.4

2005 1736.2

268.8 72253.4

41.6

5255

andere Konfession oder konfessionslos

76 30.0 46.0

2116.0 70.5

32 59.1

-27.1 734.4

12.4

10 20.0

-10.0 100.0

5.0

45 53.9 -8.9 79.2 1.5

163

SUMME 1934 3812 1291 3472 10509

52544330

Page 31: Methoden der Politikwissenschaft II Weitere Zusammenhangsmaße Siegfried Schumann

31

Berechnung der λ-Maßzahlen

18.05000.0

4120.05000.0abhängigKonfession

18.05254

43305254abhängigKonfession

ZIohne

ZImitZIohne

keitscheinlichFehlerwahrkeitscheinlichFehlerwahrkeitscheinlichFehlerwahr

01.06373.0

6307.06373.0abhängighäufigkeitKirchgangs

01.06697

66286697abhängighäufigkeitKirchgangs

0.080.63730.5000

0.6307)(0.41200.6373)(0.5000λ hsymmetrisc

08.066975254

)66284330()66975254(hsymmetrisc

ZI = Zusatzinformation

N = 10509

Page 32: Methoden der Politikwissenschaft II Weitere Zusammenhangsmaße Siegfried Schumann

32

Drittvariablenkontrolle durch Partialkorrelation

Formale Bildung(höchster allgemeinbildender Schulabschluß)

Autoritarismus Extrem rechte Einstellungen

Residuum Residuum

Partialkorrelation

Regressionen

Page 33: Methoden der Politikwissenschaft II Weitere Zusammenhangsmaße Siegfried Schumann

33

Vielen Dank für IhreAufmerksamkeit!