Methoden der Politikwissenschaft II Weitere Zusammenhangsmaße Siegfried Schumann

Methoden der Politikwissenschaft II

Weitere Zusammenhangsmaße

Siegfried Schumann

2

Phi-Koeffizient: Alternative Berechnungsart

Auto Puppe ΣJungen a b 50Mädchen

c d 50

Σ 60 40 100

Auto Puppe ΣJungen 35 15 50Mädchen

25 25 50

Σ 60 40 100

ad – bc√ (a+b) (c+d) (a+c) (b+d)

ad – bc√ (35+15) (25+25) (35+25) (15+25)

= 0.204124

(nach Clauß u.a. 1994: 82-83; 294-295)

3

Phi-Koeffizient: Bekannte Berechnungsart (Aufgabe)

observed - expectedAuto Puppe Σ

Jungen 5 -5 50Mädchen

-5 5 50

Σ 60 40 100

expectedAuto Puppe Σ

Jungen 30 20 50Mädchen

30 20 50

Σ 60 40 100

(observed – expected)2

Auto Puppe ΣJungen 25 25 50Mädchen

25 25 50

Σ 60 40 100

(observed – expected)2 / expected

Auto Puppe ΣJungen 0.83 1.25 50Mädchen

0.83 1.25 50

Σ 60 40 100Σ= 4.16; Φ = √ 4.16 / 100

= 0.204124

4

Beispiele für Werte 1, -1 und 0:

Φ = -1Auto Puppe Σ


40 0 40

Σ 40 60 100

Φ = 1Auto Puppe Σ


0 40 40

Σ 60 40 100

Φ = 0 (Beispiel 1)Auto Puppe Σ


30 20 50

Σ 60 40 100

Φ = 0 (Beispiel 2)Auto Puppe Σ


45 30 75

Σ 60 40 100„expected“ aus vorherigem Beispiel!

5

Phi-Koeffizient: Signifikanzprüfung (Beispiel)

• Voraussetzung: Erwartete absolute Häufigkeiten in der Indifferenztabelle > 5

• Hypothesen: H0: ρxy = 0H1: ρxy ≠ 0

• Signifikanzniveau festlegen: α = 0.01

• Prüfgröße: χ2 =

• Berechnung: χ2 = = 4.17

• Kritischer Wert χ2(α=0.01; df=1) = ?

N · (ad – bc)2

(a+b) (c+d) (a+c) (b+d)

100 · (35 · 25 – 15 · 25)2

50 · 50 · 60 · 40

6

Chi-Quadrat-Verteilungen

aus: Bortz 2005: 80

1 %

99 %

krit. Wert

7

Kritische Werte der Chi-Quadrat-Verteilung

α

f 0.10 0.05 0.01 0.001

1 2.71 3.84 6.64 10.8 2 4.61 5.99 9.21 13.8 3 6.25 7.81 11.3 16.3 4 7.78 9.49 13.3 18.5 5 9.24 11.1 15.1 20.5 6 10.6 12.6 16.8 22.5 7 12.0 14.1 18.5 24.3 8 13.4 15.5 20.1 26.1 9 14.7 16.9 21.7 27.9

10 16.0 18.3 23.2 29.6 11 17.3 19.7 24.7 31.3 12 18.5 21.0 26.2 32.9

.. .. .. .. ..

.. .. .. .. .. 70 85.5 90.5 100.4 112.3 75 91.1 96.2 106.4 118.6 80 96.6 101.9 112.3 124.8 85 102.1 107.5 118.2 131.0 90 107.6 113.1 124.1 137.2 95 113.0 118.8 130.0 143.3

100 118.5 124.3 135.8 149.4

Empirischer Chi-Quadrat Wert(Prüfgröße)Im Beispiel: 4.17Bei: α = 0.01

Zusatzbeispiel

Kritischer (Chi-Quadrat-) Wert

4.17 < 6.64 → nicht signifikant

8

Kontingenzkoeffizient: Berechnung

χ2 = 2.036

VorgehenStrategie

1Strategie

2Strategie

3Strategie 4 Σ

Instruktionfrei 6 3 3 4 16Regel 1 5 5 4 2 16Regel 2 2 3 2 1 8

Σ 13 11 9 7 40

nχχC 2

2

(nach Clauß u.a. 1994: 85-87; 295-297)

= 0.22 df.: 6

9

Kontingenzkoeffizient: Signifikanzprüfung

• Voraussetzung: Erwartete absolute Häufigkeiten in der Indifferenztabelle > 5

• Hypothesen: H0: ρxy = 0H1: ρxy ≠ 0


• Prüfgröße: χ2 = 2.036

• Kritischer Wert χ2(α=0.01; df=6) = 16.8

• 2.036 < 16.8; → nicht signifikant

Kritischer (Chi-Quadrat-) Wert

10

Korrelationsanalyse

Interpretation des Korrelationskoeffizienten rxy

– direkt interpretierbare Werte: +1, 0, -1

– Regressionskoeffizient bei z-standardisierten Werten

– geometrische Interpretation

– geometrisches Mittel zweier „zusammengehöriger“ Regressionskoeffizienten

– Wurzel aus „Bestimmtheitsmaß“ plus Vorzeichen des Regressionskoeffizienten

– Quadrat: Gemeinsame Varianz der beiden Variablenrxy ±.0

0±.10

±20

±.30

±.40

±.50

±.60

±.70

±.80

±.90

± 1

rxy2

.00 .01 .04 .09 .16 .25 .36 .49 .64 .81 1.00

11

Geometrische Interpretation (1)

aus: Krämer 1994: 135

12



13



14

Formeln zur Berechnung von rxy

yx

xy SAQSAQSAPr

yx

xyxy ss

sr

s SAPn

s SAQn

sSAQ

nxy xx

yy ; ;mit:

15

Signifikanzprüfung für H0: ρxy = 0 (Beispiel)

• Voraussetzungen: metrische Daten mit (annähernd) Normalverteilung; n ≥ 10

• Hypothesen i.d.R.: H0: ρxy = 0 (Abweichung: s. Seite 300 Mitte, 301 unten - 302 oben, 364, 441) H1: ρxy ≠ 0


• Prüfgröße: r hier: r = 0.713 (Korrelationskoeffizient)

• Freiheitsgrade (df.) ermitteln: N – 2 hier: 10 – 2 = 8

• Zufallshöchstwert (kritischen Wert) r(α; N-2) ermitteln: Zufallshöchstwert von r für α = 0.01: bei df. = 5: 0.87 bei df. = 10: 0.71 bei df. = 8: 0.774 (Interpolation; Tafel 8, S. 381)

• 0.713 < 0.774; → nicht signifikant (nach Clauß u.a. 1994: 299-301; 381)

16

Zufallshöchstwert von r + lineare Interpolation

df = 5 df = 8 df = 10

0.87 ? 0.71

3/5 der Differenz 2/5 der Differenz

Differenz: 0.16

2/5 ∙ 0.16 = 0.064

0.71 + 0.064 = 0.774

Tabellenwert für df = 8 ?

Tafel 8 aus Clauß u.a. 1994: 381

!

17

Signifikanzprüfung für H0: ρxy ≠ 0 (Beispiel)

• Voraussetzungen: metrische Daten mit (annähernd) Normalverteilung; n ≥ 10 • Hypothese z.B.: H0: ρxy = 0.9500

H1: ρxy ≠ 0.9500• Signifikanzniveau festlegen: α = 0.05• Fisher´sche z-Transformation für Korrelationskoeffizienten

empirisch auftretender Koeffizient: r = 0.9882 → z = 2.5634 Koeffizient gemäß H0: ρxy= 0.9500 → z0 = 1.8318 (Werte grob aus Tafel 24 auf S. 441 ablesbar)

• t-verteilte Prüfgröße: hier: 1.9356 (bei n = 10)

• Wenn Prüfgröße ≥ t(α; N-2), dann ist H0 abzulehnen.• Freiheitsgrade (df.): N – 2 (hier: 10 – 2 = 8) • t(0.05; 8) = 2.31 (t-Verteilung aus Tabelle 4, S. 364)


r1r1ln

21z

3Nzz 0

(nach Clauß u.a. 1994: 300 Mitte, 301 unten – 302 oben, 364, 441)

(aus: Bleymüller u.a. 1992: 63)

18

Tabelle zur Umrechnung: r → z


Differenz der r-Werte aus der Tabelle: 0.95080 -0.94983 = 0.00097

z-Wert für r = 0.95 ?

z-Wert für r = 0.94983: 1.83 z-Wert für r = 0.95080: 1.84

Differenz der r-Werte „0.95“ und „0.94983: 0.95000 -0.94983 = 0.00017

1.83 + (0.00017 / 0.00097 ∙ 0.01) = 1.83175

Differenz der z-Werte: 1.84 – 1.83 = 0.01

19

Wdh: Signifikanzprüfung für H0: ρxy ≠ 0 (Beispiel)

• Voraussetzungen: metrische Daten mit (annähernd) Normalverteilung; n ≥ 10 • Hypothese z.B.: H0: ρxy = 0.9500

H1: ρxy ≠ 0.9500• Signifikanzniveau festlegen: α = 0.05• Fisher´sche z-Transformation für Korrelationskoeffizienten

empirisch auftretender Koeffizient: r = 0.9882 → z = 2.5634 Koeffizient gemäß H0: ρxy= 0.9500 → z0 = 1.8318 (Werte grob aus Tafel 24 auf S. 441 ablesbar)

• t-verteilte Prüfgröße: hier: 1.9356 (bei n = 10)

• Wenn Prüfgröße ≥ t(α; N-2), dann ist H0 abzulehnen.• Freiheitsgrade (df.): N – 2 (hier: 10 – 2 = 8) • t(0.05; 8) = 2.31 (t-Verteilung aus Tabelle 4, S. 364)


r1r1ln

21z

3Nzz 0

(nach Clauß u.a. 1994: 300 Mitte, 301 unten – 302 oben, 364, 441)

(aus: Bleymüller u.a. 1992: 63)

20

Kritische Werte der t-Verteilung

Tafel 4 aus: Clauß u.a. 1994: 364-365

→ SNV

21

Sonderfälle beim Kontingenzkoeffizienten

• Punktbiserialer Koeffizient rpbis

(Zweizeilenkoeffizient)– Variable X alternativ (dichotom)– Variable Y metrisch + normalverteilt

• Beispiel: Körpergrößen in cm

• falls Variable X ebenfalls normalverteilt:

biserialer Koeffizient rbis (→ Lieraturverweis!)

2

1121

21pbis f

fs

xxoderffs

xxr

155

160

165

170

175

180

185

n

Männer 3 3 11 15 19 21 12 84Frauen 17 21 16 15 11 4 2 86

AM Männer: 174.2 cmAM Frauen: 165.1 cmAM insgesamt: 169.6 cm

SD aller Werte: 9.09 cm

rpbis = 0.50 nach Clauß u.a. 1994: 87/88

f1 / f2: relative Häufigkeiten!

(84 / 170 bzw. 86 / 170)

22

Rangkorrelationskoeffizient R (Spearman)

• Daten: zwei Rangreihen ohne Bindungen

•

• Beispiel: Rainer Horst Klaus Mario Peter Tilo Σ

Leistung 1 2 3 4 5 6 21 Sympathie 2 3 1 4 6 5 21

di (absolut) 1 1 2 0 1 1 di

2 1 1 4 0 1 1 8•

• Interpretation der Werte: +1: zwei identische Rangreihen -1: zwei gegenläufige Rangreihen Vorzeichen: zeigt die Richtung des Zusammenhangs

• Vorteil: leicht zu berechnen• Nachteil: Zwischen den Rangplätzen werden gleiche Abstände unterstellt (aus r

ableitbar!) Abhilfe: Rangkorrelationskoeffizient τ (Tau) berechnen (aber: aufwendiger)

1)(nn

d61R 2

2i

77.01)(366

861R

später!

23

Signifikanzprüfung für R (Beispiel), Rkorr oder Rg

• Voraussetzungen: ordinale Daten; n ≥ 6

• Hypothesen: H0: ρxy = 0 H1: ρxy ≠ 0

• Signifikanzniveau festlegen: hier: α = 0.01

• Prüfgröße: Rangkorrelationskoeffizient (R, Rkorr oder Rg) hier: R = 0.77 • Für N ≤ 30: Wenn ≥ R(α; N) (lt. Tafel 18), dann ist H0 abzulehnen.

Für N > 30: Wenn ≥ r(α; N-2) (lt. Tafel 8), dann ist H0 abzulehnen.

• Im Beispiel: n = 6R(0.01; 6) = 1.00 (nach Tafel 18)

< 1.00; → nicht signifikant

Prüfgröße

(nach Clauß u.a. 1994: 88-89, 297-298, 381, 435)

Prüfgröße

0.77

siehe oben!

24

Kritische Werte Rα;N für den Rangkorr.koeffizienten


R(0.01; 6) = 1.00

25

Rangkorrelationskoeffizient Tau (Kendall) - Beispiel

• Vier Objekte (O) werden von 2 Gutachtern (A und B) beurteilt (Rangfolge)O1 O2 O3 O4

Rangfolge von Gutachter A: 3 4 2 1Rangfolge von Gutachter B: 3 1 4 2

• Bestimmung von Konkordanzen (Wert: „1“) und Diskordanzen (Wert: -1):O1-O2: -1; O1-O3: -1; O1-O4: +1; O2-O3: -1; O2-O4: -1; O3-O4: +1Summe der Diskordanzen (Vertauschungen): nd = 4

• Kendall-Summe: Maximum bei nd = 0, d.h.

• Normierung, um Werte zwischen „-1“ und „+1“ zu erhalten:

• Im Beispiel: Achtung: Keine Bindungen! nur monotoner Zusammenhangsanteil!

dn22

1)(nnS

21)(nnSmax

1)(nnn41

SSτ d

max

0.333312

44162-τ

(nach Hochstädter 1991: 158-161)

n = Anzahl d. Beobachtungspaare; hier: 4

Anzahl der Paarvergleiche

26

Eta → Varianzanalyse

Beispiel: Sympathie für den Papst x Konfession

andere Konfesions- Katholiken Protestanten Konfessionen lose

insgesamtSAQSAQerklärteEta

27

λ-Maßzahlen für den Zusammenhangzwischen

zwei diskreten Variablen

28

Beispiel zur Konstruktion von λ-Maßzahlen

Anordnung innerhalb der Zellen: observed expected (observed – expected) (observed – expected)2 (observed – expected)2 / expected

Kirchgangshäufigkeit:

Konfession:

(fast) jeden Sonntag

ab und zu

etwa einmal im Jahr

seltener

SUMME

↓ katholisch

1391 936.9 454.1

206206.8 220.1

1800 1846.7

-46.7 2180.9

1.2

478 625.4

-147.4 21726.8

34.7

1422 1682.0 -260.0

67600.0 40.2

5091

evangelisch

467 967.1

-500.1 250100.0

258.6

1980 1906.2

73.8 5446.4

2.9

803 645.6 157.4

24774.8 38.4

2005 1736.2

268.8 72253.4

41.6

5255

andere Konfession oder konfessionslos

76 30.0 46.0

2116.0 70.5

32 59.1

-27.1 734.4

12.4

10 20.0

-10.0 100.0

5.0

45 53.9 -8.9 79.2 1.5

163

SUMME 1934 3812 1291 3472 10509

Empirischer Chi-Quadrat-Wert: 727.1

29

Berechnung der λ-Maßzahlen

18.05000.0

4120.05000.0abhängigKonfession

18.05254

43305254abhängigKonfession

ZIohne

ZImitZIohne

keitscheinlichFehlerwahrkeitscheinlichFehlerwahrkeitscheinlichFehlerwahr

01.06373.0

6307.06373.0abhängighäufigkeitKirchgangs

01.06697

66286697abhängighäufigkeitKirchgangs

0.080.63730.5000

0.6307)(0.41200.6373)(0.5000λ hsymmetrisc

08.066975254

)66284330()66975254(hsymmetrisc

ZI = Zusatzinformation

30

Beispiel zur Konstruktion von λ-Maßzahlen

Anordnung innerhalb der Zellen: observed expected (observed – expected) (observed – expected)2 (observed – expected)2 / expected

Kirchgangshäufigkeit:

Konfession:

(fast) jeden Sonntag

ab und zu

etwa einmal im Jahr

seltener

SUMME

↓ katholisch

1391 936.9 454.1

206206.8 220.1

1800 1846.7

-46.7 2180.9

1.2

478 625.4

-147.4 21726.8

34.7

1422 1682.0 -260.0

67600.0 40.2

5091

evangelisch

467 967.1

-500.1 250100.0

258.6

1980 1906.2

73.8 5446.4

2.9

803 645.6 157.4

24774.8 38.4

2005 1736.2

268.8 72253.4

41.6

5255

andere Konfession oder konfessionslos

76 30.0 46.0

2116.0 70.5

32 59.1

-27.1 734.4

12.4

10 20.0

-10.0 100.0

5.0

45 53.9 -8.9 79.2 1.5

163

SUMME 1934 3812 1291 3472 10509

52544330

31

Berechnung der λ-Maßzahlen

18.05000.0

4120.05000.0abhängigKonfession

18.05254

43305254abhängigKonfession

ZIohne

ZImitZIohne

keitscheinlichFehlerwahrkeitscheinlichFehlerwahrkeitscheinlichFehlerwahr

01.06373.0

6307.06373.0abhängighäufigkeitKirchgangs

01.06697

66286697abhängighäufigkeitKirchgangs

0.080.63730.5000

0.6307)(0.41200.6373)(0.5000λ hsymmetrisc

08.066975254

)66284330()66975254(hsymmetrisc

ZI = Zusatzinformation

N = 10509

32

Drittvariablenkontrolle durch Partialkorrelation

Formale Bildung(höchster allgemeinbildender Schulabschluß)

Autoritarismus Extrem rechte Einstellungen

Residuum Residuum

Partialkorrelation

Regressionen

33

Vielen Dank für IhreAufmerksamkeit!

Documents

Methoden der Politikwissenschaft II Weitere Zusammenhangsmaße Siegfried Schumann