Upload
max-brandt
View
218
Download
0
Embed Size (px)
Citation preview
Methoden der Politikwissenschaft II
Weitere Zusammenhangsmaße
Siegfried Schumann
2
Phi-Koeffizient: Alternative Berechnungsart
Auto Puppe ΣJungen a b 50Mädchen
c d 50
Σ 60 40 100
Auto Puppe ΣJungen 35 15 50Mädchen
25 25 50
Σ 60 40 100
ad – bc√ (a+b) (c+d) (a+c) (b+d)
ad – bc√ (35+15) (25+25) (35+25) (15+25)
= 0.204124
(nach Clauß u.a. 1994: 82-83; 294-295)
3
Phi-Koeffizient: Bekannte Berechnungsart (Aufgabe)
observed - expectedAuto Puppe Σ
Jungen 5 -5 50Mädchen
-5 5 50
Σ 60 40 100
expectedAuto Puppe Σ
Jungen 30 20 50Mädchen
30 20 50
Σ 60 40 100
(observed – expected)2
Auto Puppe ΣJungen 25 25 50Mädchen
25 25 50
Σ 60 40 100
(observed – expected)2 / expected
Auto Puppe ΣJungen 0.83 1.25 50Mädchen
0.83 1.25 50
Σ 60 40 100Σ= 4.16; Φ = √ 4.16 / 100
= 0.204124
4
Beispiele für Werte 1, -1 und 0:
Φ = -1Auto Puppe Σ
Jungen 0 60 60Mädchen
40 0 40
Σ 40 60 100
Φ = 1Auto Puppe Σ
Jungen 60 0 60Mädchen
0 40 40
Σ 60 40 100
Φ = 0 (Beispiel 1)Auto Puppe Σ
Jungen 30 20 50Mädchen
30 20 50
Σ 60 40 100
Φ = 0 (Beispiel 2)Auto Puppe Σ
Jungen 15 10 25Mädchen
45 30 75
Σ 60 40 100„expected“ aus vorherigem Beispiel!
5
Phi-Koeffizient: Signifikanzprüfung (Beispiel)
• Voraussetzung: Erwartete absolute Häufigkeiten in der Indifferenztabelle > 5
• Hypothesen: H0: ρxy = 0H1: ρxy ≠ 0
• Signifikanzniveau festlegen: α = 0.01
• Prüfgröße: χ2 =
• Berechnung: χ2 = = 4.17
• Kritischer Wert χ2(α=0.01; df=1) = ?
N · (ad – bc)2
(a+b) (c+d) (a+c) (b+d)
100 · (35 · 25 – 15 · 25)2
50 · 50 · 60 · 40
6
Chi-Quadrat-Verteilungen
aus: Bortz 2005: 80
1 %
99 %
krit. Wert
7
Kritische Werte der Chi-Quadrat-Verteilung
α
f 0.10 0.05 0.01 0.001
1 2.71 3.84 6.64 10.8 2 4.61 5.99 9.21 13.8 3 6.25 7.81 11.3 16.3 4 7.78 9.49 13.3 18.5 5 9.24 11.1 15.1 20.5 6 10.6 12.6 16.8 22.5 7 12.0 14.1 18.5 24.3 8 13.4 15.5 20.1 26.1 9 14.7 16.9 21.7 27.9
10 16.0 18.3 23.2 29.6 11 17.3 19.7 24.7 31.3 12 18.5 21.0 26.2 32.9
.. .. .. .. ..
.. .. .. .. .. 70 85.5 90.5 100.4 112.3 75 91.1 96.2 106.4 118.6 80 96.6 101.9 112.3 124.8 85 102.1 107.5 118.2 131.0 90 107.6 113.1 124.1 137.2 95 113.0 118.8 130.0 143.3
100 118.5 124.3 135.8 149.4
Empirischer Chi-Quadrat Wert(Prüfgröße)Im Beispiel: 4.17Bei: α = 0.01
Zusatzbeispiel
Kritischer (Chi-Quadrat-) Wert
4.17 < 6.64 → nicht signifikant
8
Kontingenzkoeffizient: Berechnung
χ2 = 2.036
VorgehenStrategie
1Strategie
2Strategie
3Strategie 4 Σ
Instruktionfrei 6 3 3 4 16Regel 1 5 5 4 2 16Regel 2 2 3 2 1 8
Σ 13 11 9 7 40
nχχC 2
2
(nach Clauß u.a. 1994: 85-87; 295-297)
= 0.22 df.: 6
9
Kontingenzkoeffizient: Signifikanzprüfung
• Voraussetzung: Erwartete absolute Häufigkeiten in der Indifferenztabelle > 5
• Hypothesen: H0: ρxy = 0H1: ρxy ≠ 0
• Signifikanzniveau festlegen: α = 0.01
• Prüfgröße: χ2 = 2.036
• Kritischer Wert χ2(α=0.01; df=6) = 16.8
• 2.036 < 16.8; → nicht signifikant
Kritischer (Chi-Quadrat-) Wert
10
Korrelationsanalyse
Interpretation des Korrelationskoeffizienten rxy
– direkt interpretierbare Werte: +1, 0, -1
– Regressionskoeffizient bei z-standardisierten Werten
– geometrische Interpretation
– geometrisches Mittel zweier „zusammengehöriger“ Regressionskoeffizienten
– Wurzel aus „Bestimmtheitsmaß“ plus Vorzeichen des Regressionskoeffizienten
– Quadrat: Gemeinsame Varianz der beiden Variablenrxy ±.0
0±.10
±20
±.30
±.40
±.50
±.60
±.70
±.80
±.90
± 1
rxy2
.00 .01 .04 .09 .16 .25 .36 .49 .64 .81 1.00
11
Geometrische Interpretation (1)
aus: Krämer 1994: 135
12
Geometrische Interpretation (2)
aus: Krämer 1994: 138
13
Geometrische Interpretation (3)
aus: Krämer 1994: 140
14
Formeln zur Berechnung von rxy
yx
xy SAQSAQSAPr
yx
xyxy ss
sr
s SAPn
s SAQn
sSAQ
nxy xx
yy ; ;mit:
15
Signifikanzprüfung für H0: ρxy = 0 (Beispiel)
• Voraussetzungen: metrische Daten mit (annähernd) Normalverteilung; n ≥ 10
• Hypothesen i.d.R.: H0: ρxy = 0 (Abweichung: s. Seite 300 Mitte, 301 unten - 302 oben, 364, 441) H1: ρxy ≠ 0
• Signifikanzniveau festlegen: α = 0.01
• Prüfgröße: r hier: r = 0.713 (Korrelationskoeffizient)
• Freiheitsgrade (df.) ermitteln: N – 2 hier: 10 – 2 = 8
• Zufallshöchstwert (kritischen Wert) r(α; N-2) ermitteln: Zufallshöchstwert von r für α = 0.01: bei df. = 5: 0.87 bei df. = 10: 0.71 bei df. = 8: 0.774 (Interpolation; Tafel 8, S. 381)
• 0.713 < 0.774; → nicht signifikant (nach Clauß u.a. 1994: 299-301; 381)
16
Zufallshöchstwert von r + lineare Interpolation
df = 5 df = 8 df = 10
0.87 ? 0.71
3/5 der Differenz 2/5 der Differenz
Differenz: 0.16
2/5 ∙ 0.16 = 0.064
0.71 + 0.064 = 0.774
Tabellenwert für df = 8 ?
Tafel 8 aus Clauß u.a. 1994: 381
!
17
Signifikanzprüfung für H0: ρxy ≠ 0 (Beispiel)
• Voraussetzungen: metrische Daten mit (annähernd) Normalverteilung; n ≥ 10 • Hypothese z.B.: H0: ρxy = 0.9500
H1: ρxy ≠ 0.9500• Signifikanzniveau festlegen: α = 0.05• Fisher´sche z-Transformation für Korrelationskoeffizienten
empirisch auftretender Koeffizient: r = 0.9882 → z = 2.5634 Koeffizient gemäß H0: ρxy= 0.9500 → z0 = 1.8318 (Werte grob aus Tafel 24 auf S. 441 ablesbar)
• t-verteilte Prüfgröße: hier: 1.9356 (bei n = 10)
• Wenn Prüfgröße ≥ t(α; N-2), dann ist H0 abzulehnen.• Freiheitsgrade (df.): N – 2 (hier: 10 – 2 = 8) • t(0.05; 8) = 2.31 (t-Verteilung aus Tabelle 4, S. 364)
• 1.9356 < 2.31; → nicht signifikant
r1r1ln
21z
3Nzz 0
(nach Clauß u.a. 1994: 300 Mitte, 301 unten – 302 oben, 364, 441)
(aus: Bleymüller u.a. 1992: 63)
18
Tabelle zur Umrechnung: r → z
Tafel 24 aus Clauß u.a. 1994: 441
Differenz der r-Werte aus der Tabelle: 0.95080 -0.94983 = 0.00097
z-Wert für r = 0.95 ?
z-Wert für r = 0.94983: 1.83 z-Wert für r = 0.95080: 1.84
Differenz der r-Werte „0.95“ und „0.94983: 0.95000 -0.94983 = 0.00017
1.83 + (0.00017 / 0.00097 ∙ 0.01) = 1.83175
Differenz der z-Werte: 1.84 – 1.83 = 0.01
19
Wdh: Signifikanzprüfung für H0: ρxy ≠ 0 (Beispiel)
• Voraussetzungen: metrische Daten mit (annähernd) Normalverteilung; n ≥ 10 • Hypothese z.B.: H0: ρxy = 0.9500
H1: ρxy ≠ 0.9500• Signifikanzniveau festlegen: α = 0.05• Fisher´sche z-Transformation für Korrelationskoeffizienten
empirisch auftretender Koeffizient: r = 0.9882 → z = 2.5634 Koeffizient gemäß H0: ρxy= 0.9500 → z0 = 1.8318 (Werte grob aus Tafel 24 auf S. 441 ablesbar)
• t-verteilte Prüfgröße: hier: 1.9356 (bei n = 10)
• Wenn Prüfgröße ≥ t(α; N-2), dann ist H0 abzulehnen.• Freiheitsgrade (df.): N – 2 (hier: 10 – 2 = 8) • t(0.05; 8) = 2.31 (t-Verteilung aus Tabelle 4, S. 364)
• 1.9356 < 2.31; → nicht signifikant
r1r1ln
21z
3Nzz 0
(nach Clauß u.a. 1994: 300 Mitte, 301 unten – 302 oben, 364, 441)
(aus: Bleymüller u.a. 1992: 63)
20
Kritische Werte der t-Verteilung
Tafel 4 aus: Clauß u.a. 1994: 364-365
→ SNV
21
Sonderfälle beim Kontingenzkoeffizienten
• Punktbiserialer Koeffizient rpbis
(Zweizeilenkoeffizient)– Variable X alternativ (dichotom)– Variable Y metrisch + normalverteilt
• Beispiel: Körpergrößen in cm
• falls Variable X ebenfalls normalverteilt:
biserialer Koeffizient rbis (→ Lieraturverweis!)
2
1121
21pbis f
fs
xxoderffs
xxr
155
160
165
170
175
180
185
n
Männer 3 3 11 15 19 21 12 84Frauen 17 21 16 15 11 4 2 86
AM Männer: 174.2 cmAM Frauen: 165.1 cmAM insgesamt: 169.6 cm
SD aller Werte: 9.09 cm
rpbis = 0.50 nach Clauß u.a. 1994: 87/88
f1 / f2: relative Häufigkeiten!
(84 / 170 bzw. 86 / 170)
22
Rangkorrelationskoeffizient R (Spearman)
• Daten: zwei Rangreihen ohne Bindungen
•
• Beispiel: Rainer Horst Klaus Mario Peter Tilo Σ
Leistung 1 2 3 4 5 6 21 Sympathie 2 3 1 4 6 5 21
di (absolut) 1 1 2 0 1 1 di
2 1 1 4 0 1 1 8•
• Interpretation der Werte: +1: zwei identische Rangreihen -1: zwei gegenläufige Rangreihen Vorzeichen: zeigt die Richtung des Zusammenhangs
• Vorteil: leicht zu berechnen• Nachteil: Zwischen den Rangplätzen werden gleiche Abstände unterstellt (aus r
ableitbar!) Abhilfe: Rangkorrelationskoeffizient τ (Tau) berechnen (aber: aufwendiger)
1)(nn
d61R 2
2i
77.01)(366
861R
später!
23
Signifikanzprüfung für R (Beispiel), Rkorr oder Rg
• Voraussetzungen: ordinale Daten; n ≥ 6
• Hypothesen: H0: ρxy = 0 H1: ρxy ≠ 0
• Signifikanzniveau festlegen: hier: α = 0.01
• Prüfgröße: Rangkorrelationskoeffizient (R, Rkorr oder Rg) hier: R = 0.77 • Für N ≤ 30: Wenn ≥ R(α; N) (lt. Tafel 18), dann ist H0 abzulehnen.
Für N > 30: Wenn ≥ r(α; N-2) (lt. Tafel 8), dann ist H0 abzulehnen.
• Im Beispiel: n = 6R(0.01; 6) = 1.00 (nach Tafel 18)
< 1.00; → nicht signifikant
Prüfgröße
(nach Clauß u.a. 1994: 88-89, 297-298, 381, 435)
Prüfgröße
0.77
siehe oben!
24
Kritische Werte Rα;N für den Rangkorr.koeffizienten
Tafel 18 aus Clauß u.a. 1994: 435
R(0.01; 6) = 1.00
25
Rangkorrelationskoeffizient Tau (Kendall) - Beispiel
• Vier Objekte (O) werden von 2 Gutachtern (A und B) beurteilt (Rangfolge)O1 O2 O3 O4
Rangfolge von Gutachter A: 3 4 2 1Rangfolge von Gutachter B: 3 1 4 2
• Bestimmung von Konkordanzen (Wert: „1“) und Diskordanzen (Wert: -1):O1-O2: -1; O1-O3: -1; O1-O4: +1; O2-O3: -1; O2-O4: -1; O3-O4: +1Summe der Diskordanzen (Vertauschungen): nd = 4
• Kendall-Summe: Maximum bei nd = 0, d.h.
• Normierung, um Werte zwischen „-1“ und „+1“ zu erhalten:
• Im Beispiel: Achtung: Keine Bindungen! nur monotoner Zusammenhangsanteil!
dn22
1)(nnS
21)(nnSmax
1)(nnn41
SSτ d
max
0.333312
44162-τ
(nach Hochstädter 1991: 158-161)
n = Anzahl d. Beobachtungspaare; hier: 4
Anzahl der Paarvergleiche
26
Eta → Varianzanalyse
Beispiel: Sympathie für den Papst x Konfession
andere Konfesions- Katholiken Protestanten Konfessionen lose
insgesamtSAQSAQerklärteEta
27
λ-Maßzahlen für den Zusammenhangzwischen
zwei diskreten Variablen
28
Beispiel zur Konstruktion von λ-Maßzahlen
Anordnung innerhalb der Zellen: observed expected (observed – expected) (observed – expected)2 (observed – expected)2 / expected
Kirchgangshäufigkeit:
Konfession:
(fast) jeden Sonntag
ab und zu
etwa einmal im Jahr
seltener
SUMME
↓ katholisch
1391 936.9 454.1
206206.8 220.1
1800 1846.7
-46.7 2180.9
1.2
478 625.4
-147.4 21726.8
34.7
1422 1682.0 -260.0
67600.0 40.2
5091
evangelisch
467 967.1
-500.1 250100.0
258.6
1980 1906.2
73.8 5446.4
2.9
803 645.6 157.4
24774.8 38.4
2005 1736.2
268.8 72253.4
41.6
5255
andere Konfession oder konfessionslos
76 30.0 46.0
2116.0 70.5
32 59.1
-27.1 734.4
12.4
10 20.0
-10.0 100.0
5.0
45 53.9 -8.9 79.2 1.5
163
SUMME 1934 3812 1291 3472 10509
Empirischer Chi-Quadrat-Wert: 727.1
29
Berechnung der λ-Maßzahlen
18.05000.0
4120.05000.0abhängigKonfession
18.05254
43305254abhängigKonfession
ZIohne
ZImitZIohne
keitscheinlichFehlerwahrkeitscheinlichFehlerwahrkeitscheinlichFehlerwahr
01.06373.0
6307.06373.0abhängighäufigkeitKirchgangs
01.06697
66286697abhängighäufigkeitKirchgangs
0.080.63730.5000
0.6307)(0.41200.6373)(0.5000λ hsymmetrisc
08.066975254
)66284330()66975254(hsymmetrisc
ZI = Zusatzinformation
30
Beispiel zur Konstruktion von λ-Maßzahlen
Anordnung innerhalb der Zellen: observed expected (observed – expected) (observed – expected)2 (observed – expected)2 / expected
Kirchgangshäufigkeit:
Konfession:
(fast) jeden Sonntag
ab und zu
etwa einmal im Jahr
seltener
SUMME
↓ katholisch
1391 936.9 454.1
206206.8 220.1
1800 1846.7
-46.7 2180.9
1.2
478 625.4
-147.4 21726.8
34.7
1422 1682.0 -260.0
67600.0 40.2
5091
evangelisch
467 967.1
-500.1 250100.0
258.6
1980 1906.2
73.8 5446.4
2.9
803 645.6 157.4
24774.8 38.4
2005 1736.2
268.8 72253.4
41.6
5255
andere Konfession oder konfessionslos
76 30.0 46.0
2116.0 70.5
32 59.1
-27.1 734.4
12.4
10 20.0
-10.0 100.0
5.0
45 53.9 -8.9 79.2 1.5
163
SUMME 1934 3812 1291 3472 10509
52544330
31
Berechnung der λ-Maßzahlen
18.05000.0
4120.05000.0abhängigKonfession
18.05254
43305254abhängigKonfession
ZIohne
ZImitZIohne
keitscheinlichFehlerwahrkeitscheinlichFehlerwahrkeitscheinlichFehlerwahr
01.06373.0
6307.06373.0abhängighäufigkeitKirchgangs
01.06697
66286697abhängighäufigkeitKirchgangs
0.080.63730.5000
0.6307)(0.41200.6373)(0.5000λ hsymmetrisc
08.066975254
)66284330()66975254(hsymmetrisc
ZI = Zusatzinformation
N = 10509
32
Drittvariablenkontrolle durch Partialkorrelation
Formale Bildung(höchster allgemeinbildender Schulabschluß)
Autoritarismus Extrem rechte Einstellungen
Residuum Residuum
Partialkorrelation
Regressionen
33
Vielen Dank für IhreAufmerksamkeit!