View
8
Download
0
Category
Preview:
Citation preview
1
11.3 Zwei-Stichproben-Tests
Zwei-Stichproben-Tests
Wir stellen Tests über die Differenzen von Erwartungswerten, die Differenzen
von Anteilswerten und die Differenzen von Varianzen vor, die in der unten stehen-
den Übersicht aufgeführt sind. Die hier behandelten Tests setzen voraus, dass die
beiden Stichproben unabhängig voneinander entnommen werden.
Übersicht: Arten von Zwei-Stichproben-Tests
Anteilswerte oder
WahrscheinlichkeitenVarianzenErwartungswerte
Doppelter
Gauß-Test
Test von
Welch
F-TestAnteilswert-
differenzentestDoppelter
t-Test
2
Beispiel 11.9:
- In Industriebetrieben erfolgt die Qualitätskontrolle der Erzeugnisse auf Stich-
probenbasis. Im Werk I eines Reifenherstellers wurde eine durchschnittliche
Laufleistung der Reifen von 39.000 km ermittelt, während in Werk II ein Durch-
schnittswert von 40.000 km erreicht wurde. Der Reifenhersteller möchte wissen,
ob auf der Grundlage dieser Stichprobenergebnisse die Hypothese gestützt
wird, dass die Qualität des Produktionsprozesses in beiden Werken gleich ist.
- Eine Stichprobenuntersuchung ergab, dass in einer Stadt A 80 % und in einer
Stadt B 85 % der befragten Haushalte ein Smartphone besitzen. Lässt sich aus
diesen Ergebnissen ableiten, dass der Anteil der Besitzer von Smartphones in
Stadt B höher ist als in der Stadt A?
Null- und Alternativhypothese (zweiseitiger Fall):
211
210
:H
:H
.0:H
0:H
211
210
oder
1: Parameter der 1. Grundgesamtheit
2: Parameter der 2. Grundgesamtheit
3
Test für Erwartungswerte
Varianzen der Grundge-
samtheit bekannt
Varianzen der Grundge-
samtheit unbekannt
Gleiche unbekannte Varian-
zen der Grundgesamtheit
Ungleiche unbekannte Vari-
anzen der Grundgesamtheit
Doppelter Gauß-Test Doppelter T-TestTest von Welch
(Näherungslösung)
Übersicht: Zwei-Stichproben-Tests für Erwartungswerte
Test über die Differenz von Mittelwerten
4
● Doppelter Gauß-Test
1. Schritt Hypothesenformulierung (zweiseitiger Test):
• H0: 1 = 2, H1: 1 2 oder
• H0: 1- 2 = 0, H1: 1- 2 0
2. Schritt Festlegung des Signifikanzniveaus
3. Schritt Prüfgröße und ihre Verteilung:
- bekannte Varianzen
- normalverteilte Grundgesamtheiten oder
- große Stichprobenumfänge (n1>30, n2>30)
4. Schritt Tabellarische Ermittlung des kritischen Wertes:
• zweiseitiger Test: z1-/2
5. Schritt Testentscheidung (zweiseitiger Test):
z0 > z1-/2 H0 ablehnen
z0 z1-/2 H0 beibehalten
2221
21
210
nn
XXZ
22
21 und
)a(
Bei großen Stichproben können die Varianzen der Grundgesamtheit
durch die Stichprobenvarianzen S1² und S2² ersetzt werden.
N(0, 1)
22
21 und
5
Beispiel 11.10:
Ein Marktforschungsinstitut untersucht, ob sich die West- und Ostdeutschen in
ihren Fernsehgewohnheiten unterscheiden.
800 westdeutschen Befragte: durchschn. Fernsehdauer 2 Std.
600 ostdeutsche Befragte: durchschn. Fernsehdauer 1 ½ Std.
Als Standardabweichungen der Fernsehdauer werden 1 Std. (Westdeutsch-
land) und ½ Std. (Ostdeutschland) ermittelt
Zu testen ist, ob zwischen den west- und ostdeutschen Befragten bei der
durchschnittlichen Fernsehdauer signifikante Differenzen bestehen (α = 0,05).
Da der Unterschiede der durchschnittlichen Fernsehdauer zwischen West- und
Ostdeutschland geprüft werden soll, ist ein Mittelwertdifferenzentest bei zwei
unabhängigen Stichproben einzusetzen. Aufgrund der Fragestellung eines
generellen Unterschieds ist ein zweiseitiger Test durchzúführen.
1. Schritt Hypothesenformulierung (zweiseitiger Test):
H0: 1- 2 = 0
H1: 1- 2 0
2. Schritt Festlegung des Signifikanzniveaus: = 0,05
Das Signifikanzniveau beträgt 0,05
6
3. Schritt Wahl und Berechnung der Prüfgröße
- große Stichprobenumfänge (n1=800>30, n2=600>30)
Doppelter Gauß-Test
Mit
erhält man die Prüfgröße
4. Schritt Tabellarische Ermittlung des kritischen Wertes ( = 0,05) :
bei zweiseitigem Test: z0,975 = 1.96
5. Schritt Testentscheidung (zweiseitiger Test):
z0=-12,255 = 12,255 > z0,975 = 1.96 H0 ablehnen
Da sich der in den beiden Stichproben ermittelte Unterschied der
Fernsehdauer zwischen den west- und ostdeutschen Befragten
nicht durch den Stichprobenfehler erklären lässt, kann auf ein unter-
schiedliches Fernsehverhalten in der Bevölkerung der beiden Ge-
biete geschlossen werden.
.255,12
0408,0
5,0
60025,08001
5,22
2221
21
210
nsns
xxz
2,5xund2x
0,25,0,5sund11s
21
222
221
7
● Doppelter t-Test
1. Schritt Hypothesenformulierung (zweiseitiger Test):
• H0: 1 = 2, H1: 1 2 oder
• H0: 1- 2 = 0, H1: 1- 2 0
2. Schritt Festlegung des Signifikanzniveaus
3. Schritt Prüfgröße und ihre Verteilung:
- unbekannte, aber gleich große Varianzen ( )
- normalverteilte Grundgesamtheiten
Anwendung bei kleinem Stichprobenumfang (n130 oder n230)
Prüfgröße:
Gepoolte Varianz:
4. Schritt Tabellarische Ermittlung des kritischen Wertes:
• zweiseitiger Test:
5. Schritt Testentscheidung (zweiseitiger Test):
H0 ablehnen
H0 beibehalten
.
2n
21
21
210 t~
nn
nnS
XXT
2nn
S1nS1nS
21
222
2112
2α12;nn 21t
2α12;nn0 21tt
2α12;nn0 21tt
222
21
σσσ
8
Beispiel 11.11:
Von Kasseler und Göttinger Studenten wurde das Einkommen pro Monat
erhoben. Bei 10 zufällig ausgewählten Kasseler Studierenden ist ein durch-
schnittliches Einkommen von 551 Euro bei einer Varianz von 22.915,111 Euro²
ermittelt worden. In einer Stichprobe von 18 Göttinger Studenten ergab sich ein
Durchschnittseinkommen von 606 Euro bei einer Varianz von 20.836,706 Euro².
Signifikante Unterschiede in den Varianzen der Einkommen ( F-Test auf
Gleichheit der Varianzen) sind hierbei nicht festgestellt worden.
Sind die Stichprobenergebnisse in Übereinstimmung mit der Hypothese, dass
alle Kasseler und alle Göttinger Studierenden ein gleiches Durchschnittseinkom-
men besitzen (α = 0,05)?
Um diese Hypothese zu überprüfen, ist die Differenz der beiden mittleren Ein-
kommen auf Gleichheit zu testen. Aufgrund der niedrigen Stichprobenumfänge
ist anstelle der Standardnormalverteilung die t-Verteilung als Prüfverteilung zu
verwenden. Da keine signifikanten Unterschiede der Stichprobenvarianzen
festgestellt werden konnten, können die Varianzen der beiden Grundgesamt-
heiten als gleich betrachtet werden. Unter Berücksichtigung der Unabhängigkeit
der beiden Stichproben lässt sich die Differenz der durchschnittlichen Einkom-
men mit dem doppelten t-Test überpüfen, der als zweiseitiger Test durchzufüh-
ren ist, da nicht nach einer Richtung gefragt ist.
9
1. Schritt Hypothesenformulierung (zweiseitiger Test):
H0: 1- 2 = 0
H1: 1- 2 0
2. Schritt Festlegung des Signifikanzniveaus: = 0,05
Das Signifikanzniveau beträgt 0,05
3. Schritt Wahl und Berechnung der Prüfgröße
- Varianzen der beiden Grundgesamtheiten unbekannt
- gleich große Varianzen der GG ( )
- kleine Stichprobenumfänge (n1=10<30, n2=18<30)
Doppelter t-Test
Mit
erhält man die gepoolte Varianz
222
21
σσσ
,706,836.20224.35417
1und111,915.22236.206
9
1 22
21
ss
606xund551x 21
,21.556,15426
354.224206.236
21810
20.836,70611822.915,111110
2nn
s1ns1ns
21
222
2112
10
noch 3.
Schritt
und die Prüfgröße
4. Schritt Tabellarische Ermittlung des kritischen Wertes ( = 0,05, zweiseitig):
5. Schritt Testentscheidung (zweiseitiger Test):
H0 annehmen
,0,950
57,907
55
1810
181021.556,154
606551
nn
nns
xxt
21
21
210
2,056ttt 0,97526;20,0512;18102α12;nn 21
2,056t0,950t 0,97526;0
- 2 - 1 0 1 2
0.1
0.2
0.3
0.4
- 2 - 1 0 1 2
0.1
0.2
0.3
0.4
)t(f
t
26t~T0
0,95
0,025
26;975,0t
Annahmebereich [- 2,056;2,056]
0t
0,025
11
● Test von Welch
1. Schritt Hypothesenformulierung (zweiseitiger Test):
• H0: 1 = 2, H1: 1 2 oder
• H0: 1- 2 = 0, H1: 1- 2 0
2. Schritt Festlegung des Signifikanzniveaus
3. Schritt Prüfgröße und ihre Verteilung:
- unbekannte, aber ungleich große Varianzen ( )
- normalverteilte Grundgesamtheiten
Anwendung bei kleinem Stichprobenumfang (n130 oder n230)
Prüfgröße:
Zahl der Freiheitsgrade:
int: Integer-Funktion (ganzzahliger Teil)
mit
.
22
21
σσ
v
2
22
1
21
210 t~
n
S
n
S
XXT
1n
w1
1n
w1intv
2
2
1
2
2
22
1
21
1
21
n
S
n
S
n
Sw
12
4. Schritt Tabellarische Ermittlung des kritischen Wertes:
• zweiseitiger Test:
5. Schritt Testentscheidung (zweiseitiger Test):
H0 ablehnen
H0 beibehalten
.
2α1v;t
2α1v;0 tt
2α1v;0 tt
13
Beispiel 11.12:
Ein Hersteller von Digitalkameras beliefert mit seinen Produkten den Fach-
handel. Da die Fachhändler nicht an die Preisempfehlung des Herstellers
gebunden sind, können die Kamerapreise für die Endkunden differieren. Um
genauere Aussagen über die Preisunterschiede in zwei Verkaufsgebieten zu
erhalten, wurde eine Stichprobenuntersuchung für einen bestimmten
Kameratyp durchgeführt:
Verkaufs-
gebiet
Anzahl der
befragten
Händler
Durchschnitts-
preis (in €)
Standardab-
weichung (in €)
1 22 800 50
2 40 760 30
Die Marktforschungsabteilung wird beauftragt, bei einem Signifikanzniveau
von 5% zu überprüfen, ob sich die durchschnittlichen Endabnehmerpreise in
den Verkaufsgebieten unterscheiden. Dabei wird angenommen, dass die
Preise in den Verkaufsgebieten normalverteilt und die Varianzen in den
Grundgesamtheiten ungleich sind. Damit liegen die Anwendungsvorausset-
zungen des Tests von Welch vor.
14
1. Schritt Hypothesenformulierung (zweiseitiger Test):
H0: 1- 2 = 0
H1: 1- 2 0
2. Schritt Festlegung des Signifikanzniveaus: = 0,05
Das Signifikanzniveau beträgt 0,05
3. Schritt Wahl und Berechnung der Prüfgröße
- Varianzen der beiden Grundgesamtheiten unbekannt
- ungleich große Varianzen der GG ( )
- kleiner Stichprobenmfang n1=22<30 (bei n2=40>30)
Test von Welch
Mit
erhält man die Prüfgröße
22
21
σσ
760,xund800x 21 30sund50s 22
21
3,428
40
30
22
50
760800
n
s
n
s
xxt
22
2
22
1
21
210
15
noch 3.
Schritt
Anzahl der Freiheitsgrade:
mit
4. Schritt Tabellarische Ermittlung des kritischen Wertes ( = 0,05, zweiseitig):
5. Schritt Testentscheidung (zweiseitiger Test):
H0 ablehnen
470,8340
30
22
50
22
50
n
s
n
s
n
sw
222
2
22
1
21
1
21
2952,29int
140
8347,01
122
8347,01int
1
1
11intv
22
2
2
1
2
n
w
n
w
2,045ttt 0,97529;20,05129;;v2α1v;
045,2t428,3t 0,97529;0
16
● Test über die Differenz von Anteilwerten und Wahrscheinlichkeiten
1. Schritt Hypothesenformulierung (zweiseitiger Test):
• H0: p1 = p2, H1: p1 p2 oder
• H0: p1- p2 = 0, H1: p1- p2 0
2. Schritt Festlegung des Signifikanzniveaus
3. Schritt Prüfgröße und ihre Verteilung:
- Bernoulli-verteilte Grundgesamtheiten
- große Stichprobenumfänge
4. Schritt Tabellarische Ermittlung des kritischen Wertes:
• zweiseitiger Test: z1-/2
5. Schritt Testentscheidung (zweiseitiger Test):
z0 > z1-/2 H0 ablehnen
z0 z1-/2 H0 beibehalten
)a( N(0, 1)
21
2211
nn
PnPnP
)nn
nnZ
21
210
()P(1P
PP 21mit
222
111
p1p
9nund
p1p
9n
17
Beispiel 11.13:
Ein Institut hat 1.500 Wahlberechtigte nach ihrer Wahlabsicht befragt. Von den
500 Männern gaben 230 an, CDU/CSU wählen zu wollen. Bei den Frauen
präferierten 430 von 1000 die CDU/CSU.
Unterscheiden sich beiden Wähleranteile der männlichen und weiblichen
Befragten bei einer Irrtumswahrscheinlichkeit von 1% signifikant voneinander?
Da die beiden Anteile aus zwei Stichproben stammen, die aufgrund der Unab-
hängigkeitsannahme im Hinblick auf die Auswahl der Stichprobenelemente
selbst als unabhängig voneinander betrachtet werden können, ist der Test über
die Differenz von Anteilswerten einzusetzen. Die Anwendbarkeit Normal-
approximation ist hierzu zu prüfen. Da generell nach einem signifikanten Unter-
schied gefragt ist, nicht jedoch nach der seiner Richtung, ist der Test zweiseitig
durchzuführen.
1.
Schritt1
Hypothesenformulierung (zweiseitiger Test):
H0: p1- p2 = 0
H1: p1- p2 0
2. Schritt Festlegung des Signifikanzniveaus: = 0,01
Das Signifikanzniveau beträgt 0,01
18
3. Schritt Wahl und Berechnung der Prüfgröße
- Bernoulli-verteilte Grundgesamtheiten
- große Stichprobenumfänge
Test über die Differenz von Anteilswerten (Normalapproximation)
Gepoolter Stichprobenanteilswert:
Wert der Prüfgröße:
46,0
500
230pmit2,36
0,540,46
9
p1p
9500n 1
111
43,0
1000
430pmit7,36
0,570,43
9
p1p
91000n 2
222
0,441000500
0,4610000,46500
nn
pnpnp
21
2211
1029,10272,0
03,0
1000500
100050056,044,0
43,046,00
z
19
4. Schritt Tabellarische Ermittlung des kritischen Wertes ( = 0,01) :
bei zweiseitigem Test: z0,995 = 2,5758
5. Schritt Testentscheidung (zweiseitiger Test):
z0=1,1029 < z0,995 = 2,5758 H0 beibehalten
F-Verteilung
Es seien 2v1
und 2v2
zwei unabhängige 2 -verteilte Zufallsvariablen mit v1
und v2 Freiheitsgraden. Dann ist das Verhältnis
222
121
v
vF
F-verteilt mit v1 und v2 Freiheitsgraden.
□
f(f)
f
Exkurs: F-Verteilung
21
● F-Test auf Gleichheit von Varianzen
1. Schritt Hypothesenformulierung (einseitiger Test):
• H0: =
• H1: > (rechtsseitiger Test)
2. Schritt Festlegung des Signifikanzniveaus
3. Schritt Prüfgröße und ihre Verteilung:
- normalverteilte Grundgesamtheiten
- Mittelwerte 1 und 2 unbekannt
Prüfgröße:
n1-1: Freiheitsgrade des Zählers, n2-1: Freiheitsgrade des Nenners
4. Schritt Tabellarische Ermittlung des kritischen Wertes:
• rechtsseitiger Test:
5. Schritt Testentscheidung (rechtsseitiger Test):
H0 ablehnen
H0 beibehalten
.
21
22
21
22
²s²smitF~²S
²SF
2121
2
1
1n1,n0
α-1,1n1,n 21F
α-1;1n1,n0 21Ff
α-1,1n1,n0 21Ff
22
Beispiel 11.14:
Ein deutscher Automobilhersteller möchte prüfen, ob es lohnend sein könnte,
in seinem chinesischen Werk die bisherige Fließbandproduktion auf eine
Gruppenfertigung umzustellen. Hierzu ist die Arbeitsproduktivtät für beide
Arten der Produktion gemessen worden:
Produktions-
verfahren
Anzahl
Arbeitstage
mittlere Arbeits-
produktivität
Standard-
abweichung
Fließband 121 280 20
Team 61 290 30
Nicht nur soll ein Vergleich der durchschnittlichen Arbeitsproduktivität bei
beiden Produktionsverfahren vorgenommen werden. Vorab soll überprüft
werden, ob von einer Varianzhomogenität ausgegangen werden kann
oder nicht. Vermutet wird, dass aufgrund der notwendigen Eingewöh-
nungsphase der Arbeitnehmer die Varianz bei der Teamproduktion die
Varianz bei der Fließbandfertigung übersteigt.
51
23
1. Schritt Hypothesenformulierung (rechtsseitiger Test):
2. Schritt Festlegung des Signifikanzniveaus: = 0,05
Das Signifikanzniveau beträgt 0,05
3. Schritt Prüfgröße und ihre Verteilung:
- Annahme normalverteilter Grundgesamtheiten
- Mittelwerte 1 und 2 unbekannt
F-Test auf Gleichheit der Varianzen
Stichprobenumfänge: n1=121 und n2=51
Prüfgröße:
Berechnung der Prüfgröße:
1n1,n012
1
2 F~²S
²SF
2,2520
30
s
sf
2
2
21
22
0
24
4. Schritt Tabellarische Ermittlung des kritischen Wertes:
Stichprobenumfänge: n1=121 und n2=51
• rechtsseitiger Test:
5. Schritt Testentscheidung (rechtsseitiger Test):
H0 ablehnen
46,1FF 550;120;0,9α-1;1n1;n12
46,1F25,2f 0;120;0,9550
=0,05
f50;120;0,95
=1,46
1-
=0,95
f0=2,25
Recommended