23
Einführung in die Methoden der empirischen Sozialforschung Fribourg, 3. Mai 2005 Masse der zentralen Tendenz Horst Biedermann Departement Erziehungswissenschaften, Universität Fribourg Forschungsmethoden

Einführung in die Methoden der empirischen Sozialforschung Fribourg, 3. Mai 2005 Masse der zentralen Tendenz Horst Biedermann Departement Erziehungswissenschaften,

Embed Size (px)

Citation preview

Page 1: Einführung in die Methoden der empirischen Sozialforschung Fribourg, 3. Mai 2005 Masse der zentralen Tendenz Horst Biedermann Departement Erziehungswissenschaften,

Ein

führu

ng in d

ie M

eth

oden d

er

em

pir

isch

en S

ozi

alfors

chung

Fri

bourg

, 3

. M

ai 2

00

5

Masse der zentralen Tendenz

Horst BiedermannDepartement

Erziehungswissenschaften, Universität Fribourg

Forschungsmethoden

Page 2: Einführung in die Methoden der empirischen Sozialforschung Fribourg, 3. Mai 2005 Masse der zentralen Tendenz Horst Biedermann Departement Erziehungswissenschaften,

Ein

führu

ng in d

ie M

eth

oden d

er

em

pir

isch

en S

ozi

alfors

chung

Fri

bourg

, 3

. M

ai 2

00

5Deskriptive vs. Inferenz-Statistik

Deskriptive Statistik

Beschreibung von Daten mit Hilfe statistischer Kennwerte: anhand der Masse der zentralen Tendenz (Masse der „Mitte“) und der Dispersion (Variabilität)

beschreibende Statistik

Schliessende Statistik (Inferenzstatistik)

Beurteilung von Daten, ob sie den Hypothesen entsprechen: Schätzen von Parametern und Berechnung statistischer Signifikanz

schlussfolgernde Statistik

Page 3: Einführung in die Methoden der empirischen Sozialforschung Fribourg, 3. Mai 2005 Masse der zentralen Tendenz Horst Biedermann Departement Erziehungswissenschaften,

Ein

führu

ng in d

ie M

eth

oden d

er

em

pir

isch

en S

ozi

alfors

chung

Fri

bourg

, 3

. M

ai 2

00

5Häufigkeiten

Geschlecht der Teilnehmenden an der Veranstaltung „Einführung in die Methoden der empirischen Sozialforschung im SS 2005

Kategorie f (x) cumf(x) % cum%

weiblich 18 18 85,7 82,1

männlich 3 21 14,3 100,0

Total 21 100.0

absoluteHäufigkeite

n

kumulierteabsolute

Häufigkeiten

relativeHäufigkeiten in Prozent

kum. relative

Häufigkeiten in Prozent

Page 4: Einführung in die Methoden der empirischen Sozialforschung Fribourg, 3. Mai 2005 Masse der zentralen Tendenz Horst Biedermann Departement Erziehungswissenschaften,

Ein

führu

ng in d

ie M

eth

oden d

er

em

pir

isch

en S

ozi

alfors

chung

Fri

bourg

, 3

. M

ai 2

00

5Kategorien

Beispiel: „12 Minutenlauf“ im Rahmen eines Fitnesstests

2000 m ≤ x ≤ 2250 m 2250 m ≤ x ≤ 2500 m ... 3750 m ≤ x ≤ 4000 m

Vorteil übersichtliche Anzahl an Kategorien, innerhalb derer die

Anzahl der zugehörigen Fälle zusammengefasst wirdNachteil Reduktion der Informationen

Problem: sehr viele Merkmalsausprägungen

Lösung: Zusammenfassung der beobachteten Daten aus bestimmten Wertbereichen zu Gruppen bzw. Kategorien

Page 5: Einführung in die Methoden der empirischen Sozialforschung Fribourg, 3. Mai 2005 Masse der zentralen Tendenz Horst Biedermann Departement Erziehungswissenschaften,

Ein

führu

ng in d

ie M

eth

oden d

er

em

pir

isch

en S

ozi

alfors

chung

Fri

bourg

, 3

. M

ai 2

00

5Kategorien: Breite und Anzahl

Regeln zur Kategorienbreite und –anzahl:

Ausschliesslichkeit der Kategorien (disjunkt) jedes beobachtete Ereignis (bzw. jeder Wert kann nur

einer Kategorie zugeordnet werden Benachbarte Konzipierung der Kategorien

es darf keine „Lücke“ zwischen zwei Kategorien entstehen, in der ein Wert liegen könnte

(geschlossene) Kategorien müssen gleich breit sein

Sinnvolle Anzahl zu bildender Kategorien Faustregel: m = 1 + 3.32 x lg (N) m = Kategorien

N = Versuchspersonen maximale Anzahl an Kategorien = 20

Offene Kategorien bei Ausreissern und Extremwerten eine offene Kategorie hat keine obere oder untere Grenze

(z.B. x ≤ 300)

Page 6: Einführung in die Methoden der empirischen Sozialforschung Fribourg, 3. Mai 2005 Masse der zentralen Tendenz Horst Biedermann Departement Erziehungswissenschaften,

Ein

führu

ng in d

ie M

eth

oden d

er

em

pir

isch

en S

ozi

alfors

chung

Fri

bourg

, 3

. M

ai 2

00

5Masse der zentralen Tendenz

Drei Kennwerte (Masse), die bestimmte Eigenschaften von Daten zusammenfassen und beschreiben. Damit können auch verschiedene Stichproben miteinander verglichen werden.

Modus / Modalwert Wert, der am häufigsten vorkommt

Median / ZentralwertWert, der in der Mitte der Verteilung liegt und diese halbiert

Arithmetisches Mittel / MittelwertDurchschnittlicher Wert einer VerteilungAchtung: jedes Mass setzt bestimmte Mindestanforderungen an das Skalenniveau voraus!

Page 7: Einführung in die Methoden der empirischen Sozialforschung Fribourg, 3. Mai 2005 Masse der zentralen Tendenz Horst Biedermann Departement Erziehungswissenschaften,

Ein

führu

ng in d

ie M

eth

oden d

er

em

pir

isch

en S

ozi

alfors

chung

Fri

bourg

, 3

. M

ai 2

00

5Modus / Modalwert

DefinitionDer Modalwert (Mo) ist derjenige Wert einer Verteilung, welcher am häufigsten besetzt ist.

Vorteil sehr stabil gegenüber Extremwerten

Voraussetzungen auf allen Skalenniveaus berechenbar

Achtung: es können mehrere Modalwerte vorherrschen bimodal = zwei Modalwerte multimodal = mehr als zwei Modalwerte in solchen Fällen geben gewisse Statistikprogramme (z. B. SPSS) nur den kleinsten dieser Werte und eine zusätzliche Warnung aus

Page 8: Einführung in die Methoden der empirischen Sozialforschung Fribourg, 3. Mai 2005 Masse der zentralen Tendenz Horst Biedermann Departement Erziehungswissenschaften,

Ein

führu

ng in d

ie M

eth

oden d

er

em

pir

isch

en S

ozi

alfors

chung

Fri

bourg

, 3

. M

ai 2

00

5Modus / Modalwert: Beispiel

0

1 1

2 2

1

3

2

1 1

0

1

2

3

4

1 2 3 4 5 6 7 8 9 10

Punkte im Test

Häufi

gkeit

en

Beispiel: Test mit maximal 10 Punkten (n=14)

2, 3, 4, 4, 5, 5, 6, 7, 7, 7, 8, 8, 9, 10

Modalwert:

Mo = 7

Page 9: Einführung in die Methoden der empirischen Sozialforschung Fribourg, 3. Mai 2005 Masse der zentralen Tendenz Horst Biedermann Departement Erziehungswissenschaften,

Ein

führu

ng in d

ie M

eth

oden d

er

em

pir

isch

en S

ozi

alfors

chung

Fri

bourg

, 3

. M

ai 2

00

5Median / Zentralwert

DefinitionDer Median (Md) ist derjenige Wert der die geordnete Reihe der Messwerte in die oberen und unteren 50 Prozent aufteilt. Somit ist die Anzahl der Messwerte über und unter dem Median gleich.

Vorteil ebenfalls sehr stabil gegenüber Extremwerten

Voraussetzung mindestens Ordinalskalenniveau

Berechnung- Für ungerades N: Md = x Wert (x) von Person

- Für gerades N: Md = x + x

- Für grupp. Daten: Md = untere Grenze fk +. Kat.breite

N + 12

2 N2

N2

N2

+1

N + 12

- cum fk-1

fk

Page 10: Einführung in die Methoden der empirischen Sozialforschung Fribourg, 3. Mai 2005 Masse der zentralen Tendenz Horst Biedermann Departement Erziehungswissenschaften,

Ein

führu

ng in d

ie M

eth

oden d

er

em

pir

isch

en S

ozi

alfors

chung

Fri

bourg

, 3

. M

ai 2

00

5Median / Zentralwert: Beispiel

Medianbestimmung bei ungerader Anzahl Werte:

4 7 9 13 17Md = 9

Medianbestimmung bei gerader Anzahl Werte:

4 7 9 13 17 30Md = (9+13) / 2 = 11

Drei Beobachtungen haben einen kleineren, drei einen grösseren Wert als der Median angibt (Wert existiert nicht in den Daten).

Page 11: Einführung in die Methoden der empirischen Sozialforschung Fribourg, 3. Mai 2005 Masse der zentralen Tendenz Horst Biedermann Departement Erziehungswissenschaften,

Ein

führu

ng in d

ie M

eth

oden d

er

em

pir

isch

en S

ozi

alfors

chung

Fri

bourg

, 3

. M

ai 2

00

5Arithmetisches Mittel

DefinitionDer arithmetische Mittel (μ bzw. x, AM) ist die Summe aller Messwerte geteilt durch deren Anzahl N. Durchschnitt aller Messwerte

Nachteil empfindlich gegenüber Extremwerten

Voraussetzung mindestens Intervallskalenniveau

Berechnung

n

i

i

n

xnn

xxxx

1

121

Summe aller WerteAM = x = Gesamtanzahl (n)

Page 12: Einführung in die Methoden der empirischen Sozialforschung Fribourg, 3. Mai 2005 Masse der zentralen Tendenz Horst Biedermann Departement Erziehungswissenschaften,

Ein

führu

ng in d

ie M

eth

oden d

er

em

pir

isch

en S

ozi

alfors

chung

Fri

bourg

, 3

. M

ai 2

00

5

 

Drei Masse der zentralen Tendenz

Page 13: Einführung in die Methoden der empirischen Sozialforschung Fribourg, 3. Mai 2005 Masse der zentralen Tendenz Horst Biedermann Departement Erziehungswissenschaften,

Ein

führu

ng in d

ie M

eth

oden d

er

em

pir

isch

en S

ozi

alfors

chung

Fri

bourg

, 3

. M

ai 2

00

5

AM, Mo und Md bei verschiedenen Verteilungsformen Modalwert, Median und arithmetisches Mittel hängen von der Verteilungsform ab.

Page 14: Einführung in die Methoden der empirischen Sozialforschung Fribourg, 3. Mai 2005 Masse der zentralen Tendenz Horst Biedermann Departement Erziehungswissenschaften,

Ein

führu

ng in d

ie M

eth

oden d

er

em

pir

isch

en S

ozi

alfors

chung

Fri

bourg

, 3

. M

ai 2

00

5Wie verteilen sich die Daten?

Page 15: Einführung in die Methoden der empirischen Sozialforschung Fribourg, 3. Mai 2005 Masse der zentralen Tendenz Horst Biedermann Departement Erziehungswissenschaften,

Ein

führu

ng in d

ie M

eth

oden d

er

em

pir

isch

en S

ozi

alfors

chung

Fri

bourg

, 3

. M

ai 2

00

5

 

Masse der Dispersion

Variationsbreite (Range, Spannweite)

Quartile, Interquartilsabstand (Perzentile)

AD-Streuung („average deviation“)

Varianz

Standardabweichung (standard deviation)

Die Masse der Dispersion beschreiben die Variabilität bzw. Streuung der beobachteten Werte.

Page 16: Einführung in die Methoden der empirischen Sozialforschung Fribourg, 3. Mai 2005 Masse der zentralen Tendenz Horst Biedermann Departement Erziehungswissenschaften,

Ein

führu

ng in d

ie M

eth

oden d

er

em

pir

isch

en S

ozi

alfors

chung

Fri

bourg

, 3

. M

ai 2

00

5

Variationsbreite (Range, Spannweite)

DefinitionDie Spannweite bzw. der Range beschreibt bei kontinuierlichen Daten die Grösse des Intervalls, in welchem die unterschiedlichen Werte einer Variable lieben. Bei nominalskalierten Variablen gibt der Range die Anzahl der Kategorien an.

Nachteile bei kontinuierlichen Daten werden nur die minimalsten und maximalsten Messwerte berücksichtigt sehr empfindlich gegenüber Extremwerten / Ausreissern

daher werden oft Extremwerte weggelassen (z.B. statt Spannweite nur mittlere 90 Prozent darstellen)

Berechnung- kontinuierliche Daten: Range = maximaler Wert – minimaler Wert- diskrete Daten (d.h. aus getrennten Einheiten bestehende Daten wie z.B. Kategorien):

Range = maximaler Wert – minimaler Wert +1

Page 17: Einführung in die Methoden der empirischen Sozialforschung Fribourg, 3. Mai 2005 Masse der zentralen Tendenz Horst Biedermann Departement Erziehungswissenschaften,

Ein

führu

ng in d

ie M

eth

oden d

er

em

pir

isch

en S

ozi

alfors

chung

Fri

bourg

, 3

. M

ai 2

00

5

Perzentile, Quartile, Interquartilabstand

DefinitionDie Perzentile teilen die Datenverteilung in mehrere Teile (bei Perzentilen 100, entsprechend den Prozenträngen) ein.

Als Quartile werden jene Punkte bezeichnet, welche eine Verteilung in vier gleich grosse Abschnitte aufteilen. Das mittlere Quartil (Q2) entspricht dabei dem Median (Prozentrang von 50), während das untere Quartil (Q1) den 25. Prozentrang und das obere Quartil (Q3) den 75. Prozentrang erfasst.Die Differenz der beiden Quartile Q1 und Q2 wird als Interquartilsabstand (IQA) bezeichnet.

VorteilAusreisser wirken sich nicht so sehr auf Kennwerte aus, da mit den Quartilen Q1 und Q3 nur die mittleren 50 Prozent der Verteilung berücksichtigt werden

NachteilDer Interquartilsabstand beinhaltet nur Informationen der mittleren 50 Prozent der Verteilung.

Page 18: Einführung in die Methoden der empirischen Sozialforschung Fribourg, 3. Mai 2005 Masse der zentralen Tendenz Horst Biedermann Departement Erziehungswissenschaften,

Ein

führu

ng in d

ie M

eth

oden d

er

em

pir

isch

en S

ozi

alfors

chung

Fri

bourg

, 3

. M

ai 2

00

5

Spezialfall Median: Teilt Verteilung in zwei gleich grosse Teile (je 50%) beim 50. Perzentil.

2, 4, 4, 5, 5, 5, 6, 6, 6, 6, 7, 7, 7, 7, 8, 8, 9, 9, 10, 10

(Md = 6,5)

Für die Einteilung in vier gleich grosse Teile werden drei Quartile (das 25., 50. & 75. Perzentil) bestimmt.

2, 4, 4, 5, 5, 5, 6, 6, 6, 6, 7, 7, 7, 7, 8, 8, 9, 9, 10, 10

P25 = 5 P50 = 6.5 P75 = 8

Perzentile, Quartile, Interquartilabstand: Beispiel

Page 19: Einführung in die Methoden der empirischen Sozialforschung Fribourg, 3. Mai 2005 Masse der zentralen Tendenz Horst Biedermann Departement Erziehungswissenschaften,

Ein

führu

ng in d

ie M

eth

oden d

er

em

pir

isch

en S

ozi

alfors

chung

Fri

bourg

, 3

. M

ai 2

00

5

AD-Streuung („average deviation“)

DefinitionDie AD-Streuung gibt den Durchschnitt der absoluten Abweichungen aller Messwerte vom Mittelwert an.

Merkmale die aufsummierten Werte ergeben immer null daher müssen negative Werte stets in positive Werte transformiert werden, so dass die aufsummierten Werte immer positiv sind je grösser die AD-Streuung ist, desto grösser ist die Variabilität der Variablenwerte alle Abweichungen haben den exakt gleichen Einfluss auf die AD- Streuung

Berechnung

N

i =i x

N

xAD

1

Page 20: Einführung in die Methoden der empirischen Sozialforschung Fribourg, 3. Mai 2005 Masse der zentralen Tendenz Horst Biedermann Departement Erziehungswissenschaften,

Ein

führu

ng in d

ie M

eth

oden d

er

em

pir

isch

en S

ozi

alfors

chung

Fri

bourg

, 3

. M

ai 2

00

5Varianz

DefinitionDie Varianz (σ2 bzw. s2) ist die durchschnittliche quadrierte Abweichung vom Mittelwert.

Berechnung

n

i

xxn

s i

1

22 )(1

0

1

2

3

4

5

6

7

8

Werte der Schüler/ innen

Punkte

im

Test

x=3.5

Abweichung vom Mittelwert im Quadrat

s2 = (6.25 + 6.25 + 0.25 + 2.25 + 12.25 + 2.25 + 0.25 + 2.25) / 8

= 32 / 8 = 4

(x – x1)2

+ (x – x2)2

+ (x – x3)2

+ ........+ (x – xn)2

dividiertdurch n

Page 21: Einführung in die Methoden der empirischen Sozialforschung Fribourg, 3. Mai 2005 Masse der zentralen Tendenz Horst Biedermann Departement Erziehungswissenschaften,

Ein

führu

ng in d

ie M

eth

oden d

er

em

pir

isch

en S

ozi

alfors

chung

Fri

bourg

, 3

. M

ai 2

00

5Varianz

Warum Quadrierung? Summe aller Werte ist nie Null (d.h. immer positiv) grössere Abweichungen vom arithmetischen Mittelwert werden stärker berücksichtigt (kleinere Abweichungen können eher zufällig entstehen, wodurch grössere Abweichungen statistisch bedeutsamer zu betrachten sind siehe Beispiel „Gewichtsschwankungen“

Freiheitsgrade die Freiheitsgrade ergeben sich aus der Stichprobengrösse, welche um die Anzahl der als bekannt vorausgesetzten Kennwerte reduziert wird Warum wird Quadratsumme durch Freiheitsgrade (N-1) und nicht durch N geteilt?

Gefahr der Unterschätzung der Populationsvarianz konservative Schätzung durch N-1

Page 22: Einführung in die Methoden der empirischen Sozialforschung Fribourg, 3. Mai 2005 Masse der zentralen Tendenz Horst Biedermann Departement Erziehungswissenschaften,

Ein

führu

ng in d

ie M

eth

oden d

er

em

pir

isch

en S

ozi

alfors

chung

Fri

bourg

, 3

. M

ai 2

00

5

Standardabweichung(„standard deviation“)

DefinitionDie Standardabweichung (σ bzw. s, SD) entspricht der Wurzel aus der Varianz.

Berechnung

2

1

2)(1

sxxn

sn

i

i

24 s

Beispiel (vgl. Beispiel von der Varianzberechnung)

Page 23: Einführung in die Methoden der empirischen Sozialforschung Fribourg, 3. Mai 2005 Masse der zentralen Tendenz Horst Biedermann Departement Erziehungswissenschaften,

Ein

führu

ng in d

ie M

eth

oden d

er

em

pir

isch

en S

ozi

alfors

chung

Fri

bourg

, 3

. M

ai 2

00

5Literatur

Aron, A. & Aron E. N. (1999). Statistics for Psychology. New Jersey: Prentice Hall.

Leonhard, R. (2004). Lehrbuch Statistik: Einstieg und Vertiefung. Bern: Hans Huber.

Shavelson, R. J. (1995). Statistical Reasoning for the Behavioral Sciences. Boston: Allyn and Bacon.

Wosnitza, M., & Jäger, R. S. (2000; Hrsg.). Daten erfassen, auswerten und präsentieren - aber wie? Landau: Verlag Empirische Pädagogik.