Einf¼hrung in die Methoden der empirischen Sozialforschung Fribourg, 3. Mai 2005 Masse der zentralen Tendenz Horst Biedermann Departement Erziehungswissenschaften,

  • View
    103

  • Download
    0

Embed Size (px)

Text of Einf¼hrung in die Methoden der empirischen Sozialforschung Fribourg, 3. Mai 2005 Masse der...

  • Folie 1
  • Einfhrung in die Methoden der empirischen Sozialforschung Fribourg, 3. Mai 2005 Masse der zentralen Tendenz Horst Biedermann Departement Erziehungswissenschaften, Universitt Fribourg Forschungsmethoden
  • Folie 2
  • Einfhrung in die Methoden der empirischen Sozialforschung Fribourg, 3. Mai 2005 Deskriptive vs. Inferenz-Statistik Deskriptive Statistik Beschreibung von Daten mit Hilfe statistischer Kennwerte: anhand der Masse der zentralen Tendenz (Masse der Mitte) und der Dispersion (Variabilitt) beschreibende Statistik Schliessende Statistik (Inferenzstatistik) Beurteilung von Daten, ob sie den Hypothesen entsprechen: Schtzen von Parametern und Berechnung statistischer Signifikanz schlussfolgernde Statistik
  • Folie 3
  • Einfhrung in die Methoden der empirischen Sozialforschung Fribourg, 3. Mai 2005 Hufigkeiten Geschlecht der Teilnehmenden an der Veranstaltung Einfhrung in die Methoden der empirischen Sozialforschung im SS 2005 Kategorief (x)cumf(x)%cum% weiblich18 85,782,1 mnnlich32114,3100,0 Total21100.0 absolute Hufigkeiten kumulierte absolute Hufigkeiten relative Hufigkeiten in Prozent kum. relative Hufigkeiten in Prozent
  • Folie 4
  • Einfhrung in die Methoden der empirischen Sozialforschung Fribourg, 3. Mai 2005 Kategorien Beispiel: 12 Minutenlauf im Rahmen eines Fitnesstests 2000 m x 2250 m 2250 m x 2500 m... 3750 m x 4000 m Vorteil bersichtliche Anzahl an Kategorien, innerhalb derer die Anzahl der zugehrigen Flle zusammengefasst wird Nachteil Reduktion der Informationen Problem: sehr viele Merkmalsausprgungen Lsung:Zusammenfassung der beobachteten Daten aus bestimmten Wertbereichen zu Gruppen bzw. Kategorien
  • Folie 5
  • Einfhrung in die Methoden der empirischen Sozialforschung Fribourg, 3. Mai 2005 Kategorien: Breite und Anzahl Regeln zur Kategorienbreite und anzahl: Ausschliesslichkeit der Kategorien (disjunkt) jedes beobachtete Ereignis (bzw. jeder Wert kann nur einer Kategorie zugeordnet werden Benachbarte Konzipierung der Kategorien es darf keine Lcke zwischen zwei Kategorien entstehen, in der ein Wert liegen knnte (geschlossene) Kategorien mssen gleich breit sein Sinnvolle Anzahl zu bildender Kategorien Faustregel: m = 1 + 3.32 x lg (N) m = Kategorien N = Versuchspersonen maximale Anzahl an Kategorien = 20 Offene Kategorien bei Ausreissern und Extremwerten eine offene Kategorie hat keine obere oder untere Grenze (z.B. x 300)
  • Folie 6
  • Einfhrung in die Methoden der empirischen Sozialforschung Fribourg, 3. Mai 2005 Masse der zentralen Tendenz Drei Kennwerte (Masse), die bestimmte Eigenschaften von Daten zusammenfassen und beschreiben. Damit knnen auch verschiedene Stichproben miteinander verglichen werden. Modus / Modalwert Wert, der am hufigsten vorkommt Median / Zentralwert Wert, der in der Mitte der Verteilung liegt und diese halbiert Arithmetisches Mittel / Mittelwert Durchschnittlicher Wert einer Verteilung Achtung: jedes Mass setzt bestimmte Mindestanforderungen an das Skalenniveau voraus!
  • Folie 7
  • Einfhrung in die Methoden der empirischen Sozialforschung Fribourg, 3. Mai 2005 Modus / Modalwert Definition Der Modalwert (Mo) ist derjenige Wert einer Verteilung, welcher am hufigsten besetzt ist. Vorteil sehr stabil gegenber Extremwerten Voraussetzungen auf allen Skalenniveaus berechenbar Achtung: es knnen mehrere Modalwerte vorherrschen bimodal = zwei Modalwerte multimodal = mehr als zwei Modalwerte in solchen Fllen geben gewisse Statistikprogramme (z. B. SPSS) nur den kleinsten dieser Werte und eine zustzliche Warnung aus
  • Folie 8
  • Einfhrung in die Methoden der empirischen Sozialforschung Fribourg, 3. Mai 2005 Modus / Modalwert: Beispiel Beispiel: Test mit maximal 10 Punkten (n=14) 2, 3, 4, 4, 5, 5, 6, 7, 7, 7, 8, 8, 9, 10 Modalwert: Mo = 7
  • Folie 9
  • Einfhrung in die Methoden der empirischen Sozialforschung Fribourg, 3. Mai 2005 Median / Zentralwert Definition Der Median (Md) ist derjenige Wert der die geordnete Reihe der Messwerte in die oberen und unteren 50 Prozent aufteilt. Somit ist die Anzahl der Messwerte ber und unter dem Median gleich. Vorteil ebenfalls sehr stabil gegenber Extremwerten Voraussetzung mindestens Ordinalskalenniveau Berechnung -Fr ungerades N: Md = x Wert (x) von Person -Fr gerades N: Md = x+ x -Fr grupp. Daten: Md = untere Grenze f k +. Kat.breite N + 1 2 2N2N2 N2N2 N2N2 +1 N + 1 2 - cum f k -1 f k
  • Folie 10
  • Einfhrung in die Methoden der empirischen Sozialforschung Fribourg, 3. Mai 2005 Median / Zentralwert: Beispiel Medianbestimmung bei ungerader Anzahl Werte: 4 7 9 13 17 Md = 9 Medianbestimmung bei gerader Anzahl Werte: 4 7 9 13 17 30 Md = (9+13) / 2 = 11 Drei Beobachtungen haben einen kleineren, drei einen grsseren Wert als der Median angibt (Wert existiert nicht in den Daten).
  • Folie 11
  • Einfhrung in die Methoden der empirischen Sozialforschung Fribourg, 3. Mai 2005 Arithmetisches Mittel Definition Der arithmetische Mittel ( bzw. x, AM) ist die Summe aller Messwerte geteilt durch deren Anzahl N. Durchschnitt aller Messwerte Nachteil empfindlich gegenber Extremwerten Voraussetzung mindestens Intervallskalenniveau Berechnung Summe aller Werte AM = x= Gesamtanzahl (n)
  • Folie 12
  • Einfhrung in die Methoden der empirischen Sozialforschung Fribourg, 3. Mai 2005 Drei Masse der zentralen Tendenz
  • Folie 13
  • Einfhrung in die Methoden der empirischen Sozialforschung Fribourg, 3. Mai 2005 AM, Mo und Md bei verschiedenen Verteilungsformen Modalwert, Median und arithmetisches Mittel hngen von der Verteilungsform ab.
  • Folie 14
  • Einfhrung in die Methoden der empirischen Sozialforschung Fribourg, 3. Mai 2005 Wie verteilen sich die Daten?
  • Folie 15
  • Einfhrung in die Methoden der empirischen Sozialforschung Fribourg, 3. Mai 2005 Masse der Dispersion Variationsbreite (Range, Spannweite) Quartile, Interquartilsabstand (Perzentile) AD-Streuung (average deviation) Varianz Standardabweichung (standard deviation) Die Masse der Dispersion beschreiben die Variabilitt bzw. Streuung der beobachteten Werte.
  • Folie 16
  • Einfhrung in die Methoden der empirischen Sozialforschung Fribourg, 3. Mai 2005 Variationsbreite (Range, Spannweite) Definition Die Spannweite bzw. der Range beschreibt bei kontinuierlichen Daten die Grsse des Intervalls, in welchem die unterschiedlichen Werte einer Variable lieben. Bei nominalskalierten Variablen gibt der Range die Anzahl der Kategorien an. Nachteile bei kontinuierlichen Daten werden nur die minimalsten und maximalsten Messwerte bercksichtigt sehr empfindlich gegenber Extremwerten / Ausreissern daher werden oft Extremwerte weggelassen (z.B. statt Spannweite nur mittlere 90 Prozent darstellen) Berechnung -kontinuierliche Daten: Range = maximaler Wert minimaler Wert -diskrete Daten (d.h. aus getrennten Einheiten bestehende Daten wie z.B. Kategorien): Range = maximaler Wert minimaler Wert +1
  • Folie 17
  • Einfhrung in die Methoden der empirischen Sozialforschung Fribourg, 3. Mai 2005 Perzentile, Quartile, Interquartilabstand Definition Die Perzentile teilen die Datenverteilung in mehrere Teile (bei Perzentilen 100, entsprechend den Prozentrngen) ein. Als Quartile werden jene Punkte bezeichnet, welche eine Verteilung in vier gleich grosse Abschnitte aufteilen. Das mittlere Quartil (Q2) entspricht dabei dem Median (Prozentrang von 50), whrend das untere Quartil (Q1) den 25. Prozentrang und das obere Quartil (Q3) den 75. Prozentrang erfasst. Die Differenz der beiden Quartile Q1 und Q2 wird als Interquartilsabstand (IQA) bezeichnet. Vorteil Ausreisser wirken sich nicht so sehr auf Kennwerte aus, da mit den Quartilen Q1 und Q3 nur die mittleren 50 Prozent der Verteilung bercksichtigt werden Nachteil Der Interquartilsabstand beinhaltet nur Informationen der mittleren 50 Prozent der Verteilung.
  • Folie 18
  • Einfhrung in die Methoden der empirischen Sozialforschung Fribourg, 3. Mai 2005 Spezialfall Median: Teilt Verteilung in zwei gleich grosse Teile (je 50%) beim 50. Perzentil. 2, 4, 4, 5, 5, 5, 6, 6, 6, 6, 7, 7, 7, 7, 8, 8, 9, 9, 10, 10 (Md = 6,5) Fr die Einteilung in vier gleich grosse Teile werden drei Quartile (das 25., 50. & 75. Perzentil) bestimmt. 2, 4, 4, 5, 5, 5, 6, 6, 6, 6, 7, 7, 7, 7, 8, 8, 9, 9, 10, 10 P 25 = 5P 50 = 6.5P 75 = 8 Perzentile, Quartile, Interquartilabstand: Beispiel
  • Folie 19
  • Einfhrung in die Methoden der empirischen Sozialforschung Fribourg, 3. Mai 2005 AD-Streuung (average deviation) Definition Die AD-Streuung gibt den Durchschnitt der absoluten Abweichungen aller Messwerte vom Mittelwert an. Merkmale die aufsummierten Werte ergeben immer null daher mssen negative Werte stets in positive Werte transformiert werden, so dass die aufsummierten Werte immer positiv sind je grsser die AD-Streuung ist, desto grsser ist die Variabilitt der Variablenwerte alle Abweichungen haben den exakt gleichen Einfluss auf die AD- Streuung Berechnung N i = i x N x AD 1
  • Folie 20
  • Einfhrung in die Methoden der empirischen Sozialforschung Fribourg, 3. Mai 2005 Varianz Definition Die Varianz ( 2 bzw. s 2 ) ist die durchschnittliche quadrierte Abweichung vom Mittelwert. Berechnung x=3.5 Abweichung vom Mittelwert im Quadrat s 2 = (6.25 + 6.25 + 0.25 + 2.25 + 12.25 + 2.25 + 0.25 + 2.25) / 8 = 32 / 8 = 4 (x x 1 ) 2 +(x x 2 ) 2 +(x x 3 ) 2 +........ +(x x n ) 2 dividiert durch n
  • Folie 21
  • Einfhrung in die Methoden der empirischen Sozialforschung Fribourg, 3. Mai 2005 Varianz Warum Quadrierung?