29

Deskriptive Statistik - uni-leipzig.dewuschke/uploads/schule/... · 2019-08-14 · H. Wuschke Deskriptive Statistik. Quartile für die Boxplots unteres/oberes Quartil Bildet man wiederum

  • Upload
    others

  • View
    13

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Deskriptive Statistik - uni-leipzig.dewuschke/uploads/schule/... · 2019-08-14 · H. Wuschke Deskriptive Statistik. Quartile für die Boxplots unteres/oberes Quartil Bildet man wiederum

Grundbegri�e der StatistikSkalen

Klassierung von DatenDarstellung von Daten

Statistische KenngröÿenBoxplots

Deskriptive Statistik

H. Wuschke

14. August 2019

H. Wuschke Deskriptive Statistik

Page 2: Deskriptive Statistik - uni-leipzig.dewuschke/uploads/schule/... · 2019-08-14 · H. Wuschke Deskriptive Statistik. Quartile für die Boxplots unteres/oberes Quartil Bildet man wiederum

Grundbegri�e der StatistikSkalen

Klassierung von DatenDarstellung von Daten

Statistische KenngröÿenBoxplots

Ziele der Sitzung

verschiedene Typen von Daten und ihre Skalen beurteilenkönnen

Daten in passenden Diagrammen veranschaulichen können

Kenngröÿen von statistischen Daten beschreiben undinterpretieren können

Boxplots interpretieren und darstellen können

H. Wuschke Deskriptive Statistik

Page 3: Deskriptive Statistik - uni-leipzig.dewuschke/uploads/schule/... · 2019-08-14 · H. Wuschke Deskriptive Statistik. Quartile für die Boxplots unteres/oberes Quartil Bildet man wiederum

Grundbegri�e der StatistikSkalen

Klassierung von DatenDarstellung von Daten

Statistische KenngröÿenBoxplots

Grundbegri�eBeispiele

In der deskriptiven (beschreibenden) Statistik erhebt man Datenund wertet diese aus, um Erkenntnisse über Zusammenhänge zugenerieren.

Grundbegri�e der Statistik

Daten sind meist in einer Urliste gegeben und werden dann in einerStrichliste geordnet. Daraus können dann die absoluteHäu�gkeiten (ausgezählte Zahlen) und die relativenHäu�gkeiten (Anteil an der Gesamtheit) gebildet werden.

H. Wuschke Deskriptive Statistik

Page 4: Deskriptive Statistik - uni-leipzig.dewuschke/uploads/schule/... · 2019-08-14 · H. Wuschke Deskriptive Statistik. Quartile für die Boxplots unteres/oberes Quartil Bildet man wiederum

Grundbegri�e der StatistikSkalen

Klassierung von DatenDarstellung von Daten

Statistische KenngröÿenBoxplots

Grundbegri�eBeispiele

In der Klasse 6B hat Herr Wuschke die Lieblingstiere erfragt. Dabeiist folgendes Ergebnis herausgekommen:

Lieblingstiere der 6B

Lieblingstier Strichliste abs. Hfkt. rel. Hfkt.

Kaninchen : 1 1

24≈ 0,0417

Pferd :::: 4 4

24≈ 0,1667

Hund ;: 6 6

24= 0,25

Einhorn ;::: 8 8

24≈ 0,3333

Katze ::: 3 3

24= 0,125

H. Wuschke Deskriptive Statistik

Page 5: Deskriptive Statistik - uni-leipzig.dewuschke/uploads/schule/... · 2019-08-14 · H. Wuschke Deskriptive Statistik. Quartile für die Boxplots unteres/oberes Quartil Bildet man wiederum

Beispiel � Besitz von Mediengeräte

Bei der JIM-Studiea wurden Jugendliche von 12 Jahren bis 19 Jahrengefragt, welche Mediengeräte sie besitzen. Hier ist ein Beispiel von 5Jugendlichen.

Urliste:Smartphone; Laptop; Spielekonsole; Tablet; Smartphone; Fernsehgerät;Smartphone; Laptop; iPod; Smartphone; Spielekonsole; Tablet;Fernsehgerät; Tablet; Streamingbox; Smartphone; Laptop; Spielekonsole;iPod; Tablet

Gerät Smartph. Laptop Konsole Tablet TV SBox iPod

Strichliste ; ::: ::: :::: :: : ::

abs. Hfkt. 5 3 3 4 2 1 2

aJährlich durchgeführte Studie �Jugend, Information, (Multi-)Media�

Page 6: Deskriptive Statistik - uni-leipzig.dewuschke/uploads/schule/... · 2019-08-14 · H. Wuschke Deskriptive Statistik. Quartile für die Boxplots unteres/oberes Quartil Bildet man wiederum

Skalenniveaus

Daten werden in drei unterschiedliche Skalen eingeteilt:

Nominalskala � Ordinalskala � metrische Skala

Nominalskala � Daten können nur anhand unterschiedlicherNamen angegeben werden (z. B. Haarfarben, Geschlecht,Krankheiten, ...)

Ordinalskala � Daten können geordnet werden unterbestimmten Gesichtspunkten (z. B. bevorzugte Produkte nachdem Motto: � Ich würde eher ... kaufen, als ...�)

metrische Skala � Daten können geordnet werden und insinnvollen Zahlen ausgedrückt werden (z. B. Daten aus denNaturwissenschaften, Daten aus dem Sport, ... nach demMotto: �Das kann ich messen.�)

Page 7: Deskriptive Statistik - uni-leipzig.dewuschke/uploads/schule/... · 2019-08-14 · H. Wuschke Deskriptive Statistik. Quartile für die Boxplots unteres/oberes Quartil Bildet man wiederum

Grundbegri�e der StatistikSkalen

Klassierung von DatenDarstellung von Daten

Statistische KenngröÿenBoxplots

Bei metrischen Daten ist es häu�g sinnvoll, diese zu klassieren.Dabei werden sie in selbstgewählten oder vorgegebenen Klassenzusammengefasst.

Beispiel � Gewicht von Säuglingen im Nordkurier 2018

Im Nordkurier erscheinen wöchentlich Informationen überNeugeborene. Das Geburtsgewicht der letzten Zeit warfolgendermaÿen: 3280g, 3165g, 3055g, 2850g, 3100g, 4190g,3730g, 3540g, 3220g, 2774g, 2955g, 3280g, 2760g, 3570g, 3860g,2915g, 3720g, 3500g, 3550g, 2760g, 4440g, 3720g, 3630g, 3450g

Gewicht x abs. Hfkt. Gewicht x abs. Hfkt.

2500g 5 x<3000g 6 3500g 5x<4000g 93000g 5 x<3500g 7 4000g5 x<4500 2

H. Wuschke Deskriptive Statistik

Page 8: Deskriptive Statistik - uni-leipzig.dewuschke/uploads/schule/... · 2019-08-14 · H. Wuschke Deskriptive Statistik. Quartile für die Boxplots unteres/oberes Quartil Bildet man wiederum

Grundbegri�e der StatistikSkalen

Klassierung von DatenDarstellung von Daten

Statistische KenngröÿenBoxplots

DiagrammtypenBeispiele für Diagramme

Diagrammtypen

Für die Darstellung von absoluten Häu�gkeiten nutzt man einSäulendiagramm oder Balkendiagramm. Wenn die x-Achsedabei geordnet ist (z. B. bei Jahreszahlen), kann man auch einLiniendiagramm nutzen.

Für die Darstellung von relativen Häu�gkeiten nutzt man einKreisdiagramm oder Streifendiagramm.Diese Diagramme dürfen nur verwendet werden, wenn keineMehrfachnennung möglich war.

Klassierte Daten werden in einem Histogramm dargestellt.Dies ist eine besondere Form des Säulendiagramms.

Wenn die statistischen Kenngröÿen berechnet wurden, könnendie Daten auch mithilfe eines Boxplots dargestellt werden.

H. Wuschke Deskriptive Statistik

Page 9: Deskriptive Statistik - uni-leipzig.dewuschke/uploads/schule/... · 2019-08-14 · H. Wuschke Deskriptive Statistik. Quartile für die Boxplots unteres/oberes Quartil Bildet man wiederum

Lieblingstiere der 6B

Kaninchen: 1; Pferd: 4; Hund: 6; Einhorn: 8; Katze: 3

Abbildung: Säulendiagramm [Felix Röhricht 2018, Excel]

Page 10: Deskriptive Statistik - uni-leipzig.dewuschke/uploads/schule/... · 2019-08-14 · H. Wuschke Deskriptive Statistik. Quartile für die Boxplots unteres/oberes Quartil Bildet man wiederum

Lieblingstiere der 6B

Kaninchen: 1; Pferd: 4; Hund: 6; Einhorn: 8; Katze: 3

Abbildung: Balkendiagramm [Felix Röhricht 2018, Excel]

Page 11: Deskriptive Statistik - uni-leipzig.dewuschke/uploads/schule/... · 2019-08-14 · H. Wuschke Deskriptive Statistik. Quartile für die Boxplots unteres/oberes Quartil Bildet man wiederum

Lieblingstiere der 6B

Kaninchen: 1; Pferd: 4; Hund: 6; Einhorn: 8; Katze: 3

Abbildung: Streifendiagramm [Felix Röhricht 2018, Excel]

Page 12: Deskriptive Statistik - uni-leipzig.dewuschke/uploads/schule/... · 2019-08-14 · H. Wuschke Deskriptive Statistik. Quartile für die Boxplots unteres/oberes Quartil Bildet man wiederum

Lieblingstiere der 6B

Kaninchen: 1; Pferd: 4; Hund: 6; Einhorn: 8; Katze: 3

Abbildung: Kreisdiagramm [Felix Röhricht 2018, Excel]

Page 13: Deskriptive Statistik - uni-leipzig.dewuschke/uploads/schule/... · 2019-08-14 · H. Wuschke Deskriptive Statistik. Quartile für die Boxplots unteres/oberes Quartil Bildet man wiederum

Lieblingstiere der 6B

Kaninchen: 1; Pferd: 4; Hund: 6; Einhorn: 8; Katze: 3

Abbildung: Kreisdiagramm [Felix Röhricht 2018, Excel]

Page 14: Deskriptive Statistik - uni-leipzig.dewuschke/uploads/schule/... · 2019-08-14 · H. Wuschke Deskriptive Statistik. Quartile für die Boxplots unteres/oberes Quartil Bildet man wiederum

Grundbegri�e der StatistikSkalen

Klassierung von DatenDarstellung von Daten

Statistische KenngröÿenBoxplots

DiagrammtypenBeispiele für Diagramme

Gewichtsklassen von Säuglingenaus dem Nordkurier

Gewicht x abs. Hfkt.

2500g 5 x<3000g 63000g 5 x<3500g 73500g 5x<4000g 94000g5 x<4500 2

Abbildung: Histogramm [HW 2018, GeoGebra]

H. Wuschke Deskriptive Statistik

Page 15: Deskriptive Statistik - uni-leipzig.dewuschke/uploads/schule/... · 2019-08-14 · H. Wuschke Deskriptive Statistik. Quartile für die Boxplots unteres/oberes Quartil Bildet man wiederum

Grundbegri�e der StatistikSkalen

Klassierung von DatenDarstellung von Daten

Statistische KenngröÿenBoxplots

NominalskalaOrdinalskalametrische Skala

Je besser die Skala ist, umso mehr statistische Kenngröÿen könnenerhoben werden. Bei einer Nominalskala kann man den Modalwert

angeben.

Modalwert

Der Modalwert xmod ist die Gröÿe, welche am häu�gstenvorkommt. Es kann mehre Modalwerte geben.

H. Wuschke Deskriptive Statistik

Page 16: Deskriptive Statistik - uni-leipzig.dewuschke/uploads/schule/... · 2019-08-14 · H. Wuschke Deskriptive Statistik. Quartile für die Boxplots unteres/oberes Quartil Bildet man wiederum

Grundbegri�e der StatistikSkalen

Klassierung von DatenDarstellung von Daten

Statistische KenngröÿenBoxplots

NominalskalaOrdinalskalametrische Skala

Net�ix-Konsum

Hannah erzählt über ihren Net�ix-Konsum am Wochenende:�Ich habe alle 8 neuen Folgen Haus des Geldes geschaut, dann noch3 Folgen von Dark und zwischendurch 5 Folgen Modern Family.�

Der Modalwert ist in diesem Beispiel xmod = Haus des Geldes

Schlafzeiten am Tag

Frank ist in letzter Zeit häu�g erschöpft. Deshalb hat er seinetägliche Stundenanzahl Schlaf in zwei Wochen notiert:

Mo Di Mi Do Fr Sa So

6h 4,5 h 7 h 6,5 h 5 h 9 h 10 h

7 h 6,5 h 6,5 h 5 h 5,5 h 7 h 10 h

Die Modalwerte sind xmod1 = 6, 5 h und xmod2 = 7 h.

H. Wuschke Deskriptive Statistik

Page 17: Deskriptive Statistik - uni-leipzig.dewuschke/uploads/schule/... · 2019-08-14 · H. Wuschke Deskriptive Statistik. Quartile für die Boxplots unteres/oberes Quartil Bildet man wiederum

Grundbegri�e der StatistikSkalen

Klassierung von DatenDarstellung von Daten

Statistische KenngröÿenBoxplots

NominalskalaOrdinalskalametrische Skala

Da die Daten bei der Ordinalskala geordnet werden können, ist esmöglich einen Zentralwert zu bestimmen, den Median.

Median

Der Median (Zentralwert) xmed ist die Gröÿe, welche in dergeordneten Datenreihe in der Mitte steht.Ist die Anzahl der Daten gerade, kann man den Median nichtimmer bestimmen. Für metrische Gröÿen (Zahlen) gilt bei einerDatenreihe von n Daten:

xmed =x n2+ x n+1

2

2

H. Wuschke Deskriptive Statistik

Page 18: Deskriptive Statistik - uni-leipzig.dewuschke/uploads/schule/... · 2019-08-14 · H. Wuschke Deskriptive Statistik. Quartile für die Boxplots unteres/oberes Quartil Bildet man wiederum

Beispiel Median

In einem Freizeitpark können bei der Auswertung verschiedene

Zufriedenheitsstufen angegeben werden:

15 Personen haben folgendermaÿen bewertet:

, , , , , , , , , , , , , ,

Ordnen der Ergebnisse führt zu:

, , , , , , , , , , , , , ,

xmod = xmed =

Schlafzeiten von Frank � Beispiel oben

Ordnet man die Schlafzeiten von Frank, erhält man:

4,5 h; 5 h; 5 h; 5,5 h; 6 h; 6,5 h; 6,5 h;6,5 h; 7 h; 7 h; 7 h; 9 h; 10 h; 10 h

xmed =6, 5h + 6, 5h

2= 6, 5h

Page 19: Deskriptive Statistik - uni-leipzig.dewuschke/uploads/schule/... · 2019-08-14 · H. Wuschke Deskriptive Statistik. Quartile für die Boxplots unteres/oberes Quartil Bildet man wiederum

Grundbegri�e der StatistikSkalen

Klassierung von DatenDarstellung von Daten

Statistische KenngröÿenBoxplots

NominalskalaOrdinalskalametrische Skala

Maximum, Minimum, Spannweite

Bei einer Ordinalskala kann man das Maximum und dasMinimum angeben. Dies ist eindeutig, wenn Zahlenwerte vorliegen,ansonsten ist es abhängig von der Betrachtung.

Der Abstand zwischen Maximum und Minimum ist dieSpannweite, es gilt also: Spannweite = Maximum � Minimum

Schlafzeiten von Frank

Mo Di Mi Do Fr Sa So

6h 4,5 h 7 h 6,5 h 5 h 9 h 10 h

7 h 6,5 h 6,5 h 5 h 5,5 h 7 h 10 h

Maximum = 10 h; Minimum = 4,5 h; Spannweite = 5,5 h

H. Wuschke Deskriptive Statistik

Page 20: Deskriptive Statistik - uni-leipzig.dewuschke/uploads/schule/... · 2019-08-14 · H. Wuschke Deskriptive Statistik. Quartile für die Boxplots unteres/oberes Quartil Bildet man wiederum

Quartile für die Boxplots

unteres/oberes Quartil

Bildet man wiederum den Median zwischen dem kleinsten Wert und demMediana, so erhält man das untere Quartil xQ1.Bildet man den Median zwischen dem gröÿten Wert und dem Median, soerhält man das obere Quartil xQ3.Während der Median die Hälfte der Stichprobe markiert, zeigt xQ1 einViertel der Stichprobe und xQ3 drei Viertel der Stichprobe an.

aBei einer geraden Anzahl an Daten, nutzt man die Daten, aus denen derMedian gebildet wurde.

Schlafzeiten von Frank � Beispiel oben

4,5 h; 5 h; 5 h; 5,5 h; 6 h; 6,5 h; 6,5 h; 6,5 h; 7 h; 7 h; 7 h; 9 h; 10 h; 10 h

xmed = 6, 5h

xQ1 wird zwischen 4,5 h und 6,5 h gebildet: xQ1 = 5, 5h

xQ3 wird zwischen 6,5 h und 10 h gebildet: xQ3 = 7h

Page 21: Deskriptive Statistik - uni-leipzig.dewuschke/uploads/schule/... · 2019-08-14 · H. Wuschke Deskriptive Statistik. Quartile für die Boxplots unteres/oberes Quartil Bildet man wiederum

Grundbegri�e der StatistikSkalen

Klassierung von DatenDarstellung von Daten

Statistische KenngröÿenBoxplots

NominalskalaOrdinalskalametrische Skala

geordnete Geburtsgewichte � Beispiel oben

2760g; 2760g; 2774g; 2850g; 2915g; 2955g; 3055g; 3100g;3165g; 3220g; 3280g; 3280g; 3450g; 3500g; 3540g; 3550g;3570g; 3630g; 3720g; 3720g; 3730g; 3860g; 4190g; 4440g

xmed =3280g + 3450g

2= 3365g

Das untere Quartil wird zwischen 2760g und 3280g gebildet und das oberezwischen 3450g und 4440g.

xQ1 =2955g + 3055g

2= 3005g xQ3 =

3630g + 3720g

2= 3675g

H. Wuschke Deskriptive Statistik

Page 22: Deskriptive Statistik - uni-leipzig.dewuschke/uploads/schule/... · 2019-08-14 · H. Wuschke Deskriptive Statistik. Quartile für die Boxplots unteres/oberes Quartil Bildet man wiederum

Grundbegri�e der StatistikSkalen

Klassierung von DatenDarstellung von Daten

Statistische KenngröÿenBoxplots

NominalskalaOrdinalskalametrische Skala

arithmetisches Mittel

arithmetisches Mittel

Das arithmetische Mittel (Durchschnitt) berechnet sich bei nmetrischen Daten:

x =x1 + x2 + . . . xn

n

Arithmetisches Mittel in den Beispielen

Bei den Geburtsgewichten ist

x =2 · 2760g + 2774g + · · ·+ 4440g

24=

81814g

24≈ 3375, 58g

Bei Franks Schlafzeiten ist

x =4, 5h + 2 · 5h + · · ·+ 2 · 10h

14=

95, 5h

14≈ 6, 82h

H. Wuschke Deskriptive Statistik

Page 23: Deskriptive Statistik - uni-leipzig.dewuschke/uploads/schule/... · 2019-08-14 · H. Wuschke Deskriptive Statistik. Quartile für die Boxplots unteres/oberes Quartil Bildet man wiederum

arithmetisches Mittel bei klassierten Daten

Das arithmetische Mittel von klassierten Daten bestimmt manähnlich, nur dass man die Klassenmitten zur Berechnung nutzt.

Durchschnittliches Gewicht der Säuglinge

Gewicht x Klassenmitte abs. Hfkt.

2500g 5 x<3000g 2750g 63000g 5 x<3500g 3250g 73500g 5 x<4000g 3750g 94000g 5 x<4500g 4250g 2

x =6 · 2750g + 7 · 3250g + 9 · 3750g + 2 · 4250g

24

=81500g

24≈ 3395, 83g

Page 24: Deskriptive Statistik - uni-leipzig.dewuschke/uploads/schule/... · 2019-08-14 · H. Wuschke Deskriptive Statistik. Quartile für die Boxplots unteres/oberes Quartil Bildet man wiederum

Zusammenhang Median und arithmetisches Mittel

statistische Ausreiÿer

Das arithmetische Mittel wird von extremen Daten starkbeein�usst. Der Median gibt einen realistischen zentralen Wert derDatenmenge an. Wenn das arithmetische Mittel und der Medianstark voneinander abweichen, dann ist in der Stichprobe einAusreiÿer enthalten.

Gehalt in der Firma �Knausrig�

Chef: �Bei mir verdient jeder im Schnitt 1.500e, es geht meinen

Angestellten sehr gut!�

Personal Gehalt Personal Gehalt

Praktikant 200e Reinigungskraft 450eWerksstudentin 800e Aushilfe 450e

Chef 6.000e Mitarbeiter 1.100e

Page 25: Deskriptive Statistik - uni-leipzig.dewuschke/uploads/schule/... · 2019-08-14 · H. Wuschke Deskriptive Statistik. Quartile für die Boxplots unteres/oberes Quartil Bildet man wiederum

Grundbegri�e der StatistikSkalen

Klassierung von DatenDarstellung von Daten

Statistische KenngröÿenBoxplots

NominalskalaOrdinalskalametrische Skala

empirische Varianz

Die empirische Varianz σ2 ist die mittlere quadratischeAbweichung vom arithmetischen Mittel.

σ2 =(x − x1)

2 + (x − x2)2 + · · ·+ (x − xn)

2

n

empirische Standardabweichung

Die empirische Standardabweichung σ macht die Quadrierung inder Varianz wieder rückgängig und gibt daher an, wie stark dieDaten vom arithmetischen Mittel abweichen. σ heiÿt auchStreumaÿ, weil es beschreibt, wie stark die Stichprobe streut.

σ =√σ2 =

√(x − x1)

2 + (x − x2)2 + · · ·+ (x − xn)

2

n

H. Wuschke Deskriptive Statistik

Page 26: Deskriptive Statistik - uni-leipzig.dewuschke/uploads/schule/... · 2019-08-14 · H. Wuschke Deskriptive Statistik. Quartile für die Boxplots unteres/oberes Quartil Bildet man wiederum

Geburten von Zwillingen in Mecklenburg-Vorpommern

Jahr ♂♂ ♂♀ ♀♀2000 76 51 632001 49 61 672002 64 60 522003 65 61 712004 70 71 722005 57 48 582006 64 66 582007 67 59 572008 64 76 552009 63 69 802010 71 75 672011 74 74 692012 63 70 572013 56 76 672014 74 81 642015 60 74 52

Statistische Kenngröÿen

♂♂Max = 76; Min = 49; Spannweite = 27xQ1 = 61, 5; xmed = 64; xQ3 = 70, 5;xmod = 64; x = 64, 81; σ = 7, 00

♂♀

Max = 81; Min = 48; Spannweite = 33xQ1 = 60, 5; xmed = 69, 5; xQ3 = 74, 5;xmod1 = 61; xmod2 = 74;x = 67, 0; σ = 9, 19

♀♀

Max = 80; Min = 52; Spannweite = 28xQ1 = 57; xmed = 63, 5; xQ3 = 68;xmod = 67; x = 63, 06; σ = 7, 69

Page 27: Deskriptive Statistik - uni-leipzig.dewuschke/uploads/schule/... · 2019-08-14 · H. Wuschke Deskriptive Statistik. Quartile für die Boxplots unteres/oberes Quartil Bildet man wiederum

Grundbegri�e der StatistikSkalen

Klassierung von DatenDarstellung von Daten

Statistische KenngröÿenBoxplots

Boxplots

Ein Boxplot stellt die Verteilung der erfassten Daten dar. Erbesteht aus Minimum, unterem Quartil, Median, (arithmetischemMittel,) oberem Quartil und Maximum. Ausreiÿer liegen auÿerhalbdes Boxplots.

H. Wuschke Deskriptive Statistik

Page 28: Deskriptive Statistik - uni-leipzig.dewuschke/uploads/schule/... · 2019-08-14 · H. Wuschke Deskriptive Statistik. Quartile für die Boxplots unteres/oberes Quartil Bildet man wiederum

Abbildung: Boxplot [HW 2018, https://plot.ly/create/box-plot/]

Page 29: Deskriptive Statistik - uni-leipzig.dewuschke/uploads/schule/... · 2019-08-14 · H. Wuschke Deskriptive Statistik. Quartile für die Boxplots unteres/oberes Quartil Bildet man wiederum

Abbildung: Boxplot [HW 2018, https://plot.ly/create/box-plot/]