28
1 M. Kresken Univariate Statistik

1M. Kresken Univariate Statistik. 2M. Kresken Graphische Darstellung Kreisdiagramm Stabdiagramm (Säulen-, Balkendiagramm) Histogramm

Embed Size (px)

Citation preview

Page 1: 1M. Kresken Univariate Statistik. 2M. Kresken Graphische Darstellung Kreisdiagramm Stabdiagramm (Säulen-, Balkendiagramm) Histogramm

1M. Kresken

Univariate Statistik

Page 2: 1M. Kresken Univariate Statistik. 2M. Kresken Graphische Darstellung Kreisdiagramm Stabdiagramm (Säulen-, Balkendiagramm) Histogramm

2M. Kresken

Graphische Darstellung

• Kreisdiagramm• Stabdiagramm

(Säulen-, Balkendiagramm)• Histogramm

Page 3: 1M. Kresken Univariate Statistik. 2M. Kresken Graphische Darstellung Kreisdiagramm Stabdiagramm (Säulen-, Balkendiagramm) Histogramm

3M. Kresken

Häufigkeit des Geschlechtsfür n=55 Probanden

SEX absolut relativ prozentualAufteilung derWinkelsumme

männlich 28 0,51 50,9% 183weiblich 27 0,49 49,1% 177gesamt 55 1,00 100,0% 360

Page 4: 1M. Kresken Univariate Statistik. 2M. Kresken Graphische Darstellung Kreisdiagramm Stabdiagramm (Säulen-, Balkendiagramm) Histogramm

4M. Kresken

Kreisdiagramm

Geschlecht

50,9%49,1%männlich

weiblich

Page 5: 1M. Kresken Univariate Statistik. 2M. Kresken Graphische Darstellung Kreisdiagramm Stabdiagramm (Säulen-, Balkendiagramm) Histogramm

5M. Kresken

Häufigkeit der Geschwisterkinderbei n=55 Probanden

GZ absolut relativ

0 10 0,181 18 0,332 12 0,223 4 0,074 4 0,075 3 0,056 1 0,027 0 0,008 1 0,02

k. A. 2 0,04gesamt 55 1,00

Page 6: 1M. Kresken Univariate Statistik. 2M. Kresken Graphische Darstellung Kreisdiagramm Stabdiagramm (Säulen-, Balkendiagramm) Histogramm

6M. Kresken

StabdiagrammGeschwisterzahl

0

2

4

6

8

10

12

14

16

18

20

0 1 2 3 4 5 6 7 8 k. A.

ab

solu

te H

äü

figke

it

Page 7: 1M. Kresken Univariate Statistik. 2M. Kresken Graphische Darstellung Kreisdiagramm Stabdiagramm (Säulen-, Balkendiagramm) Histogramm

7M. Kresken

Histogramm

• Zur Darstellung eines stetigen (auf einer metrischen Skala gemessenen) Merkmals

• Dazu wird die Messskala in Bereiche, die sogenannten Klassen, aufgeteilt.

• Klassen müssen den gesamten Wertevorrat überdecken (Vollständigkeit).

• Klassen dürfen sich nicht überschneiden (Disjunktheit).• Insbesondere ist festzulegen, zu welcher Klasse die

einzelnen Klassengrenzen gehören.

Page 8: 1M. Kresken Univariate Statistik. 2M. Kresken Graphische Darstellung Kreisdiagramm Stabdiagramm (Säulen-, Balkendiagramm) Histogramm

8M. Kresken

Histogramm

• Wird die untere Klasse zugeordnet linksgeschlossen Darstellung: [a1, a2) zur Klasse gehören alle Werte ab a1 bis unterhalb a2

• Wird die obere Klasse zugeordnet rechtsgeschlossen Darstellung: (a1, a2] zur Klasse gehören alle Werte oberhalb von a1 bis einschließlich a2

Page 9: 1M. Kresken Univariate Statistik. 2M. Kresken Graphische Darstellung Kreisdiagramm Stabdiagramm (Säulen-, Balkendiagramm) Histogramm

9M. Kresken

Häufigkeiten des systolischen Blutdrucks der n=55 Probanden

Klasseneinteilung für den sysolischen Blutdruck [mmHg]

absolut relativ

(90, 100] 3 0,05(100, 110] 6 0,11(110, 120] 13 0,24(120, 130] 14 0,25(130, 140] 10 0,18(140, 150] 6 0,11(150, 160] 0 0,00(160, 170] 3 0,05

gesamt 55 1,00

Page 10: 1M. Kresken Univariate Statistik. 2M. Kresken Graphische Darstellung Kreisdiagramm Stabdiagramm (Säulen-, Balkendiagramm) Histogramm

10M. Kresken

Histogramm

Systolischer Blutdruck [mmHg]

0,05

0,11

0,240,25

0,18

0,11

0,00

0,05

0,00

0,05

0,10

0,15

0,20

0,25

0,30

(90,100]

(100,110]

(110,120]

(120,130]

(130,140]

(140,150]

(150,160]

(160,170]

rela

tive

Häu

figke

it

Page 11: 1M. Kresken Univariate Statistik. 2M. Kresken Graphische Darstellung Kreisdiagramm Stabdiagramm (Säulen-, Balkendiagramm) Histogramm

11M. Kresken

Empirische Verteilungsfunktion

• Die Klassenbildung bedeutet eine Zusammenfassung der Messergebnisse und damit eine Reduzierung der Information über den konkreten Daten.

• Eine graphische Veranschaulichung der Orginal-Messergebnisse eines quantitativen Merkmals ist die empirische Verteilungsfunktion.

• Dazu werden zu den Messwerten, die auf der Abszisse angegeben sind, die zugehörigen Summenhäufigkeiten auf der Ordinate angetragen.

• Die entstehenden Punkte werden durch eine Treppenfunktion miteinander verbunden.

Page 12: 1M. Kresken Univariate Statistik. 2M. Kresken Graphische Darstellung Kreisdiagramm Stabdiagramm (Säulen-, Balkendiagramm) Histogramm

12M. Kresken

Empirische Verteilungsfunktion

Blutzuckerkonzentration

0,00,10,20,30,40,50,60,70,80,91,0

50 60 70 80 90 100 110 120 130 140 150

Blutzuckerkonzentration (mg/100ml)

kum

ulie

rte

rela

tive

Häu

figke

it

Page 13: 1M. Kresken Univariate Statistik. 2M. Kresken Graphische Darstellung Kreisdiagramm Stabdiagramm (Säulen-, Balkendiagramm) Histogramm

13M. Kresken

Kenngrößen

Page 14: 1M. Kresken Univariate Statistik. 2M. Kresken Graphische Darstellung Kreisdiagramm Stabdiagramm (Säulen-, Balkendiagramm) Histogramm

14M. Kresken

Kenngrößen

• Ziel ist es, typische Eigenschaften einer Messreihe mit wenigen Zahlen zu beschreiben.

• Dadurch wird bewusst eine radikale Reduktion der in den konkreten Daten enthaltenen Information angestrebt.

• Zur Beschreibung der Verteilung von Messwerten sollte immer ein Lagemaß und ein Streuungsmaß angegeben werden.

Page 15: 1M. Kresken Univariate Statistik. 2M. Kresken Graphische Darstellung Kreisdiagramm Stabdiagramm (Säulen-, Balkendiagramm) Histogramm

15M. Kresken

Lagemaße

Lagemaße• Mittelwert• Quantile• Median• Modalwert

Streuungsmaße• Spannweite• Standardabweichung/

Varianz• Quartilsabstand• Variationskoeffizient

Box-Whisker Plot

Page 16: 1M. Kresken Univariate Statistik. 2M. Kresken Graphische Darstellung Kreisdiagramm Stabdiagramm (Säulen-, Balkendiagramm) Histogramm

16M. Kresken

Lagemaße (Lageparameter)

• Beschreiben die zentrale Tendenz der Daten

Page 17: 1M. Kresken Univariate Statistik. 2M. Kresken Graphische Darstellung Kreisdiagramm Stabdiagramm (Säulen-, Balkendiagramm) Histogramm

17M. Kresken

MittelwertMittelwerte

Page 18: 1M. Kresken Univariate Statistik. 2M. Kresken Graphische Darstellung Kreisdiagramm Stabdiagramm (Säulen-, Balkendiagramm) Histogramm

18M. Kresken

Mittelwert

x = _ x1 + x2 + ... + xn

n = 1n

n

j=1

xj

• Beschreibt den Schwerpunkt der Messwerte, wobei jeder einzelnen Beobachtung das gleiche Gewicht 1/n zukommt.

Arithmetischer Mittelwert

Page 19: 1M. Kresken Univariate Statistik. 2M. Kresken Graphische Darstellung Kreisdiagramm Stabdiagramm (Säulen-, Balkendiagramm) Histogramm

19M. Kresken

Mittelwert

• Mittelwert der Blutzuckerkonzentrationen von n = 52 Probanden

- Berechnung des Mittelwertes:

x = _ 62 + 75 + ... + 125

52 = 92,4

Arithmetischer Mittelwert

Page 20: 1M. Kresken Univariate Statistik. 2M. Kresken Graphische Darstellung Kreisdiagramm Stabdiagramm (Säulen-, Balkendiagramm) Histogramm

20M. Kresken

Mittelwert

• Geometrischer Mittelwert:- Werte: 0,25, 0,5, 1, 2, 4, 8, 16

x log2 x log2 x + 9

0,25 0,25 = 2-2 log2 0,25 = –2 -2 + 9 = 7

0,5 0,5 = 2-1 log2 0,5 = –1 -1 + 9 = 8

1 1 = 20 log2 1 = 0 0 + 9 = 9

2 2 = 21 log2 2 = 1 1 + 9 = 10

4 4 = 22 log2 4 = 2 2 + 9 = 11

8 8 = 23 log2 8 = 3 3 + 9 = 12

16 16 = 24 log2 16 = 4 4 + 9 = 13

Page 21: 1M. Kresken Univariate Statistik. 2M. Kresken Graphische Darstellung Kreisdiagramm Stabdiagramm (Säulen-, Balkendiagramm) Histogramm

21M. Kresken

Mittelwert

• Geometrischer Mittelwert:

- Transformierte Werte (log2 x + 9): 7, 8, 9, 10, 11, 12, 13

x = _ 7 + 8 + 9 + 10 + 11 + 12 + 13

7 = 10

Rücktransformation: 10 – 9 = 1

1 = log2 2

21 = 2

Mittelwert: 2

Page 22: 1M. Kresken Univariate Statistik. 2M. Kresken Graphische Darstellung Kreisdiagramm Stabdiagramm (Säulen-, Balkendiagramm) Histogramm

22M. Kresken

Quantile, Median

• Ein p-Quantil ist dadurch gekennzeichnet, dass mindestens der Anteil p der Werte kleiner oder gleich diesem Wert ist.

• x, das 0,5-Quantil, Median genannt

• Q1, das 0,25-Quantil, unteres Quartil genannt

• Q3, das 0,75-Quantil, oberes Quartil genannt

• Die 0,1-, 0,2 .... 0,9-Quantile heißen Dezile.• Die 0,01-, 0,02 .... 0,09-Quantile heißen Percentile.

~

Page 23: 1M. Kresken Univariate Statistik. 2M. Kresken Graphische Darstellung Kreisdiagramm Stabdiagramm (Säulen-, Balkendiagramm) Histogramm

23M. Kresken

Quantile, Median

• Das p-Quantil lässt sich aus der Rangliste von n Messwerten bestimmen.

• Zunächst wird das Produkt n x p berechnet.• Ist n x p keine ganze Zahl, so ist das p-Quantil der k-te

Wert x (k) der Rangliste, wobei k die auf n x p folgende ganze Zahl ist.

• Falls n x p eine ganze Zahl ist, so wird zur Bestimmung des p-Quantils zwischen den Werten x (n x p) und x (n x p + 1) interpoliert.

(x (n x p) + x (n x p + 1) )1

2

Page 24: 1M. Kresken Univariate Statistik. 2M. Kresken Graphische Darstellung Kreisdiagramm Stabdiagramm (Säulen-, Balkendiagramm) Histogramm

24M. Kresken

Quantile, Median

• Median und Quartile der Blutzuckerkonzentrationen von n = 52 Probanden

- Berechnung des Medians: Position in der Rangliste n x p = 52 x 0,5 = 26 Da 26 eine ganze Zahl ist, errechnet man den

Median als den mittleren Messwert zwischen dem 26. und 27. Messwert der Rangliste.

Der mediane Blutzuckerwert beträgt (90 + 92) / 2 [mg/100 ml] = 91 [mg/100 ml]

Page 25: 1M. Kresken Univariate Statistik. 2M. Kresken Graphische Darstellung Kreisdiagramm Stabdiagramm (Säulen-, Balkendiagramm) Histogramm

25M. Kresken

Quantile, Median

• Median und Quartile der Blutzuckerkonzentrationen von n = 52 Probanden

- Berechnung des unteren Quartils: Position in der Rangliste n x p = 52 x 0,25 = 13 Da 13 eine ganze Zahl ist, errechnet man das

untere Quartil als den mittleren Messwert zwischen dem 13. und 14. Messwert der Rangliste.

Q1 = (86 + 86) / 2 [mg/100 ml] = 86 [mg/100 ml]

- Berechnung des oberen Quartils: Q3 = (96 + 96) / 2 [mg/100 ml] = 96 [mg/100 ml]

Page 26: 1M. Kresken Univariate Statistik. 2M. Kresken Graphische Darstellung Kreisdiagramm Stabdiagramm (Säulen-, Balkendiagramm) Histogramm

26M. Kresken

Quantile, Median

• Median der Körpergröße von n = 53 Probanden- Berechnung des Medians:

Position in der Rangliste n x p = 53 x 0,5 = 26,5 Da 26,5 keine ganze Zahl ist, ist der 27.

Messwert der Rangliste der Median Der mediane Körpergröße beträgt

172 cm

Page 27: 1M. Kresken Univariate Statistik. 2M. Kresken Graphische Darstellung Kreisdiagramm Stabdiagramm (Säulen-, Balkendiagramm) Histogramm

27M. Kresken

Modalwert

• Der Modalwert ist der Messwert mit der größten absoluten Häufigkeit.

• Er ist nur sinnvoll, wenn er eindeutig ist. • Modalwert der Blutzuckerkonzentrationen von n = 52

Probanden:- Die Werte 84 und 92 wurden jeweils sechs mal

bestimmt.- Der häufigste Messwert ist nicht eindeutig und der

Modalwert damit nicht bestimmbar.

Page 28: 1M. Kresken Univariate Statistik. 2M. Kresken Graphische Darstellung Kreisdiagramm Stabdiagramm (Säulen-, Balkendiagramm) Histogramm

28M. Kresken

Modalwert, Median, Mittelwert

• Der Modalwert ist ein sehr einfach bestimmbares Lagemaß.

• Der Vorteil des Medians gegenüber dem Mittelwert liegt vor allem darin, dass er durch einzelne „Ausreißer“ nicht beeinflusst wird.

• Insofern ist der Median ein robustes Maß.• Ein Vorteil des Mittelwertes besteht darin, dass mit ihm

Rechenoperationen durchgeführt werden können.