38
Vorlesung Biometrie für Studierende der Veterinärmedizin 16.11.2006 Stetige Zufallsgrößen b a dx x f b X a P ) ( ) ( Darstellung durch Dichtefunktion f

Vorlesung Biometrie für Studierende der Veterinärmedizin 16.11.2006 Stetige Zufallsgrößen Darstellung durch Dichtefunktion f

Embed Size (px)

Citation preview

Page 1: Vorlesung Biometrie für Studierende der Veterinärmedizin 16.11.2006 Stetige Zufallsgrößen Darstellung durch Dichtefunktion f

Vorlesung Biometrie für Studierende der Veterinärmedizin 16.11.2006

Stetige Zufallsgrößen

b

adxxfbXaP )()(

• Darstellung durch Dichtefunktion f

Page 2: Vorlesung Biometrie für Studierende der Veterinärmedizin 16.11.2006 Stetige Zufallsgrößen Darstellung durch Dichtefunktion f

Vorlesung Biometrie für Studierende der Veterinärmedizin 16.11.2006

:

dxxfbFXPb

)()(b)(

Verteilungsfunktion stetiger Zufallsgrößen

-4 -2 0 2 4

0.0

0.1

0.2

0.3

0.4

x

Dic

hte

b

Page 3: Vorlesung Biometrie für Studierende der Veterinärmedizin 16.11.2006 Stetige Zufallsgrößen Darstellung durch Dichtefunktion f

Vorlesung Biometrie für Studierende der Veterinärmedizin 16.11.2006

Erwartungswert und Varianz stetiger Zufallsgrößen

Ist stetig mit Dichtefunktion , so definiert man:xf

dxxfXExXEXEXVar

dxxxfXE

)())(()))((()(

)()(

22

X

Page 4: Vorlesung Biometrie für Studierende der Veterinärmedizin 16.11.2006 Stetige Zufallsgrößen Darstellung durch Dichtefunktion f

Vorlesung Biometrie für Studierende der Veterinärmedizin 16.11.2006

Erwartungswert von linear transformierten Zufallsgrößen

Für eine Zufallsvariable X gilt (mit beliebigen Konstanten a und b):

)()(

)()(2 XVarbXbaVar

XEbaXbaE

Page 5: Vorlesung Biometrie für Studierende der Veterinärmedizin 16.11.2006 Stetige Zufallsgrößen Darstellung durch Dichtefunktion f

Vorlesung Biometrie für Studierende der Veterinärmedizin 16.11.2006

Eine stetige Zufallsvariable X heißt normalverteilt mit den Parametern , kurz X~N , falls sie die folgende Dichtefunktion besitzt:

2,

2

2)(

2

1exp

2

1:)(

x

Xf X

2 und

Erwartungswert Varianz 2)( XVar

Normalverteilung: Definition

)(XE

Page 6: Vorlesung Biometrie für Studierende der Veterinärmedizin 16.11.2006 Stetige Zufallsgrößen Darstellung durch Dichtefunktion f

Vorlesung Biometrie für Studierende der Veterinärmedizin 16.11.2006

Normalverteilung

);(~ 2NX

dtexF

sfunktionVerteilung

dtexf

tx

x

2)(5,0

2)(5,0

2

1)(

2

1)(

Beschreibung: „Glockenkurve“

Page 7: Vorlesung Biometrie für Studierende der Veterinärmedizin 16.11.2006 Stetige Zufallsgrößen Darstellung durch Dichtefunktion f

Vorlesung Biometrie für Studierende der Veterinärmedizin 16.11.2006

Anwendung der Normalverteilung

Die Normalverteilung dient als Verteilungsmodellin vielen praktischen Fragestellungen, z.B. bei

• Metrische Größen einer Population• Summen und Durchschnitte von Zufallsgrößen• Natürliche Variabilität• Messfehler

Page 8: Vorlesung Biometrie für Studierende der Veterinärmedizin 16.11.2006 Stetige Zufallsgrößen Darstellung durch Dichtefunktion f

Vorlesung Biometrie für Studierende der Veterinärmedizin 16.11.2006

Page 9: Vorlesung Biometrie für Studierende der Veterinärmedizin 16.11.2006 Stetige Zufallsgrößen Darstellung durch Dichtefunktion f

Vorlesung Biometrie für Studierende der Veterinärmedizin 16.11.2006

Schwankungsbereiche der Normalverteilung

Page 10: Vorlesung Biometrie für Studierende der Veterinärmedizin 16.11.2006 Stetige Zufallsgrößen Darstellung durch Dichtefunktion f

Vorlesung Biometrie für Studierende der Veterinärmedizin 16.11.2006

Beispiel zur Normalverteilung

Bei 250 Katzen wurde der Creatinwert im Blut gemessen:

Studie:Judit Zapirain Gastón et al. Prävalenzen des felinen Herpesvirus-1 felinen Calicivirus und von Chlamydophila felis in Mehrkatzenhaushalten

Page 11: Vorlesung Biometrie für Studierende der Veterinärmedizin 16.11.2006 Stetige Zufallsgrößen Darstellung durch Dichtefunktion f

Vorlesung Biometrie für Studierende der Veterinärmedizin 16.11.2006

Quantile der Normalverteilung: Beispiel

Beispiel: Fehler bei Messung

• P (X > 20)

• P (5 < X < 20)

• P (-2 < X < 15)

Es sei X eine normalverteilte Zufallsvariable mit =10 und =25.Bestimmen Sie die folgenden Wahrscheinlichkeiten:

2

Page 12: Vorlesung Biometrie für Studierende der Veterinärmedizin 16.11.2006 Stetige Zufallsgrößen Darstellung durch Dichtefunktion f

Vorlesung Biometrie für Studierende der Veterinärmedizin 16.11.2006

i.i.d. Zufallsgrößen

seien unabhängig und identisch verteilt.

Man schreibt auch dafür:

i.i.d. steht für „independent and identically distributed“.

Ist und ,

so gilt:

...,...,, 21 diiXXX n

nXXX

nVar

XXXn

E

nXXXVar

nXXXE

n

n

n

n

2

21

21

221

21

))...(1

(

))...(1

(

)...(

)...(

nXXX ,...,, 21

)( iXE2)( iXVar

Page 13: Vorlesung Biometrie für Studierende der Veterinärmedizin 16.11.2006 Stetige Zufallsgrößen Darstellung durch Dichtefunktion f

Vorlesung Biometrie für Studierende der Veterinärmedizin 16.11.2006

Grenzwertsätze

• Gesetz der großen Zahlen: Ist der Erwartungswert einer ZG X, so

liegt das der Mittelwert mit wachsendem n nahe bei

• Zentraler Grenzwertsatz: ist für große n annähernd normalverteilt. X

Bei einer Stichprobenziehung werden n Personen gefragt odern unabhängige Experimente durchgeführt. Man ordnet jedem Versuch eine Zufallsgröße Xn zu. Die n Zufallsgrößen sind dann i.i.d.Von Interesse ist dann u.a. die Verteilung des Stichprobenmittels

)...(1

: 21 nXXXn

X

X

Page 14: Vorlesung Biometrie für Studierende der Veterinärmedizin 16.11.2006 Stetige Zufallsgrößen Darstellung durch Dichtefunktion f

Vorlesung Biometrie für Studierende der Veterinärmedizin 16.11.2006

Diskrete Wahrscheinlichkeitsmodelle

)exp(!

)(

kkXP

k

Wahrscheinlichkeitsfunktion

• Poisson-Verteilung: Zählen seltener Ereignisse

Beispiele: Zahl der Fischvergiftungen pro Zeiteinheit

Zahl der Spontantumoren pro Zeiteinheit

historisch: Zahl der Todesfälle durch Hufschlag pro Jahr und Regiment

Page 15: Vorlesung Biometrie für Studierende der Veterinärmedizin 16.11.2006 Stetige Zufallsgrößen Darstellung durch Dichtefunktion f

Vorlesung Biometrie für Studierende der Veterinärmedizin 16.11.2006

Beispiel für Possion-Verteilung

Wahrscheinlichkeitsfunktion

Page 16: Vorlesung Biometrie für Studierende der Veterinärmedizin 16.11.2006 Stetige Zufallsgrößen Darstellung durch Dichtefunktion f

Vorlesung Biometrie für Studierende der Veterinärmedizin 16.11.2006

Lebensdauerverteilungen

Beispiel: Lebensdauern

• Exponentialverteilung

Page 17: Vorlesung Biometrie für Studierende der Veterinärmedizin 16.11.2006 Stetige Zufallsgrößen Darstellung durch Dichtefunktion f

Vorlesung Biometrie für Studierende der Veterinärmedizin 16.11.2006

Zusammenfassung: Verteilungen

• Wahrscheinlichkeitsmodelle dienen dazu, bestimmte (unsichere) Phänomene zu charakterisieren.

• Das Wahrscheinlichkeitsmodell ist abhängig von der zu charakterisierenden Größe. In der Literatur gibt es eine Vielzahl solcher Verteilungen.

• Man unterscheidet diskrete und stetige Verteilungen (Wahrscheinlichkeitsmodelle).

• Wichtige Kennzahlen von Verteilungen sind Erwartungswert und Varianz.

• Verteilungen haben meist Parameter, die durch das Problem gegeben sind, oder aus Daten geschätzt werden.

Page 18: Vorlesung Biometrie für Studierende der Veterinärmedizin 16.11.2006 Stetige Zufallsgrößen Darstellung durch Dichtefunktion f

Vorlesung Biometrie für Studierende der Veterinärmedizin 16.11.2006

Statistische Erhebungen

• Befragungen z.B. Befragung der Landwirte über das Verhalten der Tiere im Stall

• Experimente z.B. Versuch, welches Arzneimittel am besten zur Heilung führt

• Beobachtungen Auftreten einer Krankheit Erhebungen zu Tieren in einer Tierklinik

Bei der Erhebung von Daten unterscheidet man:

Page 19: Vorlesung Biometrie für Studierende der Veterinärmedizin 16.11.2006 Stetige Zufallsgrößen Darstellung durch Dichtefunktion f

Vorlesung Biometrie für Studierende der Veterinärmedizin 16.11.2006

Unterscheidungseinheiten / statistische Einheit / Merkmalsträger

• Einzelne Tiere

• Einzelne Herden

• Einzelne Landwirte

• Haushalte

Individuen, die einer Erhebung zugrunde liegen

Beispiele:

Page 20: Vorlesung Biometrie für Studierende der Veterinärmedizin 16.11.2006 Stetige Zufallsgrößen Darstellung durch Dichtefunktion f

Vorlesung Biometrie für Studierende der Veterinärmedizin 16.11.2006

Merkmale (Variablen)

Eigenschaften Untersuchungseinheiten z.B.

• Krankheitsstatus

• Blutparameter

• Geschlecht

• Anzahl der Kühe (bei Untersuchungseinheit Landwirt)

Merkmalsausprägungen

mögliche Werte des Merkmals

• Messergebnisse / positive Zahlen

• krank / gesund

Page 21: Vorlesung Biometrie für Studierende der Veterinärmedizin 16.11.2006 Stetige Zufallsgrößen Darstellung durch Dichtefunktion f

Vorlesung Biometrie für Studierende der Veterinärmedizin 16.11.2006

Charakterisierung von Merkmalen

quantitative Merkmale unterscheiden sich durch ihre Größe

• Alter, Gewicht, Milchleistung, Temperatur, Anzahl Keime, Schadstoffgehalt, …

qualitative Merkmale unterscheiden sich durch ihre Art

• Geschlecht, Namen, Rassen, Haltungsform

Page 22: Vorlesung Biometrie für Studierende der Veterinärmedizin 16.11.2006 Stetige Zufallsgrößen Darstellung durch Dichtefunktion f

Vorlesung Biometrie für Studierende der Veterinärmedizin 16.11.2006

Merkmalswerte

Die gemessenen, erfragten oder beobachteten Ausprägungendes Untersuchungsmerkmals sind die Merkmalswerte. Siestellen die Daten der Erhebung dar.

• Wiederkauverhalten: z.B. in Stunden pro Tag

• Arzneimittel: Dosis 1, Dosis 2, Dosis 0 (Placebo)

• Befund: gesund, fraglich, erkrankt

• Keimzahlen: Anzahl in 1000

Page 23: Vorlesung Biometrie für Studierende der Veterinärmedizin 16.11.2006 Stetige Zufallsgrößen Darstellung durch Dichtefunktion f

Vorlesung Biometrie für Studierende der Veterinärmedizin 16.11.2006

Skalen

Metrische Skala: Die Werte unterliegen einer Rangfolge und die

Abstände zwischen den Werten der Skala lassen sich interpretieren.

• Gewicht, Keimzahlen, Schadstoffmessung

Ordinalskala: Die Werte unterliegen einer Rangfolge, aber die Ab-

stände zwischen den Werten der Skala lassen sich nicht interpretieren.

• Bewertung (Noten), Gesundheitszustand

Nominalskala: Die Werte unterliegen keiner Rangfolge und sind nicht

Vergleichbar

• Geschlecht, Rasse, Haltungsform

Page 24: Vorlesung Biometrie für Studierende der Veterinärmedizin 16.11.2006 Stetige Zufallsgrößen Darstellung durch Dichtefunktion f

Vorlesung Biometrie für Studierende der Veterinärmedizin 16.11.2006

Deskriptive Statistik

Ziel: Beschreibung von Daten mit möglichst geringem

Informationsverlust

• Eigenschaften und Strukturen sichtbar machen• Graphisch und durch Kennwerte• Eindimensional und mehrdimensional• Zunächst keine Schlüsse auf die Grundgesamtheit

Page 25: Vorlesung Biometrie für Studierende der Veterinärmedizin 16.11.2006 Stetige Zufallsgrößen Darstellung durch Dichtefunktion f

Vorlesung Biometrie für Studierende der Veterinärmedizin 16.11.2006

Rohdaten und Datenmatrix

Die Daten liegen in der Regel als Datenmatrix vor:

• Zeilen entsprechen Untersuchungseinheiten• Spalten entsprechen Merkmalen• Elemente der Matrix sind die Merkmalsausprägungen• Fragen mit Mehrfachnennungen als Einzelne binäre Merkmale definieren

Hinweise zur Eingabe unter:www.stat.uni-muenchen.de/stablab/Excel.html

Page 26: Vorlesung Biometrie für Studierende der Veterinärmedizin 16.11.2006 Stetige Zufallsgrößen Darstellung durch Dichtefunktion f

Vorlesung Biometrie für Studierende der Veterinärmedizin 16.11.2006

Beispiel: Daten zu Mastenten (Ausschnitt)

- Ändern -

Page 27: Vorlesung Biometrie für Studierende der Veterinärmedizin 16.11.2006 Stetige Zufallsgrößen Darstellung durch Dichtefunktion f

Vorlesung Biometrie für Studierende der Veterinärmedizin 16.11.2006

Eindimensionale Statistische Kennwerte

Lagemaßzahlen

• Wo liegt die Masse der Daten?• Wo liegt die Mehrzahl der Daten?• Wo liegt die Mitte der Daten?• Welche Mehrmalsausprägung ist typisch für die

Häufigkeitsverteilung?

Page 28: Vorlesung Biometrie für Studierende der Veterinärmedizin 16.11.2006 Stetige Zufallsgrößen Darstellung durch Dichtefunktion f

Vorlesung Biometrie für Studierende der Veterinärmedizin 16.11.2006

Statistische Kennwerte

• Über welchen Bereich erstrecken sich die Daten?

• Wie groß ist die Schwankung der Ausprägungen?

Page 29: Vorlesung Biometrie für Studierende der Veterinärmedizin 16.11.2006 Stetige Zufallsgrößen Darstellung durch Dichtefunktion f

Vorlesung Biometrie für Studierende der Veterinärmedizin 16.11.2006

Eindimensionale Häufigkeitsverteilung

Hämatokrit

3 2,5 3,8 3,8

7 5,8 8,8 12,5

3 2,5 3,8 16,3

9 7,5 11,3 27,5

16 13,3 20,0 47,5

18 15,0 22,5 70,0

12 10,0 15,0 85,0

5 4,2 6,3 91,3

6 5,0 7,5 98,8

1 ,8 1,3 100,0

80 66,7 100,0

40 33,3

120 100,0

35

36

37

38

39

40

41

42

43

44

Gesamt

Gültig

SystemFehlend

Gesamt

Häufigkeit ProzentGültige

ProzenteKumulierteProzente

Page 30: Vorlesung Biometrie für Studierende der Veterinärmedizin 16.11.2006 Stetige Zufallsgrößen Darstellung durch Dichtefunktion f

Vorlesung Biometrie für Studierende der Veterinärmedizin 16.11.2006

Der Modus

Eigenschaften:

• oft nicht eindeutig• nur bei gruppierten Daten oder bei Merkmalen mit wenigen

Ausprägungen sinnvoll• stabil bei allen eindeutigen Transformationen• geeignet für alle Skalenniveaus

Definition: Häufigster Wert

Page 31: Vorlesung Biometrie für Studierende der Veterinärmedizin 16.11.2006 Stetige Zufallsgrößen Darstellung durch Dichtefunktion f

Vorlesung Biometrie für Studierende der Veterinärmedizin 16.11.2006

Beispiel Modus

Modus = 4

Page 32: Vorlesung Biometrie für Studierende der Veterinärmedizin 16.11.2006 Stetige Zufallsgrößen Darstellung durch Dichtefunktion f

Vorlesung Biometrie für Studierende der Veterinärmedizin 16.11.2006

Der Median

50% der Daten sind kleiner oder gleich med

50% der Daten sind größer oder gleich med

Zahlganzen

kfallsxx

Zahlganzen

kfallsx

hk

k

2)(

2

12

1

)1()(

)(

)()1( nxx

med =

sind geordnete Werte

Definition: Wert für den gilt

Page 33: Vorlesung Biometrie für Studierende der Veterinärmedizin 16.11.2006 Stetige Zufallsgrößen Darstellung durch Dichtefunktion f

Vorlesung Biometrie für Studierende der Veterinärmedizin 16.11.2006

Eigenschaften des Median

• anschaulich• stabil gegenüber monotonen Transformationen• geeignet für ordinale Daten• stabil gegenüber Ausreißern

Page 34: Vorlesung Biometrie für Studierende der Veterinärmedizin 16.11.2006 Stetige Zufallsgrößen Darstellung durch Dichtefunktion f

Vorlesung Biometrie für Studierende der Veterinärmedizin 16.11.2006

Beispiel Median

Statistiken

Hämatokrit80

40

40,00

40

Gültig

Fehlend

N

Median

Modus

Hämatokrit

3 2,5 3,8 3,8

7 5,8 8,8 12,5

3 2,5 3,8 16,3

9 7,5 11,3 27,5

16 13,3 20,0 47,5

18 15,0 22,5 70,0

12 10,0 15,0 85,0

5 4,2 6,3 91,3

6 5,0 7,5 98,8

1 ,8 1,3 100,0

80 66,7 100,0

40 33,3

120 100,0

35

36

37

38

39

40

41

42

43

44

Gesamt

Gültig

SystemFehlend

Gesamt

Häufigkeit ProzentGültige

ProzenteKumulierteProzente

Page 35: Vorlesung Biometrie für Studierende der Veterinärmedizin 16.11.2006 Stetige Zufallsgrößen Darstellung durch Dichtefunktion f

Vorlesung Biometrie für Studierende der Veterinärmedizin 16.11.2006

Das Quantil (Perzentil)

Anteil p der Daten sind kleiner oder gleich xp

Anteil 1-p der Daten sind größer oder gleich xp

Zahlganzenpkfallsxx

nphlkleinsteZakundZahlganzekeinenpfallsx

hk

k

)(2

1 )1()(

)(

Definition: Wert für den gilt

Page 36: Vorlesung Biometrie für Studierende der Veterinärmedizin 16.11.2006 Stetige Zufallsgrößen Darstellung durch Dichtefunktion f

Vorlesung Biometrie für Studierende der Veterinärmedizin 16.11.2006

Fünf-Punkte Zusammenfassung

Minimum, 25%-Quantil, Median,75%-Quantil,Maximum

Statistiken

Hämatokrit80

40

40,00

36,00

38,00

40,00

41,00

42,00

44,00

Gültig

Fehlend

N

Median

10

25

50

75

90

99

Perzentile

Hämatokrit

3 2,5 3,8 3,8

7 5,8 8,8 12,5

3 2,5 3,8 16,3

9 7,5 11,3 27,5

16 13,3 20,0 47,5

18 15,0 22,5 70,0

12 10,0 15,0 85,0

5 4,2 6,3 91,3

6 5,0 7,5 98,8

1 ,8 1,3 100,0

80 66,7 100,0

40 33,3

120 100,0

35

36

37

38

39

40

41

42

43

44

Gesamt

Gültig

SystemFehlend

Gesamt

Häufigkeit ProzentGültige

ProzenteKumulierteProzente

Page 37: Vorlesung Biometrie für Studierende der Veterinärmedizin 16.11.2006 Stetige Zufallsgrößen Darstellung durch Dichtefunktion f

Vorlesung Biometrie für Studierende der Veterinärmedizin 16.11.2006

Der Mittelwert (arithmetisches Mittel)

n

inx

1

1

• bekanntestes Lagemaß

• instabil gegen extreme Werte • geeignet für Intervallskalierte Daten

ix

Page 38: Vorlesung Biometrie für Studierende der Veterinärmedizin 16.11.2006 Stetige Zufallsgrößen Darstellung durch Dichtefunktion f

Vorlesung Biometrie für Studierende der Veterinärmedizin 16.11.2006

Beispiel Mittelwert

Hämatokrit

3 2,5 3,8 3,8

7 5,8 8,8 12,5

3 2,5 3,8 16,3

9 7,5 11,3 27,5

16 13,3 20,0 47,5

18 15,0 22,5 70,0

12 10,0 15,0 85,0

5 4,2 6,3 91,3

6 5,0 7,5 98,8

1 ,8 1,3 100,0

80 66,7 100,0

40 33,3

120 100,0

35

36

37

38

39

40

41

42

43

44

Gesamt

Gültig

SystemFehlend

Gesamt

Häufigkeit ProzentGültige

ProzenteKumulierteProzente

Deskriptive Statistik

80 35 44 39,48 2,093

80

Hämatokrit

Gültige Werte(Listenweise)

N Minimum Maximum MittelwertStandardabweichung