46
1 M. Kresken Wahrscheinlich- keitsrechnung

1M. Kresken Wahrscheinlich- keitsrechnung. 2M. Kresken Stetige Zufallsvariable und Dichtefunktion

Embed Size (px)

Citation preview

Page 1: 1M. Kresken Wahrscheinlich- keitsrechnung. 2M. Kresken Stetige Zufallsvariable und Dichtefunktion

1M. Kresken

Wahrscheinlich-keitsrechnung

Page 2: 1M. Kresken Wahrscheinlich- keitsrechnung. 2M. Kresken Stetige Zufallsvariable und Dichtefunktion

2M. Kresken

Stetige Zufallsvariableund Dichtefunktion

Page 3: 1M. Kresken Wahrscheinlich- keitsrechnung. 2M. Kresken Stetige Zufallsvariable und Dichtefunktion

3M. Kresken

Stetige Zufallsvariable und Dichtefunktion

• Im letzten Kapitel wurden die so genannten diskreten Zufallsvariablen vorgestellt.

• Für Merkmale mit kontinuierlichen Werten lässt sich die Argumentation wie folgt modifizieren:

- Beispiel: Körpergröße von Patienten in einer klinischen Prüfung

- Über die Körpergröße des nächsten, in eine Studie eingeschlossenen männlichen Patienten lässt sich zunächst keine exakte, sondern nur eine Wahrscheinlichkeitsaussage machen.

Page 4: 1M. Kresken Wahrscheinlich- keitsrechnung. 2M. Kresken Stetige Zufallsvariable und Dichtefunktion

4M. Kresken

Stetige Zufallsvariable und Dichtefunktion

• Es ist zu erwarten, dass der Wert der Körpergröße eines erwachsenen Mannes eher einen Wert in der Nähe von 1,75 m als in der Nähe von 1,40 m oder 2,10 m liefert.

• Somit sind die Werte um 1,75 m „wahrscheinlicher“ als die um 1,40 m oder 2,10 m.

• Die beobachteten Messwerte liegen dichter um 1,75 m als um 1,40 m oder 2,10 m. Dabei wird angenommen, dass zumindest theoretisch innerhalb eines Messbereiches jeder beliebige Messwert möglich ist.

• Das betrachtete Merkmal (hier die Körpergröße) wird in diesem Sinne als stetige Zufallsgröße bezeichnet.

Page 5: 1M. Kresken Wahrscheinlich- keitsrechnung. 2M. Kresken Stetige Zufallsvariable und Dichtefunktion

5M. Kresken

Stetige Zufallsvariable und Dichtefunktion

• Die Charakteristik stetiger Zufallsvariablen des unterschiedlich dichten Auftretens von Messwerten x kann als Wahrscheinlichkeitsbelegung der Messskala aufgefasst werden und wird formal durch einen funktionalen Zusammenhang ausgedrückt.

• Die sich ergebende Funktion nimmt nur nicht-negative Wert an und heißt Dichte bzw. Dichtefunktion f(x) der Zufallsvariablen X, wobei x den Messwert (die Realisation) der Zufallsvariablen X bezeichnet.

• Sie ist das theoretische Analagon zum Histogramm zur Darstellung der relativen Häufigkeiten von n Messwerten eines stetigen Merkmals.

Page 6: 1M. Kresken Wahrscheinlich- keitsrechnung. 2M. Kresken Stetige Zufallsvariable und Dichtefunktion

6M. Kresken

Histogramm

Systolischer Blutdruck [mmHg]

0,05

0,11

0,240,25

0,18

0,11

0,00

0,05

0,00

0,05

0,10

0,15

0,20

0,25

0,30

(90,100]

(100,110]

(110,120]

(120,130]

(130,140]

(140,150]

(150,160]

(160,170]

rela

tive

Häu

figke

it

Page 7: 1M. Kresken Wahrscheinlich- keitsrechnung. 2M. Kresken Stetige Zufallsvariable und Dichtefunktion

7M. Kresken

Stetige Zufallsvariable und Dichtefunktion

• Flächenstücke unter der Dichtefunktion über einem Interval der x-Achse geben die Wahrscheinlichkeit an, mit der die Zufallsgröße Werte innerhalb dieses Intervalls annimmt.

• Folgerichtig entspricht der Flächeninhalt unter der Gesamtkurve der Wahrscheinlichkeit des sicheren Ergebnisses und hat daher den Wert 1.

• Da einem isolierten Punkt auf der x-Achse unter der Dichtefunktion der Wert 0 zukommt, ist die Wahrscheinlichkeit, dass die Zufallsgröße einen bestimmten Wert annimmt, gleich 0 (z. B. dass die Körpergröße eines erwachsenen Mannes exakt 1,7000... m beträgt; beliebige Messgenauigkeit vorausgesetzt).

Page 8: 1M. Kresken Wahrscheinlich- keitsrechnung. 2M. Kresken Stetige Zufallsvariable und Dichtefunktion

8M. Kresken

Stetige Zufallsvariable und Dichtefunktion

• Ordnet man jedem Wert x auf der x-Achse die Wahrscheinlichkeit zu, mit der die Zufallsgröße X Werte bis zu der Zahl x annimmt, so heißt diese Zuordnung Verteilungsfunktion (F(x)).

• Für jedes x ist F(x) somit die Fläche unter der Dichte f von - bis zu der Stelle x, also als Integral darzustellen:

F(x) = f(u)du.x

-

Page 9: 1M. Kresken Wahrscheinlich- keitsrechnung. 2M. Kresken Stetige Zufallsvariable und Dichtefunktion

9M. Kresken

Stetige Zufallsvariable und Dichtefunktion

• Die Verteilungsfunktion ist das theoretische Analagon zur empirischen Verteilungsfunktion in einer Stichprobe (siehe Univariate Statistik).

• Die gedankliche Brücke für den Übergang von der empirischen zur theoretischen Verteilungsfunktion bildet die folgende vereinfacht formulierte Überlegung:

- Die empirische Verteilungsfunktion eines stetigen Merkmals - beobachtet in einer beliebig großen Stichprobe mit beliebig großer Messgenauigkeit - ist gleich der (theoretischen) Verteilungsfunktion.

Page 10: 1M. Kresken Wahrscheinlich- keitsrechnung. 2M. Kresken Stetige Zufallsvariable und Dichtefunktion

10M. Kresken

Kenngrößen der Verteilungeiner Zufallsvariablen

Page 11: 1M. Kresken Wahrscheinlich- keitsrechnung. 2M. Kresken Stetige Zufallsvariable und Dichtefunktion

11M. Kresken

Kenngrößen der Verteilung einer Zufallsvariablen

• Zur Charakterisierung einer Zufallsgröße lassen sich, ähnlich wie im Rahmen der Beschreibung von Merkmalen, Kenngrößen angeben wie Erwartungswert E(X), Varianz Var (X) oder Verteilungsquantile.

• So ist beispielsweise das 0,95-Quantil jener Wert, unter dem im long run 95% der Beobachtungen liegen werden.

• Analog zur Beschreibung der Statistik ist zwischen diskreten und stetigen Zufallsgrößen zu unterscheiden.

Page 12: 1M. Kresken Wahrscheinlich- keitsrechnung. 2M. Kresken Stetige Zufallsvariable und Dichtefunktion

12M. Kresken

Diskrete Zufallsvariable• Für eine Zufallsvariable Y lässt sich der Erwartungswert E(Y)

anhand der möglichen Beobachtungen yj und der Wahrscheinlichkeit pj ihres Auftretens berechnen:

• Der Erwartungswert ist ein gewichtetes Mittel. Im „physikalischen“ Sinn entspricht er dem Schwerpunkt mit den entsprechenden Wahrscheinlichkeiten.

j

E(Y) = yj pj .

Kenngrößen der Verteilung einer Zufallsvariablen

Page 13: 1M. Kresken Wahrscheinlich- keitsrechnung. 2M. Kresken Stetige Zufallsvariable und Dichtefunktion

13M. Kresken

Diskrete Zufallsvariable• Die Varianz einer diskreten Zufallsvariablen ist allgemein

definiert durch:

• Sie ist ein Streuungsmaß für die Verteilung.

j

Var(Y) = [yj – E(y)]2 pj .

Kenngrößen der Verteilung einer Zufallsvariablen

Page 14: 1M. Kresken Wahrscheinlich- keitsrechnung. 2M. Kresken Stetige Zufallsvariable und Dichtefunktion

14M. Kresken

Binominalverteilung• Für eine nach B(n,p) binominalverteilte Zufallsvariable Y

ergeben sich der Erwartungswert

und die Varianz

Beispiel

E(Y) = n • p

Kenngrößen der Verteilung einer Zufallsvariablen

Var(Y) = n • p (1 – p) .

Page 15: 1M. Kresken Wahrscheinlich- keitsrechnung. 2M. Kresken Stetige Zufallsvariable und Dichtefunktion

15M. Kresken

Binominalverteilung• Für die Binominalverteilung bei n = 5 Spendern mit der

Erfolgswahrscheinlichkeit 0,4 ergeben sich der Erwartungswert

und die Varianz

E(Y) = 5 • 0,4 = 2

Kenngrößen der Verteilung einer Zufallsvariablen

Var(Y) = 5 • 0,4 (1 – 0,4) = 1,2.

Page 16: 1M. Kresken Wahrscheinlich- keitsrechnung. 2M. Kresken Stetige Zufallsvariable und Dichtefunktion

16M. Kresken

• Für stetige Zufallsvariablen X müssen bei der Berechnung der Parameter wie Erwartungswert und Varianz anstatt der Wahrscheinlichkeiten die Werte der Dichtefunktionen berücksichtigt werden.

• Darüber hinaus ist die Summation über die (möglichen) Werte der Zufallsgröße durch die Integration zu ersetzen

• Dann ergeben sich:

Kenngrößen der Verteilung einer Zufallsvariablen

E(X) = x f(x) dx ,

-

Var(X) = (x – E(X))2 f(x) dx .

-

Stetige Zufallsvariable

Page 17: 1M. Kresken Wahrscheinlich- keitsrechnung. 2M. Kresken Stetige Zufallsvariable und Dichtefunktion

17M. Kresken

Standardisierung einer Zufallsvariablen

Page 18: 1M. Kresken Wahrscheinlich- keitsrechnung. 2M. Kresken Stetige Zufallsvariable und Dichtefunktion

18M. Kresken

• Subtrahiert man von jedem Wert der Zufallsgröße X den Erwartungswert E(X) (was einer Verschiebung der Messskala entspricht) und teilt das Ergebnis durch die Wurzel aus der Varianz Var(X) (was einer Normierung der Messskala entspricht), so resultiert eine neue Zufallsgröße Z, die Standardisierung von X:

Standardisierung einer Zufallsvariablen

Z =X – E(X)

Var(X)

Page 19: 1M. Kresken Wahrscheinlich- keitsrechnung. 2M. Kresken Stetige Zufallsvariable und Dichtefunktion

19M. Kresken

• Die standardisierte Zufallsgröße Z ist dadurch charakterisiert, dass sie den Erwartungswert E(Z) = 0 und die Varianz Var(Z) = 1 hat.

• Sie gibt an, um wie viele Standardabweichungen eine Beobachtung über bzw. unter dem Erwartungswert liegt.

Standardisierung einer Zufallsvariablen

Page 20: 1M. Kresken Wahrscheinlich- keitsrechnung. 2M. Kresken Stetige Zufallsvariable und Dichtefunktion

20M. Kresken

• Beispiel: Nach der WHO spricht man von einer Risikogeburt, wenn das Geburtsgewicht unter 2.700 g liegt.

• Aus langjährigen Beobachtungen weiß man, dass die Geburtsgewichte in NRW bei Jungen im Mittel bei 3.400 g(SD 400 g) und bei Mädchen im Mittel bei 3.300 g (SD 350 g) liegen.

• Damit betragen die standardisierten Geburtsgewichte von Risikogeburten:

Standardisierung einer Zufallsvariablen

Jungen =2.700 – 3.400

400= – 1,75 ,

Mädchen =2.700 – 3.300

350= – 1,71 .

Page 21: 1M. Kresken Wahrscheinlich- keitsrechnung. 2M. Kresken Stetige Zufallsvariable und Dichtefunktion

21M. Kresken

Zentraler Grenzwertsatz und Normalverteilung

Page 22: 1M. Kresken Wahrscheinlich- keitsrechnung. 2M. Kresken Stetige Zufallsvariable und Dichtefunktion

22M. Kresken

• Wird eine Zufallsvariable durch viele unabhängige Einflüsse mit kleiner Wirkung bestimmt, beobachtet man, dass sowohl die Wahrscheinlichkeitsfunktion als auch die Wahrscheinlichkeitsdichte eine charakteristische Form annehmen – die der Gauss‘schen Fehler- oder Normalverteilung.

• Der Kurvenverlauf der Normalverteilung ist glockenförmig und die Kurve verläuft symmetrisch um den Erwartungswert.

• Die Normalverteilung besitzt im Abstand einer Standardabweichung vom Erwartungswert Wendepunkte und nähert sich asymptotisch der x-Achse.

Zentraler Grenzwertsatz und Normalverteilung

Page 23: 1M. Kresken Wahrscheinlich- keitsrechnung. 2M. Kresken Stetige Zufallsvariable und Dichtefunktion

23M. Kresken

Zentraler Grenzwertsatz und Normalverteilung

Page 24: 1M. Kresken Wahrscheinlich- keitsrechnung. 2M. Kresken Stetige Zufallsvariable und Dichtefunktion

24M. Kresken

• Die Beobachtung einer Normalverteilung beim unabhängigen Zusammenwirken vieler kleiner Einflussgrößen wird durch den zentralen Grenzwertsatz beschrieben.

• Bei Zufallsexperimenten, wo diese Annahmen als zutreffend angesehen werden können, wird die Normalverteilung als Modell zugrunde gelegt.

• Beispiel

Zentraler Grenzwertsatz und Normalverteilung

Page 25: 1M. Kresken Wahrscheinlich- keitsrechnung. 2M. Kresken Stetige Zufallsvariable und Dichtefunktion

Zentraler Grenzwertsatz und Normalverteilung

Verteilung der mittleren Anzahl von Episoden von Otitis media in den ersten zwei Lebensjahren in einer Stichprobe n = 1

Page 26: 1M. Kresken Wahrscheinlich- keitsrechnung. 2M. Kresken Stetige Zufallsvariable und Dichtefunktion

Zentraler Grenzwertsatz und Normalverteilung

Verteilung der mittleren Anzahl von Episoden von Otitis media in den ersten zwei Lebensjahren in einer Stichprobe n = 2

Page 27: 1M. Kresken Wahrscheinlich- keitsrechnung. 2M. Kresken Stetige Zufallsvariable und Dichtefunktion

Zentraler Grenzwertsatz und Normalverteilung

Verteilung der mittleren Anzahl von Episoden von Otitis media in den ersten zwei Lebensjahren in einer Stichprobe n = 5

Page 28: 1M. Kresken Wahrscheinlich- keitsrechnung. 2M. Kresken Stetige Zufallsvariable und Dichtefunktion

Zentraler Grenzwertsatz und Normalverteilung

Verteilung der mittleren Anzahl von Episoden von Otitis media in den ersten zwei Lebensjahren in einer Stichprobe n = 10

Page 29: 1M. Kresken Wahrscheinlich- keitsrechnung. 2M. Kresken Stetige Zufallsvariable und Dichtefunktion

29M. Kresken

• Die Dichte einer normalverteilten Zufallsvariablen wird eindeutig durch den Erwartungswert sowie die Varianz 2 festgelegt und durch die folgende Funktion beschrieben:

• Die Zufallsvariable heißt dann (,2)-normalverteilt oderN (,2).

Zentraler Grenzwertsatz und Normalverteilung

f(x) =1

2 e

1

2

x – ( )–

2

Page 30: 1M. Kresken Wahrscheinlich- keitsrechnung. 2M. Kresken Stetige Zufallsvariable und Dichtefunktion

Dichteder NormalverteilungN (,2):

Zentraler Grenzwertsatz der Normalverteilung

f() =1

2

Beachte:

Page 31: 1M. Kresken Wahrscheinlich- keitsrechnung. 2M. Kresken Stetige Zufallsvariable und Dichtefunktion

31M. Kresken

• Die zur Präzisierung der Dichte benötigten Parameter werden in praxi durch Stichprobenkenngrößen geschätzt, z. B. der Erwartungswert E(X) durch den „Stichproben“-Mittelwert und die Varianz Var(X) durch die „Stichproben“-Varianz.

• Dies gilt in analoger Weise für die Erfolgsrate p der Binominalverteilung.

Zentraler Grenzwertsatz der Normalverteilung

Page 32: 1M. Kresken Wahrscheinlich- keitsrechnung. 2M. Kresken Stetige Zufallsvariable und Dichtefunktion

32M. Kresken

• Bei praktischen Auswertungen erweist sich die Möglichkeit der Standardisierung einer normalverteilten Zufallsvariablen als sehr hilfreich.

• Durch die Ausnutzung dieser Eigenschaft lassen sich die Quantile einer beliebigen Normalverteilung auf diejenigen der Standardnormalverteilung zurückführen, so dass nur die Verteilung der letzteren tabelliert zu werden braucht.

Zentraler Grenzwertsatz der Normalverteilung

Page 33: 1M. Kresken Wahrscheinlich- keitsrechnung. 2M. Kresken Stetige Zufallsvariable und Dichtefunktion

33M. Kresken

Tabelle der Normalverteilung

Wichtige Werte der Verteilungsfunktion F(z) der Standardnormalverteilung

F(z): Fläche unter derN (0,1)-Dichte von - bis z

Page 34: 1M. Kresken Wahrscheinlich- keitsrechnung. 2M. Kresken Stetige Zufallsvariable und Dichtefunktion

34M. Kresken

Häufig verwendete Wahrscheinlichkeiten der Standardnormalverteilung für symmetrische Intervalle [-z, +z]

-z +z P(-z Z +z)

-1,00 1,00 0,683

-2,00 2,00 0,954

-3,00 3,00 0,997

Page 35: 1M. Kresken Wahrscheinlich- keitsrechnung. 2M. Kresken Stetige Zufallsvariable und Dichtefunktion

35M. Kresken

Symmetrische Intervalle [-z, +z] für ausgewählte Wahrscheinlichkeiten der Standardnormalverteilung

P(-z Z +z) -z +z

0,900 -1,64 +1,64

0,950 -1,96 +1,96

0,990 -2,58 +2,58

0,999 -3,29 +3,29

Page 36: 1M. Kresken Wahrscheinlich- keitsrechnung. 2M. Kresken Stetige Zufallsvariable und Dichtefunktion

36M. Kresken

Zentraler Grenzwertsatz der Normalverteilung

• Man beachte, dass sich die Standardnormalverteilung gemäß der Rücktransformation

in die nicht standardisierte Form überführen lässt.

x = z +

Page 37: 1M. Kresken Wahrscheinlich- keitsrechnung. 2M. Kresken Stetige Zufallsvariable und Dichtefunktion

37M. Kresken

Zentraler Grenzwertsatz der Normalverteilung

• Beispiel: Erwartete Anteile der Risikogeburten unter den Knaben und Madchengeburten in NRW

- Geburtsgewichte < 2.700 g Standardisiertes Geburtsgewicht von Jungen: – 1,75 Erwarteter Anteil:

Page 38: 1M. Kresken Wahrscheinlich- keitsrechnung. 2M. Kresken Stetige Zufallsvariable und Dichtefunktion

38M. Kresken

Tabelle der Normalverteilung

Wichtige Werte der Verteilungsfunktion F(z) der Standardnormalverteilung

F(z): Fläche unter derN (0,1)-Dichte von - bis z

Page 39: 1M. Kresken Wahrscheinlich- keitsrechnung. 2M. Kresken Stetige Zufallsvariable und Dichtefunktion

39M. Kresken

Zentraler Grenzwertsatz der Normalverteilung

• Beispiel: Erwartete Anteile der Risikogeburten unter den Knaben und Madchengeburten in NRW

- Geburtsgewichte < 2.700 g Standardisiertes Geburtsgewicht von Jungen: – 1,75 Erwarteter Anteil: 0,0401; 4,0%

Standardisiertes Geburtsgewicht von Mädchen: – 1,71 Erwarteter Anteil:

Page 40: 1M. Kresken Wahrscheinlich- keitsrechnung. 2M. Kresken Stetige Zufallsvariable und Dichtefunktion

40M. Kresken

Tabelle der Normalverteilung

Wichtige Werte der Verteilungsfunktion F(z) der Standardnormalverteilung

F(z): Fläche unter derN (0,1)-Dichte von - bis z

Page 41: 1M. Kresken Wahrscheinlich- keitsrechnung. 2M. Kresken Stetige Zufallsvariable und Dichtefunktion

41M. Kresken

Zentraler Grenzwertsatz der Normalverteilung

• Beispiel: Erwartete Anteile der Risikogeburten unter den Knaben und Madchengeburten in NRW

- Geburtsgewichte < 2.700 g Standardisiertes Geburtsgewicht von Jungen: – 1,75 Erwarteter Anteil: 0,0401; 4,0% Standardisiertes Geburtsgewicht von Mädchen: – 1,71

Erwarteter Anteil: 0,0436; 4,4%

Die Wahrscheinlichkeitsangaben treffen jedoch nur zu, wenn die Geburtsgewichte tatsächlich normalverteilt sind.Dies kann z. B. mit Hilfe eines Normal-Probability-Plots überprüft werden.

Page 42: 1M. Kresken Wahrscheinlich- keitsrechnung. 2M. Kresken Stetige Zufallsvariable und Dichtefunktion

42M. Kresken

Tabelle der Normalverteilung

F(z): Fläche unter derN (0,1)-Dichte von - bis –1,53

Page 43: 1M. Kresken Wahrscheinlich- keitsrechnung. 2M. Kresken Stetige Zufallsvariable und Dichtefunktion

43M. Kresken

Tabelle der Normalverteilung

• Aufgrund der Symmetrie der Dichte der Standardnormalverteilung um den Wert ‚0‘ folgt für die zugehörige Dichtefunktion F(z):

Damit ergibt sich, dass die Wahrscheinlichkeit 0,9370 beträgt und bei der N(0,1)-Verteilung ein Wert vorkommt, der kleiner oder gleich +1,53 ist.

F(-z) = 1 - F(+z)

Page 44: 1M. Kresken Wahrscheinlich- keitsrechnung. 2M. Kresken Stetige Zufallsvariable und Dichtefunktion

44M. Kresken

Zentraler Grenzwertsatz der Normalverteilung

• Umgekehrt lässt sich das -Quantil z() der Standardnormalverteilung aus der Tabelle ermitteln

Page 45: 1M. Kresken Wahrscheinlich- keitsrechnung. 2M. Kresken Stetige Zufallsvariable und Dichtefunktion

45M. Kresken

Tabelle der Normalverteilung

Für das 0,05-Quantil( = 0,05) ergibt sich:

• der z-Wert von 0,0505 ist –1,64• der z-Wert von 0,0495 ist –1,65• durch lineare Interpolation ergibt

sich –1,645.

Page 46: 1M. Kresken Wahrscheinlich- keitsrechnung. 2M. Kresken Stetige Zufallsvariable und Dichtefunktion

46M. Kresken

Tabelle der Normalverteilung

Entsprechend ergibt sich für das 0,975-Quantil ( = 0,975):

Verwenden der Symmetriez(0,975)= -z(1 – 0,975)= -z(0,025)= -(-1,96)= 1,96