32
Kapitel 21 Betingede fordelinger Hvis man i et eksperiment observerer to stokastiske variable, X og Y , er det ofte hen- sigtsmæssigt at skrue sin sandsynlighedsteoretiske model sammen på en sådan måde at eksperimentet ses som todelt: først observeres X - dernæst observeres Y . Det er na- turligt at tænke at den mekanisme hvorefter Y trækkes afhænger af hvilket resultat der kom ud af X-målingen. En sådan totrinsmodel kan fremkomme ved desintegration af den simultane fordeling af X og Y - vi taler om at finde den betingede fordeling af Y givet X. Mange eksperimenter har rent fysisk denne totrinskarakter. Men også for eksperi- menter der ikke i praksis forløber efter et totrinsskema kan beskrivelsen af forsøget via en betinget fordeling være et nyttigt værktøj til at forstå samvariationen mellem de to variable. 21.1 Definition af betingede fordelinger Lad X og Y være stokastiske variable fra (Ω, F, P) ind i (X, E) henholdsvis (Y, K). Den simultane fordeling af X og Y , altså billedmålet (X, Y )(P), er et sandsynligheds- mål på (X×Y, E K). Hvis denne fordeling kan desintegreres med hensyn til X, kaldes den resulterende (X, E)-Markovkerne på (Y, K) for den (regulære) betingede fordeling af Y givet X. 442

Betingede fordelinger - web.math.ku.dkweb.math.ku.dk/~erhansen/stat2_08/doku/noter/Betinget.pdf · først trækning ændrer urnens indhold. Men hvis vi ikke ved hvad der er blevet

  • Upload
    others

  • View
    0

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Betingede fordelinger - web.math.ku.dkweb.math.ku.dk/~erhansen/stat2_08/doku/noter/Betinget.pdf · først trækning ændrer urnens indhold. Men hvis vi ikke ved hvad der er blevet

Kapitel 21

Betingede fordelinger

Hvis man i et eksperiment observerer to stokastiske variable, X ogY, er det ofte hen-sigtsmæssigt at skrue sin sandsynlighedsteoretiske modelsammen på en sådan mådeat eksperimentet ses som todelt: først observeresX - dernæst observeresY. Det er na-turligt at tænke at den mekanisme hvorefterY trækkes afhænger af hvilket resultat derkom ud afX-målingen. En sådan totrinsmodel kan fremkomme ved desintegration afden simultane fordeling afX og Y - vi taler om at finde den betingede fordeling afYgivet X.

Mange eksperimenter har rent fysisk denne totrinskarakter. Men også for eksperi-menter der ikke i praksis forløber efter et totrinsskema kanbeskrivelsenaf forsøgetvia en betinget fordeling være et nyttigt værktøj til at forstå samvariationen mellemde to variable.

21.1 Definition af betingede fordelinger

Lad X og Y være stokastiske variable fra (Ω, F,P) ind i (X,E) henholdsvis (Y,K).Den simultane fordeling afX og Y, altså billedmålet (X,Y)(P), er et sandsynligheds-mål på (X × Y,E ⊗ K). Hvis denne fordeling kan desintegreres med hensyn tilX,kaldes den resulterende (X,E)-Markovkerne på (Y,K) for den(regulære) betingedefordeling af Y givet X.

442

Page 2: Betingede fordelinger - web.math.ku.dkweb.math.ku.dk/~erhansen/stat2_08/doku/noter/Betinget.pdf · først trækning ændrer urnens indhold. Men hvis vi ikke ved hvad der er blevet

21.1. Definition af betingede fordelinger 443

B: Vi ynder at tale omden betingede fordeling. Men det fremgår af enty-dighedssætning for mål fremkommet ved integration, at Markovkernen ikke er heltentydigt bestemt: der kan altid fifles med nulmængder. Hvis man skal være helt kon-sistent, bør man tale oménbetinget fordeling. Men den ubestemte sprogbrug er ikketil at bære i længden, og derfor formulerer man sig som om betingede fordelinger erhelt entydige og altid eksisterer.

Sætning 21.1Lad X og Y være stokastiske variable fra(Ω, F,P) ind i (X,E) hen-holdsvis(Y,K). Hvis (Px)x∈X er den betingede fordeling af Y givet X, så gælder derat

P(X ∈ A,Y ∈ B) =∫

APx(B) dX(P)(x) for A ∈ E, B ∈ K. (21.1)

Omvendt, hvis(Px)x∈X er en(X,E)-Markovkerne på(Y,K) som opfylder (21.1), såer (Px)x∈X den betingede fordeling af Y givet X.

B: Hvis (Px)x∈X er den betingede fordeling afY givet X, så er

P(X ∈ A,Y ∈ B) = (X,Y)(P)(A× B) =∫

APx(B) dX(P)(x).

Omvendt, hvis (Px)x∈X er en Markovkerne der opfylder (21.1), så kan vi ladeλ væreintegrationen af (Px)x∈X med hensyn tilX(P). Formel (21.1) siger atλ og (X,Y)(P)stemmer overens på produktmængderA × B. Men disse mængder udgør et fælles-mængdestabilt frembringersystem forE ⊗ K, såλ = (X,Y)(P). Idet (Px)x∈X per kon-struktion er desintegrationen afλ med hensyn tilX, følger det nu at (Px)x∈X er denbetingede fordeling afY givet X.

Fortolkningen af den betingede fordeling afY givet X er atPx beskriver fordelingenaf Y hvis vi ved atX = x. Man står sig ved at tænke i disse baner, uden dog at tagefortolkningen alt for alvorligt. Den er nemlig svær at tillægge nogen præcis mening.Problemet er at man ofte “betinger med en nulmængde”.

Hvis man skal angive den betingede fordeling afY givet X, er det ikke nødvendigtat angive en fuld Markovkerne (Px)x∈X. Siden Markovkernen skal integreres medhensyn tilX(P), er det nok at angive (Px)x∈A0, indiceret ved punkterne i en mængdeA0 ∈ EmedP(X ∈ A0) = 1.

Page 3: Betingede fordelinger - web.math.ku.dkweb.math.ku.dk/~erhansen/stat2_08/doku/noter/Betinget.pdf · først trækning ændrer urnens indhold. Men hvis vi ikke ved hvad der er blevet

444 Kapitel 21. Betingede fordelinger

Notationen med en Markovkerne (Px)x∈X, der gør ditten og datten, er hensigtsmæssigi forbindelse med teoretiske argumenter. Men i mere konkrete sammenhænge, virkerden skrækindjagende tung. Man skriver da ofte

P(Y ∈ B | X = x) i stedet for Px(B) . (21.2)

Hvis hvert Px har tæthed med hensyn til et grundmålν på (Y,K) skriver vi oftef (y | X = x) - eller blot f (y | x) - for den tæthed, der hører tilPx.

Sætning 21.2Lad X og Y være stokastiske variable fra(Ω, F,P) ind i (X,E) hen-holdsvis(Y,K). Hvis X og Y er uafhængige, så er Markovkernen(Px)x∈X givet vedat

Px = Y(P) for alle x∈ X (21.3)

den betingede fordeling af Y givet X.

B: Det er klart at (21.3) specificerer en Markovkerne. Og vi serat∫

APx(B) dX(P)(x) = P(Y ∈ B) ·

A1dX(P)(x) = P(Y ∈ B) · P(X ∈ A).

Uafhængigheden sikrer at det sidste udtryk er ligP(X ∈ A,Y ∈ B).

Sætning 21.3Lad X og Y være stokastiske variable fra(Ω, F,P) ind i (X,E) hhv.(Y,K). Hvis den betingede fordeling(Px)x∈X af Y givet X opfylder at

Px1 = Px2 for alle x1, x2 ∈ X, (21.4)

så er det fælles målPx lig med fordelingen af Y, og X og Y er uafhængige.

B: Lad x1 ∈ X være et fast valgt element. Vi har forB ∈ K at

P(Y ∈ B) = P(X ∈ X,Y ∈ B) =∫

XPx(B) dX(P)(x)

= Px1(B)∫

1dX(P)(x) = Px1(B),

Page 4: Betingede fordelinger - web.math.ku.dkweb.math.ku.dk/~erhansen/stat2_08/doku/noter/Betinget.pdf · først trækning ændrer urnens indhold. Men hvis vi ikke ved hvad der er blevet

21.1. Definition af betingede fordelinger 445

såPx1 er vitterligt lig med fordelingen afY. Og for A ∈ E, B ∈ K er

P(X ∈ A,Y ∈ B) =∫

APx(B) dX(P)(x) = Px1(B)P(X ∈ A)

= P(X ∈ A)P(Y ∈ B)

såX ogY er uafhængige.

Uafhængighed mellem to variableX og Y er altså det samme som at den betingedefordeling afX givet Y (eller omvendt) er konstant. Hvis den betingede fordeling om-vendt består af meget forskellige sandsynlighedsmål, kan det naturligt fortolkes somen kraftig afhængighed mellemX ogY.

En hurtig formulering af disse to sætninger, hvor man ikke bekymrer sig om nul-mængder og den slags, er at sige atX og Y er uafhængige hvis og kun hvis sandsyn-lighederneP(Y ∈ B | X = x) ikke afhænger af detx vi betinger med.

Vi skal nu se, at betingede fordelinger i det diskrete tilfælde blot er elementære be-tingede fordelinger givet hændelser, der har positive sandsynligheder.

Sætning 21.4Lad X og Y være stokastiske variable fra(Ω, F,P) ind i (X,E) hen-holdsvis(Y,K). Antag atX er endelig eller tællelig, og atE er systemet af alle del-mængder påX. Den betingede fordeling(Px)x∈X af Y givet X er da bestemt ved at

Px(B) =P(X = x,Y ∈ B)

P(X = x), B ∈ K (21.5)

for alle x∈ X med P(X = x) > 0.

B: LadA0 = x ∈ X | P(X = x) > 0. Bemærk atX(P)(A0) = 1 så (21.5) definerervirkelig en (X,E,X(P))-Markovkerne på (Y,K) - måleligheden behøver man endikke at tænke over, for alle funktioner påX erE-målelige. For alleB ∈ K har vi at

APx(B) dX(P)(x) =

A∩A0

Px(B) dX(P)(x) =∑

x∈A∩A0

P(X = x,Y ∈ B)P(X = x)

P(X = x)

=∑

x∈A∩A0

P(X = x,Y ∈ B) = P(X ∈ A,Y ∈ B).

Så (Px)x∈X er vitterligt den betingede fordeling afY givet X.

Page 5: Betingede fordelinger - web.math.ku.dkweb.math.ku.dk/~erhansen/stat2_08/doku/noter/Betinget.pdf · først trækning ændrer urnens indhold. Men hvis vi ikke ved hvad der er blevet

446 Kapitel 21. Betingede fordelinger

Normalt skriver man formel (21.5) på formen

P(Y ∈ B | X = x) =P(X = x,Y ∈ B)

P(X = x).

Hvis ogsåY er diskret, kan man nøjes med at angive de betingede sandsynligheds-funktioner,

P(Y = y | X = x) =P(X = x,Y = y)

P(X = x).

I elementære sammenhænge bruges denne formel gerne som definitionen af betin-gede fordelinger.

Eksempel 21.5 Lad der være givet en urne med ialtN kugler. Heraf erN1 røde, ogde øvrigeN − N1 er hvide. Vi trækker kugler fra denne urne, og bruger notation

Xi =

1 hvis deni’te udtrukne kugle er rød

0 hvis deni’te udtrukne kugle er hvid.

Det er klart at

P(X1 = 1) =N1

N, P(X1 = 0) =

N − N1

N,

mens fordelingen af de øvrigeXi ’er afhænger af reglerne for hvordan urnens indholdændres i løbet af trækningsprocessen. Det er som regel nemt at oversætte reglerne tilbetingede fordelinger, mens det kræver større omtanke at oversætte dem til simultanefordelinger eller marginale fordelinger.

Hvis den udtrukne kugle lægges tilbage i urnen igen inden næste kugle trækkes, såer urnens tilstand indeni’te trækning præcis den samme som inden første trækning,uanset hvad der er trukket. Derfor er

P(Xi = 1 | X1 = x1, . . . ,Xi−1 = xi−1) =N1

Nfor alle (x1, . . . , xi−1) ∈ 0, 1i−1 .

Det følger derfor af sætning 21.3 atXi er uafhængig af (X1, . . . ,Xi−1), og har sammefordeling somX1. Altså: trækningmed tilbagelægning fører til uafhængige, identiskfordelte trækninger.

Hvis en udtrukket kugle derimod lægges til side inden næste kugle trækkes, så erurnens tilstand indeni’te trækning afhængig af resultatet af de første trækninger.Hvis vi i første trækning har fået en rød kugle, så er derN1−1 røde kugler ogN−N1

hvide kugler tilbage inden anden trækning. Derfor er

P(X2 = 1 | X1 = 1) =N1 − 1N − 1

.

Page 6: Betingede fordelinger - web.math.ku.dkweb.math.ku.dk/~erhansen/stat2_08/doku/noter/Betinget.pdf · først trækning ændrer urnens indhold. Men hvis vi ikke ved hvad der er blevet

21.1. Definition af betingede fordelinger 447

Hvis vi i stedet har fået en hvid kugle i første trækning, så erder N1 røde kugler ogN − N1 − 1 hvide kugler tilbage inden anden trækning. Derfor er

P(X2 = 1 | X1 = 0) =N1

N − 1.

Vi konstaterer at den betingede fordeling afX2 givet X1 = x1 varierer medx1, ogderfor kanX1 og X2 ikke være uafhængige!

Lad os finde den marginale fordeling fordeling afX2. Det er blandingen af den be-tingede fordeling afX2 givet X1 med hensyn til den marginale fordeling afX1. Merekonkret:

P(X2 = 1) = P(X2 = 1 | X1 = 0)P(X1 = 0)+ P(X2 = 1 | X1 = 1)P(X1 = 1)

=N1

N − 1N − N1

N+

N1 − 1N − 1

N1

N=

N1(N − 1)N(N − 1)

=N1

N.

Interessant nok harX2 samme marginale fordeling somX1. Det kan godt være at denførst trækning ændrer urnens indhold. Men hvis vi ikke ved hvad der er blevet trukketi første omgang, så kan vi sådan set være ligeglade. Der er information i at få at videhvad der er blevet trukket - der er derimod ingen information i kunat få at videatder er blevet trukket.

Vi kan også udlede den simultane fordeling afX1 og X2 ud fra de betingede fordelin-ger. Udblandingsformlen (21.1) giver at

P(X1 = 1,X2 = 1) = P(X2 = 1 | X1 = 1)P(X1 = 1) =N1 − 1N − 1

N1

N,

og tilsvarende for de øvrige punktsandsynligheder. Endelig kan man forestille sigsituationer hvorX2 observeres, mensX1 holdes skjult. Den betingede fordeling afX1

givet X2 kan da findes ved hjælp af Bayes’ formel:

P(X1 = 1 | X2 = 0) =P(X2 = 0 | X1 = 1)P(X1 = 1)

P(X2 = 0)=

N−N1N−1

N1N

N−N1N

=N1

N − 1,

Tilsvarende er

P(X1 = 1 | X2 = 1) =P(X2 = 1 | X1 = 1)P(X1 = 1)

P(X2 = 1)=

N1−1N−1

N1N

N1N

=N1 − 1N − 1

,

Der er en interessant symmetri i problemstillingen: den betingede fordeling afX1

givet X2 er identisk med den betingede fordeling afX2 givet X1!

Page 7: Betingede fordelinger - web.math.ku.dkweb.math.ku.dk/~erhansen/stat2_08/doku/noter/Betinget.pdf · først trækning ændrer urnens indhold. Men hvis vi ikke ved hvad der er blevet

448 Kapitel 21. Betingede fordelinger

Vi kan fortsætte trækningen, og skrive den betingede fordeling afXi+1 op, givet resul-tatet af de førstei trækninger. Hvis vi har opnået resultatet (X1, . . . ,Xi) = (x1, . . . , xi),så har vi fået ialtx• =

∑ij=1 x j røde kugler, og der er derforN1 − x• tilbage. Tilsva-

rende er derN−N1− (i − x•) hvide kugler tilbage i urnen. En strømlinet opskrivningaf den betingede fordeling afXi+1 er derfor

P(Xi+1 = xi+1 | X1 = x1, . . . ,Xi = xi) =(N1 − x•)xi+1 (N − N1 − i + x•)1−xi+1

N − i.

(21.6)Formlen giver for så vidt kun mening, hvis der stadig er både røde og hvide kuglertilbage i urnen - men det er jo også den eneste situation man erinteresseret i at betingemed. Man kan finde den simultane fordeling af (X1, . . . ,Xi+1) ved at blande ud i (21.6)med hensyn til den simultane fordeling af (X1, . . . ,Xi). Ved induktion opnås formlen

P(X1 = x1, . . . ,Xi = xi) =N(x•) (N − N1)(i−x•)

N(i), (x1, . . . , xi) ∈ 0, 1i ,

hvor x• =∑i

j=1 x j, og hvor de runde paranteser i potenserne betyder det nedstigendefaktoriel fra (10.1).

Eksempel 21.6Lad (X1, . . . ,XN) være polynomialfordelt med længden og sandsyn-lighedsparameter (p1, . . . , pN). Vi vil finde den betingede fordeling af (X1, . . . ,XN−1)givet XN. Det følger af (21.5) at der er tale om en diskret fordeling, og vi behøverderfor kun at angive sandsynlighedsfunktionenq(x1, . . . , xN−1 | x), svarende til at vibetinger medXN = x. Vi ser at

q(x1, . . . , xN−1 | x) =P(X1 = x1, . . . ,XN−1 = xN−1,XN = x)

P(XN = x).

Tælleren bliver nul, medmindrex = 0, 1, . . . , n og medmindre

(x1, . . . , xN−1) ∈ S(N − 1, n− x).

Er disse betingelser opfyldt, og udnytter vi atXN er binomialfordelt med længden ogsuccessandsynlighedpN, får vi atq(x1, . . . , xN−1 | x) er lig med

(

nx1, . . . , xN−1, x)

∏N−1i=1 pi

xi pNx

(

nx

)

pNx (1− pN)n−x

=

(

n− xx1, . . . , xN−1

) N−1∏

i=1

(

pi

1− PN

)xi

.

Vi genkender dette som sandsynlighedsfunktionen for polynomialfordelingen medlængden− x og sandsynlighedsparameter

(

p11−pN, . . . ,

pN−11−pN

)

.

Page 8: Betingede fordelinger - web.math.ku.dkweb.math.ku.dk/~erhansen/stat2_08/doku/noter/Betinget.pdf · først trækning ændrer urnens indhold. Men hvis vi ikke ved hvad der er blevet

21.1. Definition af betingede fordelinger 449

Eksempel 21.7LadY1, . . . ,Yn være uafhængige stokastiske variable, og antag at

P(Yi = 0) = 1− p, P(Yi = 1) = p for alle i = 1, . . . , n .

Lad X =∑n

i=1 Y1 være antallet af 1’ere. Vi ser atX er binomialfordelt med parametre(n, p). Vi ønsker at finde den betingede fordeling af (Y1, . . . ,Yn) givet X = x, i formaf den betingede sandsynlighedsfunktionq(y1, . . . , yn | x).

Vi kan nøjes med at interessere os forx = 0, 1, . . . , n. Hvis (y1, . . . , yn) er en 0/1-sekvens med

∑ni=1 yi , x, så erq(y1, . . . , yn | x) = 0. Men hvis

∑ni=1 yi = x ser vi

at

q(y1, . . . , yn | x) =P(Y1 = y1, . . . ,Yn = yn,X = x)

P(X = x)=

P(Y1 = y1, . . . ,Yn = yn)P(X = x)

=

(

∏ni=1 pyi (1− p)1−yi

)

(

nx

)

px(1− p)n−x

=

(

nx

)−1

.

Denne sandsynlighedsfunktion afhænger ikke af den konkrete sekvens (y1, . . . , yn)- på anden måde end gennem indikatoren for om deres sum erx. Den betingedefordeling af (Y1, . . . ,Yn) givet X = x er således ligefordelingen på mængden

(y1, . . . , yn) ∈ 0, 1n | y1 + . . . + yn = x .

Resultatet er intuitivt uhyre rimeligt: hvis vi ved at der skal værex 1’ere i sekvensen,så skal de jo placeres. Men nårY’erne er uafhængige og identisk fordelte, er der ikkenoget der taler for at de skal placeres på den ene måde snarereend den anden.

Eksempel 21.8 Lad Y1, . . . ,Yn være uafhængige stokastiske variable, og antag athvert Yi er Poissonfordelt med sin egen parameterλi . Lad X =

∑ni=1 Yi. Da er X

Poissonfordelt med parameterλ1 + . . . + λn. Vi ønsker at finde den betingede for-deling af (Y1, . . . ,Yn) givet X = x, i form af den betingede sandsynlighedsfunktionq(y1, . . . , yn | x).

Vi kan nøjes med at interessere os forx = 0, 1, 2, . . .. Hvis (y1, . . . , yn) er en sekvensaf heltal med

∑ni=1 yi , x, så erq(y1, . . . , yn | x) = 0. Men hvis

∑ni=1 yi = x ser vi at

q(y1, . . . , yn | x) =

(

∏ni=1λi

yi

yi !e−λi

)

(λ1+...+λn)x

x! e−(λ1+...+λn)=

(

xy1, . . . , yn

) n∏

i=1

(

λi

λ1 + . . . + λn

)yi

.

Page 9: Betingede fordelinger - web.math.ku.dkweb.math.ku.dk/~erhansen/stat2_08/doku/noter/Betinget.pdf · først trækning ændrer urnens indhold. Men hvis vi ikke ved hvad der er blevet

450 Kapitel 21. Betingede fordelinger

Vi ser heraf at givetX = x er (Y1, . . . ,Yn) polynomialfordelt med længdex og sand-synlighedsparameter

(

λ1λ1+...+λn

, . . . ,λn

λ1+...+λn

)

.

Lad os også give et par eksempler på situationer med kontinuerte stokastiske variable,hvor vi på elementær vis kan udregne betingede fordelinger.

Eksempel 21.9Lad X1, . . . ,Xn være uafhængige variable, alle eksponentialfordeltemed parameterβ > 0. Den simultane tæthed er

f1(x1, . . . , xn) =1βn e−

1β(x1+...+xn) for xi > 0, i = 1, . . . , n.

LadY1, . . . ,YN være de kumulerede summer, altsåYi =∑i

j=1 X j for i = 1, . . . , n. Densimultane tæthed for fordelingen af (Y1, . . . ,Yn) findes til at være

f (y1, . . . , yn) =1βne−

ynβ for 0 < y1 < . . . < yn .

Vi ved atYi ’erne erΓ-fordelte, specielt harYn formparametern og skalaparameterβ,dvs. tætheden for fordelingen afYn er

g(yn) =1

Γ(n) βn yn−1n e−

ynβ for yn > 0 .

Det følger derfor af sætning 20.17, at den betingede fordeling af (Y1, . . . ,Yn−1) givetYn = yn har tæthed

f (y1, . . . , yn−1 | yn) =f (y1, . . . , yn−1, yn)

g(yn)= (n− 1)! y−(n−1)

n (21.7)

hvis 0< y1 < . . . < yn−1 < yn. Dette er ligefordelingen på mængden

(y1, . . . , yn−1) ∈ Rn−1 | 0 < y1 < . . . < yn−1 < yn.

Vi er faktisk stødt på denne fordeling før, i forbindelse medordnede, ligefordeltevariable. HvisU1, . . . ,Un−1 er uafhængige og ligefordelte på (0, yn), vil de ordnedevariableU(1), . . . ,U(n−1) ifølge sætning 19.17 også have tæthed givet ved (21.7).

Eksempel 21.10LadX væreN(0, σ2)-fordelt. LadY1, . . . ,Yn være yderligere stoka-stiske variable på samme baggrundsrum, og antag at betingetmed atX = x erY’erneuafhængigeN(x, ν2)-fordelte. Den betingede tæthed afY’erne givetX = x er altså

f (y1, . . . , yn | x) =n

i=1

(

1√

2πν2e−

(yi−x)2

2ν2

)

=

(

12πν2

)n/2

e−∑n

i=1(yi−x)2/2ν2 .

Page 10: Betingede fordelinger - web.math.ku.dkweb.math.ku.dk/~erhansen/stat2_08/doku/noter/Betinget.pdf · først trækning ændrer urnens indhold. Men hvis vi ikke ved hvad der er blevet

21.1. Definition af betingede fordelinger 451

Den simultane fordeling afX,Y1, . . . ,Yn har ifølge sætning 20.8 tæthed

(

1√

2πσ2e−

x2

2σ2

) (

12πν2

)n/2

e−∑n

i=1(yi−x)2/2ν2 ∼ e−(x2/2σ2+∑n

i=1(yi−x)2/2ν2) ,

hvor∼ betyder at vi har droppet normeringskonstanterne. Vi ønsker at finde den be-tingede fordeling afX givet alle Y’erne. Bayes’ formel fortæller at den betingedetæthed afX givet (Y1, . . . ,Yn) = (y1, . . . , yn) kan fås frem som

e−(x2/2σ2+∑n

i=1(yi−x)2/2ν2)

c(y1, . . . , yn)

hvor c(y1, . . . , yn) er en passende normeringskonstant. Eksponenten i tælleren er fak-tisk et andengradspolynomium ix, så stort set uden at regne kan vi slå fast at denbetingede fordeling afX givet (Y1, . . . ,Yn) = (y1, . . . , yn) er en normalfordeling, hvormiddelværdi og varians i princippet afhænger af de konkretey’er.

Regner man lidt omhyggeligere efter, identificerer man dette andengradspolynomiumsom

−12

x2

σ2+

n x2

ν2−

2 x∑n

i=1 yi

ν2+

∑ni=1 y2

i

ν2

.

Det kan bringes på formen

−12

(

a (x− b)2 + d)

med

a =1σ2+

n

ν2, b =

∑ni=1 yi

aν2d =

∑ni=1 y2

i

aν2− a b2 .

Disse konstanter afhænger afy’erne, men ikke afx. Den ønskede betingede fordelingkan således identificeres som normalfordelingen med middelværdib og varians 1/a.

Det mest interessante i dette resultat er måske hvad der skernår n er stor. I så faldvil b stort set være gennemsnittet afy’erne oga vil være meget stor. Det vil sigeat den betingede fordeling afX vil have en meget snæver fordeling omkring gen-nemsnittet afy’erne. Selv om man måske ikke har observeretX, men kun et stortantalY’er, vil man således alligevel være i stand til at identificere X’et ganske godt.

Page 11: Betingede fordelinger - web.math.ku.dkweb.math.ku.dk/~erhansen/stat2_08/doku/noter/Betinget.pdf · først trækning ændrer urnens indhold. Men hvis vi ikke ved hvad der er blevet

452 Kapitel 21. Betingede fordelinger

21.2 Regneregler for betingede fordelinger

I dette afsnit vil vi angive en række transformationssætninger, der alle siger noget idenne retning: i en situation med tre eller flere stokastiskevariable, hvor vi kendervisse betingede fordelinger, så er visse andre betingede fordelinger givet ved formlen(∗) - her vil det konkrete indhold af (∗) naturligvis variere fra situation til situation.

Det er kompliceret at forstå hvordan man specificerer fordelinger i situationer medtre eller flere stokastiske variable, så læseren opfordres til at bruge meget tid på atsætte sig ind iindholdet af sætningerne, nærmere end beviserne. De angivne formlerer sjældent overraskende hvis man forstår problemstillingen, og beviserne er relativtmekaniske: først skal man gøre rede for at man ved formlen (∗) faktisk har angivet enMarkovkerne, og derpå skal man sætte denne Markovkerne ind i(21.1) og kontrollereat pengene passer.

Sætning 21.11 (Substitutionssætningen)Lad X og Y være stokastiske variable fra(Ω, F,P) ind i (X,E) henholdsvis(Y,K), og lad(Px)x∈X være den betingede fordelingaf Y givet X. Lad der være givet endnu et målbart rum(Z,H) og en målelig afbildningφ : X×Y → Z. Sæt Z= φ(X,Y). Da eksisterer den betingede fordeling af Z givet X,og den er givet som(Px)x∈X, hvor

Px = (φ ix)(Px).

B: For et fastC ∈ H er

Px(C) = Px((φ ix)−1(C)) = Px((φ

−1(C))x),

hvilket er måleligt som funktion afx da (Px)x∈X er en Markovkerne. Altså er (Px)x∈Xen Markovkerne.

Betragt nu forA ∈ E ogC ∈ H

P(X ∈ A,Z ∈ C) = (X,Y)(P)(A× Y ∩ φ−1(C)).

Det ses at hvisx < A, så er

(A× Y ∩ φ−1(C))x = ∅,

Page 12: Betingede fordelinger - web.math.ku.dkweb.math.ku.dk/~erhansen/stat2_08/doku/noter/Betinget.pdf · først trækning ændrer urnens indhold. Men hvis vi ikke ved hvad der er blevet

21.2. Regneregler for betingede fordelinger 453

og hvisx ∈ A, så er

(A× Y ∩ φ−1(C))x = (φ−1(C))x = (φ ix)−1(C).

Og dermed er

P(X ∈ A,Z ∈ C) =∫

APx((φ ix)

−1(C)) dX(P)(x) =∫

APx(C) dX(P)(x),

præcis som ønsket.

Substitutionssætningen ser nok skrækindjagende ud når denudtrykkes i så formeltet sprog, som det der anvendes i sætning 21.11. Men i mange praktiske situationerforekommer indholdet så oplagt at man ikke engang opdager atder er noget at argu-mentere for. Hvis vi observerer atX = x, så måZ jo væreφ(x,Y). Med andre ord erZ en simpel transformation afY, nårX er fastlagt. Derfor må fordelingen afZ kunnefås frem som et billedmål af fordelingen afY. Når substitutionssætningen fremtræ-der så indviklet, er det udelukkende fordi den transformation, man skal bruge for atkomme fraY til Z varierer medX-værdien. Men det forhold er i praksis ikke nogetder forvirrer.

Eksempel 21.12 Lad Y1, . . . ,YM være uafhængige, indentisk fordelte reelle stoka-stiske variable - vi kalder den fælles fordeling af disse variable forν. Lad N være enheltallig stokastisk variabel med værdier mellem 1 ogM, og antag atN er uafhængigaf Y’erne. Vi ønsker at studere den stokastiske sum

Z =N

n=1

Yn . (21.8)

Sådanne summer over et stokastisk antal variable dukker op imange sammenhængei anvendt sandsynlighedsregning. Man kan f.eks. tænke påN som antallet af skaderder i et givet tidsrum indrapporteres til et forsikringsselskab, ogY’erne kan værestørrelsen af de enkelte skader. SummenZ repræsenterer da den samlede udgift forforsikringsselskabet i perioden.

Man kan i nogen grad afmystificere den stokastiske sum ved at skrive den som

Z =M∑

n=1

1(n≤N) Yn . (21.9)

Page 13: Betingede fordelinger - web.math.ku.dkweb.math.ku.dk/~erhansen/stat2_08/doku/noter/Betinget.pdf · først trækning ændrer urnens indhold. Men hvis vi ikke ved hvad der er blevet

454 Kapitel 21. Betingede fordelinger

Skrevet på denne måde, ser vi atZ er en almindelig sum uden narrestreget afMstokastiske variable. Når vi ikke uden videre foretrækker denne beskrivelse, er detfordi leddene hverken er uafhængige eller identisk fordelte, som vi nu skal se.

Hvis vi fastholder etn mellem 1 ogM, så ved vi atYn er uafhængig afN. Så denbetingede fordeling afYn givetN = k er lig medν uanset værdien afk. Den summandi (21.9) der er knyttet tilYn er

Zn = 1(n≤N) Yn ,

og det kan selvfølgelig opfattes som en transformation afN og Yn. Hvis vi lader(Pk)k=1,...,M være den betingede fordeling afZn givet N, så ser vi af substitutionssæt-ningen at

Pk =

ǫ0 for k = 1, . . . , n− 1 ,

ν for k = n, . . . ,M ,

hvor ǫ0 er etpunktsmålet i 0. Derfor er den marginale fordeling afZn bestemt ved at

P(Zn ∈ A) =∫

Pk(A) dN(P)(k) =M∑

k=1

Pk(A) P(N = k)

=

n−1∑

k=1

ǫ0(A) P(N = k) +M∑

k=n

ν(A) P(N = k)

= ǫ0(A) P(N < n) + ν(A) P(N ≥ n) .

Denne fordeling varierer medn - i sagens natur får atomet i 0 større sandsynlighednårn vokser. Og derfor er leddene i (21.9) ikke identisk fordelte.

Hvis vi ser påm < n, så er (Ym,Yn) uafhængig afN, og den betingede fordeling af(Ym,Yn) givet N = k er derfor lig medν⊗ ν for alle værdier afk. Af substitutionssæt-ningen følger det på samme måde som før at den betingede fordeling (Qk)k=1,...,M af(Zm,Zn) er givet ved

Qk =

ǫ0 ⊗ ǫ0 for k = 1, . . . ,m− 1 ,

ν ⊗ ǫ0 for k = m, . . . , n− 1 ,

ν ⊗ ν for k = n, . . . ,M .

Page 14: Betingede fordelinger - web.math.ku.dkweb.math.ku.dk/~erhansen/stat2_08/doku/noter/Betinget.pdf · først trækning ændrer urnens indhold. Men hvis vi ikke ved hvad der er blevet

21.2. Regneregler for betingede fordelinger 455

Vi kan beskrive fordelingen af (Zm,Zn) ved at blande denne betingede fordeling ud:

P(Zm ∈ A,Zn ∈ B) =M∑

k=1

Qk(A× B) P(N = k)

=

m−1∑

k=1

ǫ0 ⊗ ǫ0(A× B) P(N = k) +n−1∑

k=m

ν ⊗ ǫ0(A× B) P(N = k)

+

M∑

k=n

ν ⊗ ν(A× B) P(N = k)

= ǫ0(A) ǫ0(B) P(N < m) + ν(A) ǫ0(B) P(m≤ N < n)

+ ν(A) ν(B) P(n ≤ N) .

Dette spalterikke op i et produkt afP(Zm ∈ A) og P(Zn ∈ B) - i produktet vil derf.eks. indgå led af formenǫ0(A) ν(B), der slet ikke optræder i den simultane fordeling- og vi kan derfor konstatere atZm og Zn er afhængige. Hvilket strengt taget ikke eroverraskende: hvisZn = 0 vil det nok typisk være fordiN < n, og alt andet lige øgernaturligvis sandsynligheden for atZm = 0. Eller omvendt: hvisZn , 0, så kanNumuligt være mindre endn, og derfor erZm næppe heller nul.

Summen (21.9) er ikke entydig behagelig at have med at gøre, når leddene nu hver-ken er uafhængige eller identisk fordelte, og man står sig ofte ved at arbejde med re-præsentationen (21.8). Man kan observere at den betingede fordeling af (Y1, . . . ,YM)givet N = k er produktmåletν ⊗ . . . ⊗ ν (medM faktorer), uanset værdien afk. Mankan også bemærke at hvis vi sætter

φ(k, y1, . . . , yM) =k

n=1

yi

så erZ = φ(N,Y1, . . . ,YM). For fastholdtk kan man regne afbildningen

(y1, . . . , yM) 7→ φ(k, y1, . . . , yM)

ud i to trin: først projicerer man ned på de førstek koordinater, og dernæst læggerman disse koordinater sammen. Det første af disse trin sender ν⊗M over i ν⊗k, detnæste trin senderν⊗k over i den almindelige foldningν ∗ . . . ∗ ν (medk faktorer).Substitutionssætningen siger derfor at den betingede fordeling (Rk)k=1,...,M af Z givet

Page 15: Betingede fordelinger - web.math.ku.dkweb.math.ku.dk/~erhansen/stat2_08/doku/noter/Betinget.pdf · først trækning ændrer urnens indhold. Men hvis vi ikke ved hvad der er blevet

456 Kapitel 21. Betingede fordelinger

N må være

Rk =

ν hvis k = 1ν ∗ ν hvis k = 2......

ν∗M hvis k = M .

Eller mere kortfattet: den betingede fordeling af∑N

n=1 Yn givet N = k er identiskmed fordelingen af

∑kn=1 Yn. Den påstand lyder så oplagt når man hører den, at det

kan være svært at fornemme at der overhovedet er noget at vise. Men bemærk atresultatet kun er rigtigt fordiN er uafhængig afY’erne.

Eksempel 21.13Lad X og Y være reelle variable, sådan at den simultane fordelingaf (X,Y) er en Dirichletfordeling med parametre

(

λ1, λ2, λ)

. Den simultane fordelingaf (X,Y) har da tæthed

f (x, y) =Γ(λ + λ1 + λ2)Γ(λ)Γ(λ1)Γ(λ2)

xλ1−1yλ2−1(1− x− y)λ−1

på mængden(x, y) ∈ R2 | 0 < x, 0 < y, x+ y < 1. Den marginale fordeling afX erda enB-fordeling med parametre (λ1, λ2 + λ), dvs. den har tæthed

g(x) =Γ(λ + λ1 + λ2)Γ(λ1)Γ(λ2 + λ)

xλ1−1(1− x)λ2+λ−1, x ∈ (0, 1).

Den betingede fordelingPx af Y givet X = x for x ∈ (0, 1) lever da på intervallet(0, 1− x) og har tæthed

fx(y) =f (x, y)g(x)

=Γ(λ2 + λ)Γ(λ)Γ(λ2)

( y1− x

)λ2−1 (

1− y1− x

)λ−1 11− x

.

TransformeresPx med afbildningeny → y1−x, fås enB-fordeling med parametre

(λ2, λ). Ifølge sætning 21.11 er den konstante familie afB-fordelinger med parametre(λ2, λ) indiceret vedx ∈ (0, 1) da den betingede fordeling afY1−X givet X. Det følgerda af sætning 21.3, atY1−X og X er indbyrdes uafhængige, og atY1−X er B-fordelt medformparametre (λ2, λ).

Page 16: Betingede fordelinger - web.math.ku.dkweb.math.ku.dk/~erhansen/stat2_08/doku/noter/Betinget.pdf · først trækning ændrer urnens indhold. Men hvis vi ikke ved hvad der er blevet

21.2. Regneregler for betingede fordelinger 457

Sætning 21.14Lad X og Y være stokastiske variable fra(Ω, F,P) ind i henholdsvis(X,E) og (Y,K), og lad (Px)x∈X være den betingede fordeling af Y givet X. Lad(Z,H) være endnu et målbart rum, lad t: X → Z være enE−H-målelig afbildning,og lad Z= t(X).Da er den betingede fordeling(Qx,z)(x,z)∈X×Z af Y givet(X,Z) givet ved

Qx,z = Px for alle x ∈ X, z∈ Z. (21.10)

B: Man overbeviser sig let om at (21.10) virkelig definerer en (X × Z,E ⊗ H)-Markovkerne (Qx,z)(x,z)∈X×Z på (Y,K). ForA ∈ E, B ∈ K ogC ∈ H er

A×CQx,z(B) d(X,Z)(P)(x, z) =

1A×C(x, z)Qx,z(B) d(id, t) X(P)(x, z)

=

1A×C (id, t)(x)Q(id,t)(x)(B) dX(P)(x)

=

1A∩ t−1(C)(x)Px(B) dX(P)(x).

Da (Px)x∈X er den betingede fordeling afY givet X, identificeres det sidste integralsom

P(X ∈ A∩ t−1(C),Y ∈ B) = P(X ∈ A,Z ∈ C,Y ∈ B)

= P((X,Z) ∈ A×C,Y ∈ B).

Ved at holdeB fast og ladeA og C variere fås (ved hjælp af entydighedssætningenfor endelige mål) at

GQx,z(B) d(X,Z)(P)(x, z) = P((X,Z) ∈ G,Y ∈ B)

for alle G ∈ E ⊗ K og alle B ∈ K. Altså er (Qx,z)(x,z)∈X×Z vitterligt den betingedefordeling afY givet (X,Z).

I praksis er sætning 21.14 tæt på at være indholdsløs. Den betingede fordeling afYgivet X repræsenter hvad vi ved omY når X er kendt. Hvis vi ud overX får oplystværdien afZ = t(X), så er vi ikke det mindste bedre stillet hvad angår informationom Y: hvis vi ikke havde fåetZ oplyst, kunne vi jo selv have regnet den ud. Så

Page 17: Betingede fordelinger - web.math.ku.dkweb.math.ku.dk/~erhansen/stat2_08/doku/noter/Betinget.pdf · først trækning ændrer urnens indhold. Men hvis vi ikke ved hvad der er blevet

458 Kapitel 21. Betingede fordelinger

derfor må den betingede fordeling afY givet bådeX og Z selvfølgelig være identiskmed den betingede fordeling afY givet X. Dog med den formelle modifikation atMarkovkernen skal være indiceret med bådeX- og Z-værdier i det første tilfælde,men kun medX-værdier i det andet.

Sætning 21.14 beskæftiger sig med en af de situationer, hvordet er tydeligt at debetingede fordelinger ikke er entydigt givet. Variablen (X,Z) har ikke værdier i heleX ×Z, men kun pågrafen for t, det vil sige mængden

(x, z) ∈ X ×Z | z= t(x).

Og derfor kan man sætteQx,z til hvad som helst uden for grafen fort, blot manrespekterer visse målelighedskrav. Så (21.10) er langt fraden eneste mulige betingedefordeling afY givet (X,Z) - det er blot den mest naturlige mulighed.

Sætning 21.15Lad X og Y være stokastiske variable fra(Ω, F,P) ind i henholdsvis(X,E) og (Y,K), og lad (Px)x∈X være den betingede fordeling af Y givet X. Lad(Z,H) være endnu et målbart rum, lad t: X → Z være enE−H-målelig afbildning,og lad Z= t(X).Hvis der findes en(Z,H)-Markovkerne(Qz)z∈Z på (Y,K) sådan at

Px = Qt(x) for alle x∈ X, (21.11)

så er(Qz)z∈Z den betingede fordeling af Y givet Z.

B: TagC ∈ H og B ∈ K. Ifølge integraltransformationssætningen har vi at

P(Z ∈ C,Y ∈ B) = P(X ∈ t−1(C),Y ∈ B) =∫

1t−1(C)(x) Px(B) dX(P)(x)

=

1C t(x) Qt(x)(B) dX(P)(x) =∫

1C(z) Qz(B) d(t X)(P)(z)

=

CQz(B) dZ(P)(z).

Altså er (Qz)z∈Z den betingede fordeling afY givet Z.

Eksempel 21.16Lad os som i eksempel 21.5 betragte et eksperiment, hvor derudentilbagelægning trækkes kugler fra en urne. Antag at urnen påforhånd indeholder ialt

Page 18: Betingede fordelinger - web.math.ku.dkweb.math.ku.dk/~erhansen/stat2_08/doku/noter/Betinget.pdf · først trækning ændrer urnens indhold. Men hvis vi ikke ved hvad der er blevet

21.2. Regneregler for betingede fordelinger 459

N kugler, hvorafN1 kugler er røde kugler og de resterendeN − N1 kugler er hvide.Vi ser på de stokastiske variable

Xi =

1 hvis deni’te udtrukne kugle er rød

0 hvis deni’te udtrukne kugle er hvid.

og vi er specielt interesserede i hvordan det samlede antal røde kugler variere medhvor mange gange vi har trukket. Vi ser derfor på

Sn =

n∑

i=1

Xi for n = 0, 1, . . . ,N .

Det er klart atS0 = 0 ogSN = N1, men processens opførsel mellem disse yderpunkterer ikke på forhånd klar. Vi viste i (21.6) at

P(Xn+1 = x | X1 = x1, . . . ,Xn = xn) =

N1−sN−n hvis x = 1

1− N1−sN−n hvis x = 0 ,

(21.12)

hvor s =∑n

i=1 xi, i hvert fald hvis den konfiguration, vi betinger med, er mulig - derkræves altså ats≤ N1 og atn−s≤ N−N1. Den betingede fordeling afhænger såledeskun af den præcise konfiguration (x1, . . . , xn) gennem den transformerede værdis, ogderfor tillader sætning 21.15 os at konkludere at

P(Xn+1 = x | Sn = s) =

N1−sN−n hvis x = 1

1− N1−sN−n hvis x = 0 .

Det kan kombineres med substitutionssætningen til at sige at

P(Sn+1 = s′ | Sn = s) =

N1−sN−n hvis s′ = s+ 1

1− N1−sN−n hvis s′ = s.

Man kan nu relativt let regne igennem at

P(Sn = s) =

(

N1

s

)(

N − N1

n− s

)

(

Nn

) for s= 0, . . . , n. (21.13)

Page 19: Betingede fordelinger - web.math.ku.dkweb.math.ku.dk/~erhansen/stat2_08/doku/noter/Betinget.pdf · først trækning ændrer urnens indhold. Men hvis vi ikke ved hvad der er blevet

460 Kapitel 21. Betingede fordelinger

Denne formel passer i hvert fald forn = 1, og kan bevises for størren-værdier vedinduktion:

P(Sn+1 = s′) =n

s=0

P(Sn+1 = s′ | Sn = s)P(Sn = s)

= P(Sn+1 = s′ | Sn = s′)P(Sn = s′) + P(Sn+1 = s′ | Sn = s′ − 1)P(Sn = s′ − 1)

=

(

1− N1 − s′

N − n

)

(

N1s′

)(

N−N1n−s′

)

(

Nn

) +N1 − (s′ − 1)

N − n

(

N1s′−1

)(

N−N1n−(s′−1)

)

(

Nn

) ,

der ved en vis regnemæssig indsats kan reduceres til den relevante version af (21.13).Resultatet kommer selvfølgelig ikke bag på nogen: Vi har på en ganske kompliceretmåde vist atSn er hypergeometrisk fordelt. Det blev opfattet som selvindlysende ieksempel 10.1, og det er det vel også. Men der er nogle symmetriovervejelser invol-veret i den elementære behandling af trækning uden tilbagelægning, og disse symme-triovervejelser kan man godt komme i alvorlig tvivl om, når man begynder at tænkeefter. Den behandling vi lige har givet, fokuserer på situationen i de enkelte træk-ninger, og har ingen overordnede betragtninger om symmetri- til gengæld må mantrække på et større tekniske apparat for at få resultaterne frem.

Eksempel 21.17Man kan ofte anvende sætning 21.15 til at ændre den informationman betinger med. Hvis (Px)x∈X er den betingede fordeling afY givet X, og hvisZ = t(X) er en bijektiv transformation afX, så vil den betingede fordeling (Qz)z∈Z afY givet Z kunne findes som

Qz = Pt−1(z) for z∈ Z .

Det følger, fordi denne definition afQ smertefrit sikrer at (21.11) er opfyldt. I eksem-pel 21.16 kan den fundamentale formel (21.12) f.eks. uden videre erstattes med

P(Xn+1 = x | S1 = s1, . . . ,Sn = sn) =

N1−snN−n hvis x = 1

1− N1−snN−n hvis x = 0 ,

fordi (S1, . . . ,Sn) er en bijektiv transformation af (X1, . . . ,Xn). Kombineres det medsubstitutionssætningen, fås at

P(Sn+1 = s | S1 = s1, . . . ,Sn = sn) =

N1−snN−n hvis s= sn + 1

1− N1−snN−n hvis s= sn ,

Page 20: Betingede fordelinger - web.math.ku.dkweb.math.ku.dk/~erhansen/stat2_08/doku/noter/Betinget.pdf · først trækning ændrer urnens indhold. Men hvis vi ikke ved hvad der er blevet

21.2. Regneregler for betingede fordelinger 461

Denne formel viser når der trækkes uden tilbagelægning fra en urne, så udvikler an-tallet af udtrukne kugler af en bestemt farve sig som en tidsinhomogen Markovkæde,se f.eks. Norris (1998). Det er en Markovkæde, fordi ovenstående betingede fordelingkun afhænger af historien (s1, . . . , sn) gennemsn. Og Markovkæden er inhomogen,fordi den mådesn indgår i formlen på ændres medn.

Sætning 21.18Lad X, Y og Z være stokastiske variable fra(Ω, F,P) ind i henholds-vis (X,E), (Y,K) og (Z,H). Lad (Qx,y)(x,y)∈X×Y være den betingede fordeling af Zgivet(X,Y), og lad(Px)x∈X være den betingede fordeling af Y givet X. Da er(Rx)x∈Xden betingede fordeling af Z givet X, hvor

Rx(C) =∫

Qx,y(C) dPx(y) C ∈ H. (21.14)

B: For fastx ∈ X konstaterer vi at den reducerede familie (Qx,y)y∈Y er en (Y,K)-Markovkerne på (Z,H). Og Rx er blandingen af denne Markovkerne med hensyn tilPx. Specielt ser vi atRx er et sandsynlighedsmål på (Z,H).

VælgC ∈ H. Da (Qx,y)(x,y)∈Y×X er en Markovkerne på (Z,H), er

(x, y) 7→ Qx,y(C)

enE ⊗ K-målelig, ikke-negativ afbildning. Og derfor er

x 7→ Rx(C) =∫

Qx,y(C) dPx(y)

E-målelig, det vil sige at (Rx)x∈X er en (X,E)-Markovkerne på (Z,H).

Tag endeligA ∈ E, C ∈ H. Ifølge den udvidede Tonellis sætning er

P(X ∈ A,Z ∈ C) = P(X ∈ A,Y ∈ Y,Z ∈ C)

=

A×YQx,y(C) d(X,Y)(P)(x, y)

=

"1A×Y(x, y)Qx,y(C) dPx(y) dX(P)(x)

=

1A(x)Rx(C) dX(P)(x),

hvoraf det følger at (Rx)x∈X er den betingede fordeling afZ givet X.

Page 21: Betingede fordelinger - web.math.ku.dkweb.math.ku.dk/~erhansen/stat2_08/doku/noter/Betinget.pdf · først trækning ændrer urnens indhold. Men hvis vi ikke ved hvad der er blevet

462 Kapitel 21. Betingede fordelinger

Eksempel 21.19 I urneeksperimentet fra eksempel 21.5 kunne man interessere sigfor den betingede fordeling afX3 givet X1. Ved simpel indsættelse i (21.14) ser vi at

P(X3 = 1 | X1 = x) =∑

y

P(X3 = 1 | X1 = x,X2 = y)P(X2 = y | X1 = x)

= P(X3 = 1 | X1 = x,X2 = 0)P(X2 = 0 | X1 = x)

+ P(X3 = 1 | X1 = x,X2 = 1)P(X2 = 1 | X1 = x)

=N1 − xN − 2

(

1− N1 − xN − 1

)

+N1 − x− 1

N − 2N1 − xN − 1

=N1 − xN − 1

.

Vi konstaterer at den betingede fordeling afX3 givetX1 er identisk med den betingedefordeling af X2 givet X1. Analogt med hvad vi konstaterede i eksempel 21.5, såspiller det ingen rolle at der er trukket en kugle mellem kugle 1 og kugle 3 - vi fårkun information om kugle 3’s farve hvis vi får at vide hvilkenfarve kugle 2 havde.

21.3 Betingede middelværdier

Vi vil nu beskæftige os med hvordan den betingede fordeling (Px)x∈X af enreel va-riabel Y givet en vilkårlig variabelX, kan beskrives på en informativ måde. HvertPx er jo et sandsynlighedsmål på (R,B), og man kan derfor forsøge at beskrive detved hjælp af momentkonstruktioner. Det leder til begreber som betinget middelværdiog betinget varians. Man kan naturligvis også diskutere betingede medianer og andrebetingede fraktiler. Ja, hvis det falder for, kan man tage fat på betingede fordelings-funktioner og betingede karakteristiske funktioner - men de mest brugbare resultateropnås typisk for de betingede momenter

Lemma 21.20 Lad X og Y være stokastiske variable fra(Ω, F,P) ind i (X,E) hen-holdsvis (R,B), og lad (Px)x∈X være den betingede fordeling af Y givet X. HvisE|Y| < ∞, så harPx første moment for X(P)-næsten alle x∈ X.

B: Betragt afbildningenf : X × R→ R givet ved atf (x, y) = y. Idet∫

| f (x, y)|d(X,Y)(P)(x, y) =∫

| f (X,Y)|dP= E|Y| < ∞,

Page 22: Betingede fordelinger - web.math.ku.dkweb.math.ku.dk/~erhansen/stat2_08/doku/noter/Betinget.pdf · først trækning ændrer urnens indhold. Men hvis vi ikke ved hvad der er blevet

21.3. Betingede middelværdier 463

følger det af den udvidede Fubinis sætning at∫

|y|dPx(y) =∫

| f (x, y)|dPx(y) < ∞ for X(P)-næsten allex.

Vi indfører skrivemåden

E(Y | X = x) =∫

y dPx(y),

for denbetingede middelværdiaf Y givet X. Formelt erE(Y | X = x) en funktionX → R - lad os midlertidigt skrive

φ(x) = E(Y | X = x)

for at understøtte denne opfattelse. I mange sammenhænge vil vi imidlertid hellerebetragte den betingede middelværdi som en stokastisk variabel, nemlig som den va-riabel der fås ved at sammensætteφmedX. Vi skriver

E(Y | X) = φ X.

Betingede middelværdier, opfattet som stokastiske variable, er et helt centralt værktøji den videregående sandsynlighedsregning. HvisX ogY er uafhængige, erE(Y | X) enkonstant stokastisk variabel, så jo mereE(Y | X) varierer, jo kraftigere afhængigheder der mellemX ogY.

Hvis man skal være helt præcis, så erφ ikke defineret påheleX, men kun på enX(P)-næsten sikker delmængde. Derfor erE(Y | X) strengt taget kun defineret på enP-næsten sikker delmængde afΩ. Men hvis vi insisterer, kan den udvides til at væredefineret over det hele - sæt den f.eks. til 0 på den resterendedel afΩ.

Sætning 21.21Lad X og Y være stokastiske variable fra(Ω, F,P) ind i (X,E) hen-holdsvis(R,B). Hvis E|Y| < ∞, så er E(Y | X) integrabel, og

E(

E(Y | X))

= EY. (21.15)

B: Dette er et specialtilfælde af den udvidede Fubinis sætning.

Page 23: Betingede fordelinger - web.math.ku.dkweb.math.ku.dk/~erhansen/stat2_08/doku/noter/Betinget.pdf · først trækning ændrer urnens indhold. Men hvis vi ikke ved hvad der er blevet

464 Kapitel 21. Betingede fordelinger

••

••

••

••

••

••

• •

••

••

••

• •

••

••

••

••

••

•• •

• •

•••

••

•••

••

••

••

••

••

• •

••

• •

••

••

••

••

•••

••

••

••

••

••

•••

••

••

• •

••

••••

••

• •

• ••

••

••

••

••

•••

••

••

••

••

••

• •

••

••

••

••

••

••

••

• •

••

•••

•••

••

• •

• •

••

••

••

•••

•••

• •

••

••

•• •

••

••

•• •

••

••

•••

••

• ••

•••

•••

••

••

••

••

••

••

••

•••

• •

•••

• •

••

••

••

•••

••

••

•••

••

••

•••

•••

••

••

••

••

••

••

• •

••

••

•• •

••

••

••

••

••

•••

••

••

• ••

••

••

•••

••

••

••

••

• •

•••

••

••

••

••

••

• •

••

••

••

••

••

•••

• •••

••

••

• ••

••

••

••

••

••

••

••

••

• ••

••

••

• •

••

••

••

• •

••

••

X

Y

-2 0 2

-20

2

X = x

Figur 21.1:1 000 punkter simuleret fra en todimensional fordeling.EY beskriver centrumfor hele punktskyen projiceret ind påy-aksen (i dette tilfælde≈ 0), mensE(Y | X = x)beskriver centrum for den del af punktskyen der har førstekoordinatx (for det angivnex vel≈ −1.5).

Korollar 21.22 Lad X og Y være stokastiske variable fra(Ω, F,P) ind i (X,E) og(Y,K), og lad(Px)x∈X være den betingede fordeling af Y givet X. Ladφ : X×Y → Rvære en målelig afbildning, og sæt Z= φ(X,Y). Hvis E|Z| < ∞ er

E(Z | X = x) =∫

φ(x, y) dPx(y) for X(P)-næsten alle x∈ X. (21.16)

B: Ifølge substitutionssætninger kan den betingede fordeling af Z givet X = xfindes somPx = φ ix(Px). Dermed er

E(Z | X = x) =∫

z dPx(z) =∫

φ ix(y) dPx(y) =∫

φ(x, y) dPx(y)

som ønsket.

Eksempel 21.23Hvis Y og Z er to reelle stokastiske variable med 1. moment, ogXer en vilkårlig stokastisk variabel, så er

E(Y + Z | X) = E(Y | X) + E(Z | X) for X(P)-næsten allex ∈ X.

Page 24: Betingede fordelinger - web.math.ku.dkweb.math.ku.dk/~erhansen/stat2_08/doku/noter/Betinget.pdf · først trækning ændrer urnens indhold. Men hvis vi ikke ved hvad der er blevet

21.3. Betingede middelværdier 465

Lad nemlig (Px)x∈X være den betingede fordeling af (Y,Z) givet X. Da er

E(Y + Z | X = x) =∫

y+ z dPx(y, z)

for X(P)-næsten allex ∈ X, mens

E(Y | X = x) =∫

y dPx(y, z), E(Z | X = x) =∫

z dPx(y, z)

for X(P)-næsten allex ∈ X.

Eksempel 21.24 Lad X være en stokastisk variabel med værdier i (X,E) og ladt : X → R være en målelig afbildning. Den betingede fordeling (Px)x∈X af Z givet Xer da ganske degenereret: vi kan bruge

Px = ǫ t(x) for x ∈ X ,Hvis E|Z| < ∞ kan vi udregne den betingede middelværdi:

E(Z | X = x) =∫

z dPx(z) =∫

z dǫ t(x)(z) = t(x) .

Når vi sammensætter med den stokastiske variabelX får vi derfor at et resultat, derkortfattet kan skrives

E(

t(X) | X)

= t(X) . (21.17)

Resultatet er selvfølgelig en banalitet, men det er en regneregel, der er uhyre anven-delig.

Eksempel 21.25I urneeksperimentet fra eksempel 21.16, kunne man interessere sigfor den betingede middelværdi afSn+1 givet Sn. Vi ser at

E(Sn+1 | Sn) = E(Sn + Xn+1 | Sn) = Sn + E(Xn+1 | Sn) = Sn +N1 − Sn

N − n

=N1

N − n+

(

1− 1N − n

)

Sn .

Udnytte sætning 21.21, etablerer vi den rekursive formel

E(Sn+1) = E(

E(Sn+1 | Sn))

=N1

N − n+

(

1− 1N − n

)

ESn .

Udnyttes etES0 = 0, bevises det heraf let ved induktion atESn =nN1N . Vi fandt

samme formel for middelværdien af en hypergeometrisk fordeling i eksempel 13.25,men det bevis vi lige har givet er en hel del nemmere.

Page 25: Betingede fordelinger - web.math.ku.dkweb.math.ku.dk/~erhansen/stat2_08/doku/noter/Betinget.pdf · først trækning ændrer urnens indhold. Men hvis vi ikke ved hvad der er blevet

466 Kapitel 21. Betingede fordelinger

Eksempel 21.26 Lad os betragte situationen fra eksempel 21.12, hvor vi så påensum af formen

Z =N

i=1

Yn , (21.18)

hvor Y1, . . . ,YM er uafhængige reelle stokastiske variable, alle med fordeling ν, oghvor N er en heltallig stokastisk variabel med værdier mellem 1 ogM, uafhængig afY’erne. Studiet af summen førte naturligt til de stokastiskevariable

Zn = 1(n≤N) Yn for n = 1, . . . ,M .

Vi fandt i eksempel 21.12 den betingede fordelingPk af Zn givet N = k til at være

Pk =

ǫ0 for k = 1, . . . , n− 1 ,

ν for k = n, . . . ,M ,

Hvis vi antager atY’erne har middelværdi, følger det nu at

E(Zn | N = k) =

0 for k = 1, . . . , n− 1 ,

EY1 for k = n, . . . ,M ,

Sammensættes med den stokastiske variabelN, får vi et udtryk, der kortfattet kanskrives

E(Zn | N) = 1(n≤N) EY1 . (21.19)

Vi kan udnytte det til at finde middelværdien afZn, for

EZn = E(

E(Zn | N))

= EY1 E(

1(n≤N))

= EY1P(n ≤ N) .

I dette tilfælde er vejen omkring betingede middelværdier nok ikke den korteste - vikunne have fundetEZn direkte ved at appellere til sætning 17.9.

Eksempel 21.27Vi kan fortsætte studiet af (21.18) fra eksempel 21.26 ved atregnemiddelværdien afZ ud.

En måde at finde denne middelværdi på er at udnytte, at vi i eksempel 21.12 fandtden betingede fordeling afZ givet N. Givet atN = k, så vi at den betingede fordelingaf Z er identisk med fordelingen af

∑kn=1 Yn. Og derfor er

E(Z | N = k) = k EY1 .

Page 26: Betingede fordelinger - web.math.ku.dkweb.math.ku.dk/~erhansen/stat2_08/doku/noter/Betinget.pdf · først trækning ændrer urnens indhold. Men hvis vi ikke ved hvad der er blevet

21.4. Betingede varianser og kovarianser 467

Sammensættes med den stokastiske variabelN, ser vi atE(Z | N) = NE Y1. Og derforhar vi at

EZ = E(

E(Z | N))

= EN EY1 , (21.20)

en formel som er uhyre tilfredsstillende fra et æstetisk synspunkt.

En anden måde at finde denne middelværdi på, er at udnytte at vii eksempel 21.26fandt middelværdien afZn’erne. Vi ser at

EZ = E

M∑

n=1

Zn

=

M∑

n=1

EZn =

M∑

n=1

EY1 P(n ≤ N) = EY1

M∑

n=1

P(n ≤ N) . (21.21)

Denne sum af halesandsynligheder kan identificeres ved et klassisk trick:

M∑

n=1

P(n ≤ N) =M∑

n=1

M∑

k=n

P(N = k) =M∑

k=1

k∑

n=1

P(N = k) =M∑

k=1

k P(N = k) = EN .

Vi ser således at (21.21) vitterligt er identisk med (21.20). Vi kan i princippet kommeigennem den sidste måde at udledeEZ på helt uden at betinge (det var ikke strengtnødvendigt at betinge i eksempel 21.26, det var måske ikke engang det nemmeste).Men en række andre egenskaber vedZ lader sig ikke på samme måde udlede udenbetingning, se f.eks. eksempel 21.31.

21.4 Betingede varianser og kovarianser

Hvis Y er reel medEY2 < ∞, kan vi definere denbetingede variansaf Y givet X,skrevetV(Y | X), som

V(Y | X) = E(Y2 | X) − (

E(Y | X))2. (21.22)

Vi kan også indføre den betingede varians afY givetX = x, som skrivesV(Y | X = x),ved

V(Y | X = x) =∫

y2 dPx(y) −(∫

y dPx(y)

)2

,

hvilket giver mening forX(P)-næsten allex, og vi kan konstatere atV(Y | X) ersammensætningen afx 7→ V(Y | X = x) med den stokastiske variabelX.

Page 27: Betingede fordelinger - web.math.ku.dkweb.math.ku.dk/~erhansen/stat2_08/doku/noter/Betinget.pdf · først trækning ændrer urnens indhold. Men hvis vi ikke ved hvad der er blevet

468 Kapitel 21. Betingede fordelinger

Sætning 21.28Lad X og Y være stokastiske variable på(Ω, F,P) med værdier i(X,E) henholdsvis(R,B). Hvis EY2 < ∞, så gælder at

VY= E(

V(Y | X))

+ V(

E(Y | X))

. (21.23)

B: Af definitionen på betinget varians følger at

E(

V(Y | X))

+ V(

E(Y | X))

= E(

E(Y2 | X) − E(Y | X)2)

+ E(

E(Y | X)2)

−(

E(

E(Y | X)))2

= E(

E(Y2 | X))

−(

E(

E(Y | X)))2= VY.

Eksempel 21.29Betragt figur 21.1.VY er et mål for hvor meget punktskyen, proji-ceret ind påy-aksen, varierer omkring sit centrum.V(Y | X = x) er et udtryk for hvormeget den del af punktskyen der har førstekoordinatx varierer omkringsit centrum.De to størrelser er ikke særlig tæt forbundne. I dette tilfælde erVY relativt stor, mensV(Y | X = x) er ret lille foralle x.

Eksempel 21.30 Vi kan fortætte diskussionen fra eksempel 21.25 af de betingedemomenter i et eksperiment med trækning uden tilbagelægning. Vi har at

V(Sn+1 | Sn) = V(Sn + Xn+1 | Sn) .

Når vi betinger medSn, kan vi opfatteSn som konstant, ogSn-leddet giver derforikke noget bidrag til denne varians. Vi ved atXn+1 betinget medSn er Bernoullifordeltmed successandsynlighedN1−Sn

N−n , og dermed er

V(Sn+1 | Sn) = V(Xn+1 | Sn) =N1 − Sn

N − n

(

1− N1 − Sn

N − n

)

.

I princippet kan denne formel kombineres med sætning 21.28,og man kan opnå enrekursiv formel forV(Sn) - desværre bliver denne rekursive formel temmelig indvik-let, hvad der afspejler at variansen af en hypergeometrisk fordelinger kompliceret.

Page 28: Betingede fordelinger - web.math.ku.dkweb.math.ku.dk/~erhansen/stat2_08/doku/noter/Betinget.pdf · først trækning ændrer urnens indhold. Men hvis vi ikke ved hvad der er blevet

21.4. Betingede varianser og kovarianser 469

Eksempel 21.31Vi kan fortsætte studiet af (21.18) fra eksempel 21.26 ved atregnevariansen afZ ud. Vi udnytter at vi i eksempel 21.12 fandt at den betingede fordelingaf Z givet atN = k er identisk med fordelingen af

∑kn=1 Yn. Og antager vi atY’erne

har 2. moment, ser vi derfor at

V(Z | N = k) = k VY1 .

Hvis vi sammensætter med den stokastiske variabelN, ser vi atV(Z | N) = N EY1.Og derfor har vi at

VZ = E(

V(Z | N))

+ V(

E(Z | N))

= E(

N VY1)

+ V(

N EY1

)

= EN VY1 + (EY1)2 VN .

Denne formel er sikkert mere overraskende end den tilsvarende formel for middel-værdier. Men hvis man tænker over det, kan man godt forstå begge led. Vi forsøgerat beskrive variabiliteten af en sum med et stokastisk antalstokastiske led. Første bi-drag i variansformlen fortæller hvordan variabiliteten afde enkelte led indvirker påden samlede variabilitet. Og andet bidrag fortæller hvordan variabiliteten iantalletaf led spiller ind. I modsætning til problemstillingen omkring middelværdien afZ,der kunne findes med eller uden betingningsargumenter eftereget valg, vil det væreganske vanskeligt at findeVZ uden en eller anden form for betingning.

Hvis vi har to stokastiske variable,Y ogZ, begge med 2. moment, kan vi indføre denbetingede kovarianssom

Cov(Y,Z | X) = E(Y Z | X) − E(Y | X)E(Z | X) . (21.24)

Hvis (Qx)x∈X er den betingede fordeling af (Y,Z) givet X kan vi indføre

Cov(Y,Z | X = x) =∫

y z dQx(y, z) −(∫

y dQx(y, z)

) (∫

z dQx(y, z)

)

og i så fald konstatere at Cov(Y,Z | X) er sammensætningen afx 7→ Cov(Y,Z | X = x)med den stokastiske variabelX.

Sætning 21.32Lad X være en stokastiske variable på(Ω, F,P) med værdier i(X,E)og lad Y og Z være reelle variable, defineret på samme rum. Hvisbåde Y og Z har 2.moment gælder at

Cov(Y,Z) = E(

Cov(Y,Z | X))

+ Cov(

E(Y | X) , E(Z | X))

. (21.25)

Page 29: Betingede fordelinger - web.math.ku.dkweb.math.ku.dk/~erhansen/stat2_08/doku/noter/Betinget.pdf · først trækning ændrer urnens indhold. Men hvis vi ikke ved hvad der er blevet

470 Kapitel 21. Betingede fordelinger

B: Vi indsætter definitionerne og ser at

E(

Cov(Y,Z | X))

+ Cov(

E(Y | X) E(Z | X))

= E(

E(Y Z | X) − E(Y | X) E(Z | X))

+ E(

E(Y | X) E(Z | X))

− E(

E(Y | X))

E(

E(Z | X))

= E(Y Z) − EY EZ.

Selv om sætning 21.32 nærmest er en trivialitet at udlede, såhar den konsekvenser,der kan være yderst forbavsende, når man støder på dem i praksis. Associationsmøn-steret mellem to reelle variableY og Z kan på dramatisk vis skifte karakter, alt efterom man betinger medX eller om man ikke gør det. I statistisk sammenhæng refereresder ofte til dette fænomen somSimpsons paradoks.

Y

Z

Figur 21.2:Grafisk eksempel på Simpsons paradoks. Der er optegnet en række observationerfra en todimensional fordeling. Der er en tredie variabelX i problemstillingen - den bestem-mer hvilken af de 7 delpunktskyer observationen hører til. Betinget medX er der en kraftigpositiv korrelation mellemY ogZ, mens den ubetingede korrelation er negativ.

Simpsons paradoks er skematisk illustreret i figur 21.2. Herer X en diskret variabel,der deler observationerne på i nogle grupper. Inden for hverenkeltX-gruppe er der

Page 30: Betingede fordelinger - web.math.ku.dkweb.math.ku.dk/~erhansen/stat2_08/doku/noter/Betinget.pdf · først trækning ændrer urnens indhold. Men hvis vi ikke ved hvad der er blevet

21.5. Opgaver 471

en kraftigt positiv korrelation mellemY og Z - på figuren er grupperne trukket heltfri af hinanden, så man kan se dette forhold med det blotte øje. Alligevel er deren kraftigt negativ korrelation mellemY og Z, når man ser på punktskyen som ethele, altså når man beskriver de to variables simultane fordeling uden at inddrage detbagvedliggendeX.

Simpsons egen beskrivelse af paradokset handlede om uafhængighed. I statistisksammenhæng er der en tilbøjelighed til at man betragter afhængighed mellem tovariable som enkausal sammenhæng, og man forestiller sig at hvis man ved enintervention af en art skruer på den ene variabel, så følger den anden med. Som regeler der intet belæg for den kausale fortolkning, men den er alligevel svær at undgå.Med den kausale fortolkning vil uafhængighed mellemY ogZ betyde at de er udtrykfor fænomener, der intet har med hinanden at gøre.

Det er intuitivt begribeligt for de fleste mennesker, at selvom Y og Z er uafhængigenår der betinges medX, så kan de to variable godt være marginalt afhængige. Detsvarer til venstre side af (21.25) ikke behøver at være nul, bare fordi første led på højreside er nul. Populært siger man at der kan skabes kunstige sammenhænge mellemvariable, når man ikke kontrollerer for for de rigtigebaggrundsvariable. Hvis manvil ændre den ene af disse variable ved en intervention, skalman ikke skrue på denanden, men på baggrundsvariablene.

Simpson diskuterede det modsatte forhold: selv om der er afhængighed afY og Znår man betinger medX, og selv om denne afhængighed ikke skifter karakter medX-værdien, så kanY og Z godt være marginalt uafhængige alligevel. Svarende til atvenstre side af (21.25) godt kan være nul, selv om første led på højre side er forskel-ligt fra nul - det kræver blot at første led kompenseres af andet led. Det vil sige atsammenhænge kan forsvinde ud i den blå luft når man undlader at kontrollere forbaggrundsvariable, og det er ekstremt svært at forstå for defleste mennesker. Det erderfor velvalgt at man bruger ordet ’paradoks’ til at beskrive dette forhold.

21.5 Opgaver

O 21.1. LadX1 og X2 være uafhængige og geometrisk fordelte med parameterp. Find den betingede fordeling afX1 givet X1 + X2.

O 21.2. LadX1 og X2 være uafhængige og binomialfordelte med samme para-metre (n, p). Find den betingede fordeling afX1 givet X1 + X2.

Page 31: Betingede fordelinger - web.math.ku.dkweb.math.ku.dk/~erhansen/stat2_08/doku/noter/Betinget.pdf · først trækning ændrer urnens indhold. Men hvis vi ikke ved hvad der er blevet

472 Kapitel 21. Betingede fordelinger

O 21.3. LadX og Y være uafhængige. Antag at de begge erΓ-fordelte medskalaparameterβ, og med formparameterλ hhv.µ.

S 21.3(a). Find den simultane tæthed af (X,X + Y).

S 21.3(b). Find den betingede tæthed afX givet X + Y.

S 21.3(c). FindE(X | X + Y) og V(X | X + Y).

S 21.3(d). Kontroller atE(E(X | X + Y)) = EX.

S 21.3(e). Kontroller på tilsvarende måde den betingede varians.

O 21.4. LadX1 og X2 være indbyrdes uafhængige stokastiske variable, derbegge er ligefordelt på (0,1).

S 21.4(a). Find den betingede fordeling afX1 givet X(1).

S 21.4(b). Find den betingede fordeling afX1 givet X1 + X2.

S 21.4(c). Find den betingede fordeling afX1 givet |X1 − X2|.

S 21.4(d). Prøv at beskrive den betingede fordeling af (X1,X2) givet X(1).

O 21.5. LadRvære en stokastisk variabel, hvis fordeling har tæthed

f (r) = kr2e−r22 , r ≥ 0.

S 21.5(a). Bestemk.

Lad T være en anden stokastisk variabel, og antag at den betingedefordeling afTgivet R= r er ligefordelingen på (−r, r) for hvertr > 0.

S 21.5(b). Find den marginale fordeling afT.

SætS =√

R2 − T2.

S 21.5(c). Find den betingede fordeling afS givet R.

S 21.5(d). Find den marginale fordeling afS.

S 21.5(e). Find den betingede fordeling afRgivet T.

S 21.5(f). Find den betingede fordeling afS givet T, og vis atS og T eruafhængige.

Page 32: Betingede fordelinger - web.math.ku.dkweb.math.ku.dk/~erhansen/stat2_08/doku/noter/Betinget.pdf · først trækning ændrer urnens indhold. Men hvis vi ikke ved hvad der er blevet

21.5. Opgaver 473

O 21.6. LadX, Y og Z være stokastiske variable på (Ω, F,P) med værdier ihenholdsvis (X,E), (Y,K) og (Z,H). Lad (Px)x∈X være den betingede fordeling afYgivet X, og antag atZ og (X,Y) er uafhængige.

Definer sandsynlighedsmåletQx,z på (Y,K) ved

Qx,z = Px.

Vis at (Qx,z)(x,z)∈X×Z er den betingede fordeling afY givet (X,Z).

O 21.7. LadX, Y ogZ være stokastiske variable på (Ω, F,P) med værdier i hen-holdsvis (X,E), (Y,K) og (Z,H). Lad (Pz)z∈Z være den betingede fordeling af (X,Y)givet Z.

Antag at der findes et sandsynlighedsmålµ på (X,E) og en familie (Qz)z∈Z af sand-synlighedsmål på (Y,K) sådan at

Pz = µ ⊗ Qz for Z(P)-næsten allez.

Vis at X og (Y,Z) er uafhængige. Vis atµ er fordelingen afX, og at (Qz)z∈Z er denbetingede fordeling afY givet Z.

O 21.8. LadX og Y være reelle stokastiske variable, defineret på (Ω, F,P). LadC være en fast Borelmålelig delmængde afR. Vi spiller følgende spil: Vi får oplystværdien afX, og skal på den baggrund gætte på omY ∈ C eller ej.

Det er naturligt at forlange at hvis vi i to forskellige spil observerer sammeX-værdi,så skal vi komme med samme gæt på omY ∈ C eller ej - vi ved jo lige meget i deto situationer. Det betyder at gættereglen er det samme som at angive en mængdeA:hvis vi observererX ∈ A, så gætter vi på atY ∈ C, hvis vi observererX < A, så gættervi på atY < C.

Forskellige valg afA giver så mere eller mindre vellykkede gætteregler (en gætteregeler naturligvis vellykket hvis den ofte gætter rigtigt). Lad(Px)x∈X være den betingedefordeling afY givet X.

S 21.8(a). Vis for en given gætteregelA at

P(rigtigt gæt)=∫

APx(C) dX(P)(x) +

AcPx(C

c) dX(P)(x).

S 21.8(b). Vis at den optimale gætteregel svarer til mængden

A0 =

x ∈ X | Px(C) ≥ 12

.