26
SPIL Sandsynligheder og Strategier Ole Witt-Hansen Køge Gymnasium 1998 (2016)

Sandsynligheder og strategier ved spil - Ole Witt-Hansen ...olewitthansen.dk/Matematik/Sandsynligheder_og_strategier_ved_spil… · 6dqgv\qoljkhghu yhg vslo 3n vdpph pngh ndq yl ilqgh

  • Upload
    lamngoc

  • View
    223

  • Download
    2

Embed Size (px)

Citation preview

Page 1: Sandsynligheder og strategier ved spil - Ole Witt-Hansen ...olewitthansen.dk/Matematik/Sandsynligheder_og_strategier_ved_spil… · 6dqgv\qoljkhghu yhg vslo 3n vdpph pngh ndq yl ilqgh

SPIL

Sandsynligheder og Strategier

Ole Witt-Hansen Koslashge Gymnasium 1998 (2016)

Indhold Kap 1 Sandsynligheder ved spil1

1 Lotto 1 oslashvelser 3 2 Poker 3 3 Ruinsandsynligheder ved Roulette mv 5

Kap 2 Strategier ved spil 9 1 Forskellige spil 9 11 Mandags-chancen9 12 Skaeligbnen9 13 Indbrudstyvens pensionsproblem10 14 Taeligndstikspillet 10 15 Casino11 2 Optimale Strategier 11 2 Den optimale Snell-strategi12 21 Indbrudstyvens pensionsproblem13 22 Skaeligbnen14 23 Mandagschancen15 24 Casino17 25 Taeligndstikspillet 18

Indeks 24

Sandsynligheder ved spil 1

Kap 1 Sandsynligheder ved spil

1 Lotto Ved lottospil garingr det som bekendt ud paring at gaeligtte 7 tal ud af 36 mulige Foruden de 7 lotto tal bliver der ogsaring udtrukket 1 tillaeliggstal Man opnaringr praeligmier paring foslashlgende maringde

1 praeligmie ved at gaeligtte alle 7 rigtige 2 praeligmie for at gaeligtte 6 rigtige plus et tillaeliggstal 3 praeligmie for at gaeligtte 6 rigtige 4 praeligmie for at gaeligtte 5 rigtige 5 praeligmie for at gaeligtte 4 rigtige

Vi vil indlede med at udregne sandsynlighederne for at faring hver af disse praeligmier naringr man udfylder eacuten raeligkke Vi skal her minde om definitionen af sandsynligheden for en haeligndelse H i et Symmetrisk Sandsynlighedsfelt hvor n(U) er det mulige antal udfald og n(H) er antallet af udfald i H

Mulige

Gunstige

UielementerAntal

HielementerAntal

Un

HnHP

)(

)()(

Antallet af forskellige maringder hvor man kan udvaeliglge en delmaeligngde paring q elementer af en maeligngde paring n elementer er

)(

)(

qnq

nqnK

De mulige maringder at udvaeliglge 7 tal ud af 36 er derfor

68034781234567

30313233343536

)736(7

36)736(

K

Foslashlgelig er sandsynligheden for 7 rigtige

77 1019791

)736(

1)7( p

KP

Naringr vi skal udregne sandsynligheden for 6 rigtige tal plus et tillaeliggstal raeligsonnerer vi paring foslashlgende maringde De 6 rigtige kan vaeliglges ud af 7 paring K(76) = 7 forskellige maringder og tillaeliggstallet kan vaeliglges paring 1 maringde Da vi baringde skal have 6 rigtige og et tillaeliggstal rigtigt skal de to antal muligheder multipliceres for at finde antallet af gunstige udfald P(6 rigtige + 1tt) = K(76)1K(367)=7K(367)=7p7 = 833010-7

Sandsynligheder ved spil 2

Paring samme maringde kan vi finde sandsynligheden for 6 rigtige idet antal gunstige er K(76) gange med antal maringder rdquodet forkerte talrdquo kan vaeliglges paring nemlig 36 ndash7 ndash1 = 28 maringder idet det forkerte tal hverken maring vaeligre et af de 7 rigtige eller et tillaeliggstal P(6 rigtige) =K(76)28K(367) = 196p7 = 2347910-5 Sandsynligheden for 5 rigtige tal findes som antallet af maringder at udtage 5 rigtige ud af 7 lig med K(75) gange antallet af muligheder for de to sidste tal som kan vaeliglges blandt 36 - 7 = 29 tal Dette antal er K(292) P(5 rigtige) = K(75)K(292)K(367) = 8526p7 = 10210-3 =102 Paring helt samme maringde opskriver vi sandsynligheden for 4 rigtige idet de gunstige er K(74) K(293) nemlig 4 rigtige udvalgt blandt 7 gange 3 rdquoforkerterdquo udvalgt blandt 29 P(4 rigtige) = K(74)K(293)K(367) = 127890p7 = 00153 = 153 Af ovenstaringende fremgaringr at chancen for at faring mere end 4 rigtige er uhyre ringe Til gengaeligld er der en rimelig chance for at faring 4 rigtige Dette er gjort helt bevidst for dem der har planlagt spillet Erfaringen viser nemlig at hvis man aldrig vinder holder man op med at spille efter en vis tid Lad os antage at man hver uge udfylder en kupon med 10 raeligkker Foslashrst udregner vi chancen for at faring 4 rigtige paring mindst eacuten af kuponerne Haeligndelsen 4 rigtige er binomialfordelt med antalsparameteren n =10 For at finde denne sandsynlighed udregner vi foslashrst sandsynligheden for den komplementaeligre haeligndelse Ikke 4 rigtige paring nogen af kuponerne P(Ikke 4 rigtige paring nogen af kuponerne) = (1-p4)

10 = 0984710 =08557 P(4 rigtige paring mindst eacuten af kuponerne) = 1 - P(Ikke 4 rigtige paring nogen af kuponerne) = 01443 Man har altsaring knap 15 chance for at faring 4 rigtige paring mindst en af de 10 raeligkker Antager vi nu at man spiller 10 raeligkker i 5 uger vil vi udregne sandsynligheden for at man ikke faringr 4 rigtige paring nogen af de 5 uger P(ikke 4 rigtige i 5 uger)= 085575 = 04487 Der er saringledes godt 50 chance for at man faringr 4 rigtige mindst en gang paring 5 uger Det er formodentlig det som holder spillet i gang Vinder man faringr man udbetalt ca 40 kr som kan sammenlignes med udgiften til en kupon 540 =200 kr Middelgevinsten paring en kupon til 40 kr hvis vi kun ser paring 4 rigtige og saeligtter praeligmien 40 kr er -40∙P(ikke 4 rigtige paring de 10 kuponer) + 40∙P(4 rigtige) = -40∙ 08557+40∙01443 = -285 kr

Sandsynligheder ved spil 3

oslashvelser 1 Udregn hvor mange uger man skal spille 10 raeligkker for at der er mere end 50 chance for at

vinde 4 praeligmie (5 rigtige) Opgaven skal loslashses med logaritmer 2 Forsoslashg at udregne samme som ovenfor blot med en 1 praeligmie 3 En udfyldt raeligkke paring 7 tal daeligkker aringbenbart over K(74)K(292) forskellige raeligkker med 4

rigtige Hvor mange raeligkker skal man mindst udfylde for at vaeligre sikker paring at faring 4 rigtige

2 Poker Vi antager at Poker spilles med et almindeligt spil kort og at hver spiller faringr 5 kort fra begyndelsen Vi vil ikke beskaeligftige os med at koslashbe nye kort da det er alt for kompliceret men kun udregne sandsynlighederne for de forskellige kombinationer af kort der kan slaring hinanden Flush betyder i Poker sammenhaeligng 5 kort i samme farve og Straight betyder 5 kort i raeligkkefoslashlge Rangfoslashlgen af kortfarverne er i oslashvrigt de samme som i Bridge Spar Hjerter Ruder Kloslashr Rangfoslashlgen af kortkombinationer i Poker er foslashlgende Royal Flush De 5 hoslashjeste kort i samme farve Feks es konge dame knaeliggt 10 i ruder Straight Flush 5 kort i raeligkkefoslashlge i samme farve Fire ens 4 ens kort (5 kort underordnet) Full House 3 ens + 2 ens (et par) Flush 5 kort i samme farve Straight 5 kort i raeligkkefoslashlge Tre ens tre ens kortvaeligrdi To par 2 ens + 2 ens Et par 2 ens Hoslashjeste kort Sandsynlighederne for hver af disse kortkombinationer kan udregnes idet de mulige kombinationer af 5 kort udtaget af 52 er K(525) = 2598960 Royal Flush Der er 4 forskellige Royal Flush ndash en i hver farve

P(Royal flush) = )552(

4

K 615610-6

Straight Flush Der kan i hver af de 4 kortfarver laves 9 forskellige Straight Flush En af dem er Royal

P(Straight Flush) =)532(

32

)552(

)19(4

KK

= 492510-5

Sandsynligheder ved spil 4

Fire ens Der er 13 forskellige muligheder for fire ens Det femte kort kan vaeliglges paring 52 - 4 = 48 forskellige maringder

P(4 ens) =

)552(

624

)552(

4813

KK240110-4

Full House Der er 13 forskellige muligheder for 3 ens De 3 kan udtages paring K(43) forskellige maringder De to ens maring noslashdvendigvis have en anden talvaeligrdi hvoraf resultatet foslashlger

P(Full House 3 ens + 2 ens) =

)552(

3744

)552(

)24(12)34(13

KK

KK140010-3

Flush 5 kort i samme farve kan udtages paring K(135) maringder Der er 4 kortfarver Vi maring subtrahere Straight Flusher fra

P(Flush 5 i samme farve) = 3109671)552(

5112

)552(

432)513(4

KK

K

Straight Der er 13 - 4 = 9 forskellige raeligkkefoslashlger Hver af de 5 kortvaeligrdier kan vaeliglges blandt 4 farver Vi skal fratraeligkke Straight Flush

P(Straight 5 i raeligkkefoslashlge) = 35

10533)552(

9180

)552(

3649

KK

Tre ens Der er 13 kortvaeligrdier og der skal udvaeliglges 3 De sidste to kort kan udvaeliglges blandt 52 - 4 = 48 kort (ikke 49 da det kunne give 4 ens) Vi maring dog fratraeligkke de 12K(42) par der kan dannes og som ville give Full House

P(3 ens) = 2101132)552(

54912

)552(

))24(12)248(()34(13

KK

KKK

To par Foslashrst udregnes antallet af muligheder for de to par Faktoren frac12 skyldes at man ved denne optaeliglling taeligller de mulige kombinationer Et par feks (spar dame hjerter dame) vil baringde vaeligre at finde blandt de 13K(42) og de 12K(42) muligheder Det sidste kort kan vaeliglges blandt 52 ndash 8 som danner de to par

P(2 par) = 210754)552(

552123

)552(

)852)(24(12)24(1321

KK

KK

Et par De foslashrste 3 faktorer i taeliglleren er antallet af maringder at faring et par paring Vi bliver noslashdt til at subtrahere mulighederne for 2 par og Full House

P(1 par) = 47010)552(

1221781

)552(

3755552123)348()24(13

KK

KK

Sandsynligheder ved spil 5

Hermed har vi afsluttet vores gennemgang af sandsynlighederne i Poker Bemaeligrk at sandsynlighederne foslashlger rangen af en Pokerharingnd

3 Ruinsandsynligheder ved Roulette mv Beregningen af ruinsandsynligheder er noget som er helt afgoslashrende for forsikringsvirksomhed hvis denne skal drives forretningsmaeligssigt Sammenhaeligngen mellem ruinsandsynligheder og beregning af praeligmiestoslashrrelserne en ret kompliceret matematisk teori som betegnes forsikringsmatematik Paring universiteterne findes en saeligrlig uddannelse som kaldes aktuar studiet som har dette som speciale Forsikringsmatematik kan illustreres ved at betragte roulettespil paring et Casino En roulette har 37 felter nummereret 0 ndash 36 Hvis man vinder paring et felt faringr man udbetalt 36 gange indsatsen Da man har lagt en indsats er gevinsten 35 indsatser Hvis X er den stokastiske variabel som betegner en spillers gevinst saring antager X vaeligrdierne +35 med sandsynlighed 137 og ndash1 med sandsynlighed 3637

P(X = 35) = 137 og P(X = -1) = 3637 Middelgevinsten naringr man spiller paring et felt er foslashlgelig

(31) 37

1

37

36)1(

37

135)()()(

Uu

uPuXXE

Hvis spilleren i stedet vaeliglger at spille paring m felter antager gevinsten X vaeligrdierne 36 - m med sandsynlighed m37 og ndashm med sandsynligheden (37 - m)37 = 1 - m37 Middelgevinsten bliver herefter

37

)37

1)((37

)36()()()(mm

mm

muPuXXEUu

Middelgevinsten pr indsats er saringledes uafhaeligngig af hvor mange felter man spiller paring Hermed er det slaringet fast Der findes intet system der kan bringe eacuten i stand til at vinde paring en roulette paring laeligngere sigt Dette er en simpel matematisk kendsgerning som mange har maringttet erkende paring en betydelig mere smertelig maringde Specielt hvis man spiller paring m = 18 felter er gevinsten 36-18=18 med sandsynlighed 1837 og ndash18 med sandsynlighed 1937 Selvom en spiller ikke kan vinde i det lange loslashb har spilleren paring grund af tilfaeligldigheder (som spillere foretraeligkker at kalde held) mulighed for at vinde betragtelig store beloslashb Vi vil nu lave nogle betragtninger over hvor stor sandsynlighed en spiller har for at spraelignge banken dvs at ruinere et Casino En saringdan beregnet sandsynlighed kaldes for ruin sandsynligheden

Ruinsandsynligheder 6

Vi antager at Banken raringder over n-enheder (indsatser) Vi oslashnsker at vurdere sandsynligheden for at en uendelig rig spiller der goslashr den samme indsats i hvert spil vinder n eller flere enheder naringr der ikke er nogen begraelignsning paring antallet af spil Ruinsandsynligheden for banken betegner vi rn Hvis X1 X2 X3 betegner Casinorsquoets gevinst ved de enkelte spil er

Gk = X1 + X2 +X3++Xk gevinsten efter k-spil Ruinsandsynligheden kan derfor formuleres derhen at

rn = P( 0kG for et eller andet k)

(Der er ingen umiddelbar sammenhaeligng mellem n og k) Der gaeliglder rekursions-formlen

rn+1 = rn r1

som udtrykker at sandsynligheden for at blive ruineret med n+1 enheder er lig sandsynligheden for at blive ruineret med n enheder gange sandsynligheden for at blive ruineret med eacuten enhed Dette fordi vi antager at hvert spil er uafhaeligngigt af de oslashvrige Heraf foslashlger umiddelbart

r2 = r1+1 = r1 r1 = r12 r3 = r2+1 = r2 r1 = r1

3 og foslashlgelig

rn = r1n

For at beregne en ruinsandsynlighed ser vi foslashrst paring tilfaeligldet hvor en spiller saeligtter sin indsats paring 18 felter pr spil Her er Casinorsquoets gevinst +18 eller ndash18 pr spil For nemheds skyld saeligtter vi de 18 indsatser til at vaeligre en enhed = 1 Vi opstiller da foslashlgende rekursionsligning som tager udgangspunkt i det foslashrste spil Sandsynligheden for at banken bliver ruineret med n enheder er lig med Sandsynligheden for at banken vinder det foslashrste spil (hvor den vinder en enhed) gange sandsynligheden for at banken bliver ruineret med n+1 enheder plus sandsynligheden for at banken taber det foslashrste spil (hvor den mister en enhed) gange sandsynligheden for at banken bliver ruineret med n-1 enheder Sandsynlighederne for at banken vinder og taber er 1937 og 1837 Vi kan da opstille ligningen

1

1

1

1111 37

18

37

19

37

18

37

19 nnn

nnn rrrrrr

For at opnaring det sidste udtryk har vi anvendt resultatet af rekursionsligningen rn = r1

n Det er relativt nemt at bestemme r1 ud fra denne ligning Ved division af ligningen med r1

n-1 faringr man

Ruinsandsynligheder 7

018371937

18

37

191

21

211

rrrr

Den sidste 2gradsligning kan loslashses paring normal vis idet diskriminanten d =372 ndash 4middot19middot18 = 1 saring

119

18

38

36

192

137111

rrr

Vi er kun interesseret i loslashsningen r1 = 1819

Ifoslashlge ovenstaringende er nrr nn )

19

18(1

Vi vil herefter besvare sposlashrgsmaringlet Hvor mange enheder skal banken have for at der er mindre end 1 chance for ruin Dette er ensbetydende med at loslashse ligningen

1785)

19

18ln(

)010ln(010)

19

18( nn

Husker vi at en enhed svarede til 18 indsatser giver dette beskedne 1533 indsatser Hvis en spiller derimod spiller paring saeligdvanlig vis med kun at placere en indsats paring eacutet felt er dette - lidt overraskende ndash betydelig mere risikabelt for banken Vi opstiller igen en rekursionsligning med udgangspunkt i det foslashrste spil Sandsynligheden for at banken bliver ruineret med n enheder er lig med Sandsynligheden for at banken vinder det foslashrste spil (hvor den vinder en enhed) gange sandsynligheden for at banken bliver ruineret med n+1 enheder plus sandsynligheden for at banken taber det foslashrste spil (hvor den mister 35 enhed) gange sandsynligheden for at banken bliver ruineret med n-35 enheder Sandsynlighederne for at banken vinder og taber er 3637 og 137 Vi kan da opstille ligningen

351

111351 37

1

37

36

37

1

37

36 nnn

nnn rrrrrr

Ved division med (r1)

n-35 og omordning af leddene og ved at saeligtte r1 = x faringr man ligningen

36x36 ndash 37x35 +1 = 0 Denne ligning kan kun loslashses ved numeriske metoder og man finder loslashsningen x = 09984 Hvis vi igen stiller sposlashrgsmaringlet Hvor mange indsatser skal banken raringde over for at der er mindre end 1 chance for ruin skal vi loslashse ligningen

Ruinsandsynligheder 8

2876)99840ln(

)010ln(010)99740( nn

Altsaring en betydelig stoslashrre beholdning end hvis spilleren spiller paring 18 felter Forsoslashger vi at udregne ruinsandsynligheden for en spiller der har n enheder og laeliggger sin indsats paring eacutet felt kommer vi efter helt det samme raeligsonnement frem til foslashlgende rekursionsligning

35137

11137

36

37

1

37

361351

nn rrrrrr

nnnn

som foslashrer til ligningen x36 ndash 37x +36 = 0 Denne ligning har kun loslashsningen x = 1 Differentieres nemlig f(x) =x36 ndash 37x +36 finder man f (x) =36x35 ndash 37 Ligningen f (x) =0 har

loslashsningen 136

3735 x Da f (x) lt 0 for x lt 1 har den ingen roslashdder mindre end 1

Ruin-sandsynligheden for en spiller der garingr paring et Casino som har en ubegraelignset beholdning er 1 Saring vi kan endnu engang fastslaring at hvis man fortsaeligtter med at spille paring et Casino vil man altid blive ruineret i det lange loslashb Man kunne selvfoslashlgelig overveje ruinsandsynlighederne hvis Casino har beholdningen n og en spiller har beholdningen m (n gt m eller omvendt) men svaret vil afhaelignge af n og m og de indgaringende to ulineaeligre ligninger med to ubekendte med meget hoslashje eksponenter er ikke saring nemme at loslashse numerisk ndash selv paring en Computer Hvis n gtgt m vil svaret stort set vaeligre det samme

Strategier ved spil 9

Kap 2 Strategier ved spil

1 Forskellige spil Efter at have udregnet vindersandsynligheder i forbindelse med spil skal vi nu se paring noget andet som ogsaring er knyttet sammen med sandsynlighedsregningen nemlig problemet med at fastlaeliggge den bedste strategi naringr man spiller et spil Her skal spil imidlertid forstarings i en meget videre betydning det vaeligre sig krig boslashrsspekulation jagt eller fiskeri paring en bestemt dyreart Sidstnaeligvnte er dog alt for komplicerede til at kunne behandles elementaeligrt Faeliglles er det dog at man skal kunne beregne sandsynligheden for en bestemt konsekvens af et givet traeligk Vi vil begynde med at give nogle meget simple eksempler paring spil hvor det er meningsfuldt at tale om optimal strategi Vendingen den optimale strategi indebaeligrer at spillet afvikles i et endeligt antal trin og at der for hvert trin i spillet er mulighed for at forbedre sin gevinst og mulighed for at miste sin gevinst helt eller delvis Man skal endvidere have mulighed for at standse spillet ved ethvert trin og inkassere sin gevinst

11 Mandags-chancen I dette spil som har vaeligret lanceret af TV2 har man en raeligkke tildaeligkkede felter med beloslashb (101025255050100100250) x 1000 kr Man har maximalt 3 forsoslashg Man faringr beloslashbet paring det sidst afdaeligkkede felt Nedenfor er vist en computer simulation af spillet efter 2 traeligk Det er nok klart at hvis man afdaeligkker et felt med 10 i 1 eller 2 forsoslashg skal man fortsaeligtte eller hvis man afdaeligkker et felt med 100 eller 250 i 1 eller 2 forsoslashg skal man standse Men hvad hvis man afdaeligkker et felt med 50 i 1 eller 2 forsoslashg Det vil vi forsoslashge at afgoslashre ved nogle mere matematiske betragtninger

12 Skaeligbnen Et spil som vist nok kommer fra orienten Det spilles med to terninger Foslashrst slaringr man et slag med de to terninger og summen af deres oslashjental betegnes skaeligbnen

Strategier ved spil 10

Man kan nu slaring lige saring mange gange man vil (max 100) Hvis oslashjentallene ikke er lig skaeligbnen saring adderes dette til ens pointtal men hvis man slaringr sin skaeligbne mister man alt Nedenfor er vist et trin i en animeret computer simulation af spillet Naringr spillet er standset fordeler man indsatsen i forhold til spillernes opnaringede pointtal Det gaeliglder derfor om at have de stoslashrste pointtal Problemet er imidlertid hvornaringr det er optimalt at standse naringr man kender sin skaeligbne

13 Indbrudstyvens pensionsproblem Dette er en variant af mange forskellige optimeringsproblemer Arthur er indbrudstyv Hver tyvetugt giver i snit K kr Chancen for at Arthur bliver snuppet er p Hvis han bliver taget mister han alt fra sine tidligere tyvetugter Hvor mange indbrud skal Arthur lave foslashr han standser sin karriere og vaeliglger at leve af sin opsparing

14 Taeligndstikspillet Dette spil falder lidt uden for rammerne af de oslashvrige spil fordi man ikke kan standse spillet og fordi man aldrig kan miste noget af sin gevinst Det kan derfor ikke umiddelbart behandles paring samme maringde som de hidtil naeligvnte spil Alligevel er det et spil der udpraeligget kan behandles med matematiske teorier for den bedste strategi Spillet garingr ud paring at man paring 10 taeligndstikker farver den ene side roslashd Kastes taeligndstikken op er sandsynligheden for at den farvede side vender opad naringr den lander paring bordet lig med p = 025 Hver spiller har fra starten tallene 110 Hvert tal maring kun bruges 1 gang Man skiftes til at kaste de 10 taeligndstikker og notere antallet af farvede taeligndstikker Dette antal skal saring ganges med et af de resterende tal 110 Den som efter 10 spil har den hoslashjeste sum har vundet Det kan oplyses og let verificeres at den maximale gevinst er 550 Middelgevinsten hvor man vaeliglger tilfaeligldig er 1375 og den optimale middelgevinst er ca 167

Strategier ved spil 11

15 Casino Roulette spil falder ogsaring lidt uden for rammerne af optimale strategier af den meget simple grund at odds er svagt imod eacuten Det gaeliglder dog ikke for Blackjack hvor man kan udvikle en strategi som giver en svag fordel Hvis odds er imod eacuten vil man imidlertid altid tabe i det lange loslashb Som tidligere fastslaringet er den eneste mulighed - i det lange loslashb - for at undgaring ruin i roulettespil at der ikke er nogen oslashvre graelignse for indsatser og at man har flere penge end Casionorsquoet og ingen af disse to betingelser er nogensinde opfyldt Enhver fornuftig matematisk spil-teori vil derfor som resultat have at man skal standse foslashr det foslashrste spil Det vil sige Man skal lade vaeligre med at garing paring Casino Denne kendsgerning udelukker dog ikke at man kan goslashre sig overvejelser over hvordan man kan spille hvis man ikke udelukkende er interesseret i at foraeligre sine penge til et Casino uden kamp

2 Optimale Strategier Hvis man intuitivt skal formulere en strategi for de 3 foslashrste spil naeligvnt ovenfor saring kan man feks vaeliglge eacuten af 3 foslashlgende strategier 1 Man beslutter paring forharingnd hvor stor ens gevinst (eller tab) skal vaeligre foslashr man stopper Dette er

faktisk en meget almindelig strategi men den er bestemt ikke optimal 2 Man fortsaeligtter saring laelignge man i middel har mulighed for at foroslashge sin gevinst i naeligste spil Man

skal huske paring at middelvaeligrdien af gevinsten ogsaring omfatter tab saring middelvaeligrdien (i matematisk forstand) skal vaeligre positiv Denne umiddelbart fornuftige strategi kaldet den kortsigtede eller myope strategi er i mange tilfaeliglde ogsaring den optimale strategi (dog ikke i mandagschancen)

3 Man fortsaeligtter saring laelignge man i middel har mulighed for at foroslashge sin gevinst i et af de

efterfoslashlgende spil Denne strategi kaldes den langsigtede strategi Baringde den kortsigtede og den langsigtede strategi ser yderst rimelige ud og de vil ogsaring vaeligre optimale for langt de fleste spil Hvis der er forskel paring den langsigtede og den kortsigtede strategi skal man anvende den langsigtede - naturligvis Der findes imidlertid visse former for spil hvor ingen af strategierne er optimale Det gaeliglder feks for boslashrsspekulanter der har en beholdning aktier som de vil saeliglge naringr kurserne stiger Dette fortsaeligtter som bekendt aldrig i det uendelige Paring et vist tidspunkt standser stigningen og kurserne begynder at falde ndash som regel ndash hurtigere end de steg Hvornaringr skal man saeliglge for at opnaring den stoslashrste gevinst Det viser sig - men det er saeligrdeles kompliceret at redegoslashre for ndash at naringr det gaeliglder boslashrs spekulation saring er ingen af strategierne 2 og 3 optimale De vil begge to i grove traeligk som resultat have at man enten skal saeliglge straks eller vente til man er ruineret Vi vil nu give en beskrivelse af den optimale strategi som er udviklet af Snell Vi vil overhovedet ikke naeligrme os et bevis for at det er den optimale strategi (beviset er ret teknisk abstrakt) men

Strategier ved spil 12

understrege at det kan bevises I matematisk forstand Ulemperne ved Snell-strategien er at den for selv simple problemer kan foslashre til ret omfattende og komplicerede regninger

2 Den optimale Snell-strategi Snell-strategien er paring sin vis den samme som den kortsigtede strategi men hvor man i denne strategi hele tiden regner sig et skridt frem saring tager Snell-strategien udgangspunkt i spillets slutning og arbejder sig baglaeligns Vi indfoslashrer foslashrst nogle betegnelser Vi antager at spillet har n trin Sk er en stokastisk variabel der angiver den faktiske samlede gevinst man har opnaringet ved det kte spil Sk kan antage en eller flere vaeligrdier med tilhoslashrende sandsynligheder Det nye ved Snell-strategien er at man definerer endnu en stokastisk variabel Gk ved ligningen

Gk = maxSk E(Gk+1| S1Sk) Gk er den stoslashrste af vaeligrdierne Sk (gevinsten efter det kte spil) og E(Gk+1| S1Sk)) som er middelvaeligrdien af den maximale forventede gevinst i det k+1te spil naringr det er givet at man har spillet spillene 1k Dette opstilles i et skema Gn = Sn Gevinsten ved spillets afslutning Gn-1 = maxSn-1 E(Gn| S1Sn-1) Gk = maxSk E(Gk+1| S1Sk) G1 = maxS1 E(G2| S1) Snell strategien siger nu at man skal standse spillet den foslashrste gang Sk (gevinsten efter det kte spil) overstiger middelvaeligrdien af den maksimale forventede gevinst i det k+1te spil Dette kaldes for stopbetingelsen Stopbetingelsen er altsaring

Sk E(Gk+1| S1Sk) Man skal altsaring standse spillet naringr den opnaringede gevinst er stoslashrre eller lig med den betingede forventning af den maximale gevinst i det naeligste spil Det kunne lyde som den kortsigtede strategi men forskellen er den at i den kortsigtede strategi er Gk+1 erstattet af Sk+1 At kunne gennemskue konsekvenserne af dette er derimod ikke saring nemt Det viser sig at i mange tilfaeliglde at er Snell-Strategien identisk med den kortsigtede strategi som kraeligver at man stopper naringr Sk E(Sk+1| S1Sk) Snell strategien er ikke umiddelbart let gennemskuelig og udregningen af de betingede middelvaeligrdier E(Gk+1| S1Sk) er ofte ret teknisk Vi vil nu behandle de foslashr naeligvnte eksempler og begynder med

Strategier ved spil 13

21 Indbrudstyvens pensionsproblem Lad os antage at Arthurs gennemsnitlige gevinst ved hvert tyvetogt er K = 6000 kr og at chancen er at han bliver taget er 5 Lad os antage at hans hidtidige gevinst efter k - tyvetugt er Sk som bliver konfiskeret - og som han derved mister hvis han bliver snuppet I dette tilfaeliglde kan man - som vist nedenfor - se at den kortsigtede strategi er den optimale strategi Det haelignger sammen med at alle trin i spillet er identiske Gevinsten ved hvert tyvetogt er den samme ndash uafhaeligngigt af de foregaringende tyvetugter - bortset fra at den samlede gevinst vokser ved hvert vellykket tyvetogt Xk betegner den stokastiske variabel som er Arthurs gevinst ved eacutet tyvetugt Hermed er

Sk =X1+ X2+ X3+hellip Xk Xk+1 kan antage vaeligrdien K med sandsynlighed 1-ps = 1-P(Snuppet) (altsaring hvis det naeligste tyvetugt lykkes) og vaeligrdien ndashSk (han mister hele sin opsparing) med sandsynlighed ps = P(Snuppet) Vi opskriver nu Snell-strategien (Den kortsigtede strategi) for et trin i hans karriere

Gk = max Sk E(Sk+1| 1k)

Sk er hans gevinst efter k tyvetugter og E(Sk+1| 1k) er hans forventede gevinst efter k+1 tyvetugter E(Sk+1| 1k) kan beregnes som den hidtidige gevinst plus den forventede gevinst ved naeligste tyve- tugt i alt lig med Sk + E(Xk+1) E(Xk+1) er uafhaeligngig af de foslashrste k - tyvetugter derfor bliver stopbetingelsen Sk gt Sk + E(Xk+1) E(Xk+1) lt 0 Middelvaeligrdien E(Xk+1) kan saringledes udregnes efter den saeligdvanlige definition idet Xk+1 antager vaeligrdierne K (gevinsten ved et tyvetugt) og - Sk (mister hele sin opsparing) med sandsynlighederne 1-ps og ps henholdsvis E(Xk+1) = K(1- ps) - Sk ps Han skal standse naringr

E(Xk+1) lt 0 K(1- ps) lt Sk ps som med tal eksemplet giver

6000095 lt Sk005 Sk gt 114000- kr svarende til 114006000 = 095005 = 19 tyvetugter

(Det goslashr han nu nok ikke og er derfor henvist til at leve af folkepensionen efter nogle aringr i skyggen) Man kunne godt tro at dette eksempel kunne anvendes paring andre (ligesaring uetiske) problemstillinger Feks hvor mange gange det er optimalt at koslashre gratis i S-tog Det kan det imidlertid ikke helt

Strategier ved spil 14

Sagen er jo den at man faringr en fast boslashde hvis man bliver snuppet men man kommer ikke til at betale for de gange man har koslashrt gratis Med andre ord vurderingen om hvorvidt det er fordelagtigt at koslashre uden billet afhaelignger kun af middelgevinsten ved det naeligste forsoslashg Hvis den er positiv er det fordelagtigt at fortsaeligtte men hvis den er negativ er det fordelagtigt at loslashse billet (Det er i oslashvrigt uetisk at snyde ndash naturligvis) Tager vi et eksempel billetprisen er kr 50- Boslashden er kr 500 Sandsynligheden for at blive snuppet er Ps = 01 Hvis X er gevinsten ved at koslashre uden billet er E(X) = 50middot(1-Ps)-500middotPs = 50middot09-500middot01 = -50 Det er saringledes (med denne sandsynlighed for at blive snuppet) ikke fordelagtigt at koslashre uden billet i S-tog Da en laeligrebog i sandsynligheder ved spil naturligvis ikke maring tilskynde til uetiske handlinger undlader vi at foretage beregningen med Ps = 005

22 Skaeligbnen Vi betragter kast med to terninger X betegner summen af oslashjentallene ved eacutet kast Sandsynlighedsfordelingen for X er velkendt Feks er P(X=5) = 436 Sandsynligheden for at terningerne viser j oslashjne kan skrives som

36

76)(

jjXP

Lad os antage at spillerens skaeligbne er q Hvis man slaringr dette oslashjental er alt tabt Ellers adderes oslashjentallene for hvert kast Hvis ikke man har slaringet sin skaeligbne saring er den samlede gevinst efter n spil

Sn = X1+ X2+ X3+hellip +Xn

Og middelvaeligrdien af Sn er

E(Sn) = E(X1)+ E(X2)+E(X3)+hellip +E(Xn) = nE(X | X q) E(X | X q) er den betingede middelvaeligrdi af oslashjentallene givet at man ikke slaringr sin skaeligbne

E(X | X q) = 2P(2) +3P(3)+hellip(q-1)P(q-1) + (q+1)P(q+1)+hellip+12P(12) Den kortsigtede strategi (og Snell strategien) fastslaringr at man skal standse naringr middelvaeligrdien af den forventede gevinst ved naeligste kast er negativ Argumentet for dette kan overtages naeligsten ordret fra indbrudstyvens pensionsproblem E(Sk+1|S1 Sk) kan beregnes som den hidtidige gevinst Sk plus den forventede gevinst ved det naeligste kast i alt lig med Sk + E(Xk+1| S1 Sk) Stopbetingelsen er derfor

Sk gt Sk + E(Xk+1| S1 Sk) E(Xk+1| S1 Sk) lt 0

Strategier ved spil 15

E(X | X q) ndash SnP(q) lt 0 Sn gt E(X | X q) P(q) Det er ikke saeligrlig svaeligrt at udregne stopbetingelsen feks for q = 2 og q = 6 Nedenfor er vist udskriften fra et program som foretager beregningen for q = 212 Forventet gevinst i naeligste kast naringr ens skaeligbne er q q 2 3 4 5 6 7 8 9 10 11 12 694 683 667 644 617 583 589 600 617 639 667 Stop naringr din gevinst S gt EX(q)P(q) naringr skaeligbne er q q 2 3 4 5 6 7 8 9 10 11 12 25000 12300 8000 5800 4440 3500 4240 5400 7400 11500 24000

Som det fremgaringr er der endog meget stor forskel paring stoptiderne afhaeligngig af ens skaeligbne

23 Mandagschancen Dette spil er lidt mere interessant fordi det ikke er helt saring enkelt at gennemskue I dette tilfaeliglde kan man ikke forvente at den kortsigtede strategi vil foslashre til den optimale strategi At den faktisk goslashr det skyldes talvaeligrdierne Dette skal forstarings saringledes at hvis man aeligndrede paring praeligmiestoslashrrelserne ville Snell-strategien afvige fra den kortsigtede strategi Vi vil analysere spillet ved Snell-strategien Som naeligvnt har man i spillet 9 tildaeligkkede felter (101025255050100100250) Man kan afdaeligkke hoslashjest 3 felter Man faringr beloslashbet i 1000 kr som det sidste felt viser Hvis X er den stokastiske variabel som angiver vaeligrdien af et felt saring vil de fleste uden saring lange overvejelser vel fortsaeligtte hvis Xlt50 og standse hvis X100 Det kritiske er hvis man afdaeligkker 50 (X=50) Vi bemaeligrker foslashrst at summen af alle felterne er S=620 og at E(X) =6209=689 Vi opskriver foslashrst den fuldstaeligndige Snell-strategi for dette spil G3 =X3 Den Stokastiske variabel G3 = Gevinsten = X3 = vaeligrdien af det sidst afdaeligkkede felt G2 = max X2 E(G3| X1X2 ) Den stoslashrste af vaeligrdierne X2 (= vaeligrdien af det afdaeligkkede

felt) og den betingede middelvaeligrdi af G3 = X3 G1 = max X1 E(G2| X1 ) Som ovenfor Kriteriet for den optimale strategi er som tidligere Stop hvis paring noget trin Xk gt E(Gk+1| X1Xk ) Det er relativ nemt at opstille en formel for E(G3| X1X2 ) Naringr X1 og X2 er afdaeligkket er summen de resterende felter S - X1 - X2 Da alle felter har samme sandsynlighed er middelvaeligrdien simpelthen middeltallet af felterne E(G3| X1X2 ) = ( S - X1 - X2)(9-2)

Strategier ved spil 16

Det er noget mere teknisk at opstille en formel for E(G2| X1 ) og ogsaring lidt teknisk at foretage beregningen Vi vil noslashjes med at skitsere beregningen for en vaeligrdi af X1 og i oslashvrigt henvise til resultatet af et Computerprogram som kan ses nedenfor Lad os antage at X1 = 25 Vi lader nu X2 gennemloslashbe alle de mulige vaeligrdier (alle vaeligrdier skal taeliglles med det antal gange der er felter med denne vaeligrdi) For hver vaeligrdi af X2 (feks 50) skal vi vaeliglge max af X2 og E(G3| X1X2 ) = ( S - X1 - X2) (9-2) (= (620-50-25)7 = 778 i dette tilfaeliglde) og addere det til en sum S2 E(G2| X1 ) er da lig med S2(9-1) (da der er 9-1 felter X2 ) X2[1]= 1000 E(G3)= 8571 G2= 8571 X2[2]= 2500 E(G3)= 8357 G2= 8357 X2[3]= 5000 E(G3)= 8000 G2= 8000 X2[4]= 10000 E(G3)= 7286 G2= 10000 X2[5]= 25000 E(G3)= 5143 G2= 25000 X1[1]= 1000 E(G[2])= 10786 X2[1]= 1000 E(G3)= 8357 G2= 8357 X2[2]= 2500 E(G3)= 8143 G2= 8143 X2[3]= 5000 E(G3)= 7786 G2= 7786 X2[4]= 10000 E(G3)= 7071 G2= 10000 X2[5]= 25000 E(G3)= 4929 G2= 25000 X1[2]= 2500 E(G[2])= 10679 X2[1]= 1000 E(G3)= 8000 G2= 8000 X2[2]= 2500 E(G3)= 7786 G2= 7786 X2[3]= 5000 E(G3)= 7429 G2= 7429 X2[4]= 10000 E(G3)= 6714 G2= 10000 X2[5]= 25000 E(G3)= 4571 G2= 25000 X1[3]= 5000 E(G[2])= 10500 X2[1]= 1000 E(G3)= 7286 G2= 7286 X2[2]= 2500 E(G3)= 7071 G2= 7071 X2[3]= 5000 E(G3)= 6714 G2= 6714 X2[4]= 10000 E(G3)= 6000 G2= 10000 X2[5]= 25000 E(G3)= 3857 G2= 25000 X1[4]= 10000 E(G[2])= 9643 X2[1]= 1000 E(G3)= 5143 G2= 5143 X2[2]= 2500 E(G3)= 4929 G2= 4929 X2[3]= 5000 E(G3)= 4571 G2= 5000 X2[4]= 10000 E(G3)= 3857 G2= 10000 X1[5]= 25000 E(G[2])= 6268 Ser man resultaterne igennem kan de udmoslashntes i en simpel regel Fortsaeligt paring 50 eller derunder Stop paring 100 eller derover Det er maringske lidt overraskende at man ogsaring skal forsaeligtte paring 50000 hvis man kun har et forsoslashg tilbage ndash man kunne jo ende med 10000 og det er saring bare aeligrgerligt ndash og det er vist nok de fleste som standser ved 50000 - men det er ikke den bedste strategi

Strategier ved spil 17

24 Casino Som naeligvnt i indledningen til dette afsnit findes der ingen strategi som kan bringe en i stand til at vinde paring et Casino ndash i det lange loslashb Vil man goslashre Casino-spil til en levevej vil det altid med matematisk sikkerhed ende med ruin Det betyder imidlertid ikke at man ikke kan vinde ved at garing paring Casino men hvis man taelignker paring at spraelignge banken saring skal to krav i hvert fald vaeligre opfyldt for at der skal vaeligre en ikke forsvindende sandsynlighed for at det kan lade sig goslashre 1 Man skal have flere penge end Casino 2 Der maring ikke vaeligre loft over indsatserne Begge betingelser er som bekendt aldrig opfyldt Man kan som sagt godt vinde paring et Casino men hvis man satser paring at vinde mere (alle de gange man er paring Casino i sit liv) end det beloslashb man medbringer ved hvert besoslashg saring vil chancerne for at tabe det hele vaeligre stoslashrst Her er der tale om sandsynligheder og middelvaeligrdier ndash om odds Selvfoslashlgelig er de muligt at tabe hele sin formue ved foslashrste besoslashg eller vinde det tredobbelte ved det andet Der har i tidens loslashb vaeligret lanceret flere eksempler paring vinderstrategier som lyder uhyre besnaeligrende Den mest kendte er Martingale-systemet Man spiller kun paring sort og roslashd hvor faringr man faringr fordoblet sin indsats hvis man vinder Spillet er saringledes helt lige bortset fra at indsatserne bliver liggende naringr zero kommer ud og man kun faringr sin indsats en gang hvis man vinder i naeligste spil (zero har ingen farve) Spiller man efter Martingale-systemet skal man inkassere sin gevinst hvis man vinder Hvis man derimod taber skal man fordoble sin indsats Vi saeligtter grundindsatsen til 1 Har man spillet n gange og dermed doblet op n-1 gange har man lagt en indsats Sn = 1 + 2 + 22 +hellip2n-1 = 2n ndash1 Udregnet af kvotientraeligkkeformlen

1

10

q

qaS

n

n

for raeligkken Sn = a0 + a0q+ a0q

2+hellip+ a0qn-1

Vinder man det nte spil faringr man udbetalt 22

n-1 = 2n saring ens gevinst er 2n - (2n - 1) = 1 Der gaeliglder aringbenbart den simple kendsgerning at bliver man bare ved med at fordoble saring har man altid vundet eacuten indsats Foslashr man forsoslashger sig med dette skal man dog nok goslashre sig klart hvor mange gange man kan tabe foslashr man er ruineret

Strategier ved spil 18

Sandsynligheden for at man taber 5 spil er (frac12)5 = 132 Man har da tabt 25 ndash 1 gange vaeligrdien af en jeton (i Danmark 50 kr) dvs 1550 kr Vil man sikre sig bedre feks ved at kunne doble op 9 gange (sandsynligheden for at tabe 10 spil er 11024) saring skal man komme med kr 51150- men det kan man ikke engang gennemfoslashre da hoslashjeste indsats i Danmark er 24000- Man kunne imidlertid stille det sposlashrgsmaringl Hvis man har n-jetoner hvad er saring sandsynligheden for at vinde q-jetoner hvis man spiller efter Martingale-systemet Dette kan man faktisk godt udregne direkte men regningerne er ret omfattende Derimod er resultatet simpelt Vi vil ikke lave en direkte udregning men anvende de samme metoder som vi har anvendt for den bedste strategi Vi tager udgangspunkt i det faktum at sort roslashd Casino spil er et lige spil saring middelvaeligrdien af gevinsten er 0 ligegyldigt hvordan man spiller Middelvaeligrdien (som er nul ) af en gevinst paring q-jetoner er lig med q gange sandsynligheden P(q) for at vinde q jetoner minus ens kapital (n jetoner) gange med sandsynligheden for at man taber det sidste spil som er 1 ndash P(q)

qP(q) ndash n(1 ndashP(q)) = 0 qn

nqP

)(

Har man feks n = 31 jetoner (1550- kr) er sandsynligheden for at vinde q=10 (500 kr) lig med 0756 En rimelig stor sandsynlighed men altsaring stadig 25 chance for ruin Oslashnsker man derimod at blive rigtig rig og vinde 10000- kr dvs q=200 er P(200) = 0134 Konklusionen er den at satser man paring at vinde mere end man medbringer saring er sandsynligheden mindre end frac12 men kan man noslashjes med mindre saring er sandsynligheden stoslashrre end frac12 Men bemaeligrk dette gaeliglder fra foslashrste gang man garingr ind paring et Casino til man beslutter at holde op

25 Taeligndstikspillet Som beskrevet ovenfor garingr spillet ud paring at farve den ene af siderne roslashd paring 10 taeligndstikker Naringr taeligndstikken kasten op i luften er sandsynligheden for at den roslashde side vender opad naringr den rammer bordet lig med p=025 Man kaster paring skift 10 saringdanne taeligndstikker 10 gange For hvert kast skal man multiplicere antallet af roslashde med et af tallene 110 Hver tal maring kun bruges eacuten gang Den der faringr den stoslashrste sum har vundet Det er klart at en god strategi i det lange loslashb vil give en hoslashjere sum Vi minder om at antallet af X roslashde taeligndstikker er binomialfordelt med primaeligrsandsynlighed p og antalsparameter n=10

102104

3

4

110)(

10

jj

jXPjj

Strategier ved spil 19

Endvidere vil vi anvende de kumulerede sandsynligheder P(X j) og P(X j) Nedenfor er vist resultatet af en Computersimulation af spillet Primaeligr sandsynligheder for n= 10 og p= 0250 P(X=j) j 0 1 2 3 4 5 6 7 8 9 10 00563 01877 02816 02503 01460 00584 00162 00031 00004 00000 00000 Baglaeligns kumulerede sandsynligheder P(Xgt=q) j 0 1 2 3 4 5 6 7 8 9 10 10000 09437 07560 04744 02241 00781 00197 00035 00004 00000 00000 1 kast Antal = 2 Vaeliglg mellem 1 2 3 4 5 6 7 8 910 Faktor= 4 2 kast Antal = 4 Vaeliglg mellem 1 2 3 5 6 7 8 910 Faktor=10 3 kast Antal = 2 Vaeliglg mellem 1 2 3 5 6 7 8 9 Faktor= 5 4 kast Antal = 2 Vaeliglg mellem 1 2 3 6 7 8 9 Faktor= 3 5 kast Antal = 3 Vaeliglg mellem 1 2 6 7 8 9 Faktor= 8 6 kast Antal = 2 Vaeliglg mellem 1 2 6 7 9 Faktor= 6 7 kast Antal = 6 Vaeliglg mellem 1 2 7 9 Faktor=9 8 kast Antal = 3 Vaeliglg mellem 1 2 7 Faktor= 2 9 kast Antal = 2 Vaeliglg mellem 1 7 Faktor= 7 10 kast Antal = 2 Vaeliglg mellem 1 Faktor= 1 Din score er 176 Valget af tallene 110 er i dette tilfaeliglde foretaget ud fra den optimale strategi som vi vil omtale om et oslashjeblik Foslashr vi analyserer den optimale strategi for dette spil vil vi forsoslashge os med en intuitiv bedste strategi Vi belyser denne strategi med et konkret eksempel Lad os feks antage at vi slaringr 4 roslashde i den 3 kast (3 forsoslashg) De tal vi har tilbage kalder vi (y8 y7 y6 y5 y4 y3 y2 y1) Sposlashrgsmaringlet om vi skal gange med det stoslashrste y8 eller det naeligststoslashrste y7 osv Vi raeligsonnerer da som foslashlger Hvis sandsynligheden for at slaring mere end 4 roslashde i de resterende 7 kast er stoslashrre end frac12 saring skal vi vaeliglge det naeligststoslashrste Vi skaeligrper dette Hvis sandsynligheden for at slaring mindst 5 roslashde mindst en gang i de resterende 7 kast er stoslashrre end frac12 saring skal vi vaeliglge det naeligststoslashrste Tilsvarende hvis sandsynligheden for at slaring mindst 5 roslashde mindst 2 gange i de resterende 7 kast skal vi vaeliglge det 3 stoslashrstehellipog saringdan fremdeles Strategien virker umiddelbart meget plausibel Sandsynlighederne kan direkte farings af binomialfordelingen Foslashrst sandsynligheden for at faring mindst q-roslashde i et kast Dette er

P(X q) =

n

qj

jXP )( hvor P(X = j) er angivet ovenfor

Strategier ved spil 20

Sandsynligheden for at dette sker mindst r gange i n - k kast er ogsaring en binomialfordeling og kan skrives

P(X q mindst r gange i n - k kast ) = jknjkn

rj

qXPqXPj

kn

))(1()(

Beregningen af disse (110) sandsynligheder goslashres nok lettest paring en computer For at lave en strategi-tabel goslashr man det at for hvert kast og hvert antal mulige roslashde vaeliglger man foslashrst det stoslashrste af de resterende tal Dernaeligst beregner man sandsynligheden for at faring mindst 1 roslashd mere i et af de foslashlgende kast Hvis denne sandsynlighed er stoslashrre end frac12 ser man paring det naeligststoslashrste af de resterende tal Man beregner saring sandsynligheden for at faring mindst 1 roslashd mere i mindst to af de resterende kast Hvis denne sandsynlighed er stoslashrre end frac12 saring vaeliglger man det tredjestoslashrste af de resterende tal og saringdan fremdeleshellip Det bemaeligrkes at beregningen skal initialiseres med at man altid vaeliglger det mindste hvis man slaringr 0 roslashde og altid vaeliglger det stoslashrste hvis man slaringr 10 roslashde Nedenfor er vist en computerberegning af en strategi-tabel Endvidere er ogsaring lavet en saringkaldt Monte-Carlo simulation Dette betyder at man har ladet maskinen spille feks 10000 spil spillet efter strategi-tabellen Nederst er vist hyppighederne for ens score og endelig fordelingsfunktionen for observationerne (Den kumulerede frekvens) P(X =j) for n =10 and p = 0250 j 0 1 2 3 4 5 6 7 8 9 10 P(X =j)0056 0188 0282 0250 0146 0058 00162 0003 00004 0000 0000 P(Xgt=j) for n =10 and p = 0250 j 0 1 2 3 4 5 6 7 8 9 10 P(Xgt=j) 1000 0944 0756 0474 0224 0078 00197 00035 00004 0000 0000 Strategi tabel Tallene refererer ikke til faktorene selv men til den stoslashrste naeligststoslashrste osv Eksempel Hvis man slaringr 3 roslashde i den andet kast saring skal man vaeliglge (7) den tredjestoslashrste Kast no 1 2 3 4 5 6 7 8 9 10 score 0 1 1 1 1 1 1 1 1 1 1 1 3 3 3 2 2 2 2 1 1 1 2 6 5 5 4 4 3 3 2 2 1 3 8 7 7 6 5 4 3 3 2 1 4 9 9 8 7 6 5 4 3 2 1 5 10 9 8 7 6 5 4 3 2 1 6 10 9 8 7 6 5 4 3 2 1 7 10 9 8 7 6 5 4 3 2 1 8 10 9 8 7 6 5 4 3 2 1 9 10 9 8 7 6 5 4 3 2 1 10 10 9 8 7 6 5 4 3 2 1 Gennemsnitlig score = 16437

Strategier ved spil 21

Hyppighed af score h( 75)= 1 h( 80)= 7 h( 85)= 3 h( 90)= 5 h( 95)= 6 h(100)= 34 h(105)= 38 h(110)= 82 h(115)= 68 h(120)=161 h(125)=146 h(130)=320 h(135)=280 h(140)=534 h(145)=425 h(150)=752 h(155)=577 h(160)=878 h(165)=645 h(170)=956 h(175)=651 h(180)=863 h(185)=527 h(190)=609 h(195)=351 h(200)=389 h(205)=180 h(210)=203 h(215)= 93 h(220)= 86 h(225)= 47 h(230)= 32 h(235)= 21 h(240)= 13 h(245)= 8 h(250)= 3 h(255)= 0 h(260)= 4 h(265)= 1 h(270)= 1 h(275)= 0 h(280)= 0 Frekvens of score F( 80)=00008 F( 85)=00011 F( 90)=00016 F( 95)=00022 F(100)=00056 F(105)=00094 F(110)=00176 F(115)=00244 F(120)=00405 F(125)=00551 F(130)=00871 F(135)=01151 F(140)=01685 F(145)=02110 F(150)=02862 F(155)=03439 F(160)=04317 F(165)=04962 F(170)=05918 F(175)=06569 F(180)=07432 F(185)=07959 F(190)=08568 F(195)=08919 F(200)=09308 F(205)=09488 F(210)=09691 F(215)=09784 F(220)=09870 F(225)=09917 F(230)=09949 F(235)=09970 F(240)=09983 F(245)=09991 F(250)=09994 F(255)=09994 F(260)=09998 F(265)=09999 F(270)=10000 F(275)=10000

Som det fremgaringr af tabellen for P(X gt= j) er der kun 78 chance for at slaring 5 roslashde eller derover saring goslashr man det skal man altid vaeliglge det stoslashrste af de resterende tal For 3 eller 4 roslashde er situationen langt mere uigemmeskuelig og kun en beregning kan afgoslashre sagen Vi proslashver nu at finde den optimale strategi eller Snell-strategien Hvad angaringr sposlashrgsmaringlet om hvorvidt vi skal vaeliglge den stoslashrste eller naeligststoslashrste saring lader det sig faktisk goslashre at beregne Snell-strategien paring en computer De foslashlgende tilfaeliglde bliver derimod for komplicerede og der anvender vi en svagt forbedret version af vores intuitive strategi Forbedringen bestaringr i foslashlgende idet vi illustrerer det med et eksempel Lad os sige vi har slaringet 3 roslashde og vi overvejer om vi vil gange det med 7 eller 6 Ganger vi med 6 er det fordi vi forventer at slaring mindst 4 roslashde mindst en gang i de resterende kast Vores score vil vaeligre 73 og 74 henholdsvis og scoren vil blive forbedret med en faktor 43 hvis vi ganger med 6 under forventning af at slaring 4 roslashde Vores forbedring af strategien garingr da ud paring at vi vaeliglger det naeligststoslashrste 6 hvis sandsynligheden for at slaring 4 roslashde gange den relative forbedring 43 er stoslashrre end frac12 Vi rekapitulerer dernaeligst Snell-strategien G10 = X10 X10 Stokastisk variabel = antallet af roslashde i det 10 kast G9 = max X9 E(G10) E(G10) = E(X10) = np=10025 = 25 X9 = 01hellip10 Gk = max Xk E(Gk+1) E(Gk) kraeligver en laeligngere udregning men den udregnes som en

almindelig middelvaeligrdi altsaring som max af de to vaeligrdier gange P(X=Xk-1) G1 = max X1 E(G2) Som eksempel udregner vi E(G9) Da E(G10)=25 skal vi for X9 = 012 anvende E(G10)=25 i udregningen

Strategier ved spil 22

E(G9) = 25 (P(X=0)+P(X=1)+P(X=2))+ 3P(X=3)+hellip+10P(X=10) =306 Vaeligrdierne for E(Gk) er alle udregnet og vist i computerberegningen nedenfor Bemaeligrk isaeligr at de vokser fra 25 til 425 naringr k aftager fra 10 til 2 Strategien er nu foslashlgende Vaeliglg det stoslashrste af de resterende tal hvis Xk gt E(Gk+1) (altsaring det antal man har slaringet er er stoslashrre end det forventede stoslashrste antal) ellers vaeliglg det naeligststoslashrste Ved afgoslashrelsen om de 3 stoslashrste 4 stoslashrste osv anvender vi den hidtidige strategi med den modifikation at vi multiplicerer sandsynligheden med den formodede relative forbedring E(G10-kast)antal roslashde En computerberegning helt svarende til den foregaringende men med den aeligndrede strategi er vist nedenfor Man bemaeligrker for det foslashrste de smaring aeligndringer der er i strategien Den nye strategi er lidt mindre forsigtig men den giver altsaring ogsaring pote i form af en forbedring af gennemsnittet paring ca 275 Primaeligr sandsynligheder P(X=j) for n= 10 og p= 0250 j 0 1 2 3 4 5 6 7 8 9 10 P(X=j)0056 0188 0282 0250 0146 0058 0016 00031 00004 00000 00000 Baglaeligns Kumulerede sandsynligheder P(Xgt=j) j 0 1 2 3 4 5 6 7 8 9 10 P(Xgt=j) 1000 0944 0756 0474 0224 0078 00197 00035 00004 00000 00000 E(G[10])= 250 E(G[9])= 306 E(G[8])= 337 E(G[7])= 362 E(G[6])= 380 E(G[5])= 395 E(G[4])= 406 E(G[3])= 416 E(G[2])= 425 kast nr 1 2 3 4 5 6 7 8 9 10 score 0 1 1 1 1 1 1 1 1 1 1 1 2 2 1 1 1 1 1 1 1 1 2 5 4 4 3 3 3 2 2 1 1 3 8 7 6 5 5 4 3 2 2 1 4 9 8 7 7 6 5 4 3 2 1 5 10 9 8 7 6 5 4 3 2 1 6 10 9 8 7 6 5 4 3 2 1 7 10 9 8 7 6 5 4 3 2 1 8 10 9 8 7 6 5 4 3 2 1 9 10 9 8 7 6 5 4 3 2 1 10 10 9 8 7 6 5 4 3 2 1 Gennemsnitlig gevinst ms = 16727 Hyppigheder af score h( 75)= 1 h( 80)= 1 h( 85)= 0 h( 90)= 3 h( 95)= 2 h(100)= 5 h(105)= 4 h(110)= 9 h(115)= 12 h(120)= 12 h(125)= 17 h(130)= 22 h(135)= 28 h(140)= 39 h(145)= 24 h(150)= 49 h(155)= 54 h(160)= 74 h(165)= 63 h(170)=117 h(175)= 63 h(180)= 91 h(185)= 57 h(190)= 72 h(195)= 39 h(200)= 36 h(205)= 35 h(210)= 29 h(215)= 14 h(220)= 21 h(225)= 1 h(230)= 5 h(235)= 1 h(240)= 0 h(245)= 0 h(250)= 0 h(255)= 0 h(260)= 0 h(265)= 0 h(270)= 0 h(275)= 0 h(280)= 0

Strategier ved spil 23

Frekvens af score F( 80)=00020 F( 85)=00020 F( 90)=00050 F( 95)=00070 F(100)=00120 F(105)=00160 F(110)=00250 F(115)=00370 F(120)=00490 F(125)=00660 F(130)=00880 F(135)=01160 F(140)=01550 F(145)=01790 F(150)=02280 F(155)=02820 F(160)=03560 F(165)=04190 F(170)=05360 F(175)=05990 F(180)=06900 F(185)=07470 F(190)=08190 F(195)=08580 F(200)=08940 F(205)=09290 F(210)=09580 F(215)=09720 F(220)=09930 F(225)=09940 F(230)=09990 F(235)=10000 F(240)=10000 F(245)=10000 F(250)=10000 F(255)=10000 F(260)=10000 F(265)=10000 F(270)=10000 F(275)=10000

Maringske er det ikke en saeligrlig imponerende forbedring fra den foslashrste strategi men det er en teoretisk milepaeligl at man er i stand til at angive den bedste strategi for bestemte typer af spil Som omtalt har vi ikke forsoslashgt at bevise at Snell-Strategien er den optimale Strategi men det kan bevises Det er vigtigt at notere sig at i alle de omtalte spil har udfaldene vaeligre stokastiske variable dvs uforudsigelige men med bestemte sandsynligheder og at disse sandsynligheder ikke bliver aeligndret af den strategi man foslashlger I mange af de spil hvor man ofte moslashder begrebet strategi feks skak krig finansmarked og markedsfoslashring er dette langt fra tilfaeligldet Hvis feks alle boslashrsspekulanter fulgte den samme optimale strategi med boslashrskursen som stokastisk variabel ville det nok vise sig at det var den daringrligste strategi af alle Teorien for dynamiske strategier hvor de stokastiske variable er funktioner af tiden og af den valgte strategi er teoretisk naeligsten ufremkommelige

Strategier ved spil 24

Indeks Casino516 Computersimulation18 definitionen af sandsynlighed 1 Den optimale Snell-strategi11 forsikringsmatematik 5 Indbrudstyvens pensionsproblem912 kortsigtede strategi 10 kumulerede frekvens 19 langsigtede strategi 10 lotto 1 Mandagschancen14 Mandags-chancen9 Martingale-systemet16

Optimale Strategier 10 Poker 3 rekursionsligning 6 roulette 57 Roulette spil 10 roulettespiller 7 ruinsandsynligheder 5 Skaeligbnen913 Snell-strategien 11 Stopbetingelsen11 strategi9 Taeligndstikspillet1018

Page 2: Sandsynligheder og strategier ved spil - Ole Witt-Hansen ...olewitthansen.dk/Matematik/Sandsynligheder_og_strategier_ved_spil… · 6dqgv\qoljkhghu yhg vslo 3n vdpph pngh ndq yl ilqgh

Indhold Kap 1 Sandsynligheder ved spil1

1 Lotto 1 oslashvelser 3 2 Poker 3 3 Ruinsandsynligheder ved Roulette mv 5

Kap 2 Strategier ved spil 9 1 Forskellige spil 9 11 Mandags-chancen9 12 Skaeligbnen9 13 Indbrudstyvens pensionsproblem10 14 Taeligndstikspillet 10 15 Casino11 2 Optimale Strategier 11 2 Den optimale Snell-strategi12 21 Indbrudstyvens pensionsproblem13 22 Skaeligbnen14 23 Mandagschancen15 24 Casino17 25 Taeligndstikspillet 18

Indeks 24

Sandsynligheder ved spil 1

Kap 1 Sandsynligheder ved spil

1 Lotto Ved lottospil garingr det som bekendt ud paring at gaeligtte 7 tal ud af 36 mulige Foruden de 7 lotto tal bliver der ogsaring udtrukket 1 tillaeliggstal Man opnaringr praeligmier paring foslashlgende maringde

1 praeligmie ved at gaeligtte alle 7 rigtige 2 praeligmie for at gaeligtte 6 rigtige plus et tillaeliggstal 3 praeligmie for at gaeligtte 6 rigtige 4 praeligmie for at gaeligtte 5 rigtige 5 praeligmie for at gaeligtte 4 rigtige

Vi vil indlede med at udregne sandsynlighederne for at faring hver af disse praeligmier naringr man udfylder eacuten raeligkke Vi skal her minde om definitionen af sandsynligheden for en haeligndelse H i et Symmetrisk Sandsynlighedsfelt hvor n(U) er det mulige antal udfald og n(H) er antallet af udfald i H

Mulige

Gunstige

UielementerAntal

HielementerAntal

Un

HnHP

)(

)()(

Antallet af forskellige maringder hvor man kan udvaeliglge en delmaeligngde paring q elementer af en maeligngde paring n elementer er

)(

)(

qnq

nqnK

De mulige maringder at udvaeliglge 7 tal ud af 36 er derfor

68034781234567

30313233343536

)736(7

36)736(

K

Foslashlgelig er sandsynligheden for 7 rigtige

77 1019791

)736(

1)7( p

KP

Naringr vi skal udregne sandsynligheden for 6 rigtige tal plus et tillaeliggstal raeligsonnerer vi paring foslashlgende maringde De 6 rigtige kan vaeliglges ud af 7 paring K(76) = 7 forskellige maringder og tillaeliggstallet kan vaeliglges paring 1 maringde Da vi baringde skal have 6 rigtige og et tillaeliggstal rigtigt skal de to antal muligheder multipliceres for at finde antallet af gunstige udfald P(6 rigtige + 1tt) = K(76)1K(367)=7K(367)=7p7 = 833010-7

Sandsynligheder ved spil 2

Paring samme maringde kan vi finde sandsynligheden for 6 rigtige idet antal gunstige er K(76) gange med antal maringder rdquodet forkerte talrdquo kan vaeliglges paring nemlig 36 ndash7 ndash1 = 28 maringder idet det forkerte tal hverken maring vaeligre et af de 7 rigtige eller et tillaeliggstal P(6 rigtige) =K(76)28K(367) = 196p7 = 2347910-5 Sandsynligheden for 5 rigtige tal findes som antallet af maringder at udtage 5 rigtige ud af 7 lig med K(75) gange antallet af muligheder for de to sidste tal som kan vaeliglges blandt 36 - 7 = 29 tal Dette antal er K(292) P(5 rigtige) = K(75)K(292)K(367) = 8526p7 = 10210-3 =102 Paring helt samme maringde opskriver vi sandsynligheden for 4 rigtige idet de gunstige er K(74) K(293) nemlig 4 rigtige udvalgt blandt 7 gange 3 rdquoforkerterdquo udvalgt blandt 29 P(4 rigtige) = K(74)K(293)K(367) = 127890p7 = 00153 = 153 Af ovenstaringende fremgaringr at chancen for at faring mere end 4 rigtige er uhyre ringe Til gengaeligld er der en rimelig chance for at faring 4 rigtige Dette er gjort helt bevidst for dem der har planlagt spillet Erfaringen viser nemlig at hvis man aldrig vinder holder man op med at spille efter en vis tid Lad os antage at man hver uge udfylder en kupon med 10 raeligkker Foslashrst udregner vi chancen for at faring 4 rigtige paring mindst eacuten af kuponerne Haeligndelsen 4 rigtige er binomialfordelt med antalsparameteren n =10 For at finde denne sandsynlighed udregner vi foslashrst sandsynligheden for den komplementaeligre haeligndelse Ikke 4 rigtige paring nogen af kuponerne P(Ikke 4 rigtige paring nogen af kuponerne) = (1-p4)

10 = 0984710 =08557 P(4 rigtige paring mindst eacuten af kuponerne) = 1 - P(Ikke 4 rigtige paring nogen af kuponerne) = 01443 Man har altsaring knap 15 chance for at faring 4 rigtige paring mindst en af de 10 raeligkker Antager vi nu at man spiller 10 raeligkker i 5 uger vil vi udregne sandsynligheden for at man ikke faringr 4 rigtige paring nogen af de 5 uger P(ikke 4 rigtige i 5 uger)= 085575 = 04487 Der er saringledes godt 50 chance for at man faringr 4 rigtige mindst en gang paring 5 uger Det er formodentlig det som holder spillet i gang Vinder man faringr man udbetalt ca 40 kr som kan sammenlignes med udgiften til en kupon 540 =200 kr Middelgevinsten paring en kupon til 40 kr hvis vi kun ser paring 4 rigtige og saeligtter praeligmien 40 kr er -40∙P(ikke 4 rigtige paring de 10 kuponer) + 40∙P(4 rigtige) = -40∙ 08557+40∙01443 = -285 kr

Sandsynligheder ved spil 3

oslashvelser 1 Udregn hvor mange uger man skal spille 10 raeligkker for at der er mere end 50 chance for at

vinde 4 praeligmie (5 rigtige) Opgaven skal loslashses med logaritmer 2 Forsoslashg at udregne samme som ovenfor blot med en 1 praeligmie 3 En udfyldt raeligkke paring 7 tal daeligkker aringbenbart over K(74)K(292) forskellige raeligkker med 4

rigtige Hvor mange raeligkker skal man mindst udfylde for at vaeligre sikker paring at faring 4 rigtige

2 Poker Vi antager at Poker spilles med et almindeligt spil kort og at hver spiller faringr 5 kort fra begyndelsen Vi vil ikke beskaeligftige os med at koslashbe nye kort da det er alt for kompliceret men kun udregne sandsynlighederne for de forskellige kombinationer af kort der kan slaring hinanden Flush betyder i Poker sammenhaeligng 5 kort i samme farve og Straight betyder 5 kort i raeligkkefoslashlge Rangfoslashlgen af kortfarverne er i oslashvrigt de samme som i Bridge Spar Hjerter Ruder Kloslashr Rangfoslashlgen af kortkombinationer i Poker er foslashlgende Royal Flush De 5 hoslashjeste kort i samme farve Feks es konge dame knaeliggt 10 i ruder Straight Flush 5 kort i raeligkkefoslashlge i samme farve Fire ens 4 ens kort (5 kort underordnet) Full House 3 ens + 2 ens (et par) Flush 5 kort i samme farve Straight 5 kort i raeligkkefoslashlge Tre ens tre ens kortvaeligrdi To par 2 ens + 2 ens Et par 2 ens Hoslashjeste kort Sandsynlighederne for hver af disse kortkombinationer kan udregnes idet de mulige kombinationer af 5 kort udtaget af 52 er K(525) = 2598960 Royal Flush Der er 4 forskellige Royal Flush ndash en i hver farve

P(Royal flush) = )552(

4

K 615610-6

Straight Flush Der kan i hver af de 4 kortfarver laves 9 forskellige Straight Flush En af dem er Royal

P(Straight Flush) =)532(

32

)552(

)19(4

KK

= 492510-5

Sandsynligheder ved spil 4

Fire ens Der er 13 forskellige muligheder for fire ens Det femte kort kan vaeliglges paring 52 - 4 = 48 forskellige maringder

P(4 ens) =

)552(

624

)552(

4813

KK240110-4

Full House Der er 13 forskellige muligheder for 3 ens De 3 kan udtages paring K(43) forskellige maringder De to ens maring noslashdvendigvis have en anden talvaeligrdi hvoraf resultatet foslashlger

P(Full House 3 ens + 2 ens) =

)552(

3744

)552(

)24(12)34(13

KK

KK140010-3

Flush 5 kort i samme farve kan udtages paring K(135) maringder Der er 4 kortfarver Vi maring subtrahere Straight Flusher fra

P(Flush 5 i samme farve) = 3109671)552(

5112

)552(

432)513(4

KK

K

Straight Der er 13 - 4 = 9 forskellige raeligkkefoslashlger Hver af de 5 kortvaeligrdier kan vaeliglges blandt 4 farver Vi skal fratraeligkke Straight Flush

P(Straight 5 i raeligkkefoslashlge) = 35

10533)552(

9180

)552(

3649

KK

Tre ens Der er 13 kortvaeligrdier og der skal udvaeliglges 3 De sidste to kort kan udvaeliglges blandt 52 - 4 = 48 kort (ikke 49 da det kunne give 4 ens) Vi maring dog fratraeligkke de 12K(42) par der kan dannes og som ville give Full House

P(3 ens) = 2101132)552(

54912

)552(

))24(12)248(()34(13

KK

KKK

To par Foslashrst udregnes antallet af muligheder for de to par Faktoren frac12 skyldes at man ved denne optaeliglling taeligller de mulige kombinationer Et par feks (spar dame hjerter dame) vil baringde vaeligre at finde blandt de 13K(42) og de 12K(42) muligheder Det sidste kort kan vaeliglges blandt 52 ndash 8 som danner de to par

P(2 par) = 210754)552(

552123

)552(

)852)(24(12)24(1321

KK

KK

Et par De foslashrste 3 faktorer i taeliglleren er antallet af maringder at faring et par paring Vi bliver noslashdt til at subtrahere mulighederne for 2 par og Full House

P(1 par) = 47010)552(

1221781

)552(

3755552123)348()24(13

KK

KK

Sandsynligheder ved spil 5

Hermed har vi afsluttet vores gennemgang af sandsynlighederne i Poker Bemaeligrk at sandsynlighederne foslashlger rangen af en Pokerharingnd

3 Ruinsandsynligheder ved Roulette mv Beregningen af ruinsandsynligheder er noget som er helt afgoslashrende for forsikringsvirksomhed hvis denne skal drives forretningsmaeligssigt Sammenhaeligngen mellem ruinsandsynligheder og beregning af praeligmiestoslashrrelserne en ret kompliceret matematisk teori som betegnes forsikringsmatematik Paring universiteterne findes en saeligrlig uddannelse som kaldes aktuar studiet som har dette som speciale Forsikringsmatematik kan illustreres ved at betragte roulettespil paring et Casino En roulette har 37 felter nummereret 0 ndash 36 Hvis man vinder paring et felt faringr man udbetalt 36 gange indsatsen Da man har lagt en indsats er gevinsten 35 indsatser Hvis X er den stokastiske variabel som betegner en spillers gevinst saring antager X vaeligrdierne +35 med sandsynlighed 137 og ndash1 med sandsynlighed 3637

P(X = 35) = 137 og P(X = -1) = 3637 Middelgevinsten naringr man spiller paring et felt er foslashlgelig

(31) 37

1

37

36)1(

37

135)()()(

Uu

uPuXXE

Hvis spilleren i stedet vaeliglger at spille paring m felter antager gevinsten X vaeligrdierne 36 - m med sandsynlighed m37 og ndashm med sandsynligheden (37 - m)37 = 1 - m37 Middelgevinsten bliver herefter

37

)37

1)((37

)36()()()(mm

mm

muPuXXEUu

Middelgevinsten pr indsats er saringledes uafhaeligngig af hvor mange felter man spiller paring Hermed er det slaringet fast Der findes intet system der kan bringe eacuten i stand til at vinde paring en roulette paring laeligngere sigt Dette er en simpel matematisk kendsgerning som mange har maringttet erkende paring en betydelig mere smertelig maringde Specielt hvis man spiller paring m = 18 felter er gevinsten 36-18=18 med sandsynlighed 1837 og ndash18 med sandsynlighed 1937 Selvom en spiller ikke kan vinde i det lange loslashb har spilleren paring grund af tilfaeligldigheder (som spillere foretraeligkker at kalde held) mulighed for at vinde betragtelig store beloslashb Vi vil nu lave nogle betragtninger over hvor stor sandsynlighed en spiller har for at spraelignge banken dvs at ruinere et Casino En saringdan beregnet sandsynlighed kaldes for ruin sandsynligheden

Ruinsandsynligheder 6

Vi antager at Banken raringder over n-enheder (indsatser) Vi oslashnsker at vurdere sandsynligheden for at en uendelig rig spiller der goslashr den samme indsats i hvert spil vinder n eller flere enheder naringr der ikke er nogen begraelignsning paring antallet af spil Ruinsandsynligheden for banken betegner vi rn Hvis X1 X2 X3 betegner Casinorsquoets gevinst ved de enkelte spil er

Gk = X1 + X2 +X3++Xk gevinsten efter k-spil Ruinsandsynligheden kan derfor formuleres derhen at

rn = P( 0kG for et eller andet k)

(Der er ingen umiddelbar sammenhaeligng mellem n og k) Der gaeliglder rekursions-formlen

rn+1 = rn r1

som udtrykker at sandsynligheden for at blive ruineret med n+1 enheder er lig sandsynligheden for at blive ruineret med n enheder gange sandsynligheden for at blive ruineret med eacuten enhed Dette fordi vi antager at hvert spil er uafhaeligngigt af de oslashvrige Heraf foslashlger umiddelbart

r2 = r1+1 = r1 r1 = r12 r3 = r2+1 = r2 r1 = r1

3 og foslashlgelig

rn = r1n

For at beregne en ruinsandsynlighed ser vi foslashrst paring tilfaeligldet hvor en spiller saeligtter sin indsats paring 18 felter pr spil Her er Casinorsquoets gevinst +18 eller ndash18 pr spil For nemheds skyld saeligtter vi de 18 indsatser til at vaeligre en enhed = 1 Vi opstiller da foslashlgende rekursionsligning som tager udgangspunkt i det foslashrste spil Sandsynligheden for at banken bliver ruineret med n enheder er lig med Sandsynligheden for at banken vinder det foslashrste spil (hvor den vinder en enhed) gange sandsynligheden for at banken bliver ruineret med n+1 enheder plus sandsynligheden for at banken taber det foslashrste spil (hvor den mister en enhed) gange sandsynligheden for at banken bliver ruineret med n-1 enheder Sandsynlighederne for at banken vinder og taber er 1937 og 1837 Vi kan da opstille ligningen

1

1

1

1111 37

18

37

19

37

18

37

19 nnn

nnn rrrrrr

For at opnaring det sidste udtryk har vi anvendt resultatet af rekursionsligningen rn = r1

n Det er relativt nemt at bestemme r1 ud fra denne ligning Ved division af ligningen med r1

n-1 faringr man

Ruinsandsynligheder 7

018371937

18

37

191

21

211

rrrr

Den sidste 2gradsligning kan loslashses paring normal vis idet diskriminanten d =372 ndash 4middot19middot18 = 1 saring

119

18

38

36

192

137111

rrr

Vi er kun interesseret i loslashsningen r1 = 1819

Ifoslashlge ovenstaringende er nrr nn )

19

18(1

Vi vil herefter besvare sposlashrgsmaringlet Hvor mange enheder skal banken have for at der er mindre end 1 chance for ruin Dette er ensbetydende med at loslashse ligningen

1785)

19

18ln(

)010ln(010)

19

18( nn

Husker vi at en enhed svarede til 18 indsatser giver dette beskedne 1533 indsatser Hvis en spiller derimod spiller paring saeligdvanlig vis med kun at placere en indsats paring eacutet felt er dette - lidt overraskende ndash betydelig mere risikabelt for banken Vi opstiller igen en rekursionsligning med udgangspunkt i det foslashrste spil Sandsynligheden for at banken bliver ruineret med n enheder er lig med Sandsynligheden for at banken vinder det foslashrste spil (hvor den vinder en enhed) gange sandsynligheden for at banken bliver ruineret med n+1 enheder plus sandsynligheden for at banken taber det foslashrste spil (hvor den mister 35 enhed) gange sandsynligheden for at banken bliver ruineret med n-35 enheder Sandsynlighederne for at banken vinder og taber er 3637 og 137 Vi kan da opstille ligningen

351

111351 37

1

37

36

37

1

37

36 nnn

nnn rrrrrr

Ved division med (r1)

n-35 og omordning af leddene og ved at saeligtte r1 = x faringr man ligningen

36x36 ndash 37x35 +1 = 0 Denne ligning kan kun loslashses ved numeriske metoder og man finder loslashsningen x = 09984 Hvis vi igen stiller sposlashrgsmaringlet Hvor mange indsatser skal banken raringde over for at der er mindre end 1 chance for ruin skal vi loslashse ligningen

Ruinsandsynligheder 8

2876)99840ln(

)010ln(010)99740( nn

Altsaring en betydelig stoslashrre beholdning end hvis spilleren spiller paring 18 felter Forsoslashger vi at udregne ruinsandsynligheden for en spiller der har n enheder og laeliggger sin indsats paring eacutet felt kommer vi efter helt det samme raeligsonnement frem til foslashlgende rekursionsligning

35137

11137

36

37

1

37

361351

nn rrrrrr

nnnn

som foslashrer til ligningen x36 ndash 37x +36 = 0 Denne ligning har kun loslashsningen x = 1 Differentieres nemlig f(x) =x36 ndash 37x +36 finder man f (x) =36x35 ndash 37 Ligningen f (x) =0 har

loslashsningen 136

3735 x Da f (x) lt 0 for x lt 1 har den ingen roslashdder mindre end 1

Ruin-sandsynligheden for en spiller der garingr paring et Casino som har en ubegraelignset beholdning er 1 Saring vi kan endnu engang fastslaring at hvis man fortsaeligtter med at spille paring et Casino vil man altid blive ruineret i det lange loslashb Man kunne selvfoslashlgelig overveje ruinsandsynlighederne hvis Casino har beholdningen n og en spiller har beholdningen m (n gt m eller omvendt) men svaret vil afhaelignge af n og m og de indgaringende to ulineaeligre ligninger med to ubekendte med meget hoslashje eksponenter er ikke saring nemme at loslashse numerisk ndash selv paring en Computer Hvis n gtgt m vil svaret stort set vaeligre det samme

Strategier ved spil 9

Kap 2 Strategier ved spil

1 Forskellige spil Efter at have udregnet vindersandsynligheder i forbindelse med spil skal vi nu se paring noget andet som ogsaring er knyttet sammen med sandsynlighedsregningen nemlig problemet med at fastlaeliggge den bedste strategi naringr man spiller et spil Her skal spil imidlertid forstarings i en meget videre betydning det vaeligre sig krig boslashrsspekulation jagt eller fiskeri paring en bestemt dyreart Sidstnaeligvnte er dog alt for komplicerede til at kunne behandles elementaeligrt Faeliglles er det dog at man skal kunne beregne sandsynligheden for en bestemt konsekvens af et givet traeligk Vi vil begynde med at give nogle meget simple eksempler paring spil hvor det er meningsfuldt at tale om optimal strategi Vendingen den optimale strategi indebaeligrer at spillet afvikles i et endeligt antal trin og at der for hvert trin i spillet er mulighed for at forbedre sin gevinst og mulighed for at miste sin gevinst helt eller delvis Man skal endvidere have mulighed for at standse spillet ved ethvert trin og inkassere sin gevinst

11 Mandags-chancen I dette spil som har vaeligret lanceret af TV2 har man en raeligkke tildaeligkkede felter med beloslashb (101025255050100100250) x 1000 kr Man har maximalt 3 forsoslashg Man faringr beloslashbet paring det sidst afdaeligkkede felt Nedenfor er vist en computer simulation af spillet efter 2 traeligk Det er nok klart at hvis man afdaeligkker et felt med 10 i 1 eller 2 forsoslashg skal man fortsaeligtte eller hvis man afdaeligkker et felt med 100 eller 250 i 1 eller 2 forsoslashg skal man standse Men hvad hvis man afdaeligkker et felt med 50 i 1 eller 2 forsoslashg Det vil vi forsoslashge at afgoslashre ved nogle mere matematiske betragtninger

12 Skaeligbnen Et spil som vist nok kommer fra orienten Det spilles med to terninger Foslashrst slaringr man et slag med de to terninger og summen af deres oslashjental betegnes skaeligbnen

Strategier ved spil 10

Man kan nu slaring lige saring mange gange man vil (max 100) Hvis oslashjentallene ikke er lig skaeligbnen saring adderes dette til ens pointtal men hvis man slaringr sin skaeligbne mister man alt Nedenfor er vist et trin i en animeret computer simulation af spillet Naringr spillet er standset fordeler man indsatsen i forhold til spillernes opnaringede pointtal Det gaeliglder derfor om at have de stoslashrste pointtal Problemet er imidlertid hvornaringr det er optimalt at standse naringr man kender sin skaeligbne

13 Indbrudstyvens pensionsproblem Dette er en variant af mange forskellige optimeringsproblemer Arthur er indbrudstyv Hver tyvetugt giver i snit K kr Chancen for at Arthur bliver snuppet er p Hvis han bliver taget mister han alt fra sine tidligere tyvetugter Hvor mange indbrud skal Arthur lave foslashr han standser sin karriere og vaeliglger at leve af sin opsparing

14 Taeligndstikspillet Dette spil falder lidt uden for rammerne af de oslashvrige spil fordi man ikke kan standse spillet og fordi man aldrig kan miste noget af sin gevinst Det kan derfor ikke umiddelbart behandles paring samme maringde som de hidtil naeligvnte spil Alligevel er det et spil der udpraeligget kan behandles med matematiske teorier for den bedste strategi Spillet garingr ud paring at man paring 10 taeligndstikker farver den ene side roslashd Kastes taeligndstikken op er sandsynligheden for at den farvede side vender opad naringr den lander paring bordet lig med p = 025 Hver spiller har fra starten tallene 110 Hvert tal maring kun bruges 1 gang Man skiftes til at kaste de 10 taeligndstikker og notere antallet af farvede taeligndstikker Dette antal skal saring ganges med et af de resterende tal 110 Den som efter 10 spil har den hoslashjeste sum har vundet Det kan oplyses og let verificeres at den maximale gevinst er 550 Middelgevinsten hvor man vaeliglger tilfaeligldig er 1375 og den optimale middelgevinst er ca 167

Strategier ved spil 11

15 Casino Roulette spil falder ogsaring lidt uden for rammerne af optimale strategier af den meget simple grund at odds er svagt imod eacuten Det gaeliglder dog ikke for Blackjack hvor man kan udvikle en strategi som giver en svag fordel Hvis odds er imod eacuten vil man imidlertid altid tabe i det lange loslashb Som tidligere fastslaringet er den eneste mulighed - i det lange loslashb - for at undgaring ruin i roulettespil at der ikke er nogen oslashvre graelignse for indsatser og at man har flere penge end Casionorsquoet og ingen af disse to betingelser er nogensinde opfyldt Enhver fornuftig matematisk spil-teori vil derfor som resultat have at man skal standse foslashr det foslashrste spil Det vil sige Man skal lade vaeligre med at garing paring Casino Denne kendsgerning udelukker dog ikke at man kan goslashre sig overvejelser over hvordan man kan spille hvis man ikke udelukkende er interesseret i at foraeligre sine penge til et Casino uden kamp

2 Optimale Strategier Hvis man intuitivt skal formulere en strategi for de 3 foslashrste spil naeligvnt ovenfor saring kan man feks vaeliglge eacuten af 3 foslashlgende strategier 1 Man beslutter paring forharingnd hvor stor ens gevinst (eller tab) skal vaeligre foslashr man stopper Dette er

faktisk en meget almindelig strategi men den er bestemt ikke optimal 2 Man fortsaeligtter saring laelignge man i middel har mulighed for at foroslashge sin gevinst i naeligste spil Man

skal huske paring at middelvaeligrdien af gevinsten ogsaring omfatter tab saring middelvaeligrdien (i matematisk forstand) skal vaeligre positiv Denne umiddelbart fornuftige strategi kaldet den kortsigtede eller myope strategi er i mange tilfaeliglde ogsaring den optimale strategi (dog ikke i mandagschancen)

3 Man fortsaeligtter saring laelignge man i middel har mulighed for at foroslashge sin gevinst i et af de

efterfoslashlgende spil Denne strategi kaldes den langsigtede strategi Baringde den kortsigtede og den langsigtede strategi ser yderst rimelige ud og de vil ogsaring vaeligre optimale for langt de fleste spil Hvis der er forskel paring den langsigtede og den kortsigtede strategi skal man anvende den langsigtede - naturligvis Der findes imidlertid visse former for spil hvor ingen af strategierne er optimale Det gaeliglder feks for boslashrsspekulanter der har en beholdning aktier som de vil saeliglge naringr kurserne stiger Dette fortsaeligtter som bekendt aldrig i det uendelige Paring et vist tidspunkt standser stigningen og kurserne begynder at falde ndash som regel ndash hurtigere end de steg Hvornaringr skal man saeliglge for at opnaring den stoslashrste gevinst Det viser sig - men det er saeligrdeles kompliceret at redegoslashre for ndash at naringr det gaeliglder boslashrs spekulation saring er ingen af strategierne 2 og 3 optimale De vil begge to i grove traeligk som resultat have at man enten skal saeliglge straks eller vente til man er ruineret Vi vil nu give en beskrivelse af den optimale strategi som er udviklet af Snell Vi vil overhovedet ikke naeligrme os et bevis for at det er den optimale strategi (beviset er ret teknisk abstrakt) men

Strategier ved spil 12

understrege at det kan bevises I matematisk forstand Ulemperne ved Snell-strategien er at den for selv simple problemer kan foslashre til ret omfattende og komplicerede regninger

2 Den optimale Snell-strategi Snell-strategien er paring sin vis den samme som den kortsigtede strategi men hvor man i denne strategi hele tiden regner sig et skridt frem saring tager Snell-strategien udgangspunkt i spillets slutning og arbejder sig baglaeligns Vi indfoslashrer foslashrst nogle betegnelser Vi antager at spillet har n trin Sk er en stokastisk variabel der angiver den faktiske samlede gevinst man har opnaringet ved det kte spil Sk kan antage en eller flere vaeligrdier med tilhoslashrende sandsynligheder Det nye ved Snell-strategien er at man definerer endnu en stokastisk variabel Gk ved ligningen

Gk = maxSk E(Gk+1| S1Sk) Gk er den stoslashrste af vaeligrdierne Sk (gevinsten efter det kte spil) og E(Gk+1| S1Sk)) som er middelvaeligrdien af den maximale forventede gevinst i det k+1te spil naringr det er givet at man har spillet spillene 1k Dette opstilles i et skema Gn = Sn Gevinsten ved spillets afslutning Gn-1 = maxSn-1 E(Gn| S1Sn-1) Gk = maxSk E(Gk+1| S1Sk) G1 = maxS1 E(G2| S1) Snell strategien siger nu at man skal standse spillet den foslashrste gang Sk (gevinsten efter det kte spil) overstiger middelvaeligrdien af den maksimale forventede gevinst i det k+1te spil Dette kaldes for stopbetingelsen Stopbetingelsen er altsaring

Sk E(Gk+1| S1Sk) Man skal altsaring standse spillet naringr den opnaringede gevinst er stoslashrre eller lig med den betingede forventning af den maximale gevinst i det naeligste spil Det kunne lyde som den kortsigtede strategi men forskellen er den at i den kortsigtede strategi er Gk+1 erstattet af Sk+1 At kunne gennemskue konsekvenserne af dette er derimod ikke saring nemt Det viser sig at i mange tilfaeliglde at er Snell-Strategien identisk med den kortsigtede strategi som kraeligver at man stopper naringr Sk E(Sk+1| S1Sk) Snell strategien er ikke umiddelbart let gennemskuelig og udregningen af de betingede middelvaeligrdier E(Gk+1| S1Sk) er ofte ret teknisk Vi vil nu behandle de foslashr naeligvnte eksempler og begynder med

Strategier ved spil 13

21 Indbrudstyvens pensionsproblem Lad os antage at Arthurs gennemsnitlige gevinst ved hvert tyvetogt er K = 6000 kr og at chancen er at han bliver taget er 5 Lad os antage at hans hidtidige gevinst efter k - tyvetugt er Sk som bliver konfiskeret - og som han derved mister hvis han bliver snuppet I dette tilfaeliglde kan man - som vist nedenfor - se at den kortsigtede strategi er den optimale strategi Det haelignger sammen med at alle trin i spillet er identiske Gevinsten ved hvert tyvetogt er den samme ndash uafhaeligngigt af de foregaringende tyvetugter - bortset fra at den samlede gevinst vokser ved hvert vellykket tyvetogt Xk betegner den stokastiske variabel som er Arthurs gevinst ved eacutet tyvetugt Hermed er

Sk =X1+ X2+ X3+hellip Xk Xk+1 kan antage vaeligrdien K med sandsynlighed 1-ps = 1-P(Snuppet) (altsaring hvis det naeligste tyvetugt lykkes) og vaeligrdien ndashSk (han mister hele sin opsparing) med sandsynlighed ps = P(Snuppet) Vi opskriver nu Snell-strategien (Den kortsigtede strategi) for et trin i hans karriere

Gk = max Sk E(Sk+1| 1k)

Sk er hans gevinst efter k tyvetugter og E(Sk+1| 1k) er hans forventede gevinst efter k+1 tyvetugter E(Sk+1| 1k) kan beregnes som den hidtidige gevinst plus den forventede gevinst ved naeligste tyve- tugt i alt lig med Sk + E(Xk+1) E(Xk+1) er uafhaeligngig af de foslashrste k - tyvetugter derfor bliver stopbetingelsen Sk gt Sk + E(Xk+1) E(Xk+1) lt 0 Middelvaeligrdien E(Xk+1) kan saringledes udregnes efter den saeligdvanlige definition idet Xk+1 antager vaeligrdierne K (gevinsten ved et tyvetugt) og - Sk (mister hele sin opsparing) med sandsynlighederne 1-ps og ps henholdsvis E(Xk+1) = K(1- ps) - Sk ps Han skal standse naringr

E(Xk+1) lt 0 K(1- ps) lt Sk ps som med tal eksemplet giver

6000095 lt Sk005 Sk gt 114000- kr svarende til 114006000 = 095005 = 19 tyvetugter

(Det goslashr han nu nok ikke og er derfor henvist til at leve af folkepensionen efter nogle aringr i skyggen) Man kunne godt tro at dette eksempel kunne anvendes paring andre (ligesaring uetiske) problemstillinger Feks hvor mange gange det er optimalt at koslashre gratis i S-tog Det kan det imidlertid ikke helt

Strategier ved spil 14

Sagen er jo den at man faringr en fast boslashde hvis man bliver snuppet men man kommer ikke til at betale for de gange man har koslashrt gratis Med andre ord vurderingen om hvorvidt det er fordelagtigt at koslashre uden billet afhaelignger kun af middelgevinsten ved det naeligste forsoslashg Hvis den er positiv er det fordelagtigt at fortsaeligtte men hvis den er negativ er det fordelagtigt at loslashse billet (Det er i oslashvrigt uetisk at snyde ndash naturligvis) Tager vi et eksempel billetprisen er kr 50- Boslashden er kr 500 Sandsynligheden for at blive snuppet er Ps = 01 Hvis X er gevinsten ved at koslashre uden billet er E(X) = 50middot(1-Ps)-500middotPs = 50middot09-500middot01 = -50 Det er saringledes (med denne sandsynlighed for at blive snuppet) ikke fordelagtigt at koslashre uden billet i S-tog Da en laeligrebog i sandsynligheder ved spil naturligvis ikke maring tilskynde til uetiske handlinger undlader vi at foretage beregningen med Ps = 005

22 Skaeligbnen Vi betragter kast med to terninger X betegner summen af oslashjentallene ved eacutet kast Sandsynlighedsfordelingen for X er velkendt Feks er P(X=5) = 436 Sandsynligheden for at terningerne viser j oslashjne kan skrives som

36

76)(

jjXP

Lad os antage at spillerens skaeligbne er q Hvis man slaringr dette oslashjental er alt tabt Ellers adderes oslashjentallene for hvert kast Hvis ikke man har slaringet sin skaeligbne saring er den samlede gevinst efter n spil

Sn = X1+ X2+ X3+hellip +Xn

Og middelvaeligrdien af Sn er

E(Sn) = E(X1)+ E(X2)+E(X3)+hellip +E(Xn) = nE(X | X q) E(X | X q) er den betingede middelvaeligrdi af oslashjentallene givet at man ikke slaringr sin skaeligbne

E(X | X q) = 2P(2) +3P(3)+hellip(q-1)P(q-1) + (q+1)P(q+1)+hellip+12P(12) Den kortsigtede strategi (og Snell strategien) fastslaringr at man skal standse naringr middelvaeligrdien af den forventede gevinst ved naeligste kast er negativ Argumentet for dette kan overtages naeligsten ordret fra indbrudstyvens pensionsproblem E(Sk+1|S1 Sk) kan beregnes som den hidtidige gevinst Sk plus den forventede gevinst ved det naeligste kast i alt lig med Sk + E(Xk+1| S1 Sk) Stopbetingelsen er derfor

Sk gt Sk + E(Xk+1| S1 Sk) E(Xk+1| S1 Sk) lt 0

Strategier ved spil 15

E(X | X q) ndash SnP(q) lt 0 Sn gt E(X | X q) P(q) Det er ikke saeligrlig svaeligrt at udregne stopbetingelsen feks for q = 2 og q = 6 Nedenfor er vist udskriften fra et program som foretager beregningen for q = 212 Forventet gevinst i naeligste kast naringr ens skaeligbne er q q 2 3 4 5 6 7 8 9 10 11 12 694 683 667 644 617 583 589 600 617 639 667 Stop naringr din gevinst S gt EX(q)P(q) naringr skaeligbne er q q 2 3 4 5 6 7 8 9 10 11 12 25000 12300 8000 5800 4440 3500 4240 5400 7400 11500 24000

Som det fremgaringr er der endog meget stor forskel paring stoptiderne afhaeligngig af ens skaeligbne

23 Mandagschancen Dette spil er lidt mere interessant fordi det ikke er helt saring enkelt at gennemskue I dette tilfaeliglde kan man ikke forvente at den kortsigtede strategi vil foslashre til den optimale strategi At den faktisk goslashr det skyldes talvaeligrdierne Dette skal forstarings saringledes at hvis man aeligndrede paring praeligmiestoslashrrelserne ville Snell-strategien afvige fra den kortsigtede strategi Vi vil analysere spillet ved Snell-strategien Som naeligvnt har man i spillet 9 tildaeligkkede felter (101025255050100100250) Man kan afdaeligkke hoslashjest 3 felter Man faringr beloslashbet i 1000 kr som det sidste felt viser Hvis X er den stokastiske variabel som angiver vaeligrdien af et felt saring vil de fleste uden saring lange overvejelser vel fortsaeligtte hvis Xlt50 og standse hvis X100 Det kritiske er hvis man afdaeligkker 50 (X=50) Vi bemaeligrker foslashrst at summen af alle felterne er S=620 og at E(X) =6209=689 Vi opskriver foslashrst den fuldstaeligndige Snell-strategi for dette spil G3 =X3 Den Stokastiske variabel G3 = Gevinsten = X3 = vaeligrdien af det sidst afdaeligkkede felt G2 = max X2 E(G3| X1X2 ) Den stoslashrste af vaeligrdierne X2 (= vaeligrdien af det afdaeligkkede

felt) og den betingede middelvaeligrdi af G3 = X3 G1 = max X1 E(G2| X1 ) Som ovenfor Kriteriet for den optimale strategi er som tidligere Stop hvis paring noget trin Xk gt E(Gk+1| X1Xk ) Det er relativ nemt at opstille en formel for E(G3| X1X2 ) Naringr X1 og X2 er afdaeligkket er summen de resterende felter S - X1 - X2 Da alle felter har samme sandsynlighed er middelvaeligrdien simpelthen middeltallet af felterne E(G3| X1X2 ) = ( S - X1 - X2)(9-2)

Strategier ved spil 16

Det er noget mere teknisk at opstille en formel for E(G2| X1 ) og ogsaring lidt teknisk at foretage beregningen Vi vil noslashjes med at skitsere beregningen for en vaeligrdi af X1 og i oslashvrigt henvise til resultatet af et Computerprogram som kan ses nedenfor Lad os antage at X1 = 25 Vi lader nu X2 gennemloslashbe alle de mulige vaeligrdier (alle vaeligrdier skal taeliglles med det antal gange der er felter med denne vaeligrdi) For hver vaeligrdi af X2 (feks 50) skal vi vaeliglge max af X2 og E(G3| X1X2 ) = ( S - X1 - X2) (9-2) (= (620-50-25)7 = 778 i dette tilfaeliglde) og addere det til en sum S2 E(G2| X1 ) er da lig med S2(9-1) (da der er 9-1 felter X2 ) X2[1]= 1000 E(G3)= 8571 G2= 8571 X2[2]= 2500 E(G3)= 8357 G2= 8357 X2[3]= 5000 E(G3)= 8000 G2= 8000 X2[4]= 10000 E(G3)= 7286 G2= 10000 X2[5]= 25000 E(G3)= 5143 G2= 25000 X1[1]= 1000 E(G[2])= 10786 X2[1]= 1000 E(G3)= 8357 G2= 8357 X2[2]= 2500 E(G3)= 8143 G2= 8143 X2[3]= 5000 E(G3)= 7786 G2= 7786 X2[4]= 10000 E(G3)= 7071 G2= 10000 X2[5]= 25000 E(G3)= 4929 G2= 25000 X1[2]= 2500 E(G[2])= 10679 X2[1]= 1000 E(G3)= 8000 G2= 8000 X2[2]= 2500 E(G3)= 7786 G2= 7786 X2[3]= 5000 E(G3)= 7429 G2= 7429 X2[4]= 10000 E(G3)= 6714 G2= 10000 X2[5]= 25000 E(G3)= 4571 G2= 25000 X1[3]= 5000 E(G[2])= 10500 X2[1]= 1000 E(G3)= 7286 G2= 7286 X2[2]= 2500 E(G3)= 7071 G2= 7071 X2[3]= 5000 E(G3)= 6714 G2= 6714 X2[4]= 10000 E(G3)= 6000 G2= 10000 X2[5]= 25000 E(G3)= 3857 G2= 25000 X1[4]= 10000 E(G[2])= 9643 X2[1]= 1000 E(G3)= 5143 G2= 5143 X2[2]= 2500 E(G3)= 4929 G2= 4929 X2[3]= 5000 E(G3)= 4571 G2= 5000 X2[4]= 10000 E(G3)= 3857 G2= 10000 X1[5]= 25000 E(G[2])= 6268 Ser man resultaterne igennem kan de udmoslashntes i en simpel regel Fortsaeligt paring 50 eller derunder Stop paring 100 eller derover Det er maringske lidt overraskende at man ogsaring skal forsaeligtte paring 50000 hvis man kun har et forsoslashg tilbage ndash man kunne jo ende med 10000 og det er saring bare aeligrgerligt ndash og det er vist nok de fleste som standser ved 50000 - men det er ikke den bedste strategi

Strategier ved spil 17

24 Casino Som naeligvnt i indledningen til dette afsnit findes der ingen strategi som kan bringe en i stand til at vinde paring et Casino ndash i det lange loslashb Vil man goslashre Casino-spil til en levevej vil det altid med matematisk sikkerhed ende med ruin Det betyder imidlertid ikke at man ikke kan vinde ved at garing paring Casino men hvis man taelignker paring at spraelignge banken saring skal to krav i hvert fald vaeligre opfyldt for at der skal vaeligre en ikke forsvindende sandsynlighed for at det kan lade sig goslashre 1 Man skal have flere penge end Casino 2 Der maring ikke vaeligre loft over indsatserne Begge betingelser er som bekendt aldrig opfyldt Man kan som sagt godt vinde paring et Casino men hvis man satser paring at vinde mere (alle de gange man er paring Casino i sit liv) end det beloslashb man medbringer ved hvert besoslashg saring vil chancerne for at tabe det hele vaeligre stoslashrst Her er der tale om sandsynligheder og middelvaeligrdier ndash om odds Selvfoslashlgelig er de muligt at tabe hele sin formue ved foslashrste besoslashg eller vinde det tredobbelte ved det andet Der har i tidens loslashb vaeligret lanceret flere eksempler paring vinderstrategier som lyder uhyre besnaeligrende Den mest kendte er Martingale-systemet Man spiller kun paring sort og roslashd hvor faringr man faringr fordoblet sin indsats hvis man vinder Spillet er saringledes helt lige bortset fra at indsatserne bliver liggende naringr zero kommer ud og man kun faringr sin indsats en gang hvis man vinder i naeligste spil (zero har ingen farve) Spiller man efter Martingale-systemet skal man inkassere sin gevinst hvis man vinder Hvis man derimod taber skal man fordoble sin indsats Vi saeligtter grundindsatsen til 1 Har man spillet n gange og dermed doblet op n-1 gange har man lagt en indsats Sn = 1 + 2 + 22 +hellip2n-1 = 2n ndash1 Udregnet af kvotientraeligkkeformlen

1

10

q

qaS

n

n

for raeligkken Sn = a0 + a0q+ a0q

2+hellip+ a0qn-1

Vinder man det nte spil faringr man udbetalt 22

n-1 = 2n saring ens gevinst er 2n - (2n - 1) = 1 Der gaeliglder aringbenbart den simple kendsgerning at bliver man bare ved med at fordoble saring har man altid vundet eacuten indsats Foslashr man forsoslashger sig med dette skal man dog nok goslashre sig klart hvor mange gange man kan tabe foslashr man er ruineret

Strategier ved spil 18

Sandsynligheden for at man taber 5 spil er (frac12)5 = 132 Man har da tabt 25 ndash 1 gange vaeligrdien af en jeton (i Danmark 50 kr) dvs 1550 kr Vil man sikre sig bedre feks ved at kunne doble op 9 gange (sandsynligheden for at tabe 10 spil er 11024) saring skal man komme med kr 51150- men det kan man ikke engang gennemfoslashre da hoslashjeste indsats i Danmark er 24000- Man kunne imidlertid stille det sposlashrgsmaringl Hvis man har n-jetoner hvad er saring sandsynligheden for at vinde q-jetoner hvis man spiller efter Martingale-systemet Dette kan man faktisk godt udregne direkte men regningerne er ret omfattende Derimod er resultatet simpelt Vi vil ikke lave en direkte udregning men anvende de samme metoder som vi har anvendt for den bedste strategi Vi tager udgangspunkt i det faktum at sort roslashd Casino spil er et lige spil saring middelvaeligrdien af gevinsten er 0 ligegyldigt hvordan man spiller Middelvaeligrdien (som er nul ) af en gevinst paring q-jetoner er lig med q gange sandsynligheden P(q) for at vinde q jetoner minus ens kapital (n jetoner) gange med sandsynligheden for at man taber det sidste spil som er 1 ndash P(q)

qP(q) ndash n(1 ndashP(q)) = 0 qn

nqP

)(

Har man feks n = 31 jetoner (1550- kr) er sandsynligheden for at vinde q=10 (500 kr) lig med 0756 En rimelig stor sandsynlighed men altsaring stadig 25 chance for ruin Oslashnsker man derimod at blive rigtig rig og vinde 10000- kr dvs q=200 er P(200) = 0134 Konklusionen er den at satser man paring at vinde mere end man medbringer saring er sandsynligheden mindre end frac12 men kan man noslashjes med mindre saring er sandsynligheden stoslashrre end frac12 Men bemaeligrk dette gaeliglder fra foslashrste gang man garingr ind paring et Casino til man beslutter at holde op

25 Taeligndstikspillet Som beskrevet ovenfor garingr spillet ud paring at farve den ene af siderne roslashd paring 10 taeligndstikker Naringr taeligndstikken kasten op i luften er sandsynligheden for at den roslashde side vender opad naringr den rammer bordet lig med p=025 Man kaster paring skift 10 saringdanne taeligndstikker 10 gange For hvert kast skal man multiplicere antallet af roslashde med et af tallene 110 Hver tal maring kun bruges eacuten gang Den der faringr den stoslashrste sum har vundet Det er klart at en god strategi i det lange loslashb vil give en hoslashjere sum Vi minder om at antallet af X roslashde taeligndstikker er binomialfordelt med primaeligrsandsynlighed p og antalsparameter n=10

102104

3

4

110)(

10

jj

jXPjj

Strategier ved spil 19

Endvidere vil vi anvende de kumulerede sandsynligheder P(X j) og P(X j) Nedenfor er vist resultatet af en Computersimulation af spillet Primaeligr sandsynligheder for n= 10 og p= 0250 P(X=j) j 0 1 2 3 4 5 6 7 8 9 10 00563 01877 02816 02503 01460 00584 00162 00031 00004 00000 00000 Baglaeligns kumulerede sandsynligheder P(Xgt=q) j 0 1 2 3 4 5 6 7 8 9 10 10000 09437 07560 04744 02241 00781 00197 00035 00004 00000 00000 1 kast Antal = 2 Vaeliglg mellem 1 2 3 4 5 6 7 8 910 Faktor= 4 2 kast Antal = 4 Vaeliglg mellem 1 2 3 5 6 7 8 910 Faktor=10 3 kast Antal = 2 Vaeliglg mellem 1 2 3 5 6 7 8 9 Faktor= 5 4 kast Antal = 2 Vaeliglg mellem 1 2 3 6 7 8 9 Faktor= 3 5 kast Antal = 3 Vaeliglg mellem 1 2 6 7 8 9 Faktor= 8 6 kast Antal = 2 Vaeliglg mellem 1 2 6 7 9 Faktor= 6 7 kast Antal = 6 Vaeliglg mellem 1 2 7 9 Faktor=9 8 kast Antal = 3 Vaeliglg mellem 1 2 7 Faktor= 2 9 kast Antal = 2 Vaeliglg mellem 1 7 Faktor= 7 10 kast Antal = 2 Vaeliglg mellem 1 Faktor= 1 Din score er 176 Valget af tallene 110 er i dette tilfaeliglde foretaget ud fra den optimale strategi som vi vil omtale om et oslashjeblik Foslashr vi analyserer den optimale strategi for dette spil vil vi forsoslashge os med en intuitiv bedste strategi Vi belyser denne strategi med et konkret eksempel Lad os feks antage at vi slaringr 4 roslashde i den 3 kast (3 forsoslashg) De tal vi har tilbage kalder vi (y8 y7 y6 y5 y4 y3 y2 y1) Sposlashrgsmaringlet om vi skal gange med det stoslashrste y8 eller det naeligststoslashrste y7 osv Vi raeligsonnerer da som foslashlger Hvis sandsynligheden for at slaring mere end 4 roslashde i de resterende 7 kast er stoslashrre end frac12 saring skal vi vaeliglge det naeligststoslashrste Vi skaeligrper dette Hvis sandsynligheden for at slaring mindst 5 roslashde mindst en gang i de resterende 7 kast er stoslashrre end frac12 saring skal vi vaeliglge det naeligststoslashrste Tilsvarende hvis sandsynligheden for at slaring mindst 5 roslashde mindst 2 gange i de resterende 7 kast skal vi vaeliglge det 3 stoslashrstehellipog saringdan fremdeles Strategien virker umiddelbart meget plausibel Sandsynlighederne kan direkte farings af binomialfordelingen Foslashrst sandsynligheden for at faring mindst q-roslashde i et kast Dette er

P(X q) =

n

qj

jXP )( hvor P(X = j) er angivet ovenfor

Strategier ved spil 20

Sandsynligheden for at dette sker mindst r gange i n - k kast er ogsaring en binomialfordeling og kan skrives

P(X q mindst r gange i n - k kast ) = jknjkn

rj

qXPqXPj

kn

))(1()(

Beregningen af disse (110) sandsynligheder goslashres nok lettest paring en computer For at lave en strategi-tabel goslashr man det at for hvert kast og hvert antal mulige roslashde vaeliglger man foslashrst det stoslashrste af de resterende tal Dernaeligst beregner man sandsynligheden for at faring mindst 1 roslashd mere i et af de foslashlgende kast Hvis denne sandsynlighed er stoslashrre end frac12 ser man paring det naeligststoslashrste af de resterende tal Man beregner saring sandsynligheden for at faring mindst 1 roslashd mere i mindst to af de resterende kast Hvis denne sandsynlighed er stoslashrre end frac12 saring vaeliglger man det tredjestoslashrste af de resterende tal og saringdan fremdeleshellip Det bemaeligrkes at beregningen skal initialiseres med at man altid vaeliglger det mindste hvis man slaringr 0 roslashde og altid vaeliglger det stoslashrste hvis man slaringr 10 roslashde Nedenfor er vist en computerberegning af en strategi-tabel Endvidere er ogsaring lavet en saringkaldt Monte-Carlo simulation Dette betyder at man har ladet maskinen spille feks 10000 spil spillet efter strategi-tabellen Nederst er vist hyppighederne for ens score og endelig fordelingsfunktionen for observationerne (Den kumulerede frekvens) P(X =j) for n =10 and p = 0250 j 0 1 2 3 4 5 6 7 8 9 10 P(X =j)0056 0188 0282 0250 0146 0058 00162 0003 00004 0000 0000 P(Xgt=j) for n =10 and p = 0250 j 0 1 2 3 4 5 6 7 8 9 10 P(Xgt=j) 1000 0944 0756 0474 0224 0078 00197 00035 00004 0000 0000 Strategi tabel Tallene refererer ikke til faktorene selv men til den stoslashrste naeligststoslashrste osv Eksempel Hvis man slaringr 3 roslashde i den andet kast saring skal man vaeliglge (7) den tredjestoslashrste Kast no 1 2 3 4 5 6 7 8 9 10 score 0 1 1 1 1 1 1 1 1 1 1 1 3 3 3 2 2 2 2 1 1 1 2 6 5 5 4 4 3 3 2 2 1 3 8 7 7 6 5 4 3 3 2 1 4 9 9 8 7 6 5 4 3 2 1 5 10 9 8 7 6 5 4 3 2 1 6 10 9 8 7 6 5 4 3 2 1 7 10 9 8 7 6 5 4 3 2 1 8 10 9 8 7 6 5 4 3 2 1 9 10 9 8 7 6 5 4 3 2 1 10 10 9 8 7 6 5 4 3 2 1 Gennemsnitlig score = 16437

Strategier ved spil 21

Hyppighed af score h( 75)= 1 h( 80)= 7 h( 85)= 3 h( 90)= 5 h( 95)= 6 h(100)= 34 h(105)= 38 h(110)= 82 h(115)= 68 h(120)=161 h(125)=146 h(130)=320 h(135)=280 h(140)=534 h(145)=425 h(150)=752 h(155)=577 h(160)=878 h(165)=645 h(170)=956 h(175)=651 h(180)=863 h(185)=527 h(190)=609 h(195)=351 h(200)=389 h(205)=180 h(210)=203 h(215)= 93 h(220)= 86 h(225)= 47 h(230)= 32 h(235)= 21 h(240)= 13 h(245)= 8 h(250)= 3 h(255)= 0 h(260)= 4 h(265)= 1 h(270)= 1 h(275)= 0 h(280)= 0 Frekvens of score F( 80)=00008 F( 85)=00011 F( 90)=00016 F( 95)=00022 F(100)=00056 F(105)=00094 F(110)=00176 F(115)=00244 F(120)=00405 F(125)=00551 F(130)=00871 F(135)=01151 F(140)=01685 F(145)=02110 F(150)=02862 F(155)=03439 F(160)=04317 F(165)=04962 F(170)=05918 F(175)=06569 F(180)=07432 F(185)=07959 F(190)=08568 F(195)=08919 F(200)=09308 F(205)=09488 F(210)=09691 F(215)=09784 F(220)=09870 F(225)=09917 F(230)=09949 F(235)=09970 F(240)=09983 F(245)=09991 F(250)=09994 F(255)=09994 F(260)=09998 F(265)=09999 F(270)=10000 F(275)=10000

Som det fremgaringr af tabellen for P(X gt= j) er der kun 78 chance for at slaring 5 roslashde eller derover saring goslashr man det skal man altid vaeliglge det stoslashrste af de resterende tal For 3 eller 4 roslashde er situationen langt mere uigemmeskuelig og kun en beregning kan afgoslashre sagen Vi proslashver nu at finde den optimale strategi eller Snell-strategien Hvad angaringr sposlashrgsmaringlet om hvorvidt vi skal vaeliglge den stoslashrste eller naeligststoslashrste saring lader det sig faktisk goslashre at beregne Snell-strategien paring en computer De foslashlgende tilfaeliglde bliver derimod for komplicerede og der anvender vi en svagt forbedret version af vores intuitive strategi Forbedringen bestaringr i foslashlgende idet vi illustrerer det med et eksempel Lad os sige vi har slaringet 3 roslashde og vi overvejer om vi vil gange det med 7 eller 6 Ganger vi med 6 er det fordi vi forventer at slaring mindst 4 roslashde mindst en gang i de resterende kast Vores score vil vaeligre 73 og 74 henholdsvis og scoren vil blive forbedret med en faktor 43 hvis vi ganger med 6 under forventning af at slaring 4 roslashde Vores forbedring af strategien garingr da ud paring at vi vaeliglger det naeligststoslashrste 6 hvis sandsynligheden for at slaring 4 roslashde gange den relative forbedring 43 er stoslashrre end frac12 Vi rekapitulerer dernaeligst Snell-strategien G10 = X10 X10 Stokastisk variabel = antallet af roslashde i det 10 kast G9 = max X9 E(G10) E(G10) = E(X10) = np=10025 = 25 X9 = 01hellip10 Gk = max Xk E(Gk+1) E(Gk) kraeligver en laeligngere udregning men den udregnes som en

almindelig middelvaeligrdi altsaring som max af de to vaeligrdier gange P(X=Xk-1) G1 = max X1 E(G2) Som eksempel udregner vi E(G9) Da E(G10)=25 skal vi for X9 = 012 anvende E(G10)=25 i udregningen

Strategier ved spil 22

E(G9) = 25 (P(X=0)+P(X=1)+P(X=2))+ 3P(X=3)+hellip+10P(X=10) =306 Vaeligrdierne for E(Gk) er alle udregnet og vist i computerberegningen nedenfor Bemaeligrk isaeligr at de vokser fra 25 til 425 naringr k aftager fra 10 til 2 Strategien er nu foslashlgende Vaeliglg det stoslashrste af de resterende tal hvis Xk gt E(Gk+1) (altsaring det antal man har slaringet er er stoslashrre end det forventede stoslashrste antal) ellers vaeliglg det naeligststoslashrste Ved afgoslashrelsen om de 3 stoslashrste 4 stoslashrste osv anvender vi den hidtidige strategi med den modifikation at vi multiplicerer sandsynligheden med den formodede relative forbedring E(G10-kast)antal roslashde En computerberegning helt svarende til den foregaringende men med den aeligndrede strategi er vist nedenfor Man bemaeligrker for det foslashrste de smaring aeligndringer der er i strategien Den nye strategi er lidt mindre forsigtig men den giver altsaring ogsaring pote i form af en forbedring af gennemsnittet paring ca 275 Primaeligr sandsynligheder P(X=j) for n= 10 og p= 0250 j 0 1 2 3 4 5 6 7 8 9 10 P(X=j)0056 0188 0282 0250 0146 0058 0016 00031 00004 00000 00000 Baglaeligns Kumulerede sandsynligheder P(Xgt=j) j 0 1 2 3 4 5 6 7 8 9 10 P(Xgt=j) 1000 0944 0756 0474 0224 0078 00197 00035 00004 00000 00000 E(G[10])= 250 E(G[9])= 306 E(G[8])= 337 E(G[7])= 362 E(G[6])= 380 E(G[5])= 395 E(G[4])= 406 E(G[3])= 416 E(G[2])= 425 kast nr 1 2 3 4 5 6 7 8 9 10 score 0 1 1 1 1 1 1 1 1 1 1 1 2 2 1 1 1 1 1 1 1 1 2 5 4 4 3 3 3 2 2 1 1 3 8 7 6 5 5 4 3 2 2 1 4 9 8 7 7 6 5 4 3 2 1 5 10 9 8 7 6 5 4 3 2 1 6 10 9 8 7 6 5 4 3 2 1 7 10 9 8 7 6 5 4 3 2 1 8 10 9 8 7 6 5 4 3 2 1 9 10 9 8 7 6 5 4 3 2 1 10 10 9 8 7 6 5 4 3 2 1 Gennemsnitlig gevinst ms = 16727 Hyppigheder af score h( 75)= 1 h( 80)= 1 h( 85)= 0 h( 90)= 3 h( 95)= 2 h(100)= 5 h(105)= 4 h(110)= 9 h(115)= 12 h(120)= 12 h(125)= 17 h(130)= 22 h(135)= 28 h(140)= 39 h(145)= 24 h(150)= 49 h(155)= 54 h(160)= 74 h(165)= 63 h(170)=117 h(175)= 63 h(180)= 91 h(185)= 57 h(190)= 72 h(195)= 39 h(200)= 36 h(205)= 35 h(210)= 29 h(215)= 14 h(220)= 21 h(225)= 1 h(230)= 5 h(235)= 1 h(240)= 0 h(245)= 0 h(250)= 0 h(255)= 0 h(260)= 0 h(265)= 0 h(270)= 0 h(275)= 0 h(280)= 0

Strategier ved spil 23

Frekvens af score F( 80)=00020 F( 85)=00020 F( 90)=00050 F( 95)=00070 F(100)=00120 F(105)=00160 F(110)=00250 F(115)=00370 F(120)=00490 F(125)=00660 F(130)=00880 F(135)=01160 F(140)=01550 F(145)=01790 F(150)=02280 F(155)=02820 F(160)=03560 F(165)=04190 F(170)=05360 F(175)=05990 F(180)=06900 F(185)=07470 F(190)=08190 F(195)=08580 F(200)=08940 F(205)=09290 F(210)=09580 F(215)=09720 F(220)=09930 F(225)=09940 F(230)=09990 F(235)=10000 F(240)=10000 F(245)=10000 F(250)=10000 F(255)=10000 F(260)=10000 F(265)=10000 F(270)=10000 F(275)=10000

Maringske er det ikke en saeligrlig imponerende forbedring fra den foslashrste strategi men det er en teoretisk milepaeligl at man er i stand til at angive den bedste strategi for bestemte typer af spil Som omtalt har vi ikke forsoslashgt at bevise at Snell-Strategien er den optimale Strategi men det kan bevises Det er vigtigt at notere sig at i alle de omtalte spil har udfaldene vaeligre stokastiske variable dvs uforudsigelige men med bestemte sandsynligheder og at disse sandsynligheder ikke bliver aeligndret af den strategi man foslashlger I mange af de spil hvor man ofte moslashder begrebet strategi feks skak krig finansmarked og markedsfoslashring er dette langt fra tilfaeligldet Hvis feks alle boslashrsspekulanter fulgte den samme optimale strategi med boslashrskursen som stokastisk variabel ville det nok vise sig at det var den daringrligste strategi af alle Teorien for dynamiske strategier hvor de stokastiske variable er funktioner af tiden og af den valgte strategi er teoretisk naeligsten ufremkommelige

Strategier ved spil 24

Indeks Casino516 Computersimulation18 definitionen af sandsynlighed 1 Den optimale Snell-strategi11 forsikringsmatematik 5 Indbrudstyvens pensionsproblem912 kortsigtede strategi 10 kumulerede frekvens 19 langsigtede strategi 10 lotto 1 Mandagschancen14 Mandags-chancen9 Martingale-systemet16

Optimale Strategier 10 Poker 3 rekursionsligning 6 roulette 57 Roulette spil 10 roulettespiller 7 ruinsandsynligheder 5 Skaeligbnen913 Snell-strategien 11 Stopbetingelsen11 strategi9 Taeligndstikspillet1018

Page 3: Sandsynligheder og strategier ved spil - Ole Witt-Hansen ...olewitthansen.dk/Matematik/Sandsynligheder_og_strategier_ved_spil… · 6dqgv\qoljkhghu yhg vslo 3n vdpph pngh ndq yl ilqgh

Sandsynligheder ved spil 1

Kap 1 Sandsynligheder ved spil

1 Lotto Ved lottospil garingr det som bekendt ud paring at gaeligtte 7 tal ud af 36 mulige Foruden de 7 lotto tal bliver der ogsaring udtrukket 1 tillaeliggstal Man opnaringr praeligmier paring foslashlgende maringde

1 praeligmie ved at gaeligtte alle 7 rigtige 2 praeligmie for at gaeligtte 6 rigtige plus et tillaeliggstal 3 praeligmie for at gaeligtte 6 rigtige 4 praeligmie for at gaeligtte 5 rigtige 5 praeligmie for at gaeligtte 4 rigtige

Vi vil indlede med at udregne sandsynlighederne for at faring hver af disse praeligmier naringr man udfylder eacuten raeligkke Vi skal her minde om definitionen af sandsynligheden for en haeligndelse H i et Symmetrisk Sandsynlighedsfelt hvor n(U) er det mulige antal udfald og n(H) er antallet af udfald i H

Mulige

Gunstige

UielementerAntal

HielementerAntal

Un

HnHP

)(

)()(

Antallet af forskellige maringder hvor man kan udvaeliglge en delmaeligngde paring q elementer af en maeligngde paring n elementer er

)(

)(

qnq

nqnK

De mulige maringder at udvaeliglge 7 tal ud af 36 er derfor

68034781234567

30313233343536

)736(7

36)736(

K

Foslashlgelig er sandsynligheden for 7 rigtige

77 1019791

)736(

1)7( p

KP

Naringr vi skal udregne sandsynligheden for 6 rigtige tal plus et tillaeliggstal raeligsonnerer vi paring foslashlgende maringde De 6 rigtige kan vaeliglges ud af 7 paring K(76) = 7 forskellige maringder og tillaeliggstallet kan vaeliglges paring 1 maringde Da vi baringde skal have 6 rigtige og et tillaeliggstal rigtigt skal de to antal muligheder multipliceres for at finde antallet af gunstige udfald P(6 rigtige + 1tt) = K(76)1K(367)=7K(367)=7p7 = 833010-7

Sandsynligheder ved spil 2

Paring samme maringde kan vi finde sandsynligheden for 6 rigtige idet antal gunstige er K(76) gange med antal maringder rdquodet forkerte talrdquo kan vaeliglges paring nemlig 36 ndash7 ndash1 = 28 maringder idet det forkerte tal hverken maring vaeligre et af de 7 rigtige eller et tillaeliggstal P(6 rigtige) =K(76)28K(367) = 196p7 = 2347910-5 Sandsynligheden for 5 rigtige tal findes som antallet af maringder at udtage 5 rigtige ud af 7 lig med K(75) gange antallet af muligheder for de to sidste tal som kan vaeliglges blandt 36 - 7 = 29 tal Dette antal er K(292) P(5 rigtige) = K(75)K(292)K(367) = 8526p7 = 10210-3 =102 Paring helt samme maringde opskriver vi sandsynligheden for 4 rigtige idet de gunstige er K(74) K(293) nemlig 4 rigtige udvalgt blandt 7 gange 3 rdquoforkerterdquo udvalgt blandt 29 P(4 rigtige) = K(74)K(293)K(367) = 127890p7 = 00153 = 153 Af ovenstaringende fremgaringr at chancen for at faring mere end 4 rigtige er uhyre ringe Til gengaeligld er der en rimelig chance for at faring 4 rigtige Dette er gjort helt bevidst for dem der har planlagt spillet Erfaringen viser nemlig at hvis man aldrig vinder holder man op med at spille efter en vis tid Lad os antage at man hver uge udfylder en kupon med 10 raeligkker Foslashrst udregner vi chancen for at faring 4 rigtige paring mindst eacuten af kuponerne Haeligndelsen 4 rigtige er binomialfordelt med antalsparameteren n =10 For at finde denne sandsynlighed udregner vi foslashrst sandsynligheden for den komplementaeligre haeligndelse Ikke 4 rigtige paring nogen af kuponerne P(Ikke 4 rigtige paring nogen af kuponerne) = (1-p4)

10 = 0984710 =08557 P(4 rigtige paring mindst eacuten af kuponerne) = 1 - P(Ikke 4 rigtige paring nogen af kuponerne) = 01443 Man har altsaring knap 15 chance for at faring 4 rigtige paring mindst en af de 10 raeligkker Antager vi nu at man spiller 10 raeligkker i 5 uger vil vi udregne sandsynligheden for at man ikke faringr 4 rigtige paring nogen af de 5 uger P(ikke 4 rigtige i 5 uger)= 085575 = 04487 Der er saringledes godt 50 chance for at man faringr 4 rigtige mindst en gang paring 5 uger Det er formodentlig det som holder spillet i gang Vinder man faringr man udbetalt ca 40 kr som kan sammenlignes med udgiften til en kupon 540 =200 kr Middelgevinsten paring en kupon til 40 kr hvis vi kun ser paring 4 rigtige og saeligtter praeligmien 40 kr er -40∙P(ikke 4 rigtige paring de 10 kuponer) + 40∙P(4 rigtige) = -40∙ 08557+40∙01443 = -285 kr

Sandsynligheder ved spil 3

oslashvelser 1 Udregn hvor mange uger man skal spille 10 raeligkker for at der er mere end 50 chance for at

vinde 4 praeligmie (5 rigtige) Opgaven skal loslashses med logaritmer 2 Forsoslashg at udregne samme som ovenfor blot med en 1 praeligmie 3 En udfyldt raeligkke paring 7 tal daeligkker aringbenbart over K(74)K(292) forskellige raeligkker med 4

rigtige Hvor mange raeligkker skal man mindst udfylde for at vaeligre sikker paring at faring 4 rigtige

2 Poker Vi antager at Poker spilles med et almindeligt spil kort og at hver spiller faringr 5 kort fra begyndelsen Vi vil ikke beskaeligftige os med at koslashbe nye kort da det er alt for kompliceret men kun udregne sandsynlighederne for de forskellige kombinationer af kort der kan slaring hinanden Flush betyder i Poker sammenhaeligng 5 kort i samme farve og Straight betyder 5 kort i raeligkkefoslashlge Rangfoslashlgen af kortfarverne er i oslashvrigt de samme som i Bridge Spar Hjerter Ruder Kloslashr Rangfoslashlgen af kortkombinationer i Poker er foslashlgende Royal Flush De 5 hoslashjeste kort i samme farve Feks es konge dame knaeliggt 10 i ruder Straight Flush 5 kort i raeligkkefoslashlge i samme farve Fire ens 4 ens kort (5 kort underordnet) Full House 3 ens + 2 ens (et par) Flush 5 kort i samme farve Straight 5 kort i raeligkkefoslashlge Tre ens tre ens kortvaeligrdi To par 2 ens + 2 ens Et par 2 ens Hoslashjeste kort Sandsynlighederne for hver af disse kortkombinationer kan udregnes idet de mulige kombinationer af 5 kort udtaget af 52 er K(525) = 2598960 Royal Flush Der er 4 forskellige Royal Flush ndash en i hver farve

P(Royal flush) = )552(

4

K 615610-6

Straight Flush Der kan i hver af de 4 kortfarver laves 9 forskellige Straight Flush En af dem er Royal

P(Straight Flush) =)532(

32

)552(

)19(4

KK

= 492510-5

Sandsynligheder ved spil 4

Fire ens Der er 13 forskellige muligheder for fire ens Det femte kort kan vaeliglges paring 52 - 4 = 48 forskellige maringder

P(4 ens) =

)552(

624

)552(

4813

KK240110-4

Full House Der er 13 forskellige muligheder for 3 ens De 3 kan udtages paring K(43) forskellige maringder De to ens maring noslashdvendigvis have en anden talvaeligrdi hvoraf resultatet foslashlger

P(Full House 3 ens + 2 ens) =

)552(

3744

)552(

)24(12)34(13

KK

KK140010-3

Flush 5 kort i samme farve kan udtages paring K(135) maringder Der er 4 kortfarver Vi maring subtrahere Straight Flusher fra

P(Flush 5 i samme farve) = 3109671)552(

5112

)552(

432)513(4

KK

K

Straight Der er 13 - 4 = 9 forskellige raeligkkefoslashlger Hver af de 5 kortvaeligrdier kan vaeliglges blandt 4 farver Vi skal fratraeligkke Straight Flush

P(Straight 5 i raeligkkefoslashlge) = 35

10533)552(

9180

)552(

3649

KK

Tre ens Der er 13 kortvaeligrdier og der skal udvaeliglges 3 De sidste to kort kan udvaeliglges blandt 52 - 4 = 48 kort (ikke 49 da det kunne give 4 ens) Vi maring dog fratraeligkke de 12K(42) par der kan dannes og som ville give Full House

P(3 ens) = 2101132)552(

54912

)552(

))24(12)248(()34(13

KK

KKK

To par Foslashrst udregnes antallet af muligheder for de to par Faktoren frac12 skyldes at man ved denne optaeliglling taeligller de mulige kombinationer Et par feks (spar dame hjerter dame) vil baringde vaeligre at finde blandt de 13K(42) og de 12K(42) muligheder Det sidste kort kan vaeliglges blandt 52 ndash 8 som danner de to par

P(2 par) = 210754)552(

552123

)552(

)852)(24(12)24(1321

KK

KK

Et par De foslashrste 3 faktorer i taeliglleren er antallet af maringder at faring et par paring Vi bliver noslashdt til at subtrahere mulighederne for 2 par og Full House

P(1 par) = 47010)552(

1221781

)552(

3755552123)348()24(13

KK

KK

Sandsynligheder ved spil 5

Hermed har vi afsluttet vores gennemgang af sandsynlighederne i Poker Bemaeligrk at sandsynlighederne foslashlger rangen af en Pokerharingnd

3 Ruinsandsynligheder ved Roulette mv Beregningen af ruinsandsynligheder er noget som er helt afgoslashrende for forsikringsvirksomhed hvis denne skal drives forretningsmaeligssigt Sammenhaeligngen mellem ruinsandsynligheder og beregning af praeligmiestoslashrrelserne en ret kompliceret matematisk teori som betegnes forsikringsmatematik Paring universiteterne findes en saeligrlig uddannelse som kaldes aktuar studiet som har dette som speciale Forsikringsmatematik kan illustreres ved at betragte roulettespil paring et Casino En roulette har 37 felter nummereret 0 ndash 36 Hvis man vinder paring et felt faringr man udbetalt 36 gange indsatsen Da man har lagt en indsats er gevinsten 35 indsatser Hvis X er den stokastiske variabel som betegner en spillers gevinst saring antager X vaeligrdierne +35 med sandsynlighed 137 og ndash1 med sandsynlighed 3637

P(X = 35) = 137 og P(X = -1) = 3637 Middelgevinsten naringr man spiller paring et felt er foslashlgelig

(31) 37

1

37

36)1(

37

135)()()(

Uu

uPuXXE

Hvis spilleren i stedet vaeliglger at spille paring m felter antager gevinsten X vaeligrdierne 36 - m med sandsynlighed m37 og ndashm med sandsynligheden (37 - m)37 = 1 - m37 Middelgevinsten bliver herefter

37

)37

1)((37

)36()()()(mm

mm

muPuXXEUu

Middelgevinsten pr indsats er saringledes uafhaeligngig af hvor mange felter man spiller paring Hermed er det slaringet fast Der findes intet system der kan bringe eacuten i stand til at vinde paring en roulette paring laeligngere sigt Dette er en simpel matematisk kendsgerning som mange har maringttet erkende paring en betydelig mere smertelig maringde Specielt hvis man spiller paring m = 18 felter er gevinsten 36-18=18 med sandsynlighed 1837 og ndash18 med sandsynlighed 1937 Selvom en spiller ikke kan vinde i det lange loslashb har spilleren paring grund af tilfaeligldigheder (som spillere foretraeligkker at kalde held) mulighed for at vinde betragtelig store beloslashb Vi vil nu lave nogle betragtninger over hvor stor sandsynlighed en spiller har for at spraelignge banken dvs at ruinere et Casino En saringdan beregnet sandsynlighed kaldes for ruin sandsynligheden

Ruinsandsynligheder 6

Vi antager at Banken raringder over n-enheder (indsatser) Vi oslashnsker at vurdere sandsynligheden for at en uendelig rig spiller der goslashr den samme indsats i hvert spil vinder n eller flere enheder naringr der ikke er nogen begraelignsning paring antallet af spil Ruinsandsynligheden for banken betegner vi rn Hvis X1 X2 X3 betegner Casinorsquoets gevinst ved de enkelte spil er

Gk = X1 + X2 +X3++Xk gevinsten efter k-spil Ruinsandsynligheden kan derfor formuleres derhen at

rn = P( 0kG for et eller andet k)

(Der er ingen umiddelbar sammenhaeligng mellem n og k) Der gaeliglder rekursions-formlen

rn+1 = rn r1

som udtrykker at sandsynligheden for at blive ruineret med n+1 enheder er lig sandsynligheden for at blive ruineret med n enheder gange sandsynligheden for at blive ruineret med eacuten enhed Dette fordi vi antager at hvert spil er uafhaeligngigt af de oslashvrige Heraf foslashlger umiddelbart

r2 = r1+1 = r1 r1 = r12 r3 = r2+1 = r2 r1 = r1

3 og foslashlgelig

rn = r1n

For at beregne en ruinsandsynlighed ser vi foslashrst paring tilfaeligldet hvor en spiller saeligtter sin indsats paring 18 felter pr spil Her er Casinorsquoets gevinst +18 eller ndash18 pr spil For nemheds skyld saeligtter vi de 18 indsatser til at vaeligre en enhed = 1 Vi opstiller da foslashlgende rekursionsligning som tager udgangspunkt i det foslashrste spil Sandsynligheden for at banken bliver ruineret med n enheder er lig med Sandsynligheden for at banken vinder det foslashrste spil (hvor den vinder en enhed) gange sandsynligheden for at banken bliver ruineret med n+1 enheder plus sandsynligheden for at banken taber det foslashrste spil (hvor den mister en enhed) gange sandsynligheden for at banken bliver ruineret med n-1 enheder Sandsynlighederne for at banken vinder og taber er 1937 og 1837 Vi kan da opstille ligningen

1

1

1

1111 37

18

37

19

37

18

37

19 nnn

nnn rrrrrr

For at opnaring det sidste udtryk har vi anvendt resultatet af rekursionsligningen rn = r1

n Det er relativt nemt at bestemme r1 ud fra denne ligning Ved division af ligningen med r1

n-1 faringr man

Ruinsandsynligheder 7

018371937

18

37

191

21

211

rrrr

Den sidste 2gradsligning kan loslashses paring normal vis idet diskriminanten d =372 ndash 4middot19middot18 = 1 saring

119

18

38

36

192

137111

rrr

Vi er kun interesseret i loslashsningen r1 = 1819

Ifoslashlge ovenstaringende er nrr nn )

19

18(1

Vi vil herefter besvare sposlashrgsmaringlet Hvor mange enheder skal banken have for at der er mindre end 1 chance for ruin Dette er ensbetydende med at loslashse ligningen

1785)

19

18ln(

)010ln(010)

19

18( nn

Husker vi at en enhed svarede til 18 indsatser giver dette beskedne 1533 indsatser Hvis en spiller derimod spiller paring saeligdvanlig vis med kun at placere en indsats paring eacutet felt er dette - lidt overraskende ndash betydelig mere risikabelt for banken Vi opstiller igen en rekursionsligning med udgangspunkt i det foslashrste spil Sandsynligheden for at banken bliver ruineret med n enheder er lig med Sandsynligheden for at banken vinder det foslashrste spil (hvor den vinder en enhed) gange sandsynligheden for at banken bliver ruineret med n+1 enheder plus sandsynligheden for at banken taber det foslashrste spil (hvor den mister 35 enhed) gange sandsynligheden for at banken bliver ruineret med n-35 enheder Sandsynlighederne for at banken vinder og taber er 3637 og 137 Vi kan da opstille ligningen

351

111351 37

1

37

36

37

1

37

36 nnn

nnn rrrrrr

Ved division med (r1)

n-35 og omordning af leddene og ved at saeligtte r1 = x faringr man ligningen

36x36 ndash 37x35 +1 = 0 Denne ligning kan kun loslashses ved numeriske metoder og man finder loslashsningen x = 09984 Hvis vi igen stiller sposlashrgsmaringlet Hvor mange indsatser skal banken raringde over for at der er mindre end 1 chance for ruin skal vi loslashse ligningen

Ruinsandsynligheder 8

2876)99840ln(

)010ln(010)99740( nn

Altsaring en betydelig stoslashrre beholdning end hvis spilleren spiller paring 18 felter Forsoslashger vi at udregne ruinsandsynligheden for en spiller der har n enheder og laeliggger sin indsats paring eacutet felt kommer vi efter helt det samme raeligsonnement frem til foslashlgende rekursionsligning

35137

11137

36

37

1

37

361351

nn rrrrrr

nnnn

som foslashrer til ligningen x36 ndash 37x +36 = 0 Denne ligning har kun loslashsningen x = 1 Differentieres nemlig f(x) =x36 ndash 37x +36 finder man f (x) =36x35 ndash 37 Ligningen f (x) =0 har

loslashsningen 136

3735 x Da f (x) lt 0 for x lt 1 har den ingen roslashdder mindre end 1

Ruin-sandsynligheden for en spiller der garingr paring et Casino som har en ubegraelignset beholdning er 1 Saring vi kan endnu engang fastslaring at hvis man fortsaeligtter med at spille paring et Casino vil man altid blive ruineret i det lange loslashb Man kunne selvfoslashlgelig overveje ruinsandsynlighederne hvis Casino har beholdningen n og en spiller har beholdningen m (n gt m eller omvendt) men svaret vil afhaelignge af n og m og de indgaringende to ulineaeligre ligninger med to ubekendte med meget hoslashje eksponenter er ikke saring nemme at loslashse numerisk ndash selv paring en Computer Hvis n gtgt m vil svaret stort set vaeligre det samme

Strategier ved spil 9

Kap 2 Strategier ved spil

1 Forskellige spil Efter at have udregnet vindersandsynligheder i forbindelse med spil skal vi nu se paring noget andet som ogsaring er knyttet sammen med sandsynlighedsregningen nemlig problemet med at fastlaeliggge den bedste strategi naringr man spiller et spil Her skal spil imidlertid forstarings i en meget videre betydning det vaeligre sig krig boslashrsspekulation jagt eller fiskeri paring en bestemt dyreart Sidstnaeligvnte er dog alt for komplicerede til at kunne behandles elementaeligrt Faeliglles er det dog at man skal kunne beregne sandsynligheden for en bestemt konsekvens af et givet traeligk Vi vil begynde med at give nogle meget simple eksempler paring spil hvor det er meningsfuldt at tale om optimal strategi Vendingen den optimale strategi indebaeligrer at spillet afvikles i et endeligt antal trin og at der for hvert trin i spillet er mulighed for at forbedre sin gevinst og mulighed for at miste sin gevinst helt eller delvis Man skal endvidere have mulighed for at standse spillet ved ethvert trin og inkassere sin gevinst

11 Mandags-chancen I dette spil som har vaeligret lanceret af TV2 har man en raeligkke tildaeligkkede felter med beloslashb (101025255050100100250) x 1000 kr Man har maximalt 3 forsoslashg Man faringr beloslashbet paring det sidst afdaeligkkede felt Nedenfor er vist en computer simulation af spillet efter 2 traeligk Det er nok klart at hvis man afdaeligkker et felt med 10 i 1 eller 2 forsoslashg skal man fortsaeligtte eller hvis man afdaeligkker et felt med 100 eller 250 i 1 eller 2 forsoslashg skal man standse Men hvad hvis man afdaeligkker et felt med 50 i 1 eller 2 forsoslashg Det vil vi forsoslashge at afgoslashre ved nogle mere matematiske betragtninger

12 Skaeligbnen Et spil som vist nok kommer fra orienten Det spilles med to terninger Foslashrst slaringr man et slag med de to terninger og summen af deres oslashjental betegnes skaeligbnen

Strategier ved spil 10

Man kan nu slaring lige saring mange gange man vil (max 100) Hvis oslashjentallene ikke er lig skaeligbnen saring adderes dette til ens pointtal men hvis man slaringr sin skaeligbne mister man alt Nedenfor er vist et trin i en animeret computer simulation af spillet Naringr spillet er standset fordeler man indsatsen i forhold til spillernes opnaringede pointtal Det gaeliglder derfor om at have de stoslashrste pointtal Problemet er imidlertid hvornaringr det er optimalt at standse naringr man kender sin skaeligbne

13 Indbrudstyvens pensionsproblem Dette er en variant af mange forskellige optimeringsproblemer Arthur er indbrudstyv Hver tyvetugt giver i snit K kr Chancen for at Arthur bliver snuppet er p Hvis han bliver taget mister han alt fra sine tidligere tyvetugter Hvor mange indbrud skal Arthur lave foslashr han standser sin karriere og vaeliglger at leve af sin opsparing

14 Taeligndstikspillet Dette spil falder lidt uden for rammerne af de oslashvrige spil fordi man ikke kan standse spillet og fordi man aldrig kan miste noget af sin gevinst Det kan derfor ikke umiddelbart behandles paring samme maringde som de hidtil naeligvnte spil Alligevel er det et spil der udpraeligget kan behandles med matematiske teorier for den bedste strategi Spillet garingr ud paring at man paring 10 taeligndstikker farver den ene side roslashd Kastes taeligndstikken op er sandsynligheden for at den farvede side vender opad naringr den lander paring bordet lig med p = 025 Hver spiller har fra starten tallene 110 Hvert tal maring kun bruges 1 gang Man skiftes til at kaste de 10 taeligndstikker og notere antallet af farvede taeligndstikker Dette antal skal saring ganges med et af de resterende tal 110 Den som efter 10 spil har den hoslashjeste sum har vundet Det kan oplyses og let verificeres at den maximale gevinst er 550 Middelgevinsten hvor man vaeliglger tilfaeligldig er 1375 og den optimale middelgevinst er ca 167

Strategier ved spil 11

15 Casino Roulette spil falder ogsaring lidt uden for rammerne af optimale strategier af den meget simple grund at odds er svagt imod eacuten Det gaeliglder dog ikke for Blackjack hvor man kan udvikle en strategi som giver en svag fordel Hvis odds er imod eacuten vil man imidlertid altid tabe i det lange loslashb Som tidligere fastslaringet er den eneste mulighed - i det lange loslashb - for at undgaring ruin i roulettespil at der ikke er nogen oslashvre graelignse for indsatser og at man har flere penge end Casionorsquoet og ingen af disse to betingelser er nogensinde opfyldt Enhver fornuftig matematisk spil-teori vil derfor som resultat have at man skal standse foslashr det foslashrste spil Det vil sige Man skal lade vaeligre med at garing paring Casino Denne kendsgerning udelukker dog ikke at man kan goslashre sig overvejelser over hvordan man kan spille hvis man ikke udelukkende er interesseret i at foraeligre sine penge til et Casino uden kamp

2 Optimale Strategier Hvis man intuitivt skal formulere en strategi for de 3 foslashrste spil naeligvnt ovenfor saring kan man feks vaeliglge eacuten af 3 foslashlgende strategier 1 Man beslutter paring forharingnd hvor stor ens gevinst (eller tab) skal vaeligre foslashr man stopper Dette er

faktisk en meget almindelig strategi men den er bestemt ikke optimal 2 Man fortsaeligtter saring laelignge man i middel har mulighed for at foroslashge sin gevinst i naeligste spil Man

skal huske paring at middelvaeligrdien af gevinsten ogsaring omfatter tab saring middelvaeligrdien (i matematisk forstand) skal vaeligre positiv Denne umiddelbart fornuftige strategi kaldet den kortsigtede eller myope strategi er i mange tilfaeliglde ogsaring den optimale strategi (dog ikke i mandagschancen)

3 Man fortsaeligtter saring laelignge man i middel har mulighed for at foroslashge sin gevinst i et af de

efterfoslashlgende spil Denne strategi kaldes den langsigtede strategi Baringde den kortsigtede og den langsigtede strategi ser yderst rimelige ud og de vil ogsaring vaeligre optimale for langt de fleste spil Hvis der er forskel paring den langsigtede og den kortsigtede strategi skal man anvende den langsigtede - naturligvis Der findes imidlertid visse former for spil hvor ingen af strategierne er optimale Det gaeliglder feks for boslashrsspekulanter der har en beholdning aktier som de vil saeliglge naringr kurserne stiger Dette fortsaeligtter som bekendt aldrig i det uendelige Paring et vist tidspunkt standser stigningen og kurserne begynder at falde ndash som regel ndash hurtigere end de steg Hvornaringr skal man saeliglge for at opnaring den stoslashrste gevinst Det viser sig - men det er saeligrdeles kompliceret at redegoslashre for ndash at naringr det gaeliglder boslashrs spekulation saring er ingen af strategierne 2 og 3 optimale De vil begge to i grove traeligk som resultat have at man enten skal saeliglge straks eller vente til man er ruineret Vi vil nu give en beskrivelse af den optimale strategi som er udviklet af Snell Vi vil overhovedet ikke naeligrme os et bevis for at det er den optimale strategi (beviset er ret teknisk abstrakt) men

Strategier ved spil 12

understrege at det kan bevises I matematisk forstand Ulemperne ved Snell-strategien er at den for selv simple problemer kan foslashre til ret omfattende og komplicerede regninger

2 Den optimale Snell-strategi Snell-strategien er paring sin vis den samme som den kortsigtede strategi men hvor man i denne strategi hele tiden regner sig et skridt frem saring tager Snell-strategien udgangspunkt i spillets slutning og arbejder sig baglaeligns Vi indfoslashrer foslashrst nogle betegnelser Vi antager at spillet har n trin Sk er en stokastisk variabel der angiver den faktiske samlede gevinst man har opnaringet ved det kte spil Sk kan antage en eller flere vaeligrdier med tilhoslashrende sandsynligheder Det nye ved Snell-strategien er at man definerer endnu en stokastisk variabel Gk ved ligningen

Gk = maxSk E(Gk+1| S1Sk) Gk er den stoslashrste af vaeligrdierne Sk (gevinsten efter det kte spil) og E(Gk+1| S1Sk)) som er middelvaeligrdien af den maximale forventede gevinst i det k+1te spil naringr det er givet at man har spillet spillene 1k Dette opstilles i et skema Gn = Sn Gevinsten ved spillets afslutning Gn-1 = maxSn-1 E(Gn| S1Sn-1) Gk = maxSk E(Gk+1| S1Sk) G1 = maxS1 E(G2| S1) Snell strategien siger nu at man skal standse spillet den foslashrste gang Sk (gevinsten efter det kte spil) overstiger middelvaeligrdien af den maksimale forventede gevinst i det k+1te spil Dette kaldes for stopbetingelsen Stopbetingelsen er altsaring

Sk E(Gk+1| S1Sk) Man skal altsaring standse spillet naringr den opnaringede gevinst er stoslashrre eller lig med den betingede forventning af den maximale gevinst i det naeligste spil Det kunne lyde som den kortsigtede strategi men forskellen er den at i den kortsigtede strategi er Gk+1 erstattet af Sk+1 At kunne gennemskue konsekvenserne af dette er derimod ikke saring nemt Det viser sig at i mange tilfaeliglde at er Snell-Strategien identisk med den kortsigtede strategi som kraeligver at man stopper naringr Sk E(Sk+1| S1Sk) Snell strategien er ikke umiddelbart let gennemskuelig og udregningen af de betingede middelvaeligrdier E(Gk+1| S1Sk) er ofte ret teknisk Vi vil nu behandle de foslashr naeligvnte eksempler og begynder med

Strategier ved spil 13

21 Indbrudstyvens pensionsproblem Lad os antage at Arthurs gennemsnitlige gevinst ved hvert tyvetogt er K = 6000 kr og at chancen er at han bliver taget er 5 Lad os antage at hans hidtidige gevinst efter k - tyvetugt er Sk som bliver konfiskeret - og som han derved mister hvis han bliver snuppet I dette tilfaeliglde kan man - som vist nedenfor - se at den kortsigtede strategi er den optimale strategi Det haelignger sammen med at alle trin i spillet er identiske Gevinsten ved hvert tyvetogt er den samme ndash uafhaeligngigt af de foregaringende tyvetugter - bortset fra at den samlede gevinst vokser ved hvert vellykket tyvetogt Xk betegner den stokastiske variabel som er Arthurs gevinst ved eacutet tyvetugt Hermed er

Sk =X1+ X2+ X3+hellip Xk Xk+1 kan antage vaeligrdien K med sandsynlighed 1-ps = 1-P(Snuppet) (altsaring hvis det naeligste tyvetugt lykkes) og vaeligrdien ndashSk (han mister hele sin opsparing) med sandsynlighed ps = P(Snuppet) Vi opskriver nu Snell-strategien (Den kortsigtede strategi) for et trin i hans karriere

Gk = max Sk E(Sk+1| 1k)

Sk er hans gevinst efter k tyvetugter og E(Sk+1| 1k) er hans forventede gevinst efter k+1 tyvetugter E(Sk+1| 1k) kan beregnes som den hidtidige gevinst plus den forventede gevinst ved naeligste tyve- tugt i alt lig med Sk + E(Xk+1) E(Xk+1) er uafhaeligngig af de foslashrste k - tyvetugter derfor bliver stopbetingelsen Sk gt Sk + E(Xk+1) E(Xk+1) lt 0 Middelvaeligrdien E(Xk+1) kan saringledes udregnes efter den saeligdvanlige definition idet Xk+1 antager vaeligrdierne K (gevinsten ved et tyvetugt) og - Sk (mister hele sin opsparing) med sandsynlighederne 1-ps og ps henholdsvis E(Xk+1) = K(1- ps) - Sk ps Han skal standse naringr

E(Xk+1) lt 0 K(1- ps) lt Sk ps som med tal eksemplet giver

6000095 lt Sk005 Sk gt 114000- kr svarende til 114006000 = 095005 = 19 tyvetugter

(Det goslashr han nu nok ikke og er derfor henvist til at leve af folkepensionen efter nogle aringr i skyggen) Man kunne godt tro at dette eksempel kunne anvendes paring andre (ligesaring uetiske) problemstillinger Feks hvor mange gange det er optimalt at koslashre gratis i S-tog Det kan det imidlertid ikke helt

Strategier ved spil 14

Sagen er jo den at man faringr en fast boslashde hvis man bliver snuppet men man kommer ikke til at betale for de gange man har koslashrt gratis Med andre ord vurderingen om hvorvidt det er fordelagtigt at koslashre uden billet afhaelignger kun af middelgevinsten ved det naeligste forsoslashg Hvis den er positiv er det fordelagtigt at fortsaeligtte men hvis den er negativ er det fordelagtigt at loslashse billet (Det er i oslashvrigt uetisk at snyde ndash naturligvis) Tager vi et eksempel billetprisen er kr 50- Boslashden er kr 500 Sandsynligheden for at blive snuppet er Ps = 01 Hvis X er gevinsten ved at koslashre uden billet er E(X) = 50middot(1-Ps)-500middotPs = 50middot09-500middot01 = -50 Det er saringledes (med denne sandsynlighed for at blive snuppet) ikke fordelagtigt at koslashre uden billet i S-tog Da en laeligrebog i sandsynligheder ved spil naturligvis ikke maring tilskynde til uetiske handlinger undlader vi at foretage beregningen med Ps = 005

22 Skaeligbnen Vi betragter kast med to terninger X betegner summen af oslashjentallene ved eacutet kast Sandsynlighedsfordelingen for X er velkendt Feks er P(X=5) = 436 Sandsynligheden for at terningerne viser j oslashjne kan skrives som

36

76)(

jjXP

Lad os antage at spillerens skaeligbne er q Hvis man slaringr dette oslashjental er alt tabt Ellers adderes oslashjentallene for hvert kast Hvis ikke man har slaringet sin skaeligbne saring er den samlede gevinst efter n spil

Sn = X1+ X2+ X3+hellip +Xn

Og middelvaeligrdien af Sn er

E(Sn) = E(X1)+ E(X2)+E(X3)+hellip +E(Xn) = nE(X | X q) E(X | X q) er den betingede middelvaeligrdi af oslashjentallene givet at man ikke slaringr sin skaeligbne

E(X | X q) = 2P(2) +3P(3)+hellip(q-1)P(q-1) + (q+1)P(q+1)+hellip+12P(12) Den kortsigtede strategi (og Snell strategien) fastslaringr at man skal standse naringr middelvaeligrdien af den forventede gevinst ved naeligste kast er negativ Argumentet for dette kan overtages naeligsten ordret fra indbrudstyvens pensionsproblem E(Sk+1|S1 Sk) kan beregnes som den hidtidige gevinst Sk plus den forventede gevinst ved det naeligste kast i alt lig med Sk + E(Xk+1| S1 Sk) Stopbetingelsen er derfor

Sk gt Sk + E(Xk+1| S1 Sk) E(Xk+1| S1 Sk) lt 0

Strategier ved spil 15

E(X | X q) ndash SnP(q) lt 0 Sn gt E(X | X q) P(q) Det er ikke saeligrlig svaeligrt at udregne stopbetingelsen feks for q = 2 og q = 6 Nedenfor er vist udskriften fra et program som foretager beregningen for q = 212 Forventet gevinst i naeligste kast naringr ens skaeligbne er q q 2 3 4 5 6 7 8 9 10 11 12 694 683 667 644 617 583 589 600 617 639 667 Stop naringr din gevinst S gt EX(q)P(q) naringr skaeligbne er q q 2 3 4 5 6 7 8 9 10 11 12 25000 12300 8000 5800 4440 3500 4240 5400 7400 11500 24000

Som det fremgaringr er der endog meget stor forskel paring stoptiderne afhaeligngig af ens skaeligbne

23 Mandagschancen Dette spil er lidt mere interessant fordi det ikke er helt saring enkelt at gennemskue I dette tilfaeliglde kan man ikke forvente at den kortsigtede strategi vil foslashre til den optimale strategi At den faktisk goslashr det skyldes talvaeligrdierne Dette skal forstarings saringledes at hvis man aeligndrede paring praeligmiestoslashrrelserne ville Snell-strategien afvige fra den kortsigtede strategi Vi vil analysere spillet ved Snell-strategien Som naeligvnt har man i spillet 9 tildaeligkkede felter (101025255050100100250) Man kan afdaeligkke hoslashjest 3 felter Man faringr beloslashbet i 1000 kr som det sidste felt viser Hvis X er den stokastiske variabel som angiver vaeligrdien af et felt saring vil de fleste uden saring lange overvejelser vel fortsaeligtte hvis Xlt50 og standse hvis X100 Det kritiske er hvis man afdaeligkker 50 (X=50) Vi bemaeligrker foslashrst at summen af alle felterne er S=620 og at E(X) =6209=689 Vi opskriver foslashrst den fuldstaeligndige Snell-strategi for dette spil G3 =X3 Den Stokastiske variabel G3 = Gevinsten = X3 = vaeligrdien af det sidst afdaeligkkede felt G2 = max X2 E(G3| X1X2 ) Den stoslashrste af vaeligrdierne X2 (= vaeligrdien af det afdaeligkkede

felt) og den betingede middelvaeligrdi af G3 = X3 G1 = max X1 E(G2| X1 ) Som ovenfor Kriteriet for den optimale strategi er som tidligere Stop hvis paring noget trin Xk gt E(Gk+1| X1Xk ) Det er relativ nemt at opstille en formel for E(G3| X1X2 ) Naringr X1 og X2 er afdaeligkket er summen de resterende felter S - X1 - X2 Da alle felter har samme sandsynlighed er middelvaeligrdien simpelthen middeltallet af felterne E(G3| X1X2 ) = ( S - X1 - X2)(9-2)

Strategier ved spil 16

Det er noget mere teknisk at opstille en formel for E(G2| X1 ) og ogsaring lidt teknisk at foretage beregningen Vi vil noslashjes med at skitsere beregningen for en vaeligrdi af X1 og i oslashvrigt henvise til resultatet af et Computerprogram som kan ses nedenfor Lad os antage at X1 = 25 Vi lader nu X2 gennemloslashbe alle de mulige vaeligrdier (alle vaeligrdier skal taeliglles med det antal gange der er felter med denne vaeligrdi) For hver vaeligrdi af X2 (feks 50) skal vi vaeliglge max af X2 og E(G3| X1X2 ) = ( S - X1 - X2) (9-2) (= (620-50-25)7 = 778 i dette tilfaeliglde) og addere det til en sum S2 E(G2| X1 ) er da lig med S2(9-1) (da der er 9-1 felter X2 ) X2[1]= 1000 E(G3)= 8571 G2= 8571 X2[2]= 2500 E(G3)= 8357 G2= 8357 X2[3]= 5000 E(G3)= 8000 G2= 8000 X2[4]= 10000 E(G3)= 7286 G2= 10000 X2[5]= 25000 E(G3)= 5143 G2= 25000 X1[1]= 1000 E(G[2])= 10786 X2[1]= 1000 E(G3)= 8357 G2= 8357 X2[2]= 2500 E(G3)= 8143 G2= 8143 X2[3]= 5000 E(G3)= 7786 G2= 7786 X2[4]= 10000 E(G3)= 7071 G2= 10000 X2[5]= 25000 E(G3)= 4929 G2= 25000 X1[2]= 2500 E(G[2])= 10679 X2[1]= 1000 E(G3)= 8000 G2= 8000 X2[2]= 2500 E(G3)= 7786 G2= 7786 X2[3]= 5000 E(G3)= 7429 G2= 7429 X2[4]= 10000 E(G3)= 6714 G2= 10000 X2[5]= 25000 E(G3)= 4571 G2= 25000 X1[3]= 5000 E(G[2])= 10500 X2[1]= 1000 E(G3)= 7286 G2= 7286 X2[2]= 2500 E(G3)= 7071 G2= 7071 X2[3]= 5000 E(G3)= 6714 G2= 6714 X2[4]= 10000 E(G3)= 6000 G2= 10000 X2[5]= 25000 E(G3)= 3857 G2= 25000 X1[4]= 10000 E(G[2])= 9643 X2[1]= 1000 E(G3)= 5143 G2= 5143 X2[2]= 2500 E(G3)= 4929 G2= 4929 X2[3]= 5000 E(G3)= 4571 G2= 5000 X2[4]= 10000 E(G3)= 3857 G2= 10000 X1[5]= 25000 E(G[2])= 6268 Ser man resultaterne igennem kan de udmoslashntes i en simpel regel Fortsaeligt paring 50 eller derunder Stop paring 100 eller derover Det er maringske lidt overraskende at man ogsaring skal forsaeligtte paring 50000 hvis man kun har et forsoslashg tilbage ndash man kunne jo ende med 10000 og det er saring bare aeligrgerligt ndash og det er vist nok de fleste som standser ved 50000 - men det er ikke den bedste strategi

Strategier ved spil 17

24 Casino Som naeligvnt i indledningen til dette afsnit findes der ingen strategi som kan bringe en i stand til at vinde paring et Casino ndash i det lange loslashb Vil man goslashre Casino-spil til en levevej vil det altid med matematisk sikkerhed ende med ruin Det betyder imidlertid ikke at man ikke kan vinde ved at garing paring Casino men hvis man taelignker paring at spraelignge banken saring skal to krav i hvert fald vaeligre opfyldt for at der skal vaeligre en ikke forsvindende sandsynlighed for at det kan lade sig goslashre 1 Man skal have flere penge end Casino 2 Der maring ikke vaeligre loft over indsatserne Begge betingelser er som bekendt aldrig opfyldt Man kan som sagt godt vinde paring et Casino men hvis man satser paring at vinde mere (alle de gange man er paring Casino i sit liv) end det beloslashb man medbringer ved hvert besoslashg saring vil chancerne for at tabe det hele vaeligre stoslashrst Her er der tale om sandsynligheder og middelvaeligrdier ndash om odds Selvfoslashlgelig er de muligt at tabe hele sin formue ved foslashrste besoslashg eller vinde det tredobbelte ved det andet Der har i tidens loslashb vaeligret lanceret flere eksempler paring vinderstrategier som lyder uhyre besnaeligrende Den mest kendte er Martingale-systemet Man spiller kun paring sort og roslashd hvor faringr man faringr fordoblet sin indsats hvis man vinder Spillet er saringledes helt lige bortset fra at indsatserne bliver liggende naringr zero kommer ud og man kun faringr sin indsats en gang hvis man vinder i naeligste spil (zero har ingen farve) Spiller man efter Martingale-systemet skal man inkassere sin gevinst hvis man vinder Hvis man derimod taber skal man fordoble sin indsats Vi saeligtter grundindsatsen til 1 Har man spillet n gange og dermed doblet op n-1 gange har man lagt en indsats Sn = 1 + 2 + 22 +hellip2n-1 = 2n ndash1 Udregnet af kvotientraeligkkeformlen

1

10

q

qaS

n

n

for raeligkken Sn = a0 + a0q+ a0q

2+hellip+ a0qn-1

Vinder man det nte spil faringr man udbetalt 22

n-1 = 2n saring ens gevinst er 2n - (2n - 1) = 1 Der gaeliglder aringbenbart den simple kendsgerning at bliver man bare ved med at fordoble saring har man altid vundet eacuten indsats Foslashr man forsoslashger sig med dette skal man dog nok goslashre sig klart hvor mange gange man kan tabe foslashr man er ruineret

Strategier ved spil 18

Sandsynligheden for at man taber 5 spil er (frac12)5 = 132 Man har da tabt 25 ndash 1 gange vaeligrdien af en jeton (i Danmark 50 kr) dvs 1550 kr Vil man sikre sig bedre feks ved at kunne doble op 9 gange (sandsynligheden for at tabe 10 spil er 11024) saring skal man komme med kr 51150- men det kan man ikke engang gennemfoslashre da hoslashjeste indsats i Danmark er 24000- Man kunne imidlertid stille det sposlashrgsmaringl Hvis man har n-jetoner hvad er saring sandsynligheden for at vinde q-jetoner hvis man spiller efter Martingale-systemet Dette kan man faktisk godt udregne direkte men regningerne er ret omfattende Derimod er resultatet simpelt Vi vil ikke lave en direkte udregning men anvende de samme metoder som vi har anvendt for den bedste strategi Vi tager udgangspunkt i det faktum at sort roslashd Casino spil er et lige spil saring middelvaeligrdien af gevinsten er 0 ligegyldigt hvordan man spiller Middelvaeligrdien (som er nul ) af en gevinst paring q-jetoner er lig med q gange sandsynligheden P(q) for at vinde q jetoner minus ens kapital (n jetoner) gange med sandsynligheden for at man taber det sidste spil som er 1 ndash P(q)

qP(q) ndash n(1 ndashP(q)) = 0 qn

nqP

)(

Har man feks n = 31 jetoner (1550- kr) er sandsynligheden for at vinde q=10 (500 kr) lig med 0756 En rimelig stor sandsynlighed men altsaring stadig 25 chance for ruin Oslashnsker man derimod at blive rigtig rig og vinde 10000- kr dvs q=200 er P(200) = 0134 Konklusionen er den at satser man paring at vinde mere end man medbringer saring er sandsynligheden mindre end frac12 men kan man noslashjes med mindre saring er sandsynligheden stoslashrre end frac12 Men bemaeligrk dette gaeliglder fra foslashrste gang man garingr ind paring et Casino til man beslutter at holde op

25 Taeligndstikspillet Som beskrevet ovenfor garingr spillet ud paring at farve den ene af siderne roslashd paring 10 taeligndstikker Naringr taeligndstikken kasten op i luften er sandsynligheden for at den roslashde side vender opad naringr den rammer bordet lig med p=025 Man kaster paring skift 10 saringdanne taeligndstikker 10 gange For hvert kast skal man multiplicere antallet af roslashde med et af tallene 110 Hver tal maring kun bruges eacuten gang Den der faringr den stoslashrste sum har vundet Det er klart at en god strategi i det lange loslashb vil give en hoslashjere sum Vi minder om at antallet af X roslashde taeligndstikker er binomialfordelt med primaeligrsandsynlighed p og antalsparameter n=10

102104

3

4

110)(

10

jj

jXPjj

Strategier ved spil 19

Endvidere vil vi anvende de kumulerede sandsynligheder P(X j) og P(X j) Nedenfor er vist resultatet af en Computersimulation af spillet Primaeligr sandsynligheder for n= 10 og p= 0250 P(X=j) j 0 1 2 3 4 5 6 7 8 9 10 00563 01877 02816 02503 01460 00584 00162 00031 00004 00000 00000 Baglaeligns kumulerede sandsynligheder P(Xgt=q) j 0 1 2 3 4 5 6 7 8 9 10 10000 09437 07560 04744 02241 00781 00197 00035 00004 00000 00000 1 kast Antal = 2 Vaeliglg mellem 1 2 3 4 5 6 7 8 910 Faktor= 4 2 kast Antal = 4 Vaeliglg mellem 1 2 3 5 6 7 8 910 Faktor=10 3 kast Antal = 2 Vaeliglg mellem 1 2 3 5 6 7 8 9 Faktor= 5 4 kast Antal = 2 Vaeliglg mellem 1 2 3 6 7 8 9 Faktor= 3 5 kast Antal = 3 Vaeliglg mellem 1 2 6 7 8 9 Faktor= 8 6 kast Antal = 2 Vaeliglg mellem 1 2 6 7 9 Faktor= 6 7 kast Antal = 6 Vaeliglg mellem 1 2 7 9 Faktor=9 8 kast Antal = 3 Vaeliglg mellem 1 2 7 Faktor= 2 9 kast Antal = 2 Vaeliglg mellem 1 7 Faktor= 7 10 kast Antal = 2 Vaeliglg mellem 1 Faktor= 1 Din score er 176 Valget af tallene 110 er i dette tilfaeliglde foretaget ud fra den optimale strategi som vi vil omtale om et oslashjeblik Foslashr vi analyserer den optimale strategi for dette spil vil vi forsoslashge os med en intuitiv bedste strategi Vi belyser denne strategi med et konkret eksempel Lad os feks antage at vi slaringr 4 roslashde i den 3 kast (3 forsoslashg) De tal vi har tilbage kalder vi (y8 y7 y6 y5 y4 y3 y2 y1) Sposlashrgsmaringlet om vi skal gange med det stoslashrste y8 eller det naeligststoslashrste y7 osv Vi raeligsonnerer da som foslashlger Hvis sandsynligheden for at slaring mere end 4 roslashde i de resterende 7 kast er stoslashrre end frac12 saring skal vi vaeliglge det naeligststoslashrste Vi skaeligrper dette Hvis sandsynligheden for at slaring mindst 5 roslashde mindst en gang i de resterende 7 kast er stoslashrre end frac12 saring skal vi vaeliglge det naeligststoslashrste Tilsvarende hvis sandsynligheden for at slaring mindst 5 roslashde mindst 2 gange i de resterende 7 kast skal vi vaeliglge det 3 stoslashrstehellipog saringdan fremdeles Strategien virker umiddelbart meget plausibel Sandsynlighederne kan direkte farings af binomialfordelingen Foslashrst sandsynligheden for at faring mindst q-roslashde i et kast Dette er

P(X q) =

n

qj

jXP )( hvor P(X = j) er angivet ovenfor

Strategier ved spil 20

Sandsynligheden for at dette sker mindst r gange i n - k kast er ogsaring en binomialfordeling og kan skrives

P(X q mindst r gange i n - k kast ) = jknjkn

rj

qXPqXPj

kn

))(1()(

Beregningen af disse (110) sandsynligheder goslashres nok lettest paring en computer For at lave en strategi-tabel goslashr man det at for hvert kast og hvert antal mulige roslashde vaeliglger man foslashrst det stoslashrste af de resterende tal Dernaeligst beregner man sandsynligheden for at faring mindst 1 roslashd mere i et af de foslashlgende kast Hvis denne sandsynlighed er stoslashrre end frac12 ser man paring det naeligststoslashrste af de resterende tal Man beregner saring sandsynligheden for at faring mindst 1 roslashd mere i mindst to af de resterende kast Hvis denne sandsynlighed er stoslashrre end frac12 saring vaeliglger man det tredjestoslashrste af de resterende tal og saringdan fremdeleshellip Det bemaeligrkes at beregningen skal initialiseres med at man altid vaeliglger det mindste hvis man slaringr 0 roslashde og altid vaeliglger det stoslashrste hvis man slaringr 10 roslashde Nedenfor er vist en computerberegning af en strategi-tabel Endvidere er ogsaring lavet en saringkaldt Monte-Carlo simulation Dette betyder at man har ladet maskinen spille feks 10000 spil spillet efter strategi-tabellen Nederst er vist hyppighederne for ens score og endelig fordelingsfunktionen for observationerne (Den kumulerede frekvens) P(X =j) for n =10 and p = 0250 j 0 1 2 3 4 5 6 7 8 9 10 P(X =j)0056 0188 0282 0250 0146 0058 00162 0003 00004 0000 0000 P(Xgt=j) for n =10 and p = 0250 j 0 1 2 3 4 5 6 7 8 9 10 P(Xgt=j) 1000 0944 0756 0474 0224 0078 00197 00035 00004 0000 0000 Strategi tabel Tallene refererer ikke til faktorene selv men til den stoslashrste naeligststoslashrste osv Eksempel Hvis man slaringr 3 roslashde i den andet kast saring skal man vaeliglge (7) den tredjestoslashrste Kast no 1 2 3 4 5 6 7 8 9 10 score 0 1 1 1 1 1 1 1 1 1 1 1 3 3 3 2 2 2 2 1 1 1 2 6 5 5 4 4 3 3 2 2 1 3 8 7 7 6 5 4 3 3 2 1 4 9 9 8 7 6 5 4 3 2 1 5 10 9 8 7 6 5 4 3 2 1 6 10 9 8 7 6 5 4 3 2 1 7 10 9 8 7 6 5 4 3 2 1 8 10 9 8 7 6 5 4 3 2 1 9 10 9 8 7 6 5 4 3 2 1 10 10 9 8 7 6 5 4 3 2 1 Gennemsnitlig score = 16437

Strategier ved spil 21

Hyppighed af score h( 75)= 1 h( 80)= 7 h( 85)= 3 h( 90)= 5 h( 95)= 6 h(100)= 34 h(105)= 38 h(110)= 82 h(115)= 68 h(120)=161 h(125)=146 h(130)=320 h(135)=280 h(140)=534 h(145)=425 h(150)=752 h(155)=577 h(160)=878 h(165)=645 h(170)=956 h(175)=651 h(180)=863 h(185)=527 h(190)=609 h(195)=351 h(200)=389 h(205)=180 h(210)=203 h(215)= 93 h(220)= 86 h(225)= 47 h(230)= 32 h(235)= 21 h(240)= 13 h(245)= 8 h(250)= 3 h(255)= 0 h(260)= 4 h(265)= 1 h(270)= 1 h(275)= 0 h(280)= 0 Frekvens of score F( 80)=00008 F( 85)=00011 F( 90)=00016 F( 95)=00022 F(100)=00056 F(105)=00094 F(110)=00176 F(115)=00244 F(120)=00405 F(125)=00551 F(130)=00871 F(135)=01151 F(140)=01685 F(145)=02110 F(150)=02862 F(155)=03439 F(160)=04317 F(165)=04962 F(170)=05918 F(175)=06569 F(180)=07432 F(185)=07959 F(190)=08568 F(195)=08919 F(200)=09308 F(205)=09488 F(210)=09691 F(215)=09784 F(220)=09870 F(225)=09917 F(230)=09949 F(235)=09970 F(240)=09983 F(245)=09991 F(250)=09994 F(255)=09994 F(260)=09998 F(265)=09999 F(270)=10000 F(275)=10000

Som det fremgaringr af tabellen for P(X gt= j) er der kun 78 chance for at slaring 5 roslashde eller derover saring goslashr man det skal man altid vaeliglge det stoslashrste af de resterende tal For 3 eller 4 roslashde er situationen langt mere uigemmeskuelig og kun en beregning kan afgoslashre sagen Vi proslashver nu at finde den optimale strategi eller Snell-strategien Hvad angaringr sposlashrgsmaringlet om hvorvidt vi skal vaeliglge den stoslashrste eller naeligststoslashrste saring lader det sig faktisk goslashre at beregne Snell-strategien paring en computer De foslashlgende tilfaeliglde bliver derimod for komplicerede og der anvender vi en svagt forbedret version af vores intuitive strategi Forbedringen bestaringr i foslashlgende idet vi illustrerer det med et eksempel Lad os sige vi har slaringet 3 roslashde og vi overvejer om vi vil gange det med 7 eller 6 Ganger vi med 6 er det fordi vi forventer at slaring mindst 4 roslashde mindst en gang i de resterende kast Vores score vil vaeligre 73 og 74 henholdsvis og scoren vil blive forbedret med en faktor 43 hvis vi ganger med 6 under forventning af at slaring 4 roslashde Vores forbedring af strategien garingr da ud paring at vi vaeliglger det naeligststoslashrste 6 hvis sandsynligheden for at slaring 4 roslashde gange den relative forbedring 43 er stoslashrre end frac12 Vi rekapitulerer dernaeligst Snell-strategien G10 = X10 X10 Stokastisk variabel = antallet af roslashde i det 10 kast G9 = max X9 E(G10) E(G10) = E(X10) = np=10025 = 25 X9 = 01hellip10 Gk = max Xk E(Gk+1) E(Gk) kraeligver en laeligngere udregning men den udregnes som en

almindelig middelvaeligrdi altsaring som max af de to vaeligrdier gange P(X=Xk-1) G1 = max X1 E(G2) Som eksempel udregner vi E(G9) Da E(G10)=25 skal vi for X9 = 012 anvende E(G10)=25 i udregningen

Strategier ved spil 22

E(G9) = 25 (P(X=0)+P(X=1)+P(X=2))+ 3P(X=3)+hellip+10P(X=10) =306 Vaeligrdierne for E(Gk) er alle udregnet og vist i computerberegningen nedenfor Bemaeligrk isaeligr at de vokser fra 25 til 425 naringr k aftager fra 10 til 2 Strategien er nu foslashlgende Vaeliglg det stoslashrste af de resterende tal hvis Xk gt E(Gk+1) (altsaring det antal man har slaringet er er stoslashrre end det forventede stoslashrste antal) ellers vaeliglg det naeligststoslashrste Ved afgoslashrelsen om de 3 stoslashrste 4 stoslashrste osv anvender vi den hidtidige strategi med den modifikation at vi multiplicerer sandsynligheden med den formodede relative forbedring E(G10-kast)antal roslashde En computerberegning helt svarende til den foregaringende men med den aeligndrede strategi er vist nedenfor Man bemaeligrker for det foslashrste de smaring aeligndringer der er i strategien Den nye strategi er lidt mindre forsigtig men den giver altsaring ogsaring pote i form af en forbedring af gennemsnittet paring ca 275 Primaeligr sandsynligheder P(X=j) for n= 10 og p= 0250 j 0 1 2 3 4 5 6 7 8 9 10 P(X=j)0056 0188 0282 0250 0146 0058 0016 00031 00004 00000 00000 Baglaeligns Kumulerede sandsynligheder P(Xgt=j) j 0 1 2 3 4 5 6 7 8 9 10 P(Xgt=j) 1000 0944 0756 0474 0224 0078 00197 00035 00004 00000 00000 E(G[10])= 250 E(G[9])= 306 E(G[8])= 337 E(G[7])= 362 E(G[6])= 380 E(G[5])= 395 E(G[4])= 406 E(G[3])= 416 E(G[2])= 425 kast nr 1 2 3 4 5 6 7 8 9 10 score 0 1 1 1 1 1 1 1 1 1 1 1 2 2 1 1 1 1 1 1 1 1 2 5 4 4 3 3 3 2 2 1 1 3 8 7 6 5 5 4 3 2 2 1 4 9 8 7 7 6 5 4 3 2 1 5 10 9 8 7 6 5 4 3 2 1 6 10 9 8 7 6 5 4 3 2 1 7 10 9 8 7 6 5 4 3 2 1 8 10 9 8 7 6 5 4 3 2 1 9 10 9 8 7 6 5 4 3 2 1 10 10 9 8 7 6 5 4 3 2 1 Gennemsnitlig gevinst ms = 16727 Hyppigheder af score h( 75)= 1 h( 80)= 1 h( 85)= 0 h( 90)= 3 h( 95)= 2 h(100)= 5 h(105)= 4 h(110)= 9 h(115)= 12 h(120)= 12 h(125)= 17 h(130)= 22 h(135)= 28 h(140)= 39 h(145)= 24 h(150)= 49 h(155)= 54 h(160)= 74 h(165)= 63 h(170)=117 h(175)= 63 h(180)= 91 h(185)= 57 h(190)= 72 h(195)= 39 h(200)= 36 h(205)= 35 h(210)= 29 h(215)= 14 h(220)= 21 h(225)= 1 h(230)= 5 h(235)= 1 h(240)= 0 h(245)= 0 h(250)= 0 h(255)= 0 h(260)= 0 h(265)= 0 h(270)= 0 h(275)= 0 h(280)= 0

Strategier ved spil 23

Frekvens af score F( 80)=00020 F( 85)=00020 F( 90)=00050 F( 95)=00070 F(100)=00120 F(105)=00160 F(110)=00250 F(115)=00370 F(120)=00490 F(125)=00660 F(130)=00880 F(135)=01160 F(140)=01550 F(145)=01790 F(150)=02280 F(155)=02820 F(160)=03560 F(165)=04190 F(170)=05360 F(175)=05990 F(180)=06900 F(185)=07470 F(190)=08190 F(195)=08580 F(200)=08940 F(205)=09290 F(210)=09580 F(215)=09720 F(220)=09930 F(225)=09940 F(230)=09990 F(235)=10000 F(240)=10000 F(245)=10000 F(250)=10000 F(255)=10000 F(260)=10000 F(265)=10000 F(270)=10000 F(275)=10000

Maringske er det ikke en saeligrlig imponerende forbedring fra den foslashrste strategi men det er en teoretisk milepaeligl at man er i stand til at angive den bedste strategi for bestemte typer af spil Som omtalt har vi ikke forsoslashgt at bevise at Snell-Strategien er den optimale Strategi men det kan bevises Det er vigtigt at notere sig at i alle de omtalte spil har udfaldene vaeligre stokastiske variable dvs uforudsigelige men med bestemte sandsynligheder og at disse sandsynligheder ikke bliver aeligndret af den strategi man foslashlger I mange af de spil hvor man ofte moslashder begrebet strategi feks skak krig finansmarked og markedsfoslashring er dette langt fra tilfaeligldet Hvis feks alle boslashrsspekulanter fulgte den samme optimale strategi med boslashrskursen som stokastisk variabel ville det nok vise sig at det var den daringrligste strategi af alle Teorien for dynamiske strategier hvor de stokastiske variable er funktioner af tiden og af den valgte strategi er teoretisk naeligsten ufremkommelige

Strategier ved spil 24

Indeks Casino516 Computersimulation18 definitionen af sandsynlighed 1 Den optimale Snell-strategi11 forsikringsmatematik 5 Indbrudstyvens pensionsproblem912 kortsigtede strategi 10 kumulerede frekvens 19 langsigtede strategi 10 lotto 1 Mandagschancen14 Mandags-chancen9 Martingale-systemet16

Optimale Strategier 10 Poker 3 rekursionsligning 6 roulette 57 Roulette spil 10 roulettespiller 7 ruinsandsynligheder 5 Skaeligbnen913 Snell-strategien 11 Stopbetingelsen11 strategi9 Taeligndstikspillet1018

Page 4: Sandsynligheder og strategier ved spil - Ole Witt-Hansen ...olewitthansen.dk/Matematik/Sandsynligheder_og_strategier_ved_spil… · 6dqgv\qoljkhghu yhg vslo 3n vdpph pngh ndq yl ilqgh

Sandsynligheder ved spil 2

Paring samme maringde kan vi finde sandsynligheden for 6 rigtige idet antal gunstige er K(76) gange med antal maringder rdquodet forkerte talrdquo kan vaeliglges paring nemlig 36 ndash7 ndash1 = 28 maringder idet det forkerte tal hverken maring vaeligre et af de 7 rigtige eller et tillaeliggstal P(6 rigtige) =K(76)28K(367) = 196p7 = 2347910-5 Sandsynligheden for 5 rigtige tal findes som antallet af maringder at udtage 5 rigtige ud af 7 lig med K(75) gange antallet af muligheder for de to sidste tal som kan vaeliglges blandt 36 - 7 = 29 tal Dette antal er K(292) P(5 rigtige) = K(75)K(292)K(367) = 8526p7 = 10210-3 =102 Paring helt samme maringde opskriver vi sandsynligheden for 4 rigtige idet de gunstige er K(74) K(293) nemlig 4 rigtige udvalgt blandt 7 gange 3 rdquoforkerterdquo udvalgt blandt 29 P(4 rigtige) = K(74)K(293)K(367) = 127890p7 = 00153 = 153 Af ovenstaringende fremgaringr at chancen for at faring mere end 4 rigtige er uhyre ringe Til gengaeligld er der en rimelig chance for at faring 4 rigtige Dette er gjort helt bevidst for dem der har planlagt spillet Erfaringen viser nemlig at hvis man aldrig vinder holder man op med at spille efter en vis tid Lad os antage at man hver uge udfylder en kupon med 10 raeligkker Foslashrst udregner vi chancen for at faring 4 rigtige paring mindst eacuten af kuponerne Haeligndelsen 4 rigtige er binomialfordelt med antalsparameteren n =10 For at finde denne sandsynlighed udregner vi foslashrst sandsynligheden for den komplementaeligre haeligndelse Ikke 4 rigtige paring nogen af kuponerne P(Ikke 4 rigtige paring nogen af kuponerne) = (1-p4)

10 = 0984710 =08557 P(4 rigtige paring mindst eacuten af kuponerne) = 1 - P(Ikke 4 rigtige paring nogen af kuponerne) = 01443 Man har altsaring knap 15 chance for at faring 4 rigtige paring mindst en af de 10 raeligkker Antager vi nu at man spiller 10 raeligkker i 5 uger vil vi udregne sandsynligheden for at man ikke faringr 4 rigtige paring nogen af de 5 uger P(ikke 4 rigtige i 5 uger)= 085575 = 04487 Der er saringledes godt 50 chance for at man faringr 4 rigtige mindst en gang paring 5 uger Det er formodentlig det som holder spillet i gang Vinder man faringr man udbetalt ca 40 kr som kan sammenlignes med udgiften til en kupon 540 =200 kr Middelgevinsten paring en kupon til 40 kr hvis vi kun ser paring 4 rigtige og saeligtter praeligmien 40 kr er -40∙P(ikke 4 rigtige paring de 10 kuponer) + 40∙P(4 rigtige) = -40∙ 08557+40∙01443 = -285 kr

Sandsynligheder ved spil 3

oslashvelser 1 Udregn hvor mange uger man skal spille 10 raeligkker for at der er mere end 50 chance for at

vinde 4 praeligmie (5 rigtige) Opgaven skal loslashses med logaritmer 2 Forsoslashg at udregne samme som ovenfor blot med en 1 praeligmie 3 En udfyldt raeligkke paring 7 tal daeligkker aringbenbart over K(74)K(292) forskellige raeligkker med 4

rigtige Hvor mange raeligkker skal man mindst udfylde for at vaeligre sikker paring at faring 4 rigtige

2 Poker Vi antager at Poker spilles med et almindeligt spil kort og at hver spiller faringr 5 kort fra begyndelsen Vi vil ikke beskaeligftige os med at koslashbe nye kort da det er alt for kompliceret men kun udregne sandsynlighederne for de forskellige kombinationer af kort der kan slaring hinanden Flush betyder i Poker sammenhaeligng 5 kort i samme farve og Straight betyder 5 kort i raeligkkefoslashlge Rangfoslashlgen af kortfarverne er i oslashvrigt de samme som i Bridge Spar Hjerter Ruder Kloslashr Rangfoslashlgen af kortkombinationer i Poker er foslashlgende Royal Flush De 5 hoslashjeste kort i samme farve Feks es konge dame knaeliggt 10 i ruder Straight Flush 5 kort i raeligkkefoslashlge i samme farve Fire ens 4 ens kort (5 kort underordnet) Full House 3 ens + 2 ens (et par) Flush 5 kort i samme farve Straight 5 kort i raeligkkefoslashlge Tre ens tre ens kortvaeligrdi To par 2 ens + 2 ens Et par 2 ens Hoslashjeste kort Sandsynlighederne for hver af disse kortkombinationer kan udregnes idet de mulige kombinationer af 5 kort udtaget af 52 er K(525) = 2598960 Royal Flush Der er 4 forskellige Royal Flush ndash en i hver farve

P(Royal flush) = )552(

4

K 615610-6

Straight Flush Der kan i hver af de 4 kortfarver laves 9 forskellige Straight Flush En af dem er Royal

P(Straight Flush) =)532(

32

)552(

)19(4

KK

= 492510-5

Sandsynligheder ved spil 4

Fire ens Der er 13 forskellige muligheder for fire ens Det femte kort kan vaeliglges paring 52 - 4 = 48 forskellige maringder

P(4 ens) =

)552(

624

)552(

4813

KK240110-4

Full House Der er 13 forskellige muligheder for 3 ens De 3 kan udtages paring K(43) forskellige maringder De to ens maring noslashdvendigvis have en anden talvaeligrdi hvoraf resultatet foslashlger

P(Full House 3 ens + 2 ens) =

)552(

3744

)552(

)24(12)34(13

KK

KK140010-3

Flush 5 kort i samme farve kan udtages paring K(135) maringder Der er 4 kortfarver Vi maring subtrahere Straight Flusher fra

P(Flush 5 i samme farve) = 3109671)552(

5112

)552(

432)513(4

KK

K

Straight Der er 13 - 4 = 9 forskellige raeligkkefoslashlger Hver af de 5 kortvaeligrdier kan vaeliglges blandt 4 farver Vi skal fratraeligkke Straight Flush

P(Straight 5 i raeligkkefoslashlge) = 35

10533)552(

9180

)552(

3649

KK

Tre ens Der er 13 kortvaeligrdier og der skal udvaeliglges 3 De sidste to kort kan udvaeliglges blandt 52 - 4 = 48 kort (ikke 49 da det kunne give 4 ens) Vi maring dog fratraeligkke de 12K(42) par der kan dannes og som ville give Full House

P(3 ens) = 2101132)552(

54912

)552(

))24(12)248(()34(13

KK

KKK

To par Foslashrst udregnes antallet af muligheder for de to par Faktoren frac12 skyldes at man ved denne optaeliglling taeligller de mulige kombinationer Et par feks (spar dame hjerter dame) vil baringde vaeligre at finde blandt de 13K(42) og de 12K(42) muligheder Det sidste kort kan vaeliglges blandt 52 ndash 8 som danner de to par

P(2 par) = 210754)552(

552123

)552(

)852)(24(12)24(1321

KK

KK

Et par De foslashrste 3 faktorer i taeliglleren er antallet af maringder at faring et par paring Vi bliver noslashdt til at subtrahere mulighederne for 2 par og Full House

P(1 par) = 47010)552(

1221781

)552(

3755552123)348()24(13

KK

KK

Sandsynligheder ved spil 5

Hermed har vi afsluttet vores gennemgang af sandsynlighederne i Poker Bemaeligrk at sandsynlighederne foslashlger rangen af en Pokerharingnd

3 Ruinsandsynligheder ved Roulette mv Beregningen af ruinsandsynligheder er noget som er helt afgoslashrende for forsikringsvirksomhed hvis denne skal drives forretningsmaeligssigt Sammenhaeligngen mellem ruinsandsynligheder og beregning af praeligmiestoslashrrelserne en ret kompliceret matematisk teori som betegnes forsikringsmatematik Paring universiteterne findes en saeligrlig uddannelse som kaldes aktuar studiet som har dette som speciale Forsikringsmatematik kan illustreres ved at betragte roulettespil paring et Casino En roulette har 37 felter nummereret 0 ndash 36 Hvis man vinder paring et felt faringr man udbetalt 36 gange indsatsen Da man har lagt en indsats er gevinsten 35 indsatser Hvis X er den stokastiske variabel som betegner en spillers gevinst saring antager X vaeligrdierne +35 med sandsynlighed 137 og ndash1 med sandsynlighed 3637

P(X = 35) = 137 og P(X = -1) = 3637 Middelgevinsten naringr man spiller paring et felt er foslashlgelig

(31) 37

1

37

36)1(

37

135)()()(

Uu

uPuXXE

Hvis spilleren i stedet vaeliglger at spille paring m felter antager gevinsten X vaeligrdierne 36 - m med sandsynlighed m37 og ndashm med sandsynligheden (37 - m)37 = 1 - m37 Middelgevinsten bliver herefter

37

)37

1)((37

)36()()()(mm

mm

muPuXXEUu

Middelgevinsten pr indsats er saringledes uafhaeligngig af hvor mange felter man spiller paring Hermed er det slaringet fast Der findes intet system der kan bringe eacuten i stand til at vinde paring en roulette paring laeligngere sigt Dette er en simpel matematisk kendsgerning som mange har maringttet erkende paring en betydelig mere smertelig maringde Specielt hvis man spiller paring m = 18 felter er gevinsten 36-18=18 med sandsynlighed 1837 og ndash18 med sandsynlighed 1937 Selvom en spiller ikke kan vinde i det lange loslashb har spilleren paring grund af tilfaeligldigheder (som spillere foretraeligkker at kalde held) mulighed for at vinde betragtelig store beloslashb Vi vil nu lave nogle betragtninger over hvor stor sandsynlighed en spiller har for at spraelignge banken dvs at ruinere et Casino En saringdan beregnet sandsynlighed kaldes for ruin sandsynligheden

Ruinsandsynligheder 6

Vi antager at Banken raringder over n-enheder (indsatser) Vi oslashnsker at vurdere sandsynligheden for at en uendelig rig spiller der goslashr den samme indsats i hvert spil vinder n eller flere enheder naringr der ikke er nogen begraelignsning paring antallet af spil Ruinsandsynligheden for banken betegner vi rn Hvis X1 X2 X3 betegner Casinorsquoets gevinst ved de enkelte spil er

Gk = X1 + X2 +X3++Xk gevinsten efter k-spil Ruinsandsynligheden kan derfor formuleres derhen at

rn = P( 0kG for et eller andet k)

(Der er ingen umiddelbar sammenhaeligng mellem n og k) Der gaeliglder rekursions-formlen

rn+1 = rn r1

som udtrykker at sandsynligheden for at blive ruineret med n+1 enheder er lig sandsynligheden for at blive ruineret med n enheder gange sandsynligheden for at blive ruineret med eacuten enhed Dette fordi vi antager at hvert spil er uafhaeligngigt af de oslashvrige Heraf foslashlger umiddelbart

r2 = r1+1 = r1 r1 = r12 r3 = r2+1 = r2 r1 = r1

3 og foslashlgelig

rn = r1n

For at beregne en ruinsandsynlighed ser vi foslashrst paring tilfaeligldet hvor en spiller saeligtter sin indsats paring 18 felter pr spil Her er Casinorsquoets gevinst +18 eller ndash18 pr spil For nemheds skyld saeligtter vi de 18 indsatser til at vaeligre en enhed = 1 Vi opstiller da foslashlgende rekursionsligning som tager udgangspunkt i det foslashrste spil Sandsynligheden for at banken bliver ruineret med n enheder er lig med Sandsynligheden for at banken vinder det foslashrste spil (hvor den vinder en enhed) gange sandsynligheden for at banken bliver ruineret med n+1 enheder plus sandsynligheden for at banken taber det foslashrste spil (hvor den mister en enhed) gange sandsynligheden for at banken bliver ruineret med n-1 enheder Sandsynlighederne for at banken vinder og taber er 1937 og 1837 Vi kan da opstille ligningen

1

1

1

1111 37

18

37

19

37

18

37

19 nnn

nnn rrrrrr

For at opnaring det sidste udtryk har vi anvendt resultatet af rekursionsligningen rn = r1

n Det er relativt nemt at bestemme r1 ud fra denne ligning Ved division af ligningen med r1

n-1 faringr man

Ruinsandsynligheder 7

018371937

18

37

191

21

211

rrrr

Den sidste 2gradsligning kan loslashses paring normal vis idet diskriminanten d =372 ndash 4middot19middot18 = 1 saring

119

18

38

36

192

137111

rrr

Vi er kun interesseret i loslashsningen r1 = 1819

Ifoslashlge ovenstaringende er nrr nn )

19

18(1

Vi vil herefter besvare sposlashrgsmaringlet Hvor mange enheder skal banken have for at der er mindre end 1 chance for ruin Dette er ensbetydende med at loslashse ligningen

1785)

19

18ln(

)010ln(010)

19

18( nn

Husker vi at en enhed svarede til 18 indsatser giver dette beskedne 1533 indsatser Hvis en spiller derimod spiller paring saeligdvanlig vis med kun at placere en indsats paring eacutet felt er dette - lidt overraskende ndash betydelig mere risikabelt for banken Vi opstiller igen en rekursionsligning med udgangspunkt i det foslashrste spil Sandsynligheden for at banken bliver ruineret med n enheder er lig med Sandsynligheden for at banken vinder det foslashrste spil (hvor den vinder en enhed) gange sandsynligheden for at banken bliver ruineret med n+1 enheder plus sandsynligheden for at banken taber det foslashrste spil (hvor den mister 35 enhed) gange sandsynligheden for at banken bliver ruineret med n-35 enheder Sandsynlighederne for at banken vinder og taber er 3637 og 137 Vi kan da opstille ligningen

351

111351 37

1

37

36

37

1

37

36 nnn

nnn rrrrrr

Ved division med (r1)

n-35 og omordning af leddene og ved at saeligtte r1 = x faringr man ligningen

36x36 ndash 37x35 +1 = 0 Denne ligning kan kun loslashses ved numeriske metoder og man finder loslashsningen x = 09984 Hvis vi igen stiller sposlashrgsmaringlet Hvor mange indsatser skal banken raringde over for at der er mindre end 1 chance for ruin skal vi loslashse ligningen

Ruinsandsynligheder 8

2876)99840ln(

)010ln(010)99740( nn

Altsaring en betydelig stoslashrre beholdning end hvis spilleren spiller paring 18 felter Forsoslashger vi at udregne ruinsandsynligheden for en spiller der har n enheder og laeliggger sin indsats paring eacutet felt kommer vi efter helt det samme raeligsonnement frem til foslashlgende rekursionsligning

35137

11137

36

37

1

37

361351

nn rrrrrr

nnnn

som foslashrer til ligningen x36 ndash 37x +36 = 0 Denne ligning har kun loslashsningen x = 1 Differentieres nemlig f(x) =x36 ndash 37x +36 finder man f (x) =36x35 ndash 37 Ligningen f (x) =0 har

loslashsningen 136

3735 x Da f (x) lt 0 for x lt 1 har den ingen roslashdder mindre end 1

Ruin-sandsynligheden for en spiller der garingr paring et Casino som har en ubegraelignset beholdning er 1 Saring vi kan endnu engang fastslaring at hvis man fortsaeligtter med at spille paring et Casino vil man altid blive ruineret i det lange loslashb Man kunne selvfoslashlgelig overveje ruinsandsynlighederne hvis Casino har beholdningen n og en spiller har beholdningen m (n gt m eller omvendt) men svaret vil afhaelignge af n og m og de indgaringende to ulineaeligre ligninger med to ubekendte med meget hoslashje eksponenter er ikke saring nemme at loslashse numerisk ndash selv paring en Computer Hvis n gtgt m vil svaret stort set vaeligre det samme

Strategier ved spil 9

Kap 2 Strategier ved spil

1 Forskellige spil Efter at have udregnet vindersandsynligheder i forbindelse med spil skal vi nu se paring noget andet som ogsaring er knyttet sammen med sandsynlighedsregningen nemlig problemet med at fastlaeliggge den bedste strategi naringr man spiller et spil Her skal spil imidlertid forstarings i en meget videre betydning det vaeligre sig krig boslashrsspekulation jagt eller fiskeri paring en bestemt dyreart Sidstnaeligvnte er dog alt for komplicerede til at kunne behandles elementaeligrt Faeliglles er det dog at man skal kunne beregne sandsynligheden for en bestemt konsekvens af et givet traeligk Vi vil begynde med at give nogle meget simple eksempler paring spil hvor det er meningsfuldt at tale om optimal strategi Vendingen den optimale strategi indebaeligrer at spillet afvikles i et endeligt antal trin og at der for hvert trin i spillet er mulighed for at forbedre sin gevinst og mulighed for at miste sin gevinst helt eller delvis Man skal endvidere have mulighed for at standse spillet ved ethvert trin og inkassere sin gevinst

11 Mandags-chancen I dette spil som har vaeligret lanceret af TV2 har man en raeligkke tildaeligkkede felter med beloslashb (101025255050100100250) x 1000 kr Man har maximalt 3 forsoslashg Man faringr beloslashbet paring det sidst afdaeligkkede felt Nedenfor er vist en computer simulation af spillet efter 2 traeligk Det er nok klart at hvis man afdaeligkker et felt med 10 i 1 eller 2 forsoslashg skal man fortsaeligtte eller hvis man afdaeligkker et felt med 100 eller 250 i 1 eller 2 forsoslashg skal man standse Men hvad hvis man afdaeligkker et felt med 50 i 1 eller 2 forsoslashg Det vil vi forsoslashge at afgoslashre ved nogle mere matematiske betragtninger

12 Skaeligbnen Et spil som vist nok kommer fra orienten Det spilles med to terninger Foslashrst slaringr man et slag med de to terninger og summen af deres oslashjental betegnes skaeligbnen

Strategier ved spil 10

Man kan nu slaring lige saring mange gange man vil (max 100) Hvis oslashjentallene ikke er lig skaeligbnen saring adderes dette til ens pointtal men hvis man slaringr sin skaeligbne mister man alt Nedenfor er vist et trin i en animeret computer simulation af spillet Naringr spillet er standset fordeler man indsatsen i forhold til spillernes opnaringede pointtal Det gaeliglder derfor om at have de stoslashrste pointtal Problemet er imidlertid hvornaringr det er optimalt at standse naringr man kender sin skaeligbne

13 Indbrudstyvens pensionsproblem Dette er en variant af mange forskellige optimeringsproblemer Arthur er indbrudstyv Hver tyvetugt giver i snit K kr Chancen for at Arthur bliver snuppet er p Hvis han bliver taget mister han alt fra sine tidligere tyvetugter Hvor mange indbrud skal Arthur lave foslashr han standser sin karriere og vaeliglger at leve af sin opsparing

14 Taeligndstikspillet Dette spil falder lidt uden for rammerne af de oslashvrige spil fordi man ikke kan standse spillet og fordi man aldrig kan miste noget af sin gevinst Det kan derfor ikke umiddelbart behandles paring samme maringde som de hidtil naeligvnte spil Alligevel er det et spil der udpraeligget kan behandles med matematiske teorier for den bedste strategi Spillet garingr ud paring at man paring 10 taeligndstikker farver den ene side roslashd Kastes taeligndstikken op er sandsynligheden for at den farvede side vender opad naringr den lander paring bordet lig med p = 025 Hver spiller har fra starten tallene 110 Hvert tal maring kun bruges 1 gang Man skiftes til at kaste de 10 taeligndstikker og notere antallet af farvede taeligndstikker Dette antal skal saring ganges med et af de resterende tal 110 Den som efter 10 spil har den hoslashjeste sum har vundet Det kan oplyses og let verificeres at den maximale gevinst er 550 Middelgevinsten hvor man vaeliglger tilfaeligldig er 1375 og den optimale middelgevinst er ca 167

Strategier ved spil 11

15 Casino Roulette spil falder ogsaring lidt uden for rammerne af optimale strategier af den meget simple grund at odds er svagt imod eacuten Det gaeliglder dog ikke for Blackjack hvor man kan udvikle en strategi som giver en svag fordel Hvis odds er imod eacuten vil man imidlertid altid tabe i det lange loslashb Som tidligere fastslaringet er den eneste mulighed - i det lange loslashb - for at undgaring ruin i roulettespil at der ikke er nogen oslashvre graelignse for indsatser og at man har flere penge end Casionorsquoet og ingen af disse to betingelser er nogensinde opfyldt Enhver fornuftig matematisk spil-teori vil derfor som resultat have at man skal standse foslashr det foslashrste spil Det vil sige Man skal lade vaeligre med at garing paring Casino Denne kendsgerning udelukker dog ikke at man kan goslashre sig overvejelser over hvordan man kan spille hvis man ikke udelukkende er interesseret i at foraeligre sine penge til et Casino uden kamp

2 Optimale Strategier Hvis man intuitivt skal formulere en strategi for de 3 foslashrste spil naeligvnt ovenfor saring kan man feks vaeliglge eacuten af 3 foslashlgende strategier 1 Man beslutter paring forharingnd hvor stor ens gevinst (eller tab) skal vaeligre foslashr man stopper Dette er

faktisk en meget almindelig strategi men den er bestemt ikke optimal 2 Man fortsaeligtter saring laelignge man i middel har mulighed for at foroslashge sin gevinst i naeligste spil Man

skal huske paring at middelvaeligrdien af gevinsten ogsaring omfatter tab saring middelvaeligrdien (i matematisk forstand) skal vaeligre positiv Denne umiddelbart fornuftige strategi kaldet den kortsigtede eller myope strategi er i mange tilfaeliglde ogsaring den optimale strategi (dog ikke i mandagschancen)

3 Man fortsaeligtter saring laelignge man i middel har mulighed for at foroslashge sin gevinst i et af de

efterfoslashlgende spil Denne strategi kaldes den langsigtede strategi Baringde den kortsigtede og den langsigtede strategi ser yderst rimelige ud og de vil ogsaring vaeligre optimale for langt de fleste spil Hvis der er forskel paring den langsigtede og den kortsigtede strategi skal man anvende den langsigtede - naturligvis Der findes imidlertid visse former for spil hvor ingen af strategierne er optimale Det gaeliglder feks for boslashrsspekulanter der har en beholdning aktier som de vil saeliglge naringr kurserne stiger Dette fortsaeligtter som bekendt aldrig i det uendelige Paring et vist tidspunkt standser stigningen og kurserne begynder at falde ndash som regel ndash hurtigere end de steg Hvornaringr skal man saeliglge for at opnaring den stoslashrste gevinst Det viser sig - men det er saeligrdeles kompliceret at redegoslashre for ndash at naringr det gaeliglder boslashrs spekulation saring er ingen af strategierne 2 og 3 optimale De vil begge to i grove traeligk som resultat have at man enten skal saeliglge straks eller vente til man er ruineret Vi vil nu give en beskrivelse af den optimale strategi som er udviklet af Snell Vi vil overhovedet ikke naeligrme os et bevis for at det er den optimale strategi (beviset er ret teknisk abstrakt) men

Strategier ved spil 12

understrege at det kan bevises I matematisk forstand Ulemperne ved Snell-strategien er at den for selv simple problemer kan foslashre til ret omfattende og komplicerede regninger

2 Den optimale Snell-strategi Snell-strategien er paring sin vis den samme som den kortsigtede strategi men hvor man i denne strategi hele tiden regner sig et skridt frem saring tager Snell-strategien udgangspunkt i spillets slutning og arbejder sig baglaeligns Vi indfoslashrer foslashrst nogle betegnelser Vi antager at spillet har n trin Sk er en stokastisk variabel der angiver den faktiske samlede gevinst man har opnaringet ved det kte spil Sk kan antage en eller flere vaeligrdier med tilhoslashrende sandsynligheder Det nye ved Snell-strategien er at man definerer endnu en stokastisk variabel Gk ved ligningen

Gk = maxSk E(Gk+1| S1Sk) Gk er den stoslashrste af vaeligrdierne Sk (gevinsten efter det kte spil) og E(Gk+1| S1Sk)) som er middelvaeligrdien af den maximale forventede gevinst i det k+1te spil naringr det er givet at man har spillet spillene 1k Dette opstilles i et skema Gn = Sn Gevinsten ved spillets afslutning Gn-1 = maxSn-1 E(Gn| S1Sn-1) Gk = maxSk E(Gk+1| S1Sk) G1 = maxS1 E(G2| S1) Snell strategien siger nu at man skal standse spillet den foslashrste gang Sk (gevinsten efter det kte spil) overstiger middelvaeligrdien af den maksimale forventede gevinst i det k+1te spil Dette kaldes for stopbetingelsen Stopbetingelsen er altsaring

Sk E(Gk+1| S1Sk) Man skal altsaring standse spillet naringr den opnaringede gevinst er stoslashrre eller lig med den betingede forventning af den maximale gevinst i det naeligste spil Det kunne lyde som den kortsigtede strategi men forskellen er den at i den kortsigtede strategi er Gk+1 erstattet af Sk+1 At kunne gennemskue konsekvenserne af dette er derimod ikke saring nemt Det viser sig at i mange tilfaeliglde at er Snell-Strategien identisk med den kortsigtede strategi som kraeligver at man stopper naringr Sk E(Sk+1| S1Sk) Snell strategien er ikke umiddelbart let gennemskuelig og udregningen af de betingede middelvaeligrdier E(Gk+1| S1Sk) er ofte ret teknisk Vi vil nu behandle de foslashr naeligvnte eksempler og begynder med

Strategier ved spil 13

21 Indbrudstyvens pensionsproblem Lad os antage at Arthurs gennemsnitlige gevinst ved hvert tyvetogt er K = 6000 kr og at chancen er at han bliver taget er 5 Lad os antage at hans hidtidige gevinst efter k - tyvetugt er Sk som bliver konfiskeret - og som han derved mister hvis han bliver snuppet I dette tilfaeliglde kan man - som vist nedenfor - se at den kortsigtede strategi er den optimale strategi Det haelignger sammen med at alle trin i spillet er identiske Gevinsten ved hvert tyvetogt er den samme ndash uafhaeligngigt af de foregaringende tyvetugter - bortset fra at den samlede gevinst vokser ved hvert vellykket tyvetogt Xk betegner den stokastiske variabel som er Arthurs gevinst ved eacutet tyvetugt Hermed er

Sk =X1+ X2+ X3+hellip Xk Xk+1 kan antage vaeligrdien K med sandsynlighed 1-ps = 1-P(Snuppet) (altsaring hvis det naeligste tyvetugt lykkes) og vaeligrdien ndashSk (han mister hele sin opsparing) med sandsynlighed ps = P(Snuppet) Vi opskriver nu Snell-strategien (Den kortsigtede strategi) for et trin i hans karriere

Gk = max Sk E(Sk+1| 1k)

Sk er hans gevinst efter k tyvetugter og E(Sk+1| 1k) er hans forventede gevinst efter k+1 tyvetugter E(Sk+1| 1k) kan beregnes som den hidtidige gevinst plus den forventede gevinst ved naeligste tyve- tugt i alt lig med Sk + E(Xk+1) E(Xk+1) er uafhaeligngig af de foslashrste k - tyvetugter derfor bliver stopbetingelsen Sk gt Sk + E(Xk+1) E(Xk+1) lt 0 Middelvaeligrdien E(Xk+1) kan saringledes udregnes efter den saeligdvanlige definition idet Xk+1 antager vaeligrdierne K (gevinsten ved et tyvetugt) og - Sk (mister hele sin opsparing) med sandsynlighederne 1-ps og ps henholdsvis E(Xk+1) = K(1- ps) - Sk ps Han skal standse naringr

E(Xk+1) lt 0 K(1- ps) lt Sk ps som med tal eksemplet giver

6000095 lt Sk005 Sk gt 114000- kr svarende til 114006000 = 095005 = 19 tyvetugter

(Det goslashr han nu nok ikke og er derfor henvist til at leve af folkepensionen efter nogle aringr i skyggen) Man kunne godt tro at dette eksempel kunne anvendes paring andre (ligesaring uetiske) problemstillinger Feks hvor mange gange det er optimalt at koslashre gratis i S-tog Det kan det imidlertid ikke helt

Strategier ved spil 14

Sagen er jo den at man faringr en fast boslashde hvis man bliver snuppet men man kommer ikke til at betale for de gange man har koslashrt gratis Med andre ord vurderingen om hvorvidt det er fordelagtigt at koslashre uden billet afhaelignger kun af middelgevinsten ved det naeligste forsoslashg Hvis den er positiv er det fordelagtigt at fortsaeligtte men hvis den er negativ er det fordelagtigt at loslashse billet (Det er i oslashvrigt uetisk at snyde ndash naturligvis) Tager vi et eksempel billetprisen er kr 50- Boslashden er kr 500 Sandsynligheden for at blive snuppet er Ps = 01 Hvis X er gevinsten ved at koslashre uden billet er E(X) = 50middot(1-Ps)-500middotPs = 50middot09-500middot01 = -50 Det er saringledes (med denne sandsynlighed for at blive snuppet) ikke fordelagtigt at koslashre uden billet i S-tog Da en laeligrebog i sandsynligheder ved spil naturligvis ikke maring tilskynde til uetiske handlinger undlader vi at foretage beregningen med Ps = 005

22 Skaeligbnen Vi betragter kast med to terninger X betegner summen af oslashjentallene ved eacutet kast Sandsynlighedsfordelingen for X er velkendt Feks er P(X=5) = 436 Sandsynligheden for at terningerne viser j oslashjne kan skrives som

36

76)(

jjXP

Lad os antage at spillerens skaeligbne er q Hvis man slaringr dette oslashjental er alt tabt Ellers adderes oslashjentallene for hvert kast Hvis ikke man har slaringet sin skaeligbne saring er den samlede gevinst efter n spil

Sn = X1+ X2+ X3+hellip +Xn

Og middelvaeligrdien af Sn er

E(Sn) = E(X1)+ E(X2)+E(X3)+hellip +E(Xn) = nE(X | X q) E(X | X q) er den betingede middelvaeligrdi af oslashjentallene givet at man ikke slaringr sin skaeligbne

E(X | X q) = 2P(2) +3P(3)+hellip(q-1)P(q-1) + (q+1)P(q+1)+hellip+12P(12) Den kortsigtede strategi (og Snell strategien) fastslaringr at man skal standse naringr middelvaeligrdien af den forventede gevinst ved naeligste kast er negativ Argumentet for dette kan overtages naeligsten ordret fra indbrudstyvens pensionsproblem E(Sk+1|S1 Sk) kan beregnes som den hidtidige gevinst Sk plus den forventede gevinst ved det naeligste kast i alt lig med Sk + E(Xk+1| S1 Sk) Stopbetingelsen er derfor

Sk gt Sk + E(Xk+1| S1 Sk) E(Xk+1| S1 Sk) lt 0

Strategier ved spil 15

E(X | X q) ndash SnP(q) lt 0 Sn gt E(X | X q) P(q) Det er ikke saeligrlig svaeligrt at udregne stopbetingelsen feks for q = 2 og q = 6 Nedenfor er vist udskriften fra et program som foretager beregningen for q = 212 Forventet gevinst i naeligste kast naringr ens skaeligbne er q q 2 3 4 5 6 7 8 9 10 11 12 694 683 667 644 617 583 589 600 617 639 667 Stop naringr din gevinst S gt EX(q)P(q) naringr skaeligbne er q q 2 3 4 5 6 7 8 9 10 11 12 25000 12300 8000 5800 4440 3500 4240 5400 7400 11500 24000

Som det fremgaringr er der endog meget stor forskel paring stoptiderne afhaeligngig af ens skaeligbne

23 Mandagschancen Dette spil er lidt mere interessant fordi det ikke er helt saring enkelt at gennemskue I dette tilfaeliglde kan man ikke forvente at den kortsigtede strategi vil foslashre til den optimale strategi At den faktisk goslashr det skyldes talvaeligrdierne Dette skal forstarings saringledes at hvis man aeligndrede paring praeligmiestoslashrrelserne ville Snell-strategien afvige fra den kortsigtede strategi Vi vil analysere spillet ved Snell-strategien Som naeligvnt har man i spillet 9 tildaeligkkede felter (101025255050100100250) Man kan afdaeligkke hoslashjest 3 felter Man faringr beloslashbet i 1000 kr som det sidste felt viser Hvis X er den stokastiske variabel som angiver vaeligrdien af et felt saring vil de fleste uden saring lange overvejelser vel fortsaeligtte hvis Xlt50 og standse hvis X100 Det kritiske er hvis man afdaeligkker 50 (X=50) Vi bemaeligrker foslashrst at summen af alle felterne er S=620 og at E(X) =6209=689 Vi opskriver foslashrst den fuldstaeligndige Snell-strategi for dette spil G3 =X3 Den Stokastiske variabel G3 = Gevinsten = X3 = vaeligrdien af det sidst afdaeligkkede felt G2 = max X2 E(G3| X1X2 ) Den stoslashrste af vaeligrdierne X2 (= vaeligrdien af det afdaeligkkede

felt) og den betingede middelvaeligrdi af G3 = X3 G1 = max X1 E(G2| X1 ) Som ovenfor Kriteriet for den optimale strategi er som tidligere Stop hvis paring noget trin Xk gt E(Gk+1| X1Xk ) Det er relativ nemt at opstille en formel for E(G3| X1X2 ) Naringr X1 og X2 er afdaeligkket er summen de resterende felter S - X1 - X2 Da alle felter har samme sandsynlighed er middelvaeligrdien simpelthen middeltallet af felterne E(G3| X1X2 ) = ( S - X1 - X2)(9-2)

Strategier ved spil 16

Det er noget mere teknisk at opstille en formel for E(G2| X1 ) og ogsaring lidt teknisk at foretage beregningen Vi vil noslashjes med at skitsere beregningen for en vaeligrdi af X1 og i oslashvrigt henvise til resultatet af et Computerprogram som kan ses nedenfor Lad os antage at X1 = 25 Vi lader nu X2 gennemloslashbe alle de mulige vaeligrdier (alle vaeligrdier skal taeliglles med det antal gange der er felter med denne vaeligrdi) For hver vaeligrdi af X2 (feks 50) skal vi vaeliglge max af X2 og E(G3| X1X2 ) = ( S - X1 - X2) (9-2) (= (620-50-25)7 = 778 i dette tilfaeliglde) og addere det til en sum S2 E(G2| X1 ) er da lig med S2(9-1) (da der er 9-1 felter X2 ) X2[1]= 1000 E(G3)= 8571 G2= 8571 X2[2]= 2500 E(G3)= 8357 G2= 8357 X2[3]= 5000 E(G3)= 8000 G2= 8000 X2[4]= 10000 E(G3)= 7286 G2= 10000 X2[5]= 25000 E(G3)= 5143 G2= 25000 X1[1]= 1000 E(G[2])= 10786 X2[1]= 1000 E(G3)= 8357 G2= 8357 X2[2]= 2500 E(G3)= 8143 G2= 8143 X2[3]= 5000 E(G3)= 7786 G2= 7786 X2[4]= 10000 E(G3)= 7071 G2= 10000 X2[5]= 25000 E(G3)= 4929 G2= 25000 X1[2]= 2500 E(G[2])= 10679 X2[1]= 1000 E(G3)= 8000 G2= 8000 X2[2]= 2500 E(G3)= 7786 G2= 7786 X2[3]= 5000 E(G3)= 7429 G2= 7429 X2[4]= 10000 E(G3)= 6714 G2= 10000 X2[5]= 25000 E(G3)= 4571 G2= 25000 X1[3]= 5000 E(G[2])= 10500 X2[1]= 1000 E(G3)= 7286 G2= 7286 X2[2]= 2500 E(G3)= 7071 G2= 7071 X2[3]= 5000 E(G3)= 6714 G2= 6714 X2[4]= 10000 E(G3)= 6000 G2= 10000 X2[5]= 25000 E(G3)= 3857 G2= 25000 X1[4]= 10000 E(G[2])= 9643 X2[1]= 1000 E(G3)= 5143 G2= 5143 X2[2]= 2500 E(G3)= 4929 G2= 4929 X2[3]= 5000 E(G3)= 4571 G2= 5000 X2[4]= 10000 E(G3)= 3857 G2= 10000 X1[5]= 25000 E(G[2])= 6268 Ser man resultaterne igennem kan de udmoslashntes i en simpel regel Fortsaeligt paring 50 eller derunder Stop paring 100 eller derover Det er maringske lidt overraskende at man ogsaring skal forsaeligtte paring 50000 hvis man kun har et forsoslashg tilbage ndash man kunne jo ende med 10000 og det er saring bare aeligrgerligt ndash og det er vist nok de fleste som standser ved 50000 - men det er ikke den bedste strategi

Strategier ved spil 17

24 Casino Som naeligvnt i indledningen til dette afsnit findes der ingen strategi som kan bringe en i stand til at vinde paring et Casino ndash i det lange loslashb Vil man goslashre Casino-spil til en levevej vil det altid med matematisk sikkerhed ende med ruin Det betyder imidlertid ikke at man ikke kan vinde ved at garing paring Casino men hvis man taelignker paring at spraelignge banken saring skal to krav i hvert fald vaeligre opfyldt for at der skal vaeligre en ikke forsvindende sandsynlighed for at det kan lade sig goslashre 1 Man skal have flere penge end Casino 2 Der maring ikke vaeligre loft over indsatserne Begge betingelser er som bekendt aldrig opfyldt Man kan som sagt godt vinde paring et Casino men hvis man satser paring at vinde mere (alle de gange man er paring Casino i sit liv) end det beloslashb man medbringer ved hvert besoslashg saring vil chancerne for at tabe det hele vaeligre stoslashrst Her er der tale om sandsynligheder og middelvaeligrdier ndash om odds Selvfoslashlgelig er de muligt at tabe hele sin formue ved foslashrste besoslashg eller vinde det tredobbelte ved det andet Der har i tidens loslashb vaeligret lanceret flere eksempler paring vinderstrategier som lyder uhyre besnaeligrende Den mest kendte er Martingale-systemet Man spiller kun paring sort og roslashd hvor faringr man faringr fordoblet sin indsats hvis man vinder Spillet er saringledes helt lige bortset fra at indsatserne bliver liggende naringr zero kommer ud og man kun faringr sin indsats en gang hvis man vinder i naeligste spil (zero har ingen farve) Spiller man efter Martingale-systemet skal man inkassere sin gevinst hvis man vinder Hvis man derimod taber skal man fordoble sin indsats Vi saeligtter grundindsatsen til 1 Har man spillet n gange og dermed doblet op n-1 gange har man lagt en indsats Sn = 1 + 2 + 22 +hellip2n-1 = 2n ndash1 Udregnet af kvotientraeligkkeformlen

1

10

q

qaS

n

n

for raeligkken Sn = a0 + a0q+ a0q

2+hellip+ a0qn-1

Vinder man det nte spil faringr man udbetalt 22

n-1 = 2n saring ens gevinst er 2n - (2n - 1) = 1 Der gaeliglder aringbenbart den simple kendsgerning at bliver man bare ved med at fordoble saring har man altid vundet eacuten indsats Foslashr man forsoslashger sig med dette skal man dog nok goslashre sig klart hvor mange gange man kan tabe foslashr man er ruineret

Strategier ved spil 18

Sandsynligheden for at man taber 5 spil er (frac12)5 = 132 Man har da tabt 25 ndash 1 gange vaeligrdien af en jeton (i Danmark 50 kr) dvs 1550 kr Vil man sikre sig bedre feks ved at kunne doble op 9 gange (sandsynligheden for at tabe 10 spil er 11024) saring skal man komme med kr 51150- men det kan man ikke engang gennemfoslashre da hoslashjeste indsats i Danmark er 24000- Man kunne imidlertid stille det sposlashrgsmaringl Hvis man har n-jetoner hvad er saring sandsynligheden for at vinde q-jetoner hvis man spiller efter Martingale-systemet Dette kan man faktisk godt udregne direkte men regningerne er ret omfattende Derimod er resultatet simpelt Vi vil ikke lave en direkte udregning men anvende de samme metoder som vi har anvendt for den bedste strategi Vi tager udgangspunkt i det faktum at sort roslashd Casino spil er et lige spil saring middelvaeligrdien af gevinsten er 0 ligegyldigt hvordan man spiller Middelvaeligrdien (som er nul ) af en gevinst paring q-jetoner er lig med q gange sandsynligheden P(q) for at vinde q jetoner minus ens kapital (n jetoner) gange med sandsynligheden for at man taber det sidste spil som er 1 ndash P(q)

qP(q) ndash n(1 ndashP(q)) = 0 qn

nqP

)(

Har man feks n = 31 jetoner (1550- kr) er sandsynligheden for at vinde q=10 (500 kr) lig med 0756 En rimelig stor sandsynlighed men altsaring stadig 25 chance for ruin Oslashnsker man derimod at blive rigtig rig og vinde 10000- kr dvs q=200 er P(200) = 0134 Konklusionen er den at satser man paring at vinde mere end man medbringer saring er sandsynligheden mindre end frac12 men kan man noslashjes med mindre saring er sandsynligheden stoslashrre end frac12 Men bemaeligrk dette gaeliglder fra foslashrste gang man garingr ind paring et Casino til man beslutter at holde op

25 Taeligndstikspillet Som beskrevet ovenfor garingr spillet ud paring at farve den ene af siderne roslashd paring 10 taeligndstikker Naringr taeligndstikken kasten op i luften er sandsynligheden for at den roslashde side vender opad naringr den rammer bordet lig med p=025 Man kaster paring skift 10 saringdanne taeligndstikker 10 gange For hvert kast skal man multiplicere antallet af roslashde med et af tallene 110 Hver tal maring kun bruges eacuten gang Den der faringr den stoslashrste sum har vundet Det er klart at en god strategi i det lange loslashb vil give en hoslashjere sum Vi minder om at antallet af X roslashde taeligndstikker er binomialfordelt med primaeligrsandsynlighed p og antalsparameter n=10

102104

3

4

110)(

10

jj

jXPjj

Strategier ved spil 19

Endvidere vil vi anvende de kumulerede sandsynligheder P(X j) og P(X j) Nedenfor er vist resultatet af en Computersimulation af spillet Primaeligr sandsynligheder for n= 10 og p= 0250 P(X=j) j 0 1 2 3 4 5 6 7 8 9 10 00563 01877 02816 02503 01460 00584 00162 00031 00004 00000 00000 Baglaeligns kumulerede sandsynligheder P(Xgt=q) j 0 1 2 3 4 5 6 7 8 9 10 10000 09437 07560 04744 02241 00781 00197 00035 00004 00000 00000 1 kast Antal = 2 Vaeliglg mellem 1 2 3 4 5 6 7 8 910 Faktor= 4 2 kast Antal = 4 Vaeliglg mellem 1 2 3 5 6 7 8 910 Faktor=10 3 kast Antal = 2 Vaeliglg mellem 1 2 3 5 6 7 8 9 Faktor= 5 4 kast Antal = 2 Vaeliglg mellem 1 2 3 6 7 8 9 Faktor= 3 5 kast Antal = 3 Vaeliglg mellem 1 2 6 7 8 9 Faktor= 8 6 kast Antal = 2 Vaeliglg mellem 1 2 6 7 9 Faktor= 6 7 kast Antal = 6 Vaeliglg mellem 1 2 7 9 Faktor=9 8 kast Antal = 3 Vaeliglg mellem 1 2 7 Faktor= 2 9 kast Antal = 2 Vaeliglg mellem 1 7 Faktor= 7 10 kast Antal = 2 Vaeliglg mellem 1 Faktor= 1 Din score er 176 Valget af tallene 110 er i dette tilfaeliglde foretaget ud fra den optimale strategi som vi vil omtale om et oslashjeblik Foslashr vi analyserer den optimale strategi for dette spil vil vi forsoslashge os med en intuitiv bedste strategi Vi belyser denne strategi med et konkret eksempel Lad os feks antage at vi slaringr 4 roslashde i den 3 kast (3 forsoslashg) De tal vi har tilbage kalder vi (y8 y7 y6 y5 y4 y3 y2 y1) Sposlashrgsmaringlet om vi skal gange med det stoslashrste y8 eller det naeligststoslashrste y7 osv Vi raeligsonnerer da som foslashlger Hvis sandsynligheden for at slaring mere end 4 roslashde i de resterende 7 kast er stoslashrre end frac12 saring skal vi vaeliglge det naeligststoslashrste Vi skaeligrper dette Hvis sandsynligheden for at slaring mindst 5 roslashde mindst en gang i de resterende 7 kast er stoslashrre end frac12 saring skal vi vaeliglge det naeligststoslashrste Tilsvarende hvis sandsynligheden for at slaring mindst 5 roslashde mindst 2 gange i de resterende 7 kast skal vi vaeliglge det 3 stoslashrstehellipog saringdan fremdeles Strategien virker umiddelbart meget plausibel Sandsynlighederne kan direkte farings af binomialfordelingen Foslashrst sandsynligheden for at faring mindst q-roslashde i et kast Dette er

P(X q) =

n

qj

jXP )( hvor P(X = j) er angivet ovenfor

Strategier ved spil 20

Sandsynligheden for at dette sker mindst r gange i n - k kast er ogsaring en binomialfordeling og kan skrives

P(X q mindst r gange i n - k kast ) = jknjkn

rj

qXPqXPj

kn

))(1()(

Beregningen af disse (110) sandsynligheder goslashres nok lettest paring en computer For at lave en strategi-tabel goslashr man det at for hvert kast og hvert antal mulige roslashde vaeliglger man foslashrst det stoslashrste af de resterende tal Dernaeligst beregner man sandsynligheden for at faring mindst 1 roslashd mere i et af de foslashlgende kast Hvis denne sandsynlighed er stoslashrre end frac12 ser man paring det naeligststoslashrste af de resterende tal Man beregner saring sandsynligheden for at faring mindst 1 roslashd mere i mindst to af de resterende kast Hvis denne sandsynlighed er stoslashrre end frac12 saring vaeliglger man det tredjestoslashrste af de resterende tal og saringdan fremdeleshellip Det bemaeligrkes at beregningen skal initialiseres med at man altid vaeliglger det mindste hvis man slaringr 0 roslashde og altid vaeliglger det stoslashrste hvis man slaringr 10 roslashde Nedenfor er vist en computerberegning af en strategi-tabel Endvidere er ogsaring lavet en saringkaldt Monte-Carlo simulation Dette betyder at man har ladet maskinen spille feks 10000 spil spillet efter strategi-tabellen Nederst er vist hyppighederne for ens score og endelig fordelingsfunktionen for observationerne (Den kumulerede frekvens) P(X =j) for n =10 and p = 0250 j 0 1 2 3 4 5 6 7 8 9 10 P(X =j)0056 0188 0282 0250 0146 0058 00162 0003 00004 0000 0000 P(Xgt=j) for n =10 and p = 0250 j 0 1 2 3 4 5 6 7 8 9 10 P(Xgt=j) 1000 0944 0756 0474 0224 0078 00197 00035 00004 0000 0000 Strategi tabel Tallene refererer ikke til faktorene selv men til den stoslashrste naeligststoslashrste osv Eksempel Hvis man slaringr 3 roslashde i den andet kast saring skal man vaeliglge (7) den tredjestoslashrste Kast no 1 2 3 4 5 6 7 8 9 10 score 0 1 1 1 1 1 1 1 1 1 1 1 3 3 3 2 2 2 2 1 1 1 2 6 5 5 4 4 3 3 2 2 1 3 8 7 7 6 5 4 3 3 2 1 4 9 9 8 7 6 5 4 3 2 1 5 10 9 8 7 6 5 4 3 2 1 6 10 9 8 7 6 5 4 3 2 1 7 10 9 8 7 6 5 4 3 2 1 8 10 9 8 7 6 5 4 3 2 1 9 10 9 8 7 6 5 4 3 2 1 10 10 9 8 7 6 5 4 3 2 1 Gennemsnitlig score = 16437

Strategier ved spil 21

Hyppighed af score h( 75)= 1 h( 80)= 7 h( 85)= 3 h( 90)= 5 h( 95)= 6 h(100)= 34 h(105)= 38 h(110)= 82 h(115)= 68 h(120)=161 h(125)=146 h(130)=320 h(135)=280 h(140)=534 h(145)=425 h(150)=752 h(155)=577 h(160)=878 h(165)=645 h(170)=956 h(175)=651 h(180)=863 h(185)=527 h(190)=609 h(195)=351 h(200)=389 h(205)=180 h(210)=203 h(215)= 93 h(220)= 86 h(225)= 47 h(230)= 32 h(235)= 21 h(240)= 13 h(245)= 8 h(250)= 3 h(255)= 0 h(260)= 4 h(265)= 1 h(270)= 1 h(275)= 0 h(280)= 0 Frekvens of score F( 80)=00008 F( 85)=00011 F( 90)=00016 F( 95)=00022 F(100)=00056 F(105)=00094 F(110)=00176 F(115)=00244 F(120)=00405 F(125)=00551 F(130)=00871 F(135)=01151 F(140)=01685 F(145)=02110 F(150)=02862 F(155)=03439 F(160)=04317 F(165)=04962 F(170)=05918 F(175)=06569 F(180)=07432 F(185)=07959 F(190)=08568 F(195)=08919 F(200)=09308 F(205)=09488 F(210)=09691 F(215)=09784 F(220)=09870 F(225)=09917 F(230)=09949 F(235)=09970 F(240)=09983 F(245)=09991 F(250)=09994 F(255)=09994 F(260)=09998 F(265)=09999 F(270)=10000 F(275)=10000

Som det fremgaringr af tabellen for P(X gt= j) er der kun 78 chance for at slaring 5 roslashde eller derover saring goslashr man det skal man altid vaeliglge det stoslashrste af de resterende tal For 3 eller 4 roslashde er situationen langt mere uigemmeskuelig og kun en beregning kan afgoslashre sagen Vi proslashver nu at finde den optimale strategi eller Snell-strategien Hvad angaringr sposlashrgsmaringlet om hvorvidt vi skal vaeliglge den stoslashrste eller naeligststoslashrste saring lader det sig faktisk goslashre at beregne Snell-strategien paring en computer De foslashlgende tilfaeliglde bliver derimod for komplicerede og der anvender vi en svagt forbedret version af vores intuitive strategi Forbedringen bestaringr i foslashlgende idet vi illustrerer det med et eksempel Lad os sige vi har slaringet 3 roslashde og vi overvejer om vi vil gange det med 7 eller 6 Ganger vi med 6 er det fordi vi forventer at slaring mindst 4 roslashde mindst en gang i de resterende kast Vores score vil vaeligre 73 og 74 henholdsvis og scoren vil blive forbedret med en faktor 43 hvis vi ganger med 6 under forventning af at slaring 4 roslashde Vores forbedring af strategien garingr da ud paring at vi vaeliglger det naeligststoslashrste 6 hvis sandsynligheden for at slaring 4 roslashde gange den relative forbedring 43 er stoslashrre end frac12 Vi rekapitulerer dernaeligst Snell-strategien G10 = X10 X10 Stokastisk variabel = antallet af roslashde i det 10 kast G9 = max X9 E(G10) E(G10) = E(X10) = np=10025 = 25 X9 = 01hellip10 Gk = max Xk E(Gk+1) E(Gk) kraeligver en laeligngere udregning men den udregnes som en

almindelig middelvaeligrdi altsaring som max af de to vaeligrdier gange P(X=Xk-1) G1 = max X1 E(G2) Som eksempel udregner vi E(G9) Da E(G10)=25 skal vi for X9 = 012 anvende E(G10)=25 i udregningen

Strategier ved spil 22

E(G9) = 25 (P(X=0)+P(X=1)+P(X=2))+ 3P(X=3)+hellip+10P(X=10) =306 Vaeligrdierne for E(Gk) er alle udregnet og vist i computerberegningen nedenfor Bemaeligrk isaeligr at de vokser fra 25 til 425 naringr k aftager fra 10 til 2 Strategien er nu foslashlgende Vaeliglg det stoslashrste af de resterende tal hvis Xk gt E(Gk+1) (altsaring det antal man har slaringet er er stoslashrre end det forventede stoslashrste antal) ellers vaeliglg det naeligststoslashrste Ved afgoslashrelsen om de 3 stoslashrste 4 stoslashrste osv anvender vi den hidtidige strategi med den modifikation at vi multiplicerer sandsynligheden med den formodede relative forbedring E(G10-kast)antal roslashde En computerberegning helt svarende til den foregaringende men med den aeligndrede strategi er vist nedenfor Man bemaeligrker for det foslashrste de smaring aeligndringer der er i strategien Den nye strategi er lidt mindre forsigtig men den giver altsaring ogsaring pote i form af en forbedring af gennemsnittet paring ca 275 Primaeligr sandsynligheder P(X=j) for n= 10 og p= 0250 j 0 1 2 3 4 5 6 7 8 9 10 P(X=j)0056 0188 0282 0250 0146 0058 0016 00031 00004 00000 00000 Baglaeligns Kumulerede sandsynligheder P(Xgt=j) j 0 1 2 3 4 5 6 7 8 9 10 P(Xgt=j) 1000 0944 0756 0474 0224 0078 00197 00035 00004 00000 00000 E(G[10])= 250 E(G[9])= 306 E(G[8])= 337 E(G[7])= 362 E(G[6])= 380 E(G[5])= 395 E(G[4])= 406 E(G[3])= 416 E(G[2])= 425 kast nr 1 2 3 4 5 6 7 8 9 10 score 0 1 1 1 1 1 1 1 1 1 1 1 2 2 1 1 1 1 1 1 1 1 2 5 4 4 3 3 3 2 2 1 1 3 8 7 6 5 5 4 3 2 2 1 4 9 8 7 7 6 5 4 3 2 1 5 10 9 8 7 6 5 4 3 2 1 6 10 9 8 7 6 5 4 3 2 1 7 10 9 8 7 6 5 4 3 2 1 8 10 9 8 7 6 5 4 3 2 1 9 10 9 8 7 6 5 4 3 2 1 10 10 9 8 7 6 5 4 3 2 1 Gennemsnitlig gevinst ms = 16727 Hyppigheder af score h( 75)= 1 h( 80)= 1 h( 85)= 0 h( 90)= 3 h( 95)= 2 h(100)= 5 h(105)= 4 h(110)= 9 h(115)= 12 h(120)= 12 h(125)= 17 h(130)= 22 h(135)= 28 h(140)= 39 h(145)= 24 h(150)= 49 h(155)= 54 h(160)= 74 h(165)= 63 h(170)=117 h(175)= 63 h(180)= 91 h(185)= 57 h(190)= 72 h(195)= 39 h(200)= 36 h(205)= 35 h(210)= 29 h(215)= 14 h(220)= 21 h(225)= 1 h(230)= 5 h(235)= 1 h(240)= 0 h(245)= 0 h(250)= 0 h(255)= 0 h(260)= 0 h(265)= 0 h(270)= 0 h(275)= 0 h(280)= 0

Strategier ved spil 23

Frekvens af score F( 80)=00020 F( 85)=00020 F( 90)=00050 F( 95)=00070 F(100)=00120 F(105)=00160 F(110)=00250 F(115)=00370 F(120)=00490 F(125)=00660 F(130)=00880 F(135)=01160 F(140)=01550 F(145)=01790 F(150)=02280 F(155)=02820 F(160)=03560 F(165)=04190 F(170)=05360 F(175)=05990 F(180)=06900 F(185)=07470 F(190)=08190 F(195)=08580 F(200)=08940 F(205)=09290 F(210)=09580 F(215)=09720 F(220)=09930 F(225)=09940 F(230)=09990 F(235)=10000 F(240)=10000 F(245)=10000 F(250)=10000 F(255)=10000 F(260)=10000 F(265)=10000 F(270)=10000 F(275)=10000

Maringske er det ikke en saeligrlig imponerende forbedring fra den foslashrste strategi men det er en teoretisk milepaeligl at man er i stand til at angive den bedste strategi for bestemte typer af spil Som omtalt har vi ikke forsoslashgt at bevise at Snell-Strategien er den optimale Strategi men det kan bevises Det er vigtigt at notere sig at i alle de omtalte spil har udfaldene vaeligre stokastiske variable dvs uforudsigelige men med bestemte sandsynligheder og at disse sandsynligheder ikke bliver aeligndret af den strategi man foslashlger I mange af de spil hvor man ofte moslashder begrebet strategi feks skak krig finansmarked og markedsfoslashring er dette langt fra tilfaeligldet Hvis feks alle boslashrsspekulanter fulgte den samme optimale strategi med boslashrskursen som stokastisk variabel ville det nok vise sig at det var den daringrligste strategi af alle Teorien for dynamiske strategier hvor de stokastiske variable er funktioner af tiden og af den valgte strategi er teoretisk naeligsten ufremkommelige

Strategier ved spil 24

Indeks Casino516 Computersimulation18 definitionen af sandsynlighed 1 Den optimale Snell-strategi11 forsikringsmatematik 5 Indbrudstyvens pensionsproblem912 kortsigtede strategi 10 kumulerede frekvens 19 langsigtede strategi 10 lotto 1 Mandagschancen14 Mandags-chancen9 Martingale-systemet16

Optimale Strategier 10 Poker 3 rekursionsligning 6 roulette 57 Roulette spil 10 roulettespiller 7 ruinsandsynligheder 5 Skaeligbnen913 Snell-strategien 11 Stopbetingelsen11 strategi9 Taeligndstikspillet1018

Page 5: Sandsynligheder og strategier ved spil - Ole Witt-Hansen ...olewitthansen.dk/Matematik/Sandsynligheder_og_strategier_ved_spil… · 6dqgv\qoljkhghu yhg vslo 3n vdpph pngh ndq yl ilqgh

Sandsynligheder ved spil 3

oslashvelser 1 Udregn hvor mange uger man skal spille 10 raeligkker for at der er mere end 50 chance for at

vinde 4 praeligmie (5 rigtige) Opgaven skal loslashses med logaritmer 2 Forsoslashg at udregne samme som ovenfor blot med en 1 praeligmie 3 En udfyldt raeligkke paring 7 tal daeligkker aringbenbart over K(74)K(292) forskellige raeligkker med 4

rigtige Hvor mange raeligkker skal man mindst udfylde for at vaeligre sikker paring at faring 4 rigtige

2 Poker Vi antager at Poker spilles med et almindeligt spil kort og at hver spiller faringr 5 kort fra begyndelsen Vi vil ikke beskaeligftige os med at koslashbe nye kort da det er alt for kompliceret men kun udregne sandsynlighederne for de forskellige kombinationer af kort der kan slaring hinanden Flush betyder i Poker sammenhaeligng 5 kort i samme farve og Straight betyder 5 kort i raeligkkefoslashlge Rangfoslashlgen af kortfarverne er i oslashvrigt de samme som i Bridge Spar Hjerter Ruder Kloslashr Rangfoslashlgen af kortkombinationer i Poker er foslashlgende Royal Flush De 5 hoslashjeste kort i samme farve Feks es konge dame knaeliggt 10 i ruder Straight Flush 5 kort i raeligkkefoslashlge i samme farve Fire ens 4 ens kort (5 kort underordnet) Full House 3 ens + 2 ens (et par) Flush 5 kort i samme farve Straight 5 kort i raeligkkefoslashlge Tre ens tre ens kortvaeligrdi To par 2 ens + 2 ens Et par 2 ens Hoslashjeste kort Sandsynlighederne for hver af disse kortkombinationer kan udregnes idet de mulige kombinationer af 5 kort udtaget af 52 er K(525) = 2598960 Royal Flush Der er 4 forskellige Royal Flush ndash en i hver farve

P(Royal flush) = )552(

4

K 615610-6

Straight Flush Der kan i hver af de 4 kortfarver laves 9 forskellige Straight Flush En af dem er Royal

P(Straight Flush) =)532(

32

)552(

)19(4

KK

= 492510-5

Sandsynligheder ved spil 4

Fire ens Der er 13 forskellige muligheder for fire ens Det femte kort kan vaeliglges paring 52 - 4 = 48 forskellige maringder

P(4 ens) =

)552(

624

)552(

4813

KK240110-4

Full House Der er 13 forskellige muligheder for 3 ens De 3 kan udtages paring K(43) forskellige maringder De to ens maring noslashdvendigvis have en anden talvaeligrdi hvoraf resultatet foslashlger

P(Full House 3 ens + 2 ens) =

)552(

3744

)552(

)24(12)34(13

KK

KK140010-3

Flush 5 kort i samme farve kan udtages paring K(135) maringder Der er 4 kortfarver Vi maring subtrahere Straight Flusher fra

P(Flush 5 i samme farve) = 3109671)552(

5112

)552(

432)513(4

KK

K

Straight Der er 13 - 4 = 9 forskellige raeligkkefoslashlger Hver af de 5 kortvaeligrdier kan vaeliglges blandt 4 farver Vi skal fratraeligkke Straight Flush

P(Straight 5 i raeligkkefoslashlge) = 35

10533)552(

9180

)552(

3649

KK

Tre ens Der er 13 kortvaeligrdier og der skal udvaeliglges 3 De sidste to kort kan udvaeliglges blandt 52 - 4 = 48 kort (ikke 49 da det kunne give 4 ens) Vi maring dog fratraeligkke de 12K(42) par der kan dannes og som ville give Full House

P(3 ens) = 2101132)552(

54912

)552(

))24(12)248(()34(13

KK

KKK

To par Foslashrst udregnes antallet af muligheder for de to par Faktoren frac12 skyldes at man ved denne optaeliglling taeligller de mulige kombinationer Et par feks (spar dame hjerter dame) vil baringde vaeligre at finde blandt de 13K(42) og de 12K(42) muligheder Det sidste kort kan vaeliglges blandt 52 ndash 8 som danner de to par

P(2 par) = 210754)552(

552123

)552(

)852)(24(12)24(1321

KK

KK

Et par De foslashrste 3 faktorer i taeliglleren er antallet af maringder at faring et par paring Vi bliver noslashdt til at subtrahere mulighederne for 2 par og Full House

P(1 par) = 47010)552(

1221781

)552(

3755552123)348()24(13

KK

KK

Sandsynligheder ved spil 5

Hermed har vi afsluttet vores gennemgang af sandsynlighederne i Poker Bemaeligrk at sandsynlighederne foslashlger rangen af en Pokerharingnd

3 Ruinsandsynligheder ved Roulette mv Beregningen af ruinsandsynligheder er noget som er helt afgoslashrende for forsikringsvirksomhed hvis denne skal drives forretningsmaeligssigt Sammenhaeligngen mellem ruinsandsynligheder og beregning af praeligmiestoslashrrelserne en ret kompliceret matematisk teori som betegnes forsikringsmatematik Paring universiteterne findes en saeligrlig uddannelse som kaldes aktuar studiet som har dette som speciale Forsikringsmatematik kan illustreres ved at betragte roulettespil paring et Casino En roulette har 37 felter nummereret 0 ndash 36 Hvis man vinder paring et felt faringr man udbetalt 36 gange indsatsen Da man har lagt en indsats er gevinsten 35 indsatser Hvis X er den stokastiske variabel som betegner en spillers gevinst saring antager X vaeligrdierne +35 med sandsynlighed 137 og ndash1 med sandsynlighed 3637

P(X = 35) = 137 og P(X = -1) = 3637 Middelgevinsten naringr man spiller paring et felt er foslashlgelig

(31) 37

1

37

36)1(

37

135)()()(

Uu

uPuXXE

Hvis spilleren i stedet vaeliglger at spille paring m felter antager gevinsten X vaeligrdierne 36 - m med sandsynlighed m37 og ndashm med sandsynligheden (37 - m)37 = 1 - m37 Middelgevinsten bliver herefter

37

)37

1)((37

)36()()()(mm

mm

muPuXXEUu

Middelgevinsten pr indsats er saringledes uafhaeligngig af hvor mange felter man spiller paring Hermed er det slaringet fast Der findes intet system der kan bringe eacuten i stand til at vinde paring en roulette paring laeligngere sigt Dette er en simpel matematisk kendsgerning som mange har maringttet erkende paring en betydelig mere smertelig maringde Specielt hvis man spiller paring m = 18 felter er gevinsten 36-18=18 med sandsynlighed 1837 og ndash18 med sandsynlighed 1937 Selvom en spiller ikke kan vinde i det lange loslashb har spilleren paring grund af tilfaeligldigheder (som spillere foretraeligkker at kalde held) mulighed for at vinde betragtelig store beloslashb Vi vil nu lave nogle betragtninger over hvor stor sandsynlighed en spiller har for at spraelignge banken dvs at ruinere et Casino En saringdan beregnet sandsynlighed kaldes for ruin sandsynligheden

Ruinsandsynligheder 6

Vi antager at Banken raringder over n-enheder (indsatser) Vi oslashnsker at vurdere sandsynligheden for at en uendelig rig spiller der goslashr den samme indsats i hvert spil vinder n eller flere enheder naringr der ikke er nogen begraelignsning paring antallet af spil Ruinsandsynligheden for banken betegner vi rn Hvis X1 X2 X3 betegner Casinorsquoets gevinst ved de enkelte spil er

Gk = X1 + X2 +X3++Xk gevinsten efter k-spil Ruinsandsynligheden kan derfor formuleres derhen at

rn = P( 0kG for et eller andet k)

(Der er ingen umiddelbar sammenhaeligng mellem n og k) Der gaeliglder rekursions-formlen

rn+1 = rn r1

som udtrykker at sandsynligheden for at blive ruineret med n+1 enheder er lig sandsynligheden for at blive ruineret med n enheder gange sandsynligheden for at blive ruineret med eacuten enhed Dette fordi vi antager at hvert spil er uafhaeligngigt af de oslashvrige Heraf foslashlger umiddelbart

r2 = r1+1 = r1 r1 = r12 r3 = r2+1 = r2 r1 = r1

3 og foslashlgelig

rn = r1n

For at beregne en ruinsandsynlighed ser vi foslashrst paring tilfaeligldet hvor en spiller saeligtter sin indsats paring 18 felter pr spil Her er Casinorsquoets gevinst +18 eller ndash18 pr spil For nemheds skyld saeligtter vi de 18 indsatser til at vaeligre en enhed = 1 Vi opstiller da foslashlgende rekursionsligning som tager udgangspunkt i det foslashrste spil Sandsynligheden for at banken bliver ruineret med n enheder er lig med Sandsynligheden for at banken vinder det foslashrste spil (hvor den vinder en enhed) gange sandsynligheden for at banken bliver ruineret med n+1 enheder plus sandsynligheden for at banken taber det foslashrste spil (hvor den mister en enhed) gange sandsynligheden for at banken bliver ruineret med n-1 enheder Sandsynlighederne for at banken vinder og taber er 1937 og 1837 Vi kan da opstille ligningen

1

1

1

1111 37

18

37

19

37

18

37

19 nnn

nnn rrrrrr

For at opnaring det sidste udtryk har vi anvendt resultatet af rekursionsligningen rn = r1

n Det er relativt nemt at bestemme r1 ud fra denne ligning Ved division af ligningen med r1

n-1 faringr man

Ruinsandsynligheder 7

018371937

18

37

191

21

211

rrrr

Den sidste 2gradsligning kan loslashses paring normal vis idet diskriminanten d =372 ndash 4middot19middot18 = 1 saring

119

18

38

36

192

137111

rrr

Vi er kun interesseret i loslashsningen r1 = 1819

Ifoslashlge ovenstaringende er nrr nn )

19

18(1

Vi vil herefter besvare sposlashrgsmaringlet Hvor mange enheder skal banken have for at der er mindre end 1 chance for ruin Dette er ensbetydende med at loslashse ligningen

1785)

19

18ln(

)010ln(010)

19

18( nn

Husker vi at en enhed svarede til 18 indsatser giver dette beskedne 1533 indsatser Hvis en spiller derimod spiller paring saeligdvanlig vis med kun at placere en indsats paring eacutet felt er dette - lidt overraskende ndash betydelig mere risikabelt for banken Vi opstiller igen en rekursionsligning med udgangspunkt i det foslashrste spil Sandsynligheden for at banken bliver ruineret med n enheder er lig med Sandsynligheden for at banken vinder det foslashrste spil (hvor den vinder en enhed) gange sandsynligheden for at banken bliver ruineret med n+1 enheder plus sandsynligheden for at banken taber det foslashrste spil (hvor den mister 35 enhed) gange sandsynligheden for at banken bliver ruineret med n-35 enheder Sandsynlighederne for at banken vinder og taber er 3637 og 137 Vi kan da opstille ligningen

351

111351 37

1

37

36

37

1

37

36 nnn

nnn rrrrrr

Ved division med (r1)

n-35 og omordning af leddene og ved at saeligtte r1 = x faringr man ligningen

36x36 ndash 37x35 +1 = 0 Denne ligning kan kun loslashses ved numeriske metoder og man finder loslashsningen x = 09984 Hvis vi igen stiller sposlashrgsmaringlet Hvor mange indsatser skal banken raringde over for at der er mindre end 1 chance for ruin skal vi loslashse ligningen

Ruinsandsynligheder 8

2876)99840ln(

)010ln(010)99740( nn

Altsaring en betydelig stoslashrre beholdning end hvis spilleren spiller paring 18 felter Forsoslashger vi at udregne ruinsandsynligheden for en spiller der har n enheder og laeliggger sin indsats paring eacutet felt kommer vi efter helt det samme raeligsonnement frem til foslashlgende rekursionsligning

35137

11137

36

37

1

37

361351

nn rrrrrr

nnnn

som foslashrer til ligningen x36 ndash 37x +36 = 0 Denne ligning har kun loslashsningen x = 1 Differentieres nemlig f(x) =x36 ndash 37x +36 finder man f (x) =36x35 ndash 37 Ligningen f (x) =0 har

loslashsningen 136

3735 x Da f (x) lt 0 for x lt 1 har den ingen roslashdder mindre end 1

Ruin-sandsynligheden for en spiller der garingr paring et Casino som har en ubegraelignset beholdning er 1 Saring vi kan endnu engang fastslaring at hvis man fortsaeligtter med at spille paring et Casino vil man altid blive ruineret i det lange loslashb Man kunne selvfoslashlgelig overveje ruinsandsynlighederne hvis Casino har beholdningen n og en spiller har beholdningen m (n gt m eller omvendt) men svaret vil afhaelignge af n og m og de indgaringende to ulineaeligre ligninger med to ubekendte med meget hoslashje eksponenter er ikke saring nemme at loslashse numerisk ndash selv paring en Computer Hvis n gtgt m vil svaret stort set vaeligre det samme

Strategier ved spil 9

Kap 2 Strategier ved spil

1 Forskellige spil Efter at have udregnet vindersandsynligheder i forbindelse med spil skal vi nu se paring noget andet som ogsaring er knyttet sammen med sandsynlighedsregningen nemlig problemet med at fastlaeliggge den bedste strategi naringr man spiller et spil Her skal spil imidlertid forstarings i en meget videre betydning det vaeligre sig krig boslashrsspekulation jagt eller fiskeri paring en bestemt dyreart Sidstnaeligvnte er dog alt for komplicerede til at kunne behandles elementaeligrt Faeliglles er det dog at man skal kunne beregne sandsynligheden for en bestemt konsekvens af et givet traeligk Vi vil begynde med at give nogle meget simple eksempler paring spil hvor det er meningsfuldt at tale om optimal strategi Vendingen den optimale strategi indebaeligrer at spillet afvikles i et endeligt antal trin og at der for hvert trin i spillet er mulighed for at forbedre sin gevinst og mulighed for at miste sin gevinst helt eller delvis Man skal endvidere have mulighed for at standse spillet ved ethvert trin og inkassere sin gevinst

11 Mandags-chancen I dette spil som har vaeligret lanceret af TV2 har man en raeligkke tildaeligkkede felter med beloslashb (101025255050100100250) x 1000 kr Man har maximalt 3 forsoslashg Man faringr beloslashbet paring det sidst afdaeligkkede felt Nedenfor er vist en computer simulation af spillet efter 2 traeligk Det er nok klart at hvis man afdaeligkker et felt med 10 i 1 eller 2 forsoslashg skal man fortsaeligtte eller hvis man afdaeligkker et felt med 100 eller 250 i 1 eller 2 forsoslashg skal man standse Men hvad hvis man afdaeligkker et felt med 50 i 1 eller 2 forsoslashg Det vil vi forsoslashge at afgoslashre ved nogle mere matematiske betragtninger

12 Skaeligbnen Et spil som vist nok kommer fra orienten Det spilles med to terninger Foslashrst slaringr man et slag med de to terninger og summen af deres oslashjental betegnes skaeligbnen

Strategier ved spil 10

Man kan nu slaring lige saring mange gange man vil (max 100) Hvis oslashjentallene ikke er lig skaeligbnen saring adderes dette til ens pointtal men hvis man slaringr sin skaeligbne mister man alt Nedenfor er vist et trin i en animeret computer simulation af spillet Naringr spillet er standset fordeler man indsatsen i forhold til spillernes opnaringede pointtal Det gaeliglder derfor om at have de stoslashrste pointtal Problemet er imidlertid hvornaringr det er optimalt at standse naringr man kender sin skaeligbne

13 Indbrudstyvens pensionsproblem Dette er en variant af mange forskellige optimeringsproblemer Arthur er indbrudstyv Hver tyvetugt giver i snit K kr Chancen for at Arthur bliver snuppet er p Hvis han bliver taget mister han alt fra sine tidligere tyvetugter Hvor mange indbrud skal Arthur lave foslashr han standser sin karriere og vaeliglger at leve af sin opsparing

14 Taeligndstikspillet Dette spil falder lidt uden for rammerne af de oslashvrige spil fordi man ikke kan standse spillet og fordi man aldrig kan miste noget af sin gevinst Det kan derfor ikke umiddelbart behandles paring samme maringde som de hidtil naeligvnte spil Alligevel er det et spil der udpraeligget kan behandles med matematiske teorier for den bedste strategi Spillet garingr ud paring at man paring 10 taeligndstikker farver den ene side roslashd Kastes taeligndstikken op er sandsynligheden for at den farvede side vender opad naringr den lander paring bordet lig med p = 025 Hver spiller har fra starten tallene 110 Hvert tal maring kun bruges 1 gang Man skiftes til at kaste de 10 taeligndstikker og notere antallet af farvede taeligndstikker Dette antal skal saring ganges med et af de resterende tal 110 Den som efter 10 spil har den hoslashjeste sum har vundet Det kan oplyses og let verificeres at den maximale gevinst er 550 Middelgevinsten hvor man vaeliglger tilfaeligldig er 1375 og den optimale middelgevinst er ca 167

Strategier ved spil 11

15 Casino Roulette spil falder ogsaring lidt uden for rammerne af optimale strategier af den meget simple grund at odds er svagt imod eacuten Det gaeliglder dog ikke for Blackjack hvor man kan udvikle en strategi som giver en svag fordel Hvis odds er imod eacuten vil man imidlertid altid tabe i det lange loslashb Som tidligere fastslaringet er den eneste mulighed - i det lange loslashb - for at undgaring ruin i roulettespil at der ikke er nogen oslashvre graelignse for indsatser og at man har flere penge end Casionorsquoet og ingen af disse to betingelser er nogensinde opfyldt Enhver fornuftig matematisk spil-teori vil derfor som resultat have at man skal standse foslashr det foslashrste spil Det vil sige Man skal lade vaeligre med at garing paring Casino Denne kendsgerning udelukker dog ikke at man kan goslashre sig overvejelser over hvordan man kan spille hvis man ikke udelukkende er interesseret i at foraeligre sine penge til et Casino uden kamp

2 Optimale Strategier Hvis man intuitivt skal formulere en strategi for de 3 foslashrste spil naeligvnt ovenfor saring kan man feks vaeliglge eacuten af 3 foslashlgende strategier 1 Man beslutter paring forharingnd hvor stor ens gevinst (eller tab) skal vaeligre foslashr man stopper Dette er

faktisk en meget almindelig strategi men den er bestemt ikke optimal 2 Man fortsaeligtter saring laelignge man i middel har mulighed for at foroslashge sin gevinst i naeligste spil Man

skal huske paring at middelvaeligrdien af gevinsten ogsaring omfatter tab saring middelvaeligrdien (i matematisk forstand) skal vaeligre positiv Denne umiddelbart fornuftige strategi kaldet den kortsigtede eller myope strategi er i mange tilfaeliglde ogsaring den optimale strategi (dog ikke i mandagschancen)

3 Man fortsaeligtter saring laelignge man i middel har mulighed for at foroslashge sin gevinst i et af de

efterfoslashlgende spil Denne strategi kaldes den langsigtede strategi Baringde den kortsigtede og den langsigtede strategi ser yderst rimelige ud og de vil ogsaring vaeligre optimale for langt de fleste spil Hvis der er forskel paring den langsigtede og den kortsigtede strategi skal man anvende den langsigtede - naturligvis Der findes imidlertid visse former for spil hvor ingen af strategierne er optimale Det gaeliglder feks for boslashrsspekulanter der har en beholdning aktier som de vil saeliglge naringr kurserne stiger Dette fortsaeligtter som bekendt aldrig i det uendelige Paring et vist tidspunkt standser stigningen og kurserne begynder at falde ndash som regel ndash hurtigere end de steg Hvornaringr skal man saeliglge for at opnaring den stoslashrste gevinst Det viser sig - men det er saeligrdeles kompliceret at redegoslashre for ndash at naringr det gaeliglder boslashrs spekulation saring er ingen af strategierne 2 og 3 optimale De vil begge to i grove traeligk som resultat have at man enten skal saeliglge straks eller vente til man er ruineret Vi vil nu give en beskrivelse af den optimale strategi som er udviklet af Snell Vi vil overhovedet ikke naeligrme os et bevis for at det er den optimale strategi (beviset er ret teknisk abstrakt) men

Strategier ved spil 12

understrege at det kan bevises I matematisk forstand Ulemperne ved Snell-strategien er at den for selv simple problemer kan foslashre til ret omfattende og komplicerede regninger

2 Den optimale Snell-strategi Snell-strategien er paring sin vis den samme som den kortsigtede strategi men hvor man i denne strategi hele tiden regner sig et skridt frem saring tager Snell-strategien udgangspunkt i spillets slutning og arbejder sig baglaeligns Vi indfoslashrer foslashrst nogle betegnelser Vi antager at spillet har n trin Sk er en stokastisk variabel der angiver den faktiske samlede gevinst man har opnaringet ved det kte spil Sk kan antage en eller flere vaeligrdier med tilhoslashrende sandsynligheder Det nye ved Snell-strategien er at man definerer endnu en stokastisk variabel Gk ved ligningen

Gk = maxSk E(Gk+1| S1Sk) Gk er den stoslashrste af vaeligrdierne Sk (gevinsten efter det kte spil) og E(Gk+1| S1Sk)) som er middelvaeligrdien af den maximale forventede gevinst i det k+1te spil naringr det er givet at man har spillet spillene 1k Dette opstilles i et skema Gn = Sn Gevinsten ved spillets afslutning Gn-1 = maxSn-1 E(Gn| S1Sn-1) Gk = maxSk E(Gk+1| S1Sk) G1 = maxS1 E(G2| S1) Snell strategien siger nu at man skal standse spillet den foslashrste gang Sk (gevinsten efter det kte spil) overstiger middelvaeligrdien af den maksimale forventede gevinst i det k+1te spil Dette kaldes for stopbetingelsen Stopbetingelsen er altsaring

Sk E(Gk+1| S1Sk) Man skal altsaring standse spillet naringr den opnaringede gevinst er stoslashrre eller lig med den betingede forventning af den maximale gevinst i det naeligste spil Det kunne lyde som den kortsigtede strategi men forskellen er den at i den kortsigtede strategi er Gk+1 erstattet af Sk+1 At kunne gennemskue konsekvenserne af dette er derimod ikke saring nemt Det viser sig at i mange tilfaeliglde at er Snell-Strategien identisk med den kortsigtede strategi som kraeligver at man stopper naringr Sk E(Sk+1| S1Sk) Snell strategien er ikke umiddelbart let gennemskuelig og udregningen af de betingede middelvaeligrdier E(Gk+1| S1Sk) er ofte ret teknisk Vi vil nu behandle de foslashr naeligvnte eksempler og begynder med

Strategier ved spil 13

21 Indbrudstyvens pensionsproblem Lad os antage at Arthurs gennemsnitlige gevinst ved hvert tyvetogt er K = 6000 kr og at chancen er at han bliver taget er 5 Lad os antage at hans hidtidige gevinst efter k - tyvetugt er Sk som bliver konfiskeret - og som han derved mister hvis han bliver snuppet I dette tilfaeliglde kan man - som vist nedenfor - se at den kortsigtede strategi er den optimale strategi Det haelignger sammen med at alle trin i spillet er identiske Gevinsten ved hvert tyvetogt er den samme ndash uafhaeligngigt af de foregaringende tyvetugter - bortset fra at den samlede gevinst vokser ved hvert vellykket tyvetogt Xk betegner den stokastiske variabel som er Arthurs gevinst ved eacutet tyvetugt Hermed er

Sk =X1+ X2+ X3+hellip Xk Xk+1 kan antage vaeligrdien K med sandsynlighed 1-ps = 1-P(Snuppet) (altsaring hvis det naeligste tyvetugt lykkes) og vaeligrdien ndashSk (han mister hele sin opsparing) med sandsynlighed ps = P(Snuppet) Vi opskriver nu Snell-strategien (Den kortsigtede strategi) for et trin i hans karriere

Gk = max Sk E(Sk+1| 1k)

Sk er hans gevinst efter k tyvetugter og E(Sk+1| 1k) er hans forventede gevinst efter k+1 tyvetugter E(Sk+1| 1k) kan beregnes som den hidtidige gevinst plus den forventede gevinst ved naeligste tyve- tugt i alt lig med Sk + E(Xk+1) E(Xk+1) er uafhaeligngig af de foslashrste k - tyvetugter derfor bliver stopbetingelsen Sk gt Sk + E(Xk+1) E(Xk+1) lt 0 Middelvaeligrdien E(Xk+1) kan saringledes udregnes efter den saeligdvanlige definition idet Xk+1 antager vaeligrdierne K (gevinsten ved et tyvetugt) og - Sk (mister hele sin opsparing) med sandsynlighederne 1-ps og ps henholdsvis E(Xk+1) = K(1- ps) - Sk ps Han skal standse naringr

E(Xk+1) lt 0 K(1- ps) lt Sk ps som med tal eksemplet giver

6000095 lt Sk005 Sk gt 114000- kr svarende til 114006000 = 095005 = 19 tyvetugter

(Det goslashr han nu nok ikke og er derfor henvist til at leve af folkepensionen efter nogle aringr i skyggen) Man kunne godt tro at dette eksempel kunne anvendes paring andre (ligesaring uetiske) problemstillinger Feks hvor mange gange det er optimalt at koslashre gratis i S-tog Det kan det imidlertid ikke helt

Strategier ved spil 14

Sagen er jo den at man faringr en fast boslashde hvis man bliver snuppet men man kommer ikke til at betale for de gange man har koslashrt gratis Med andre ord vurderingen om hvorvidt det er fordelagtigt at koslashre uden billet afhaelignger kun af middelgevinsten ved det naeligste forsoslashg Hvis den er positiv er det fordelagtigt at fortsaeligtte men hvis den er negativ er det fordelagtigt at loslashse billet (Det er i oslashvrigt uetisk at snyde ndash naturligvis) Tager vi et eksempel billetprisen er kr 50- Boslashden er kr 500 Sandsynligheden for at blive snuppet er Ps = 01 Hvis X er gevinsten ved at koslashre uden billet er E(X) = 50middot(1-Ps)-500middotPs = 50middot09-500middot01 = -50 Det er saringledes (med denne sandsynlighed for at blive snuppet) ikke fordelagtigt at koslashre uden billet i S-tog Da en laeligrebog i sandsynligheder ved spil naturligvis ikke maring tilskynde til uetiske handlinger undlader vi at foretage beregningen med Ps = 005

22 Skaeligbnen Vi betragter kast med to terninger X betegner summen af oslashjentallene ved eacutet kast Sandsynlighedsfordelingen for X er velkendt Feks er P(X=5) = 436 Sandsynligheden for at terningerne viser j oslashjne kan skrives som

36

76)(

jjXP

Lad os antage at spillerens skaeligbne er q Hvis man slaringr dette oslashjental er alt tabt Ellers adderes oslashjentallene for hvert kast Hvis ikke man har slaringet sin skaeligbne saring er den samlede gevinst efter n spil

Sn = X1+ X2+ X3+hellip +Xn

Og middelvaeligrdien af Sn er

E(Sn) = E(X1)+ E(X2)+E(X3)+hellip +E(Xn) = nE(X | X q) E(X | X q) er den betingede middelvaeligrdi af oslashjentallene givet at man ikke slaringr sin skaeligbne

E(X | X q) = 2P(2) +3P(3)+hellip(q-1)P(q-1) + (q+1)P(q+1)+hellip+12P(12) Den kortsigtede strategi (og Snell strategien) fastslaringr at man skal standse naringr middelvaeligrdien af den forventede gevinst ved naeligste kast er negativ Argumentet for dette kan overtages naeligsten ordret fra indbrudstyvens pensionsproblem E(Sk+1|S1 Sk) kan beregnes som den hidtidige gevinst Sk plus den forventede gevinst ved det naeligste kast i alt lig med Sk + E(Xk+1| S1 Sk) Stopbetingelsen er derfor

Sk gt Sk + E(Xk+1| S1 Sk) E(Xk+1| S1 Sk) lt 0

Strategier ved spil 15

E(X | X q) ndash SnP(q) lt 0 Sn gt E(X | X q) P(q) Det er ikke saeligrlig svaeligrt at udregne stopbetingelsen feks for q = 2 og q = 6 Nedenfor er vist udskriften fra et program som foretager beregningen for q = 212 Forventet gevinst i naeligste kast naringr ens skaeligbne er q q 2 3 4 5 6 7 8 9 10 11 12 694 683 667 644 617 583 589 600 617 639 667 Stop naringr din gevinst S gt EX(q)P(q) naringr skaeligbne er q q 2 3 4 5 6 7 8 9 10 11 12 25000 12300 8000 5800 4440 3500 4240 5400 7400 11500 24000

Som det fremgaringr er der endog meget stor forskel paring stoptiderne afhaeligngig af ens skaeligbne

23 Mandagschancen Dette spil er lidt mere interessant fordi det ikke er helt saring enkelt at gennemskue I dette tilfaeliglde kan man ikke forvente at den kortsigtede strategi vil foslashre til den optimale strategi At den faktisk goslashr det skyldes talvaeligrdierne Dette skal forstarings saringledes at hvis man aeligndrede paring praeligmiestoslashrrelserne ville Snell-strategien afvige fra den kortsigtede strategi Vi vil analysere spillet ved Snell-strategien Som naeligvnt har man i spillet 9 tildaeligkkede felter (101025255050100100250) Man kan afdaeligkke hoslashjest 3 felter Man faringr beloslashbet i 1000 kr som det sidste felt viser Hvis X er den stokastiske variabel som angiver vaeligrdien af et felt saring vil de fleste uden saring lange overvejelser vel fortsaeligtte hvis Xlt50 og standse hvis X100 Det kritiske er hvis man afdaeligkker 50 (X=50) Vi bemaeligrker foslashrst at summen af alle felterne er S=620 og at E(X) =6209=689 Vi opskriver foslashrst den fuldstaeligndige Snell-strategi for dette spil G3 =X3 Den Stokastiske variabel G3 = Gevinsten = X3 = vaeligrdien af det sidst afdaeligkkede felt G2 = max X2 E(G3| X1X2 ) Den stoslashrste af vaeligrdierne X2 (= vaeligrdien af det afdaeligkkede

felt) og den betingede middelvaeligrdi af G3 = X3 G1 = max X1 E(G2| X1 ) Som ovenfor Kriteriet for den optimale strategi er som tidligere Stop hvis paring noget trin Xk gt E(Gk+1| X1Xk ) Det er relativ nemt at opstille en formel for E(G3| X1X2 ) Naringr X1 og X2 er afdaeligkket er summen de resterende felter S - X1 - X2 Da alle felter har samme sandsynlighed er middelvaeligrdien simpelthen middeltallet af felterne E(G3| X1X2 ) = ( S - X1 - X2)(9-2)

Strategier ved spil 16

Det er noget mere teknisk at opstille en formel for E(G2| X1 ) og ogsaring lidt teknisk at foretage beregningen Vi vil noslashjes med at skitsere beregningen for en vaeligrdi af X1 og i oslashvrigt henvise til resultatet af et Computerprogram som kan ses nedenfor Lad os antage at X1 = 25 Vi lader nu X2 gennemloslashbe alle de mulige vaeligrdier (alle vaeligrdier skal taeliglles med det antal gange der er felter med denne vaeligrdi) For hver vaeligrdi af X2 (feks 50) skal vi vaeliglge max af X2 og E(G3| X1X2 ) = ( S - X1 - X2) (9-2) (= (620-50-25)7 = 778 i dette tilfaeliglde) og addere det til en sum S2 E(G2| X1 ) er da lig med S2(9-1) (da der er 9-1 felter X2 ) X2[1]= 1000 E(G3)= 8571 G2= 8571 X2[2]= 2500 E(G3)= 8357 G2= 8357 X2[3]= 5000 E(G3)= 8000 G2= 8000 X2[4]= 10000 E(G3)= 7286 G2= 10000 X2[5]= 25000 E(G3)= 5143 G2= 25000 X1[1]= 1000 E(G[2])= 10786 X2[1]= 1000 E(G3)= 8357 G2= 8357 X2[2]= 2500 E(G3)= 8143 G2= 8143 X2[3]= 5000 E(G3)= 7786 G2= 7786 X2[4]= 10000 E(G3)= 7071 G2= 10000 X2[5]= 25000 E(G3)= 4929 G2= 25000 X1[2]= 2500 E(G[2])= 10679 X2[1]= 1000 E(G3)= 8000 G2= 8000 X2[2]= 2500 E(G3)= 7786 G2= 7786 X2[3]= 5000 E(G3)= 7429 G2= 7429 X2[4]= 10000 E(G3)= 6714 G2= 10000 X2[5]= 25000 E(G3)= 4571 G2= 25000 X1[3]= 5000 E(G[2])= 10500 X2[1]= 1000 E(G3)= 7286 G2= 7286 X2[2]= 2500 E(G3)= 7071 G2= 7071 X2[3]= 5000 E(G3)= 6714 G2= 6714 X2[4]= 10000 E(G3)= 6000 G2= 10000 X2[5]= 25000 E(G3)= 3857 G2= 25000 X1[4]= 10000 E(G[2])= 9643 X2[1]= 1000 E(G3)= 5143 G2= 5143 X2[2]= 2500 E(G3)= 4929 G2= 4929 X2[3]= 5000 E(G3)= 4571 G2= 5000 X2[4]= 10000 E(G3)= 3857 G2= 10000 X1[5]= 25000 E(G[2])= 6268 Ser man resultaterne igennem kan de udmoslashntes i en simpel regel Fortsaeligt paring 50 eller derunder Stop paring 100 eller derover Det er maringske lidt overraskende at man ogsaring skal forsaeligtte paring 50000 hvis man kun har et forsoslashg tilbage ndash man kunne jo ende med 10000 og det er saring bare aeligrgerligt ndash og det er vist nok de fleste som standser ved 50000 - men det er ikke den bedste strategi

Strategier ved spil 17

24 Casino Som naeligvnt i indledningen til dette afsnit findes der ingen strategi som kan bringe en i stand til at vinde paring et Casino ndash i det lange loslashb Vil man goslashre Casino-spil til en levevej vil det altid med matematisk sikkerhed ende med ruin Det betyder imidlertid ikke at man ikke kan vinde ved at garing paring Casino men hvis man taelignker paring at spraelignge banken saring skal to krav i hvert fald vaeligre opfyldt for at der skal vaeligre en ikke forsvindende sandsynlighed for at det kan lade sig goslashre 1 Man skal have flere penge end Casino 2 Der maring ikke vaeligre loft over indsatserne Begge betingelser er som bekendt aldrig opfyldt Man kan som sagt godt vinde paring et Casino men hvis man satser paring at vinde mere (alle de gange man er paring Casino i sit liv) end det beloslashb man medbringer ved hvert besoslashg saring vil chancerne for at tabe det hele vaeligre stoslashrst Her er der tale om sandsynligheder og middelvaeligrdier ndash om odds Selvfoslashlgelig er de muligt at tabe hele sin formue ved foslashrste besoslashg eller vinde det tredobbelte ved det andet Der har i tidens loslashb vaeligret lanceret flere eksempler paring vinderstrategier som lyder uhyre besnaeligrende Den mest kendte er Martingale-systemet Man spiller kun paring sort og roslashd hvor faringr man faringr fordoblet sin indsats hvis man vinder Spillet er saringledes helt lige bortset fra at indsatserne bliver liggende naringr zero kommer ud og man kun faringr sin indsats en gang hvis man vinder i naeligste spil (zero har ingen farve) Spiller man efter Martingale-systemet skal man inkassere sin gevinst hvis man vinder Hvis man derimod taber skal man fordoble sin indsats Vi saeligtter grundindsatsen til 1 Har man spillet n gange og dermed doblet op n-1 gange har man lagt en indsats Sn = 1 + 2 + 22 +hellip2n-1 = 2n ndash1 Udregnet af kvotientraeligkkeformlen

1

10

q

qaS

n

n

for raeligkken Sn = a0 + a0q+ a0q

2+hellip+ a0qn-1

Vinder man det nte spil faringr man udbetalt 22

n-1 = 2n saring ens gevinst er 2n - (2n - 1) = 1 Der gaeliglder aringbenbart den simple kendsgerning at bliver man bare ved med at fordoble saring har man altid vundet eacuten indsats Foslashr man forsoslashger sig med dette skal man dog nok goslashre sig klart hvor mange gange man kan tabe foslashr man er ruineret

Strategier ved spil 18

Sandsynligheden for at man taber 5 spil er (frac12)5 = 132 Man har da tabt 25 ndash 1 gange vaeligrdien af en jeton (i Danmark 50 kr) dvs 1550 kr Vil man sikre sig bedre feks ved at kunne doble op 9 gange (sandsynligheden for at tabe 10 spil er 11024) saring skal man komme med kr 51150- men det kan man ikke engang gennemfoslashre da hoslashjeste indsats i Danmark er 24000- Man kunne imidlertid stille det sposlashrgsmaringl Hvis man har n-jetoner hvad er saring sandsynligheden for at vinde q-jetoner hvis man spiller efter Martingale-systemet Dette kan man faktisk godt udregne direkte men regningerne er ret omfattende Derimod er resultatet simpelt Vi vil ikke lave en direkte udregning men anvende de samme metoder som vi har anvendt for den bedste strategi Vi tager udgangspunkt i det faktum at sort roslashd Casino spil er et lige spil saring middelvaeligrdien af gevinsten er 0 ligegyldigt hvordan man spiller Middelvaeligrdien (som er nul ) af en gevinst paring q-jetoner er lig med q gange sandsynligheden P(q) for at vinde q jetoner minus ens kapital (n jetoner) gange med sandsynligheden for at man taber det sidste spil som er 1 ndash P(q)

qP(q) ndash n(1 ndashP(q)) = 0 qn

nqP

)(

Har man feks n = 31 jetoner (1550- kr) er sandsynligheden for at vinde q=10 (500 kr) lig med 0756 En rimelig stor sandsynlighed men altsaring stadig 25 chance for ruin Oslashnsker man derimod at blive rigtig rig og vinde 10000- kr dvs q=200 er P(200) = 0134 Konklusionen er den at satser man paring at vinde mere end man medbringer saring er sandsynligheden mindre end frac12 men kan man noslashjes med mindre saring er sandsynligheden stoslashrre end frac12 Men bemaeligrk dette gaeliglder fra foslashrste gang man garingr ind paring et Casino til man beslutter at holde op

25 Taeligndstikspillet Som beskrevet ovenfor garingr spillet ud paring at farve den ene af siderne roslashd paring 10 taeligndstikker Naringr taeligndstikken kasten op i luften er sandsynligheden for at den roslashde side vender opad naringr den rammer bordet lig med p=025 Man kaster paring skift 10 saringdanne taeligndstikker 10 gange For hvert kast skal man multiplicere antallet af roslashde med et af tallene 110 Hver tal maring kun bruges eacuten gang Den der faringr den stoslashrste sum har vundet Det er klart at en god strategi i det lange loslashb vil give en hoslashjere sum Vi minder om at antallet af X roslashde taeligndstikker er binomialfordelt med primaeligrsandsynlighed p og antalsparameter n=10

102104

3

4

110)(

10

jj

jXPjj

Strategier ved spil 19

Endvidere vil vi anvende de kumulerede sandsynligheder P(X j) og P(X j) Nedenfor er vist resultatet af en Computersimulation af spillet Primaeligr sandsynligheder for n= 10 og p= 0250 P(X=j) j 0 1 2 3 4 5 6 7 8 9 10 00563 01877 02816 02503 01460 00584 00162 00031 00004 00000 00000 Baglaeligns kumulerede sandsynligheder P(Xgt=q) j 0 1 2 3 4 5 6 7 8 9 10 10000 09437 07560 04744 02241 00781 00197 00035 00004 00000 00000 1 kast Antal = 2 Vaeliglg mellem 1 2 3 4 5 6 7 8 910 Faktor= 4 2 kast Antal = 4 Vaeliglg mellem 1 2 3 5 6 7 8 910 Faktor=10 3 kast Antal = 2 Vaeliglg mellem 1 2 3 5 6 7 8 9 Faktor= 5 4 kast Antal = 2 Vaeliglg mellem 1 2 3 6 7 8 9 Faktor= 3 5 kast Antal = 3 Vaeliglg mellem 1 2 6 7 8 9 Faktor= 8 6 kast Antal = 2 Vaeliglg mellem 1 2 6 7 9 Faktor= 6 7 kast Antal = 6 Vaeliglg mellem 1 2 7 9 Faktor=9 8 kast Antal = 3 Vaeliglg mellem 1 2 7 Faktor= 2 9 kast Antal = 2 Vaeliglg mellem 1 7 Faktor= 7 10 kast Antal = 2 Vaeliglg mellem 1 Faktor= 1 Din score er 176 Valget af tallene 110 er i dette tilfaeliglde foretaget ud fra den optimale strategi som vi vil omtale om et oslashjeblik Foslashr vi analyserer den optimale strategi for dette spil vil vi forsoslashge os med en intuitiv bedste strategi Vi belyser denne strategi med et konkret eksempel Lad os feks antage at vi slaringr 4 roslashde i den 3 kast (3 forsoslashg) De tal vi har tilbage kalder vi (y8 y7 y6 y5 y4 y3 y2 y1) Sposlashrgsmaringlet om vi skal gange med det stoslashrste y8 eller det naeligststoslashrste y7 osv Vi raeligsonnerer da som foslashlger Hvis sandsynligheden for at slaring mere end 4 roslashde i de resterende 7 kast er stoslashrre end frac12 saring skal vi vaeliglge det naeligststoslashrste Vi skaeligrper dette Hvis sandsynligheden for at slaring mindst 5 roslashde mindst en gang i de resterende 7 kast er stoslashrre end frac12 saring skal vi vaeliglge det naeligststoslashrste Tilsvarende hvis sandsynligheden for at slaring mindst 5 roslashde mindst 2 gange i de resterende 7 kast skal vi vaeliglge det 3 stoslashrstehellipog saringdan fremdeles Strategien virker umiddelbart meget plausibel Sandsynlighederne kan direkte farings af binomialfordelingen Foslashrst sandsynligheden for at faring mindst q-roslashde i et kast Dette er

P(X q) =

n

qj

jXP )( hvor P(X = j) er angivet ovenfor

Strategier ved spil 20

Sandsynligheden for at dette sker mindst r gange i n - k kast er ogsaring en binomialfordeling og kan skrives

P(X q mindst r gange i n - k kast ) = jknjkn

rj

qXPqXPj

kn

))(1()(

Beregningen af disse (110) sandsynligheder goslashres nok lettest paring en computer For at lave en strategi-tabel goslashr man det at for hvert kast og hvert antal mulige roslashde vaeliglger man foslashrst det stoslashrste af de resterende tal Dernaeligst beregner man sandsynligheden for at faring mindst 1 roslashd mere i et af de foslashlgende kast Hvis denne sandsynlighed er stoslashrre end frac12 ser man paring det naeligststoslashrste af de resterende tal Man beregner saring sandsynligheden for at faring mindst 1 roslashd mere i mindst to af de resterende kast Hvis denne sandsynlighed er stoslashrre end frac12 saring vaeliglger man det tredjestoslashrste af de resterende tal og saringdan fremdeleshellip Det bemaeligrkes at beregningen skal initialiseres med at man altid vaeliglger det mindste hvis man slaringr 0 roslashde og altid vaeliglger det stoslashrste hvis man slaringr 10 roslashde Nedenfor er vist en computerberegning af en strategi-tabel Endvidere er ogsaring lavet en saringkaldt Monte-Carlo simulation Dette betyder at man har ladet maskinen spille feks 10000 spil spillet efter strategi-tabellen Nederst er vist hyppighederne for ens score og endelig fordelingsfunktionen for observationerne (Den kumulerede frekvens) P(X =j) for n =10 and p = 0250 j 0 1 2 3 4 5 6 7 8 9 10 P(X =j)0056 0188 0282 0250 0146 0058 00162 0003 00004 0000 0000 P(Xgt=j) for n =10 and p = 0250 j 0 1 2 3 4 5 6 7 8 9 10 P(Xgt=j) 1000 0944 0756 0474 0224 0078 00197 00035 00004 0000 0000 Strategi tabel Tallene refererer ikke til faktorene selv men til den stoslashrste naeligststoslashrste osv Eksempel Hvis man slaringr 3 roslashde i den andet kast saring skal man vaeliglge (7) den tredjestoslashrste Kast no 1 2 3 4 5 6 7 8 9 10 score 0 1 1 1 1 1 1 1 1 1 1 1 3 3 3 2 2 2 2 1 1 1 2 6 5 5 4 4 3 3 2 2 1 3 8 7 7 6 5 4 3 3 2 1 4 9 9 8 7 6 5 4 3 2 1 5 10 9 8 7 6 5 4 3 2 1 6 10 9 8 7 6 5 4 3 2 1 7 10 9 8 7 6 5 4 3 2 1 8 10 9 8 7 6 5 4 3 2 1 9 10 9 8 7 6 5 4 3 2 1 10 10 9 8 7 6 5 4 3 2 1 Gennemsnitlig score = 16437

Strategier ved spil 21

Hyppighed af score h( 75)= 1 h( 80)= 7 h( 85)= 3 h( 90)= 5 h( 95)= 6 h(100)= 34 h(105)= 38 h(110)= 82 h(115)= 68 h(120)=161 h(125)=146 h(130)=320 h(135)=280 h(140)=534 h(145)=425 h(150)=752 h(155)=577 h(160)=878 h(165)=645 h(170)=956 h(175)=651 h(180)=863 h(185)=527 h(190)=609 h(195)=351 h(200)=389 h(205)=180 h(210)=203 h(215)= 93 h(220)= 86 h(225)= 47 h(230)= 32 h(235)= 21 h(240)= 13 h(245)= 8 h(250)= 3 h(255)= 0 h(260)= 4 h(265)= 1 h(270)= 1 h(275)= 0 h(280)= 0 Frekvens of score F( 80)=00008 F( 85)=00011 F( 90)=00016 F( 95)=00022 F(100)=00056 F(105)=00094 F(110)=00176 F(115)=00244 F(120)=00405 F(125)=00551 F(130)=00871 F(135)=01151 F(140)=01685 F(145)=02110 F(150)=02862 F(155)=03439 F(160)=04317 F(165)=04962 F(170)=05918 F(175)=06569 F(180)=07432 F(185)=07959 F(190)=08568 F(195)=08919 F(200)=09308 F(205)=09488 F(210)=09691 F(215)=09784 F(220)=09870 F(225)=09917 F(230)=09949 F(235)=09970 F(240)=09983 F(245)=09991 F(250)=09994 F(255)=09994 F(260)=09998 F(265)=09999 F(270)=10000 F(275)=10000

Som det fremgaringr af tabellen for P(X gt= j) er der kun 78 chance for at slaring 5 roslashde eller derover saring goslashr man det skal man altid vaeliglge det stoslashrste af de resterende tal For 3 eller 4 roslashde er situationen langt mere uigemmeskuelig og kun en beregning kan afgoslashre sagen Vi proslashver nu at finde den optimale strategi eller Snell-strategien Hvad angaringr sposlashrgsmaringlet om hvorvidt vi skal vaeliglge den stoslashrste eller naeligststoslashrste saring lader det sig faktisk goslashre at beregne Snell-strategien paring en computer De foslashlgende tilfaeliglde bliver derimod for komplicerede og der anvender vi en svagt forbedret version af vores intuitive strategi Forbedringen bestaringr i foslashlgende idet vi illustrerer det med et eksempel Lad os sige vi har slaringet 3 roslashde og vi overvejer om vi vil gange det med 7 eller 6 Ganger vi med 6 er det fordi vi forventer at slaring mindst 4 roslashde mindst en gang i de resterende kast Vores score vil vaeligre 73 og 74 henholdsvis og scoren vil blive forbedret med en faktor 43 hvis vi ganger med 6 under forventning af at slaring 4 roslashde Vores forbedring af strategien garingr da ud paring at vi vaeliglger det naeligststoslashrste 6 hvis sandsynligheden for at slaring 4 roslashde gange den relative forbedring 43 er stoslashrre end frac12 Vi rekapitulerer dernaeligst Snell-strategien G10 = X10 X10 Stokastisk variabel = antallet af roslashde i det 10 kast G9 = max X9 E(G10) E(G10) = E(X10) = np=10025 = 25 X9 = 01hellip10 Gk = max Xk E(Gk+1) E(Gk) kraeligver en laeligngere udregning men den udregnes som en

almindelig middelvaeligrdi altsaring som max af de to vaeligrdier gange P(X=Xk-1) G1 = max X1 E(G2) Som eksempel udregner vi E(G9) Da E(G10)=25 skal vi for X9 = 012 anvende E(G10)=25 i udregningen

Strategier ved spil 22

E(G9) = 25 (P(X=0)+P(X=1)+P(X=2))+ 3P(X=3)+hellip+10P(X=10) =306 Vaeligrdierne for E(Gk) er alle udregnet og vist i computerberegningen nedenfor Bemaeligrk isaeligr at de vokser fra 25 til 425 naringr k aftager fra 10 til 2 Strategien er nu foslashlgende Vaeliglg det stoslashrste af de resterende tal hvis Xk gt E(Gk+1) (altsaring det antal man har slaringet er er stoslashrre end det forventede stoslashrste antal) ellers vaeliglg det naeligststoslashrste Ved afgoslashrelsen om de 3 stoslashrste 4 stoslashrste osv anvender vi den hidtidige strategi med den modifikation at vi multiplicerer sandsynligheden med den formodede relative forbedring E(G10-kast)antal roslashde En computerberegning helt svarende til den foregaringende men med den aeligndrede strategi er vist nedenfor Man bemaeligrker for det foslashrste de smaring aeligndringer der er i strategien Den nye strategi er lidt mindre forsigtig men den giver altsaring ogsaring pote i form af en forbedring af gennemsnittet paring ca 275 Primaeligr sandsynligheder P(X=j) for n= 10 og p= 0250 j 0 1 2 3 4 5 6 7 8 9 10 P(X=j)0056 0188 0282 0250 0146 0058 0016 00031 00004 00000 00000 Baglaeligns Kumulerede sandsynligheder P(Xgt=j) j 0 1 2 3 4 5 6 7 8 9 10 P(Xgt=j) 1000 0944 0756 0474 0224 0078 00197 00035 00004 00000 00000 E(G[10])= 250 E(G[9])= 306 E(G[8])= 337 E(G[7])= 362 E(G[6])= 380 E(G[5])= 395 E(G[4])= 406 E(G[3])= 416 E(G[2])= 425 kast nr 1 2 3 4 5 6 7 8 9 10 score 0 1 1 1 1 1 1 1 1 1 1 1 2 2 1 1 1 1 1 1 1 1 2 5 4 4 3 3 3 2 2 1 1 3 8 7 6 5 5 4 3 2 2 1 4 9 8 7 7 6 5 4 3 2 1 5 10 9 8 7 6 5 4 3 2 1 6 10 9 8 7 6 5 4 3 2 1 7 10 9 8 7 6 5 4 3 2 1 8 10 9 8 7 6 5 4 3 2 1 9 10 9 8 7 6 5 4 3 2 1 10 10 9 8 7 6 5 4 3 2 1 Gennemsnitlig gevinst ms = 16727 Hyppigheder af score h( 75)= 1 h( 80)= 1 h( 85)= 0 h( 90)= 3 h( 95)= 2 h(100)= 5 h(105)= 4 h(110)= 9 h(115)= 12 h(120)= 12 h(125)= 17 h(130)= 22 h(135)= 28 h(140)= 39 h(145)= 24 h(150)= 49 h(155)= 54 h(160)= 74 h(165)= 63 h(170)=117 h(175)= 63 h(180)= 91 h(185)= 57 h(190)= 72 h(195)= 39 h(200)= 36 h(205)= 35 h(210)= 29 h(215)= 14 h(220)= 21 h(225)= 1 h(230)= 5 h(235)= 1 h(240)= 0 h(245)= 0 h(250)= 0 h(255)= 0 h(260)= 0 h(265)= 0 h(270)= 0 h(275)= 0 h(280)= 0

Strategier ved spil 23

Frekvens af score F( 80)=00020 F( 85)=00020 F( 90)=00050 F( 95)=00070 F(100)=00120 F(105)=00160 F(110)=00250 F(115)=00370 F(120)=00490 F(125)=00660 F(130)=00880 F(135)=01160 F(140)=01550 F(145)=01790 F(150)=02280 F(155)=02820 F(160)=03560 F(165)=04190 F(170)=05360 F(175)=05990 F(180)=06900 F(185)=07470 F(190)=08190 F(195)=08580 F(200)=08940 F(205)=09290 F(210)=09580 F(215)=09720 F(220)=09930 F(225)=09940 F(230)=09990 F(235)=10000 F(240)=10000 F(245)=10000 F(250)=10000 F(255)=10000 F(260)=10000 F(265)=10000 F(270)=10000 F(275)=10000

Maringske er det ikke en saeligrlig imponerende forbedring fra den foslashrste strategi men det er en teoretisk milepaeligl at man er i stand til at angive den bedste strategi for bestemte typer af spil Som omtalt har vi ikke forsoslashgt at bevise at Snell-Strategien er den optimale Strategi men det kan bevises Det er vigtigt at notere sig at i alle de omtalte spil har udfaldene vaeligre stokastiske variable dvs uforudsigelige men med bestemte sandsynligheder og at disse sandsynligheder ikke bliver aeligndret af den strategi man foslashlger I mange af de spil hvor man ofte moslashder begrebet strategi feks skak krig finansmarked og markedsfoslashring er dette langt fra tilfaeligldet Hvis feks alle boslashrsspekulanter fulgte den samme optimale strategi med boslashrskursen som stokastisk variabel ville det nok vise sig at det var den daringrligste strategi af alle Teorien for dynamiske strategier hvor de stokastiske variable er funktioner af tiden og af den valgte strategi er teoretisk naeligsten ufremkommelige

Strategier ved spil 24

Indeks Casino516 Computersimulation18 definitionen af sandsynlighed 1 Den optimale Snell-strategi11 forsikringsmatematik 5 Indbrudstyvens pensionsproblem912 kortsigtede strategi 10 kumulerede frekvens 19 langsigtede strategi 10 lotto 1 Mandagschancen14 Mandags-chancen9 Martingale-systemet16

Optimale Strategier 10 Poker 3 rekursionsligning 6 roulette 57 Roulette spil 10 roulettespiller 7 ruinsandsynligheder 5 Skaeligbnen913 Snell-strategien 11 Stopbetingelsen11 strategi9 Taeligndstikspillet1018

Page 6: Sandsynligheder og strategier ved spil - Ole Witt-Hansen ...olewitthansen.dk/Matematik/Sandsynligheder_og_strategier_ved_spil… · 6dqgv\qoljkhghu yhg vslo 3n vdpph pngh ndq yl ilqgh

Sandsynligheder ved spil 4

Fire ens Der er 13 forskellige muligheder for fire ens Det femte kort kan vaeliglges paring 52 - 4 = 48 forskellige maringder

P(4 ens) =

)552(

624

)552(

4813

KK240110-4

Full House Der er 13 forskellige muligheder for 3 ens De 3 kan udtages paring K(43) forskellige maringder De to ens maring noslashdvendigvis have en anden talvaeligrdi hvoraf resultatet foslashlger

P(Full House 3 ens + 2 ens) =

)552(

3744

)552(

)24(12)34(13

KK

KK140010-3

Flush 5 kort i samme farve kan udtages paring K(135) maringder Der er 4 kortfarver Vi maring subtrahere Straight Flusher fra

P(Flush 5 i samme farve) = 3109671)552(

5112

)552(

432)513(4

KK

K

Straight Der er 13 - 4 = 9 forskellige raeligkkefoslashlger Hver af de 5 kortvaeligrdier kan vaeliglges blandt 4 farver Vi skal fratraeligkke Straight Flush

P(Straight 5 i raeligkkefoslashlge) = 35

10533)552(

9180

)552(

3649

KK

Tre ens Der er 13 kortvaeligrdier og der skal udvaeliglges 3 De sidste to kort kan udvaeliglges blandt 52 - 4 = 48 kort (ikke 49 da det kunne give 4 ens) Vi maring dog fratraeligkke de 12K(42) par der kan dannes og som ville give Full House

P(3 ens) = 2101132)552(

54912

)552(

))24(12)248(()34(13

KK

KKK

To par Foslashrst udregnes antallet af muligheder for de to par Faktoren frac12 skyldes at man ved denne optaeliglling taeligller de mulige kombinationer Et par feks (spar dame hjerter dame) vil baringde vaeligre at finde blandt de 13K(42) og de 12K(42) muligheder Det sidste kort kan vaeliglges blandt 52 ndash 8 som danner de to par

P(2 par) = 210754)552(

552123

)552(

)852)(24(12)24(1321

KK

KK

Et par De foslashrste 3 faktorer i taeliglleren er antallet af maringder at faring et par paring Vi bliver noslashdt til at subtrahere mulighederne for 2 par og Full House

P(1 par) = 47010)552(

1221781

)552(

3755552123)348()24(13

KK

KK

Sandsynligheder ved spil 5

Hermed har vi afsluttet vores gennemgang af sandsynlighederne i Poker Bemaeligrk at sandsynlighederne foslashlger rangen af en Pokerharingnd

3 Ruinsandsynligheder ved Roulette mv Beregningen af ruinsandsynligheder er noget som er helt afgoslashrende for forsikringsvirksomhed hvis denne skal drives forretningsmaeligssigt Sammenhaeligngen mellem ruinsandsynligheder og beregning af praeligmiestoslashrrelserne en ret kompliceret matematisk teori som betegnes forsikringsmatematik Paring universiteterne findes en saeligrlig uddannelse som kaldes aktuar studiet som har dette som speciale Forsikringsmatematik kan illustreres ved at betragte roulettespil paring et Casino En roulette har 37 felter nummereret 0 ndash 36 Hvis man vinder paring et felt faringr man udbetalt 36 gange indsatsen Da man har lagt en indsats er gevinsten 35 indsatser Hvis X er den stokastiske variabel som betegner en spillers gevinst saring antager X vaeligrdierne +35 med sandsynlighed 137 og ndash1 med sandsynlighed 3637

P(X = 35) = 137 og P(X = -1) = 3637 Middelgevinsten naringr man spiller paring et felt er foslashlgelig

(31) 37

1

37

36)1(

37

135)()()(

Uu

uPuXXE

Hvis spilleren i stedet vaeliglger at spille paring m felter antager gevinsten X vaeligrdierne 36 - m med sandsynlighed m37 og ndashm med sandsynligheden (37 - m)37 = 1 - m37 Middelgevinsten bliver herefter

37

)37

1)((37

)36()()()(mm

mm

muPuXXEUu

Middelgevinsten pr indsats er saringledes uafhaeligngig af hvor mange felter man spiller paring Hermed er det slaringet fast Der findes intet system der kan bringe eacuten i stand til at vinde paring en roulette paring laeligngere sigt Dette er en simpel matematisk kendsgerning som mange har maringttet erkende paring en betydelig mere smertelig maringde Specielt hvis man spiller paring m = 18 felter er gevinsten 36-18=18 med sandsynlighed 1837 og ndash18 med sandsynlighed 1937 Selvom en spiller ikke kan vinde i det lange loslashb har spilleren paring grund af tilfaeligldigheder (som spillere foretraeligkker at kalde held) mulighed for at vinde betragtelig store beloslashb Vi vil nu lave nogle betragtninger over hvor stor sandsynlighed en spiller har for at spraelignge banken dvs at ruinere et Casino En saringdan beregnet sandsynlighed kaldes for ruin sandsynligheden

Ruinsandsynligheder 6

Vi antager at Banken raringder over n-enheder (indsatser) Vi oslashnsker at vurdere sandsynligheden for at en uendelig rig spiller der goslashr den samme indsats i hvert spil vinder n eller flere enheder naringr der ikke er nogen begraelignsning paring antallet af spil Ruinsandsynligheden for banken betegner vi rn Hvis X1 X2 X3 betegner Casinorsquoets gevinst ved de enkelte spil er

Gk = X1 + X2 +X3++Xk gevinsten efter k-spil Ruinsandsynligheden kan derfor formuleres derhen at

rn = P( 0kG for et eller andet k)

(Der er ingen umiddelbar sammenhaeligng mellem n og k) Der gaeliglder rekursions-formlen

rn+1 = rn r1

som udtrykker at sandsynligheden for at blive ruineret med n+1 enheder er lig sandsynligheden for at blive ruineret med n enheder gange sandsynligheden for at blive ruineret med eacuten enhed Dette fordi vi antager at hvert spil er uafhaeligngigt af de oslashvrige Heraf foslashlger umiddelbart

r2 = r1+1 = r1 r1 = r12 r3 = r2+1 = r2 r1 = r1

3 og foslashlgelig

rn = r1n

For at beregne en ruinsandsynlighed ser vi foslashrst paring tilfaeligldet hvor en spiller saeligtter sin indsats paring 18 felter pr spil Her er Casinorsquoets gevinst +18 eller ndash18 pr spil For nemheds skyld saeligtter vi de 18 indsatser til at vaeligre en enhed = 1 Vi opstiller da foslashlgende rekursionsligning som tager udgangspunkt i det foslashrste spil Sandsynligheden for at banken bliver ruineret med n enheder er lig med Sandsynligheden for at banken vinder det foslashrste spil (hvor den vinder en enhed) gange sandsynligheden for at banken bliver ruineret med n+1 enheder plus sandsynligheden for at banken taber det foslashrste spil (hvor den mister en enhed) gange sandsynligheden for at banken bliver ruineret med n-1 enheder Sandsynlighederne for at banken vinder og taber er 1937 og 1837 Vi kan da opstille ligningen

1

1

1

1111 37

18

37

19

37

18

37

19 nnn

nnn rrrrrr

For at opnaring det sidste udtryk har vi anvendt resultatet af rekursionsligningen rn = r1

n Det er relativt nemt at bestemme r1 ud fra denne ligning Ved division af ligningen med r1

n-1 faringr man

Ruinsandsynligheder 7

018371937

18

37

191

21

211

rrrr

Den sidste 2gradsligning kan loslashses paring normal vis idet diskriminanten d =372 ndash 4middot19middot18 = 1 saring

119

18

38

36

192

137111

rrr

Vi er kun interesseret i loslashsningen r1 = 1819

Ifoslashlge ovenstaringende er nrr nn )

19

18(1

Vi vil herefter besvare sposlashrgsmaringlet Hvor mange enheder skal banken have for at der er mindre end 1 chance for ruin Dette er ensbetydende med at loslashse ligningen

1785)

19

18ln(

)010ln(010)

19

18( nn

Husker vi at en enhed svarede til 18 indsatser giver dette beskedne 1533 indsatser Hvis en spiller derimod spiller paring saeligdvanlig vis med kun at placere en indsats paring eacutet felt er dette - lidt overraskende ndash betydelig mere risikabelt for banken Vi opstiller igen en rekursionsligning med udgangspunkt i det foslashrste spil Sandsynligheden for at banken bliver ruineret med n enheder er lig med Sandsynligheden for at banken vinder det foslashrste spil (hvor den vinder en enhed) gange sandsynligheden for at banken bliver ruineret med n+1 enheder plus sandsynligheden for at banken taber det foslashrste spil (hvor den mister 35 enhed) gange sandsynligheden for at banken bliver ruineret med n-35 enheder Sandsynlighederne for at banken vinder og taber er 3637 og 137 Vi kan da opstille ligningen

351

111351 37

1

37

36

37

1

37

36 nnn

nnn rrrrrr

Ved division med (r1)

n-35 og omordning af leddene og ved at saeligtte r1 = x faringr man ligningen

36x36 ndash 37x35 +1 = 0 Denne ligning kan kun loslashses ved numeriske metoder og man finder loslashsningen x = 09984 Hvis vi igen stiller sposlashrgsmaringlet Hvor mange indsatser skal banken raringde over for at der er mindre end 1 chance for ruin skal vi loslashse ligningen

Ruinsandsynligheder 8

2876)99840ln(

)010ln(010)99740( nn

Altsaring en betydelig stoslashrre beholdning end hvis spilleren spiller paring 18 felter Forsoslashger vi at udregne ruinsandsynligheden for en spiller der har n enheder og laeliggger sin indsats paring eacutet felt kommer vi efter helt det samme raeligsonnement frem til foslashlgende rekursionsligning

35137

11137

36

37

1

37

361351

nn rrrrrr

nnnn

som foslashrer til ligningen x36 ndash 37x +36 = 0 Denne ligning har kun loslashsningen x = 1 Differentieres nemlig f(x) =x36 ndash 37x +36 finder man f (x) =36x35 ndash 37 Ligningen f (x) =0 har

loslashsningen 136

3735 x Da f (x) lt 0 for x lt 1 har den ingen roslashdder mindre end 1

Ruin-sandsynligheden for en spiller der garingr paring et Casino som har en ubegraelignset beholdning er 1 Saring vi kan endnu engang fastslaring at hvis man fortsaeligtter med at spille paring et Casino vil man altid blive ruineret i det lange loslashb Man kunne selvfoslashlgelig overveje ruinsandsynlighederne hvis Casino har beholdningen n og en spiller har beholdningen m (n gt m eller omvendt) men svaret vil afhaelignge af n og m og de indgaringende to ulineaeligre ligninger med to ubekendte med meget hoslashje eksponenter er ikke saring nemme at loslashse numerisk ndash selv paring en Computer Hvis n gtgt m vil svaret stort set vaeligre det samme

Strategier ved spil 9

Kap 2 Strategier ved spil

1 Forskellige spil Efter at have udregnet vindersandsynligheder i forbindelse med spil skal vi nu se paring noget andet som ogsaring er knyttet sammen med sandsynlighedsregningen nemlig problemet med at fastlaeliggge den bedste strategi naringr man spiller et spil Her skal spil imidlertid forstarings i en meget videre betydning det vaeligre sig krig boslashrsspekulation jagt eller fiskeri paring en bestemt dyreart Sidstnaeligvnte er dog alt for komplicerede til at kunne behandles elementaeligrt Faeliglles er det dog at man skal kunne beregne sandsynligheden for en bestemt konsekvens af et givet traeligk Vi vil begynde med at give nogle meget simple eksempler paring spil hvor det er meningsfuldt at tale om optimal strategi Vendingen den optimale strategi indebaeligrer at spillet afvikles i et endeligt antal trin og at der for hvert trin i spillet er mulighed for at forbedre sin gevinst og mulighed for at miste sin gevinst helt eller delvis Man skal endvidere have mulighed for at standse spillet ved ethvert trin og inkassere sin gevinst

11 Mandags-chancen I dette spil som har vaeligret lanceret af TV2 har man en raeligkke tildaeligkkede felter med beloslashb (101025255050100100250) x 1000 kr Man har maximalt 3 forsoslashg Man faringr beloslashbet paring det sidst afdaeligkkede felt Nedenfor er vist en computer simulation af spillet efter 2 traeligk Det er nok klart at hvis man afdaeligkker et felt med 10 i 1 eller 2 forsoslashg skal man fortsaeligtte eller hvis man afdaeligkker et felt med 100 eller 250 i 1 eller 2 forsoslashg skal man standse Men hvad hvis man afdaeligkker et felt med 50 i 1 eller 2 forsoslashg Det vil vi forsoslashge at afgoslashre ved nogle mere matematiske betragtninger

12 Skaeligbnen Et spil som vist nok kommer fra orienten Det spilles med to terninger Foslashrst slaringr man et slag med de to terninger og summen af deres oslashjental betegnes skaeligbnen

Strategier ved spil 10

Man kan nu slaring lige saring mange gange man vil (max 100) Hvis oslashjentallene ikke er lig skaeligbnen saring adderes dette til ens pointtal men hvis man slaringr sin skaeligbne mister man alt Nedenfor er vist et trin i en animeret computer simulation af spillet Naringr spillet er standset fordeler man indsatsen i forhold til spillernes opnaringede pointtal Det gaeliglder derfor om at have de stoslashrste pointtal Problemet er imidlertid hvornaringr det er optimalt at standse naringr man kender sin skaeligbne

13 Indbrudstyvens pensionsproblem Dette er en variant af mange forskellige optimeringsproblemer Arthur er indbrudstyv Hver tyvetugt giver i snit K kr Chancen for at Arthur bliver snuppet er p Hvis han bliver taget mister han alt fra sine tidligere tyvetugter Hvor mange indbrud skal Arthur lave foslashr han standser sin karriere og vaeliglger at leve af sin opsparing

14 Taeligndstikspillet Dette spil falder lidt uden for rammerne af de oslashvrige spil fordi man ikke kan standse spillet og fordi man aldrig kan miste noget af sin gevinst Det kan derfor ikke umiddelbart behandles paring samme maringde som de hidtil naeligvnte spil Alligevel er det et spil der udpraeligget kan behandles med matematiske teorier for den bedste strategi Spillet garingr ud paring at man paring 10 taeligndstikker farver den ene side roslashd Kastes taeligndstikken op er sandsynligheden for at den farvede side vender opad naringr den lander paring bordet lig med p = 025 Hver spiller har fra starten tallene 110 Hvert tal maring kun bruges 1 gang Man skiftes til at kaste de 10 taeligndstikker og notere antallet af farvede taeligndstikker Dette antal skal saring ganges med et af de resterende tal 110 Den som efter 10 spil har den hoslashjeste sum har vundet Det kan oplyses og let verificeres at den maximale gevinst er 550 Middelgevinsten hvor man vaeliglger tilfaeligldig er 1375 og den optimale middelgevinst er ca 167

Strategier ved spil 11

15 Casino Roulette spil falder ogsaring lidt uden for rammerne af optimale strategier af den meget simple grund at odds er svagt imod eacuten Det gaeliglder dog ikke for Blackjack hvor man kan udvikle en strategi som giver en svag fordel Hvis odds er imod eacuten vil man imidlertid altid tabe i det lange loslashb Som tidligere fastslaringet er den eneste mulighed - i det lange loslashb - for at undgaring ruin i roulettespil at der ikke er nogen oslashvre graelignse for indsatser og at man har flere penge end Casionorsquoet og ingen af disse to betingelser er nogensinde opfyldt Enhver fornuftig matematisk spil-teori vil derfor som resultat have at man skal standse foslashr det foslashrste spil Det vil sige Man skal lade vaeligre med at garing paring Casino Denne kendsgerning udelukker dog ikke at man kan goslashre sig overvejelser over hvordan man kan spille hvis man ikke udelukkende er interesseret i at foraeligre sine penge til et Casino uden kamp

2 Optimale Strategier Hvis man intuitivt skal formulere en strategi for de 3 foslashrste spil naeligvnt ovenfor saring kan man feks vaeliglge eacuten af 3 foslashlgende strategier 1 Man beslutter paring forharingnd hvor stor ens gevinst (eller tab) skal vaeligre foslashr man stopper Dette er

faktisk en meget almindelig strategi men den er bestemt ikke optimal 2 Man fortsaeligtter saring laelignge man i middel har mulighed for at foroslashge sin gevinst i naeligste spil Man

skal huske paring at middelvaeligrdien af gevinsten ogsaring omfatter tab saring middelvaeligrdien (i matematisk forstand) skal vaeligre positiv Denne umiddelbart fornuftige strategi kaldet den kortsigtede eller myope strategi er i mange tilfaeliglde ogsaring den optimale strategi (dog ikke i mandagschancen)

3 Man fortsaeligtter saring laelignge man i middel har mulighed for at foroslashge sin gevinst i et af de

efterfoslashlgende spil Denne strategi kaldes den langsigtede strategi Baringde den kortsigtede og den langsigtede strategi ser yderst rimelige ud og de vil ogsaring vaeligre optimale for langt de fleste spil Hvis der er forskel paring den langsigtede og den kortsigtede strategi skal man anvende den langsigtede - naturligvis Der findes imidlertid visse former for spil hvor ingen af strategierne er optimale Det gaeliglder feks for boslashrsspekulanter der har en beholdning aktier som de vil saeliglge naringr kurserne stiger Dette fortsaeligtter som bekendt aldrig i det uendelige Paring et vist tidspunkt standser stigningen og kurserne begynder at falde ndash som regel ndash hurtigere end de steg Hvornaringr skal man saeliglge for at opnaring den stoslashrste gevinst Det viser sig - men det er saeligrdeles kompliceret at redegoslashre for ndash at naringr det gaeliglder boslashrs spekulation saring er ingen af strategierne 2 og 3 optimale De vil begge to i grove traeligk som resultat have at man enten skal saeliglge straks eller vente til man er ruineret Vi vil nu give en beskrivelse af den optimale strategi som er udviklet af Snell Vi vil overhovedet ikke naeligrme os et bevis for at det er den optimale strategi (beviset er ret teknisk abstrakt) men

Strategier ved spil 12

understrege at det kan bevises I matematisk forstand Ulemperne ved Snell-strategien er at den for selv simple problemer kan foslashre til ret omfattende og komplicerede regninger

2 Den optimale Snell-strategi Snell-strategien er paring sin vis den samme som den kortsigtede strategi men hvor man i denne strategi hele tiden regner sig et skridt frem saring tager Snell-strategien udgangspunkt i spillets slutning og arbejder sig baglaeligns Vi indfoslashrer foslashrst nogle betegnelser Vi antager at spillet har n trin Sk er en stokastisk variabel der angiver den faktiske samlede gevinst man har opnaringet ved det kte spil Sk kan antage en eller flere vaeligrdier med tilhoslashrende sandsynligheder Det nye ved Snell-strategien er at man definerer endnu en stokastisk variabel Gk ved ligningen

Gk = maxSk E(Gk+1| S1Sk) Gk er den stoslashrste af vaeligrdierne Sk (gevinsten efter det kte spil) og E(Gk+1| S1Sk)) som er middelvaeligrdien af den maximale forventede gevinst i det k+1te spil naringr det er givet at man har spillet spillene 1k Dette opstilles i et skema Gn = Sn Gevinsten ved spillets afslutning Gn-1 = maxSn-1 E(Gn| S1Sn-1) Gk = maxSk E(Gk+1| S1Sk) G1 = maxS1 E(G2| S1) Snell strategien siger nu at man skal standse spillet den foslashrste gang Sk (gevinsten efter det kte spil) overstiger middelvaeligrdien af den maksimale forventede gevinst i det k+1te spil Dette kaldes for stopbetingelsen Stopbetingelsen er altsaring

Sk E(Gk+1| S1Sk) Man skal altsaring standse spillet naringr den opnaringede gevinst er stoslashrre eller lig med den betingede forventning af den maximale gevinst i det naeligste spil Det kunne lyde som den kortsigtede strategi men forskellen er den at i den kortsigtede strategi er Gk+1 erstattet af Sk+1 At kunne gennemskue konsekvenserne af dette er derimod ikke saring nemt Det viser sig at i mange tilfaeliglde at er Snell-Strategien identisk med den kortsigtede strategi som kraeligver at man stopper naringr Sk E(Sk+1| S1Sk) Snell strategien er ikke umiddelbart let gennemskuelig og udregningen af de betingede middelvaeligrdier E(Gk+1| S1Sk) er ofte ret teknisk Vi vil nu behandle de foslashr naeligvnte eksempler og begynder med

Strategier ved spil 13

21 Indbrudstyvens pensionsproblem Lad os antage at Arthurs gennemsnitlige gevinst ved hvert tyvetogt er K = 6000 kr og at chancen er at han bliver taget er 5 Lad os antage at hans hidtidige gevinst efter k - tyvetugt er Sk som bliver konfiskeret - og som han derved mister hvis han bliver snuppet I dette tilfaeliglde kan man - som vist nedenfor - se at den kortsigtede strategi er den optimale strategi Det haelignger sammen med at alle trin i spillet er identiske Gevinsten ved hvert tyvetogt er den samme ndash uafhaeligngigt af de foregaringende tyvetugter - bortset fra at den samlede gevinst vokser ved hvert vellykket tyvetogt Xk betegner den stokastiske variabel som er Arthurs gevinst ved eacutet tyvetugt Hermed er

Sk =X1+ X2+ X3+hellip Xk Xk+1 kan antage vaeligrdien K med sandsynlighed 1-ps = 1-P(Snuppet) (altsaring hvis det naeligste tyvetugt lykkes) og vaeligrdien ndashSk (han mister hele sin opsparing) med sandsynlighed ps = P(Snuppet) Vi opskriver nu Snell-strategien (Den kortsigtede strategi) for et trin i hans karriere

Gk = max Sk E(Sk+1| 1k)

Sk er hans gevinst efter k tyvetugter og E(Sk+1| 1k) er hans forventede gevinst efter k+1 tyvetugter E(Sk+1| 1k) kan beregnes som den hidtidige gevinst plus den forventede gevinst ved naeligste tyve- tugt i alt lig med Sk + E(Xk+1) E(Xk+1) er uafhaeligngig af de foslashrste k - tyvetugter derfor bliver stopbetingelsen Sk gt Sk + E(Xk+1) E(Xk+1) lt 0 Middelvaeligrdien E(Xk+1) kan saringledes udregnes efter den saeligdvanlige definition idet Xk+1 antager vaeligrdierne K (gevinsten ved et tyvetugt) og - Sk (mister hele sin opsparing) med sandsynlighederne 1-ps og ps henholdsvis E(Xk+1) = K(1- ps) - Sk ps Han skal standse naringr

E(Xk+1) lt 0 K(1- ps) lt Sk ps som med tal eksemplet giver

6000095 lt Sk005 Sk gt 114000- kr svarende til 114006000 = 095005 = 19 tyvetugter

(Det goslashr han nu nok ikke og er derfor henvist til at leve af folkepensionen efter nogle aringr i skyggen) Man kunne godt tro at dette eksempel kunne anvendes paring andre (ligesaring uetiske) problemstillinger Feks hvor mange gange det er optimalt at koslashre gratis i S-tog Det kan det imidlertid ikke helt

Strategier ved spil 14

Sagen er jo den at man faringr en fast boslashde hvis man bliver snuppet men man kommer ikke til at betale for de gange man har koslashrt gratis Med andre ord vurderingen om hvorvidt det er fordelagtigt at koslashre uden billet afhaelignger kun af middelgevinsten ved det naeligste forsoslashg Hvis den er positiv er det fordelagtigt at fortsaeligtte men hvis den er negativ er det fordelagtigt at loslashse billet (Det er i oslashvrigt uetisk at snyde ndash naturligvis) Tager vi et eksempel billetprisen er kr 50- Boslashden er kr 500 Sandsynligheden for at blive snuppet er Ps = 01 Hvis X er gevinsten ved at koslashre uden billet er E(X) = 50middot(1-Ps)-500middotPs = 50middot09-500middot01 = -50 Det er saringledes (med denne sandsynlighed for at blive snuppet) ikke fordelagtigt at koslashre uden billet i S-tog Da en laeligrebog i sandsynligheder ved spil naturligvis ikke maring tilskynde til uetiske handlinger undlader vi at foretage beregningen med Ps = 005

22 Skaeligbnen Vi betragter kast med to terninger X betegner summen af oslashjentallene ved eacutet kast Sandsynlighedsfordelingen for X er velkendt Feks er P(X=5) = 436 Sandsynligheden for at terningerne viser j oslashjne kan skrives som

36

76)(

jjXP

Lad os antage at spillerens skaeligbne er q Hvis man slaringr dette oslashjental er alt tabt Ellers adderes oslashjentallene for hvert kast Hvis ikke man har slaringet sin skaeligbne saring er den samlede gevinst efter n spil

Sn = X1+ X2+ X3+hellip +Xn

Og middelvaeligrdien af Sn er

E(Sn) = E(X1)+ E(X2)+E(X3)+hellip +E(Xn) = nE(X | X q) E(X | X q) er den betingede middelvaeligrdi af oslashjentallene givet at man ikke slaringr sin skaeligbne

E(X | X q) = 2P(2) +3P(3)+hellip(q-1)P(q-1) + (q+1)P(q+1)+hellip+12P(12) Den kortsigtede strategi (og Snell strategien) fastslaringr at man skal standse naringr middelvaeligrdien af den forventede gevinst ved naeligste kast er negativ Argumentet for dette kan overtages naeligsten ordret fra indbrudstyvens pensionsproblem E(Sk+1|S1 Sk) kan beregnes som den hidtidige gevinst Sk plus den forventede gevinst ved det naeligste kast i alt lig med Sk + E(Xk+1| S1 Sk) Stopbetingelsen er derfor

Sk gt Sk + E(Xk+1| S1 Sk) E(Xk+1| S1 Sk) lt 0

Strategier ved spil 15

E(X | X q) ndash SnP(q) lt 0 Sn gt E(X | X q) P(q) Det er ikke saeligrlig svaeligrt at udregne stopbetingelsen feks for q = 2 og q = 6 Nedenfor er vist udskriften fra et program som foretager beregningen for q = 212 Forventet gevinst i naeligste kast naringr ens skaeligbne er q q 2 3 4 5 6 7 8 9 10 11 12 694 683 667 644 617 583 589 600 617 639 667 Stop naringr din gevinst S gt EX(q)P(q) naringr skaeligbne er q q 2 3 4 5 6 7 8 9 10 11 12 25000 12300 8000 5800 4440 3500 4240 5400 7400 11500 24000

Som det fremgaringr er der endog meget stor forskel paring stoptiderne afhaeligngig af ens skaeligbne

23 Mandagschancen Dette spil er lidt mere interessant fordi det ikke er helt saring enkelt at gennemskue I dette tilfaeliglde kan man ikke forvente at den kortsigtede strategi vil foslashre til den optimale strategi At den faktisk goslashr det skyldes talvaeligrdierne Dette skal forstarings saringledes at hvis man aeligndrede paring praeligmiestoslashrrelserne ville Snell-strategien afvige fra den kortsigtede strategi Vi vil analysere spillet ved Snell-strategien Som naeligvnt har man i spillet 9 tildaeligkkede felter (101025255050100100250) Man kan afdaeligkke hoslashjest 3 felter Man faringr beloslashbet i 1000 kr som det sidste felt viser Hvis X er den stokastiske variabel som angiver vaeligrdien af et felt saring vil de fleste uden saring lange overvejelser vel fortsaeligtte hvis Xlt50 og standse hvis X100 Det kritiske er hvis man afdaeligkker 50 (X=50) Vi bemaeligrker foslashrst at summen af alle felterne er S=620 og at E(X) =6209=689 Vi opskriver foslashrst den fuldstaeligndige Snell-strategi for dette spil G3 =X3 Den Stokastiske variabel G3 = Gevinsten = X3 = vaeligrdien af det sidst afdaeligkkede felt G2 = max X2 E(G3| X1X2 ) Den stoslashrste af vaeligrdierne X2 (= vaeligrdien af det afdaeligkkede

felt) og den betingede middelvaeligrdi af G3 = X3 G1 = max X1 E(G2| X1 ) Som ovenfor Kriteriet for den optimale strategi er som tidligere Stop hvis paring noget trin Xk gt E(Gk+1| X1Xk ) Det er relativ nemt at opstille en formel for E(G3| X1X2 ) Naringr X1 og X2 er afdaeligkket er summen de resterende felter S - X1 - X2 Da alle felter har samme sandsynlighed er middelvaeligrdien simpelthen middeltallet af felterne E(G3| X1X2 ) = ( S - X1 - X2)(9-2)

Strategier ved spil 16

Det er noget mere teknisk at opstille en formel for E(G2| X1 ) og ogsaring lidt teknisk at foretage beregningen Vi vil noslashjes med at skitsere beregningen for en vaeligrdi af X1 og i oslashvrigt henvise til resultatet af et Computerprogram som kan ses nedenfor Lad os antage at X1 = 25 Vi lader nu X2 gennemloslashbe alle de mulige vaeligrdier (alle vaeligrdier skal taeliglles med det antal gange der er felter med denne vaeligrdi) For hver vaeligrdi af X2 (feks 50) skal vi vaeliglge max af X2 og E(G3| X1X2 ) = ( S - X1 - X2) (9-2) (= (620-50-25)7 = 778 i dette tilfaeliglde) og addere det til en sum S2 E(G2| X1 ) er da lig med S2(9-1) (da der er 9-1 felter X2 ) X2[1]= 1000 E(G3)= 8571 G2= 8571 X2[2]= 2500 E(G3)= 8357 G2= 8357 X2[3]= 5000 E(G3)= 8000 G2= 8000 X2[4]= 10000 E(G3)= 7286 G2= 10000 X2[5]= 25000 E(G3)= 5143 G2= 25000 X1[1]= 1000 E(G[2])= 10786 X2[1]= 1000 E(G3)= 8357 G2= 8357 X2[2]= 2500 E(G3)= 8143 G2= 8143 X2[3]= 5000 E(G3)= 7786 G2= 7786 X2[4]= 10000 E(G3)= 7071 G2= 10000 X2[5]= 25000 E(G3)= 4929 G2= 25000 X1[2]= 2500 E(G[2])= 10679 X2[1]= 1000 E(G3)= 8000 G2= 8000 X2[2]= 2500 E(G3)= 7786 G2= 7786 X2[3]= 5000 E(G3)= 7429 G2= 7429 X2[4]= 10000 E(G3)= 6714 G2= 10000 X2[5]= 25000 E(G3)= 4571 G2= 25000 X1[3]= 5000 E(G[2])= 10500 X2[1]= 1000 E(G3)= 7286 G2= 7286 X2[2]= 2500 E(G3)= 7071 G2= 7071 X2[3]= 5000 E(G3)= 6714 G2= 6714 X2[4]= 10000 E(G3)= 6000 G2= 10000 X2[5]= 25000 E(G3)= 3857 G2= 25000 X1[4]= 10000 E(G[2])= 9643 X2[1]= 1000 E(G3)= 5143 G2= 5143 X2[2]= 2500 E(G3)= 4929 G2= 4929 X2[3]= 5000 E(G3)= 4571 G2= 5000 X2[4]= 10000 E(G3)= 3857 G2= 10000 X1[5]= 25000 E(G[2])= 6268 Ser man resultaterne igennem kan de udmoslashntes i en simpel regel Fortsaeligt paring 50 eller derunder Stop paring 100 eller derover Det er maringske lidt overraskende at man ogsaring skal forsaeligtte paring 50000 hvis man kun har et forsoslashg tilbage ndash man kunne jo ende med 10000 og det er saring bare aeligrgerligt ndash og det er vist nok de fleste som standser ved 50000 - men det er ikke den bedste strategi

Strategier ved spil 17

24 Casino Som naeligvnt i indledningen til dette afsnit findes der ingen strategi som kan bringe en i stand til at vinde paring et Casino ndash i det lange loslashb Vil man goslashre Casino-spil til en levevej vil det altid med matematisk sikkerhed ende med ruin Det betyder imidlertid ikke at man ikke kan vinde ved at garing paring Casino men hvis man taelignker paring at spraelignge banken saring skal to krav i hvert fald vaeligre opfyldt for at der skal vaeligre en ikke forsvindende sandsynlighed for at det kan lade sig goslashre 1 Man skal have flere penge end Casino 2 Der maring ikke vaeligre loft over indsatserne Begge betingelser er som bekendt aldrig opfyldt Man kan som sagt godt vinde paring et Casino men hvis man satser paring at vinde mere (alle de gange man er paring Casino i sit liv) end det beloslashb man medbringer ved hvert besoslashg saring vil chancerne for at tabe det hele vaeligre stoslashrst Her er der tale om sandsynligheder og middelvaeligrdier ndash om odds Selvfoslashlgelig er de muligt at tabe hele sin formue ved foslashrste besoslashg eller vinde det tredobbelte ved det andet Der har i tidens loslashb vaeligret lanceret flere eksempler paring vinderstrategier som lyder uhyre besnaeligrende Den mest kendte er Martingale-systemet Man spiller kun paring sort og roslashd hvor faringr man faringr fordoblet sin indsats hvis man vinder Spillet er saringledes helt lige bortset fra at indsatserne bliver liggende naringr zero kommer ud og man kun faringr sin indsats en gang hvis man vinder i naeligste spil (zero har ingen farve) Spiller man efter Martingale-systemet skal man inkassere sin gevinst hvis man vinder Hvis man derimod taber skal man fordoble sin indsats Vi saeligtter grundindsatsen til 1 Har man spillet n gange og dermed doblet op n-1 gange har man lagt en indsats Sn = 1 + 2 + 22 +hellip2n-1 = 2n ndash1 Udregnet af kvotientraeligkkeformlen

1

10

q

qaS

n

n

for raeligkken Sn = a0 + a0q+ a0q

2+hellip+ a0qn-1

Vinder man det nte spil faringr man udbetalt 22

n-1 = 2n saring ens gevinst er 2n - (2n - 1) = 1 Der gaeliglder aringbenbart den simple kendsgerning at bliver man bare ved med at fordoble saring har man altid vundet eacuten indsats Foslashr man forsoslashger sig med dette skal man dog nok goslashre sig klart hvor mange gange man kan tabe foslashr man er ruineret

Strategier ved spil 18

Sandsynligheden for at man taber 5 spil er (frac12)5 = 132 Man har da tabt 25 ndash 1 gange vaeligrdien af en jeton (i Danmark 50 kr) dvs 1550 kr Vil man sikre sig bedre feks ved at kunne doble op 9 gange (sandsynligheden for at tabe 10 spil er 11024) saring skal man komme med kr 51150- men det kan man ikke engang gennemfoslashre da hoslashjeste indsats i Danmark er 24000- Man kunne imidlertid stille det sposlashrgsmaringl Hvis man har n-jetoner hvad er saring sandsynligheden for at vinde q-jetoner hvis man spiller efter Martingale-systemet Dette kan man faktisk godt udregne direkte men regningerne er ret omfattende Derimod er resultatet simpelt Vi vil ikke lave en direkte udregning men anvende de samme metoder som vi har anvendt for den bedste strategi Vi tager udgangspunkt i det faktum at sort roslashd Casino spil er et lige spil saring middelvaeligrdien af gevinsten er 0 ligegyldigt hvordan man spiller Middelvaeligrdien (som er nul ) af en gevinst paring q-jetoner er lig med q gange sandsynligheden P(q) for at vinde q jetoner minus ens kapital (n jetoner) gange med sandsynligheden for at man taber det sidste spil som er 1 ndash P(q)

qP(q) ndash n(1 ndashP(q)) = 0 qn

nqP

)(

Har man feks n = 31 jetoner (1550- kr) er sandsynligheden for at vinde q=10 (500 kr) lig med 0756 En rimelig stor sandsynlighed men altsaring stadig 25 chance for ruin Oslashnsker man derimod at blive rigtig rig og vinde 10000- kr dvs q=200 er P(200) = 0134 Konklusionen er den at satser man paring at vinde mere end man medbringer saring er sandsynligheden mindre end frac12 men kan man noslashjes med mindre saring er sandsynligheden stoslashrre end frac12 Men bemaeligrk dette gaeliglder fra foslashrste gang man garingr ind paring et Casino til man beslutter at holde op

25 Taeligndstikspillet Som beskrevet ovenfor garingr spillet ud paring at farve den ene af siderne roslashd paring 10 taeligndstikker Naringr taeligndstikken kasten op i luften er sandsynligheden for at den roslashde side vender opad naringr den rammer bordet lig med p=025 Man kaster paring skift 10 saringdanne taeligndstikker 10 gange For hvert kast skal man multiplicere antallet af roslashde med et af tallene 110 Hver tal maring kun bruges eacuten gang Den der faringr den stoslashrste sum har vundet Det er klart at en god strategi i det lange loslashb vil give en hoslashjere sum Vi minder om at antallet af X roslashde taeligndstikker er binomialfordelt med primaeligrsandsynlighed p og antalsparameter n=10

102104

3

4

110)(

10

jj

jXPjj

Strategier ved spil 19

Endvidere vil vi anvende de kumulerede sandsynligheder P(X j) og P(X j) Nedenfor er vist resultatet af en Computersimulation af spillet Primaeligr sandsynligheder for n= 10 og p= 0250 P(X=j) j 0 1 2 3 4 5 6 7 8 9 10 00563 01877 02816 02503 01460 00584 00162 00031 00004 00000 00000 Baglaeligns kumulerede sandsynligheder P(Xgt=q) j 0 1 2 3 4 5 6 7 8 9 10 10000 09437 07560 04744 02241 00781 00197 00035 00004 00000 00000 1 kast Antal = 2 Vaeliglg mellem 1 2 3 4 5 6 7 8 910 Faktor= 4 2 kast Antal = 4 Vaeliglg mellem 1 2 3 5 6 7 8 910 Faktor=10 3 kast Antal = 2 Vaeliglg mellem 1 2 3 5 6 7 8 9 Faktor= 5 4 kast Antal = 2 Vaeliglg mellem 1 2 3 6 7 8 9 Faktor= 3 5 kast Antal = 3 Vaeliglg mellem 1 2 6 7 8 9 Faktor= 8 6 kast Antal = 2 Vaeliglg mellem 1 2 6 7 9 Faktor= 6 7 kast Antal = 6 Vaeliglg mellem 1 2 7 9 Faktor=9 8 kast Antal = 3 Vaeliglg mellem 1 2 7 Faktor= 2 9 kast Antal = 2 Vaeliglg mellem 1 7 Faktor= 7 10 kast Antal = 2 Vaeliglg mellem 1 Faktor= 1 Din score er 176 Valget af tallene 110 er i dette tilfaeliglde foretaget ud fra den optimale strategi som vi vil omtale om et oslashjeblik Foslashr vi analyserer den optimale strategi for dette spil vil vi forsoslashge os med en intuitiv bedste strategi Vi belyser denne strategi med et konkret eksempel Lad os feks antage at vi slaringr 4 roslashde i den 3 kast (3 forsoslashg) De tal vi har tilbage kalder vi (y8 y7 y6 y5 y4 y3 y2 y1) Sposlashrgsmaringlet om vi skal gange med det stoslashrste y8 eller det naeligststoslashrste y7 osv Vi raeligsonnerer da som foslashlger Hvis sandsynligheden for at slaring mere end 4 roslashde i de resterende 7 kast er stoslashrre end frac12 saring skal vi vaeliglge det naeligststoslashrste Vi skaeligrper dette Hvis sandsynligheden for at slaring mindst 5 roslashde mindst en gang i de resterende 7 kast er stoslashrre end frac12 saring skal vi vaeliglge det naeligststoslashrste Tilsvarende hvis sandsynligheden for at slaring mindst 5 roslashde mindst 2 gange i de resterende 7 kast skal vi vaeliglge det 3 stoslashrstehellipog saringdan fremdeles Strategien virker umiddelbart meget plausibel Sandsynlighederne kan direkte farings af binomialfordelingen Foslashrst sandsynligheden for at faring mindst q-roslashde i et kast Dette er

P(X q) =

n

qj

jXP )( hvor P(X = j) er angivet ovenfor

Strategier ved spil 20

Sandsynligheden for at dette sker mindst r gange i n - k kast er ogsaring en binomialfordeling og kan skrives

P(X q mindst r gange i n - k kast ) = jknjkn

rj

qXPqXPj

kn

))(1()(

Beregningen af disse (110) sandsynligheder goslashres nok lettest paring en computer For at lave en strategi-tabel goslashr man det at for hvert kast og hvert antal mulige roslashde vaeliglger man foslashrst det stoslashrste af de resterende tal Dernaeligst beregner man sandsynligheden for at faring mindst 1 roslashd mere i et af de foslashlgende kast Hvis denne sandsynlighed er stoslashrre end frac12 ser man paring det naeligststoslashrste af de resterende tal Man beregner saring sandsynligheden for at faring mindst 1 roslashd mere i mindst to af de resterende kast Hvis denne sandsynlighed er stoslashrre end frac12 saring vaeliglger man det tredjestoslashrste af de resterende tal og saringdan fremdeleshellip Det bemaeligrkes at beregningen skal initialiseres med at man altid vaeliglger det mindste hvis man slaringr 0 roslashde og altid vaeliglger det stoslashrste hvis man slaringr 10 roslashde Nedenfor er vist en computerberegning af en strategi-tabel Endvidere er ogsaring lavet en saringkaldt Monte-Carlo simulation Dette betyder at man har ladet maskinen spille feks 10000 spil spillet efter strategi-tabellen Nederst er vist hyppighederne for ens score og endelig fordelingsfunktionen for observationerne (Den kumulerede frekvens) P(X =j) for n =10 and p = 0250 j 0 1 2 3 4 5 6 7 8 9 10 P(X =j)0056 0188 0282 0250 0146 0058 00162 0003 00004 0000 0000 P(Xgt=j) for n =10 and p = 0250 j 0 1 2 3 4 5 6 7 8 9 10 P(Xgt=j) 1000 0944 0756 0474 0224 0078 00197 00035 00004 0000 0000 Strategi tabel Tallene refererer ikke til faktorene selv men til den stoslashrste naeligststoslashrste osv Eksempel Hvis man slaringr 3 roslashde i den andet kast saring skal man vaeliglge (7) den tredjestoslashrste Kast no 1 2 3 4 5 6 7 8 9 10 score 0 1 1 1 1 1 1 1 1 1 1 1 3 3 3 2 2 2 2 1 1 1 2 6 5 5 4 4 3 3 2 2 1 3 8 7 7 6 5 4 3 3 2 1 4 9 9 8 7 6 5 4 3 2 1 5 10 9 8 7 6 5 4 3 2 1 6 10 9 8 7 6 5 4 3 2 1 7 10 9 8 7 6 5 4 3 2 1 8 10 9 8 7 6 5 4 3 2 1 9 10 9 8 7 6 5 4 3 2 1 10 10 9 8 7 6 5 4 3 2 1 Gennemsnitlig score = 16437

Strategier ved spil 21

Hyppighed af score h( 75)= 1 h( 80)= 7 h( 85)= 3 h( 90)= 5 h( 95)= 6 h(100)= 34 h(105)= 38 h(110)= 82 h(115)= 68 h(120)=161 h(125)=146 h(130)=320 h(135)=280 h(140)=534 h(145)=425 h(150)=752 h(155)=577 h(160)=878 h(165)=645 h(170)=956 h(175)=651 h(180)=863 h(185)=527 h(190)=609 h(195)=351 h(200)=389 h(205)=180 h(210)=203 h(215)= 93 h(220)= 86 h(225)= 47 h(230)= 32 h(235)= 21 h(240)= 13 h(245)= 8 h(250)= 3 h(255)= 0 h(260)= 4 h(265)= 1 h(270)= 1 h(275)= 0 h(280)= 0 Frekvens of score F( 80)=00008 F( 85)=00011 F( 90)=00016 F( 95)=00022 F(100)=00056 F(105)=00094 F(110)=00176 F(115)=00244 F(120)=00405 F(125)=00551 F(130)=00871 F(135)=01151 F(140)=01685 F(145)=02110 F(150)=02862 F(155)=03439 F(160)=04317 F(165)=04962 F(170)=05918 F(175)=06569 F(180)=07432 F(185)=07959 F(190)=08568 F(195)=08919 F(200)=09308 F(205)=09488 F(210)=09691 F(215)=09784 F(220)=09870 F(225)=09917 F(230)=09949 F(235)=09970 F(240)=09983 F(245)=09991 F(250)=09994 F(255)=09994 F(260)=09998 F(265)=09999 F(270)=10000 F(275)=10000

Som det fremgaringr af tabellen for P(X gt= j) er der kun 78 chance for at slaring 5 roslashde eller derover saring goslashr man det skal man altid vaeliglge det stoslashrste af de resterende tal For 3 eller 4 roslashde er situationen langt mere uigemmeskuelig og kun en beregning kan afgoslashre sagen Vi proslashver nu at finde den optimale strategi eller Snell-strategien Hvad angaringr sposlashrgsmaringlet om hvorvidt vi skal vaeliglge den stoslashrste eller naeligststoslashrste saring lader det sig faktisk goslashre at beregne Snell-strategien paring en computer De foslashlgende tilfaeliglde bliver derimod for komplicerede og der anvender vi en svagt forbedret version af vores intuitive strategi Forbedringen bestaringr i foslashlgende idet vi illustrerer det med et eksempel Lad os sige vi har slaringet 3 roslashde og vi overvejer om vi vil gange det med 7 eller 6 Ganger vi med 6 er det fordi vi forventer at slaring mindst 4 roslashde mindst en gang i de resterende kast Vores score vil vaeligre 73 og 74 henholdsvis og scoren vil blive forbedret med en faktor 43 hvis vi ganger med 6 under forventning af at slaring 4 roslashde Vores forbedring af strategien garingr da ud paring at vi vaeliglger det naeligststoslashrste 6 hvis sandsynligheden for at slaring 4 roslashde gange den relative forbedring 43 er stoslashrre end frac12 Vi rekapitulerer dernaeligst Snell-strategien G10 = X10 X10 Stokastisk variabel = antallet af roslashde i det 10 kast G9 = max X9 E(G10) E(G10) = E(X10) = np=10025 = 25 X9 = 01hellip10 Gk = max Xk E(Gk+1) E(Gk) kraeligver en laeligngere udregning men den udregnes som en

almindelig middelvaeligrdi altsaring som max af de to vaeligrdier gange P(X=Xk-1) G1 = max X1 E(G2) Som eksempel udregner vi E(G9) Da E(G10)=25 skal vi for X9 = 012 anvende E(G10)=25 i udregningen

Strategier ved spil 22

E(G9) = 25 (P(X=0)+P(X=1)+P(X=2))+ 3P(X=3)+hellip+10P(X=10) =306 Vaeligrdierne for E(Gk) er alle udregnet og vist i computerberegningen nedenfor Bemaeligrk isaeligr at de vokser fra 25 til 425 naringr k aftager fra 10 til 2 Strategien er nu foslashlgende Vaeliglg det stoslashrste af de resterende tal hvis Xk gt E(Gk+1) (altsaring det antal man har slaringet er er stoslashrre end det forventede stoslashrste antal) ellers vaeliglg det naeligststoslashrste Ved afgoslashrelsen om de 3 stoslashrste 4 stoslashrste osv anvender vi den hidtidige strategi med den modifikation at vi multiplicerer sandsynligheden med den formodede relative forbedring E(G10-kast)antal roslashde En computerberegning helt svarende til den foregaringende men med den aeligndrede strategi er vist nedenfor Man bemaeligrker for det foslashrste de smaring aeligndringer der er i strategien Den nye strategi er lidt mindre forsigtig men den giver altsaring ogsaring pote i form af en forbedring af gennemsnittet paring ca 275 Primaeligr sandsynligheder P(X=j) for n= 10 og p= 0250 j 0 1 2 3 4 5 6 7 8 9 10 P(X=j)0056 0188 0282 0250 0146 0058 0016 00031 00004 00000 00000 Baglaeligns Kumulerede sandsynligheder P(Xgt=j) j 0 1 2 3 4 5 6 7 8 9 10 P(Xgt=j) 1000 0944 0756 0474 0224 0078 00197 00035 00004 00000 00000 E(G[10])= 250 E(G[9])= 306 E(G[8])= 337 E(G[7])= 362 E(G[6])= 380 E(G[5])= 395 E(G[4])= 406 E(G[3])= 416 E(G[2])= 425 kast nr 1 2 3 4 5 6 7 8 9 10 score 0 1 1 1 1 1 1 1 1 1 1 1 2 2 1 1 1 1 1 1 1 1 2 5 4 4 3 3 3 2 2 1 1 3 8 7 6 5 5 4 3 2 2 1 4 9 8 7 7 6 5 4 3 2 1 5 10 9 8 7 6 5 4 3 2 1 6 10 9 8 7 6 5 4 3 2 1 7 10 9 8 7 6 5 4 3 2 1 8 10 9 8 7 6 5 4 3 2 1 9 10 9 8 7 6 5 4 3 2 1 10 10 9 8 7 6 5 4 3 2 1 Gennemsnitlig gevinst ms = 16727 Hyppigheder af score h( 75)= 1 h( 80)= 1 h( 85)= 0 h( 90)= 3 h( 95)= 2 h(100)= 5 h(105)= 4 h(110)= 9 h(115)= 12 h(120)= 12 h(125)= 17 h(130)= 22 h(135)= 28 h(140)= 39 h(145)= 24 h(150)= 49 h(155)= 54 h(160)= 74 h(165)= 63 h(170)=117 h(175)= 63 h(180)= 91 h(185)= 57 h(190)= 72 h(195)= 39 h(200)= 36 h(205)= 35 h(210)= 29 h(215)= 14 h(220)= 21 h(225)= 1 h(230)= 5 h(235)= 1 h(240)= 0 h(245)= 0 h(250)= 0 h(255)= 0 h(260)= 0 h(265)= 0 h(270)= 0 h(275)= 0 h(280)= 0

Strategier ved spil 23

Frekvens af score F( 80)=00020 F( 85)=00020 F( 90)=00050 F( 95)=00070 F(100)=00120 F(105)=00160 F(110)=00250 F(115)=00370 F(120)=00490 F(125)=00660 F(130)=00880 F(135)=01160 F(140)=01550 F(145)=01790 F(150)=02280 F(155)=02820 F(160)=03560 F(165)=04190 F(170)=05360 F(175)=05990 F(180)=06900 F(185)=07470 F(190)=08190 F(195)=08580 F(200)=08940 F(205)=09290 F(210)=09580 F(215)=09720 F(220)=09930 F(225)=09940 F(230)=09990 F(235)=10000 F(240)=10000 F(245)=10000 F(250)=10000 F(255)=10000 F(260)=10000 F(265)=10000 F(270)=10000 F(275)=10000

Maringske er det ikke en saeligrlig imponerende forbedring fra den foslashrste strategi men det er en teoretisk milepaeligl at man er i stand til at angive den bedste strategi for bestemte typer af spil Som omtalt har vi ikke forsoslashgt at bevise at Snell-Strategien er den optimale Strategi men det kan bevises Det er vigtigt at notere sig at i alle de omtalte spil har udfaldene vaeligre stokastiske variable dvs uforudsigelige men med bestemte sandsynligheder og at disse sandsynligheder ikke bliver aeligndret af den strategi man foslashlger I mange af de spil hvor man ofte moslashder begrebet strategi feks skak krig finansmarked og markedsfoslashring er dette langt fra tilfaeligldet Hvis feks alle boslashrsspekulanter fulgte den samme optimale strategi med boslashrskursen som stokastisk variabel ville det nok vise sig at det var den daringrligste strategi af alle Teorien for dynamiske strategier hvor de stokastiske variable er funktioner af tiden og af den valgte strategi er teoretisk naeligsten ufremkommelige

Strategier ved spil 24

Indeks Casino516 Computersimulation18 definitionen af sandsynlighed 1 Den optimale Snell-strategi11 forsikringsmatematik 5 Indbrudstyvens pensionsproblem912 kortsigtede strategi 10 kumulerede frekvens 19 langsigtede strategi 10 lotto 1 Mandagschancen14 Mandags-chancen9 Martingale-systemet16

Optimale Strategier 10 Poker 3 rekursionsligning 6 roulette 57 Roulette spil 10 roulettespiller 7 ruinsandsynligheder 5 Skaeligbnen913 Snell-strategien 11 Stopbetingelsen11 strategi9 Taeligndstikspillet1018

Page 7: Sandsynligheder og strategier ved spil - Ole Witt-Hansen ...olewitthansen.dk/Matematik/Sandsynligheder_og_strategier_ved_spil… · 6dqgv\qoljkhghu yhg vslo 3n vdpph pngh ndq yl ilqgh

Sandsynligheder ved spil 5

Hermed har vi afsluttet vores gennemgang af sandsynlighederne i Poker Bemaeligrk at sandsynlighederne foslashlger rangen af en Pokerharingnd

3 Ruinsandsynligheder ved Roulette mv Beregningen af ruinsandsynligheder er noget som er helt afgoslashrende for forsikringsvirksomhed hvis denne skal drives forretningsmaeligssigt Sammenhaeligngen mellem ruinsandsynligheder og beregning af praeligmiestoslashrrelserne en ret kompliceret matematisk teori som betegnes forsikringsmatematik Paring universiteterne findes en saeligrlig uddannelse som kaldes aktuar studiet som har dette som speciale Forsikringsmatematik kan illustreres ved at betragte roulettespil paring et Casino En roulette har 37 felter nummereret 0 ndash 36 Hvis man vinder paring et felt faringr man udbetalt 36 gange indsatsen Da man har lagt en indsats er gevinsten 35 indsatser Hvis X er den stokastiske variabel som betegner en spillers gevinst saring antager X vaeligrdierne +35 med sandsynlighed 137 og ndash1 med sandsynlighed 3637

P(X = 35) = 137 og P(X = -1) = 3637 Middelgevinsten naringr man spiller paring et felt er foslashlgelig

(31) 37

1

37

36)1(

37

135)()()(

Uu

uPuXXE

Hvis spilleren i stedet vaeliglger at spille paring m felter antager gevinsten X vaeligrdierne 36 - m med sandsynlighed m37 og ndashm med sandsynligheden (37 - m)37 = 1 - m37 Middelgevinsten bliver herefter

37

)37

1)((37

)36()()()(mm

mm

muPuXXEUu

Middelgevinsten pr indsats er saringledes uafhaeligngig af hvor mange felter man spiller paring Hermed er det slaringet fast Der findes intet system der kan bringe eacuten i stand til at vinde paring en roulette paring laeligngere sigt Dette er en simpel matematisk kendsgerning som mange har maringttet erkende paring en betydelig mere smertelig maringde Specielt hvis man spiller paring m = 18 felter er gevinsten 36-18=18 med sandsynlighed 1837 og ndash18 med sandsynlighed 1937 Selvom en spiller ikke kan vinde i det lange loslashb har spilleren paring grund af tilfaeligldigheder (som spillere foretraeligkker at kalde held) mulighed for at vinde betragtelig store beloslashb Vi vil nu lave nogle betragtninger over hvor stor sandsynlighed en spiller har for at spraelignge banken dvs at ruinere et Casino En saringdan beregnet sandsynlighed kaldes for ruin sandsynligheden

Ruinsandsynligheder 6

Vi antager at Banken raringder over n-enheder (indsatser) Vi oslashnsker at vurdere sandsynligheden for at en uendelig rig spiller der goslashr den samme indsats i hvert spil vinder n eller flere enheder naringr der ikke er nogen begraelignsning paring antallet af spil Ruinsandsynligheden for banken betegner vi rn Hvis X1 X2 X3 betegner Casinorsquoets gevinst ved de enkelte spil er

Gk = X1 + X2 +X3++Xk gevinsten efter k-spil Ruinsandsynligheden kan derfor formuleres derhen at

rn = P( 0kG for et eller andet k)

(Der er ingen umiddelbar sammenhaeligng mellem n og k) Der gaeliglder rekursions-formlen

rn+1 = rn r1

som udtrykker at sandsynligheden for at blive ruineret med n+1 enheder er lig sandsynligheden for at blive ruineret med n enheder gange sandsynligheden for at blive ruineret med eacuten enhed Dette fordi vi antager at hvert spil er uafhaeligngigt af de oslashvrige Heraf foslashlger umiddelbart

r2 = r1+1 = r1 r1 = r12 r3 = r2+1 = r2 r1 = r1

3 og foslashlgelig

rn = r1n

For at beregne en ruinsandsynlighed ser vi foslashrst paring tilfaeligldet hvor en spiller saeligtter sin indsats paring 18 felter pr spil Her er Casinorsquoets gevinst +18 eller ndash18 pr spil For nemheds skyld saeligtter vi de 18 indsatser til at vaeligre en enhed = 1 Vi opstiller da foslashlgende rekursionsligning som tager udgangspunkt i det foslashrste spil Sandsynligheden for at banken bliver ruineret med n enheder er lig med Sandsynligheden for at banken vinder det foslashrste spil (hvor den vinder en enhed) gange sandsynligheden for at banken bliver ruineret med n+1 enheder plus sandsynligheden for at banken taber det foslashrste spil (hvor den mister en enhed) gange sandsynligheden for at banken bliver ruineret med n-1 enheder Sandsynlighederne for at banken vinder og taber er 1937 og 1837 Vi kan da opstille ligningen

1

1

1

1111 37

18

37

19

37

18

37

19 nnn

nnn rrrrrr

For at opnaring det sidste udtryk har vi anvendt resultatet af rekursionsligningen rn = r1

n Det er relativt nemt at bestemme r1 ud fra denne ligning Ved division af ligningen med r1

n-1 faringr man

Ruinsandsynligheder 7

018371937

18

37

191

21

211

rrrr

Den sidste 2gradsligning kan loslashses paring normal vis idet diskriminanten d =372 ndash 4middot19middot18 = 1 saring

119

18

38

36

192

137111

rrr

Vi er kun interesseret i loslashsningen r1 = 1819

Ifoslashlge ovenstaringende er nrr nn )

19

18(1

Vi vil herefter besvare sposlashrgsmaringlet Hvor mange enheder skal banken have for at der er mindre end 1 chance for ruin Dette er ensbetydende med at loslashse ligningen

1785)

19

18ln(

)010ln(010)

19

18( nn

Husker vi at en enhed svarede til 18 indsatser giver dette beskedne 1533 indsatser Hvis en spiller derimod spiller paring saeligdvanlig vis med kun at placere en indsats paring eacutet felt er dette - lidt overraskende ndash betydelig mere risikabelt for banken Vi opstiller igen en rekursionsligning med udgangspunkt i det foslashrste spil Sandsynligheden for at banken bliver ruineret med n enheder er lig med Sandsynligheden for at banken vinder det foslashrste spil (hvor den vinder en enhed) gange sandsynligheden for at banken bliver ruineret med n+1 enheder plus sandsynligheden for at banken taber det foslashrste spil (hvor den mister 35 enhed) gange sandsynligheden for at banken bliver ruineret med n-35 enheder Sandsynlighederne for at banken vinder og taber er 3637 og 137 Vi kan da opstille ligningen

351

111351 37

1

37

36

37

1

37

36 nnn

nnn rrrrrr

Ved division med (r1)

n-35 og omordning af leddene og ved at saeligtte r1 = x faringr man ligningen

36x36 ndash 37x35 +1 = 0 Denne ligning kan kun loslashses ved numeriske metoder og man finder loslashsningen x = 09984 Hvis vi igen stiller sposlashrgsmaringlet Hvor mange indsatser skal banken raringde over for at der er mindre end 1 chance for ruin skal vi loslashse ligningen

Ruinsandsynligheder 8

2876)99840ln(

)010ln(010)99740( nn

Altsaring en betydelig stoslashrre beholdning end hvis spilleren spiller paring 18 felter Forsoslashger vi at udregne ruinsandsynligheden for en spiller der har n enheder og laeliggger sin indsats paring eacutet felt kommer vi efter helt det samme raeligsonnement frem til foslashlgende rekursionsligning

35137

11137

36

37

1

37

361351

nn rrrrrr

nnnn

som foslashrer til ligningen x36 ndash 37x +36 = 0 Denne ligning har kun loslashsningen x = 1 Differentieres nemlig f(x) =x36 ndash 37x +36 finder man f (x) =36x35 ndash 37 Ligningen f (x) =0 har

loslashsningen 136

3735 x Da f (x) lt 0 for x lt 1 har den ingen roslashdder mindre end 1

Ruin-sandsynligheden for en spiller der garingr paring et Casino som har en ubegraelignset beholdning er 1 Saring vi kan endnu engang fastslaring at hvis man fortsaeligtter med at spille paring et Casino vil man altid blive ruineret i det lange loslashb Man kunne selvfoslashlgelig overveje ruinsandsynlighederne hvis Casino har beholdningen n og en spiller har beholdningen m (n gt m eller omvendt) men svaret vil afhaelignge af n og m og de indgaringende to ulineaeligre ligninger med to ubekendte med meget hoslashje eksponenter er ikke saring nemme at loslashse numerisk ndash selv paring en Computer Hvis n gtgt m vil svaret stort set vaeligre det samme

Strategier ved spil 9

Kap 2 Strategier ved spil

1 Forskellige spil Efter at have udregnet vindersandsynligheder i forbindelse med spil skal vi nu se paring noget andet som ogsaring er knyttet sammen med sandsynlighedsregningen nemlig problemet med at fastlaeliggge den bedste strategi naringr man spiller et spil Her skal spil imidlertid forstarings i en meget videre betydning det vaeligre sig krig boslashrsspekulation jagt eller fiskeri paring en bestemt dyreart Sidstnaeligvnte er dog alt for komplicerede til at kunne behandles elementaeligrt Faeliglles er det dog at man skal kunne beregne sandsynligheden for en bestemt konsekvens af et givet traeligk Vi vil begynde med at give nogle meget simple eksempler paring spil hvor det er meningsfuldt at tale om optimal strategi Vendingen den optimale strategi indebaeligrer at spillet afvikles i et endeligt antal trin og at der for hvert trin i spillet er mulighed for at forbedre sin gevinst og mulighed for at miste sin gevinst helt eller delvis Man skal endvidere have mulighed for at standse spillet ved ethvert trin og inkassere sin gevinst

11 Mandags-chancen I dette spil som har vaeligret lanceret af TV2 har man en raeligkke tildaeligkkede felter med beloslashb (101025255050100100250) x 1000 kr Man har maximalt 3 forsoslashg Man faringr beloslashbet paring det sidst afdaeligkkede felt Nedenfor er vist en computer simulation af spillet efter 2 traeligk Det er nok klart at hvis man afdaeligkker et felt med 10 i 1 eller 2 forsoslashg skal man fortsaeligtte eller hvis man afdaeligkker et felt med 100 eller 250 i 1 eller 2 forsoslashg skal man standse Men hvad hvis man afdaeligkker et felt med 50 i 1 eller 2 forsoslashg Det vil vi forsoslashge at afgoslashre ved nogle mere matematiske betragtninger

12 Skaeligbnen Et spil som vist nok kommer fra orienten Det spilles med to terninger Foslashrst slaringr man et slag med de to terninger og summen af deres oslashjental betegnes skaeligbnen

Strategier ved spil 10

Man kan nu slaring lige saring mange gange man vil (max 100) Hvis oslashjentallene ikke er lig skaeligbnen saring adderes dette til ens pointtal men hvis man slaringr sin skaeligbne mister man alt Nedenfor er vist et trin i en animeret computer simulation af spillet Naringr spillet er standset fordeler man indsatsen i forhold til spillernes opnaringede pointtal Det gaeliglder derfor om at have de stoslashrste pointtal Problemet er imidlertid hvornaringr det er optimalt at standse naringr man kender sin skaeligbne

13 Indbrudstyvens pensionsproblem Dette er en variant af mange forskellige optimeringsproblemer Arthur er indbrudstyv Hver tyvetugt giver i snit K kr Chancen for at Arthur bliver snuppet er p Hvis han bliver taget mister han alt fra sine tidligere tyvetugter Hvor mange indbrud skal Arthur lave foslashr han standser sin karriere og vaeliglger at leve af sin opsparing

14 Taeligndstikspillet Dette spil falder lidt uden for rammerne af de oslashvrige spil fordi man ikke kan standse spillet og fordi man aldrig kan miste noget af sin gevinst Det kan derfor ikke umiddelbart behandles paring samme maringde som de hidtil naeligvnte spil Alligevel er det et spil der udpraeligget kan behandles med matematiske teorier for den bedste strategi Spillet garingr ud paring at man paring 10 taeligndstikker farver den ene side roslashd Kastes taeligndstikken op er sandsynligheden for at den farvede side vender opad naringr den lander paring bordet lig med p = 025 Hver spiller har fra starten tallene 110 Hvert tal maring kun bruges 1 gang Man skiftes til at kaste de 10 taeligndstikker og notere antallet af farvede taeligndstikker Dette antal skal saring ganges med et af de resterende tal 110 Den som efter 10 spil har den hoslashjeste sum har vundet Det kan oplyses og let verificeres at den maximale gevinst er 550 Middelgevinsten hvor man vaeliglger tilfaeligldig er 1375 og den optimale middelgevinst er ca 167

Strategier ved spil 11

15 Casino Roulette spil falder ogsaring lidt uden for rammerne af optimale strategier af den meget simple grund at odds er svagt imod eacuten Det gaeliglder dog ikke for Blackjack hvor man kan udvikle en strategi som giver en svag fordel Hvis odds er imod eacuten vil man imidlertid altid tabe i det lange loslashb Som tidligere fastslaringet er den eneste mulighed - i det lange loslashb - for at undgaring ruin i roulettespil at der ikke er nogen oslashvre graelignse for indsatser og at man har flere penge end Casionorsquoet og ingen af disse to betingelser er nogensinde opfyldt Enhver fornuftig matematisk spil-teori vil derfor som resultat have at man skal standse foslashr det foslashrste spil Det vil sige Man skal lade vaeligre med at garing paring Casino Denne kendsgerning udelukker dog ikke at man kan goslashre sig overvejelser over hvordan man kan spille hvis man ikke udelukkende er interesseret i at foraeligre sine penge til et Casino uden kamp

2 Optimale Strategier Hvis man intuitivt skal formulere en strategi for de 3 foslashrste spil naeligvnt ovenfor saring kan man feks vaeliglge eacuten af 3 foslashlgende strategier 1 Man beslutter paring forharingnd hvor stor ens gevinst (eller tab) skal vaeligre foslashr man stopper Dette er

faktisk en meget almindelig strategi men den er bestemt ikke optimal 2 Man fortsaeligtter saring laelignge man i middel har mulighed for at foroslashge sin gevinst i naeligste spil Man

skal huske paring at middelvaeligrdien af gevinsten ogsaring omfatter tab saring middelvaeligrdien (i matematisk forstand) skal vaeligre positiv Denne umiddelbart fornuftige strategi kaldet den kortsigtede eller myope strategi er i mange tilfaeliglde ogsaring den optimale strategi (dog ikke i mandagschancen)

3 Man fortsaeligtter saring laelignge man i middel har mulighed for at foroslashge sin gevinst i et af de

efterfoslashlgende spil Denne strategi kaldes den langsigtede strategi Baringde den kortsigtede og den langsigtede strategi ser yderst rimelige ud og de vil ogsaring vaeligre optimale for langt de fleste spil Hvis der er forskel paring den langsigtede og den kortsigtede strategi skal man anvende den langsigtede - naturligvis Der findes imidlertid visse former for spil hvor ingen af strategierne er optimale Det gaeliglder feks for boslashrsspekulanter der har en beholdning aktier som de vil saeliglge naringr kurserne stiger Dette fortsaeligtter som bekendt aldrig i det uendelige Paring et vist tidspunkt standser stigningen og kurserne begynder at falde ndash som regel ndash hurtigere end de steg Hvornaringr skal man saeliglge for at opnaring den stoslashrste gevinst Det viser sig - men det er saeligrdeles kompliceret at redegoslashre for ndash at naringr det gaeliglder boslashrs spekulation saring er ingen af strategierne 2 og 3 optimale De vil begge to i grove traeligk som resultat have at man enten skal saeliglge straks eller vente til man er ruineret Vi vil nu give en beskrivelse af den optimale strategi som er udviklet af Snell Vi vil overhovedet ikke naeligrme os et bevis for at det er den optimale strategi (beviset er ret teknisk abstrakt) men

Strategier ved spil 12

understrege at det kan bevises I matematisk forstand Ulemperne ved Snell-strategien er at den for selv simple problemer kan foslashre til ret omfattende og komplicerede regninger

2 Den optimale Snell-strategi Snell-strategien er paring sin vis den samme som den kortsigtede strategi men hvor man i denne strategi hele tiden regner sig et skridt frem saring tager Snell-strategien udgangspunkt i spillets slutning og arbejder sig baglaeligns Vi indfoslashrer foslashrst nogle betegnelser Vi antager at spillet har n trin Sk er en stokastisk variabel der angiver den faktiske samlede gevinst man har opnaringet ved det kte spil Sk kan antage en eller flere vaeligrdier med tilhoslashrende sandsynligheder Det nye ved Snell-strategien er at man definerer endnu en stokastisk variabel Gk ved ligningen

Gk = maxSk E(Gk+1| S1Sk) Gk er den stoslashrste af vaeligrdierne Sk (gevinsten efter det kte spil) og E(Gk+1| S1Sk)) som er middelvaeligrdien af den maximale forventede gevinst i det k+1te spil naringr det er givet at man har spillet spillene 1k Dette opstilles i et skema Gn = Sn Gevinsten ved spillets afslutning Gn-1 = maxSn-1 E(Gn| S1Sn-1) Gk = maxSk E(Gk+1| S1Sk) G1 = maxS1 E(G2| S1) Snell strategien siger nu at man skal standse spillet den foslashrste gang Sk (gevinsten efter det kte spil) overstiger middelvaeligrdien af den maksimale forventede gevinst i det k+1te spil Dette kaldes for stopbetingelsen Stopbetingelsen er altsaring

Sk E(Gk+1| S1Sk) Man skal altsaring standse spillet naringr den opnaringede gevinst er stoslashrre eller lig med den betingede forventning af den maximale gevinst i det naeligste spil Det kunne lyde som den kortsigtede strategi men forskellen er den at i den kortsigtede strategi er Gk+1 erstattet af Sk+1 At kunne gennemskue konsekvenserne af dette er derimod ikke saring nemt Det viser sig at i mange tilfaeliglde at er Snell-Strategien identisk med den kortsigtede strategi som kraeligver at man stopper naringr Sk E(Sk+1| S1Sk) Snell strategien er ikke umiddelbart let gennemskuelig og udregningen af de betingede middelvaeligrdier E(Gk+1| S1Sk) er ofte ret teknisk Vi vil nu behandle de foslashr naeligvnte eksempler og begynder med

Strategier ved spil 13

21 Indbrudstyvens pensionsproblem Lad os antage at Arthurs gennemsnitlige gevinst ved hvert tyvetogt er K = 6000 kr og at chancen er at han bliver taget er 5 Lad os antage at hans hidtidige gevinst efter k - tyvetugt er Sk som bliver konfiskeret - og som han derved mister hvis han bliver snuppet I dette tilfaeliglde kan man - som vist nedenfor - se at den kortsigtede strategi er den optimale strategi Det haelignger sammen med at alle trin i spillet er identiske Gevinsten ved hvert tyvetogt er den samme ndash uafhaeligngigt af de foregaringende tyvetugter - bortset fra at den samlede gevinst vokser ved hvert vellykket tyvetogt Xk betegner den stokastiske variabel som er Arthurs gevinst ved eacutet tyvetugt Hermed er

Sk =X1+ X2+ X3+hellip Xk Xk+1 kan antage vaeligrdien K med sandsynlighed 1-ps = 1-P(Snuppet) (altsaring hvis det naeligste tyvetugt lykkes) og vaeligrdien ndashSk (han mister hele sin opsparing) med sandsynlighed ps = P(Snuppet) Vi opskriver nu Snell-strategien (Den kortsigtede strategi) for et trin i hans karriere

Gk = max Sk E(Sk+1| 1k)

Sk er hans gevinst efter k tyvetugter og E(Sk+1| 1k) er hans forventede gevinst efter k+1 tyvetugter E(Sk+1| 1k) kan beregnes som den hidtidige gevinst plus den forventede gevinst ved naeligste tyve- tugt i alt lig med Sk + E(Xk+1) E(Xk+1) er uafhaeligngig af de foslashrste k - tyvetugter derfor bliver stopbetingelsen Sk gt Sk + E(Xk+1) E(Xk+1) lt 0 Middelvaeligrdien E(Xk+1) kan saringledes udregnes efter den saeligdvanlige definition idet Xk+1 antager vaeligrdierne K (gevinsten ved et tyvetugt) og - Sk (mister hele sin opsparing) med sandsynlighederne 1-ps og ps henholdsvis E(Xk+1) = K(1- ps) - Sk ps Han skal standse naringr

E(Xk+1) lt 0 K(1- ps) lt Sk ps som med tal eksemplet giver

6000095 lt Sk005 Sk gt 114000- kr svarende til 114006000 = 095005 = 19 tyvetugter

(Det goslashr han nu nok ikke og er derfor henvist til at leve af folkepensionen efter nogle aringr i skyggen) Man kunne godt tro at dette eksempel kunne anvendes paring andre (ligesaring uetiske) problemstillinger Feks hvor mange gange det er optimalt at koslashre gratis i S-tog Det kan det imidlertid ikke helt

Strategier ved spil 14

Sagen er jo den at man faringr en fast boslashde hvis man bliver snuppet men man kommer ikke til at betale for de gange man har koslashrt gratis Med andre ord vurderingen om hvorvidt det er fordelagtigt at koslashre uden billet afhaelignger kun af middelgevinsten ved det naeligste forsoslashg Hvis den er positiv er det fordelagtigt at fortsaeligtte men hvis den er negativ er det fordelagtigt at loslashse billet (Det er i oslashvrigt uetisk at snyde ndash naturligvis) Tager vi et eksempel billetprisen er kr 50- Boslashden er kr 500 Sandsynligheden for at blive snuppet er Ps = 01 Hvis X er gevinsten ved at koslashre uden billet er E(X) = 50middot(1-Ps)-500middotPs = 50middot09-500middot01 = -50 Det er saringledes (med denne sandsynlighed for at blive snuppet) ikke fordelagtigt at koslashre uden billet i S-tog Da en laeligrebog i sandsynligheder ved spil naturligvis ikke maring tilskynde til uetiske handlinger undlader vi at foretage beregningen med Ps = 005

22 Skaeligbnen Vi betragter kast med to terninger X betegner summen af oslashjentallene ved eacutet kast Sandsynlighedsfordelingen for X er velkendt Feks er P(X=5) = 436 Sandsynligheden for at terningerne viser j oslashjne kan skrives som

36

76)(

jjXP

Lad os antage at spillerens skaeligbne er q Hvis man slaringr dette oslashjental er alt tabt Ellers adderes oslashjentallene for hvert kast Hvis ikke man har slaringet sin skaeligbne saring er den samlede gevinst efter n spil

Sn = X1+ X2+ X3+hellip +Xn

Og middelvaeligrdien af Sn er

E(Sn) = E(X1)+ E(X2)+E(X3)+hellip +E(Xn) = nE(X | X q) E(X | X q) er den betingede middelvaeligrdi af oslashjentallene givet at man ikke slaringr sin skaeligbne

E(X | X q) = 2P(2) +3P(3)+hellip(q-1)P(q-1) + (q+1)P(q+1)+hellip+12P(12) Den kortsigtede strategi (og Snell strategien) fastslaringr at man skal standse naringr middelvaeligrdien af den forventede gevinst ved naeligste kast er negativ Argumentet for dette kan overtages naeligsten ordret fra indbrudstyvens pensionsproblem E(Sk+1|S1 Sk) kan beregnes som den hidtidige gevinst Sk plus den forventede gevinst ved det naeligste kast i alt lig med Sk + E(Xk+1| S1 Sk) Stopbetingelsen er derfor

Sk gt Sk + E(Xk+1| S1 Sk) E(Xk+1| S1 Sk) lt 0

Strategier ved spil 15

E(X | X q) ndash SnP(q) lt 0 Sn gt E(X | X q) P(q) Det er ikke saeligrlig svaeligrt at udregne stopbetingelsen feks for q = 2 og q = 6 Nedenfor er vist udskriften fra et program som foretager beregningen for q = 212 Forventet gevinst i naeligste kast naringr ens skaeligbne er q q 2 3 4 5 6 7 8 9 10 11 12 694 683 667 644 617 583 589 600 617 639 667 Stop naringr din gevinst S gt EX(q)P(q) naringr skaeligbne er q q 2 3 4 5 6 7 8 9 10 11 12 25000 12300 8000 5800 4440 3500 4240 5400 7400 11500 24000

Som det fremgaringr er der endog meget stor forskel paring stoptiderne afhaeligngig af ens skaeligbne

23 Mandagschancen Dette spil er lidt mere interessant fordi det ikke er helt saring enkelt at gennemskue I dette tilfaeliglde kan man ikke forvente at den kortsigtede strategi vil foslashre til den optimale strategi At den faktisk goslashr det skyldes talvaeligrdierne Dette skal forstarings saringledes at hvis man aeligndrede paring praeligmiestoslashrrelserne ville Snell-strategien afvige fra den kortsigtede strategi Vi vil analysere spillet ved Snell-strategien Som naeligvnt har man i spillet 9 tildaeligkkede felter (101025255050100100250) Man kan afdaeligkke hoslashjest 3 felter Man faringr beloslashbet i 1000 kr som det sidste felt viser Hvis X er den stokastiske variabel som angiver vaeligrdien af et felt saring vil de fleste uden saring lange overvejelser vel fortsaeligtte hvis Xlt50 og standse hvis X100 Det kritiske er hvis man afdaeligkker 50 (X=50) Vi bemaeligrker foslashrst at summen af alle felterne er S=620 og at E(X) =6209=689 Vi opskriver foslashrst den fuldstaeligndige Snell-strategi for dette spil G3 =X3 Den Stokastiske variabel G3 = Gevinsten = X3 = vaeligrdien af det sidst afdaeligkkede felt G2 = max X2 E(G3| X1X2 ) Den stoslashrste af vaeligrdierne X2 (= vaeligrdien af det afdaeligkkede

felt) og den betingede middelvaeligrdi af G3 = X3 G1 = max X1 E(G2| X1 ) Som ovenfor Kriteriet for den optimale strategi er som tidligere Stop hvis paring noget trin Xk gt E(Gk+1| X1Xk ) Det er relativ nemt at opstille en formel for E(G3| X1X2 ) Naringr X1 og X2 er afdaeligkket er summen de resterende felter S - X1 - X2 Da alle felter har samme sandsynlighed er middelvaeligrdien simpelthen middeltallet af felterne E(G3| X1X2 ) = ( S - X1 - X2)(9-2)

Strategier ved spil 16

Det er noget mere teknisk at opstille en formel for E(G2| X1 ) og ogsaring lidt teknisk at foretage beregningen Vi vil noslashjes med at skitsere beregningen for en vaeligrdi af X1 og i oslashvrigt henvise til resultatet af et Computerprogram som kan ses nedenfor Lad os antage at X1 = 25 Vi lader nu X2 gennemloslashbe alle de mulige vaeligrdier (alle vaeligrdier skal taeliglles med det antal gange der er felter med denne vaeligrdi) For hver vaeligrdi af X2 (feks 50) skal vi vaeliglge max af X2 og E(G3| X1X2 ) = ( S - X1 - X2) (9-2) (= (620-50-25)7 = 778 i dette tilfaeliglde) og addere det til en sum S2 E(G2| X1 ) er da lig med S2(9-1) (da der er 9-1 felter X2 ) X2[1]= 1000 E(G3)= 8571 G2= 8571 X2[2]= 2500 E(G3)= 8357 G2= 8357 X2[3]= 5000 E(G3)= 8000 G2= 8000 X2[4]= 10000 E(G3)= 7286 G2= 10000 X2[5]= 25000 E(G3)= 5143 G2= 25000 X1[1]= 1000 E(G[2])= 10786 X2[1]= 1000 E(G3)= 8357 G2= 8357 X2[2]= 2500 E(G3)= 8143 G2= 8143 X2[3]= 5000 E(G3)= 7786 G2= 7786 X2[4]= 10000 E(G3)= 7071 G2= 10000 X2[5]= 25000 E(G3)= 4929 G2= 25000 X1[2]= 2500 E(G[2])= 10679 X2[1]= 1000 E(G3)= 8000 G2= 8000 X2[2]= 2500 E(G3)= 7786 G2= 7786 X2[3]= 5000 E(G3)= 7429 G2= 7429 X2[4]= 10000 E(G3)= 6714 G2= 10000 X2[5]= 25000 E(G3)= 4571 G2= 25000 X1[3]= 5000 E(G[2])= 10500 X2[1]= 1000 E(G3)= 7286 G2= 7286 X2[2]= 2500 E(G3)= 7071 G2= 7071 X2[3]= 5000 E(G3)= 6714 G2= 6714 X2[4]= 10000 E(G3)= 6000 G2= 10000 X2[5]= 25000 E(G3)= 3857 G2= 25000 X1[4]= 10000 E(G[2])= 9643 X2[1]= 1000 E(G3)= 5143 G2= 5143 X2[2]= 2500 E(G3)= 4929 G2= 4929 X2[3]= 5000 E(G3)= 4571 G2= 5000 X2[4]= 10000 E(G3)= 3857 G2= 10000 X1[5]= 25000 E(G[2])= 6268 Ser man resultaterne igennem kan de udmoslashntes i en simpel regel Fortsaeligt paring 50 eller derunder Stop paring 100 eller derover Det er maringske lidt overraskende at man ogsaring skal forsaeligtte paring 50000 hvis man kun har et forsoslashg tilbage ndash man kunne jo ende med 10000 og det er saring bare aeligrgerligt ndash og det er vist nok de fleste som standser ved 50000 - men det er ikke den bedste strategi

Strategier ved spil 17

24 Casino Som naeligvnt i indledningen til dette afsnit findes der ingen strategi som kan bringe en i stand til at vinde paring et Casino ndash i det lange loslashb Vil man goslashre Casino-spil til en levevej vil det altid med matematisk sikkerhed ende med ruin Det betyder imidlertid ikke at man ikke kan vinde ved at garing paring Casino men hvis man taelignker paring at spraelignge banken saring skal to krav i hvert fald vaeligre opfyldt for at der skal vaeligre en ikke forsvindende sandsynlighed for at det kan lade sig goslashre 1 Man skal have flere penge end Casino 2 Der maring ikke vaeligre loft over indsatserne Begge betingelser er som bekendt aldrig opfyldt Man kan som sagt godt vinde paring et Casino men hvis man satser paring at vinde mere (alle de gange man er paring Casino i sit liv) end det beloslashb man medbringer ved hvert besoslashg saring vil chancerne for at tabe det hele vaeligre stoslashrst Her er der tale om sandsynligheder og middelvaeligrdier ndash om odds Selvfoslashlgelig er de muligt at tabe hele sin formue ved foslashrste besoslashg eller vinde det tredobbelte ved det andet Der har i tidens loslashb vaeligret lanceret flere eksempler paring vinderstrategier som lyder uhyre besnaeligrende Den mest kendte er Martingale-systemet Man spiller kun paring sort og roslashd hvor faringr man faringr fordoblet sin indsats hvis man vinder Spillet er saringledes helt lige bortset fra at indsatserne bliver liggende naringr zero kommer ud og man kun faringr sin indsats en gang hvis man vinder i naeligste spil (zero har ingen farve) Spiller man efter Martingale-systemet skal man inkassere sin gevinst hvis man vinder Hvis man derimod taber skal man fordoble sin indsats Vi saeligtter grundindsatsen til 1 Har man spillet n gange og dermed doblet op n-1 gange har man lagt en indsats Sn = 1 + 2 + 22 +hellip2n-1 = 2n ndash1 Udregnet af kvotientraeligkkeformlen

1

10

q

qaS

n

n

for raeligkken Sn = a0 + a0q+ a0q

2+hellip+ a0qn-1

Vinder man det nte spil faringr man udbetalt 22

n-1 = 2n saring ens gevinst er 2n - (2n - 1) = 1 Der gaeliglder aringbenbart den simple kendsgerning at bliver man bare ved med at fordoble saring har man altid vundet eacuten indsats Foslashr man forsoslashger sig med dette skal man dog nok goslashre sig klart hvor mange gange man kan tabe foslashr man er ruineret

Strategier ved spil 18

Sandsynligheden for at man taber 5 spil er (frac12)5 = 132 Man har da tabt 25 ndash 1 gange vaeligrdien af en jeton (i Danmark 50 kr) dvs 1550 kr Vil man sikre sig bedre feks ved at kunne doble op 9 gange (sandsynligheden for at tabe 10 spil er 11024) saring skal man komme med kr 51150- men det kan man ikke engang gennemfoslashre da hoslashjeste indsats i Danmark er 24000- Man kunne imidlertid stille det sposlashrgsmaringl Hvis man har n-jetoner hvad er saring sandsynligheden for at vinde q-jetoner hvis man spiller efter Martingale-systemet Dette kan man faktisk godt udregne direkte men regningerne er ret omfattende Derimod er resultatet simpelt Vi vil ikke lave en direkte udregning men anvende de samme metoder som vi har anvendt for den bedste strategi Vi tager udgangspunkt i det faktum at sort roslashd Casino spil er et lige spil saring middelvaeligrdien af gevinsten er 0 ligegyldigt hvordan man spiller Middelvaeligrdien (som er nul ) af en gevinst paring q-jetoner er lig med q gange sandsynligheden P(q) for at vinde q jetoner minus ens kapital (n jetoner) gange med sandsynligheden for at man taber det sidste spil som er 1 ndash P(q)

qP(q) ndash n(1 ndashP(q)) = 0 qn

nqP

)(

Har man feks n = 31 jetoner (1550- kr) er sandsynligheden for at vinde q=10 (500 kr) lig med 0756 En rimelig stor sandsynlighed men altsaring stadig 25 chance for ruin Oslashnsker man derimod at blive rigtig rig og vinde 10000- kr dvs q=200 er P(200) = 0134 Konklusionen er den at satser man paring at vinde mere end man medbringer saring er sandsynligheden mindre end frac12 men kan man noslashjes med mindre saring er sandsynligheden stoslashrre end frac12 Men bemaeligrk dette gaeliglder fra foslashrste gang man garingr ind paring et Casino til man beslutter at holde op

25 Taeligndstikspillet Som beskrevet ovenfor garingr spillet ud paring at farve den ene af siderne roslashd paring 10 taeligndstikker Naringr taeligndstikken kasten op i luften er sandsynligheden for at den roslashde side vender opad naringr den rammer bordet lig med p=025 Man kaster paring skift 10 saringdanne taeligndstikker 10 gange For hvert kast skal man multiplicere antallet af roslashde med et af tallene 110 Hver tal maring kun bruges eacuten gang Den der faringr den stoslashrste sum har vundet Det er klart at en god strategi i det lange loslashb vil give en hoslashjere sum Vi minder om at antallet af X roslashde taeligndstikker er binomialfordelt med primaeligrsandsynlighed p og antalsparameter n=10

102104

3

4

110)(

10

jj

jXPjj

Strategier ved spil 19

Endvidere vil vi anvende de kumulerede sandsynligheder P(X j) og P(X j) Nedenfor er vist resultatet af en Computersimulation af spillet Primaeligr sandsynligheder for n= 10 og p= 0250 P(X=j) j 0 1 2 3 4 5 6 7 8 9 10 00563 01877 02816 02503 01460 00584 00162 00031 00004 00000 00000 Baglaeligns kumulerede sandsynligheder P(Xgt=q) j 0 1 2 3 4 5 6 7 8 9 10 10000 09437 07560 04744 02241 00781 00197 00035 00004 00000 00000 1 kast Antal = 2 Vaeliglg mellem 1 2 3 4 5 6 7 8 910 Faktor= 4 2 kast Antal = 4 Vaeliglg mellem 1 2 3 5 6 7 8 910 Faktor=10 3 kast Antal = 2 Vaeliglg mellem 1 2 3 5 6 7 8 9 Faktor= 5 4 kast Antal = 2 Vaeliglg mellem 1 2 3 6 7 8 9 Faktor= 3 5 kast Antal = 3 Vaeliglg mellem 1 2 6 7 8 9 Faktor= 8 6 kast Antal = 2 Vaeliglg mellem 1 2 6 7 9 Faktor= 6 7 kast Antal = 6 Vaeliglg mellem 1 2 7 9 Faktor=9 8 kast Antal = 3 Vaeliglg mellem 1 2 7 Faktor= 2 9 kast Antal = 2 Vaeliglg mellem 1 7 Faktor= 7 10 kast Antal = 2 Vaeliglg mellem 1 Faktor= 1 Din score er 176 Valget af tallene 110 er i dette tilfaeliglde foretaget ud fra den optimale strategi som vi vil omtale om et oslashjeblik Foslashr vi analyserer den optimale strategi for dette spil vil vi forsoslashge os med en intuitiv bedste strategi Vi belyser denne strategi med et konkret eksempel Lad os feks antage at vi slaringr 4 roslashde i den 3 kast (3 forsoslashg) De tal vi har tilbage kalder vi (y8 y7 y6 y5 y4 y3 y2 y1) Sposlashrgsmaringlet om vi skal gange med det stoslashrste y8 eller det naeligststoslashrste y7 osv Vi raeligsonnerer da som foslashlger Hvis sandsynligheden for at slaring mere end 4 roslashde i de resterende 7 kast er stoslashrre end frac12 saring skal vi vaeliglge det naeligststoslashrste Vi skaeligrper dette Hvis sandsynligheden for at slaring mindst 5 roslashde mindst en gang i de resterende 7 kast er stoslashrre end frac12 saring skal vi vaeliglge det naeligststoslashrste Tilsvarende hvis sandsynligheden for at slaring mindst 5 roslashde mindst 2 gange i de resterende 7 kast skal vi vaeliglge det 3 stoslashrstehellipog saringdan fremdeles Strategien virker umiddelbart meget plausibel Sandsynlighederne kan direkte farings af binomialfordelingen Foslashrst sandsynligheden for at faring mindst q-roslashde i et kast Dette er

P(X q) =

n

qj

jXP )( hvor P(X = j) er angivet ovenfor

Strategier ved spil 20

Sandsynligheden for at dette sker mindst r gange i n - k kast er ogsaring en binomialfordeling og kan skrives

P(X q mindst r gange i n - k kast ) = jknjkn

rj

qXPqXPj

kn

))(1()(

Beregningen af disse (110) sandsynligheder goslashres nok lettest paring en computer For at lave en strategi-tabel goslashr man det at for hvert kast og hvert antal mulige roslashde vaeliglger man foslashrst det stoslashrste af de resterende tal Dernaeligst beregner man sandsynligheden for at faring mindst 1 roslashd mere i et af de foslashlgende kast Hvis denne sandsynlighed er stoslashrre end frac12 ser man paring det naeligststoslashrste af de resterende tal Man beregner saring sandsynligheden for at faring mindst 1 roslashd mere i mindst to af de resterende kast Hvis denne sandsynlighed er stoslashrre end frac12 saring vaeliglger man det tredjestoslashrste af de resterende tal og saringdan fremdeleshellip Det bemaeligrkes at beregningen skal initialiseres med at man altid vaeliglger det mindste hvis man slaringr 0 roslashde og altid vaeliglger det stoslashrste hvis man slaringr 10 roslashde Nedenfor er vist en computerberegning af en strategi-tabel Endvidere er ogsaring lavet en saringkaldt Monte-Carlo simulation Dette betyder at man har ladet maskinen spille feks 10000 spil spillet efter strategi-tabellen Nederst er vist hyppighederne for ens score og endelig fordelingsfunktionen for observationerne (Den kumulerede frekvens) P(X =j) for n =10 and p = 0250 j 0 1 2 3 4 5 6 7 8 9 10 P(X =j)0056 0188 0282 0250 0146 0058 00162 0003 00004 0000 0000 P(Xgt=j) for n =10 and p = 0250 j 0 1 2 3 4 5 6 7 8 9 10 P(Xgt=j) 1000 0944 0756 0474 0224 0078 00197 00035 00004 0000 0000 Strategi tabel Tallene refererer ikke til faktorene selv men til den stoslashrste naeligststoslashrste osv Eksempel Hvis man slaringr 3 roslashde i den andet kast saring skal man vaeliglge (7) den tredjestoslashrste Kast no 1 2 3 4 5 6 7 8 9 10 score 0 1 1 1 1 1 1 1 1 1 1 1 3 3 3 2 2 2 2 1 1 1 2 6 5 5 4 4 3 3 2 2 1 3 8 7 7 6 5 4 3 3 2 1 4 9 9 8 7 6 5 4 3 2 1 5 10 9 8 7 6 5 4 3 2 1 6 10 9 8 7 6 5 4 3 2 1 7 10 9 8 7 6 5 4 3 2 1 8 10 9 8 7 6 5 4 3 2 1 9 10 9 8 7 6 5 4 3 2 1 10 10 9 8 7 6 5 4 3 2 1 Gennemsnitlig score = 16437

Strategier ved spil 21

Hyppighed af score h( 75)= 1 h( 80)= 7 h( 85)= 3 h( 90)= 5 h( 95)= 6 h(100)= 34 h(105)= 38 h(110)= 82 h(115)= 68 h(120)=161 h(125)=146 h(130)=320 h(135)=280 h(140)=534 h(145)=425 h(150)=752 h(155)=577 h(160)=878 h(165)=645 h(170)=956 h(175)=651 h(180)=863 h(185)=527 h(190)=609 h(195)=351 h(200)=389 h(205)=180 h(210)=203 h(215)= 93 h(220)= 86 h(225)= 47 h(230)= 32 h(235)= 21 h(240)= 13 h(245)= 8 h(250)= 3 h(255)= 0 h(260)= 4 h(265)= 1 h(270)= 1 h(275)= 0 h(280)= 0 Frekvens of score F( 80)=00008 F( 85)=00011 F( 90)=00016 F( 95)=00022 F(100)=00056 F(105)=00094 F(110)=00176 F(115)=00244 F(120)=00405 F(125)=00551 F(130)=00871 F(135)=01151 F(140)=01685 F(145)=02110 F(150)=02862 F(155)=03439 F(160)=04317 F(165)=04962 F(170)=05918 F(175)=06569 F(180)=07432 F(185)=07959 F(190)=08568 F(195)=08919 F(200)=09308 F(205)=09488 F(210)=09691 F(215)=09784 F(220)=09870 F(225)=09917 F(230)=09949 F(235)=09970 F(240)=09983 F(245)=09991 F(250)=09994 F(255)=09994 F(260)=09998 F(265)=09999 F(270)=10000 F(275)=10000

Som det fremgaringr af tabellen for P(X gt= j) er der kun 78 chance for at slaring 5 roslashde eller derover saring goslashr man det skal man altid vaeliglge det stoslashrste af de resterende tal For 3 eller 4 roslashde er situationen langt mere uigemmeskuelig og kun en beregning kan afgoslashre sagen Vi proslashver nu at finde den optimale strategi eller Snell-strategien Hvad angaringr sposlashrgsmaringlet om hvorvidt vi skal vaeliglge den stoslashrste eller naeligststoslashrste saring lader det sig faktisk goslashre at beregne Snell-strategien paring en computer De foslashlgende tilfaeliglde bliver derimod for komplicerede og der anvender vi en svagt forbedret version af vores intuitive strategi Forbedringen bestaringr i foslashlgende idet vi illustrerer det med et eksempel Lad os sige vi har slaringet 3 roslashde og vi overvejer om vi vil gange det med 7 eller 6 Ganger vi med 6 er det fordi vi forventer at slaring mindst 4 roslashde mindst en gang i de resterende kast Vores score vil vaeligre 73 og 74 henholdsvis og scoren vil blive forbedret med en faktor 43 hvis vi ganger med 6 under forventning af at slaring 4 roslashde Vores forbedring af strategien garingr da ud paring at vi vaeliglger det naeligststoslashrste 6 hvis sandsynligheden for at slaring 4 roslashde gange den relative forbedring 43 er stoslashrre end frac12 Vi rekapitulerer dernaeligst Snell-strategien G10 = X10 X10 Stokastisk variabel = antallet af roslashde i det 10 kast G9 = max X9 E(G10) E(G10) = E(X10) = np=10025 = 25 X9 = 01hellip10 Gk = max Xk E(Gk+1) E(Gk) kraeligver en laeligngere udregning men den udregnes som en

almindelig middelvaeligrdi altsaring som max af de to vaeligrdier gange P(X=Xk-1) G1 = max X1 E(G2) Som eksempel udregner vi E(G9) Da E(G10)=25 skal vi for X9 = 012 anvende E(G10)=25 i udregningen

Strategier ved spil 22

E(G9) = 25 (P(X=0)+P(X=1)+P(X=2))+ 3P(X=3)+hellip+10P(X=10) =306 Vaeligrdierne for E(Gk) er alle udregnet og vist i computerberegningen nedenfor Bemaeligrk isaeligr at de vokser fra 25 til 425 naringr k aftager fra 10 til 2 Strategien er nu foslashlgende Vaeliglg det stoslashrste af de resterende tal hvis Xk gt E(Gk+1) (altsaring det antal man har slaringet er er stoslashrre end det forventede stoslashrste antal) ellers vaeliglg det naeligststoslashrste Ved afgoslashrelsen om de 3 stoslashrste 4 stoslashrste osv anvender vi den hidtidige strategi med den modifikation at vi multiplicerer sandsynligheden med den formodede relative forbedring E(G10-kast)antal roslashde En computerberegning helt svarende til den foregaringende men med den aeligndrede strategi er vist nedenfor Man bemaeligrker for det foslashrste de smaring aeligndringer der er i strategien Den nye strategi er lidt mindre forsigtig men den giver altsaring ogsaring pote i form af en forbedring af gennemsnittet paring ca 275 Primaeligr sandsynligheder P(X=j) for n= 10 og p= 0250 j 0 1 2 3 4 5 6 7 8 9 10 P(X=j)0056 0188 0282 0250 0146 0058 0016 00031 00004 00000 00000 Baglaeligns Kumulerede sandsynligheder P(Xgt=j) j 0 1 2 3 4 5 6 7 8 9 10 P(Xgt=j) 1000 0944 0756 0474 0224 0078 00197 00035 00004 00000 00000 E(G[10])= 250 E(G[9])= 306 E(G[8])= 337 E(G[7])= 362 E(G[6])= 380 E(G[5])= 395 E(G[4])= 406 E(G[3])= 416 E(G[2])= 425 kast nr 1 2 3 4 5 6 7 8 9 10 score 0 1 1 1 1 1 1 1 1 1 1 1 2 2 1 1 1 1 1 1 1 1 2 5 4 4 3 3 3 2 2 1 1 3 8 7 6 5 5 4 3 2 2 1 4 9 8 7 7 6 5 4 3 2 1 5 10 9 8 7 6 5 4 3 2 1 6 10 9 8 7 6 5 4 3 2 1 7 10 9 8 7 6 5 4 3 2 1 8 10 9 8 7 6 5 4 3 2 1 9 10 9 8 7 6 5 4 3 2 1 10 10 9 8 7 6 5 4 3 2 1 Gennemsnitlig gevinst ms = 16727 Hyppigheder af score h( 75)= 1 h( 80)= 1 h( 85)= 0 h( 90)= 3 h( 95)= 2 h(100)= 5 h(105)= 4 h(110)= 9 h(115)= 12 h(120)= 12 h(125)= 17 h(130)= 22 h(135)= 28 h(140)= 39 h(145)= 24 h(150)= 49 h(155)= 54 h(160)= 74 h(165)= 63 h(170)=117 h(175)= 63 h(180)= 91 h(185)= 57 h(190)= 72 h(195)= 39 h(200)= 36 h(205)= 35 h(210)= 29 h(215)= 14 h(220)= 21 h(225)= 1 h(230)= 5 h(235)= 1 h(240)= 0 h(245)= 0 h(250)= 0 h(255)= 0 h(260)= 0 h(265)= 0 h(270)= 0 h(275)= 0 h(280)= 0

Strategier ved spil 23

Frekvens af score F( 80)=00020 F( 85)=00020 F( 90)=00050 F( 95)=00070 F(100)=00120 F(105)=00160 F(110)=00250 F(115)=00370 F(120)=00490 F(125)=00660 F(130)=00880 F(135)=01160 F(140)=01550 F(145)=01790 F(150)=02280 F(155)=02820 F(160)=03560 F(165)=04190 F(170)=05360 F(175)=05990 F(180)=06900 F(185)=07470 F(190)=08190 F(195)=08580 F(200)=08940 F(205)=09290 F(210)=09580 F(215)=09720 F(220)=09930 F(225)=09940 F(230)=09990 F(235)=10000 F(240)=10000 F(245)=10000 F(250)=10000 F(255)=10000 F(260)=10000 F(265)=10000 F(270)=10000 F(275)=10000

Maringske er det ikke en saeligrlig imponerende forbedring fra den foslashrste strategi men det er en teoretisk milepaeligl at man er i stand til at angive den bedste strategi for bestemte typer af spil Som omtalt har vi ikke forsoslashgt at bevise at Snell-Strategien er den optimale Strategi men det kan bevises Det er vigtigt at notere sig at i alle de omtalte spil har udfaldene vaeligre stokastiske variable dvs uforudsigelige men med bestemte sandsynligheder og at disse sandsynligheder ikke bliver aeligndret af den strategi man foslashlger I mange af de spil hvor man ofte moslashder begrebet strategi feks skak krig finansmarked og markedsfoslashring er dette langt fra tilfaeligldet Hvis feks alle boslashrsspekulanter fulgte den samme optimale strategi med boslashrskursen som stokastisk variabel ville det nok vise sig at det var den daringrligste strategi af alle Teorien for dynamiske strategier hvor de stokastiske variable er funktioner af tiden og af den valgte strategi er teoretisk naeligsten ufremkommelige

Strategier ved spil 24

Indeks Casino516 Computersimulation18 definitionen af sandsynlighed 1 Den optimale Snell-strategi11 forsikringsmatematik 5 Indbrudstyvens pensionsproblem912 kortsigtede strategi 10 kumulerede frekvens 19 langsigtede strategi 10 lotto 1 Mandagschancen14 Mandags-chancen9 Martingale-systemet16

Optimale Strategier 10 Poker 3 rekursionsligning 6 roulette 57 Roulette spil 10 roulettespiller 7 ruinsandsynligheder 5 Skaeligbnen913 Snell-strategien 11 Stopbetingelsen11 strategi9 Taeligndstikspillet1018

Page 8: Sandsynligheder og strategier ved spil - Ole Witt-Hansen ...olewitthansen.dk/Matematik/Sandsynligheder_og_strategier_ved_spil… · 6dqgv\qoljkhghu yhg vslo 3n vdpph pngh ndq yl ilqgh

Ruinsandsynligheder 6

Vi antager at Banken raringder over n-enheder (indsatser) Vi oslashnsker at vurdere sandsynligheden for at en uendelig rig spiller der goslashr den samme indsats i hvert spil vinder n eller flere enheder naringr der ikke er nogen begraelignsning paring antallet af spil Ruinsandsynligheden for banken betegner vi rn Hvis X1 X2 X3 betegner Casinorsquoets gevinst ved de enkelte spil er

Gk = X1 + X2 +X3++Xk gevinsten efter k-spil Ruinsandsynligheden kan derfor formuleres derhen at

rn = P( 0kG for et eller andet k)

(Der er ingen umiddelbar sammenhaeligng mellem n og k) Der gaeliglder rekursions-formlen

rn+1 = rn r1

som udtrykker at sandsynligheden for at blive ruineret med n+1 enheder er lig sandsynligheden for at blive ruineret med n enheder gange sandsynligheden for at blive ruineret med eacuten enhed Dette fordi vi antager at hvert spil er uafhaeligngigt af de oslashvrige Heraf foslashlger umiddelbart

r2 = r1+1 = r1 r1 = r12 r3 = r2+1 = r2 r1 = r1

3 og foslashlgelig

rn = r1n

For at beregne en ruinsandsynlighed ser vi foslashrst paring tilfaeligldet hvor en spiller saeligtter sin indsats paring 18 felter pr spil Her er Casinorsquoets gevinst +18 eller ndash18 pr spil For nemheds skyld saeligtter vi de 18 indsatser til at vaeligre en enhed = 1 Vi opstiller da foslashlgende rekursionsligning som tager udgangspunkt i det foslashrste spil Sandsynligheden for at banken bliver ruineret med n enheder er lig med Sandsynligheden for at banken vinder det foslashrste spil (hvor den vinder en enhed) gange sandsynligheden for at banken bliver ruineret med n+1 enheder plus sandsynligheden for at banken taber det foslashrste spil (hvor den mister en enhed) gange sandsynligheden for at banken bliver ruineret med n-1 enheder Sandsynlighederne for at banken vinder og taber er 1937 og 1837 Vi kan da opstille ligningen

1

1

1

1111 37

18

37

19

37

18

37

19 nnn

nnn rrrrrr

For at opnaring det sidste udtryk har vi anvendt resultatet af rekursionsligningen rn = r1

n Det er relativt nemt at bestemme r1 ud fra denne ligning Ved division af ligningen med r1

n-1 faringr man

Ruinsandsynligheder 7

018371937

18

37

191

21

211

rrrr

Den sidste 2gradsligning kan loslashses paring normal vis idet diskriminanten d =372 ndash 4middot19middot18 = 1 saring

119

18

38

36

192

137111

rrr

Vi er kun interesseret i loslashsningen r1 = 1819

Ifoslashlge ovenstaringende er nrr nn )

19

18(1

Vi vil herefter besvare sposlashrgsmaringlet Hvor mange enheder skal banken have for at der er mindre end 1 chance for ruin Dette er ensbetydende med at loslashse ligningen

1785)

19

18ln(

)010ln(010)

19

18( nn

Husker vi at en enhed svarede til 18 indsatser giver dette beskedne 1533 indsatser Hvis en spiller derimod spiller paring saeligdvanlig vis med kun at placere en indsats paring eacutet felt er dette - lidt overraskende ndash betydelig mere risikabelt for banken Vi opstiller igen en rekursionsligning med udgangspunkt i det foslashrste spil Sandsynligheden for at banken bliver ruineret med n enheder er lig med Sandsynligheden for at banken vinder det foslashrste spil (hvor den vinder en enhed) gange sandsynligheden for at banken bliver ruineret med n+1 enheder plus sandsynligheden for at banken taber det foslashrste spil (hvor den mister 35 enhed) gange sandsynligheden for at banken bliver ruineret med n-35 enheder Sandsynlighederne for at banken vinder og taber er 3637 og 137 Vi kan da opstille ligningen

351

111351 37

1

37

36

37

1

37

36 nnn

nnn rrrrrr

Ved division med (r1)

n-35 og omordning af leddene og ved at saeligtte r1 = x faringr man ligningen

36x36 ndash 37x35 +1 = 0 Denne ligning kan kun loslashses ved numeriske metoder og man finder loslashsningen x = 09984 Hvis vi igen stiller sposlashrgsmaringlet Hvor mange indsatser skal banken raringde over for at der er mindre end 1 chance for ruin skal vi loslashse ligningen

Ruinsandsynligheder 8

2876)99840ln(

)010ln(010)99740( nn

Altsaring en betydelig stoslashrre beholdning end hvis spilleren spiller paring 18 felter Forsoslashger vi at udregne ruinsandsynligheden for en spiller der har n enheder og laeliggger sin indsats paring eacutet felt kommer vi efter helt det samme raeligsonnement frem til foslashlgende rekursionsligning

35137

11137

36

37

1

37

361351

nn rrrrrr

nnnn

som foslashrer til ligningen x36 ndash 37x +36 = 0 Denne ligning har kun loslashsningen x = 1 Differentieres nemlig f(x) =x36 ndash 37x +36 finder man f (x) =36x35 ndash 37 Ligningen f (x) =0 har

loslashsningen 136

3735 x Da f (x) lt 0 for x lt 1 har den ingen roslashdder mindre end 1

Ruin-sandsynligheden for en spiller der garingr paring et Casino som har en ubegraelignset beholdning er 1 Saring vi kan endnu engang fastslaring at hvis man fortsaeligtter med at spille paring et Casino vil man altid blive ruineret i det lange loslashb Man kunne selvfoslashlgelig overveje ruinsandsynlighederne hvis Casino har beholdningen n og en spiller har beholdningen m (n gt m eller omvendt) men svaret vil afhaelignge af n og m og de indgaringende to ulineaeligre ligninger med to ubekendte med meget hoslashje eksponenter er ikke saring nemme at loslashse numerisk ndash selv paring en Computer Hvis n gtgt m vil svaret stort set vaeligre det samme

Strategier ved spil 9

Kap 2 Strategier ved spil

1 Forskellige spil Efter at have udregnet vindersandsynligheder i forbindelse med spil skal vi nu se paring noget andet som ogsaring er knyttet sammen med sandsynlighedsregningen nemlig problemet med at fastlaeliggge den bedste strategi naringr man spiller et spil Her skal spil imidlertid forstarings i en meget videre betydning det vaeligre sig krig boslashrsspekulation jagt eller fiskeri paring en bestemt dyreart Sidstnaeligvnte er dog alt for komplicerede til at kunne behandles elementaeligrt Faeliglles er det dog at man skal kunne beregne sandsynligheden for en bestemt konsekvens af et givet traeligk Vi vil begynde med at give nogle meget simple eksempler paring spil hvor det er meningsfuldt at tale om optimal strategi Vendingen den optimale strategi indebaeligrer at spillet afvikles i et endeligt antal trin og at der for hvert trin i spillet er mulighed for at forbedre sin gevinst og mulighed for at miste sin gevinst helt eller delvis Man skal endvidere have mulighed for at standse spillet ved ethvert trin og inkassere sin gevinst

11 Mandags-chancen I dette spil som har vaeligret lanceret af TV2 har man en raeligkke tildaeligkkede felter med beloslashb (101025255050100100250) x 1000 kr Man har maximalt 3 forsoslashg Man faringr beloslashbet paring det sidst afdaeligkkede felt Nedenfor er vist en computer simulation af spillet efter 2 traeligk Det er nok klart at hvis man afdaeligkker et felt med 10 i 1 eller 2 forsoslashg skal man fortsaeligtte eller hvis man afdaeligkker et felt med 100 eller 250 i 1 eller 2 forsoslashg skal man standse Men hvad hvis man afdaeligkker et felt med 50 i 1 eller 2 forsoslashg Det vil vi forsoslashge at afgoslashre ved nogle mere matematiske betragtninger

12 Skaeligbnen Et spil som vist nok kommer fra orienten Det spilles med to terninger Foslashrst slaringr man et slag med de to terninger og summen af deres oslashjental betegnes skaeligbnen

Strategier ved spil 10

Man kan nu slaring lige saring mange gange man vil (max 100) Hvis oslashjentallene ikke er lig skaeligbnen saring adderes dette til ens pointtal men hvis man slaringr sin skaeligbne mister man alt Nedenfor er vist et trin i en animeret computer simulation af spillet Naringr spillet er standset fordeler man indsatsen i forhold til spillernes opnaringede pointtal Det gaeliglder derfor om at have de stoslashrste pointtal Problemet er imidlertid hvornaringr det er optimalt at standse naringr man kender sin skaeligbne

13 Indbrudstyvens pensionsproblem Dette er en variant af mange forskellige optimeringsproblemer Arthur er indbrudstyv Hver tyvetugt giver i snit K kr Chancen for at Arthur bliver snuppet er p Hvis han bliver taget mister han alt fra sine tidligere tyvetugter Hvor mange indbrud skal Arthur lave foslashr han standser sin karriere og vaeliglger at leve af sin opsparing

14 Taeligndstikspillet Dette spil falder lidt uden for rammerne af de oslashvrige spil fordi man ikke kan standse spillet og fordi man aldrig kan miste noget af sin gevinst Det kan derfor ikke umiddelbart behandles paring samme maringde som de hidtil naeligvnte spil Alligevel er det et spil der udpraeligget kan behandles med matematiske teorier for den bedste strategi Spillet garingr ud paring at man paring 10 taeligndstikker farver den ene side roslashd Kastes taeligndstikken op er sandsynligheden for at den farvede side vender opad naringr den lander paring bordet lig med p = 025 Hver spiller har fra starten tallene 110 Hvert tal maring kun bruges 1 gang Man skiftes til at kaste de 10 taeligndstikker og notere antallet af farvede taeligndstikker Dette antal skal saring ganges med et af de resterende tal 110 Den som efter 10 spil har den hoslashjeste sum har vundet Det kan oplyses og let verificeres at den maximale gevinst er 550 Middelgevinsten hvor man vaeliglger tilfaeligldig er 1375 og den optimale middelgevinst er ca 167

Strategier ved spil 11

15 Casino Roulette spil falder ogsaring lidt uden for rammerne af optimale strategier af den meget simple grund at odds er svagt imod eacuten Det gaeliglder dog ikke for Blackjack hvor man kan udvikle en strategi som giver en svag fordel Hvis odds er imod eacuten vil man imidlertid altid tabe i det lange loslashb Som tidligere fastslaringet er den eneste mulighed - i det lange loslashb - for at undgaring ruin i roulettespil at der ikke er nogen oslashvre graelignse for indsatser og at man har flere penge end Casionorsquoet og ingen af disse to betingelser er nogensinde opfyldt Enhver fornuftig matematisk spil-teori vil derfor som resultat have at man skal standse foslashr det foslashrste spil Det vil sige Man skal lade vaeligre med at garing paring Casino Denne kendsgerning udelukker dog ikke at man kan goslashre sig overvejelser over hvordan man kan spille hvis man ikke udelukkende er interesseret i at foraeligre sine penge til et Casino uden kamp

2 Optimale Strategier Hvis man intuitivt skal formulere en strategi for de 3 foslashrste spil naeligvnt ovenfor saring kan man feks vaeliglge eacuten af 3 foslashlgende strategier 1 Man beslutter paring forharingnd hvor stor ens gevinst (eller tab) skal vaeligre foslashr man stopper Dette er

faktisk en meget almindelig strategi men den er bestemt ikke optimal 2 Man fortsaeligtter saring laelignge man i middel har mulighed for at foroslashge sin gevinst i naeligste spil Man

skal huske paring at middelvaeligrdien af gevinsten ogsaring omfatter tab saring middelvaeligrdien (i matematisk forstand) skal vaeligre positiv Denne umiddelbart fornuftige strategi kaldet den kortsigtede eller myope strategi er i mange tilfaeliglde ogsaring den optimale strategi (dog ikke i mandagschancen)

3 Man fortsaeligtter saring laelignge man i middel har mulighed for at foroslashge sin gevinst i et af de

efterfoslashlgende spil Denne strategi kaldes den langsigtede strategi Baringde den kortsigtede og den langsigtede strategi ser yderst rimelige ud og de vil ogsaring vaeligre optimale for langt de fleste spil Hvis der er forskel paring den langsigtede og den kortsigtede strategi skal man anvende den langsigtede - naturligvis Der findes imidlertid visse former for spil hvor ingen af strategierne er optimale Det gaeliglder feks for boslashrsspekulanter der har en beholdning aktier som de vil saeliglge naringr kurserne stiger Dette fortsaeligtter som bekendt aldrig i det uendelige Paring et vist tidspunkt standser stigningen og kurserne begynder at falde ndash som regel ndash hurtigere end de steg Hvornaringr skal man saeliglge for at opnaring den stoslashrste gevinst Det viser sig - men det er saeligrdeles kompliceret at redegoslashre for ndash at naringr det gaeliglder boslashrs spekulation saring er ingen af strategierne 2 og 3 optimale De vil begge to i grove traeligk som resultat have at man enten skal saeliglge straks eller vente til man er ruineret Vi vil nu give en beskrivelse af den optimale strategi som er udviklet af Snell Vi vil overhovedet ikke naeligrme os et bevis for at det er den optimale strategi (beviset er ret teknisk abstrakt) men

Strategier ved spil 12

understrege at det kan bevises I matematisk forstand Ulemperne ved Snell-strategien er at den for selv simple problemer kan foslashre til ret omfattende og komplicerede regninger

2 Den optimale Snell-strategi Snell-strategien er paring sin vis den samme som den kortsigtede strategi men hvor man i denne strategi hele tiden regner sig et skridt frem saring tager Snell-strategien udgangspunkt i spillets slutning og arbejder sig baglaeligns Vi indfoslashrer foslashrst nogle betegnelser Vi antager at spillet har n trin Sk er en stokastisk variabel der angiver den faktiske samlede gevinst man har opnaringet ved det kte spil Sk kan antage en eller flere vaeligrdier med tilhoslashrende sandsynligheder Det nye ved Snell-strategien er at man definerer endnu en stokastisk variabel Gk ved ligningen

Gk = maxSk E(Gk+1| S1Sk) Gk er den stoslashrste af vaeligrdierne Sk (gevinsten efter det kte spil) og E(Gk+1| S1Sk)) som er middelvaeligrdien af den maximale forventede gevinst i det k+1te spil naringr det er givet at man har spillet spillene 1k Dette opstilles i et skema Gn = Sn Gevinsten ved spillets afslutning Gn-1 = maxSn-1 E(Gn| S1Sn-1) Gk = maxSk E(Gk+1| S1Sk) G1 = maxS1 E(G2| S1) Snell strategien siger nu at man skal standse spillet den foslashrste gang Sk (gevinsten efter det kte spil) overstiger middelvaeligrdien af den maksimale forventede gevinst i det k+1te spil Dette kaldes for stopbetingelsen Stopbetingelsen er altsaring

Sk E(Gk+1| S1Sk) Man skal altsaring standse spillet naringr den opnaringede gevinst er stoslashrre eller lig med den betingede forventning af den maximale gevinst i det naeligste spil Det kunne lyde som den kortsigtede strategi men forskellen er den at i den kortsigtede strategi er Gk+1 erstattet af Sk+1 At kunne gennemskue konsekvenserne af dette er derimod ikke saring nemt Det viser sig at i mange tilfaeliglde at er Snell-Strategien identisk med den kortsigtede strategi som kraeligver at man stopper naringr Sk E(Sk+1| S1Sk) Snell strategien er ikke umiddelbart let gennemskuelig og udregningen af de betingede middelvaeligrdier E(Gk+1| S1Sk) er ofte ret teknisk Vi vil nu behandle de foslashr naeligvnte eksempler og begynder med

Strategier ved spil 13

21 Indbrudstyvens pensionsproblem Lad os antage at Arthurs gennemsnitlige gevinst ved hvert tyvetogt er K = 6000 kr og at chancen er at han bliver taget er 5 Lad os antage at hans hidtidige gevinst efter k - tyvetugt er Sk som bliver konfiskeret - og som han derved mister hvis han bliver snuppet I dette tilfaeliglde kan man - som vist nedenfor - se at den kortsigtede strategi er den optimale strategi Det haelignger sammen med at alle trin i spillet er identiske Gevinsten ved hvert tyvetogt er den samme ndash uafhaeligngigt af de foregaringende tyvetugter - bortset fra at den samlede gevinst vokser ved hvert vellykket tyvetogt Xk betegner den stokastiske variabel som er Arthurs gevinst ved eacutet tyvetugt Hermed er

Sk =X1+ X2+ X3+hellip Xk Xk+1 kan antage vaeligrdien K med sandsynlighed 1-ps = 1-P(Snuppet) (altsaring hvis det naeligste tyvetugt lykkes) og vaeligrdien ndashSk (han mister hele sin opsparing) med sandsynlighed ps = P(Snuppet) Vi opskriver nu Snell-strategien (Den kortsigtede strategi) for et trin i hans karriere

Gk = max Sk E(Sk+1| 1k)

Sk er hans gevinst efter k tyvetugter og E(Sk+1| 1k) er hans forventede gevinst efter k+1 tyvetugter E(Sk+1| 1k) kan beregnes som den hidtidige gevinst plus den forventede gevinst ved naeligste tyve- tugt i alt lig med Sk + E(Xk+1) E(Xk+1) er uafhaeligngig af de foslashrste k - tyvetugter derfor bliver stopbetingelsen Sk gt Sk + E(Xk+1) E(Xk+1) lt 0 Middelvaeligrdien E(Xk+1) kan saringledes udregnes efter den saeligdvanlige definition idet Xk+1 antager vaeligrdierne K (gevinsten ved et tyvetugt) og - Sk (mister hele sin opsparing) med sandsynlighederne 1-ps og ps henholdsvis E(Xk+1) = K(1- ps) - Sk ps Han skal standse naringr

E(Xk+1) lt 0 K(1- ps) lt Sk ps som med tal eksemplet giver

6000095 lt Sk005 Sk gt 114000- kr svarende til 114006000 = 095005 = 19 tyvetugter

(Det goslashr han nu nok ikke og er derfor henvist til at leve af folkepensionen efter nogle aringr i skyggen) Man kunne godt tro at dette eksempel kunne anvendes paring andre (ligesaring uetiske) problemstillinger Feks hvor mange gange det er optimalt at koslashre gratis i S-tog Det kan det imidlertid ikke helt

Strategier ved spil 14

Sagen er jo den at man faringr en fast boslashde hvis man bliver snuppet men man kommer ikke til at betale for de gange man har koslashrt gratis Med andre ord vurderingen om hvorvidt det er fordelagtigt at koslashre uden billet afhaelignger kun af middelgevinsten ved det naeligste forsoslashg Hvis den er positiv er det fordelagtigt at fortsaeligtte men hvis den er negativ er det fordelagtigt at loslashse billet (Det er i oslashvrigt uetisk at snyde ndash naturligvis) Tager vi et eksempel billetprisen er kr 50- Boslashden er kr 500 Sandsynligheden for at blive snuppet er Ps = 01 Hvis X er gevinsten ved at koslashre uden billet er E(X) = 50middot(1-Ps)-500middotPs = 50middot09-500middot01 = -50 Det er saringledes (med denne sandsynlighed for at blive snuppet) ikke fordelagtigt at koslashre uden billet i S-tog Da en laeligrebog i sandsynligheder ved spil naturligvis ikke maring tilskynde til uetiske handlinger undlader vi at foretage beregningen med Ps = 005

22 Skaeligbnen Vi betragter kast med to terninger X betegner summen af oslashjentallene ved eacutet kast Sandsynlighedsfordelingen for X er velkendt Feks er P(X=5) = 436 Sandsynligheden for at terningerne viser j oslashjne kan skrives som

36

76)(

jjXP

Lad os antage at spillerens skaeligbne er q Hvis man slaringr dette oslashjental er alt tabt Ellers adderes oslashjentallene for hvert kast Hvis ikke man har slaringet sin skaeligbne saring er den samlede gevinst efter n spil

Sn = X1+ X2+ X3+hellip +Xn

Og middelvaeligrdien af Sn er

E(Sn) = E(X1)+ E(X2)+E(X3)+hellip +E(Xn) = nE(X | X q) E(X | X q) er den betingede middelvaeligrdi af oslashjentallene givet at man ikke slaringr sin skaeligbne

E(X | X q) = 2P(2) +3P(3)+hellip(q-1)P(q-1) + (q+1)P(q+1)+hellip+12P(12) Den kortsigtede strategi (og Snell strategien) fastslaringr at man skal standse naringr middelvaeligrdien af den forventede gevinst ved naeligste kast er negativ Argumentet for dette kan overtages naeligsten ordret fra indbrudstyvens pensionsproblem E(Sk+1|S1 Sk) kan beregnes som den hidtidige gevinst Sk plus den forventede gevinst ved det naeligste kast i alt lig med Sk + E(Xk+1| S1 Sk) Stopbetingelsen er derfor

Sk gt Sk + E(Xk+1| S1 Sk) E(Xk+1| S1 Sk) lt 0

Strategier ved spil 15

E(X | X q) ndash SnP(q) lt 0 Sn gt E(X | X q) P(q) Det er ikke saeligrlig svaeligrt at udregne stopbetingelsen feks for q = 2 og q = 6 Nedenfor er vist udskriften fra et program som foretager beregningen for q = 212 Forventet gevinst i naeligste kast naringr ens skaeligbne er q q 2 3 4 5 6 7 8 9 10 11 12 694 683 667 644 617 583 589 600 617 639 667 Stop naringr din gevinst S gt EX(q)P(q) naringr skaeligbne er q q 2 3 4 5 6 7 8 9 10 11 12 25000 12300 8000 5800 4440 3500 4240 5400 7400 11500 24000

Som det fremgaringr er der endog meget stor forskel paring stoptiderne afhaeligngig af ens skaeligbne

23 Mandagschancen Dette spil er lidt mere interessant fordi det ikke er helt saring enkelt at gennemskue I dette tilfaeliglde kan man ikke forvente at den kortsigtede strategi vil foslashre til den optimale strategi At den faktisk goslashr det skyldes talvaeligrdierne Dette skal forstarings saringledes at hvis man aeligndrede paring praeligmiestoslashrrelserne ville Snell-strategien afvige fra den kortsigtede strategi Vi vil analysere spillet ved Snell-strategien Som naeligvnt har man i spillet 9 tildaeligkkede felter (101025255050100100250) Man kan afdaeligkke hoslashjest 3 felter Man faringr beloslashbet i 1000 kr som det sidste felt viser Hvis X er den stokastiske variabel som angiver vaeligrdien af et felt saring vil de fleste uden saring lange overvejelser vel fortsaeligtte hvis Xlt50 og standse hvis X100 Det kritiske er hvis man afdaeligkker 50 (X=50) Vi bemaeligrker foslashrst at summen af alle felterne er S=620 og at E(X) =6209=689 Vi opskriver foslashrst den fuldstaeligndige Snell-strategi for dette spil G3 =X3 Den Stokastiske variabel G3 = Gevinsten = X3 = vaeligrdien af det sidst afdaeligkkede felt G2 = max X2 E(G3| X1X2 ) Den stoslashrste af vaeligrdierne X2 (= vaeligrdien af det afdaeligkkede

felt) og den betingede middelvaeligrdi af G3 = X3 G1 = max X1 E(G2| X1 ) Som ovenfor Kriteriet for den optimale strategi er som tidligere Stop hvis paring noget trin Xk gt E(Gk+1| X1Xk ) Det er relativ nemt at opstille en formel for E(G3| X1X2 ) Naringr X1 og X2 er afdaeligkket er summen de resterende felter S - X1 - X2 Da alle felter har samme sandsynlighed er middelvaeligrdien simpelthen middeltallet af felterne E(G3| X1X2 ) = ( S - X1 - X2)(9-2)

Strategier ved spil 16

Det er noget mere teknisk at opstille en formel for E(G2| X1 ) og ogsaring lidt teknisk at foretage beregningen Vi vil noslashjes med at skitsere beregningen for en vaeligrdi af X1 og i oslashvrigt henvise til resultatet af et Computerprogram som kan ses nedenfor Lad os antage at X1 = 25 Vi lader nu X2 gennemloslashbe alle de mulige vaeligrdier (alle vaeligrdier skal taeliglles med det antal gange der er felter med denne vaeligrdi) For hver vaeligrdi af X2 (feks 50) skal vi vaeliglge max af X2 og E(G3| X1X2 ) = ( S - X1 - X2) (9-2) (= (620-50-25)7 = 778 i dette tilfaeliglde) og addere det til en sum S2 E(G2| X1 ) er da lig med S2(9-1) (da der er 9-1 felter X2 ) X2[1]= 1000 E(G3)= 8571 G2= 8571 X2[2]= 2500 E(G3)= 8357 G2= 8357 X2[3]= 5000 E(G3)= 8000 G2= 8000 X2[4]= 10000 E(G3)= 7286 G2= 10000 X2[5]= 25000 E(G3)= 5143 G2= 25000 X1[1]= 1000 E(G[2])= 10786 X2[1]= 1000 E(G3)= 8357 G2= 8357 X2[2]= 2500 E(G3)= 8143 G2= 8143 X2[3]= 5000 E(G3)= 7786 G2= 7786 X2[4]= 10000 E(G3)= 7071 G2= 10000 X2[5]= 25000 E(G3)= 4929 G2= 25000 X1[2]= 2500 E(G[2])= 10679 X2[1]= 1000 E(G3)= 8000 G2= 8000 X2[2]= 2500 E(G3)= 7786 G2= 7786 X2[3]= 5000 E(G3)= 7429 G2= 7429 X2[4]= 10000 E(G3)= 6714 G2= 10000 X2[5]= 25000 E(G3)= 4571 G2= 25000 X1[3]= 5000 E(G[2])= 10500 X2[1]= 1000 E(G3)= 7286 G2= 7286 X2[2]= 2500 E(G3)= 7071 G2= 7071 X2[3]= 5000 E(G3)= 6714 G2= 6714 X2[4]= 10000 E(G3)= 6000 G2= 10000 X2[5]= 25000 E(G3)= 3857 G2= 25000 X1[4]= 10000 E(G[2])= 9643 X2[1]= 1000 E(G3)= 5143 G2= 5143 X2[2]= 2500 E(G3)= 4929 G2= 4929 X2[3]= 5000 E(G3)= 4571 G2= 5000 X2[4]= 10000 E(G3)= 3857 G2= 10000 X1[5]= 25000 E(G[2])= 6268 Ser man resultaterne igennem kan de udmoslashntes i en simpel regel Fortsaeligt paring 50 eller derunder Stop paring 100 eller derover Det er maringske lidt overraskende at man ogsaring skal forsaeligtte paring 50000 hvis man kun har et forsoslashg tilbage ndash man kunne jo ende med 10000 og det er saring bare aeligrgerligt ndash og det er vist nok de fleste som standser ved 50000 - men det er ikke den bedste strategi

Strategier ved spil 17

24 Casino Som naeligvnt i indledningen til dette afsnit findes der ingen strategi som kan bringe en i stand til at vinde paring et Casino ndash i det lange loslashb Vil man goslashre Casino-spil til en levevej vil det altid med matematisk sikkerhed ende med ruin Det betyder imidlertid ikke at man ikke kan vinde ved at garing paring Casino men hvis man taelignker paring at spraelignge banken saring skal to krav i hvert fald vaeligre opfyldt for at der skal vaeligre en ikke forsvindende sandsynlighed for at det kan lade sig goslashre 1 Man skal have flere penge end Casino 2 Der maring ikke vaeligre loft over indsatserne Begge betingelser er som bekendt aldrig opfyldt Man kan som sagt godt vinde paring et Casino men hvis man satser paring at vinde mere (alle de gange man er paring Casino i sit liv) end det beloslashb man medbringer ved hvert besoslashg saring vil chancerne for at tabe det hele vaeligre stoslashrst Her er der tale om sandsynligheder og middelvaeligrdier ndash om odds Selvfoslashlgelig er de muligt at tabe hele sin formue ved foslashrste besoslashg eller vinde det tredobbelte ved det andet Der har i tidens loslashb vaeligret lanceret flere eksempler paring vinderstrategier som lyder uhyre besnaeligrende Den mest kendte er Martingale-systemet Man spiller kun paring sort og roslashd hvor faringr man faringr fordoblet sin indsats hvis man vinder Spillet er saringledes helt lige bortset fra at indsatserne bliver liggende naringr zero kommer ud og man kun faringr sin indsats en gang hvis man vinder i naeligste spil (zero har ingen farve) Spiller man efter Martingale-systemet skal man inkassere sin gevinst hvis man vinder Hvis man derimod taber skal man fordoble sin indsats Vi saeligtter grundindsatsen til 1 Har man spillet n gange og dermed doblet op n-1 gange har man lagt en indsats Sn = 1 + 2 + 22 +hellip2n-1 = 2n ndash1 Udregnet af kvotientraeligkkeformlen

1

10

q

qaS

n

n

for raeligkken Sn = a0 + a0q+ a0q

2+hellip+ a0qn-1

Vinder man det nte spil faringr man udbetalt 22

n-1 = 2n saring ens gevinst er 2n - (2n - 1) = 1 Der gaeliglder aringbenbart den simple kendsgerning at bliver man bare ved med at fordoble saring har man altid vundet eacuten indsats Foslashr man forsoslashger sig med dette skal man dog nok goslashre sig klart hvor mange gange man kan tabe foslashr man er ruineret

Strategier ved spil 18

Sandsynligheden for at man taber 5 spil er (frac12)5 = 132 Man har da tabt 25 ndash 1 gange vaeligrdien af en jeton (i Danmark 50 kr) dvs 1550 kr Vil man sikre sig bedre feks ved at kunne doble op 9 gange (sandsynligheden for at tabe 10 spil er 11024) saring skal man komme med kr 51150- men det kan man ikke engang gennemfoslashre da hoslashjeste indsats i Danmark er 24000- Man kunne imidlertid stille det sposlashrgsmaringl Hvis man har n-jetoner hvad er saring sandsynligheden for at vinde q-jetoner hvis man spiller efter Martingale-systemet Dette kan man faktisk godt udregne direkte men regningerne er ret omfattende Derimod er resultatet simpelt Vi vil ikke lave en direkte udregning men anvende de samme metoder som vi har anvendt for den bedste strategi Vi tager udgangspunkt i det faktum at sort roslashd Casino spil er et lige spil saring middelvaeligrdien af gevinsten er 0 ligegyldigt hvordan man spiller Middelvaeligrdien (som er nul ) af en gevinst paring q-jetoner er lig med q gange sandsynligheden P(q) for at vinde q jetoner minus ens kapital (n jetoner) gange med sandsynligheden for at man taber det sidste spil som er 1 ndash P(q)

qP(q) ndash n(1 ndashP(q)) = 0 qn

nqP

)(

Har man feks n = 31 jetoner (1550- kr) er sandsynligheden for at vinde q=10 (500 kr) lig med 0756 En rimelig stor sandsynlighed men altsaring stadig 25 chance for ruin Oslashnsker man derimod at blive rigtig rig og vinde 10000- kr dvs q=200 er P(200) = 0134 Konklusionen er den at satser man paring at vinde mere end man medbringer saring er sandsynligheden mindre end frac12 men kan man noslashjes med mindre saring er sandsynligheden stoslashrre end frac12 Men bemaeligrk dette gaeliglder fra foslashrste gang man garingr ind paring et Casino til man beslutter at holde op

25 Taeligndstikspillet Som beskrevet ovenfor garingr spillet ud paring at farve den ene af siderne roslashd paring 10 taeligndstikker Naringr taeligndstikken kasten op i luften er sandsynligheden for at den roslashde side vender opad naringr den rammer bordet lig med p=025 Man kaster paring skift 10 saringdanne taeligndstikker 10 gange For hvert kast skal man multiplicere antallet af roslashde med et af tallene 110 Hver tal maring kun bruges eacuten gang Den der faringr den stoslashrste sum har vundet Det er klart at en god strategi i det lange loslashb vil give en hoslashjere sum Vi minder om at antallet af X roslashde taeligndstikker er binomialfordelt med primaeligrsandsynlighed p og antalsparameter n=10

102104

3

4

110)(

10

jj

jXPjj

Strategier ved spil 19

Endvidere vil vi anvende de kumulerede sandsynligheder P(X j) og P(X j) Nedenfor er vist resultatet af en Computersimulation af spillet Primaeligr sandsynligheder for n= 10 og p= 0250 P(X=j) j 0 1 2 3 4 5 6 7 8 9 10 00563 01877 02816 02503 01460 00584 00162 00031 00004 00000 00000 Baglaeligns kumulerede sandsynligheder P(Xgt=q) j 0 1 2 3 4 5 6 7 8 9 10 10000 09437 07560 04744 02241 00781 00197 00035 00004 00000 00000 1 kast Antal = 2 Vaeliglg mellem 1 2 3 4 5 6 7 8 910 Faktor= 4 2 kast Antal = 4 Vaeliglg mellem 1 2 3 5 6 7 8 910 Faktor=10 3 kast Antal = 2 Vaeliglg mellem 1 2 3 5 6 7 8 9 Faktor= 5 4 kast Antal = 2 Vaeliglg mellem 1 2 3 6 7 8 9 Faktor= 3 5 kast Antal = 3 Vaeliglg mellem 1 2 6 7 8 9 Faktor= 8 6 kast Antal = 2 Vaeliglg mellem 1 2 6 7 9 Faktor= 6 7 kast Antal = 6 Vaeliglg mellem 1 2 7 9 Faktor=9 8 kast Antal = 3 Vaeliglg mellem 1 2 7 Faktor= 2 9 kast Antal = 2 Vaeliglg mellem 1 7 Faktor= 7 10 kast Antal = 2 Vaeliglg mellem 1 Faktor= 1 Din score er 176 Valget af tallene 110 er i dette tilfaeliglde foretaget ud fra den optimale strategi som vi vil omtale om et oslashjeblik Foslashr vi analyserer den optimale strategi for dette spil vil vi forsoslashge os med en intuitiv bedste strategi Vi belyser denne strategi med et konkret eksempel Lad os feks antage at vi slaringr 4 roslashde i den 3 kast (3 forsoslashg) De tal vi har tilbage kalder vi (y8 y7 y6 y5 y4 y3 y2 y1) Sposlashrgsmaringlet om vi skal gange med det stoslashrste y8 eller det naeligststoslashrste y7 osv Vi raeligsonnerer da som foslashlger Hvis sandsynligheden for at slaring mere end 4 roslashde i de resterende 7 kast er stoslashrre end frac12 saring skal vi vaeliglge det naeligststoslashrste Vi skaeligrper dette Hvis sandsynligheden for at slaring mindst 5 roslashde mindst en gang i de resterende 7 kast er stoslashrre end frac12 saring skal vi vaeliglge det naeligststoslashrste Tilsvarende hvis sandsynligheden for at slaring mindst 5 roslashde mindst 2 gange i de resterende 7 kast skal vi vaeliglge det 3 stoslashrstehellipog saringdan fremdeles Strategien virker umiddelbart meget plausibel Sandsynlighederne kan direkte farings af binomialfordelingen Foslashrst sandsynligheden for at faring mindst q-roslashde i et kast Dette er

P(X q) =

n

qj

jXP )( hvor P(X = j) er angivet ovenfor

Strategier ved spil 20

Sandsynligheden for at dette sker mindst r gange i n - k kast er ogsaring en binomialfordeling og kan skrives

P(X q mindst r gange i n - k kast ) = jknjkn

rj

qXPqXPj

kn

))(1()(

Beregningen af disse (110) sandsynligheder goslashres nok lettest paring en computer For at lave en strategi-tabel goslashr man det at for hvert kast og hvert antal mulige roslashde vaeliglger man foslashrst det stoslashrste af de resterende tal Dernaeligst beregner man sandsynligheden for at faring mindst 1 roslashd mere i et af de foslashlgende kast Hvis denne sandsynlighed er stoslashrre end frac12 ser man paring det naeligststoslashrste af de resterende tal Man beregner saring sandsynligheden for at faring mindst 1 roslashd mere i mindst to af de resterende kast Hvis denne sandsynlighed er stoslashrre end frac12 saring vaeliglger man det tredjestoslashrste af de resterende tal og saringdan fremdeleshellip Det bemaeligrkes at beregningen skal initialiseres med at man altid vaeliglger det mindste hvis man slaringr 0 roslashde og altid vaeliglger det stoslashrste hvis man slaringr 10 roslashde Nedenfor er vist en computerberegning af en strategi-tabel Endvidere er ogsaring lavet en saringkaldt Monte-Carlo simulation Dette betyder at man har ladet maskinen spille feks 10000 spil spillet efter strategi-tabellen Nederst er vist hyppighederne for ens score og endelig fordelingsfunktionen for observationerne (Den kumulerede frekvens) P(X =j) for n =10 and p = 0250 j 0 1 2 3 4 5 6 7 8 9 10 P(X =j)0056 0188 0282 0250 0146 0058 00162 0003 00004 0000 0000 P(Xgt=j) for n =10 and p = 0250 j 0 1 2 3 4 5 6 7 8 9 10 P(Xgt=j) 1000 0944 0756 0474 0224 0078 00197 00035 00004 0000 0000 Strategi tabel Tallene refererer ikke til faktorene selv men til den stoslashrste naeligststoslashrste osv Eksempel Hvis man slaringr 3 roslashde i den andet kast saring skal man vaeliglge (7) den tredjestoslashrste Kast no 1 2 3 4 5 6 7 8 9 10 score 0 1 1 1 1 1 1 1 1 1 1 1 3 3 3 2 2 2 2 1 1 1 2 6 5 5 4 4 3 3 2 2 1 3 8 7 7 6 5 4 3 3 2 1 4 9 9 8 7 6 5 4 3 2 1 5 10 9 8 7 6 5 4 3 2 1 6 10 9 8 7 6 5 4 3 2 1 7 10 9 8 7 6 5 4 3 2 1 8 10 9 8 7 6 5 4 3 2 1 9 10 9 8 7 6 5 4 3 2 1 10 10 9 8 7 6 5 4 3 2 1 Gennemsnitlig score = 16437

Strategier ved spil 21

Hyppighed af score h( 75)= 1 h( 80)= 7 h( 85)= 3 h( 90)= 5 h( 95)= 6 h(100)= 34 h(105)= 38 h(110)= 82 h(115)= 68 h(120)=161 h(125)=146 h(130)=320 h(135)=280 h(140)=534 h(145)=425 h(150)=752 h(155)=577 h(160)=878 h(165)=645 h(170)=956 h(175)=651 h(180)=863 h(185)=527 h(190)=609 h(195)=351 h(200)=389 h(205)=180 h(210)=203 h(215)= 93 h(220)= 86 h(225)= 47 h(230)= 32 h(235)= 21 h(240)= 13 h(245)= 8 h(250)= 3 h(255)= 0 h(260)= 4 h(265)= 1 h(270)= 1 h(275)= 0 h(280)= 0 Frekvens of score F( 80)=00008 F( 85)=00011 F( 90)=00016 F( 95)=00022 F(100)=00056 F(105)=00094 F(110)=00176 F(115)=00244 F(120)=00405 F(125)=00551 F(130)=00871 F(135)=01151 F(140)=01685 F(145)=02110 F(150)=02862 F(155)=03439 F(160)=04317 F(165)=04962 F(170)=05918 F(175)=06569 F(180)=07432 F(185)=07959 F(190)=08568 F(195)=08919 F(200)=09308 F(205)=09488 F(210)=09691 F(215)=09784 F(220)=09870 F(225)=09917 F(230)=09949 F(235)=09970 F(240)=09983 F(245)=09991 F(250)=09994 F(255)=09994 F(260)=09998 F(265)=09999 F(270)=10000 F(275)=10000

Som det fremgaringr af tabellen for P(X gt= j) er der kun 78 chance for at slaring 5 roslashde eller derover saring goslashr man det skal man altid vaeliglge det stoslashrste af de resterende tal For 3 eller 4 roslashde er situationen langt mere uigemmeskuelig og kun en beregning kan afgoslashre sagen Vi proslashver nu at finde den optimale strategi eller Snell-strategien Hvad angaringr sposlashrgsmaringlet om hvorvidt vi skal vaeliglge den stoslashrste eller naeligststoslashrste saring lader det sig faktisk goslashre at beregne Snell-strategien paring en computer De foslashlgende tilfaeliglde bliver derimod for komplicerede og der anvender vi en svagt forbedret version af vores intuitive strategi Forbedringen bestaringr i foslashlgende idet vi illustrerer det med et eksempel Lad os sige vi har slaringet 3 roslashde og vi overvejer om vi vil gange det med 7 eller 6 Ganger vi med 6 er det fordi vi forventer at slaring mindst 4 roslashde mindst en gang i de resterende kast Vores score vil vaeligre 73 og 74 henholdsvis og scoren vil blive forbedret med en faktor 43 hvis vi ganger med 6 under forventning af at slaring 4 roslashde Vores forbedring af strategien garingr da ud paring at vi vaeliglger det naeligststoslashrste 6 hvis sandsynligheden for at slaring 4 roslashde gange den relative forbedring 43 er stoslashrre end frac12 Vi rekapitulerer dernaeligst Snell-strategien G10 = X10 X10 Stokastisk variabel = antallet af roslashde i det 10 kast G9 = max X9 E(G10) E(G10) = E(X10) = np=10025 = 25 X9 = 01hellip10 Gk = max Xk E(Gk+1) E(Gk) kraeligver en laeligngere udregning men den udregnes som en

almindelig middelvaeligrdi altsaring som max af de to vaeligrdier gange P(X=Xk-1) G1 = max X1 E(G2) Som eksempel udregner vi E(G9) Da E(G10)=25 skal vi for X9 = 012 anvende E(G10)=25 i udregningen

Strategier ved spil 22

E(G9) = 25 (P(X=0)+P(X=1)+P(X=2))+ 3P(X=3)+hellip+10P(X=10) =306 Vaeligrdierne for E(Gk) er alle udregnet og vist i computerberegningen nedenfor Bemaeligrk isaeligr at de vokser fra 25 til 425 naringr k aftager fra 10 til 2 Strategien er nu foslashlgende Vaeliglg det stoslashrste af de resterende tal hvis Xk gt E(Gk+1) (altsaring det antal man har slaringet er er stoslashrre end det forventede stoslashrste antal) ellers vaeliglg det naeligststoslashrste Ved afgoslashrelsen om de 3 stoslashrste 4 stoslashrste osv anvender vi den hidtidige strategi med den modifikation at vi multiplicerer sandsynligheden med den formodede relative forbedring E(G10-kast)antal roslashde En computerberegning helt svarende til den foregaringende men med den aeligndrede strategi er vist nedenfor Man bemaeligrker for det foslashrste de smaring aeligndringer der er i strategien Den nye strategi er lidt mindre forsigtig men den giver altsaring ogsaring pote i form af en forbedring af gennemsnittet paring ca 275 Primaeligr sandsynligheder P(X=j) for n= 10 og p= 0250 j 0 1 2 3 4 5 6 7 8 9 10 P(X=j)0056 0188 0282 0250 0146 0058 0016 00031 00004 00000 00000 Baglaeligns Kumulerede sandsynligheder P(Xgt=j) j 0 1 2 3 4 5 6 7 8 9 10 P(Xgt=j) 1000 0944 0756 0474 0224 0078 00197 00035 00004 00000 00000 E(G[10])= 250 E(G[9])= 306 E(G[8])= 337 E(G[7])= 362 E(G[6])= 380 E(G[5])= 395 E(G[4])= 406 E(G[3])= 416 E(G[2])= 425 kast nr 1 2 3 4 5 6 7 8 9 10 score 0 1 1 1 1 1 1 1 1 1 1 1 2 2 1 1 1 1 1 1 1 1 2 5 4 4 3 3 3 2 2 1 1 3 8 7 6 5 5 4 3 2 2 1 4 9 8 7 7 6 5 4 3 2 1 5 10 9 8 7 6 5 4 3 2 1 6 10 9 8 7 6 5 4 3 2 1 7 10 9 8 7 6 5 4 3 2 1 8 10 9 8 7 6 5 4 3 2 1 9 10 9 8 7 6 5 4 3 2 1 10 10 9 8 7 6 5 4 3 2 1 Gennemsnitlig gevinst ms = 16727 Hyppigheder af score h( 75)= 1 h( 80)= 1 h( 85)= 0 h( 90)= 3 h( 95)= 2 h(100)= 5 h(105)= 4 h(110)= 9 h(115)= 12 h(120)= 12 h(125)= 17 h(130)= 22 h(135)= 28 h(140)= 39 h(145)= 24 h(150)= 49 h(155)= 54 h(160)= 74 h(165)= 63 h(170)=117 h(175)= 63 h(180)= 91 h(185)= 57 h(190)= 72 h(195)= 39 h(200)= 36 h(205)= 35 h(210)= 29 h(215)= 14 h(220)= 21 h(225)= 1 h(230)= 5 h(235)= 1 h(240)= 0 h(245)= 0 h(250)= 0 h(255)= 0 h(260)= 0 h(265)= 0 h(270)= 0 h(275)= 0 h(280)= 0

Strategier ved spil 23

Frekvens af score F( 80)=00020 F( 85)=00020 F( 90)=00050 F( 95)=00070 F(100)=00120 F(105)=00160 F(110)=00250 F(115)=00370 F(120)=00490 F(125)=00660 F(130)=00880 F(135)=01160 F(140)=01550 F(145)=01790 F(150)=02280 F(155)=02820 F(160)=03560 F(165)=04190 F(170)=05360 F(175)=05990 F(180)=06900 F(185)=07470 F(190)=08190 F(195)=08580 F(200)=08940 F(205)=09290 F(210)=09580 F(215)=09720 F(220)=09930 F(225)=09940 F(230)=09990 F(235)=10000 F(240)=10000 F(245)=10000 F(250)=10000 F(255)=10000 F(260)=10000 F(265)=10000 F(270)=10000 F(275)=10000

Maringske er det ikke en saeligrlig imponerende forbedring fra den foslashrste strategi men det er en teoretisk milepaeligl at man er i stand til at angive den bedste strategi for bestemte typer af spil Som omtalt har vi ikke forsoslashgt at bevise at Snell-Strategien er den optimale Strategi men det kan bevises Det er vigtigt at notere sig at i alle de omtalte spil har udfaldene vaeligre stokastiske variable dvs uforudsigelige men med bestemte sandsynligheder og at disse sandsynligheder ikke bliver aeligndret af den strategi man foslashlger I mange af de spil hvor man ofte moslashder begrebet strategi feks skak krig finansmarked og markedsfoslashring er dette langt fra tilfaeligldet Hvis feks alle boslashrsspekulanter fulgte den samme optimale strategi med boslashrskursen som stokastisk variabel ville det nok vise sig at det var den daringrligste strategi af alle Teorien for dynamiske strategier hvor de stokastiske variable er funktioner af tiden og af den valgte strategi er teoretisk naeligsten ufremkommelige

Strategier ved spil 24

Indeks Casino516 Computersimulation18 definitionen af sandsynlighed 1 Den optimale Snell-strategi11 forsikringsmatematik 5 Indbrudstyvens pensionsproblem912 kortsigtede strategi 10 kumulerede frekvens 19 langsigtede strategi 10 lotto 1 Mandagschancen14 Mandags-chancen9 Martingale-systemet16

Optimale Strategier 10 Poker 3 rekursionsligning 6 roulette 57 Roulette spil 10 roulettespiller 7 ruinsandsynligheder 5 Skaeligbnen913 Snell-strategien 11 Stopbetingelsen11 strategi9 Taeligndstikspillet1018

Page 9: Sandsynligheder og strategier ved spil - Ole Witt-Hansen ...olewitthansen.dk/Matematik/Sandsynligheder_og_strategier_ved_spil… · 6dqgv\qoljkhghu yhg vslo 3n vdpph pngh ndq yl ilqgh

Ruinsandsynligheder 7

018371937

18

37

191

21

211

rrrr

Den sidste 2gradsligning kan loslashses paring normal vis idet diskriminanten d =372 ndash 4middot19middot18 = 1 saring

119

18

38

36

192

137111

rrr

Vi er kun interesseret i loslashsningen r1 = 1819

Ifoslashlge ovenstaringende er nrr nn )

19

18(1

Vi vil herefter besvare sposlashrgsmaringlet Hvor mange enheder skal banken have for at der er mindre end 1 chance for ruin Dette er ensbetydende med at loslashse ligningen

1785)

19

18ln(

)010ln(010)

19

18( nn

Husker vi at en enhed svarede til 18 indsatser giver dette beskedne 1533 indsatser Hvis en spiller derimod spiller paring saeligdvanlig vis med kun at placere en indsats paring eacutet felt er dette - lidt overraskende ndash betydelig mere risikabelt for banken Vi opstiller igen en rekursionsligning med udgangspunkt i det foslashrste spil Sandsynligheden for at banken bliver ruineret med n enheder er lig med Sandsynligheden for at banken vinder det foslashrste spil (hvor den vinder en enhed) gange sandsynligheden for at banken bliver ruineret med n+1 enheder plus sandsynligheden for at banken taber det foslashrste spil (hvor den mister 35 enhed) gange sandsynligheden for at banken bliver ruineret med n-35 enheder Sandsynlighederne for at banken vinder og taber er 3637 og 137 Vi kan da opstille ligningen

351

111351 37

1

37

36

37

1

37

36 nnn

nnn rrrrrr

Ved division med (r1)

n-35 og omordning af leddene og ved at saeligtte r1 = x faringr man ligningen

36x36 ndash 37x35 +1 = 0 Denne ligning kan kun loslashses ved numeriske metoder og man finder loslashsningen x = 09984 Hvis vi igen stiller sposlashrgsmaringlet Hvor mange indsatser skal banken raringde over for at der er mindre end 1 chance for ruin skal vi loslashse ligningen

Ruinsandsynligheder 8

2876)99840ln(

)010ln(010)99740( nn

Altsaring en betydelig stoslashrre beholdning end hvis spilleren spiller paring 18 felter Forsoslashger vi at udregne ruinsandsynligheden for en spiller der har n enheder og laeliggger sin indsats paring eacutet felt kommer vi efter helt det samme raeligsonnement frem til foslashlgende rekursionsligning

35137

11137

36

37

1

37

361351

nn rrrrrr

nnnn

som foslashrer til ligningen x36 ndash 37x +36 = 0 Denne ligning har kun loslashsningen x = 1 Differentieres nemlig f(x) =x36 ndash 37x +36 finder man f (x) =36x35 ndash 37 Ligningen f (x) =0 har

loslashsningen 136

3735 x Da f (x) lt 0 for x lt 1 har den ingen roslashdder mindre end 1

Ruin-sandsynligheden for en spiller der garingr paring et Casino som har en ubegraelignset beholdning er 1 Saring vi kan endnu engang fastslaring at hvis man fortsaeligtter med at spille paring et Casino vil man altid blive ruineret i det lange loslashb Man kunne selvfoslashlgelig overveje ruinsandsynlighederne hvis Casino har beholdningen n og en spiller har beholdningen m (n gt m eller omvendt) men svaret vil afhaelignge af n og m og de indgaringende to ulineaeligre ligninger med to ubekendte med meget hoslashje eksponenter er ikke saring nemme at loslashse numerisk ndash selv paring en Computer Hvis n gtgt m vil svaret stort set vaeligre det samme

Strategier ved spil 9

Kap 2 Strategier ved spil

1 Forskellige spil Efter at have udregnet vindersandsynligheder i forbindelse med spil skal vi nu se paring noget andet som ogsaring er knyttet sammen med sandsynlighedsregningen nemlig problemet med at fastlaeliggge den bedste strategi naringr man spiller et spil Her skal spil imidlertid forstarings i en meget videre betydning det vaeligre sig krig boslashrsspekulation jagt eller fiskeri paring en bestemt dyreart Sidstnaeligvnte er dog alt for komplicerede til at kunne behandles elementaeligrt Faeliglles er det dog at man skal kunne beregne sandsynligheden for en bestemt konsekvens af et givet traeligk Vi vil begynde med at give nogle meget simple eksempler paring spil hvor det er meningsfuldt at tale om optimal strategi Vendingen den optimale strategi indebaeligrer at spillet afvikles i et endeligt antal trin og at der for hvert trin i spillet er mulighed for at forbedre sin gevinst og mulighed for at miste sin gevinst helt eller delvis Man skal endvidere have mulighed for at standse spillet ved ethvert trin og inkassere sin gevinst

11 Mandags-chancen I dette spil som har vaeligret lanceret af TV2 har man en raeligkke tildaeligkkede felter med beloslashb (101025255050100100250) x 1000 kr Man har maximalt 3 forsoslashg Man faringr beloslashbet paring det sidst afdaeligkkede felt Nedenfor er vist en computer simulation af spillet efter 2 traeligk Det er nok klart at hvis man afdaeligkker et felt med 10 i 1 eller 2 forsoslashg skal man fortsaeligtte eller hvis man afdaeligkker et felt med 100 eller 250 i 1 eller 2 forsoslashg skal man standse Men hvad hvis man afdaeligkker et felt med 50 i 1 eller 2 forsoslashg Det vil vi forsoslashge at afgoslashre ved nogle mere matematiske betragtninger

12 Skaeligbnen Et spil som vist nok kommer fra orienten Det spilles med to terninger Foslashrst slaringr man et slag med de to terninger og summen af deres oslashjental betegnes skaeligbnen

Strategier ved spil 10

Man kan nu slaring lige saring mange gange man vil (max 100) Hvis oslashjentallene ikke er lig skaeligbnen saring adderes dette til ens pointtal men hvis man slaringr sin skaeligbne mister man alt Nedenfor er vist et trin i en animeret computer simulation af spillet Naringr spillet er standset fordeler man indsatsen i forhold til spillernes opnaringede pointtal Det gaeliglder derfor om at have de stoslashrste pointtal Problemet er imidlertid hvornaringr det er optimalt at standse naringr man kender sin skaeligbne

13 Indbrudstyvens pensionsproblem Dette er en variant af mange forskellige optimeringsproblemer Arthur er indbrudstyv Hver tyvetugt giver i snit K kr Chancen for at Arthur bliver snuppet er p Hvis han bliver taget mister han alt fra sine tidligere tyvetugter Hvor mange indbrud skal Arthur lave foslashr han standser sin karriere og vaeliglger at leve af sin opsparing

14 Taeligndstikspillet Dette spil falder lidt uden for rammerne af de oslashvrige spil fordi man ikke kan standse spillet og fordi man aldrig kan miste noget af sin gevinst Det kan derfor ikke umiddelbart behandles paring samme maringde som de hidtil naeligvnte spil Alligevel er det et spil der udpraeligget kan behandles med matematiske teorier for den bedste strategi Spillet garingr ud paring at man paring 10 taeligndstikker farver den ene side roslashd Kastes taeligndstikken op er sandsynligheden for at den farvede side vender opad naringr den lander paring bordet lig med p = 025 Hver spiller har fra starten tallene 110 Hvert tal maring kun bruges 1 gang Man skiftes til at kaste de 10 taeligndstikker og notere antallet af farvede taeligndstikker Dette antal skal saring ganges med et af de resterende tal 110 Den som efter 10 spil har den hoslashjeste sum har vundet Det kan oplyses og let verificeres at den maximale gevinst er 550 Middelgevinsten hvor man vaeliglger tilfaeligldig er 1375 og den optimale middelgevinst er ca 167

Strategier ved spil 11

15 Casino Roulette spil falder ogsaring lidt uden for rammerne af optimale strategier af den meget simple grund at odds er svagt imod eacuten Det gaeliglder dog ikke for Blackjack hvor man kan udvikle en strategi som giver en svag fordel Hvis odds er imod eacuten vil man imidlertid altid tabe i det lange loslashb Som tidligere fastslaringet er den eneste mulighed - i det lange loslashb - for at undgaring ruin i roulettespil at der ikke er nogen oslashvre graelignse for indsatser og at man har flere penge end Casionorsquoet og ingen af disse to betingelser er nogensinde opfyldt Enhver fornuftig matematisk spil-teori vil derfor som resultat have at man skal standse foslashr det foslashrste spil Det vil sige Man skal lade vaeligre med at garing paring Casino Denne kendsgerning udelukker dog ikke at man kan goslashre sig overvejelser over hvordan man kan spille hvis man ikke udelukkende er interesseret i at foraeligre sine penge til et Casino uden kamp

2 Optimale Strategier Hvis man intuitivt skal formulere en strategi for de 3 foslashrste spil naeligvnt ovenfor saring kan man feks vaeliglge eacuten af 3 foslashlgende strategier 1 Man beslutter paring forharingnd hvor stor ens gevinst (eller tab) skal vaeligre foslashr man stopper Dette er

faktisk en meget almindelig strategi men den er bestemt ikke optimal 2 Man fortsaeligtter saring laelignge man i middel har mulighed for at foroslashge sin gevinst i naeligste spil Man

skal huske paring at middelvaeligrdien af gevinsten ogsaring omfatter tab saring middelvaeligrdien (i matematisk forstand) skal vaeligre positiv Denne umiddelbart fornuftige strategi kaldet den kortsigtede eller myope strategi er i mange tilfaeliglde ogsaring den optimale strategi (dog ikke i mandagschancen)

3 Man fortsaeligtter saring laelignge man i middel har mulighed for at foroslashge sin gevinst i et af de

efterfoslashlgende spil Denne strategi kaldes den langsigtede strategi Baringde den kortsigtede og den langsigtede strategi ser yderst rimelige ud og de vil ogsaring vaeligre optimale for langt de fleste spil Hvis der er forskel paring den langsigtede og den kortsigtede strategi skal man anvende den langsigtede - naturligvis Der findes imidlertid visse former for spil hvor ingen af strategierne er optimale Det gaeliglder feks for boslashrsspekulanter der har en beholdning aktier som de vil saeliglge naringr kurserne stiger Dette fortsaeligtter som bekendt aldrig i det uendelige Paring et vist tidspunkt standser stigningen og kurserne begynder at falde ndash som regel ndash hurtigere end de steg Hvornaringr skal man saeliglge for at opnaring den stoslashrste gevinst Det viser sig - men det er saeligrdeles kompliceret at redegoslashre for ndash at naringr det gaeliglder boslashrs spekulation saring er ingen af strategierne 2 og 3 optimale De vil begge to i grove traeligk som resultat have at man enten skal saeliglge straks eller vente til man er ruineret Vi vil nu give en beskrivelse af den optimale strategi som er udviklet af Snell Vi vil overhovedet ikke naeligrme os et bevis for at det er den optimale strategi (beviset er ret teknisk abstrakt) men

Strategier ved spil 12

understrege at det kan bevises I matematisk forstand Ulemperne ved Snell-strategien er at den for selv simple problemer kan foslashre til ret omfattende og komplicerede regninger

2 Den optimale Snell-strategi Snell-strategien er paring sin vis den samme som den kortsigtede strategi men hvor man i denne strategi hele tiden regner sig et skridt frem saring tager Snell-strategien udgangspunkt i spillets slutning og arbejder sig baglaeligns Vi indfoslashrer foslashrst nogle betegnelser Vi antager at spillet har n trin Sk er en stokastisk variabel der angiver den faktiske samlede gevinst man har opnaringet ved det kte spil Sk kan antage en eller flere vaeligrdier med tilhoslashrende sandsynligheder Det nye ved Snell-strategien er at man definerer endnu en stokastisk variabel Gk ved ligningen

Gk = maxSk E(Gk+1| S1Sk) Gk er den stoslashrste af vaeligrdierne Sk (gevinsten efter det kte spil) og E(Gk+1| S1Sk)) som er middelvaeligrdien af den maximale forventede gevinst i det k+1te spil naringr det er givet at man har spillet spillene 1k Dette opstilles i et skema Gn = Sn Gevinsten ved spillets afslutning Gn-1 = maxSn-1 E(Gn| S1Sn-1) Gk = maxSk E(Gk+1| S1Sk) G1 = maxS1 E(G2| S1) Snell strategien siger nu at man skal standse spillet den foslashrste gang Sk (gevinsten efter det kte spil) overstiger middelvaeligrdien af den maksimale forventede gevinst i det k+1te spil Dette kaldes for stopbetingelsen Stopbetingelsen er altsaring

Sk E(Gk+1| S1Sk) Man skal altsaring standse spillet naringr den opnaringede gevinst er stoslashrre eller lig med den betingede forventning af den maximale gevinst i det naeligste spil Det kunne lyde som den kortsigtede strategi men forskellen er den at i den kortsigtede strategi er Gk+1 erstattet af Sk+1 At kunne gennemskue konsekvenserne af dette er derimod ikke saring nemt Det viser sig at i mange tilfaeliglde at er Snell-Strategien identisk med den kortsigtede strategi som kraeligver at man stopper naringr Sk E(Sk+1| S1Sk) Snell strategien er ikke umiddelbart let gennemskuelig og udregningen af de betingede middelvaeligrdier E(Gk+1| S1Sk) er ofte ret teknisk Vi vil nu behandle de foslashr naeligvnte eksempler og begynder med

Strategier ved spil 13

21 Indbrudstyvens pensionsproblem Lad os antage at Arthurs gennemsnitlige gevinst ved hvert tyvetogt er K = 6000 kr og at chancen er at han bliver taget er 5 Lad os antage at hans hidtidige gevinst efter k - tyvetugt er Sk som bliver konfiskeret - og som han derved mister hvis han bliver snuppet I dette tilfaeliglde kan man - som vist nedenfor - se at den kortsigtede strategi er den optimale strategi Det haelignger sammen med at alle trin i spillet er identiske Gevinsten ved hvert tyvetogt er den samme ndash uafhaeligngigt af de foregaringende tyvetugter - bortset fra at den samlede gevinst vokser ved hvert vellykket tyvetogt Xk betegner den stokastiske variabel som er Arthurs gevinst ved eacutet tyvetugt Hermed er

Sk =X1+ X2+ X3+hellip Xk Xk+1 kan antage vaeligrdien K med sandsynlighed 1-ps = 1-P(Snuppet) (altsaring hvis det naeligste tyvetugt lykkes) og vaeligrdien ndashSk (han mister hele sin opsparing) med sandsynlighed ps = P(Snuppet) Vi opskriver nu Snell-strategien (Den kortsigtede strategi) for et trin i hans karriere

Gk = max Sk E(Sk+1| 1k)

Sk er hans gevinst efter k tyvetugter og E(Sk+1| 1k) er hans forventede gevinst efter k+1 tyvetugter E(Sk+1| 1k) kan beregnes som den hidtidige gevinst plus den forventede gevinst ved naeligste tyve- tugt i alt lig med Sk + E(Xk+1) E(Xk+1) er uafhaeligngig af de foslashrste k - tyvetugter derfor bliver stopbetingelsen Sk gt Sk + E(Xk+1) E(Xk+1) lt 0 Middelvaeligrdien E(Xk+1) kan saringledes udregnes efter den saeligdvanlige definition idet Xk+1 antager vaeligrdierne K (gevinsten ved et tyvetugt) og - Sk (mister hele sin opsparing) med sandsynlighederne 1-ps og ps henholdsvis E(Xk+1) = K(1- ps) - Sk ps Han skal standse naringr

E(Xk+1) lt 0 K(1- ps) lt Sk ps som med tal eksemplet giver

6000095 lt Sk005 Sk gt 114000- kr svarende til 114006000 = 095005 = 19 tyvetugter

(Det goslashr han nu nok ikke og er derfor henvist til at leve af folkepensionen efter nogle aringr i skyggen) Man kunne godt tro at dette eksempel kunne anvendes paring andre (ligesaring uetiske) problemstillinger Feks hvor mange gange det er optimalt at koslashre gratis i S-tog Det kan det imidlertid ikke helt

Strategier ved spil 14

Sagen er jo den at man faringr en fast boslashde hvis man bliver snuppet men man kommer ikke til at betale for de gange man har koslashrt gratis Med andre ord vurderingen om hvorvidt det er fordelagtigt at koslashre uden billet afhaelignger kun af middelgevinsten ved det naeligste forsoslashg Hvis den er positiv er det fordelagtigt at fortsaeligtte men hvis den er negativ er det fordelagtigt at loslashse billet (Det er i oslashvrigt uetisk at snyde ndash naturligvis) Tager vi et eksempel billetprisen er kr 50- Boslashden er kr 500 Sandsynligheden for at blive snuppet er Ps = 01 Hvis X er gevinsten ved at koslashre uden billet er E(X) = 50middot(1-Ps)-500middotPs = 50middot09-500middot01 = -50 Det er saringledes (med denne sandsynlighed for at blive snuppet) ikke fordelagtigt at koslashre uden billet i S-tog Da en laeligrebog i sandsynligheder ved spil naturligvis ikke maring tilskynde til uetiske handlinger undlader vi at foretage beregningen med Ps = 005

22 Skaeligbnen Vi betragter kast med to terninger X betegner summen af oslashjentallene ved eacutet kast Sandsynlighedsfordelingen for X er velkendt Feks er P(X=5) = 436 Sandsynligheden for at terningerne viser j oslashjne kan skrives som

36

76)(

jjXP

Lad os antage at spillerens skaeligbne er q Hvis man slaringr dette oslashjental er alt tabt Ellers adderes oslashjentallene for hvert kast Hvis ikke man har slaringet sin skaeligbne saring er den samlede gevinst efter n spil

Sn = X1+ X2+ X3+hellip +Xn

Og middelvaeligrdien af Sn er

E(Sn) = E(X1)+ E(X2)+E(X3)+hellip +E(Xn) = nE(X | X q) E(X | X q) er den betingede middelvaeligrdi af oslashjentallene givet at man ikke slaringr sin skaeligbne

E(X | X q) = 2P(2) +3P(3)+hellip(q-1)P(q-1) + (q+1)P(q+1)+hellip+12P(12) Den kortsigtede strategi (og Snell strategien) fastslaringr at man skal standse naringr middelvaeligrdien af den forventede gevinst ved naeligste kast er negativ Argumentet for dette kan overtages naeligsten ordret fra indbrudstyvens pensionsproblem E(Sk+1|S1 Sk) kan beregnes som den hidtidige gevinst Sk plus den forventede gevinst ved det naeligste kast i alt lig med Sk + E(Xk+1| S1 Sk) Stopbetingelsen er derfor

Sk gt Sk + E(Xk+1| S1 Sk) E(Xk+1| S1 Sk) lt 0

Strategier ved spil 15

E(X | X q) ndash SnP(q) lt 0 Sn gt E(X | X q) P(q) Det er ikke saeligrlig svaeligrt at udregne stopbetingelsen feks for q = 2 og q = 6 Nedenfor er vist udskriften fra et program som foretager beregningen for q = 212 Forventet gevinst i naeligste kast naringr ens skaeligbne er q q 2 3 4 5 6 7 8 9 10 11 12 694 683 667 644 617 583 589 600 617 639 667 Stop naringr din gevinst S gt EX(q)P(q) naringr skaeligbne er q q 2 3 4 5 6 7 8 9 10 11 12 25000 12300 8000 5800 4440 3500 4240 5400 7400 11500 24000

Som det fremgaringr er der endog meget stor forskel paring stoptiderne afhaeligngig af ens skaeligbne

23 Mandagschancen Dette spil er lidt mere interessant fordi det ikke er helt saring enkelt at gennemskue I dette tilfaeliglde kan man ikke forvente at den kortsigtede strategi vil foslashre til den optimale strategi At den faktisk goslashr det skyldes talvaeligrdierne Dette skal forstarings saringledes at hvis man aeligndrede paring praeligmiestoslashrrelserne ville Snell-strategien afvige fra den kortsigtede strategi Vi vil analysere spillet ved Snell-strategien Som naeligvnt har man i spillet 9 tildaeligkkede felter (101025255050100100250) Man kan afdaeligkke hoslashjest 3 felter Man faringr beloslashbet i 1000 kr som det sidste felt viser Hvis X er den stokastiske variabel som angiver vaeligrdien af et felt saring vil de fleste uden saring lange overvejelser vel fortsaeligtte hvis Xlt50 og standse hvis X100 Det kritiske er hvis man afdaeligkker 50 (X=50) Vi bemaeligrker foslashrst at summen af alle felterne er S=620 og at E(X) =6209=689 Vi opskriver foslashrst den fuldstaeligndige Snell-strategi for dette spil G3 =X3 Den Stokastiske variabel G3 = Gevinsten = X3 = vaeligrdien af det sidst afdaeligkkede felt G2 = max X2 E(G3| X1X2 ) Den stoslashrste af vaeligrdierne X2 (= vaeligrdien af det afdaeligkkede

felt) og den betingede middelvaeligrdi af G3 = X3 G1 = max X1 E(G2| X1 ) Som ovenfor Kriteriet for den optimale strategi er som tidligere Stop hvis paring noget trin Xk gt E(Gk+1| X1Xk ) Det er relativ nemt at opstille en formel for E(G3| X1X2 ) Naringr X1 og X2 er afdaeligkket er summen de resterende felter S - X1 - X2 Da alle felter har samme sandsynlighed er middelvaeligrdien simpelthen middeltallet af felterne E(G3| X1X2 ) = ( S - X1 - X2)(9-2)

Strategier ved spil 16

Det er noget mere teknisk at opstille en formel for E(G2| X1 ) og ogsaring lidt teknisk at foretage beregningen Vi vil noslashjes med at skitsere beregningen for en vaeligrdi af X1 og i oslashvrigt henvise til resultatet af et Computerprogram som kan ses nedenfor Lad os antage at X1 = 25 Vi lader nu X2 gennemloslashbe alle de mulige vaeligrdier (alle vaeligrdier skal taeliglles med det antal gange der er felter med denne vaeligrdi) For hver vaeligrdi af X2 (feks 50) skal vi vaeliglge max af X2 og E(G3| X1X2 ) = ( S - X1 - X2) (9-2) (= (620-50-25)7 = 778 i dette tilfaeliglde) og addere det til en sum S2 E(G2| X1 ) er da lig med S2(9-1) (da der er 9-1 felter X2 ) X2[1]= 1000 E(G3)= 8571 G2= 8571 X2[2]= 2500 E(G3)= 8357 G2= 8357 X2[3]= 5000 E(G3)= 8000 G2= 8000 X2[4]= 10000 E(G3)= 7286 G2= 10000 X2[5]= 25000 E(G3)= 5143 G2= 25000 X1[1]= 1000 E(G[2])= 10786 X2[1]= 1000 E(G3)= 8357 G2= 8357 X2[2]= 2500 E(G3)= 8143 G2= 8143 X2[3]= 5000 E(G3)= 7786 G2= 7786 X2[4]= 10000 E(G3)= 7071 G2= 10000 X2[5]= 25000 E(G3)= 4929 G2= 25000 X1[2]= 2500 E(G[2])= 10679 X2[1]= 1000 E(G3)= 8000 G2= 8000 X2[2]= 2500 E(G3)= 7786 G2= 7786 X2[3]= 5000 E(G3)= 7429 G2= 7429 X2[4]= 10000 E(G3)= 6714 G2= 10000 X2[5]= 25000 E(G3)= 4571 G2= 25000 X1[3]= 5000 E(G[2])= 10500 X2[1]= 1000 E(G3)= 7286 G2= 7286 X2[2]= 2500 E(G3)= 7071 G2= 7071 X2[3]= 5000 E(G3)= 6714 G2= 6714 X2[4]= 10000 E(G3)= 6000 G2= 10000 X2[5]= 25000 E(G3)= 3857 G2= 25000 X1[4]= 10000 E(G[2])= 9643 X2[1]= 1000 E(G3)= 5143 G2= 5143 X2[2]= 2500 E(G3)= 4929 G2= 4929 X2[3]= 5000 E(G3)= 4571 G2= 5000 X2[4]= 10000 E(G3)= 3857 G2= 10000 X1[5]= 25000 E(G[2])= 6268 Ser man resultaterne igennem kan de udmoslashntes i en simpel regel Fortsaeligt paring 50 eller derunder Stop paring 100 eller derover Det er maringske lidt overraskende at man ogsaring skal forsaeligtte paring 50000 hvis man kun har et forsoslashg tilbage ndash man kunne jo ende med 10000 og det er saring bare aeligrgerligt ndash og det er vist nok de fleste som standser ved 50000 - men det er ikke den bedste strategi

Strategier ved spil 17

24 Casino Som naeligvnt i indledningen til dette afsnit findes der ingen strategi som kan bringe en i stand til at vinde paring et Casino ndash i det lange loslashb Vil man goslashre Casino-spil til en levevej vil det altid med matematisk sikkerhed ende med ruin Det betyder imidlertid ikke at man ikke kan vinde ved at garing paring Casino men hvis man taelignker paring at spraelignge banken saring skal to krav i hvert fald vaeligre opfyldt for at der skal vaeligre en ikke forsvindende sandsynlighed for at det kan lade sig goslashre 1 Man skal have flere penge end Casino 2 Der maring ikke vaeligre loft over indsatserne Begge betingelser er som bekendt aldrig opfyldt Man kan som sagt godt vinde paring et Casino men hvis man satser paring at vinde mere (alle de gange man er paring Casino i sit liv) end det beloslashb man medbringer ved hvert besoslashg saring vil chancerne for at tabe det hele vaeligre stoslashrst Her er der tale om sandsynligheder og middelvaeligrdier ndash om odds Selvfoslashlgelig er de muligt at tabe hele sin formue ved foslashrste besoslashg eller vinde det tredobbelte ved det andet Der har i tidens loslashb vaeligret lanceret flere eksempler paring vinderstrategier som lyder uhyre besnaeligrende Den mest kendte er Martingale-systemet Man spiller kun paring sort og roslashd hvor faringr man faringr fordoblet sin indsats hvis man vinder Spillet er saringledes helt lige bortset fra at indsatserne bliver liggende naringr zero kommer ud og man kun faringr sin indsats en gang hvis man vinder i naeligste spil (zero har ingen farve) Spiller man efter Martingale-systemet skal man inkassere sin gevinst hvis man vinder Hvis man derimod taber skal man fordoble sin indsats Vi saeligtter grundindsatsen til 1 Har man spillet n gange og dermed doblet op n-1 gange har man lagt en indsats Sn = 1 + 2 + 22 +hellip2n-1 = 2n ndash1 Udregnet af kvotientraeligkkeformlen

1

10

q

qaS

n

n

for raeligkken Sn = a0 + a0q+ a0q

2+hellip+ a0qn-1

Vinder man det nte spil faringr man udbetalt 22

n-1 = 2n saring ens gevinst er 2n - (2n - 1) = 1 Der gaeliglder aringbenbart den simple kendsgerning at bliver man bare ved med at fordoble saring har man altid vundet eacuten indsats Foslashr man forsoslashger sig med dette skal man dog nok goslashre sig klart hvor mange gange man kan tabe foslashr man er ruineret

Strategier ved spil 18

Sandsynligheden for at man taber 5 spil er (frac12)5 = 132 Man har da tabt 25 ndash 1 gange vaeligrdien af en jeton (i Danmark 50 kr) dvs 1550 kr Vil man sikre sig bedre feks ved at kunne doble op 9 gange (sandsynligheden for at tabe 10 spil er 11024) saring skal man komme med kr 51150- men det kan man ikke engang gennemfoslashre da hoslashjeste indsats i Danmark er 24000- Man kunne imidlertid stille det sposlashrgsmaringl Hvis man har n-jetoner hvad er saring sandsynligheden for at vinde q-jetoner hvis man spiller efter Martingale-systemet Dette kan man faktisk godt udregne direkte men regningerne er ret omfattende Derimod er resultatet simpelt Vi vil ikke lave en direkte udregning men anvende de samme metoder som vi har anvendt for den bedste strategi Vi tager udgangspunkt i det faktum at sort roslashd Casino spil er et lige spil saring middelvaeligrdien af gevinsten er 0 ligegyldigt hvordan man spiller Middelvaeligrdien (som er nul ) af en gevinst paring q-jetoner er lig med q gange sandsynligheden P(q) for at vinde q jetoner minus ens kapital (n jetoner) gange med sandsynligheden for at man taber det sidste spil som er 1 ndash P(q)

qP(q) ndash n(1 ndashP(q)) = 0 qn

nqP

)(

Har man feks n = 31 jetoner (1550- kr) er sandsynligheden for at vinde q=10 (500 kr) lig med 0756 En rimelig stor sandsynlighed men altsaring stadig 25 chance for ruin Oslashnsker man derimod at blive rigtig rig og vinde 10000- kr dvs q=200 er P(200) = 0134 Konklusionen er den at satser man paring at vinde mere end man medbringer saring er sandsynligheden mindre end frac12 men kan man noslashjes med mindre saring er sandsynligheden stoslashrre end frac12 Men bemaeligrk dette gaeliglder fra foslashrste gang man garingr ind paring et Casino til man beslutter at holde op

25 Taeligndstikspillet Som beskrevet ovenfor garingr spillet ud paring at farve den ene af siderne roslashd paring 10 taeligndstikker Naringr taeligndstikken kasten op i luften er sandsynligheden for at den roslashde side vender opad naringr den rammer bordet lig med p=025 Man kaster paring skift 10 saringdanne taeligndstikker 10 gange For hvert kast skal man multiplicere antallet af roslashde med et af tallene 110 Hver tal maring kun bruges eacuten gang Den der faringr den stoslashrste sum har vundet Det er klart at en god strategi i det lange loslashb vil give en hoslashjere sum Vi minder om at antallet af X roslashde taeligndstikker er binomialfordelt med primaeligrsandsynlighed p og antalsparameter n=10

102104

3

4

110)(

10

jj

jXPjj

Strategier ved spil 19

Endvidere vil vi anvende de kumulerede sandsynligheder P(X j) og P(X j) Nedenfor er vist resultatet af en Computersimulation af spillet Primaeligr sandsynligheder for n= 10 og p= 0250 P(X=j) j 0 1 2 3 4 5 6 7 8 9 10 00563 01877 02816 02503 01460 00584 00162 00031 00004 00000 00000 Baglaeligns kumulerede sandsynligheder P(Xgt=q) j 0 1 2 3 4 5 6 7 8 9 10 10000 09437 07560 04744 02241 00781 00197 00035 00004 00000 00000 1 kast Antal = 2 Vaeliglg mellem 1 2 3 4 5 6 7 8 910 Faktor= 4 2 kast Antal = 4 Vaeliglg mellem 1 2 3 5 6 7 8 910 Faktor=10 3 kast Antal = 2 Vaeliglg mellem 1 2 3 5 6 7 8 9 Faktor= 5 4 kast Antal = 2 Vaeliglg mellem 1 2 3 6 7 8 9 Faktor= 3 5 kast Antal = 3 Vaeliglg mellem 1 2 6 7 8 9 Faktor= 8 6 kast Antal = 2 Vaeliglg mellem 1 2 6 7 9 Faktor= 6 7 kast Antal = 6 Vaeliglg mellem 1 2 7 9 Faktor=9 8 kast Antal = 3 Vaeliglg mellem 1 2 7 Faktor= 2 9 kast Antal = 2 Vaeliglg mellem 1 7 Faktor= 7 10 kast Antal = 2 Vaeliglg mellem 1 Faktor= 1 Din score er 176 Valget af tallene 110 er i dette tilfaeliglde foretaget ud fra den optimale strategi som vi vil omtale om et oslashjeblik Foslashr vi analyserer den optimale strategi for dette spil vil vi forsoslashge os med en intuitiv bedste strategi Vi belyser denne strategi med et konkret eksempel Lad os feks antage at vi slaringr 4 roslashde i den 3 kast (3 forsoslashg) De tal vi har tilbage kalder vi (y8 y7 y6 y5 y4 y3 y2 y1) Sposlashrgsmaringlet om vi skal gange med det stoslashrste y8 eller det naeligststoslashrste y7 osv Vi raeligsonnerer da som foslashlger Hvis sandsynligheden for at slaring mere end 4 roslashde i de resterende 7 kast er stoslashrre end frac12 saring skal vi vaeliglge det naeligststoslashrste Vi skaeligrper dette Hvis sandsynligheden for at slaring mindst 5 roslashde mindst en gang i de resterende 7 kast er stoslashrre end frac12 saring skal vi vaeliglge det naeligststoslashrste Tilsvarende hvis sandsynligheden for at slaring mindst 5 roslashde mindst 2 gange i de resterende 7 kast skal vi vaeliglge det 3 stoslashrstehellipog saringdan fremdeles Strategien virker umiddelbart meget plausibel Sandsynlighederne kan direkte farings af binomialfordelingen Foslashrst sandsynligheden for at faring mindst q-roslashde i et kast Dette er

P(X q) =

n

qj

jXP )( hvor P(X = j) er angivet ovenfor

Strategier ved spil 20

Sandsynligheden for at dette sker mindst r gange i n - k kast er ogsaring en binomialfordeling og kan skrives

P(X q mindst r gange i n - k kast ) = jknjkn

rj

qXPqXPj

kn

))(1()(

Beregningen af disse (110) sandsynligheder goslashres nok lettest paring en computer For at lave en strategi-tabel goslashr man det at for hvert kast og hvert antal mulige roslashde vaeliglger man foslashrst det stoslashrste af de resterende tal Dernaeligst beregner man sandsynligheden for at faring mindst 1 roslashd mere i et af de foslashlgende kast Hvis denne sandsynlighed er stoslashrre end frac12 ser man paring det naeligststoslashrste af de resterende tal Man beregner saring sandsynligheden for at faring mindst 1 roslashd mere i mindst to af de resterende kast Hvis denne sandsynlighed er stoslashrre end frac12 saring vaeliglger man det tredjestoslashrste af de resterende tal og saringdan fremdeleshellip Det bemaeligrkes at beregningen skal initialiseres med at man altid vaeliglger det mindste hvis man slaringr 0 roslashde og altid vaeliglger det stoslashrste hvis man slaringr 10 roslashde Nedenfor er vist en computerberegning af en strategi-tabel Endvidere er ogsaring lavet en saringkaldt Monte-Carlo simulation Dette betyder at man har ladet maskinen spille feks 10000 spil spillet efter strategi-tabellen Nederst er vist hyppighederne for ens score og endelig fordelingsfunktionen for observationerne (Den kumulerede frekvens) P(X =j) for n =10 and p = 0250 j 0 1 2 3 4 5 6 7 8 9 10 P(X =j)0056 0188 0282 0250 0146 0058 00162 0003 00004 0000 0000 P(Xgt=j) for n =10 and p = 0250 j 0 1 2 3 4 5 6 7 8 9 10 P(Xgt=j) 1000 0944 0756 0474 0224 0078 00197 00035 00004 0000 0000 Strategi tabel Tallene refererer ikke til faktorene selv men til den stoslashrste naeligststoslashrste osv Eksempel Hvis man slaringr 3 roslashde i den andet kast saring skal man vaeliglge (7) den tredjestoslashrste Kast no 1 2 3 4 5 6 7 8 9 10 score 0 1 1 1 1 1 1 1 1 1 1 1 3 3 3 2 2 2 2 1 1 1 2 6 5 5 4 4 3 3 2 2 1 3 8 7 7 6 5 4 3 3 2 1 4 9 9 8 7 6 5 4 3 2 1 5 10 9 8 7 6 5 4 3 2 1 6 10 9 8 7 6 5 4 3 2 1 7 10 9 8 7 6 5 4 3 2 1 8 10 9 8 7 6 5 4 3 2 1 9 10 9 8 7 6 5 4 3 2 1 10 10 9 8 7 6 5 4 3 2 1 Gennemsnitlig score = 16437

Strategier ved spil 21

Hyppighed af score h( 75)= 1 h( 80)= 7 h( 85)= 3 h( 90)= 5 h( 95)= 6 h(100)= 34 h(105)= 38 h(110)= 82 h(115)= 68 h(120)=161 h(125)=146 h(130)=320 h(135)=280 h(140)=534 h(145)=425 h(150)=752 h(155)=577 h(160)=878 h(165)=645 h(170)=956 h(175)=651 h(180)=863 h(185)=527 h(190)=609 h(195)=351 h(200)=389 h(205)=180 h(210)=203 h(215)= 93 h(220)= 86 h(225)= 47 h(230)= 32 h(235)= 21 h(240)= 13 h(245)= 8 h(250)= 3 h(255)= 0 h(260)= 4 h(265)= 1 h(270)= 1 h(275)= 0 h(280)= 0 Frekvens of score F( 80)=00008 F( 85)=00011 F( 90)=00016 F( 95)=00022 F(100)=00056 F(105)=00094 F(110)=00176 F(115)=00244 F(120)=00405 F(125)=00551 F(130)=00871 F(135)=01151 F(140)=01685 F(145)=02110 F(150)=02862 F(155)=03439 F(160)=04317 F(165)=04962 F(170)=05918 F(175)=06569 F(180)=07432 F(185)=07959 F(190)=08568 F(195)=08919 F(200)=09308 F(205)=09488 F(210)=09691 F(215)=09784 F(220)=09870 F(225)=09917 F(230)=09949 F(235)=09970 F(240)=09983 F(245)=09991 F(250)=09994 F(255)=09994 F(260)=09998 F(265)=09999 F(270)=10000 F(275)=10000

Som det fremgaringr af tabellen for P(X gt= j) er der kun 78 chance for at slaring 5 roslashde eller derover saring goslashr man det skal man altid vaeliglge det stoslashrste af de resterende tal For 3 eller 4 roslashde er situationen langt mere uigemmeskuelig og kun en beregning kan afgoslashre sagen Vi proslashver nu at finde den optimale strategi eller Snell-strategien Hvad angaringr sposlashrgsmaringlet om hvorvidt vi skal vaeliglge den stoslashrste eller naeligststoslashrste saring lader det sig faktisk goslashre at beregne Snell-strategien paring en computer De foslashlgende tilfaeliglde bliver derimod for komplicerede og der anvender vi en svagt forbedret version af vores intuitive strategi Forbedringen bestaringr i foslashlgende idet vi illustrerer det med et eksempel Lad os sige vi har slaringet 3 roslashde og vi overvejer om vi vil gange det med 7 eller 6 Ganger vi med 6 er det fordi vi forventer at slaring mindst 4 roslashde mindst en gang i de resterende kast Vores score vil vaeligre 73 og 74 henholdsvis og scoren vil blive forbedret med en faktor 43 hvis vi ganger med 6 under forventning af at slaring 4 roslashde Vores forbedring af strategien garingr da ud paring at vi vaeliglger det naeligststoslashrste 6 hvis sandsynligheden for at slaring 4 roslashde gange den relative forbedring 43 er stoslashrre end frac12 Vi rekapitulerer dernaeligst Snell-strategien G10 = X10 X10 Stokastisk variabel = antallet af roslashde i det 10 kast G9 = max X9 E(G10) E(G10) = E(X10) = np=10025 = 25 X9 = 01hellip10 Gk = max Xk E(Gk+1) E(Gk) kraeligver en laeligngere udregning men den udregnes som en

almindelig middelvaeligrdi altsaring som max af de to vaeligrdier gange P(X=Xk-1) G1 = max X1 E(G2) Som eksempel udregner vi E(G9) Da E(G10)=25 skal vi for X9 = 012 anvende E(G10)=25 i udregningen

Strategier ved spil 22

E(G9) = 25 (P(X=0)+P(X=1)+P(X=2))+ 3P(X=3)+hellip+10P(X=10) =306 Vaeligrdierne for E(Gk) er alle udregnet og vist i computerberegningen nedenfor Bemaeligrk isaeligr at de vokser fra 25 til 425 naringr k aftager fra 10 til 2 Strategien er nu foslashlgende Vaeliglg det stoslashrste af de resterende tal hvis Xk gt E(Gk+1) (altsaring det antal man har slaringet er er stoslashrre end det forventede stoslashrste antal) ellers vaeliglg det naeligststoslashrste Ved afgoslashrelsen om de 3 stoslashrste 4 stoslashrste osv anvender vi den hidtidige strategi med den modifikation at vi multiplicerer sandsynligheden med den formodede relative forbedring E(G10-kast)antal roslashde En computerberegning helt svarende til den foregaringende men med den aeligndrede strategi er vist nedenfor Man bemaeligrker for det foslashrste de smaring aeligndringer der er i strategien Den nye strategi er lidt mindre forsigtig men den giver altsaring ogsaring pote i form af en forbedring af gennemsnittet paring ca 275 Primaeligr sandsynligheder P(X=j) for n= 10 og p= 0250 j 0 1 2 3 4 5 6 7 8 9 10 P(X=j)0056 0188 0282 0250 0146 0058 0016 00031 00004 00000 00000 Baglaeligns Kumulerede sandsynligheder P(Xgt=j) j 0 1 2 3 4 5 6 7 8 9 10 P(Xgt=j) 1000 0944 0756 0474 0224 0078 00197 00035 00004 00000 00000 E(G[10])= 250 E(G[9])= 306 E(G[8])= 337 E(G[7])= 362 E(G[6])= 380 E(G[5])= 395 E(G[4])= 406 E(G[3])= 416 E(G[2])= 425 kast nr 1 2 3 4 5 6 7 8 9 10 score 0 1 1 1 1 1 1 1 1 1 1 1 2 2 1 1 1 1 1 1 1 1 2 5 4 4 3 3 3 2 2 1 1 3 8 7 6 5 5 4 3 2 2 1 4 9 8 7 7 6 5 4 3 2 1 5 10 9 8 7 6 5 4 3 2 1 6 10 9 8 7 6 5 4 3 2 1 7 10 9 8 7 6 5 4 3 2 1 8 10 9 8 7 6 5 4 3 2 1 9 10 9 8 7 6 5 4 3 2 1 10 10 9 8 7 6 5 4 3 2 1 Gennemsnitlig gevinst ms = 16727 Hyppigheder af score h( 75)= 1 h( 80)= 1 h( 85)= 0 h( 90)= 3 h( 95)= 2 h(100)= 5 h(105)= 4 h(110)= 9 h(115)= 12 h(120)= 12 h(125)= 17 h(130)= 22 h(135)= 28 h(140)= 39 h(145)= 24 h(150)= 49 h(155)= 54 h(160)= 74 h(165)= 63 h(170)=117 h(175)= 63 h(180)= 91 h(185)= 57 h(190)= 72 h(195)= 39 h(200)= 36 h(205)= 35 h(210)= 29 h(215)= 14 h(220)= 21 h(225)= 1 h(230)= 5 h(235)= 1 h(240)= 0 h(245)= 0 h(250)= 0 h(255)= 0 h(260)= 0 h(265)= 0 h(270)= 0 h(275)= 0 h(280)= 0

Strategier ved spil 23

Frekvens af score F( 80)=00020 F( 85)=00020 F( 90)=00050 F( 95)=00070 F(100)=00120 F(105)=00160 F(110)=00250 F(115)=00370 F(120)=00490 F(125)=00660 F(130)=00880 F(135)=01160 F(140)=01550 F(145)=01790 F(150)=02280 F(155)=02820 F(160)=03560 F(165)=04190 F(170)=05360 F(175)=05990 F(180)=06900 F(185)=07470 F(190)=08190 F(195)=08580 F(200)=08940 F(205)=09290 F(210)=09580 F(215)=09720 F(220)=09930 F(225)=09940 F(230)=09990 F(235)=10000 F(240)=10000 F(245)=10000 F(250)=10000 F(255)=10000 F(260)=10000 F(265)=10000 F(270)=10000 F(275)=10000

Maringske er det ikke en saeligrlig imponerende forbedring fra den foslashrste strategi men det er en teoretisk milepaeligl at man er i stand til at angive den bedste strategi for bestemte typer af spil Som omtalt har vi ikke forsoslashgt at bevise at Snell-Strategien er den optimale Strategi men det kan bevises Det er vigtigt at notere sig at i alle de omtalte spil har udfaldene vaeligre stokastiske variable dvs uforudsigelige men med bestemte sandsynligheder og at disse sandsynligheder ikke bliver aeligndret af den strategi man foslashlger I mange af de spil hvor man ofte moslashder begrebet strategi feks skak krig finansmarked og markedsfoslashring er dette langt fra tilfaeligldet Hvis feks alle boslashrsspekulanter fulgte den samme optimale strategi med boslashrskursen som stokastisk variabel ville det nok vise sig at det var den daringrligste strategi af alle Teorien for dynamiske strategier hvor de stokastiske variable er funktioner af tiden og af den valgte strategi er teoretisk naeligsten ufremkommelige

Strategier ved spil 24

Indeks Casino516 Computersimulation18 definitionen af sandsynlighed 1 Den optimale Snell-strategi11 forsikringsmatematik 5 Indbrudstyvens pensionsproblem912 kortsigtede strategi 10 kumulerede frekvens 19 langsigtede strategi 10 lotto 1 Mandagschancen14 Mandags-chancen9 Martingale-systemet16

Optimale Strategier 10 Poker 3 rekursionsligning 6 roulette 57 Roulette spil 10 roulettespiller 7 ruinsandsynligheder 5 Skaeligbnen913 Snell-strategien 11 Stopbetingelsen11 strategi9 Taeligndstikspillet1018

Page 10: Sandsynligheder og strategier ved spil - Ole Witt-Hansen ...olewitthansen.dk/Matematik/Sandsynligheder_og_strategier_ved_spil… · 6dqgv\qoljkhghu yhg vslo 3n vdpph pngh ndq yl ilqgh

Ruinsandsynligheder 8

2876)99840ln(

)010ln(010)99740( nn

Altsaring en betydelig stoslashrre beholdning end hvis spilleren spiller paring 18 felter Forsoslashger vi at udregne ruinsandsynligheden for en spiller der har n enheder og laeliggger sin indsats paring eacutet felt kommer vi efter helt det samme raeligsonnement frem til foslashlgende rekursionsligning

35137

11137

36

37

1

37

361351

nn rrrrrr

nnnn

som foslashrer til ligningen x36 ndash 37x +36 = 0 Denne ligning har kun loslashsningen x = 1 Differentieres nemlig f(x) =x36 ndash 37x +36 finder man f (x) =36x35 ndash 37 Ligningen f (x) =0 har

loslashsningen 136

3735 x Da f (x) lt 0 for x lt 1 har den ingen roslashdder mindre end 1

Ruin-sandsynligheden for en spiller der garingr paring et Casino som har en ubegraelignset beholdning er 1 Saring vi kan endnu engang fastslaring at hvis man fortsaeligtter med at spille paring et Casino vil man altid blive ruineret i det lange loslashb Man kunne selvfoslashlgelig overveje ruinsandsynlighederne hvis Casino har beholdningen n og en spiller har beholdningen m (n gt m eller omvendt) men svaret vil afhaelignge af n og m og de indgaringende to ulineaeligre ligninger med to ubekendte med meget hoslashje eksponenter er ikke saring nemme at loslashse numerisk ndash selv paring en Computer Hvis n gtgt m vil svaret stort set vaeligre det samme

Strategier ved spil 9

Kap 2 Strategier ved spil

1 Forskellige spil Efter at have udregnet vindersandsynligheder i forbindelse med spil skal vi nu se paring noget andet som ogsaring er knyttet sammen med sandsynlighedsregningen nemlig problemet med at fastlaeliggge den bedste strategi naringr man spiller et spil Her skal spil imidlertid forstarings i en meget videre betydning det vaeligre sig krig boslashrsspekulation jagt eller fiskeri paring en bestemt dyreart Sidstnaeligvnte er dog alt for komplicerede til at kunne behandles elementaeligrt Faeliglles er det dog at man skal kunne beregne sandsynligheden for en bestemt konsekvens af et givet traeligk Vi vil begynde med at give nogle meget simple eksempler paring spil hvor det er meningsfuldt at tale om optimal strategi Vendingen den optimale strategi indebaeligrer at spillet afvikles i et endeligt antal trin og at der for hvert trin i spillet er mulighed for at forbedre sin gevinst og mulighed for at miste sin gevinst helt eller delvis Man skal endvidere have mulighed for at standse spillet ved ethvert trin og inkassere sin gevinst

11 Mandags-chancen I dette spil som har vaeligret lanceret af TV2 har man en raeligkke tildaeligkkede felter med beloslashb (101025255050100100250) x 1000 kr Man har maximalt 3 forsoslashg Man faringr beloslashbet paring det sidst afdaeligkkede felt Nedenfor er vist en computer simulation af spillet efter 2 traeligk Det er nok klart at hvis man afdaeligkker et felt med 10 i 1 eller 2 forsoslashg skal man fortsaeligtte eller hvis man afdaeligkker et felt med 100 eller 250 i 1 eller 2 forsoslashg skal man standse Men hvad hvis man afdaeligkker et felt med 50 i 1 eller 2 forsoslashg Det vil vi forsoslashge at afgoslashre ved nogle mere matematiske betragtninger

12 Skaeligbnen Et spil som vist nok kommer fra orienten Det spilles med to terninger Foslashrst slaringr man et slag med de to terninger og summen af deres oslashjental betegnes skaeligbnen

Strategier ved spil 10

Man kan nu slaring lige saring mange gange man vil (max 100) Hvis oslashjentallene ikke er lig skaeligbnen saring adderes dette til ens pointtal men hvis man slaringr sin skaeligbne mister man alt Nedenfor er vist et trin i en animeret computer simulation af spillet Naringr spillet er standset fordeler man indsatsen i forhold til spillernes opnaringede pointtal Det gaeliglder derfor om at have de stoslashrste pointtal Problemet er imidlertid hvornaringr det er optimalt at standse naringr man kender sin skaeligbne

13 Indbrudstyvens pensionsproblem Dette er en variant af mange forskellige optimeringsproblemer Arthur er indbrudstyv Hver tyvetugt giver i snit K kr Chancen for at Arthur bliver snuppet er p Hvis han bliver taget mister han alt fra sine tidligere tyvetugter Hvor mange indbrud skal Arthur lave foslashr han standser sin karriere og vaeliglger at leve af sin opsparing

14 Taeligndstikspillet Dette spil falder lidt uden for rammerne af de oslashvrige spil fordi man ikke kan standse spillet og fordi man aldrig kan miste noget af sin gevinst Det kan derfor ikke umiddelbart behandles paring samme maringde som de hidtil naeligvnte spil Alligevel er det et spil der udpraeligget kan behandles med matematiske teorier for den bedste strategi Spillet garingr ud paring at man paring 10 taeligndstikker farver den ene side roslashd Kastes taeligndstikken op er sandsynligheden for at den farvede side vender opad naringr den lander paring bordet lig med p = 025 Hver spiller har fra starten tallene 110 Hvert tal maring kun bruges 1 gang Man skiftes til at kaste de 10 taeligndstikker og notere antallet af farvede taeligndstikker Dette antal skal saring ganges med et af de resterende tal 110 Den som efter 10 spil har den hoslashjeste sum har vundet Det kan oplyses og let verificeres at den maximale gevinst er 550 Middelgevinsten hvor man vaeliglger tilfaeligldig er 1375 og den optimale middelgevinst er ca 167

Strategier ved spil 11

15 Casino Roulette spil falder ogsaring lidt uden for rammerne af optimale strategier af den meget simple grund at odds er svagt imod eacuten Det gaeliglder dog ikke for Blackjack hvor man kan udvikle en strategi som giver en svag fordel Hvis odds er imod eacuten vil man imidlertid altid tabe i det lange loslashb Som tidligere fastslaringet er den eneste mulighed - i det lange loslashb - for at undgaring ruin i roulettespil at der ikke er nogen oslashvre graelignse for indsatser og at man har flere penge end Casionorsquoet og ingen af disse to betingelser er nogensinde opfyldt Enhver fornuftig matematisk spil-teori vil derfor som resultat have at man skal standse foslashr det foslashrste spil Det vil sige Man skal lade vaeligre med at garing paring Casino Denne kendsgerning udelukker dog ikke at man kan goslashre sig overvejelser over hvordan man kan spille hvis man ikke udelukkende er interesseret i at foraeligre sine penge til et Casino uden kamp

2 Optimale Strategier Hvis man intuitivt skal formulere en strategi for de 3 foslashrste spil naeligvnt ovenfor saring kan man feks vaeliglge eacuten af 3 foslashlgende strategier 1 Man beslutter paring forharingnd hvor stor ens gevinst (eller tab) skal vaeligre foslashr man stopper Dette er

faktisk en meget almindelig strategi men den er bestemt ikke optimal 2 Man fortsaeligtter saring laelignge man i middel har mulighed for at foroslashge sin gevinst i naeligste spil Man

skal huske paring at middelvaeligrdien af gevinsten ogsaring omfatter tab saring middelvaeligrdien (i matematisk forstand) skal vaeligre positiv Denne umiddelbart fornuftige strategi kaldet den kortsigtede eller myope strategi er i mange tilfaeliglde ogsaring den optimale strategi (dog ikke i mandagschancen)

3 Man fortsaeligtter saring laelignge man i middel har mulighed for at foroslashge sin gevinst i et af de

efterfoslashlgende spil Denne strategi kaldes den langsigtede strategi Baringde den kortsigtede og den langsigtede strategi ser yderst rimelige ud og de vil ogsaring vaeligre optimale for langt de fleste spil Hvis der er forskel paring den langsigtede og den kortsigtede strategi skal man anvende den langsigtede - naturligvis Der findes imidlertid visse former for spil hvor ingen af strategierne er optimale Det gaeliglder feks for boslashrsspekulanter der har en beholdning aktier som de vil saeliglge naringr kurserne stiger Dette fortsaeligtter som bekendt aldrig i det uendelige Paring et vist tidspunkt standser stigningen og kurserne begynder at falde ndash som regel ndash hurtigere end de steg Hvornaringr skal man saeliglge for at opnaring den stoslashrste gevinst Det viser sig - men det er saeligrdeles kompliceret at redegoslashre for ndash at naringr det gaeliglder boslashrs spekulation saring er ingen af strategierne 2 og 3 optimale De vil begge to i grove traeligk som resultat have at man enten skal saeliglge straks eller vente til man er ruineret Vi vil nu give en beskrivelse af den optimale strategi som er udviklet af Snell Vi vil overhovedet ikke naeligrme os et bevis for at det er den optimale strategi (beviset er ret teknisk abstrakt) men

Strategier ved spil 12

understrege at det kan bevises I matematisk forstand Ulemperne ved Snell-strategien er at den for selv simple problemer kan foslashre til ret omfattende og komplicerede regninger

2 Den optimale Snell-strategi Snell-strategien er paring sin vis den samme som den kortsigtede strategi men hvor man i denne strategi hele tiden regner sig et skridt frem saring tager Snell-strategien udgangspunkt i spillets slutning og arbejder sig baglaeligns Vi indfoslashrer foslashrst nogle betegnelser Vi antager at spillet har n trin Sk er en stokastisk variabel der angiver den faktiske samlede gevinst man har opnaringet ved det kte spil Sk kan antage en eller flere vaeligrdier med tilhoslashrende sandsynligheder Det nye ved Snell-strategien er at man definerer endnu en stokastisk variabel Gk ved ligningen

Gk = maxSk E(Gk+1| S1Sk) Gk er den stoslashrste af vaeligrdierne Sk (gevinsten efter det kte spil) og E(Gk+1| S1Sk)) som er middelvaeligrdien af den maximale forventede gevinst i det k+1te spil naringr det er givet at man har spillet spillene 1k Dette opstilles i et skema Gn = Sn Gevinsten ved spillets afslutning Gn-1 = maxSn-1 E(Gn| S1Sn-1) Gk = maxSk E(Gk+1| S1Sk) G1 = maxS1 E(G2| S1) Snell strategien siger nu at man skal standse spillet den foslashrste gang Sk (gevinsten efter det kte spil) overstiger middelvaeligrdien af den maksimale forventede gevinst i det k+1te spil Dette kaldes for stopbetingelsen Stopbetingelsen er altsaring

Sk E(Gk+1| S1Sk) Man skal altsaring standse spillet naringr den opnaringede gevinst er stoslashrre eller lig med den betingede forventning af den maximale gevinst i det naeligste spil Det kunne lyde som den kortsigtede strategi men forskellen er den at i den kortsigtede strategi er Gk+1 erstattet af Sk+1 At kunne gennemskue konsekvenserne af dette er derimod ikke saring nemt Det viser sig at i mange tilfaeliglde at er Snell-Strategien identisk med den kortsigtede strategi som kraeligver at man stopper naringr Sk E(Sk+1| S1Sk) Snell strategien er ikke umiddelbart let gennemskuelig og udregningen af de betingede middelvaeligrdier E(Gk+1| S1Sk) er ofte ret teknisk Vi vil nu behandle de foslashr naeligvnte eksempler og begynder med

Strategier ved spil 13

21 Indbrudstyvens pensionsproblem Lad os antage at Arthurs gennemsnitlige gevinst ved hvert tyvetogt er K = 6000 kr og at chancen er at han bliver taget er 5 Lad os antage at hans hidtidige gevinst efter k - tyvetugt er Sk som bliver konfiskeret - og som han derved mister hvis han bliver snuppet I dette tilfaeliglde kan man - som vist nedenfor - se at den kortsigtede strategi er den optimale strategi Det haelignger sammen med at alle trin i spillet er identiske Gevinsten ved hvert tyvetogt er den samme ndash uafhaeligngigt af de foregaringende tyvetugter - bortset fra at den samlede gevinst vokser ved hvert vellykket tyvetogt Xk betegner den stokastiske variabel som er Arthurs gevinst ved eacutet tyvetugt Hermed er

Sk =X1+ X2+ X3+hellip Xk Xk+1 kan antage vaeligrdien K med sandsynlighed 1-ps = 1-P(Snuppet) (altsaring hvis det naeligste tyvetugt lykkes) og vaeligrdien ndashSk (han mister hele sin opsparing) med sandsynlighed ps = P(Snuppet) Vi opskriver nu Snell-strategien (Den kortsigtede strategi) for et trin i hans karriere

Gk = max Sk E(Sk+1| 1k)

Sk er hans gevinst efter k tyvetugter og E(Sk+1| 1k) er hans forventede gevinst efter k+1 tyvetugter E(Sk+1| 1k) kan beregnes som den hidtidige gevinst plus den forventede gevinst ved naeligste tyve- tugt i alt lig med Sk + E(Xk+1) E(Xk+1) er uafhaeligngig af de foslashrste k - tyvetugter derfor bliver stopbetingelsen Sk gt Sk + E(Xk+1) E(Xk+1) lt 0 Middelvaeligrdien E(Xk+1) kan saringledes udregnes efter den saeligdvanlige definition idet Xk+1 antager vaeligrdierne K (gevinsten ved et tyvetugt) og - Sk (mister hele sin opsparing) med sandsynlighederne 1-ps og ps henholdsvis E(Xk+1) = K(1- ps) - Sk ps Han skal standse naringr

E(Xk+1) lt 0 K(1- ps) lt Sk ps som med tal eksemplet giver

6000095 lt Sk005 Sk gt 114000- kr svarende til 114006000 = 095005 = 19 tyvetugter

(Det goslashr han nu nok ikke og er derfor henvist til at leve af folkepensionen efter nogle aringr i skyggen) Man kunne godt tro at dette eksempel kunne anvendes paring andre (ligesaring uetiske) problemstillinger Feks hvor mange gange det er optimalt at koslashre gratis i S-tog Det kan det imidlertid ikke helt

Strategier ved spil 14

Sagen er jo den at man faringr en fast boslashde hvis man bliver snuppet men man kommer ikke til at betale for de gange man har koslashrt gratis Med andre ord vurderingen om hvorvidt det er fordelagtigt at koslashre uden billet afhaelignger kun af middelgevinsten ved det naeligste forsoslashg Hvis den er positiv er det fordelagtigt at fortsaeligtte men hvis den er negativ er det fordelagtigt at loslashse billet (Det er i oslashvrigt uetisk at snyde ndash naturligvis) Tager vi et eksempel billetprisen er kr 50- Boslashden er kr 500 Sandsynligheden for at blive snuppet er Ps = 01 Hvis X er gevinsten ved at koslashre uden billet er E(X) = 50middot(1-Ps)-500middotPs = 50middot09-500middot01 = -50 Det er saringledes (med denne sandsynlighed for at blive snuppet) ikke fordelagtigt at koslashre uden billet i S-tog Da en laeligrebog i sandsynligheder ved spil naturligvis ikke maring tilskynde til uetiske handlinger undlader vi at foretage beregningen med Ps = 005

22 Skaeligbnen Vi betragter kast med to terninger X betegner summen af oslashjentallene ved eacutet kast Sandsynlighedsfordelingen for X er velkendt Feks er P(X=5) = 436 Sandsynligheden for at terningerne viser j oslashjne kan skrives som

36

76)(

jjXP

Lad os antage at spillerens skaeligbne er q Hvis man slaringr dette oslashjental er alt tabt Ellers adderes oslashjentallene for hvert kast Hvis ikke man har slaringet sin skaeligbne saring er den samlede gevinst efter n spil

Sn = X1+ X2+ X3+hellip +Xn

Og middelvaeligrdien af Sn er

E(Sn) = E(X1)+ E(X2)+E(X3)+hellip +E(Xn) = nE(X | X q) E(X | X q) er den betingede middelvaeligrdi af oslashjentallene givet at man ikke slaringr sin skaeligbne

E(X | X q) = 2P(2) +3P(3)+hellip(q-1)P(q-1) + (q+1)P(q+1)+hellip+12P(12) Den kortsigtede strategi (og Snell strategien) fastslaringr at man skal standse naringr middelvaeligrdien af den forventede gevinst ved naeligste kast er negativ Argumentet for dette kan overtages naeligsten ordret fra indbrudstyvens pensionsproblem E(Sk+1|S1 Sk) kan beregnes som den hidtidige gevinst Sk plus den forventede gevinst ved det naeligste kast i alt lig med Sk + E(Xk+1| S1 Sk) Stopbetingelsen er derfor

Sk gt Sk + E(Xk+1| S1 Sk) E(Xk+1| S1 Sk) lt 0

Strategier ved spil 15

E(X | X q) ndash SnP(q) lt 0 Sn gt E(X | X q) P(q) Det er ikke saeligrlig svaeligrt at udregne stopbetingelsen feks for q = 2 og q = 6 Nedenfor er vist udskriften fra et program som foretager beregningen for q = 212 Forventet gevinst i naeligste kast naringr ens skaeligbne er q q 2 3 4 5 6 7 8 9 10 11 12 694 683 667 644 617 583 589 600 617 639 667 Stop naringr din gevinst S gt EX(q)P(q) naringr skaeligbne er q q 2 3 4 5 6 7 8 9 10 11 12 25000 12300 8000 5800 4440 3500 4240 5400 7400 11500 24000

Som det fremgaringr er der endog meget stor forskel paring stoptiderne afhaeligngig af ens skaeligbne

23 Mandagschancen Dette spil er lidt mere interessant fordi det ikke er helt saring enkelt at gennemskue I dette tilfaeliglde kan man ikke forvente at den kortsigtede strategi vil foslashre til den optimale strategi At den faktisk goslashr det skyldes talvaeligrdierne Dette skal forstarings saringledes at hvis man aeligndrede paring praeligmiestoslashrrelserne ville Snell-strategien afvige fra den kortsigtede strategi Vi vil analysere spillet ved Snell-strategien Som naeligvnt har man i spillet 9 tildaeligkkede felter (101025255050100100250) Man kan afdaeligkke hoslashjest 3 felter Man faringr beloslashbet i 1000 kr som det sidste felt viser Hvis X er den stokastiske variabel som angiver vaeligrdien af et felt saring vil de fleste uden saring lange overvejelser vel fortsaeligtte hvis Xlt50 og standse hvis X100 Det kritiske er hvis man afdaeligkker 50 (X=50) Vi bemaeligrker foslashrst at summen af alle felterne er S=620 og at E(X) =6209=689 Vi opskriver foslashrst den fuldstaeligndige Snell-strategi for dette spil G3 =X3 Den Stokastiske variabel G3 = Gevinsten = X3 = vaeligrdien af det sidst afdaeligkkede felt G2 = max X2 E(G3| X1X2 ) Den stoslashrste af vaeligrdierne X2 (= vaeligrdien af det afdaeligkkede

felt) og den betingede middelvaeligrdi af G3 = X3 G1 = max X1 E(G2| X1 ) Som ovenfor Kriteriet for den optimale strategi er som tidligere Stop hvis paring noget trin Xk gt E(Gk+1| X1Xk ) Det er relativ nemt at opstille en formel for E(G3| X1X2 ) Naringr X1 og X2 er afdaeligkket er summen de resterende felter S - X1 - X2 Da alle felter har samme sandsynlighed er middelvaeligrdien simpelthen middeltallet af felterne E(G3| X1X2 ) = ( S - X1 - X2)(9-2)

Strategier ved spil 16

Det er noget mere teknisk at opstille en formel for E(G2| X1 ) og ogsaring lidt teknisk at foretage beregningen Vi vil noslashjes med at skitsere beregningen for en vaeligrdi af X1 og i oslashvrigt henvise til resultatet af et Computerprogram som kan ses nedenfor Lad os antage at X1 = 25 Vi lader nu X2 gennemloslashbe alle de mulige vaeligrdier (alle vaeligrdier skal taeliglles med det antal gange der er felter med denne vaeligrdi) For hver vaeligrdi af X2 (feks 50) skal vi vaeliglge max af X2 og E(G3| X1X2 ) = ( S - X1 - X2) (9-2) (= (620-50-25)7 = 778 i dette tilfaeliglde) og addere det til en sum S2 E(G2| X1 ) er da lig med S2(9-1) (da der er 9-1 felter X2 ) X2[1]= 1000 E(G3)= 8571 G2= 8571 X2[2]= 2500 E(G3)= 8357 G2= 8357 X2[3]= 5000 E(G3)= 8000 G2= 8000 X2[4]= 10000 E(G3)= 7286 G2= 10000 X2[5]= 25000 E(G3)= 5143 G2= 25000 X1[1]= 1000 E(G[2])= 10786 X2[1]= 1000 E(G3)= 8357 G2= 8357 X2[2]= 2500 E(G3)= 8143 G2= 8143 X2[3]= 5000 E(G3)= 7786 G2= 7786 X2[4]= 10000 E(G3)= 7071 G2= 10000 X2[5]= 25000 E(G3)= 4929 G2= 25000 X1[2]= 2500 E(G[2])= 10679 X2[1]= 1000 E(G3)= 8000 G2= 8000 X2[2]= 2500 E(G3)= 7786 G2= 7786 X2[3]= 5000 E(G3)= 7429 G2= 7429 X2[4]= 10000 E(G3)= 6714 G2= 10000 X2[5]= 25000 E(G3)= 4571 G2= 25000 X1[3]= 5000 E(G[2])= 10500 X2[1]= 1000 E(G3)= 7286 G2= 7286 X2[2]= 2500 E(G3)= 7071 G2= 7071 X2[3]= 5000 E(G3)= 6714 G2= 6714 X2[4]= 10000 E(G3)= 6000 G2= 10000 X2[5]= 25000 E(G3)= 3857 G2= 25000 X1[4]= 10000 E(G[2])= 9643 X2[1]= 1000 E(G3)= 5143 G2= 5143 X2[2]= 2500 E(G3)= 4929 G2= 4929 X2[3]= 5000 E(G3)= 4571 G2= 5000 X2[4]= 10000 E(G3)= 3857 G2= 10000 X1[5]= 25000 E(G[2])= 6268 Ser man resultaterne igennem kan de udmoslashntes i en simpel regel Fortsaeligt paring 50 eller derunder Stop paring 100 eller derover Det er maringske lidt overraskende at man ogsaring skal forsaeligtte paring 50000 hvis man kun har et forsoslashg tilbage ndash man kunne jo ende med 10000 og det er saring bare aeligrgerligt ndash og det er vist nok de fleste som standser ved 50000 - men det er ikke den bedste strategi

Strategier ved spil 17

24 Casino Som naeligvnt i indledningen til dette afsnit findes der ingen strategi som kan bringe en i stand til at vinde paring et Casino ndash i det lange loslashb Vil man goslashre Casino-spil til en levevej vil det altid med matematisk sikkerhed ende med ruin Det betyder imidlertid ikke at man ikke kan vinde ved at garing paring Casino men hvis man taelignker paring at spraelignge banken saring skal to krav i hvert fald vaeligre opfyldt for at der skal vaeligre en ikke forsvindende sandsynlighed for at det kan lade sig goslashre 1 Man skal have flere penge end Casino 2 Der maring ikke vaeligre loft over indsatserne Begge betingelser er som bekendt aldrig opfyldt Man kan som sagt godt vinde paring et Casino men hvis man satser paring at vinde mere (alle de gange man er paring Casino i sit liv) end det beloslashb man medbringer ved hvert besoslashg saring vil chancerne for at tabe det hele vaeligre stoslashrst Her er der tale om sandsynligheder og middelvaeligrdier ndash om odds Selvfoslashlgelig er de muligt at tabe hele sin formue ved foslashrste besoslashg eller vinde det tredobbelte ved det andet Der har i tidens loslashb vaeligret lanceret flere eksempler paring vinderstrategier som lyder uhyre besnaeligrende Den mest kendte er Martingale-systemet Man spiller kun paring sort og roslashd hvor faringr man faringr fordoblet sin indsats hvis man vinder Spillet er saringledes helt lige bortset fra at indsatserne bliver liggende naringr zero kommer ud og man kun faringr sin indsats en gang hvis man vinder i naeligste spil (zero har ingen farve) Spiller man efter Martingale-systemet skal man inkassere sin gevinst hvis man vinder Hvis man derimod taber skal man fordoble sin indsats Vi saeligtter grundindsatsen til 1 Har man spillet n gange og dermed doblet op n-1 gange har man lagt en indsats Sn = 1 + 2 + 22 +hellip2n-1 = 2n ndash1 Udregnet af kvotientraeligkkeformlen

1

10

q

qaS

n

n

for raeligkken Sn = a0 + a0q+ a0q

2+hellip+ a0qn-1

Vinder man det nte spil faringr man udbetalt 22

n-1 = 2n saring ens gevinst er 2n - (2n - 1) = 1 Der gaeliglder aringbenbart den simple kendsgerning at bliver man bare ved med at fordoble saring har man altid vundet eacuten indsats Foslashr man forsoslashger sig med dette skal man dog nok goslashre sig klart hvor mange gange man kan tabe foslashr man er ruineret

Strategier ved spil 18

Sandsynligheden for at man taber 5 spil er (frac12)5 = 132 Man har da tabt 25 ndash 1 gange vaeligrdien af en jeton (i Danmark 50 kr) dvs 1550 kr Vil man sikre sig bedre feks ved at kunne doble op 9 gange (sandsynligheden for at tabe 10 spil er 11024) saring skal man komme med kr 51150- men det kan man ikke engang gennemfoslashre da hoslashjeste indsats i Danmark er 24000- Man kunne imidlertid stille det sposlashrgsmaringl Hvis man har n-jetoner hvad er saring sandsynligheden for at vinde q-jetoner hvis man spiller efter Martingale-systemet Dette kan man faktisk godt udregne direkte men regningerne er ret omfattende Derimod er resultatet simpelt Vi vil ikke lave en direkte udregning men anvende de samme metoder som vi har anvendt for den bedste strategi Vi tager udgangspunkt i det faktum at sort roslashd Casino spil er et lige spil saring middelvaeligrdien af gevinsten er 0 ligegyldigt hvordan man spiller Middelvaeligrdien (som er nul ) af en gevinst paring q-jetoner er lig med q gange sandsynligheden P(q) for at vinde q jetoner minus ens kapital (n jetoner) gange med sandsynligheden for at man taber det sidste spil som er 1 ndash P(q)

qP(q) ndash n(1 ndashP(q)) = 0 qn

nqP

)(

Har man feks n = 31 jetoner (1550- kr) er sandsynligheden for at vinde q=10 (500 kr) lig med 0756 En rimelig stor sandsynlighed men altsaring stadig 25 chance for ruin Oslashnsker man derimod at blive rigtig rig og vinde 10000- kr dvs q=200 er P(200) = 0134 Konklusionen er den at satser man paring at vinde mere end man medbringer saring er sandsynligheden mindre end frac12 men kan man noslashjes med mindre saring er sandsynligheden stoslashrre end frac12 Men bemaeligrk dette gaeliglder fra foslashrste gang man garingr ind paring et Casino til man beslutter at holde op

25 Taeligndstikspillet Som beskrevet ovenfor garingr spillet ud paring at farve den ene af siderne roslashd paring 10 taeligndstikker Naringr taeligndstikken kasten op i luften er sandsynligheden for at den roslashde side vender opad naringr den rammer bordet lig med p=025 Man kaster paring skift 10 saringdanne taeligndstikker 10 gange For hvert kast skal man multiplicere antallet af roslashde med et af tallene 110 Hver tal maring kun bruges eacuten gang Den der faringr den stoslashrste sum har vundet Det er klart at en god strategi i det lange loslashb vil give en hoslashjere sum Vi minder om at antallet af X roslashde taeligndstikker er binomialfordelt med primaeligrsandsynlighed p og antalsparameter n=10

102104

3

4

110)(

10

jj

jXPjj

Strategier ved spil 19

Endvidere vil vi anvende de kumulerede sandsynligheder P(X j) og P(X j) Nedenfor er vist resultatet af en Computersimulation af spillet Primaeligr sandsynligheder for n= 10 og p= 0250 P(X=j) j 0 1 2 3 4 5 6 7 8 9 10 00563 01877 02816 02503 01460 00584 00162 00031 00004 00000 00000 Baglaeligns kumulerede sandsynligheder P(Xgt=q) j 0 1 2 3 4 5 6 7 8 9 10 10000 09437 07560 04744 02241 00781 00197 00035 00004 00000 00000 1 kast Antal = 2 Vaeliglg mellem 1 2 3 4 5 6 7 8 910 Faktor= 4 2 kast Antal = 4 Vaeliglg mellem 1 2 3 5 6 7 8 910 Faktor=10 3 kast Antal = 2 Vaeliglg mellem 1 2 3 5 6 7 8 9 Faktor= 5 4 kast Antal = 2 Vaeliglg mellem 1 2 3 6 7 8 9 Faktor= 3 5 kast Antal = 3 Vaeliglg mellem 1 2 6 7 8 9 Faktor= 8 6 kast Antal = 2 Vaeliglg mellem 1 2 6 7 9 Faktor= 6 7 kast Antal = 6 Vaeliglg mellem 1 2 7 9 Faktor=9 8 kast Antal = 3 Vaeliglg mellem 1 2 7 Faktor= 2 9 kast Antal = 2 Vaeliglg mellem 1 7 Faktor= 7 10 kast Antal = 2 Vaeliglg mellem 1 Faktor= 1 Din score er 176 Valget af tallene 110 er i dette tilfaeliglde foretaget ud fra den optimale strategi som vi vil omtale om et oslashjeblik Foslashr vi analyserer den optimale strategi for dette spil vil vi forsoslashge os med en intuitiv bedste strategi Vi belyser denne strategi med et konkret eksempel Lad os feks antage at vi slaringr 4 roslashde i den 3 kast (3 forsoslashg) De tal vi har tilbage kalder vi (y8 y7 y6 y5 y4 y3 y2 y1) Sposlashrgsmaringlet om vi skal gange med det stoslashrste y8 eller det naeligststoslashrste y7 osv Vi raeligsonnerer da som foslashlger Hvis sandsynligheden for at slaring mere end 4 roslashde i de resterende 7 kast er stoslashrre end frac12 saring skal vi vaeliglge det naeligststoslashrste Vi skaeligrper dette Hvis sandsynligheden for at slaring mindst 5 roslashde mindst en gang i de resterende 7 kast er stoslashrre end frac12 saring skal vi vaeliglge det naeligststoslashrste Tilsvarende hvis sandsynligheden for at slaring mindst 5 roslashde mindst 2 gange i de resterende 7 kast skal vi vaeliglge det 3 stoslashrstehellipog saringdan fremdeles Strategien virker umiddelbart meget plausibel Sandsynlighederne kan direkte farings af binomialfordelingen Foslashrst sandsynligheden for at faring mindst q-roslashde i et kast Dette er

P(X q) =

n

qj

jXP )( hvor P(X = j) er angivet ovenfor

Strategier ved spil 20

Sandsynligheden for at dette sker mindst r gange i n - k kast er ogsaring en binomialfordeling og kan skrives

P(X q mindst r gange i n - k kast ) = jknjkn

rj

qXPqXPj

kn

))(1()(

Beregningen af disse (110) sandsynligheder goslashres nok lettest paring en computer For at lave en strategi-tabel goslashr man det at for hvert kast og hvert antal mulige roslashde vaeliglger man foslashrst det stoslashrste af de resterende tal Dernaeligst beregner man sandsynligheden for at faring mindst 1 roslashd mere i et af de foslashlgende kast Hvis denne sandsynlighed er stoslashrre end frac12 ser man paring det naeligststoslashrste af de resterende tal Man beregner saring sandsynligheden for at faring mindst 1 roslashd mere i mindst to af de resterende kast Hvis denne sandsynlighed er stoslashrre end frac12 saring vaeliglger man det tredjestoslashrste af de resterende tal og saringdan fremdeleshellip Det bemaeligrkes at beregningen skal initialiseres med at man altid vaeliglger det mindste hvis man slaringr 0 roslashde og altid vaeliglger det stoslashrste hvis man slaringr 10 roslashde Nedenfor er vist en computerberegning af en strategi-tabel Endvidere er ogsaring lavet en saringkaldt Monte-Carlo simulation Dette betyder at man har ladet maskinen spille feks 10000 spil spillet efter strategi-tabellen Nederst er vist hyppighederne for ens score og endelig fordelingsfunktionen for observationerne (Den kumulerede frekvens) P(X =j) for n =10 and p = 0250 j 0 1 2 3 4 5 6 7 8 9 10 P(X =j)0056 0188 0282 0250 0146 0058 00162 0003 00004 0000 0000 P(Xgt=j) for n =10 and p = 0250 j 0 1 2 3 4 5 6 7 8 9 10 P(Xgt=j) 1000 0944 0756 0474 0224 0078 00197 00035 00004 0000 0000 Strategi tabel Tallene refererer ikke til faktorene selv men til den stoslashrste naeligststoslashrste osv Eksempel Hvis man slaringr 3 roslashde i den andet kast saring skal man vaeliglge (7) den tredjestoslashrste Kast no 1 2 3 4 5 6 7 8 9 10 score 0 1 1 1 1 1 1 1 1 1 1 1 3 3 3 2 2 2 2 1 1 1 2 6 5 5 4 4 3 3 2 2 1 3 8 7 7 6 5 4 3 3 2 1 4 9 9 8 7 6 5 4 3 2 1 5 10 9 8 7 6 5 4 3 2 1 6 10 9 8 7 6 5 4 3 2 1 7 10 9 8 7 6 5 4 3 2 1 8 10 9 8 7 6 5 4 3 2 1 9 10 9 8 7 6 5 4 3 2 1 10 10 9 8 7 6 5 4 3 2 1 Gennemsnitlig score = 16437

Strategier ved spil 21

Hyppighed af score h( 75)= 1 h( 80)= 7 h( 85)= 3 h( 90)= 5 h( 95)= 6 h(100)= 34 h(105)= 38 h(110)= 82 h(115)= 68 h(120)=161 h(125)=146 h(130)=320 h(135)=280 h(140)=534 h(145)=425 h(150)=752 h(155)=577 h(160)=878 h(165)=645 h(170)=956 h(175)=651 h(180)=863 h(185)=527 h(190)=609 h(195)=351 h(200)=389 h(205)=180 h(210)=203 h(215)= 93 h(220)= 86 h(225)= 47 h(230)= 32 h(235)= 21 h(240)= 13 h(245)= 8 h(250)= 3 h(255)= 0 h(260)= 4 h(265)= 1 h(270)= 1 h(275)= 0 h(280)= 0 Frekvens of score F( 80)=00008 F( 85)=00011 F( 90)=00016 F( 95)=00022 F(100)=00056 F(105)=00094 F(110)=00176 F(115)=00244 F(120)=00405 F(125)=00551 F(130)=00871 F(135)=01151 F(140)=01685 F(145)=02110 F(150)=02862 F(155)=03439 F(160)=04317 F(165)=04962 F(170)=05918 F(175)=06569 F(180)=07432 F(185)=07959 F(190)=08568 F(195)=08919 F(200)=09308 F(205)=09488 F(210)=09691 F(215)=09784 F(220)=09870 F(225)=09917 F(230)=09949 F(235)=09970 F(240)=09983 F(245)=09991 F(250)=09994 F(255)=09994 F(260)=09998 F(265)=09999 F(270)=10000 F(275)=10000

Som det fremgaringr af tabellen for P(X gt= j) er der kun 78 chance for at slaring 5 roslashde eller derover saring goslashr man det skal man altid vaeliglge det stoslashrste af de resterende tal For 3 eller 4 roslashde er situationen langt mere uigemmeskuelig og kun en beregning kan afgoslashre sagen Vi proslashver nu at finde den optimale strategi eller Snell-strategien Hvad angaringr sposlashrgsmaringlet om hvorvidt vi skal vaeliglge den stoslashrste eller naeligststoslashrste saring lader det sig faktisk goslashre at beregne Snell-strategien paring en computer De foslashlgende tilfaeliglde bliver derimod for komplicerede og der anvender vi en svagt forbedret version af vores intuitive strategi Forbedringen bestaringr i foslashlgende idet vi illustrerer det med et eksempel Lad os sige vi har slaringet 3 roslashde og vi overvejer om vi vil gange det med 7 eller 6 Ganger vi med 6 er det fordi vi forventer at slaring mindst 4 roslashde mindst en gang i de resterende kast Vores score vil vaeligre 73 og 74 henholdsvis og scoren vil blive forbedret med en faktor 43 hvis vi ganger med 6 under forventning af at slaring 4 roslashde Vores forbedring af strategien garingr da ud paring at vi vaeliglger det naeligststoslashrste 6 hvis sandsynligheden for at slaring 4 roslashde gange den relative forbedring 43 er stoslashrre end frac12 Vi rekapitulerer dernaeligst Snell-strategien G10 = X10 X10 Stokastisk variabel = antallet af roslashde i det 10 kast G9 = max X9 E(G10) E(G10) = E(X10) = np=10025 = 25 X9 = 01hellip10 Gk = max Xk E(Gk+1) E(Gk) kraeligver en laeligngere udregning men den udregnes som en

almindelig middelvaeligrdi altsaring som max af de to vaeligrdier gange P(X=Xk-1) G1 = max X1 E(G2) Som eksempel udregner vi E(G9) Da E(G10)=25 skal vi for X9 = 012 anvende E(G10)=25 i udregningen

Strategier ved spil 22

E(G9) = 25 (P(X=0)+P(X=1)+P(X=2))+ 3P(X=3)+hellip+10P(X=10) =306 Vaeligrdierne for E(Gk) er alle udregnet og vist i computerberegningen nedenfor Bemaeligrk isaeligr at de vokser fra 25 til 425 naringr k aftager fra 10 til 2 Strategien er nu foslashlgende Vaeliglg det stoslashrste af de resterende tal hvis Xk gt E(Gk+1) (altsaring det antal man har slaringet er er stoslashrre end det forventede stoslashrste antal) ellers vaeliglg det naeligststoslashrste Ved afgoslashrelsen om de 3 stoslashrste 4 stoslashrste osv anvender vi den hidtidige strategi med den modifikation at vi multiplicerer sandsynligheden med den formodede relative forbedring E(G10-kast)antal roslashde En computerberegning helt svarende til den foregaringende men med den aeligndrede strategi er vist nedenfor Man bemaeligrker for det foslashrste de smaring aeligndringer der er i strategien Den nye strategi er lidt mindre forsigtig men den giver altsaring ogsaring pote i form af en forbedring af gennemsnittet paring ca 275 Primaeligr sandsynligheder P(X=j) for n= 10 og p= 0250 j 0 1 2 3 4 5 6 7 8 9 10 P(X=j)0056 0188 0282 0250 0146 0058 0016 00031 00004 00000 00000 Baglaeligns Kumulerede sandsynligheder P(Xgt=j) j 0 1 2 3 4 5 6 7 8 9 10 P(Xgt=j) 1000 0944 0756 0474 0224 0078 00197 00035 00004 00000 00000 E(G[10])= 250 E(G[9])= 306 E(G[8])= 337 E(G[7])= 362 E(G[6])= 380 E(G[5])= 395 E(G[4])= 406 E(G[3])= 416 E(G[2])= 425 kast nr 1 2 3 4 5 6 7 8 9 10 score 0 1 1 1 1 1 1 1 1 1 1 1 2 2 1 1 1 1 1 1 1 1 2 5 4 4 3 3 3 2 2 1 1 3 8 7 6 5 5 4 3 2 2 1 4 9 8 7 7 6 5 4 3 2 1 5 10 9 8 7 6 5 4 3 2 1 6 10 9 8 7 6 5 4 3 2 1 7 10 9 8 7 6 5 4 3 2 1 8 10 9 8 7 6 5 4 3 2 1 9 10 9 8 7 6 5 4 3 2 1 10 10 9 8 7 6 5 4 3 2 1 Gennemsnitlig gevinst ms = 16727 Hyppigheder af score h( 75)= 1 h( 80)= 1 h( 85)= 0 h( 90)= 3 h( 95)= 2 h(100)= 5 h(105)= 4 h(110)= 9 h(115)= 12 h(120)= 12 h(125)= 17 h(130)= 22 h(135)= 28 h(140)= 39 h(145)= 24 h(150)= 49 h(155)= 54 h(160)= 74 h(165)= 63 h(170)=117 h(175)= 63 h(180)= 91 h(185)= 57 h(190)= 72 h(195)= 39 h(200)= 36 h(205)= 35 h(210)= 29 h(215)= 14 h(220)= 21 h(225)= 1 h(230)= 5 h(235)= 1 h(240)= 0 h(245)= 0 h(250)= 0 h(255)= 0 h(260)= 0 h(265)= 0 h(270)= 0 h(275)= 0 h(280)= 0

Strategier ved spil 23

Frekvens af score F( 80)=00020 F( 85)=00020 F( 90)=00050 F( 95)=00070 F(100)=00120 F(105)=00160 F(110)=00250 F(115)=00370 F(120)=00490 F(125)=00660 F(130)=00880 F(135)=01160 F(140)=01550 F(145)=01790 F(150)=02280 F(155)=02820 F(160)=03560 F(165)=04190 F(170)=05360 F(175)=05990 F(180)=06900 F(185)=07470 F(190)=08190 F(195)=08580 F(200)=08940 F(205)=09290 F(210)=09580 F(215)=09720 F(220)=09930 F(225)=09940 F(230)=09990 F(235)=10000 F(240)=10000 F(245)=10000 F(250)=10000 F(255)=10000 F(260)=10000 F(265)=10000 F(270)=10000 F(275)=10000

Maringske er det ikke en saeligrlig imponerende forbedring fra den foslashrste strategi men det er en teoretisk milepaeligl at man er i stand til at angive den bedste strategi for bestemte typer af spil Som omtalt har vi ikke forsoslashgt at bevise at Snell-Strategien er den optimale Strategi men det kan bevises Det er vigtigt at notere sig at i alle de omtalte spil har udfaldene vaeligre stokastiske variable dvs uforudsigelige men med bestemte sandsynligheder og at disse sandsynligheder ikke bliver aeligndret af den strategi man foslashlger I mange af de spil hvor man ofte moslashder begrebet strategi feks skak krig finansmarked og markedsfoslashring er dette langt fra tilfaeligldet Hvis feks alle boslashrsspekulanter fulgte den samme optimale strategi med boslashrskursen som stokastisk variabel ville det nok vise sig at det var den daringrligste strategi af alle Teorien for dynamiske strategier hvor de stokastiske variable er funktioner af tiden og af den valgte strategi er teoretisk naeligsten ufremkommelige

Strategier ved spil 24

Indeks Casino516 Computersimulation18 definitionen af sandsynlighed 1 Den optimale Snell-strategi11 forsikringsmatematik 5 Indbrudstyvens pensionsproblem912 kortsigtede strategi 10 kumulerede frekvens 19 langsigtede strategi 10 lotto 1 Mandagschancen14 Mandags-chancen9 Martingale-systemet16

Optimale Strategier 10 Poker 3 rekursionsligning 6 roulette 57 Roulette spil 10 roulettespiller 7 ruinsandsynligheder 5 Skaeligbnen913 Snell-strategien 11 Stopbetingelsen11 strategi9 Taeligndstikspillet1018

Page 11: Sandsynligheder og strategier ved spil - Ole Witt-Hansen ...olewitthansen.dk/Matematik/Sandsynligheder_og_strategier_ved_spil… · 6dqgv\qoljkhghu yhg vslo 3n vdpph pngh ndq yl ilqgh

Strategier ved spil 9

Kap 2 Strategier ved spil

1 Forskellige spil Efter at have udregnet vindersandsynligheder i forbindelse med spil skal vi nu se paring noget andet som ogsaring er knyttet sammen med sandsynlighedsregningen nemlig problemet med at fastlaeliggge den bedste strategi naringr man spiller et spil Her skal spil imidlertid forstarings i en meget videre betydning det vaeligre sig krig boslashrsspekulation jagt eller fiskeri paring en bestemt dyreart Sidstnaeligvnte er dog alt for komplicerede til at kunne behandles elementaeligrt Faeliglles er det dog at man skal kunne beregne sandsynligheden for en bestemt konsekvens af et givet traeligk Vi vil begynde med at give nogle meget simple eksempler paring spil hvor det er meningsfuldt at tale om optimal strategi Vendingen den optimale strategi indebaeligrer at spillet afvikles i et endeligt antal trin og at der for hvert trin i spillet er mulighed for at forbedre sin gevinst og mulighed for at miste sin gevinst helt eller delvis Man skal endvidere have mulighed for at standse spillet ved ethvert trin og inkassere sin gevinst

11 Mandags-chancen I dette spil som har vaeligret lanceret af TV2 har man en raeligkke tildaeligkkede felter med beloslashb (101025255050100100250) x 1000 kr Man har maximalt 3 forsoslashg Man faringr beloslashbet paring det sidst afdaeligkkede felt Nedenfor er vist en computer simulation af spillet efter 2 traeligk Det er nok klart at hvis man afdaeligkker et felt med 10 i 1 eller 2 forsoslashg skal man fortsaeligtte eller hvis man afdaeligkker et felt med 100 eller 250 i 1 eller 2 forsoslashg skal man standse Men hvad hvis man afdaeligkker et felt med 50 i 1 eller 2 forsoslashg Det vil vi forsoslashge at afgoslashre ved nogle mere matematiske betragtninger

12 Skaeligbnen Et spil som vist nok kommer fra orienten Det spilles med to terninger Foslashrst slaringr man et slag med de to terninger og summen af deres oslashjental betegnes skaeligbnen

Strategier ved spil 10

Man kan nu slaring lige saring mange gange man vil (max 100) Hvis oslashjentallene ikke er lig skaeligbnen saring adderes dette til ens pointtal men hvis man slaringr sin skaeligbne mister man alt Nedenfor er vist et trin i en animeret computer simulation af spillet Naringr spillet er standset fordeler man indsatsen i forhold til spillernes opnaringede pointtal Det gaeliglder derfor om at have de stoslashrste pointtal Problemet er imidlertid hvornaringr det er optimalt at standse naringr man kender sin skaeligbne

13 Indbrudstyvens pensionsproblem Dette er en variant af mange forskellige optimeringsproblemer Arthur er indbrudstyv Hver tyvetugt giver i snit K kr Chancen for at Arthur bliver snuppet er p Hvis han bliver taget mister han alt fra sine tidligere tyvetugter Hvor mange indbrud skal Arthur lave foslashr han standser sin karriere og vaeliglger at leve af sin opsparing

14 Taeligndstikspillet Dette spil falder lidt uden for rammerne af de oslashvrige spil fordi man ikke kan standse spillet og fordi man aldrig kan miste noget af sin gevinst Det kan derfor ikke umiddelbart behandles paring samme maringde som de hidtil naeligvnte spil Alligevel er det et spil der udpraeligget kan behandles med matematiske teorier for den bedste strategi Spillet garingr ud paring at man paring 10 taeligndstikker farver den ene side roslashd Kastes taeligndstikken op er sandsynligheden for at den farvede side vender opad naringr den lander paring bordet lig med p = 025 Hver spiller har fra starten tallene 110 Hvert tal maring kun bruges 1 gang Man skiftes til at kaste de 10 taeligndstikker og notere antallet af farvede taeligndstikker Dette antal skal saring ganges med et af de resterende tal 110 Den som efter 10 spil har den hoslashjeste sum har vundet Det kan oplyses og let verificeres at den maximale gevinst er 550 Middelgevinsten hvor man vaeliglger tilfaeligldig er 1375 og den optimale middelgevinst er ca 167

Strategier ved spil 11

15 Casino Roulette spil falder ogsaring lidt uden for rammerne af optimale strategier af den meget simple grund at odds er svagt imod eacuten Det gaeliglder dog ikke for Blackjack hvor man kan udvikle en strategi som giver en svag fordel Hvis odds er imod eacuten vil man imidlertid altid tabe i det lange loslashb Som tidligere fastslaringet er den eneste mulighed - i det lange loslashb - for at undgaring ruin i roulettespil at der ikke er nogen oslashvre graelignse for indsatser og at man har flere penge end Casionorsquoet og ingen af disse to betingelser er nogensinde opfyldt Enhver fornuftig matematisk spil-teori vil derfor som resultat have at man skal standse foslashr det foslashrste spil Det vil sige Man skal lade vaeligre med at garing paring Casino Denne kendsgerning udelukker dog ikke at man kan goslashre sig overvejelser over hvordan man kan spille hvis man ikke udelukkende er interesseret i at foraeligre sine penge til et Casino uden kamp

2 Optimale Strategier Hvis man intuitivt skal formulere en strategi for de 3 foslashrste spil naeligvnt ovenfor saring kan man feks vaeliglge eacuten af 3 foslashlgende strategier 1 Man beslutter paring forharingnd hvor stor ens gevinst (eller tab) skal vaeligre foslashr man stopper Dette er

faktisk en meget almindelig strategi men den er bestemt ikke optimal 2 Man fortsaeligtter saring laelignge man i middel har mulighed for at foroslashge sin gevinst i naeligste spil Man

skal huske paring at middelvaeligrdien af gevinsten ogsaring omfatter tab saring middelvaeligrdien (i matematisk forstand) skal vaeligre positiv Denne umiddelbart fornuftige strategi kaldet den kortsigtede eller myope strategi er i mange tilfaeliglde ogsaring den optimale strategi (dog ikke i mandagschancen)

3 Man fortsaeligtter saring laelignge man i middel har mulighed for at foroslashge sin gevinst i et af de

efterfoslashlgende spil Denne strategi kaldes den langsigtede strategi Baringde den kortsigtede og den langsigtede strategi ser yderst rimelige ud og de vil ogsaring vaeligre optimale for langt de fleste spil Hvis der er forskel paring den langsigtede og den kortsigtede strategi skal man anvende den langsigtede - naturligvis Der findes imidlertid visse former for spil hvor ingen af strategierne er optimale Det gaeliglder feks for boslashrsspekulanter der har en beholdning aktier som de vil saeliglge naringr kurserne stiger Dette fortsaeligtter som bekendt aldrig i det uendelige Paring et vist tidspunkt standser stigningen og kurserne begynder at falde ndash som regel ndash hurtigere end de steg Hvornaringr skal man saeliglge for at opnaring den stoslashrste gevinst Det viser sig - men det er saeligrdeles kompliceret at redegoslashre for ndash at naringr det gaeliglder boslashrs spekulation saring er ingen af strategierne 2 og 3 optimale De vil begge to i grove traeligk som resultat have at man enten skal saeliglge straks eller vente til man er ruineret Vi vil nu give en beskrivelse af den optimale strategi som er udviklet af Snell Vi vil overhovedet ikke naeligrme os et bevis for at det er den optimale strategi (beviset er ret teknisk abstrakt) men

Strategier ved spil 12

understrege at det kan bevises I matematisk forstand Ulemperne ved Snell-strategien er at den for selv simple problemer kan foslashre til ret omfattende og komplicerede regninger

2 Den optimale Snell-strategi Snell-strategien er paring sin vis den samme som den kortsigtede strategi men hvor man i denne strategi hele tiden regner sig et skridt frem saring tager Snell-strategien udgangspunkt i spillets slutning og arbejder sig baglaeligns Vi indfoslashrer foslashrst nogle betegnelser Vi antager at spillet har n trin Sk er en stokastisk variabel der angiver den faktiske samlede gevinst man har opnaringet ved det kte spil Sk kan antage en eller flere vaeligrdier med tilhoslashrende sandsynligheder Det nye ved Snell-strategien er at man definerer endnu en stokastisk variabel Gk ved ligningen

Gk = maxSk E(Gk+1| S1Sk) Gk er den stoslashrste af vaeligrdierne Sk (gevinsten efter det kte spil) og E(Gk+1| S1Sk)) som er middelvaeligrdien af den maximale forventede gevinst i det k+1te spil naringr det er givet at man har spillet spillene 1k Dette opstilles i et skema Gn = Sn Gevinsten ved spillets afslutning Gn-1 = maxSn-1 E(Gn| S1Sn-1) Gk = maxSk E(Gk+1| S1Sk) G1 = maxS1 E(G2| S1) Snell strategien siger nu at man skal standse spillet den foslashrste gang Sk (gevinsten efter det kte spil) overstiger middelvaeligrdien af den maksimale forventede gevinst i det k+1te spil Dette kaldes for stopbetingelsen Stopbetingelsen er altsaring

Sk E(Gk+1| S1Sk) Man skal altsaring standse spillet naringr den opnaringede gevinst er stoslashrre eller lig med den betingede forventning af den maximale gevinst i det naeligste spil Det kunne lyde som den kortsigtede strategi men forskellen er den at i den kortsigtede strategi er Gk+1 erstattet af Sk+1 At kunne gennemskue konsekvenserne af dette er derimod ikke saring nemt Det viser sig at i mange tilfaeliglde at er Snell-Strategien identisk med den kortsigtede strategi som kraeligver at man stopper naringr Sk E(Sk+1| S1Sk) Snell strategien er ikke umiddelbart let gennemskuelig og udregningen af de betingede middelvaeligrdier E(Gk+1| S1Sk) er ofte ret teknisk Vi vil nu behandle de foslashr naeligvnte eksempler og begynder med

Strategier ved spil 13

21 Indbrudstyvens pensionsproblem Lad os antage at Arthurs gennemsnitlige gevinst ved hvert tyvetogt er K = 6000 kr og at chancen er at han bliver taget er 5 Lad os antage at hans hidtidige gevinst efter k - tyvetugt er Sk som bliver konfiskeret - og som han derved mister hvis han bliver snuppet I dette tilfaeliglde kan man - som vist nedenfor - se at den kortsigtede strategi er den optimale strategi Det haelignger sammen med at alle trin i spillet er identiske Gevinsten ved hvert tyvetogt er den samme ndash uafhaeligngigt af de foregaringende tyvetugter - bortset fra at den samlede gevinst vokser ved hvert vellykket tyvetogt Xk betegner den stokastiske variabel som er Arthurs gevinst ved eacutet tyvetugt Hermed er

Sk =X1+ X2+ X3+hellip Xk Xk+1 kan antage vaeligrdien K med sandsynlighed 1-ps = 1-P(Snuppet) (altsaring hvis det naeligste tyvetugt lykkes) og vaeligrdien ndashSk (han mister hele sin opsparing) med sandsynlighed ps = P(Snuppet) Vi opskriver nu Snell-strategien (Den kortsigtede strategi) for et trin i hans karriere

Gk = max Sk E(Sk+1| 1k)

Sk er hans gevinst efter k tyvetugter og E(Sk+1| 1k) er hans forventede gevinst efter k+1 tyvetugter E(Sk+1| 1k) kan beregnes som den hidtidige gevinst plus den forventede gevinst ved naeligste tyve- tugt i alt lig med Sk + E(Xk+1) E(Xk+1) er uafhaeligngig af de foslashrste k - tyvetugter derfor bliver stopbetingelsen Sk gt Sk + E(Xk+1) E(Xk+1) lt 0 Middelvaeligrdien E(Xk+1) kan saringledes udregnes efter den saeligdvanlige definition idet Xk+1 antager vaeligrdierne K (gevinsten ved et tyvetugt) og - Sk (mister hele sin opsparing) med sandsynlighederne 1-ps og ps henholdsvis E(Xk+1) = K(1- ps) - Sk ps Han skal standse naringr

E(Xk+1) lt 0 K(1- ps) lt Sk ps som med tal eksemplet giver

6000095 lt Sk005 Sk gt 114000- kr svarende til 114006000 = 095005 = 19 tyvetugter

(Det goslashr han nu nok ikke og er derfor henvist til at leve af folkepensionen efter nogle aringr i skyggen) Man kunne godt tro at dette eksempel kunne anvendes paring andre (ligesaring uetiske) problemstillinger Feks hvor mange gange det er optimalt at koslashre gratis i S-tog Det kan det imidlertid ikke helt

Strategier ved spil 14

Sagen er jo den at man faringr en fast boslashde hvis man bliver snuppet men man kommer ikke til at betale for de gange man har koslashrt gratis Med andre ord vurderingen om hvorvidt det er fordelagtigt at koslashre uden billet afhaelignger kun af middelgevinsten ved det naeligste forsoslashg Hvis den er positiv er det fordelagtigt at fortsaeligtte men hvis den er negativ er det fordelagtigt at loslashse billet (Det er i oslashvrigt uetisk at snyde ndash naturligvis) Tager vi et eksempel billetprisen er kr 50- Boslashden er kr 500 Sandsynligheden for at blive snuppet er Ps = 01 Hvis X er gevinsten ved at koslashre uden billet er E(X) = 50middot(1-Ps)-500middotPs = 50middot09-500middot01 = -50 Det er saringledes (med denne sandsynlighed for at blive snuppet) ikke fordelagtigt at koslashre uden billet i S-tog Da en laeligrebog i sandsynligheder ved spil naturligvis ikke maring tilskynde til uetiske handlinger undlader vi at foretage beregningen med Ps = 005

22 Skaeligbnen Vi betragter kast med to terninger X betegner summen af oslashjentallene ved eacutet kast Sandsynlighedsfordelingen for X er velkendt Feks er P(X=5) = 436 Sandsynligheden for at terningerne viser j oslashjne kan skrives som

36

76)(

jjXP

Lad os antage at spillerens skaeligbne er q Hvis man slaringr dette oslashjental er alt tabt Ellers adderes oslashjentallene for hvert kast Hvis ikke man har slaringet sin skaeligbne saring er den samlede gevinst efter n spil

Sn = X1+ X2+ X3+hellip +Xn

Og middelvaeligrdien af Sn er

E(Sn) = E(X1)+ E(X2)+E(X3)+hellip +E(Xn) = nE(X | X q) E(X | X q) er den betingede middelvaeligrdi af oslashjentallene givet at man ikke slaringr sin skaeligbne

E(X | X q) = 2P(2) +3P(3)+hellip(q-1)P(q-1) + (q+1)P(q+1)+hellip+12P(12) Den kortsigtede strategi (og Snell strategien) fastslaringr at man skal standse naringr middelvaeligrdien af den forventede gevinst ved naeligste kast er negativ Argumentet for dette kan overtages naeligsten ordret fra indbrudstyvens pensionsproblem E(Sk+1|S1 Sk) kan beregnes som den hidtidige gevinst Sk plus den forventede gevinst ved det naeligste kast i alt lig med Sk + E(Xk+1| S1 Sk) Stopbetingelsen er derfor

Sk gt Sk + E(Xk+1| S1 Sk) E(Xk+1| S1 Sk) lt 0

Strategier ved spil 15

E(X | X q) ndash SnP(q) lt 0 Sn gt E(X | X q) P(q) Det er ikke saeligrlig svaeligrt at udregne stopbetingelsen feks for q = 2 og q = 6 Nedenfor er vist udskriften fra et program som foretager beregningen for q = 212 Forventet gevinst i naeligste kast naringr ens skaeligbne er q q 2 3 4 5 6 7 8 9 10 11 12 694 683 667 644 617 583 589 600 617 639 667 Stop naringr din gevinst S gt EX(q)P(q) naringr skaeligbne er q q 2 3 4 5 6 7 8 9 10 11 12 25000 12300 8000 5800 4440 3500 4240 5400 7400 11500 24000

Som det fremgaringr er der endog meget stor forskel paring stoptiderne afhaeligngig af ens skaeligbne

23 Mandagschancen Dette spil er lidt mere interessant fordi det ikke er helt saring enkelt at gennemskue I dette tilfaeliglde kan man ikke forvente at den kortsigtede strategi vil foslashre til den optimale strategi At den faktisk goslashr det skyldes talvaeligrdierne Dette skal forstarings saringledes at hvis man aeligndrede paring praeligmiestoslashrrelserne ville Snell-strategien afvige fra den kortsigtede strategi Vi vil analysere spillet ved Snell-strategien Som naeligvnt har man i spillet 9 tildaeligkkede felter (101025255050100100250) Man kan afdaeligkke hoslashjest 3 felter Man faringr beloslashbet i 1000 kr som det sidste felt viser Hvis X er den stokastiske variabel som angiver vaeligrdien af et felt saring vil de fleste uden saring lange overvejelser vel fortsaeligtte hvis Xlt50 og standse hvis X100 Det kritiske er hvis man afdaeligkker 50 (X=50) Vi bemaeligrker foslashrst at summen af alle felterne er S=620 og at E(X) =6209=689 Vi opskriver foslashrst den fuldstaeligndige Snell-strategi for dette spil G3 =X3 Den Stokastiske variabel G3 = Gevinsten = X3 = vaeligrdien af det sidst afdaeligkkede felt G2 = max X2 E(G3| X1X2 ) Den stoslashrste af vaeligrdierne X2 (= vaeligrdien af det afdaeligkkede

felt) og den betingede middelvaeligrdi af G3 = X3 G1 = max X1 E(G2| X1 ) Som ovenfor Kriteriet for den optimale strategi er som tidligere Stop hvis paring noget trin Xk gt E(Gk+1| X1Xk ) Det er relativ nemt at opstille en formel for E(G3| X1X2 ) Naringr X1 og X2 er afdaeligkket er summen de resterende felter S - X1 - X2 Da alle felter har samme sandsynlighed er middelvaeligrdien simpelthen middeltallet af felterne E(G3| X1X2 ) = ( S - X1 - X2)(9-2)

Strategier ved spil 16

Det er noget mere teknisk at opstille en formel for E(G2| X1 ) og ogsaring lidt teknisk at foretage beregningen Vi vil noslashjes med at skitsere beregningen for en vaeligrdi af X1 og i oslashvrigt henvise til resultatet af et Computerprogram som kan ses nedenfor Lad os antage at X1 = 25 Vi lader nu X2 gennemloslashbe alle de mulige vaeligrdier (alle vaeligrdier skal taeliglles med det antal gange der er felter med denne vaeligrdi) For hver vaeligrdi af X2 (feks 50) skal vi vaeliglge max af X2 og E(G3| X1X2 ) = ( S - X1 - X2) (9-2) (= (620-50-25)7 = 778 i dette tilfaeliglde) og addere det til en sum S2 E(G2| X1 ) er da lig med S2(9-1) (da der er 9-1 felter X2 ) X2[1]= 1000 E(G3)= 8571 G2= 8571 X2[2]= 2500 E(G3)= 8357 G2= 8357 X2[3]= 5000 E(G3)= 8000 G2= 8000 X2[4]= 10000 E(G3)= 7286 G2= 10000 X2[5]= 25000 E(G3)= 5143 G2= 25000 X1[1]= 1000 E(G[2])= 10786 X2[1]= 1000 E(G3)= 8357 G2= 8357 X2[2]= 2500 E(G3)= 8143 G2= 8143 X2[3]= 5000 E(G3)= 7786 G2= 7786 X2[4]= 10000 E(G3)= 7071 G2= 10000 X2[5]= 25000 E(G3)= 4929 G2= 25000 X1[2]= 2500 E(G[2])= 10679 X2[1]= 1000 E(G3)= 8000 G2= 8000 X2[2]= 2500 E(G3)= 7786 G2= 7786 X2[3]= 5000 E(G3)= 7429 G2= 7429 X2[4]= 10000 E(G3)= 6714 G2= 10000 X2[5]= 25000 E(G3)= 4571 G2= 25000 X1[3]= 5000 E(G[2])= 10500 X2[1]= 1000 E(G3)= 7286 G2= 7286 X2[2]= 2500 E(G3)= 7071 G2= 7071 X2[3]= 5000 E(G3)= 6714 G2= 6714 X2[4]= 10000 E(G3)= 6000 G2= 10000 X2[5]= 25000 E(G3)= 3857 G2= 25000 X1[4]= 10000 E(G[2])= 9643 X2[1]= 1000 E(G3)= 5143 G2= 5143 X2[2]= 2500 E(G3)= 4929 G2= 4929 X2[3]= 5000 E(G3)= 4571 G2= 5000 X2[4]= 10000 E(G3)= 3857 G2= 10000 X1[5]= 25000 E(G[2])= 6268 Ser man resultaterne igennem kan de udmoslashntes i en simpel regel Fortsaeligt paring 50 eller derunder Stop paring 100 eller derover Det er maringske lidt overraskende at man ogsaring skal forsaeligtte paring 50000 hvis man kun har et forsoslashg tilbage ndash man kunne jo ende med 10000 og det er saring bare aeligrgerligt ndash og det er vist nok de fleste som standser ved 50000 - men det er ikke den bedste strategi

Strategier ved spil 17

24 Casino Som naeligvnt i indledningen til dette afsnit findes der ingen strategi som kan bringe en i stand til at vinde paring et Casino ndash i det lange loslashb Vil man goslashre Casino-spil til en levevej vil det altid med matematisk sikkerhed ende med ruin Det betyder imidlertid ikke at man ikke kan vinde ved at garing paring Casino men hvis man taelignker paring at spraelignge banken saring skal to krav i hvert fald vaeligre opfyldt for at der skal vaeligre en ikke forsvindende sandsynlighed for at det kan lade sig goslashre 1 Man skal have flere penge end Casino 2 Der maring ikke vaeligre loft over indsatserne Begge betingelser er som bekendt aldrig opfyldt Man kan som sagt godt vinde paring et Casino men hvis man satser paring at vinde mere (alle de gange man er paring Casino i sit liv) end det beloslashb man medbringer ved hvert besoslashg saring vil chancerne for at tabe det hele vaeligre stoslashrst Her er der tale om sandsynligheder og middelvaeligrdier ndash om odds Selvfoslashlgelig er de muligt at tabe hele sin formue ved foslashrste besoslashg eller vinde det tredobbelte ved det andet Der har i tidens loslashb vaeligret lanceret flere eksempler paring vinderstrategier som lyder uhyre besnaeligrende Den mest kendte er Martingale-systemet Man spiller kun paring sort og roslashd hvor faringr man faringr fordoblet sin indsats hvis man vinder Spillet er saringledes helt lige bortset fra at indsatserne bliver liggende naringr zero kommer ud og man kun faringr sin indsats en gang hvis man vinder i naeligste spil (zero har ingen farve) Spiller man efter Martingale-systemet skal man inkassere sin gevinst hvis man vinder Hvis man derimod taber skal man fordoble sin indsats Vi saeligtter grundindsatsen til 1 Har man spillet n gange og dermed doblet op n-1 gange har man lagt en indsats Sn = 1 + 2 + 22 +hellip2n-1 = 2n ndash1 Udregnet af kvotientraeligkkeformlen

1

10

q

qaS

n

n

for raeligkken Sn = a0 + a0q+ a0q

2+hellip+ a0qn-1

Vinder man det nte spil faringr man udbetalt 22

n-1 = 2n saring ens gevinst er 2n - (2n - 1) = 1 Der gaeliglder aringbenbart den simple kendsgerning at bliver man bare ved med at fordoble saring har man altid vundet eacuten indsats Foslashr man forsoslashger sig med dette skal man dog nok goslashre sig klart hvor mange gange man kan tabe foslashr man er ruineret

Strategier ved spil 18

Sandsynligheden for at man taber 5 spil er (frac12)5 = 132 Man har da tabt 25 ndash 1 gange vaeligrdien af en jeton (i Danmark 50 kr) dvs 1550 kr Vil man sikre sig bedre feks ved at kunne doble op 9 gange (sandsynligheden for at tabe 10 spil er 11024) saring skal man komme med kr 51150- men det kan man ikke engang gennemfoslashre da hoslashjeste indsats i Danmark er 24000- Man kunne imidlertid stille det sposlashrgsmaringl Hvis man har n-jetoner hvad er saring sandsynligheden for at vinde q-jetoner hvis man spiller efter Martingale-systemet Dette kan man faktisk godt udregne direkte men regningerne er ret omfattende Derimod er resultatet simpelt Vi vil ikke lave en direkte udregning men anvende de samme metoder som vi har anvendt for den bedste strategi Vi tager udgangspunkt i det faktum at sort roslashd Casino spil er et lige spil saring middelvaeligrdien af gevinsten er 0 ligegyldigt hvordan man spiller Middelvaeligrdien (som er nul ) af en gevinst paring q-jetoner er lig med q gange sandsynligheden P(q) for at vinde q jetoner minus ens kapital (n jetoner) gange med sandsynligheden for at man taber det sidste spil som er 1 ndash P(q)

qP(q) ndash n(1 ndashP(q)) = 0 qn

nqP

)(

Har man feks n = 31 jetoner (1550- kr) er sandsynligheden for at vinde q=10 (500 kr) lig med 0756 En rimelig stor sandsynlighed men altsaring stadig 25 chance for ruin Oslashnsker man derimod at blive rigtig rig og vinde 10000- kr dvs q=200 er P(200) = 0134 Konklusionen er den at satser man paring at vinde mere end man medbringer saring er sandsynligheden mindre end frac12 men kan man noslashjes med mindre saring er sandsynligheden stoslashrre end frac12 Men bemaeligrk dette gaeliglder fra foslashrste gang man garingr ind paring et Casino til man beslutter at holde op

25 Taeligndstikspillet Som beskrevet ovenfor garingr spillet ud paring at farve den ene af siderne roslashd paring 10 taeligndstikker Naringr taeligndstikken kasten op i luften er sandsynligheden for at den roslashde side vender opad naringr den rammer bordet lig med p=025 Man kaster paring skift 10 saringdanne taeligndstikker 10 gange For hvert kast skal man multiplicere antallet af roslashde med et af tallene 110 Hver tal maring kun bruges eacuten gang Den der faringr den stoslashrste sum har vundet Det er klart at en god strategi i det lange loslashb vil give en hoslashjere sum Vi minder om at antallet af X roslashde taeligndstikker er binomialfordelt med primaeligrsandsynlighed p og antalsparameter n=10

102104

3

4

110)(

10

jj

jXPjj

Strategier ved spil 19

Endvidere vil vi anvende de kumulerede sandsynligheder P(X j) og P(X j) Nedenfor er vist resultatet af en Computersimulation af spillet Primaeligr sandsynligheder for n= 10 og p= 0250 P(X=j) j 0 1 2 3 4 5 6 7 8 9 10 00563 01877 02816 02503 01460 00584 00162 00031 00004 00000 00000 Baglaeligns kumulerede sandsynligheder P(Xgt=q) j 0 1 2 3 4 5 6 7 8 9 10 10000 09437 07560 04744 02241 00781 00197 00035 00004 00000 00000 1 kast Antal = 2 Vaeliglg mellem 1 2 3 4 5 6 7 8 910 Faktor= 4 2 kast Antal = 4 Vaeliglg mellem 1 2 3 5 6 7 8 910 Faktor=10 3 kast Antal = 2 Vaeliglg mellem 1 2 3 5 6 7 8 9 Faktor= 5 4 kast Antal = 2 Vaeliglg mellem 1 2 3 6 7 8 9 Faktor= 3 5 kast Antal = 3 Vaeliglg mellem 1 2 6 7 8 9 Faktor= 8 6 kast Antal = 2 Vaeliglg mellem 1 2 6 7 9 Faktor= 6 7 kast Antal = 6 Vaeliglg mellem 1 2 7 9 Faktor=9 8 kast Antal = 3 Vaeliglg mellem 1 2 7 Faktor= 2 9 kast Antal = 2 Vaeliglg mellem 1 7 Faktor= 7 10 kast Antal = 2 Vaeliglg mellem 1 Faktor= 1 Din score er 176 Valget af tallene 110 er i dette tilfaeliglde foretaget ud fra den optimale strategi som vi vil omtale om et oslashjeblik Foslashr vi analyserer den optimale strategi for dette spil vil vi forsoslashge os med en intuitiv bedste strategi Vi belyser denne strategi med et konkret eksempel Lad os feks antage at vi slaringr 4 roslashde i den 3 kast (3 forsoslashg) De tal vi har tilbage kalder vi (y8 y7 y6 y5 y4 y3 y2 y1) Sposlashrgsmaringlet om vi skal gange med det stoslashrste y8 eller det naeligststoslashrste y7 osv Vi raeligsonnerer da som foslashlger Hvis sandsynligheden for at slaring mere end 4 roslashde i de resterende 7 kast er stoslashrre end frac12 saring skal vi vaeliglge det naeligststoslashrste Vi skaeligrper dette Hvis sandsynligheden for at slaring mindst 5 roslashde mindst en gang i de resterende 7 kast er stoslashrre end frac12 saring skal vi vaeliglge det naeligststoslashrste Tilsvarende hvis sandsynligheden for at slaring mindst 5 roslashde mindst 2 gange i de resterende 7 kast skal vi vaeliglge det 3 stoslashrstehellipog saringdan fremdeles Strategien virker umiddelbart meget plausibel Sandsynlighederne kan direkte farings af binomialfordelingen Foslashrst sandsynligheden for at faring mindst q-roslashde i et kast Dette er

P(X q) =

n

qj

jXP )( hvor P(X = j) er angivet ovenfor

Strategier ved spil 20

Sandsynligheden for at dette sker mindst r gange i n - k kast er ogsaring en binomialfordeling og kan skrives

P(X q mindst r gange i n - k kast ) = jknjkn

rj

qXPqXPj

kn

))(1()(

Beregningen af disse (110) sandsynligheder goslashres nok lettest paring en computer For at lave en strategi-tabel goslashr man det at for hvert kast og hvert antal mulige roslashde vaeliglger man foslashrst det stoslashrste af de resterende tal Dernaeligst beregner man sandsynligheden for at faring mindst 1 roslashd mere i et af de foslashlgende kast Hvis denne sandsynlighed er stoslashrre end frac12 ser man paring det naeligststoslashrste af de resterende tal Man beregner saring sandsynligheden for at faring mindst 1 roslashd mere i mindst to af de resterende kast Hvis denne sandsynlighed er stoslashrre end frac12 saring vaeliglger man det tredjestoslashrste af de resterende tal og saringdan fremdeleshellip Det bemaeligrkes at beregningen skal initialiseres med at man altid vaeliglger det mindste hvis man slaringr 0 roslashde og altid vaeliglger det stoslashrste hvis man slaringr 10 roslashde Nedenfor er vist en computerberegning af en strategi-tabel Endvidere er ogsaring lavet en saringkaldt Monte-Carlo simulation Dette betyder at man har ladet maskinen spille feks 10000 spil spillet efter strategi-tabellen Nederst er vist hyppighederne for ens score og endelig fordelingsfunktionen for observationerne (Den kumulerede frekvens) P(X =j) for n =10 and p = 0250 j 0 1 2 3 4 5 6 7 8 9 10 P(X =j)0056 0188 0282 0250 0146 0058 00162 0003 00004 0000 0000 P(Xgt=j) for n =10 and p = 0250 j 0 1 2 3 4 5 6 7 8 9 10 P(Xgt=j) 1000 0944 0756 0474 0224 0078 00197 00035 00004 0000 0000 Strategi tabel Tallene refererer ikke til faktorene selv men til den stoslashrste naeligststoslashrste osv Eksempel Hvis man slaringr 3 roslashde i den andet kast saring skal man vaeliglge (7) den tredjestoslashrste Kast no 1 2 3 4 5 6 7 8 9 10 score 0 1 1 1 1 1 1 1 1 1 1 1 3 3 3 2 2 2 2 1 1 1 2 6 5 5 4 4 3 3 2 2 1 3 8 7 7 6 5 4 3 3 2 1 4 9 9 8 7 6 5 4 3 2 1 5 10 9 8 7 6 5 4 3 2 1 6 10 9 8 7 6 5 4 3 2 1 7 10 9 8 7 6 5 4 3 2 1 8 10 9 8 7 6 5 4 3 2 1 9 10 9 8 7 6 5 4 3 2 1 10 10 9 8 7 6 5 4 3 2 1 Gennemsnitlig score = 16437

Strategier ved spil 21

Hyppighed af score h( 75)= 1 h( 80)= 7 h( 85)= 3 h( 90)= 5 h( 95)= 6 h(100)= 34 h(105)= 38 h(110)= 82 h(115)= 68 h(120)=161 h(125)=146 h(130)=320 h(135)=280 h(140)=534 h(145)=425 h(150)=752 h(155)=577 h(160)=878 h(165)=645 h(170)=956 h(175)=651 h(180)=863 h(185)=527 h(190)=609 h(195)=351 h(200)=389 h(205)=180 h(210)=203 h(215)= 93 h(220)= 86 h(225)= 47 h(230)= 32 h(235)= 21 h(240)= 13 h(245)= 8 h(250)= 3 h(255)= 0 h(260)= 4 h(265)= 1 h(270)= 1 h(275)= 0 h(280)= 0 Frekvens of score F( 80)=00008 F( 85)=00011 F( 90)=00016 F( 95)=00022 F(100)=00056 F(105)=00094 F(110)=00176 F(115)=00244 F(120)=00405 F(125)=00551 F(130)=00871 F(135)=01151 F(140)=01685 F(145)=02110 F(150)=02862 F(155)=03439 F(160)=04317 F(165)=04962 F(170)=05918 F(175)=06569 F(180)=07432 F(185)=07959 F(190)=08568 F(195)=08919 F(200)=09308 F(205)=09488 F(210)=09691 F(215)=09784 F(220)=09870 F(225)=09917 F(230)=09949 F(235)=09970 F(240)=09983 F(245)=09991 F(250)=09994 F(255)=09994 F(260)=09998 F(265)=09999 F(270)=10000 F(275)=10000

Som det fremgaringr af tabellen for P(X gt= j) er der kun 78 chance for at slaring 5 roslashde eller derover saring goslashr man det skal man altid vaeliglge det stoslashrste af de resterende tal For 3 eller 4 roslashde er situationen langt mere uigemmeskuelig og kun en beregning kan afgoslashre sagen Vi proslashver nu at finde den optimale strategi eller Snell-strategien Hvad angaringr sposlashrgsmaringlet om hvorvidt vi skal vaeliglge den stoslashrste eller naeligststoslashrste saring lader det sig faktisk goslashre at beregne Snell-strategien paring en computer De foslashlgende tilfaeliglde bliver derimod for komplicerede og der anvender vi en svagt forbedret version af vores intuitive strategi Forbedringen bestaringr i foslashlgende idet vi illustrerer det med et eksempel Lad os sige vi har slaringet 3 roslashde og vi overvejer om vi vil gange det med 7 eller 6 Ganger vi med 6 er det fordi vi forventer at slaring mindst 4 roslashde mindst en gang i de resterende kast Vores score vil vaeligre 73 og 74 henholdsvis og scoren vil blive forbedret med en faktor 43 hvis vi ganger med 6 under forventning af at slaring 4 roslashde Vores forbedring af strategien garingr da ud paring at vi vaeliglger det naeligststoslashrste 6 hvis sandsynligheden for at slaring 4 roslashde gange den relative forbedring 43 er stoslashrre end frac12 Vi rekapitulerer dernaeligst Snell-strategien G10 = X10 X10 Stokastisk variabel = antallet af roslashde i det 10 kast G9 = max X9 E(G10) E(G10) = E(X10) = np=10025 = 25 X9 = 01hellip10 Gk = max Xk E(Gk+1) E(Gk) kraeligver en laeligngere udregning men den udregnes som en

almindelig middelvaeligrdi altsaring som max af de to vaeligrdier gange P(X=Xk-1) G1 = max X1 E(G2) Som eksempel udregner vi E(G9) Da E(G10)=25 skal vi for X9 = 012 anvende E(G10)=25 i udregningen

Strategier ved spil 22

E(G9) = 25 (P(X=0)+P(X=1)+P(X=2))+ 3P(X=3)+hellip+10P(X=10) =306 Vaeligrdierne for E(Gk) er alle udregnet og vist i computerberegningen nedenfor Bemaeligrk isaeligr at de vokser fra 25 til 425 naringr k aftager fra 10 til 2 Strategien er nu foslashlgende Vaeliglg det stoslashrste af de resterende tal hvis Xk gt E(Gk+1) (altsaring det antal man har slaringet er er stoslashrre end det forventede stoslashrste antal) ellers vaeliglg det naeligststoslashrste Ved afgoslashrelsen om de 3 stoslashrste 4 stoslashrste osv anvender vi den hidtidige strategi med den modifikation at vi multiplicerer sandsynligheden med den formodede relative forbedring E(G10-kast)antal roslashde En computerberegning helt svarende til den foregaringende men med den aeligndrede strategi er vist nedenfor Man bemaeligrker for det foslashrste de smaring aeligndringer der er i strategien Den nye strategi er lidt mindre forsigtig men den giver altsaring ogsaring pote i form af en forbedring af gennemsnittet paring ca 275 Primaeligr sandsynligheder P(X=j) for n= 10 og p= 0250 j 0 1 2 3 4 5 6 7 8 9 10 P(X=j)0056 0188 0282 0250 0146 0058 0016 00031 00004 00000 00000 Baglaeligns Kumulerede sandsynligheder P(Xgt=j) j 0 1 2 3 4 5 6 7 8 9 10 P(Xgt=j) 1000 0944 0756 0474 0224 0078 00197 00035 00004 00000 00000 E(G[10])= 250 E(G[9])= 306 E(G[8])= 337 E(G[7])= 362 E(G[6])= 380 E(G[5])= 395 E(G[4])= 406 E(G[3])= 416 E(G[2])= 425 kast nr 1 2 3 4 5 6 7 8 9 10 score 0 1 1 1 1 1 1 1 1 1 1 1 2 2 1 1 1 1 1 1 1 1 2 5 4 4 3 3 3 2 2 1 1 3 8 7 6 5 5 4 3 2 2 1 4 9 8 7 7 6 5 4 3 2 1 5 10 9 8 7 6 5 4 3 2 1 6 10 9 8 7 6 5 4 3 2 1 7 10 9 8 7 6 5 4 3 2 1 8 10 9 8 7 6 5 4 3 2 1 9 10 9 8 7 6 5 4 3 2 1 10 10 9 8 7 6 5 4 3 2 1 Gennemsnitlig gevinst ms = 16727 Hyppigheder af score h( 75)= 1 h( 80)= 1 h( 85)= 0 h( 90)= 3 h( 95)= 2 h(100)= 5 h(105)= 4 h(110)= 9 h(115)= 12 h(120)= 12 h(125)= 17 h(130)= 22 h(135)= 28 h(140)= 39 h(145)= 24 h(150)= 49 h(155)= 54 h(160)= 74 h(165)= 63 h(170)=117 h(175)= 63 h(180)= 91 h(185)= 57 h(190)= 72 h(195)= 39 h(200)= 36 h(205)= 35 h(210)= 29 h(215)= 14 h(220)= 21 h(225)= 1 h(230)= 5 h(235)= 1 h(240)= 0 h(245)= 0 h(250)= 0 h(255)= 0 h(260)= 0 h(265)= 0 h(270)= 0 h(275)= 0 h(280)= 0

Strategier ved spil 23

Frekvens af score F( 80)=00020 F( 85)=00020 F( 90)=00050 F( 95)=00070 F(100)=00120 F(105)=00160 F(110)=00250 F(115)=00370 F(120)=00490 F(125)=00660 F(130)=00880 F(135)=01160 F(140)=01550 F(145)=01790 F(150)=02280 F(155)=02820 F(160)=03560 F(165)=04190 F(170)=05360 F(175)=05990 F(180)=06900 F(185)=07470 F(190)=08190 F(195)=08580 F(200)=08940 F(205)=09290 F(210)=09580 F(215)=09720 F(220)=09930 F(225)=09940 F(230)=09990 F(235)=10000 F(240)=10000 F(245)=10000 F(250)=10000 F(255)=10000 F(260)=10000 F(265)=10000 F(270)=10000 F(275)=10000

Maringske er det ikke en saeligrlig imponerende forbedring fra den foslashrste strategi men det er en teoretisk milepaeligl at man er i stand til at angive den bedste strategi for bestemte typer af spil Som omtalt har vi ikke forsoslashgt at bevise at Snell-Strategien er den optimale Strategi men det kan bevises Det er vigtigt at notere sig at i alle de omtalte spil har udfaldene vaeligre stokastiske variable dvs uforudsigelige men med bestemte sandsynligheder og at disse sandsynligheder ikke bliver aeligndret af den strategi man foslashlger I mange af de spil hvor man ofte moslashder begrebet strategi feks skak krig finansmarked og markedsfoslashring er dette langt fra tilfaeligldet Hvis feks alle boslashrsspekulanter fulgte den samme optimale strategi med boslashrskursen som stokastisk variabel ville det nok vise sig at det var den daringrligste strategi af alle Teorien for dynamiske strategier hvor de stokastiske variable er funktioner af tiden og af den valgte strategi er teoretisk naeligsten ufremkommelige

Strategier ved spil 24

Indeks Casino516 Computersimulation18 definitionen af sandsynlighed 1 Den optimale Snell-strategi11 forsikringsmatematik 5 Indbrudstyvens pensionsproblem912 kortsigtede strategi 10 kumulerede frekvens 19 langsigtede strategi 10 lotto 1 Mandagschancen14 Mandags-chancen9 Martingale-systemet16

Optimale Strategier 10 Poker 3 rekursionsligning 6 roulette 57 Roulette spil 10 roulettespiller 7 ruinsandsynligheder 5 Skaeligbnen913 Snell-strategien 11 Stopbetingelsen11 strategi9 Taeligndstikspillet1018

Page 12: Sandsynligheder og strategier ved spil - Ole Witt-Hansen ...olewitthansen.dk/Matematik/Sandsynligheder_og_strategier_ved_spil… · 6dqgv\qoljkhghu yhg vslo 3n vdpph pngh ndq yl ilqgh

Strategier ved spil 10

Man kan nu slaring lige saring mange gange man vil (max 100) Hvis oslashjentallene ikke er lig skaeligbnen saring adderes dette til ens pointtal men hvis man slaringr sin skaeligbne mister man alt Nedenfor er vist et trin i en animeret computer simulation af spillet Naringr spillet er standset fordeler man indsatsen i forhold til spillernes opnaringede pointtal Det gaeliglder derfor om at have de stoslashrste pointtal Problemet er imidlertid hvornaringr det er optimalt at standse naringr man kender sin skaeligbne

13 Indbrudstyvens pensionsproblem Dette er en variant af mange forskellige optimeringsproblemer Arthur er indbrudstyv Hver tyvetugt giver i snit K kr Chancen for at Arthur bliver snuppet er p Hvis han bliver taget mister han alt fra sine tidligere tyvetugter Hvor mange indbrud skal Arthur lave foslashr han standser sin karriere og vaeliglger at leve af sin opsparing

14 Taeligndstikspillet Dette spil falder lidt uden for rammerne af de oslashvrige spil fordi man ikke kan standse spillet og fordi man aldrig kan miste noget af sin gevinst Det kan derfor ikke umiddelbart behandles paring samme maringde som de hidtil naeligvnte spil Alligevel er det et spil der udpraeligget kan behandles med matematiske teorier for den bedste strategi Spillet garingr ud paring at man paring 10 taeligndstikker farver den ene side roslashd Kastes taeligndstikken op er sandsynligheden for at den farvede side vender opad naringr den lander paring bordet lig med p = 025 Hver spiller har fra starten tallene 110 Hvert tal maring kun bruges 1 gang Man skiftes til at kaste de 10 taeligndstikker og notere antallet af farvede taeligndstikker Dette antal skal saring ganges med et af de resterende tal 110 Den som efter 10 spil har den hoslashjeste sum har vundet Det kan oplyses og let verificeres at den maximale gevinst er 550 Middelgevinsten hvor man vaeliglger tilfaeligldig er 1375 og den optimale middelgevinst er ca 167

Strategier ved spil 11

15 Casino Roulette spil falder ogsaring lidt uden for rammerne af optimale strategier af den meget simple grund at odds er svagt imod eacuten Det gaeliglder dog ikke for Blackjack hvor man kan udvikle en strategi som giver en svag fordel Hvis odds er imod eacuten vil man imidlertid altid tabe i det lange loslashb Som tidligere fastslaringet er den eneste mulighed - i det lange loslashb - for at undgaring ruin i roulettespil at der ikke er nogen oslashvre graelignse for indsatser og at man har flere penge end Casionorsquoet og ingen af disse to betingelser er nogensinde opfyldt Enhver fornuftig matematisk spil-teori vil derfor som resultat have at man skal standse foslashr det foslashrste spil Det vil sige Man skal lade vaeligre med at garing paring Casino Denne kendsgerning udelukker dog ikke at man kan goslashre sig overvejelser over hvordan man kan spille hvis man ikke udelukkende er interesseret i at foraeligre sine penge til et Casino uden kamp

2 Optimale Strategier Hvis man intuitivt skal formulere en strategi for de 3 foslashrste spil naeligvnt ovenfor saring kan man feks vaeliglge eacuten af 3 foslashlgende strategier 1 Man beslutter paring forharingnd hvor stor ens gevinst (eller tab) skal vaeligre foslashr man stopper Dette er

faktisk en meget almindelig strategi men den er bestemt ikke optimal 2 Man fortsaeligtter saring laelignge man i middel har mulighed for at foroslashge sin gevinst i naeligste spil Man

skal huske paring at middelvaeligrdien af gevinsten ogsaring omfatter tab saring middelvaeligrdien (i matematisk forstand) skal vaeligre positiv Denne umiddelbart fornuftige strategi kaldet den kortsigtede eller myope strategi er i mange tilfaeliglde ogsaring den optimale strategi (dog ikke i mandagschancen)

3 Man fortsaeligtter saring laelignge man i middel har mulighed for at foroslashge sin gevinst i et af de

efterfoslashlgende spil Denne strategi kaldes den langsigtede strategi Baringde den kortsigtede og den langsigtede strategi ser yderst rimelige ud og de vil ogsaring vaeligre optimale for langt de fleste spil Hvis der er forskel paring den langsigtede og den kortsigtede strategi skal man anvende den langsigtede - naturligvis Der findes imidlertid visse former for spil hvor ingen af strategierne er optimale Det gaeliglder feks for boslashrsspekulanter der har en beholdning aktier som de vil saeliglge naringr kurserne stiger Dette fortsaeligtter som bekendt aldrig i det uendelige Paring et vist tidspunkt standser stigningen og kurserne begynder at falde ndash som regel ndash hurtigere end de steg Hvornaringr skal man saeliglge for at opnaring den stoslashrste gevinst Det viser sig - men det er saeligrdeles kompliceret at redegoslashre for ndash at naringr det gaeliglder boslashrs spekulation saring er ingen af strategierne 2 og 3 optimale De vil begge to i grove traeligk som resultat have at man enten skal saeliglge straks eller vente til man er ruineret Vi vil nu give en beskrivelse af den optimale strategi som er udviklet af Snell Vi vil overhovedet ikke naeligrme os et bevis for at det er den optimale strategi (beviset er ret teknisk abstrakt) men

Strategier ved spil 12

understrege at det kan bevises I matematisk forstand Ulemperne ved Snell-strategien er at den for selv simple problemer kan foslashre til ret omfattende og komplicerede regninger

2 Den optimale Snell-strategi Snell-strategien er paring sin vis den samme som den kortsigtede strategi men hvor man i denne strategi hele tiden regner sig et skridt frem saring tager Snell-strategien udgangspunkt i spillets slutning og arbejder sig baglaeligns Vi indfoslashrer foslashrst nogle betegnelser Vi antager at spillet har n trin Sk er en stokastisk variabel der angiver den faktiske samlede gevinst man har opnaringet ved det kte spil Sk kan antage en eller flere vaeligrdier med tilhoslashrende sandsynligheder Det nye ved Snell-strategien er at man definerer endnu en stokastisk variabel Gk ved ligningen

Gk = maxSk E(Gk+1| S1Sk) Gk er den stoslashrste af vaeligrdierne Sk (gevinsten efter det kte spil) og E(Gk+1| S1Sk)) som er middelvaeligrdien af den maximale forventede gevinst i det k+1te spil naringr det er givet at man har spillet spillene 1k Dette opstilles i et skema Gn = Sn Gevinsten ved spillets afslutning Gn-1 = maxSn-1 E(Gn| S1Sn-1) Gk = maxSk E(Gk+1| S1Sk) G1 = maxS1 E(G2| S1) Snell strategien siger nu at man skal standse spillet den foslashrste gang Sk (gevinsten efter det kte spil) overstiger middelvaeligrdien af den maksimale forventede gevinst i det k+1te spil Dette kaldes for stopbetingelsen Stopbetingelsen er altsaring

Sk E(Gk+1| S1Sk) Man skal altsaring standse spillet naringr den opnaringede gevinst er stoslashrre eller lig med den betingede forventning af den maximale gevinst i det naeligste spil Det kunne lyde som den kortsigtede strategi men forskellen er den at i den kortsigtede strategi er Gk+1 erstattet af Sk+1 At kunne gennemskue konsekvenserne af dette er derimod ikke saring nemt Det viser sig at i mange tilfaeliglde at er Snell-Strategien identisk med den kortsigtede strategi som kraeligver at man stopper naringr Sk E(Sk+1| S1Sk) Snell strategien er ikke umiddelbart let gennemskuelig og udregningen af de betingede middelvaeligrdier E(Gk+1| S1Sk) er ofte ret teknisk Vi vil nu behandle de foslashr naeligvnte eksempler og begynder med

Strategier ved spil 13

21 Indbrudstyvens pensionsproblem Lad os antage at Arthurs gennemsnitlige gevinst ved hvert tyvetogt er K = 6000 kr og at chancen er at han bliver taget er 5 Lad os antage at hans hidtidige gevinst efter k - tyvetugt er Sk som bliver konfiskeret - og som han derved mister hvis han bliver snuppet I dette tilfaeliglde kan man - som vist nedenfor - se at den kortsigtede strategi er den optimale strategi Det haelignger sammen med at alle trin i spillet er identiske Gevinsten ved hvert tyvetogt er den samme ndash uafhaeligngigt af de foregaringende tyvetugter - bortset fra at den samlede gevinst vokser ved hvert vellykket tyvetogt Xk betegner den stokastiske variabel som er Arthurs gevinst ved eacutet tyvetugt Hermed er

Sk =X1+ X2+ X3+hellip Xk Xk+1 kan antage vaeligrdien K med sandsynlighed 1-ps = 1-P(Snuppet) (altsaring hvis det naeligste tyvetugt lykkes) og vaeligrdien ndashSk (han mister hele sin opsparing) med sandsynlighed ps = P(Snuppet) Vi opskriver nu Snell-strategien (Den kortsigtede strategi) for et trin i hans karriere

Gk = max Sk E(Sk+1| 1k)

Sk er hans gevinst efter k tyvetugter og E(Sk+1| 1k) er hans forventede gevinst efter k+1 tyvetugter E(Sk+1| 1k) kan beregnes som den hidtidige gevinst plus den forventede gevinst ved naeligste tyve- tugt i alt lig med Sk + E(Xk+1) E(Xk+1) er uafhaeligngig af de foslashrste k - tyvetugter derfor bliver stopbetingelsen Sk gt Sk + E(Xk+1) E(Xk+1) lt 0 Middelvaeligrdien E(Xk+1) kan saringledes udregnes efter den saeligdvanlige definition idet Xk+1 antager vaeligrdierne K (gevinsten ved et tyvetugt) og - Sk (mister hele sin opsparing) med sandsynlighederne 1-ps og ps henholdsvis E(Xk+1) = K(1- ps) - Sk ps Han skal standse naringr

E(Xk+1) lt 0 K(1- ps) lt Sk ps som med tal eksemplet giver

6000095 lt Sk005 Sk gt 114000- kr svarende til 114006000 = 095005 = 19 tyvetugter

(Det goslashr han nu nok ikke og er derfor henvist til at leve af folkepensionen efter nogle aringr i skyggen) Man kunne godt tro at dette eksempel kunne anvendes paring andre (ligesaring uetiske) problemstillinger Feks hvor mange gange det er optimalt at koslashre gratis i S-tog Det kan det imidlertid ikke helt

Strategier ved spil 14

Sagen er jo den at man faringr en fast boslashde hvis man bliver snuppet men man kommer ikke til at betale for de gange man har koslashrt gratis Med andre ord vurderingen om hvorvidt det er fordelagtigt at koslashre uden billet afhaelignger kun af middelgevinsten ved det naeligste forsoslashg Hvis den er positiv er det fordelagtigt at fortsaeligtte men hvis den er negativ er det fordelagtigt at loslashse billet (Det er i oslashvrigt uetisk at snyde ndash naturligvis) Tager vi et eksempel billetprisen er kr 50- Boslashden er kr 500 Sandsynligheden for at blive snuppet er Ps = 01 Hvis X er gevinsten ved at koslashre uden billet er E(X) = 50middot(1-Ps)-500middotPs = 50middot09-500middot01 = -50 Det er saringledes (med denne sandsynlighed for at blive snuppet) ikke fordelagtigt at koslashre uden billet i S-tog Da en laeligrebog i sandsynligheder ved spil naturligvis ikke maring tilskynde til uetiske handlinger undlader vi at foretage beregningen med Ps = 005

22 Skaeligbnen Vi betragter kast med to terninger X betegner summen af oslashjentallene ved eacutet kast Sandsynlighedsfordelingen for X er velkendt Feks er P(X=5) = 436 Sandsynligheden for at terningerne viser j oslashjne kan skrives som

36

76)(

jjXP

Lad os antage at spillerens skaeligbne er q Hvis man slaringr dette oslashjental er alt tabt Ellers adderes oslashjentallene for hvert kast Hvis ikke man har slaringet sin skaeligbne saring er den samlede gevinst efter n spil

Sn = X1+ X2+ X3+hellip +Xn

Og middelvaeligrdien af Sn er

E(Sn) = E(X1)+ E(X2)+E(X3)+hellip +E(Xn) = nE(X | X q) E(X | X q) er den betingede middelvaeligrdi af oslashjentallene givet at man ikke slaringr sin skaeligbne

E(X | X q) = 2P(2) +3P(3)+hellip(q-1)P(q-1) + (q+1)P(q+1)+hellip+12P(12) Den kortsigtede strategi (og Snell strategien) fastslaringr at man skal standse naringr middelvaeligrdien af den forventede gevinst ved naeligste kast er negativ Argumentet for dette kan overtages naeligsten ordret fra indbrudstyvens pensionsproblem E(Sk+1|S1 Sk) kan beregnes som den hidtidige gevinst Sk plus den forventede gevinst ved det naeligste kast i alt lig med Sk + E(Xk+1| S1 Sk) Stopbetingelsen er derfor

Sk gt Sk + E(Xk+1| S1 Sk) E(Xk+1| S1 Sk) lt 0

Strategier ved spil 15

E(X | X q) ndash SnP(q) lt 0 Sn gt E(X | X q) P(q) Det er ikke saeligrlig svaeligrt at udregne stopbetingelsen feks for q = 2 og q = 6 Nedenfor er vist udskriften fra et program som foretager beregningen for q = 212 Forventet gevinst i naeligste kast naringr ens skaeligbne er q q 2 3 4 5 6 7 8 9 10 11 12 694 683 667 644 617 583 589 600 617 639 667 Stop naringr din gevinst S gt EX(q)P(q) naringr skaeligbne er q q 2 3 4 5 6 7 8 9 10 11 12 25000 12300 8000 5800 4440 3500 4240 5400 7400 11500 24000

Som det fremgaringr er der endog meget stor forskel paring stoptiderne afhaeligngig af ens skaeligbne

23 Mandagschancen Dette spil er lidt mere interessant fordi det ikke er helt saring enkelt at gennemskue I dette tilfaeliglde kan man ikke forvente at den kortsigtede strategi vil foslashre til den optimale strategi At den faktisk goslashr det skyldes talvaeligrdierne Dette skal forstarings saringledes at hvis man aeligndrede paring praeligmiestoslashrrelserne ville Snell-strategien afvige fra den kortsigtede strategi Vi vil analysere spillet ved Snell-strategien Som naeligvnt har man i spillet 9 tildaeligkkede felter (101025255050100100250) Man kan afdaeligkke hoslashjest 3 felter Man faringr beloslashbet i 1000 kr som det sidste felt viser Hvis X er den stokastiske variabel som angiver vaeligrdien af et felt saring vil de fleste uden saring lange overvejelser vel fortsaeligtte hvis Xlt50 og standse hvis X100 Det kritiske er hvis man afdaeligkker 50 (X=50) Vi bemaeligrker foslashrst at summen af alle felterne er S=620 og at E(X) =6209=689 Vi opskriver foslashrst den fuldstaeligndige Snell-strategi for dette spil G3 =X3 Den Stokastiske variabel G3 = Gevinsten = X3 = vaeligrdien af det sidst afdaeligkkede felt G2 = max X2 E(G3| X1X2 ) Den stoslashrste af vaeligrdierne X2 (= vaeligrdien af det afdaeligkkede

felt) og den betingede middelvaeligrdi af G3 = X3 G1 = max X1 E(G2| X1 ) Som ovenfor Kriteriet for den optimale strategi er som tidligere Stop hvis paring noget trin Xk gt E(Gk+1| X1Xk ) Det er relativ nemt at opstille en formel for E(G3| X1X2 ) Naringr X1 og X2 er afdaeligkket er summen de resterende felter S - X1 - X2 Da alle felter har samme sandsynlighed er middelvaeligrdien simpelthen middeltallet af felterne E(G3| X1X2 ) = ( S - X1 - X2)(9-2)

Strategier ved spil 16

Det er noget mere teknisk at opstille en formel for E(G2| X1 ) og ogsaring lidt teknisk at foretage beregningen Vi vil noslashjes med at skitsere beregningen for en vaeligrdi af X1 og i oslashvrigt henvise til resultatet af et Computerprogram som kan ses nedenfor Lad os antage at X1 = 25 Vi lader nu X2 gennemloslashbe alle de mulige vaeligrdier (alle vaeligrdier skal taeliglles med det antal gange der er felter med denne vaeligrdi) For hver vaeligrdi af X2 (feks 50) skal vi vaeliglge max af X2 og E(G3| X1X2 ) = ( S - X1 - X2) (9-2) (= (620-50-25)7 = 778 i dette tilfaeliglde) og addere det til en sum S2 E(G2| X1 ) er da lig med S2(9-1) (da der er 9-1 felter X2 ) X2[1]= 1000 E(G3)= 8571 G2= 8571 X2[2]= 2500 E(G3)= 8357 G2= 8357 X2[3]= 5000 E(G3)= 8000 G2= 8000 X2[4]= 10000 E(G3)= 7286 G2= 10000 X2[5]= 25000 E(G3)= 5143 G2= 25000 X1[1]= 1000 E(G[2])= 10786 X2[1]= 1000 E(G3)= 8357 G2= 8357 X2[2]= 2500 E(G3)= 8143 G2= 8143 X2[3]= 5000 E(G3)= 7786 G2= 7786 X2[4]= 10000 E(G3)= 7071 G2= 10000 X2[5]= 25000 E(G3)= 4929 G2= 25000 X1[2]= 2500 E(G[2])= 10679 X2[1]= 1000 E(G3)= 8000 G2= 8000 X2[2]= 2500 E(G3)= 7786 G2= 7786 X2[3]= 5000 E(G3)= 7429 G2= 7429 X2[4]= 10000 E(G3)= 6714 G2= 10000 X2[5]= 25000 E(G3)= 4571 G2= 25000 X1[3]= 5000 E(G[2])= 10500 X2[1]= 1000 E(G3)= 7286 G2= 7286 X2[2]= 2500 E(G3)= 7071 G2= 7071 X2[3]= 5000 E(G3)= 6714 G2= 6714 X2[4]= 10000 E(G3)= 6000 G2= 10000 X2[5]= 25000 E(G3)= 3857 G2= 25000 X1[4]= 10000 E(G[2])= 9643 X2[1]= 1000 E(G3)= 5143 G2= 5143 X2[2]= 2500 E(G3)= 4929 G2= 4929 X2[3]= 5000 E(G3)= 4571 G2= 5000 X2[4]= 10000 E(G3)= 3857 G2= 10000 X1[5]= 25000 E(G[2])= 6268 Ser man resultaterne igennem kan de udmoslashntes i en simpel regel Fortsaeligt paring 50 eller derunder Stop paring 100 eller derover Det er maringske lidt overraskende at man ogsaring skal forsaeligtte paring 50000 hvis man kun har et forsoslashg tilbage ndash man kunne jo ende med 10000 og det er saring bare aeligrgerligt ndash og det er vist nok de fleste som standser ved 50000 - men det er ikke den bedste strategi

Strategier ved spil 17

24 Casino Som naeligvnt i indledningen til dette afsnit findes der ingen strategi som kan bringe en i stand til at vinde paring et Casino ndash i det lange loslashb Vil man goslashre Casino-spil til en levevej vil det altid med matematisk sikkerhed ende med ruin Det betyder imidlertid ikke at man ikke kan vinde ved at garing paring Casino men hvis man taelignker paring at spraelignge banken saring skal to krav i hvert fald vaeligre opfyldt for at der skal vaeligre en ikke forsvindende sandsynlighed for at det kan lade sig goslashre 1 Man skal have flere penge end Casino 2 Der maring ikke vaeligre loft over indsatserne Begge betingelser er som bekendt aldrig opfyldt Man kan som sagt godt vinde paring et Casino men hvis man satser paring at vinde mere (alle de gange man er paring Casino i sit liv) end det beloslashb man medbringer ved hvert besoslashg saring vil chancerne for at tabe det hele vaeligre stoslashrst Her er der tale om sandsynligheder og middelvaeligrdier ndash om odds Selvfoslashlgelig er de muligt at tabe hele sin formue ved foslashrste besoslashg eller vinde det tredobbelte ved det andet Der har i tidens loslashb vaeligret lanceret flere eksempler paring vinderstrategier som lyder uhyre besnaeligrende Den mest kendte er Martingale-systemet Man spiller kun paring sort og roslashd hvor faringr man faringr fordoblet sin indsats hvis man vinder Spillet er saringledes helt lige bortset fra at indsatserne bliver liggende naringr zero kommer ud og man kun faringr sin indsats en gang hvis man vinder i naeligste spil (zero har ingen farve) Spiller man efter Martingale-systemet skal man inkassere sin gevinst hvis man vinder Hvis man derimod taber skal man fordoble sin indsats Vi saeligtter grundindsatsen til 1 Har man spillet n gange og dermed doblet op n-1 gange har man lagt en indsats Sn = 1 + 2 + 22 +hellip2n-1 = 2n ndash1 Udregnet af kvotientraeligkkeformlen

1

10

q

qaS

n

n

for raeligkken Sn = a0 + a0q+ a0q

2+hellip+ a0qn-1

Vinder man det nte spil faringr man udbetalt 22

n-1 = 2n saring ens gevinst er 2n - (2n - 1) = 1 Der gaeliglder aringbenbart den simple kendsgerning at bliver man bare ved med at fordoble saring har man altid vundet eacuten indsats Foslashr man forsoslashger sig med dette skal man dog nok goslashre sig klart hvor mange gange man kan tabe foslashr man er ruineret

Strategier ved spil 18

Sandsynligheden for at man taber 5 spil er (frac12)5 = 132 Man har da tabt 25 ndash 1 gange vaeligrdien af en jeton (i Danmark 50 kr) dvs 1550 kr Vil man sikre sig bedre feks ved at kunne doble op 9 gange (sandsynligheden for at tabe 10 spil er 11024) saring skal man komme med kr 51150- men det kan man ikke engang gennemfoslashre da hoslashjeste indsats i Danmark er 24000- Man kunne imidlertid stille det sposlashrgsmaringl Hvis man har n-jetoner hvad er saring sandsynligheden for at vinde q-jetoner hvis man spiller efter Martingale-systemet Dette kan man faktisk godt udregne direkte men regningerne er ret omfattende Derimod er resultatet simpelt Vi vil ikke lave en direkte udregning men anvende de samme metoder som vi har anvendt for den bedste strategi Vi tager udgangspunkt i det faktum at sort roslashd Casino spil er et lige spil saring middelvaeligrdien af gevinsten er 0 ligegyldigt hvordan man spiller Middelvaeligrdien (som er nul ) af en gevinst paring q-jetoner er lig med q gange sandsynligheden P(q) for at vinde q jetoner minus ens kapital (n jetoner) gange med sandsynligheden for at man taber det sidste spil som er 1 ndash P(q)

qP(q) ndash n(1 ndashP(q)) = 0 qn

nqP

)(

Har man feks n = 31 jetoner (1550- kr) er sandsynligheden for at vinde q=10 (500 kr) lig med 0756 En rimelig stor sandsynlighed men altsaring stadig 25 chance for ruin Oslashnsker man derimod at blive rigtig rig og vinde 10000- kr dvs q=200 er P(200) = 0134 Konklusionen er den at satser man paring at vinde mere end man medbringer saring er sandsynligheden mindre end frac12 men kan man noslashjes med mindre saring er sandsynligheden stoslashrre end frac12 Men bemaeligrk dette gaeliglder fra foslashrste gang man garingr ind paring et Casino til man beslutter at holde op

25 Taeligndstikspillet Som beskrevet ovenfor garingr spillet ud paring at farve den ene af siderne roslashd paring 10 taeligndstikker Naringr taeligndstikken kasten op i luften er sandsynligheden for at den roslashde side vender opad naringr den rammer bordet lig med p=025 Man kaster paring skift 10 saringdanne taeligndstikker 10 gange For hvert kast skal man multiplicere antallet af roslashde med et af tallene 110 Hver tal maring kun bruges eacuten gang Den der faringr den stoslashrste sum har vundet Det er klart at en god strategi i det lange loslashb vil give en hoslashjere sum Vi minder om at antallet af X roslashde taeligndstikker er binomialfordelt med primaeligrsandsynlighed p og antalsparameter n=10

102104

3

4

110)(

10

jj

jXPjj

Strategier ved spil 19

Endvidere vil vi anvende de kumulerede sandsynligheder P(X j) og P(X j) Nedenfor er vist resultatet af en Computersimulation af spillet Primaeligr sandsynligheder for n= 10 og p= 0250 P(X=j) j 0 1 2 3 4 5 6 7 8 9 10 00563 01877 02816 02503 01460 00584 00162 00031 00004 00000 00000 Baglaeligns kumulerede sandsynligheder P(Xgt=q) j 0 1 2 3 4 5 6 7 8 9 10 10000 09437 07560 04744 02241 00781 00197 00035 00004 00000 00000 1 kast Antal = 2 Vaeliglg mellem 1 2 3 4 5 6 7 8 910 Faktor= 4 2 kast Antal = 4 Vaeliglg mellem 1 2 3 5 6 7 8 910 Faktor=10 3 kast Antal = 2 Vaeliglg mellem 1 2 3 5 6 7 8 9 Faktor= 5 4 kast Antal = 2 Vaeliglg mellem 1 2 3 6 7 8 9 Faktor= 3 5 kast Antal = 3 Vaeliglg mellem 1 2 6 7 8 9 Faktor= 8 6 kast Antal = 2 Vaeliglg mellem 1 2 6 7 9 Faktor= 6 7 kast Antal = 6 Vaeliglg mellem 1 2 7 9 Faktor=9 8 kast Antal = 3 Vaeliglg mellem 1 2 7 Faktor= 2 9 kast Antal = 2 Vaeliglg mellem 1 7 Faktor= 7 10 kast Antal = 2 Vaeliglg mellem 1 Faktor= 1 Din score er 176 Valget af tallene 110 er i dette tilfaeliglde foretaget ud fra den optimale strategi som vi vil omtale om et oslashjeblik Foslashr vi analyserer den optimale strategi for dette spil vil vi forsoslashge os med en intuitiv bedste strategi Vi belyser denne strategi med et konkret eksempel Lad os feks antage at vi slaringr 4 roslashde i den 3 kast (3 forsoslashg) De tal vi har tilbage kalder vi (y8 y7 y6 y5 y4 y3 y2 y1) Sposlashrgsmaringlet om vi skal gange med det stoslashrste y8 eller det naeligststoslashrste y7 osv Vi raeligsonnerer da som foslashlger Hvis sandsynligheden for at slaring mere end 4 roslashde i de resterende 7 kast er stoslashrre end frac12 saring skal vi vaeliglge det naeligststoslashrste Vi skaeligrper dette Hvis sandsynligheden for at slaring mindst 5 roslashde mindst en gang i de resterende 7 kast er stoslashrre end frac12 saring skal vi vaeliglge det naeligststoslashrste Tilsvarende hvis sandsynligheden for at slaring mindst 5 roslashde mindst 2 gange i de resterende 7 kast skal vi vaeliglge det 3 stoslashrstehellipog saringdan fremdeles Strategien virker umiddelbart meget plausibel Sandsynlighederne kan direkte farings af binomialfordelingen Foslashrst sandsynligheden for at faring mindst q-roslashde i et kast Dette er

P(X q) =

n

qj

jXP )( hvor P(X = j) er angivet ovenfor

Strategier ved spil 20

Sandsynligheden for at dette sker mindst r gange i n - k kast er ogsaring en binomialfordeling og kan skrives

P(X q mindst r gange i n - k kast ) = jknjkn

rj

qXPqXPj

kn

))(1()(

Beregningen af disse (110) sandsynligheder goslashres nok lettest paring en computer For at lave en strategi-tabel goslashr man det at for hvert kast og hvert antal mulige roslashde vaeliglger man foslashrst det stoslashrste af de resterende tal Dernaeligst beregner man sandsynligheden for at faring mindst 1 roslashd mere i et af de foslashlgende kast Hvis denne sandsynlighed er stoslashrre end frac12 ser man paring det naeligststoslashrste af de resterende tal Man beregner saring sandsynligheden for at faring mindst 1 roslashd mere i mindst to af de resterende kast Hvis denne sandsynlighed er stoslashrre end frac12 saring vaeliglger man det tredjestoslashrste af de resterende tal og saringdan fremdeleshellip Det bemaeligrkes at beregningen skal initialiseres med at man altid vaeliglger det mindste hvis man slaringr 0 roslashde og altid vaeliglger det stoslashrste hvis man slaringr 10 roslashde Nedenfor er vist en computerberegning af en strategi-tabel Endvidere er ogsaring lavet en saringkaldt Monte-Carlo simulation Dette betyder at man har ladet maskinen spille feks 10000 spil spillet efter strategi-tabellen Nederst er vist hyppighederne for ens score og endelig fordelingsfunktionen for observationerne (Den kumulerede frekvens) P(X =j) for n =10 and p = 0250 j 0 1 2 3 4 5 6 7 8 9 10 P(X =j)0056 0188 0282 0250 0146 0058 00162 0003 00004 0000 0000 P(Xgt=j) for n =10 and p = 0250 j 0 1 2 3 4 5 6 7 8 9 10 P(Xgt=j) 1000 0944 0756 0474 0224 0078 00197 00035 00004 0000 0000 Strategi tabel Tallene refererer ikke til faktorene selv men til den stoslashrste naeligststoslashrste osv Eksempel Hvis man slaringr 3 roslashde i den andet kast saring skal man vaeliglge (7) den tredjestoslashrste Kast no 1 2 3 4 5 6 7 8 9 10 score 0 1 1 1 1 1 1 1 1 1 1 1 3 3 3 2 2 2 2 1 1 1 2 6 5 5 4 4 3 3 2 2 1 3 8 7 7 6 5 4 3 3 2 1 4 9 9 8 7 6 5 4 3 2 1 5 10 9 8 7 6 5 4 3 2 1 6 10 9 8 7 6 5 4 3 2 1 7 10 9 8 7 6 5 4 3 2 1 8 10 9 8 7 6 5 4 3 2 1 9 10 9 8 7 6 5 4 3 2 1 10 10 9 8 7 6 5 4 3 2 1 Gennemsnitlig score = 16437

Strategier ved spil 21

Hyppighed af score h( 75)= 1 h( 80)= 7 h( 85)= 3 h( 90)= 5 h( 95)= 6 h(100)= 34 h(105)= 38 h(110)= 82 h(115)= 68 h(120)=161 h(125)=146 h(130)=320 h(135)=280 h(140)=534 h(145)=425 h(150)=752 h(155)=577 h(160)=878 h(165)=645 h(170)=956 h(175)=651 h(180)=863 h(185)=527 h(190)=609 h(195)=351 h(200)=389 h(205)=180 h(210)=203 h(215)= 93 h(220)= 86 h(225)= 47 h(230)= 32 h(235)= 21 h(240)= 13 h(245)= 8 h(250)= 3 h(255)= 0 h(260)= 4 h(265)= 1 h(270)= 1 h(275)= 0 h(280)= 0 Frekvens of score F( 80)=00008 F( 85)=00011 F( 90)=00016 F( 95)=00022 F(100)=00056 F(105)=00094 F(110)=00176 F(115)=00244 F(120)=00405 F(125)=00551 F(130)=00871 F(135)=01151 F(140)=01685 F(145)=02110 F(150)=02862 F(155)=03439 F(160)=04317 F(165)=04962 F(170)=05918 F(175)=06569 F(180)=07432 F(185)=07959 F(190)=08568 F(195)=08919 F(200)=09308 F(205)=09488 F(210)=09691 F(215)=09784 F(220)=09870 F(225)=09917 F(230)=09949 F(235)=09970 F(240)=09983 F(245)=09991 F(250)=09994 F(255)=09994 F(260)=09998 F(265)=09999 F(270)=10000 F(275)=10000

Som det fremgaringr af tabellen for P(X gt= j) er der kun 78 chance for at slaring 5 roslashde eller derover saring goslashr man det skal man altid vaeliglge det stoslashrste af de resterende tal For 3 eller 4 roslashde er situationen langt mere uigemmeskuelig og kun en beregning kan afgoslashre sagen Vi proslashver nu at finde den optimale strategi eller Snell-strategien Hvad angaringr sposlashrgsmaringlet om hvorvidt vi skal vaeliglge den stoslashrste eller naeligststoslashrste saring lader det sig faktisk goslashre at beregne Snell-strategien paring en computer De foslashlgende tilfaeliglde bliver derimod for komplicerede og der anvender vi en svagt forbedret version af vores intuitive strategi Forbedringen bestaringr i foslashlgende idet vi illustrerer det med et eksempel Lad os sige vi har slaringet 3 roslashde og vi overvejer om vi vil gange det med 7 eller 6 Ganger vi med 6 er det fordi vi forventer at slaring mindst 4 roslashde mindst en gang i de resterende kast Vores score vil vaeligre 73 og 74 henholdsvis og scoren vil blive forbedret med en faktor 43 hvis vi ganger med 6 under forventning af at slaring 4 roslashde Vores forbedring af strategien garingr da ud paring at vi vaeliglger det naeligststoslashrste 6 hvis sandsynligheden for at slaring 4 roslashde gange den relative forbedring 43 er stoslashrre end frac12 Vi rekapitulerer dernaeligst Snell-strategien G10 = X10 X10 Stokastisk variabel = antallet af roslashde i det 10 kast G9 = max X9 E(G10) E(G10) = E(X10) = np=10025 = 25 X9 = 01hellip10 Gk = max Xk E(Gk+1) E(Gk) kraeligver en laeligngere udregning men den udregnes som en

almindelig middelvaeligrdi altsaring som max af de to vaeligrdier gange P(X=Xk-1) G1 = max X1 E(G2) Som eksempel udregner vi E(G9) Da E(G10)=25 skal vi for X9 = 012 anvende E(G10)=25 i udregningen

Strategier ved spil 22

E(G9) = 25 (P(X=0)+P(X=1)+P(X=2))+ 3P(X=3)+hellip+10P(X=10) =306 Vaeligrdierne for E(Gk) er alle udregnet og vist i computerberegningen nedenfor Bemaeligrk isaeligr at de vokser fra 25 til 425 naringr k aftager fra 10 til 2 Strategien er nu foslashlgende Vaeliglg det stoslashrste af de resterende tal hvis Xk gt E(Gk+1) (altsaring det antal man har slaringet er er stoslashrre end det forventede stoslashrste antal) ellers vaeliglg det naeligststoslashrste Ved afgoslashrelsen om de 3 stoslashrste 4 stoslashrste osv anvender vi den hidtidige strategi med den modifikation at vi multiplicerer sandsynligheden med den formodede relative forbedring E(G10-kast)antal roslashde En computerberegning helt svarende til den foregaringende men med den aeligndrede strategi er vist nedenfor Man bemaeligrker for det foslashrste de smaring aeligndringer der er i strategien Den nye strategi er lidt mindre forsigtig men den giver altsaring ogsaring pote i form af en forbedring af gennemsnittet paring ca 275 Primaeligr sandsynligheder P(X=j) for n= 10 og p= 0250 j 0 1 2 3 4 5 6 7 8 9 10 P(X=j)0056 0188 0282 0250 0146 0058 0016 00031 00004 00000 00000 Baglaeligns Kumulerede sandsynligheder P(Xgt=j) j 0 1 2 3 4 5 6 7 8 9 10 P(Xgt=j) 1000 0944 0756 0474 0224 0078 00197 00035 00004 00000 00000 E(G[10])= 250 E(G[9])= 306 E(G[8])= 337 E(G[7])= 362 E(G[6])= 380 E(G[5])= 395 E(G[4])= 406 E(G[3])= 416 E(G[2])= 425 kast nr 1 2 3 4 5 6 7 8 9 10 score 0 1 1 1 1 1 1 1 1 1 1 1 2 2 1 1 1 1 1 1 1 1 2 5 4 4 3 3 3 2 2 1 1 3 8 7 6 5 5 4 3 2 2 1 4 9 8 7 7 6 5 4 3 2 1 5 10 9 8 7 6 5 4 3 2 1 6 10 9 8 7 6 5 4 3 2 1 7 10 9 8 7 6 5 4 3 2 1 8 10 9 8 7 6 5 4 3 2 1 9 10 9 8 7 6 5 4 3 2 1 10 10 9 8 7 6 5 4 3 2 1 Gennemsnitlig gevinst ms = 16727 Hyppigheder af score h( 75)= 1 h( 80)= 1 h( 85)= 0 h( 90)= 3 h( 95)= 2 h(100)= 5 h(105)= 4 h(110)= 9 h(115)= 12 h(120)= 12 h(125)= 17 h(130)= 22 h(135)= 28 h(140)= 39 h(145)= 24 h(150)= 49 h(155)= 54 h(160)= 74 h(165)= 63 h(170)=117 h(175)= 63 h(180)= 91 h(185)= 57 h(190)= 72 h(195)= 39 h(200)= 36 h(205)= 35 h(210)= 29 h(215)= 14 h(220)= 21 h(225)= 1 h(230)= 5 h(235)= 1 h(240)= 0 h(245)= 0 h(250)= 0 h(255)= 0 h(260)= 0 h(265)= 0 h(270)= 0 h(275)= 0 h(280)= 0

Strategier ved spil 23

Frekvens af score F( 80)=00020 F( 85)=00020 F( 90)=00050 F( 95)=00070 F(100)=00120 F(105)=00160 F(110)=00250 F(115)=00370 F(120)=00490 F(125)=00660 F(130)=00880 F(135)=01160 F(140)=01550 F(145)=01790 F(150)=02280 F(155)=02820 F(160)=03560 F(165)=04190 F(170)=05360 F(175)=05990 F(180)=06900 F(185)=07470 F(190)=08190 F(195)=08580 F(200)=08940 F(205)=09290 F(210)=09580 F(215)=09720 F(220)=09930 F(225)=09940 F(230)=09990 F(235)=10000 F(240)=10000 F(245)=10000 F(250)=10000 F(255)=10000 F(260)=10000 F(265)=10000 F(270)=10000 F(275)=10000

Maringske er det ikke en saeligrlig imponerende forbedring fra den foslashrste strategi men det er en teoretisk milepaeligl at man er i stand til at angive den bedste strategi for bestemte typer af spil Som omtalt har vi ikke forsoslashgt at bevise at Snell-Strategien er den optimale Strategi men det kan bevises Det er vigtigt at notere sig at i alle de omtalte spil har udfaldene vaeligre stokastiske variable dvs uforudsigelige men med bestemte sandsynligheder og at disse sandsynligheder ikke bliver aeligndret af den strategi man foslashlger I mange af de spil hvor man ofte moslashder begrebet strategi feks skak krig finansmarked og markedsfoslashring er dette langt fra tilfaeligldet Hvis feks alle boslashrsspekulanter fulgte den samme optimale strategi med boslashrskursen som stokastisk variabel ville det nok vise sig at det var den daringrligste strategi af alle Teorien for dynamiske strategier hvor de stokastiske variable er funktioner af tiden og af den valgte strategi er teoretisk naeligsten ufremkommelige

Strategier ved spil 24

Indeks Casino516 Computersimulation18 definitionen af sandsynlighed 1 Den optimale Snell-strategi11 forsikringsmatematik 5 Indbrudstyvens pensionsproblem912 kortsigtede strategi 10 kumulerede frekvens 19 langsigtede strategi 10 lotto 1 Mandagschancen14 Mandags-chancen9 Martingale-systemet16

Optimale Strategier 10 Poker 3 rekursionsligning 6 roulette 57 Roulette spil 10 roulettespiller 7 ruinsandsynligheder 5 Skaeligbnen913 Snell-strategien 11 Stopbetingelsen11 strategi9 Taeligndstikspillet1018

Page 13: Sandsynligheder og strategier ved spil - Ole Witt-Hansen ...olewitthansen.dk/Matematik/Sandsynligheder_og_strategier_ved_spil… · 6dqgv\qoljkhghu yhg vslo 3n vdpph pngh ndq yl ilqgh

Strategier ved spil 11

15 Casino Roulette spil falder ogsaring lidt uden for rammerne af optimale strategier af den meget simple grund at odds er svagt imod eacuten Det gaeliglder dog ikke for Blackjack hvor man kan udvikle en strategi som giver en svag fordel Hvis odds er imod eacuten vil man imidlertid altid tabe i det lange loslashb Som tidligere fastslaringet er den eneste mulighed - i det lange loslashb - for at undgaring ruin i roulettespil at der ikke er nogen oslashvre graelignse for indsatser og at man har flere penge end Casionorsquoet og ingen af disse to betingelser er nogensinde opfyldt Enhver fornuftig matematisk spil-teori vil derfor som resultat have at man skal standse foslashr det foslashrste spil Det vil sige Man skal lade vaeligre med at garing paring Casino Denne kendsgerning udelukker dog ikke at man kan goslashre sig overvejelser over hvordan man kan spille hvis man ikke udelukkende er interesseret i at foraeligre sine penge til et Casino uden kamp

2 Optimale Strategier Hvis man intuitivt skal formulere en strategi for de 3 foslashrste spil naeligvnt ovenfor saring kan man feks vaeliglge eacuten af 3 foslashlgende strategier 1 Man beslutter paring forharingnd hvor stor ens gevinst (eller tab) skal vaeligre foslashr man stopper Dette er

faktisk en meget almindelig strategi men den er bestemt ikke optimal 2 Man fortsaeligtter saring laelignge man i middel har mulighed for at foroslashge sin gevinst i naeligste spil Man

skal huske paring at middelvaeligrdien af gevinsten ogsaring omfatter tab saring middelvaeligrdien (i matematisk forstand) skal vaeligre positiv Denne umiddelbart fornuftige strategi kaldet den kortsigtede eller myope strategi er i mange tilfaeliglde ogsaring den optimale strategi (dog ikke i mandagschancen)

3 Man fortsaeligtter saring laelignge man i middel har mulighed for at foroslashge sin gevinst i et af de

efterfoslashlgende spil Denne strategi kaldes den langsigtede strategi Baringde den kortsigtede og den langsigtede strategi ser yderst rimelige ud og de vil ogsaring vaeligre optimale for langt de fleste spil Hvis der er forskel paring den langsigtede og den kortsigtede strategi skal man anvende den langsigtede - naturligvis Der findes imidlertid visse former for spil hvor ingen af strategierne er optimale Det gaeliglder feks for boslashrsspekulanter der har en beholdning aktier som de vil saeliglge naringr kurserne stiger Dette fortsaeligtter som bekendt aldrig i det uendelige Paring et vist tidspunkt standser stigningen og kurserne begynder at falde ndash som regel ndash hurtigere end de steg Hvornaringr skal man saeliglge for at opnaring den stoslashrste gevinst Det viser sig - men det er saeligrdeles kompliceret at redegoslashre for ndash at naringr det gaeliglder boslashrs spekulation saring er ingen af strategierne 2 og 3 optimale De vil begge to i grove traeligk som resultat have at man enten skal saeliglge straks eller vente til man er ruineret Vi vil nu give en beskrivelse af den optimale strategi som er udviklet af Snell Vi vil overhovedet ikke naeligrme os et bevis for at det er den optimale strategi (beviset er ret teknisk abstrakt) men

Strategier ved spil 12

understrege at det kan bevises I matematisk forstand Ulemperne ved Snell-strategien er at den for selv simple problemer kan foslashre til ret omfattende og komplicerede regninger

2 Den optimale Snell-strategi Snell-strategien er paring sin vis den samme som den kortsigtede strategi men hvor man i denne strategi hele tiden regner sig et skridt frem saring tager Snell-strategien udgangspunkt i spillets slutning og arbejder sig baglaeligns Vi indfoslashrer foslashrst nogle betegnelser Vi antager at spillet har n trin Sk er en stokastisk variabel der angiver den faktiske samlede gevinst man har opnaringet ved det kte spil Sk kan antage en eller flere vaeligrdier med tilhoslashrende sandsynligheder Det nye ved Snell-strategien er at man definerer endnu en stokastisk variabel Gk ved ligningen

Gk = maxSk E(Gk+1| S1Sk) Gk er den stoslashrste af vaeligrdierne Sk (gevinsten efter det kte spil) og E(Gk+1| S1Sk)) som er middelvaeligrdien af den maximale forventede gevinst i det k+1te spil naringr det er givet at man har spillet spillene 1k Dette opstilles i et skema Gn = Sn Gevinsten ved spillets afslutning Gn-1 = maxSn-1 E(Gn| S1Sn-1) Gk = maxSk E(Gk+1| S1Sk) G1 = maxS1 E(G2| S1) Snell strategien siger nu at man skal standse spillet den foslashrste gang Sk (gevinsten efter det kte spil) overstiger middelvaeligrdien af den maksimale forventede gevinst i det k+1te spil Dette kaldes for stopbetingelsen Stopbetingelsen er altsaring

Sk E(Gk+1| S1Sk) Man skal altsaring standse spillet naringr den opnaringede gevinst er stoslashrre eller lig med den betingede forventning af den maximale gevinst i det naeligste spil Det kunne lyde som den kortsigtede strategi men forskellen er den at i den kortsigtede strategi er Gk+1 erstattet af Sk+1 At kunne gennemskue konsekvenserne af dette er derimod ikke saring nemt Det viser sig at i mange tilfaeliglde at er Snell-Strategien identisk med den kortsigtede strategi som kraeligver at man stopper naringr Sk E(Sk+1| S1Sk) Snell strategien er ikke umiddelbart let gennemskuelig og udregningen af de betingede middelvaeligrdier E(Gk+1| S1Sk) er ofte ret teknisk Vi vil nu behandle de foslashr naeligvnte eksempler og begynder med

Strategier ved spil 13

21 Indbrudstyvens pensionsproblem Lad os antage at Arthurs gennemsnitlige gevinst ved hvert tyvetogt er K = 6000 kr og at chancen er at han bliver taget er 5 Lad os antage at hans hidtidige gevinst efter k - tyvetugt er Sk som bliver konfiskeret - og som han derved mister hvis han bliver snuppet I dette tilfaeliglde kan man - som vist nedenfor - se at den kortsigtede strategi er den optimale strategi Det haelignger sammen med at alle trin i spillet er identiske Gevinsten ved hvert tyvetogt er den samme ndash uafhaeligngigt af de foregaringende tyvetugter - bortset fra at den samlede gevinst vokser ved hvert vellykket tyvetogt Xk betegner den stokastiske variabel som er Arthurs gevinst ved eacutet tyvetugt Hermed er

Sk =X1+ X2+ X3+hellip Xk Xk+1 kan antage vaeligrdien K med sandsynlighed 1-ps = 1-P(Snuppet) (altsaring hvis det naeligste tyvetugt lykkes) og vaeligrdien ndashSk (han mister hele sin opsparing) med sandsynlighed ps = P(Snuppet) Vi opskriver nu Snell-strategien (Den kortsigtede strategi) for et trin i hans karriere

Gk = max Sk E(Sk+1| 1k)

Sk er hans gevinst efter k tyvetugter og E(Sk+1| 1k) er hans forventede gevinst efter k+1 tyvetugter E(Sk+1| 1k) kan beregnes som den hidtidige gevinst plus den forventede gevinst ved naeligste tyve- tugt i alt lig med Sk + E(Xk+1) E(Xk+1) er uafhaeligngig af de foslashrste k - tyvetugter derfor bliver stopbetingelsen Sk gt Sk + E(Xk+1) E(Xk+1) lt 0 Middelvaeligrdien E(Xk+1) kan saringledes udregnes efter den saeligdvanlige definition idet Xk+1 antager vaeligrdierne K (gevinsten ved et tyvetugt) og - Sk (mister hele sin opsparing) med sandsynlighederne 1-ps og ps henholdsvis E(Xk+1) = K(1- ps) - Sk ps Han skal standse naringr

E(Xk+1) lt 0 K(1- ps) lt Sk ps som med tal eksemplet giver

6000095 lt Sk005 Sk gt 114000- kr svarende til 114006000 = 095005 = 19 tyvetugter

(Det goslashr han nu nok ikke og er derfor henvist til at leve af folkepensionen efter nogle aringr i skyggen) Man kunne godt tro at dette eksempel kunne anvendes paring andre (ligesaring uetiske) problemstillinger Feks hvor mange gange det er optimalt at koslashre gratis i S-tog Det kan det imidlertid ikke helt

Strategier ved spil 14

Sagen er jo den at man faringr en fast boslashde hvis man bliver snuppet men man kommer ikke til at betale for de gange man har koslashrt gratis Med andre ord vurderingen om hvorvidt det er fordelagtigt at koslashre uden billet afhaelignger kun af middelgevinsten ved det naeligste forsoslashg Hvis den er positiv er det fordelagtigt at fortsaeligtte men hvis den er negativ er det fordelagtigt at loslashse billet (Det er i oslashvrigt uetisk at snyde ndash naturligvis) Tager vi et eksempel billetprisen er kr 50- Boslashden er kr 500 Sandsynligheden for at blive snuppet er Ps = 01 Hvis X er gevinsten ved at koslashre uden billet er E(X) = 50middot(1-Ps)-500middotPs = 50middot09-500middot01 = -50 Det er saringledes (med denne sandsynlighed for at blive snuppet) ikke fordelagtigt at koslashre uden billet i S-tog Da en laeligrebog i sandsynligheder ved spil naturligvis ikke maring tilskynde til uetiske handlinger undlader vi at foretage beregningen med Ps = 005

22 Skaeligbnen Vi betragter kast med to terninger X betegner summen af oslashjentallene ved eacutet kast Sandsynlighedsfordelingen for X er velkendt Feks er P(X=5) = 436 Sandsynligheden for at terningerne viser j oslashjne kan skrives som

36

76)(

jjXP

Lad os antage at spillerens skaeligbne er q Hvis man slaringr dette oslashjental er alt tabt Ellers adderes oslashjentallene for hvert kast Hvis ikke man har slaringet sin skaeligbne saring er den samlede gevinst efter n spil

Sn = X1+ X2+ X3+hellip +Xn

Og middelvaeligrdien af Sn er

E(Sn) = E(X1)+ E(X2)+E(X3)+hellip +E(Xn) = nE(X | X q) E(X | X q) er den betingede middelvaeligrdi af oslashjentallene givet at man ikke slaringr sin skaeligbne

E(X | X q) = 2P(2) +3P(3)+hellip(q-1)P(q-1) + (q+1)P(q+1)+hellip+12P(12) Den kortsigtede strategi (og Snell strategien) fastslaringr at man skal standse naringr middelvaeligrdien af den forventede gevinst ved naeligste kast er negativ Argumentet for dette kan overtages naeligsten ordret fra indbrudstyvens pensionsproblem E(Sk+1|S1 Sk) kan beregnes som den hidtidige gevinst Sk plus den forventede gevinst ved det naeligste kast i alt lig med Sk + E(Xk+1| S1 Sk) Stopbetingelsen er derfor

Sk gt Sk + E(Xk+1| S1 Sk) E(Xk+1| S1 Sk) lt 0

Strategier ved spil 15

E(X | X q) ndash SnP(q) lt 0 Sn gt E(X | X q) P(q) Det er ikke saeligrlig svaeligrt at udregne stopbetingelsen feks for q = 2 og q = 6 Nedenfor er vist udskriften fra et program som foretager beregningen for q = 212 Forventet gevinst i naeligste kast naringr ens skaeligbne er q q 2 3 4 5 6 7 8 9 10 11 12 694 683 667 644 617 583 589 600 617 639 667 Stop naringr din gevinst S gt EX(q)P(q) naringr skaeligbne er q q 2 3 4 5 6 7 8 9 10 11 12 25000 12300 8000 5800 4440 3500 4240 5400 7400 11500 24000

Som det fremgaringr er der endog meget stor forskel paring stoptiderne afhaeligngig af ens skaeligbne

23 Mandagschancen Dette spil er lidt mere interessant fordi det ikke er helt saring enkelt at gennemskue I dette tilfaeliglde kan man ikke forvente at den kortsigtede strategi vil foslashre til den optimale strategi At den faktisk goslashr det skyldes talvaeligrdierne Dette skal forstarings saringledes at hvis man aeligndrede paring praeligmiestoslashrrelserne ville Snell-strategien afvige fra den kortsigtede strategi Vi vil analysere spillet ved Snell-strategien Som naeligvnt har man i spillet 9 tildaeligkkede felter (101025255050100100250) Man kan afdaeligkke hoslashjest 3 felter Man faringr beloslashbet i 1000 kr som det sidste felt viser Hvis X er den stokastiske variabel som angiver vaeligrdien af et felt saring vil de fleste uden saring lange overvejelser vel fortsaeligtte hvis Xlt50 og standse hvis X100 Det kritiske er hvis man afdaeligkker 50 (X=50) Vi bemaeligrker foslashrst at summen af alle felterne er S=620 og at E(X) =6209=689 Vi opskriver foslashrst den fuldstaeligndige Snell-strategi for dette spil G3 =X3 Den Stokastiske variabel G3 = Gevinsten = X3 = vaeligrdien af det sidst afdaeligkkede felt G2 = max X2 E(G3| X1X2 ) Den stoslashrste af vaeligrdierne X2 (= vaeligrdien af det afdaeligkkede

felt) og den betingede middelvaeligrdi af G3 = X3 G1 = max X1 E(G2| X1 ) Som ovenfor Kriteriet for den optimale strategi er som tidligere Stop hvis paring noget trin Xk gt E(Gk+1| X1Xk ) Det er relativ nemt at opstille en formel for E(G3| X1X2 ) Naringr X1 og X2 er afdaeligkket er summen de resterende felter S - X1 - X2 Da alle felter har samme sandsynlighed er middelvaeligrdien simpelthen middeltallet af felterne E(G3| X1X2 ) = ( S - X1 - X2)(9-2)

Strategier ved spil 16

Det er noget mere teknisk at opstille en formel for E(G2| X1 ) og ogsaring lidt teknisk at foretage beregningen Vi vil noslashjes med at skitsere beregningen for en vaeligrdi af X1 og i oslashvrigt henvise til resultatet af et Computerprogram som kan ses nedenfor Lad os antage at X1 = 25 Vi lader nu X2 gennemloslashbe alle de mulige vaeligrdier (alle vaeligrdier skal taeliglles med det antal gange der er felter med denne vaeligrdi) For hver vaeligrdi af X2 (feks 50) skal vi vaeliglge max af X2 og E(G3| X1X2 ) = ( S - X1 - X2) (9-2) (= (620-50-25)7 = 778 i dette tilfaeliglde) og addere det til en sum S2 E(G2| X1 ) er da lig med S2(9-1) (da der er 9-1 felter X2 ) X2[1]= 1000 E(G3)= 8571 G2= 8571 X2[2]= 2500 E(G3)= 8357 G2= 8357 X2[3]= 5000 E(G3)= 8000 G2= 8000 X2[4]= 10000 E(G3)= 7286 G2= 10000 X2[5]= 25000 E(G3)= 5143 G2= 25000 X1[1]= 1000 E(G[2])= 10786 X2[1]= 1000 E(G3)= 8357 G2= 8357 X2[2]= 2500 E(G3)= 8143 G2= 8143 X2[3]= 5000 E(G3)= 7786 G2= 7786 X2[4]= 10000 E(G3)= 7071 G2= 10000 X2[5]= 25000 E(G3)= 4929 G2= 25000 X1[2]= 2500 E(G[2])= 10679 X2[1]= 1000 E(G3)= 8000 G2= 8000 X2[2]= 2500 E(G3)= 7786 G2= 7786 X2[3]= 5000 E(G3)= 7429 G2= 7429 X2[4]= 10000 E(G3)= 6714 G2= 10000 X2[5]= 25000 E(G3)= 4571 G2= 25000 X1[3]= 5000 E(G[2])= 10500 X2[1]= 1000 E(G3)= 7286 G2= 7286 X2[2]= 2500 E(G3)= 7071 G2= 7071 X2[3]= 5000 E(G3)= 6714 G2= 6714 X2[4]= 10000 E(G3)= 6000 G2= 10000 X2[5]= 25000 E(G3)= 3857 G2= 25000 X1[4]= 10000 E(G[2])= 9643 X2[1]= 1000 E(G3)= 5143 G2= 5143 X2[2]= 2500 E(G3)= 4929 G2= 4929 X2[3]= 5000 E(G3)= 4571 G2= 5000 X2[4]= 10000 E(G3)= 3857 G2= 10000 X1[5]= 25000 E(G[2])= 6268 Ser man resultaterne igennem kan de udmoslashntes i en simpel regel Fortsaeligt paring 50 eller derunder Stop paring 100 eller derover Det er maringske lidt overraskende at man ogsaring skal forsaeligtte paring 50000 hvis man kun har et forsoslashg tilbage ndash man kunne jo ende med 10000 og det er saring bare aeligrgerligt ndash og det er vist nok de fleste som standser ved 50000 - men det er ikke den bedste strategi

Strategier ved spil 17

24 Casino Som naeligvnt i indledningen til dette afsnit findes der ingen strategi som kan bringe en i stand til at vinde paring et Casino ndash i det lange loslashb Vil man goslashre Casino-spil til en levevej vil det altid med matematisk sikkerhed ende med ruin Det betyder imidlertid ikke at man ikke kan vinde ved at garing paring Casino men hvis man taelignker paring at spraelignge banken saring skal to krav i hvert fald vaeligre opfyldt for at der skal vaeligre en ikke forsvindende sandsynlighed for at det kan lade sig goslashre 1 Man skal have flere penge end Casino 2 Der maring ikke vaeligre loft over indsatserne Begge betingelser er som bekendt aldrig opfyldt Man kan som sagt godt vinde paring et Casino men hvis man satser paring at vinde mere (alle de gange man er paring Casino i sit liv) end det beloslashb man medbringer ved hvert besoslashg saring vil chancerne for at tabe det hele vaeligre stoslashrst Her er der tale om sandsynligheder og middelvaeligrdier ndash om odds Selvfoslashlgelig er de muligt at tabe hele sin formue ved foslashrste besoslashg eller vinde det tredobbelte ved det andet Der har i tidens loslashb vaeligret lanceret flere eksempler paring vinderstrategier som lyder uhyre besnaeligrende Den mest kendte er Martingale-systemet Man spiller kun paring sort og roslashd hvor faringr man faringr fordoblet sin indsats hvis man vinder Spillet er saringledes helt lige bortset fra at indsatserne bliver liggende naringr zero kommer ud og man kun faringr sin indsats en gang hvis man vinder i naeligste spil (zero har ingen farve) Spiller man efter Martingale-systemet skal man inkassere sin gevinst hvis man vinder Hvis man derimod taber skal man fordoble sin indsats Vi saeligtter grundindsatsen til 1 Har man spillet n gange og dermed doblet op n-1 gange har man lagt en indsats Sn = 1 + 2 + 22 +hellip2n-1 = 2n ndash1 Udregnet af kvotientraeligkkeformlen

1

10

q

qaS

n

n

for raeligkken Sn = a0 + a0q+ a0q

2+hellip+ a0qn-1

Vinder man det nte spil faringr man udbetalt 22

n-1 = 2n saring ens gevinst er 2n - (2n - 1) = 1 Der gaeliglder aringbenbart den simple kendsgerning at bliver man bare ved med at fordoble saring har man altid vundet eacuten indsats Foslashr man forsoslashger sig med dette skal man dog nok goslashre sig klart hvor mange gange man kan tabe foslashr man er ruineret

Strategier ved spil 18

Sandsynligheden for at man taber 5 spil er (frac12)5 = 132 Man har da tabt 25 ndash 1 gange vaeligrdien af en jeton (i Danmark 50 kr) dvs 1550 kr Vil man sikre sig bedre feks ved at kunne doble op 9 gange (sandsynligheden for at tabe 10 spil er 11024) saring skal man komme med kr 51150- men det kan man ikke engang gennemfoslashre da hoslashjeste indsats i Danmark er 24000- Man kunne imidlertid stille det sposlashrgsmaringl Hvis man har n-jetoner hvad er saring sandsynligheden for at vinde q-jetoner hvis man spiller efter Martingale-systemet Dette kan man faktisk godt udregne direkte men regningerne er ret omfattende Derimod er resultatet simpelt Vi vil ikke lave en direkte udregning men anvende de samme metoder som vi har anvendt for den bedste strategi Vi tager udgangspunkt i det faktum at sort roslashd Casino spil er et lige spil saring middelvaeligrdien af gevinsten er 0 ligegyldigt hvordan man spiller Middelvaeligrdien (som er nul ) af en gevinst paring q-jetoner er lig med q gange sandsynligheden P(q) for at vinde q jetoner minus ens kapital (n jetoner) gange med sandsynligheden for at man taber det sidste spil som er 1 ndash P(q)

qP(q) ndash n(1 ndashP(q)) = 0 qn

nqP

)(

Har man feks n = 31 jetoner (1550- kr) er sandsynligheden for at vinde q=10 (500 kr) lig med 0756 En rimelig stor sandsynlighed men altsaring stadig 25 chance for ruin Oslashnsker man derimod at blive rigtig rig og vinde 10000- kr dvs q=200 er P(200) = 0134 Konklusionen er den at satser man paring at vinde mere end man medbringer saring er sandsynligheden mindre end frac12 men kan man noslashjes med mindre saring er sandsynligheden stoslashrre end frac12 Men bemaeligrk dette gaeliglder fra foslashrste gang man garingr ind paring et Casino til man beslutter at holde op

25 Taeligndstikspillet Som beskrevet ovenfor garingr spillet ud paring at farve den ene af siderne roslashd paring 10 taeligndstikker Naringr taeligndstikken kasten op i luften er sandsynligheden for at den roslashde side vender opad naringr den rammer bordet lig med p=025 Man kaster paring skift 10 saringdanne taeligndstikker 10 gange For hvert kast skal man multiplicere antallet af roslashde med et af tallene 110 Hver tal maring kun bruges eacuten gang Den der faringr den stoslashrste sum har vundet Det er klart at en god strategi i det lange loslashb vil give en hoslashjere sum Vi minder om at antallet af X roslashde taeligndstikker er binomialfordelt med primaeligrsandsynlighed p og antalsparameter n=10

102104

3

4

110)(

10

jj

jXPjj

Strategier ved spil 19

Endvidere vil vi anvende de kumulerede sandsynligheder P(X j) og P(X j) Nedenfor er vist resultatet af en Computersimulation af spillet Primaeligr sandsynligheder for n= 10 og p= 0250 P(X=j) j 0 1 2 3 4 5 6 7 8 9 10 00563 01877 02816 02503 01460 00584 00162 00031 00004 00000 00000 Baglaeligns kumulerede sandsynligheder P(Xgt=q) j 0 1 2 3 4 5 6 7 8 9 10 10000 09437 07560 04744 02241 00781 00197 00035 00004 00000 00000 1 kast Antal = 2 Vaeliglg mellem 1 2 3 4 5 6 7 8 910 Faktor= 4 2 kast Antal = 4 Vaeliglg mellem 1 2 3 5 6 7 8 910 Faktor=10 3 kast Antal = 2 Vaeliglg mellem 1 2 3 5 6 7 8 9 Faktor= 5 4 kast Antal = 2 Vaeliglg mellem 1 2 3 6 7 8 9 Faktor= 3 5 kast Antal = 3 Vaeliglg mellem 1 2 6 7 8 9 Faktor= 8 6 kast Antal = 2 Vaeliglg mellem 1 2 6 7 9 Faktor= 6 7 kast Antal = 6 Vaeliglg mellem 1 2 7 9 Faktor=9 8 kast Antal = 3 Vaeliglg mellem 1 2 7 Faktor= 2 9 kast Antal = 2 Vaeliglg mellem 1 7 Faktor= 7 10 kast Antal = 2 Vaeliglg mellem 1 Faktor= 1 Din score er 176 Valget af tallene 110 er i dette tilfaeliglde foretaget ud fra den optimale strategi som vi vil omtale om et oslashjeblik Foslashr vi analyserer den optimale strategi for dette spil vil vi forsoslashge os med en intuitiv bedste strategi Vi belyser denne strategi med et konkret eksempel Lad os feks antage at vi slaringr 4 roslashde i den 3 kast (3 forsoslashg) De tal vi har tilbage kalder vi (y8 y7 y6 y5 y4 y3 y2 y1) Sposlashrgsmaringlet om vi skal gange med det stoslashrste y8 eller det naeligststoslashrste y7 osv Vi raeligsonnerer da som foslashlger Hvis sandsynligheden for at slaring mere end 4 roslashde i de resterende 7 kast er stoslashrre end frac12 saring skal vi vaeliglge det naeligststoslashrste Vi skaeligrper dette Hvis sandsynligheden for at slaring mindst 5 roslashde mindst en gang i de resterende 7 kast er stoslashrre end frac12 saring skal vi vaeliglge det naeligststoslashrste Tilsvarende hvis sandsynligheden for at slaring mindst 5 roslashde mindst 2 gange i de resterende 7 kast skal vi vaeliglge det 3 stoslashrstehellipog saringdan fremdeles Strategien virker umiddelbart meget plausibel Sandsynlighederne kan direkte farings af binomialfordelingen Foslashrst sandsynligheden for at faring mindst q-roslashde i et kast Dette er

P(X q) =

n

qj

jXP )( hvor P(X = j) er angivet ovenfor

Strategier ved spil 20

Sandsynligheden for at dette sker mindst r gange i n - k kast er ogsaring en binomialfordeling og kan skrives

P(X q mindst r gange i n - k kast ) = jknjkn

rj

qXPqXPj

kn

))(1()(

Beregningen af disse (110) sandsynligheder goslashres nok lettest paring en computer For at lave en strategi-tabel goslashr man det at for hvert kast og hvert antal mulige roslashde vaeliglger man foslashrst det stoslashrste af de resterende tal Dernaeligst beregner man sandsynligheden for at faring mindst 1 roslashd mere i et af de foslashlgende kast Hvis denne sandsynlighed er stoslashrre end frac12 ser man paring det naeligststoslashrste af de resterende tal Man beregner saring sandsynligheden for at faring mindst 1 roslashd mere i mindst to af de resterende kast Hvis denne sandsynlighed er stoslashrre end frac12 saring vaeliglger man det tredjestoslashrste af de resterende tal og saringdan fremdeleshellip Det bemaeligrkes at beregningen skal initialiseres med at man altid vaeliglger det mindste hvis man slaringr 0 roslashde og altid vaeliglger det stoslashrste hvis man slaringr 10 roslashde Nedenfor er vist en computerberegning af en strategi-tabel Endvidere er ogsaring lavet en saringkaldt Monte-Carlo simulation Dette betyder at man har ladet maskinen spille feks 10000 spil spillet efter strategi-tabellen Nederst er vist hyppighederne for ens score og endelig fordelingsfunktionen for observationerne (Den kumulerede frekvens) P(X =j) for n =10 and p = 0250 j 0 1 2 3 4 5 6 7 8 9 10 P(X =j)0056 0188 0282 0250 0146 0058 00162 0003 00004 0000 0000 P(Xgt=j) for n =10 and p = 0250 j 0 1 2 3 4 5 6 7 8 9 10 P(Xgt=j) 1000 0944 0756 0474 0224 0078 00197 00035 00004 0000 0000 Strategi tabel Tallene refererer ikke til faktorene selv men til den stoslashrste naeligststoslashrste osv Eksempel Hvis man slaringr 3 roslashde i den andet kast saring skal man vaeliglge (7) den tredjestoslashrste Kast no 1 2 3 4 5 6 7 8 9 10 score 0 1 1 1 1 1 1 1 1 1 1 1 3 3 3 2 2 2 2 1 1 1 2 6 5 5 4 4 3 3 2 2 1 3 8 7 7 6 5 4 3 3 2 1 4 9 9 8 7 6 5 4 3 2 1 5 10 9 8 7 6 5 4 3 2 1 6 10 9 8 7 6 5 4 3 2 1 7 10 9 8 7 6 5 4 3 2 1 8 10 9 8 7 6 5 4 3 2 1 9 10 9 8 7 6 5 4 3 2 1 10 10 9 8 7 6 5 4 3 2 1 Gennemsnitlig score = 16437

Strategier ved spil 21

Hyppighed af score h( 75)= 1 h( 80)= 7 h( 85)= 3 h( 90)= 5 h( 95)= 6 h(100)= 34 h(105)= 38 h(110)= 82 h(115)= 68 h(120)=161 h(125)=146 h(130)=320 h(135)=280 h(140)=534 h(145)=425 h(150)=752 h(155)=577 h(160)=878 h(165)=645 h(170)=956 h(175)=651 h(180)=863 h(185)=527 h(190)=609 h(195)=351 h(200)=389 h(205)=180 h(210)=203 h(215)= 93 h(220)= 86 h(225)= 47 h(230)= 32 h(235)= 21 h(240)= 13 h(245)= 8 h(250)= 3 h(255)= 0 h(260)= 4 h(265)= 1 h(270)= 1 h(275)= 0 h(280)= 0 Frekvens of score F( 80)=00008 F( 85)=00011 F( 90)=00016 F( 95)=00022 F(100)=00056 F(105)=00094 F(110)=00176 F(115)=00244 F(120)=00405 F(125)=00551 F(130)=00871 F(135)=01151 F(140)=01685 F(145)=02110 F(150)=02862 F(155)=03439 F(160)=04317 F(165)=04962 F(170)=05918 F(175)=06569 F(180)=07432 F(185)=07959 F(190)=08568 F(195)=08919 F(200)=09308 F(205)=09488 F(210)=09691 F(215)=09784 F(220)=09870 F(225)=09917 F(230)=09949 F(235)=09970 F(240)=09983 F(245)=09991 F(250)=09994 F(255)=09994 F(260)=09998 F(265)=09999 F(270)=10000 F(275)=10000

Som det fremgaringr af tabellen for P(X gt= j) er der kun 78 chance for at slaring 5 roslashde eller derover saring goslashr man det skal man altid vaeliglge det stoslashrste af de resterende tal For 3 eller 4 roslashde er situationen langt mere uigemmeskuelig og kun en beregning kan afgoslashre sagen Vi proslashver nu at finde den optimale strategi eller Snell-strategien Hvad angaringr sposlashrgsmaringlet om hvorvidt vi skal vaeliglge den stoslashrste eller naeligststoslashrste saring lader det sig faktisk goslashre at beregne Snell-strategien paring en computer De foslashlgende tilfaeliglde bliver derimod for komplicerede og der anvender vi en svagt forbedret version af vores intuitive strategi Forbedringen bestaringr i foslashlgende idet vi illustrerer det med et eksempel Lad os sige vi har slaringet 3 roslashde og vi overvejer om vi vil gange det med 7 eller 6 Ganger vi med 6 er det fordi vi forventer at slaring mindst 4 roslashde mindst en gang i de resterende kast Vores score vil vaeligre 73 og 74 henholdsvis og scoren vil blive forbedret med en faktor 43 hvis vi ganger med 6 under forventning af at slaring 4 roslashde Vores forbedring af strategien garingr da ud paring at vi vaeliglger det naeligststoslashrste 6 hvis sandsynligheden for at slaring 4 roslashde gange den relative forbedring 43 er stoslashrre end frac12 Vi rekapitulerer dernaeligst Snell-strategien G10 = X10 X10 Stokastisk variabel = antallet af roslashde i det 10 kast G9 = max X9 E(G10) E(G10) = E(X10) = np=10025 = 25 X9 = 01hellip10 Gk = max Xk E(Gk+1) E(Gk) kraeligver en laeligngere udregning men den udregnes som en

almindelig middelvaeligrdi altsaring som max af de to vaeligrdier gange P(X=Xk-1) G1 = max X1 E(G2) Som eksempel udregner vi E(G9) Da E(G10)=25 skal vi for X9 = 012 anvende E(G10)=25 i udregningen

Strategier ved spil 22

E(G9) = 25 (P(X=0)+P(X=1)+P(X=2))+ 3P(X=3)+hellip+10P(X=10) =306 Vaeligrdierne for E(Gk) er alle udregnet og vist i computerberegningen nedenfor Bemaeligrk isaeligr at de vokser fra 25 til 425 naringr k aftager fra 10 til 2 Strategien er nu foslashlgende Vaeliglg det stoslashrste af de resterende tal hvis Xk gt E(Gk+1) (altsaring det antal man har slaringet er er stoslashrre end det forventede stoslashrste antal) ellers vaeliglg det naeligststoslashrste Ved afgoslashrelsen om de 3 stoslashrste 4 stoslashrste osv anvender vi den hidtidige strategi med den modifikation at vi multiplicerer sandsynligheden med den formodede relative forbedring E(G10-kast)antal roslashde En computerberegning helt svarende til den foregaringende men med den aeligndrede strategi er vist nedenfor Man bemaeligrker for det foslashrste de smaring aeligndringer der er i strategien Den nye strategi er lidt mindre forsigtig men den giver altsaring ogsaring pote i form af en forbedring af gennemsnittet paring ca 275 Primaeligr sandsynligheder P(X=j) for n= 10 og p= 0250 j 0 1 2 3 4 5 6 7 8 9 10 P(X=j)0056 0188 0282 0250 0146 0058 0016 00031 00004 00000 00000 Baglaeligns Kumulerede sandsynligheder P(Xgt=j) j 0 1 2 3 4 5 6 7 8 9 10 P(Xgt=j) 1000 0944 0756 0474 0224 0078 00197 00035 00004 00000 00000 E(G[10])= 250 E(G[9])= 306 E(G[8])= 337 E(G[7])= 362 E(G[6])= 380 E(G[5])= 395 E(G[4])= 406 E(G[3])= 416 E(G[2])= 425 kast nr 1 2 3 4 5 6 7 8 9 10 score 0 1 1 1 1 1 1 1 1 1 1 1 2 2 1 1 1 1 1 1 1 1 2 5 4 4 3 3 3 2 2 1 1 3 8 7 6 5 5 4 3 2 2 1 4 9 8 7 7 6 5 4 3 2 1 5 10 9 8 7 6 5 4 3 2 1 6 10 9 8 7 6 5 4 3 2 1 7 10 9 8 7 6 5 4 3 2 1 8 10 9 8 7 6 5 4 3 2 1 9 10 9 8 7 6 5 4 3 2 1 10 10 9 8 7 6 5 4 3 2 1 Gennemsnitlig gevinst ms = 16727 Hyppigheder af score h( 75)= 1 h( 80)= 1 h( 85)= 0 h( 90)= 3 h( 95)= 2 h(100)= 5 h(105)= 4 h(110)= 9 h(115)= 12 h(120)= 12 h(125)= 17 h(130)= 22 h(135)= 28 h(140)= 39 h(145)= 24 h(150)= 49 h(155)= 54 h(160)= 74 h(165)= 63 h(170)=117 h(175)= 63 h(180)= 91 h(185)= 57 h(190)= 72 h(195)= 39 h(200)= 36 h(205)= 35 h(210)= 29 h(215)= 14 h(220)= 21 h(225)= 1 h(230)= 5 h(235)= 1 h(240)= 0 h(245)= 0 h(250)= 0 h(255)= 0 h(260)= 0 h(265)= 0 h(270)= 0 h(275)= 0 h(280)= 0

Strategier ved spil 23

Frekvens af score F( 80)=00020 F( 85)=00020 F( 90)=00050 F( 95)=00070 F(100)=00120 F(105)=00160 F(110)=00250 F(115)=00370 F(120)=00490 F(125)=00660 F(130)=00880 F(135)=01160 F(140)=01550 F(145)=01790 F(150)=02280 F(155)=02820 F(160)=03560 F(165)=04190 F(170)=05360 F(175)=05990 F(180)=06900 F(185)=07470 F(190)=08190 F(195)=08580 F(200)=08940 F(205)=09290 F(210)=09580 F(215)=09720 F(220)=09930 F(225)=09940 F(230)=09990 F(235)=10000 F(240)=10000 F(245)=10000 F(250)=10000 F(255)=10000 F(260)=10000 F(265)=10000 F(270)=10000 F(275)=10000

Maringske er det ikke en saeligrlig imponerende forbedring fra den foslashrste strategi men det er en teoretisk milepaeligl at man er i stand til at angive den bedste strategi for bestemte typer af spil Som omtalt har vi ikke forsoslashgt at bevise at Snell-Strategien er den optimale Strategi men det kan bevises Det er vigtigt at notere sig at i alle de omtalte spil har udfaldene vaeligre stokastiske variable dvs uforudsigelige men med bestemte sandsynligheder og at disse sandsynligheder ikke bliver aeligndret af den strategi man foslashlger I mange af de spil hvor man ofte moslashder begrebet strategi feks skak krig finansmarked og markedsfoslashring er dette langt fra tilfaeligldet Hvis feks alle boslashrsspekulanter fulgte den samme optimale strategi med boslashrskursen som stokastisk variabel ville det nok vise sig at det var den daringrligste strategi af alle Teorien for dynamiske strategier hvor de stokastiske variable er funktioner af tiden og af den valgte strategi er teoretisk naeligsten ufremkommelige

Strategier ved spil 24

Indeks Casino516 Computersimulation18 definitionen af sandsynlighed 1 Den optimale Snell-strategi11 forsikringsmatematik 5 Indbrudstyvens pensionsproblem912 kortsigtede strategi 10 kumulerede frekvens 19 langsigtede strategi 10 lotto 1 Mandagschancen14 Mandags-chancen9 Martingale-systemet16

Optimale Strategier 10 Poker 3 rekursionsligning 6 roulette 57 Roulette spil 10 roulettespiller 7 ruinsandsynligheder 5 Skaeligbnen913 Snell-strategien 11 Stopbetingelsen11 strategi9 Taeligndstikspillet1018

Page 14: Sandsynligheder og strategier ved spil - Ole Witt-Hansen ...olewitthansen.dk/Matematik/Sandsynligheder_og_strategier_ved_spil… · 6dqgv\qoljkhghu yhg vslo 3n vdpph pngh ndq yl ilqgh

Strategier ved spil 12

understrege at det kan bevises I matematisk forstand Ulemperne ved Snell-strategien er at den for selv simple problemer kan foslashre til ret omfattende og komplicerede regninger

2 Den optimale Snell-strategi Snell-strategien er paring sin vis den samme som den kortsigtede strategi men hvor man i denne strategi hele tiden regner sig et skridt frem saring tager Snell-strategien udgangspunkt i spillets slutning og arbejder sig baglaeligns Vi indfoslashrer foslashrst nogle betegnelser Vi antager at spillet har n trin Sk er en stokastisk variabel der angiver den faktiske samlede gevinst man har opnaringet ved det kte spil Sk kan antage en eller flere vaeligrdier med tilhoslashrende sandsynligheder Det nye ved Snell-strategien er at man definerer endnu en stokastisk variabel Gk ved ligningen

Gk = maxSk E(Gk+1| S1Sk) Gk er den stoslashrste af vaeligrdierne Sk (gevinsten efter det kte spil) og E(Gk+1| S1Sk)) som er middelvaeligrdien af den maximale forventede gevinst i det k+1te spil naringr det er givet at man har spillet spillene 1k Dette opstilles i et skema Gn = Sn Gevinsten ved spillets afslutning Gn-1 = maxSn-1 E(Gn| S1Sn-1) Gk = maxSk E(Gk+1| S1Sk) G1 = maxS1 E(G2| S1) Snell strategien siger nu at man skal standse spillet den foslashrste gang Sk (gevinsten efter det kte spil) overstiger middelvaeligrdien af den maksimale forventede gevinst i det k+1te spil Dette kaldes for stopbetingelsen Stopbetingelsen er altsaring

Sk E(Gk+1| S1Sk) Man skal altsaring standse spillet naringr den opnaringede gevinst er stoslashrre eller lig med den betingede forventning af den maximale gevinst i det naeligste spil Det kunne lyde som den kortsigtede strategi men forskellen er den at i den kortsigtede strategi er Gk+1 erstattet af Sk+1 At kunne gennemskue konsekvenserne af dette er derimod ikke saring nemt Det viser sig at i mange tilfaeliglde at er Snell-Strategien identisk med den kortsigtede strategi som kraeligver at man stopper naringr Sk E(Sk+1| S1Sk) Snell strategien er ikke umiddelbart let gennemskuelig og udregningen af de betingede middelvaeligrdier E(Gk+1| S1Sk) er ofte ret teknisk Vi vil nu behandle de foslashr naeligvnte eksempler og begynder med

Strategier ved spil 13

21 Indbrudstyvens pensionsproblem Lad os antage at Arthurs gennemsnitlige gevinst ved hvert tyvetogt er K = 6000 kr og at chancen er at han bliver taget er 5 Lad os antage at hans hidtidige gevinst efter k - tyvetugt er Sk som bliver konfiskeret - og som han derved mister hvis han bliver snuppet I dette tilfaeliglde kan man - som vist nedenfor - se at den kortsigtede strategi er den optimale strategi Det haelignger sammen med at alle trin i spillet er identiske Gevinsten ved hvert tyvetogt er den samme ndash uafhaeligngigt af de foregaringende tyvetugter - bortset fra at den samlede gevinst vokser ved hvert vellykket tyvetogt Xk betegner den stokastiske variabel som er Arthurs gevinst ved eacutet tyvetugt Hermed er

Sk =X1+ X2+ X3+hellip Xk Xk+1 kan antage vaeligrdien K med sandsynlighed 1-ps = 1-P(Snuppet) (altsaring hvis det naeligste tyvetugt lykkes) og vaeligrdien ndashSk (han mister hele sin opsparing) med sandsynlighed ps = P(Snuppet) Vi opskriver nu Snell-strategien (Den kortsigtede strategi) for et trin i hans karriere

Gk = max Sk E(Sk+1| 1k)

Sk er hans gevinst efter k tyvetugter og E(Sk+1| 1k) er hans forventede gevinst efter k+1 tyvetugter E(Sk+1| 1k) kan beregnes som den hidtidige gevinst plus den forventede gevinst ved naeligste tyve- tugt i alt lig med Sk + E(Xk+1) E(Xk+1) er uafhaeligngig af de foslashrste k - tyvetugter derfor bliver stopbetingelsen Sk gt Sk + E(Xk+1) E(Xk+1) lt 0 Middelvaeligrdien E(Xk+1) kan saringledes udregnes efter den saeligdvanlige definition idet Xk+1 antager vaeligrdierne K (gevinsten ved et tyvetugt) og - Sk (mister hele sin opsparing) med sandsynlighederne 1-ps og ps henholdsvis E(Xk+1) = K(1- ps) - Sk ps Han skal standse naringr

E(Xk+1) lt 0 K(1- ps) lt Sk ps som med tal eksemplet giver

6000095 lt Sk005 Sk gt 114000- kr svarende til 114006000 = 095005 = 19 tyvetugter

(Det goslashr han nu nok ikke og er derfor henvist til at leve af folkepensionen efter nogle aringr i skyggen) Man kunne godt tro at dette eksempel kunne anvendes paring andre (ligesaring uetiske) problemstillinger Feks hvor mange gange det er optimalt at koslashre gratis i S-tog Det kan det imidlertid ikke helt

Strategier ved spil 14

Sagen er jo den at man faringr en fast boslashde hvis man bliver snuppet men man kommer ikke til at betale for de gange man har koslashrt gratis Med andre ord vurderingen om hvorvidt det er fordelagtigt at koslashre uden billet afhaelignger kun af middelgevinsten ved det naeligste forsoslashg Hvis den er positiv er det fordelagtigt at fortsaeligtte men hvis den er negativ er det fordelagtigt at loslashse billet (Det er i oslashvrigt uetisk at snyde ndash naturligvis) Tager vi et eksempel billetprisen er kr 50- Boslashden er kr 500 Sandsynligheden for at blive snuppet er Ps = 01 Hvis X er gevinsten ved at koslashre uden billet er E(X) = 50middot(1-Ps)-500middotPs = 50middot09-500middot01 = -50 Det er saringledes (med denne sandsynlighed for at blive snuppet) ikke fordelagtigt at koslashre uden billet i S-tog Da en laeligrebog i sandsynligheder ved spil naturligvis ikke maring tilskynde til uetiske handlinger undlader vi at foretage beregningen med Ps = 005

22 Skaeligbnen Vi betragter kast med to terninger X betegner summen af oslashjentallene ved eacutet kast Sandsynlighedsfordelingen for X er velkendt Feks er P(X=5) = 436 Sandsynligheden for at terningerne viser j oslashjne kan skrives som

36

76)(

jjXP

Lad os antage at spillerens skaeligbne er q Hvis man slaringr dette oslashjental er alt tabt Ellers adderes oslashjentallene for hvert kast Hvis ikke man har slaringet sin skaeligbne saring er den samlede gevinst efter n spil

Sn = X1+ X2+ X3+hellip +Xn

Og middelvaeligrdien af Sn er

E(Sn) = E(X1)+ E(X2)+E(X3)+hellip +E(Xn) = nE(X | X q) E(X | X q) er den betingede middelvaeligrdi af oslashjentallene givet at man ikke slaringr sin skaeligbne

E(X | X q) = 2P(2) +3P(3)+hellip(q-1)P(q-1) + (q+1)P(q+1)+hellip+12P(12) Den kortsigtede strategi (og Snell strategien) fastslaringr at man skal standse naringr middelvaeligrdien af den forventede gevinst ved naeligste kast er negativ Argumentet for dette kan overtages naeligsten ordret fra indbrudstyvens pensionsproblem E(Sk+1|S1 Sk) kan beregnes som den hidtidige gevinst Sk plus den forventede gevinst ved det naeligste kast i alt lig med Sk + E(Xk+1| S1 Sk) Stopbetingelsen er derfor

Sk gt Sk + E(Xk+1| S1 Sk) E(Xk+1| S1 Sk) lt 0

Strategier ved spil 15

E(X | X q) ndash SnP(q) lt 0 Sn gt E(X | X q) P(q) Det er ikke saeligrlig svaeligrt at udregne stopbetingelsen feks for q = 2 og q = 6 Nedenfor er vist udskriften fra et program som foretager beregningen for q = 212 Forventet gevinst i naeligste kast naringr ens skaeligbne er q q 2 3 4 5 6 7 8 9 10 11 12 694 683 667 644 617 583 589 600 617 639 667 Stop naringr din gevinst S gt EX(q)P(q) naringr skaeligbne er q q 2 3 4 5 6 7 8 9 10 11 12 25000 12300 8000 5800 4440 3500 4240 5400 7400 11500 24000

Som det fremgaringr er der endog meget stor forskel paring stoptiderne afhaeligngig af ens skaeligbne

23 Mandagschancen Dette spil er lidt mere interessant fordi det ikke er helt saring enkelt at gennemskue I dette tilfaeliglde kan man ikke forvente at den kortsigtede strategi vil foslashre til den optimale strategi At den faktisk goslashr det skyldes talvaeligrdierne Dette skal forstarings saringledes at hvis man aeligndrede paring praeligmiestoslashrrelserne ville Snell-strategien afvige fra den kortsigtede strategi Vi vil analysere spillet ved Snell-strategien Som naeligvnt har man i spillet 9 tildaeligkkede felter (101025255050100100250) Man kan afdaeligkke hoslashjest 3 felter Man faringr beloslashbet i 1000 kr som det sidste felt viser Hvis X er den stokastiske variabel som angiver vaeligrdien af et felt saring vil de fleste uden saring lange overvejelser vel fortsaeligtte hvis Xlt50 og standse hvis X100 Det kritiske er hvis man afdaeligkker 50 (X=50) Vi bemaeligrker foslashrst at summen af alle felterne er S=620 og at E(X) =6209=689 Vi opskriver foslashrst den fuldstaeligndige Snell-strategi for dette spil G3 =X3 Den Stokastiske variabel G3 = Gevinsten = X3 = vaeligrdien af det sidst afdaeligkkede felt G2 = max X2 E(G3| X1X2 ) Den stoslashrste af vaeligrdierne X2 (= vaeligrdien af det afdaeligkkede

felt) og den betingede middelvaeligrdi af G3 = X3 G1 = max X1 E(G2| X1 ) Som ovenfor Kriteriet for den optimale strategi er som tidligere Stop hvis paring noget trin Xk gt E(Gk+1| X1Xk ) Det er relativ nemt at opstille en formel for E(G3| X1X2 ) Naringr X1 og X2 er afdaeligkket er summen de resterende felter S - X1 - X2 Da alle felter har samme sandsynlighed er middelvaeligrdien simpelthen middeltallet af felterne E(G3| X1X2 ) = ( S - X1 - X2)(9-2)

Strategier ved spil 16

Det er noget mere teknisk at opstille en formel for E(G2| X1 ) og ogsaring lidt teknisk at foretage beregningen Vi vil noslashjes med at skitsere beregningen for en vaeligrdi af X1 og i oslashvrigt henvise til resultatet af et Computerprogram som kan ses nedenfor Lad os antage at X1 = 25 Vi lader nu X2 gennemloslashbe alle de mulige vaeligrdier (alle vaeligrdier skal taeliglles med det antal gange der er felter med denne vaeligrdi) For hver vaeligrdi af X2 (feks 50) skal vi vaeliglge max af X2 og E(G3| X1X2 ) = ( S - X1 - X2) (9-2) (= (620-50-25)7 = 778 i dette tilfaeliglde) og addere det til en sum S2 E(G2| X1 ) er da lig med S2(9-1) (da der er 9-1 felter X2 ) X2[1]= 1000 E(G3)= 8571 G2= 8571 X2[2]= 2500 E(G3)= 8357 G2= 8357 X2[3]= 5000 E(G3)= 8000 G2= 8000 X2[4]= 10000 E(G3)= 7286 G2= 10000 X2[5]= 25000 E(G3)= 5143 G2= 25000 X1[1]= 1000 E(G[2])= 10786 X2[1]= 1000 E(G3)= 8357 G2= 8357 X2[2]= 2500 E(G3)= 8143 G2= 8143 X2[3]= 5000 E(G3)= 7786 G2= 7786 X2[4]= 10000 E(G3)= 7071 G2= 10000 X2[5]= 25000 E(G3)= 4929 G2= 25000 X1[2]= 2500 E(G[2])= 10679 X2[1]= 1000 E(G3)= 8000 G2= 8000 X2[2]= 2500 E(G3)= 7786 G2= 7786 X2[3]= 5000 E(G3)= 7429 G2= 7429 X2[4]= 10000 E(G3)= 6714 G2= 10000 X2[5]= 25000 E(G3)= 4571 G2= 25000 X1[3]= 5000 E(G[2])= 10500 X2[1]= 1000 E(G3)= 7286 G2= 7286 X2[2]= 2500 E(G3)= 7071 G2= 7071 X2[3]= 5000 E(G3)= 6714 G2= 6714 X2[4]= 10000 E(G3)= 6000 G2= 10000 X2[5]= 25000 E(G3)= 3857 G2= 25000 X1[4]= 10000 E(G[2])= 9643 X2[1]= 1000 E(G3)= 5143 G2= 5143 X2[2]= 2500 E(G3)= 4929 G2= 4929 X2[3]= 5000 E(G3)= 4571 G2= 5000 X2[4]= 10000 E(G3)= 3857 G2= 10000 X1[5]= 25000 E(G[2])= 6268 Ser man resultaterne igennem kan de udmoslashntes i en simpel regel Fortsaeligt paring 50 eller derunder Stop paring 100 eller derover Det er maringske lidt overraskende at man ogsaring skal forsaeligtte paring 50000 hvis man kun har et forsoslashg tilbage ndash man kunne jo ende med 10000 og det er saring bare aeligrgerligt ndash og det er vist nok de fleste som standser ved 50000 - men det er ikke den bedste strategi

Strategier ved spil 17

24 Casino Som naeligvnt i indledningen til dette afsnit findes der ingen strategi som kan bringe en i stand til at vinde paring et Casino ndash i det lange loslashb Vil man goslashre Casino-spil til en levevej vil det altid med matematisk sikkerhed ende med ruin Det betyder imidlertid ikke at man ikke kan vinde ved at garing paring Casino men hvis man taelignker paring at spraelignge banken saring skal to krav i hvert fald vaeligre opfyldt for at der skal vaeligre en ikke forsvindende sandsynlighed for at det kan lade sig goslashre 1 Man skal have flere penge end Casino 2 Der maring ikke vaeligre loft over indsatserne Begge betingelser er som bekendt aldrig opfyldt Man kan som sagt godt vinde paring et Casino men hvis man satser paring at vinde mere (alle de gange man er paring Casino i sit liv) end det beloslashb man medbringer ved hvert besoslashg saring vil chancerne for at tabe det hele vaeligre stoslashrst Her er der tale om sandsynligheder og middelvaeligrdier ndash om odds Selvfoslashlgelig er de muligt at tabe hele sin formue ved foslashrste besoslashg eller vinde det tredobbelte ved det andet Der har i tidens loslashb vaeligret lanceret flere eksempler paring vinderstrategier som lyder uhyre besnaeligrende Den mest kendte er Martingale-systemet Man spiller kun paring sort og roslashd hvor faringr man faringr fordoblet sin indsats hvis man vinder Spillet er saringledes helt lige bortset fra at indsatserne bliver liggende naringr zero kommer ud og man kun faringr sin indsats en gang hvis man vinder i naeligste spil (zero har ingen farve) Spiller man efter Martingale-systemet skal man inkassere sin gevinst hvis man vinder Hvis man derimod taber skal man fordoble sin indsats Vi saeligtter grundindsatsen til 1 Har man spillet n gange og dermed doblet op n-1 gange har man lagt en indsats Sn = 1 + 2 + 22 +hellip2n-1 = 2n ndash1 Udregnet af kvotientraeligkkeformlen

1

10

q

qaS

n

n

for raeligkken Sn = a0 + a0q+ a0q

2+hellip+ a0qn-1

Vinder man det nte spil faringr man udbetalt 22

n-1 = 2n saring ens gevinst er 2n - (2n - 1) = 1 Der gaeliglder aringbenbart den simple kendsgerning at bliver man bare ved med at fordoble saring har man altid vundet eacuten indsats Foslashr man forsoslashger sig med dette skal man dog nok goslashre sig klart hvor mange gange man kan tabe foslashr man er ruineret

Strategier ved spil 18

Sandsynligheden for at man taber 5 spil er (frac12)5 = 132 Man har da tabt 25 ndash 1 gange vaeligrdien af en jeton (i Danmark 50 kr) dvs 1550 kr Vil man sikre sig bedre feks ved at kunne doble op 9 gange (sandsynligheden for at tabe 10 spil er 11024) saring skal man komme med kr 51150- men det kan man ikke engang gennemfoslashre da hoslashjeste indsats i Danmark er 24000- Man kunne imidlertid stille det sposlashrgsmaringl Hvis man har n-jetoner hvad er saring sandsynligheden for at vinde q-jetoner hvis man spiller efter Martingale-systemet Dette kan man faktisk godt udregne direkte men regningerne er ret omfattende Derimod er resultatet simpelt Vi vil ikke lave en direkte udregning men anvende de samme metoder som vi har anvendt for den bedste strategi Vi tager udgangspunkt i det faktum at sort roslashd Casino spil er et lige spil saring middelvaeligrdien af gevinsten er 0 ligegyldigt hvordan man spiller Middelvaeligrdien (som er nul ) af en gevinst paring q-jetoner er lig med q gange sandsynligheden P(q) for at vinde q jetoner minus ens kapital (n jetoner) gange med sandsynligheden for at man taber det sidste spil som er 1 ndash P(q)

qP(q) ndash n(1 ndashP(q)) = 0 qn

nqP

)(

Har man feks n = 31 jetoner (1550- kr) er sandsynligheden for at vinde q=10 (500 kr) lig med 0756 En rimelig stor sandsynlighed men altsaring stadig 25 chance for ruin Oslashnsker man derimod at blive rigtig rig og vinde 10000- kr dvs q=200 er P(200) = 0134 Konklusionen er den at satser man paring at vinde mere end man medbringer saring er sandsynligheden mindre end frac12 men kan man noslashjes med mindre saring er sandsynligheden stoslashrre end frac12 Men bemaeligrk dette gaeliglder fra foslashrste gang man garingr ind paring et Casino til man beslutter at holde op

25 Taeligndstikspillet Som beskrevet ovenfor garingr spillet ud paring at farve den ene af siderne roslashd paring 10 taeligndstikker Naringr taeligndstikken kasten op i luften er sandsynligheden for at den roslashde side vender opad naringr den rammer bordet lig med p=025 Man kaster paring skift 10 saringdanne taeligndstikker 10 gange For hvert kast skal man multiplicere antallet af roslashde med et af tallene 110 Hver tal maring kun bruges eacuten gang Den der faringr den stoslashrste sum har vundet Det er klart at en god strategi i det lange loslashb vil give en hoslashjere sum Vi minder om at antallet af X roslashde taeligndstikker er binomialfordelt med primaeligrsandsynlighed p og antalsparameter n=10

102104

3

4

110)(

10

jj

jXPjj

Strategier ved spil 19

Endvidere vil vi anvende de kumulerede sandsynligheder P(X j) og P(X j) Nedenfor er vist resultatet af en Computersimulation af spillet Primaeligr sandsynligheder for n= 10 og p= 0250 P(X=j) j 0 1 2 3 4 5 6 7 8 9 10 00563 01877 02816 02503 01460 00584 00162 00031 00004 00000 00000 Baglaeligns kumulerede sandsynligheder P(Xgt=q) j 0 1 2 3 4 5 6 7 8 9 10 10000 09437 07560 04744 02241 00781 00197 00035 00004 00000 00000 1 kast Antal = 2 Vaeliglg mellem 1 2 3 4 5 6 7 8 910 Faktor= 4 2 kast Antal = 4 Vaeliglg mellem 1 2 3 5 6 7 8 910 Faktor=10 3 kast Antal = 2 Vaeliglg mellem 1 2 3 5 6 7 8 9 Faktor= 5 4 kast Antal = 2 Vaeliglg mellem 1 2 3 6 7 8 9 Faktor= 3 5 kast Antal = 3 Vaeliglg mellem 1 2 6 7 8 9 Faktor= 8 6 kast Antal = 2 Vaeliglg mellem 1 2 6 7 9 Faktor= 6 7 kast Antal = 6 Vaeliglg mellem 1 2 7 9 Faktor=9 8 kast Antal = 3 Vaeliglg mellem 1 2 7 Faktor= 2 9 kast Antal = 2 Vaeliglg mellem 1 7 Faktor= 7 10 kast Antal = 2 Vaeliglg mellem 1 Faktor= 1 Din score er 176 Valget af tallene 110 er i dette tilfaeliglde foretaget ud fra den optimale strategi som vi vil omtale om et oslashjeblik Foslashr vi analyserer den optimale strategi for dette spil vil vi forsoslashge os med en intuitiv bedste strategi Vi belyser denne strategi med et konkret eksempel Lad os feks antage at vi slaringr 4 roslashde i den 3 kast (3 forsoslashg) De tal vi har tilbage kalder vi (y8 y7 y6 y5 y4 y3 y2 y1) Sposlashrgsmaringlet om vi skal gange med det stoslashrste y8 eller det naeligststoslashrste y7 osv Vi raeligsonnerer da som foslashlger Hvis sandsynligheden for at slaring mere end 4 roslashde i de resterende 7 kast er stoslashrre end frac12 saring skal vi vaeliglge det naeligststoslashrste Vi skaeligrper dette Hvis sandsynligheden for at slaring mindst 5 roslashde mindst en gang i de resterende 7 kast er stoslashrre end frac12 saring skal vi vaeliglge det naeligststoslashrste Tilsvarende hvis sandsynligheden for at slaring mindst 5 roslashde mindst 2 gange i de resterende 7 kast skal vi vaeliglge det 3 stoslashrstehellipog saringdan fremdeles Strategien virker umiddelbart meget plausibel Sandsynlighederne kan direkte farings af binomialfordelingen Foslashrst sandsynligheden for at faring mindst q-roslashde i et kast Dette er

P(X q) =

n

qj

jXP )( hvor P(X = j) er angivet ovenfor

Strategier ved spil 20

Sandsynligheden for at dette sker mindst r gange i n - k kast er ogsaring en binomialfordeling og kan skrives

P(X q mindst r gange i n - k kast ) = jknjkn

rj

qXPqXPj

kn

))(1()(

Beregningen af disse (110) sandsynligheder goslashres nok lettest paring en computer For at lave en strategi-tabel goslashr man det at for hvert kast og hvert antal mulige roslashde vaeliglger man foslashrst det stoslashrste af de resterende tal Dernaeligst beregner man sandsynligheden for at faring mindst 1 roslashd mere i et af de foslashlgende kast Hvis denne sandsynlighed er stoslashrre end frac12 ser man paring det naeligststoslashrste af de resterende tal Man beregner saring sandsynligheden for at faring mindst 1 roslashd mere i mindst to af de resterende kast Hvis denne sandsynlighed er stoslashrre end frac12 saring vaeliglger man det tredjestoslashrste af de resterende tal og saringdan fremdeleshellip Det bemaeligrkes at beregningen skal initialiseres med at man altid vaeliglger det mindste hvis man slaringr 0 roslashde og altid vaeliglger det stoslashrste hvis man slaringr 10 roslashde Nedenfor er vist en computerberegning af en strategi-tabel Endvidere er ogsaring lavet en saringkaldt Monte-Carlo simulation Dette betyder at man har ladet maskinen spille feks 10000 spil spillet efter strategi-tabellen Nederst er vist hyppighederne for ens score og endelig fordelingsfunktionen for observationerne (Den kumulerede frekvens) P(X =j) for n =10 and p = 0250 j 0 1 2 3 4 5 6 7 8 9 10 P(X =j)0056 0188 0282 0250 0146 0058 00162 0003 00004 0000 0000 P(Xgt=j) for n =10 and p = 0250 j 0 1 2 3 4 5 6 7 8 9 10 P(Xgt=j) 1000 0944 0756 0474 0224 0078 00197 00035 00004 0000 0000 Strategi tabel Tallene refererer ikke til faktorene selv men til den stoslashrste naeligststoslashrste osv Eksempel Hvis man slaringr 3 roslashde i den andet kast saring skal man vaeliglge (7) den tredjestoslashrste Kast no 1 2 3 4 5 6 7 8 9 10 score 0 1 1 1 1 1 1 1 1 1 1 1 3 3 3 2 2 2 2 1 1 1 2 6 5 5 4 4 3 3 2 2 1 3 8 7 7 6 5 4 3 3 2 1 4 9 9 8 7 6 5 4 3 2 1 5 10 9 8 7 6 5 4 3 2 1 6 10 9 8 7 6 5 4 3 2 1 7 10 9 8 7 6 5 4 3 2 1 8 10 9 8 7 6 5 4 3 2 1 9 10 9 8 7 6 5 4 3 2 1 10 10 9 8 7 6 5 4 3 2 1 Gennemsnitlig score = 16437

Strategier ved spil 21

Hyppighed af score h( 75)= 1 h( 80)= 7 h( 85)= 3 h( 90)= 5 h( 95)= 6 h(100)= 34 h(105)= 38 h(110)= 82 h(115)= 68 h(120)=161 h(125)=146 h(130)=320 h(135)=280 h(140)=534 h(145)=425 h(150)=752 h(155)=577 h(160)=878 h(165)=645 h(170)=956 h(175)=651 h(180)=863 h(185)=527 h(190)=609 h(195)=351 h(200)=389 h(205)=180 h(210)=203 h(215)= 93 h(220)= 86 h(225)= 47 h(230)= 32 h(235)= 21 h(240)= 13 h(245)= 8 h(250)= 3 h(255)= 0 h(260)= 4 h(265)= 1 h(270)= 1 h(275)= 0 h(280)= 0 Frekvens of score F( 80)=00008 F( 85)=00011 F( 90)=00016 F( 95)=00022 F(100)=00056 F(105)=00094 F(110)=00176 F(115)=00244 F(120)=00405 F(125)=00551 F(130)=00871 F(135)=01151 F(140)=01685 F(145)=02110 F(150)=02862 F(155)=03439 F(160)=04317 F(165)=04962 F(170)=05918 F(175)=06569 F(180)=07432 F(185)=07959 F(190)=08568 F(195)=08919 F(200)=09308 F(205)=09488 F(210)=09691 F(215)=09784 F(220)=09870 F(225)=09917 F(230)=09949 F(235)=09970 F(240)=09983 F(245)=09991 F(250)=09994 F(255)=09994 F(260)=09998 F(265)=09999 F(270)=10000 F(275)=10000

Som det fremgaringr af tabellen for P(X gt= j) er der kun 78 chance for at slaring 5 roslashde eller derover saring goslashr man det skal man altid vaeliglge det stoslashrste af de resterende tal For 3 eller 4 roslashde er situationen langt mere uigemmeskuelig og kun en beregning kan afgoslashre sagen Vi proslashver nu at finde den optimale strategi eller Snell-strategien Hvad angaringr sposlashrgsmaringlet om hvorvidt vi skal vaeliglge den stoslashrste eller naeligststoslashrste saring lader det sig faktisk goslashre at beregne Snell-strategien paring en computer De foslashlgende tilfaeliglde bliver derimod for komplicerede og der anvender vi en svagt forbedret version af vores intuitive strategi Forbedringen bestaringr i foslashlgende idet vi illustrerer det med et eksempel Lad os sige vi har slaringet 3 roslashde og vi overvejer om vi vil gange det med 7 eller 6 Ganger vi med 6 er det fordi vi forventer at slaring mindst 4 roslashde mindst en gang i de resterende kast Vores score vil vaeligre 73 og 74 henholdsvis og scoren vil blive forbedret med en faktor 43 hvis vi ganger med 6 under forventning af at slaring 4 roslashde Vores forbedring af strategien garingr da ud paring at vi vaeliglger det naeligststoslashrste 6 hvis sandsynligheden for at slaring 4 roslashde gange den relative forbedring 43 er stoslashrre end frac12 Vi rekapitulerer dernaeligst Snell-strategien G10 = X10 X10 Stokastisk variabel = antallet af roslashde i det 10 kast G9 = max X9 E(G10) E(G10) = E(X10) = np=10025 = 25 X9 = 01hellip10 Gk = max Xk E(Gk+1) E(Gk) kraeligver en laeligngere udregning men den udregnes som en

almindelig middelvaeligrdi altsaring som max af de to vaeligrdier gange P(X=Xk-1) G1 = max X1 E(G2) Som eksempel udregner vi E(G9) Da E(G10)=25 skal vi for X9 = 012 anvende E(G10)=25 i udregningen

Strategier ved spil 22

E(G9) = 25 (P(X=0)+P(X=1)+P(X=2))+ 3P(X=3)+hellip+10P(X=10) =306 Vaeligrdierne for E(Gk) er alle udregnet og vist i computerberegningen nedenfor Bemaeligrk isaeligr at de vokser fra 25 til 425 naringr k aftager fra 10 til 2 Strategien er nu foslashlgende Vaeliglg det stoslashrste af de resterende tal hvis Xk gt E(Gk+1) (altsaring det antal man har slaringet er er stoslashrre end det forventede stoslashrste antal) ellers vaeliglg det naeligststoslashrste Ved afgoslashrelsen om de 3 stoslashrste 4 stoslashrste osv anvender vi den hidtidige strategi med den modifikation at vi multiplicerer sandsynligheden med den formodede relative forbedring E(G10-kast)antal roslashde En computerberegning helt svarende til den foregaringende men med den aeligndrede strategi er vist nedenfor Man bemaeligrker for det foslashrste de smaring aeligndringer der er i strategien Den nye strategi er lidt mindre forsigtig men den giver altsaring ogsaring pote i form af en forbedring af gennemsnittet paring ca 275 Primaeligr sandsynligheder P(X=j) for n= 10 og p= 0250 j 0 1 2 3 4 5 6 7 8 9 10 P(X=j)0056 0188 0282 0250 0146 0058 0016 00031 00004 00000 00000 Baglaeligns Kumulerede sandsynligheder P(Xgt=j) j 0 1 2 3 4 5 6 7 8 9 10 P(Xgt=j) 1000 0944 0756 0474 0224 0078 00197 00035 00004 00000 00000 E(G[10])= 250 E(G[9])= 306 E(G[8])= 337 E(G[7])= 362 E(G[6])= 380 E(G[5])= 395 E(G[4])= 406 E(G[3])= 416 E(G[2])= 425 kast nr 1 2 3 4 5 6 7 8 9 10 score 0 1 1 1 1 1 1 1 1 1 1 1 2 2 1 1 1 1 1 1 1 1 2 5 4 4 3 3 3 2 2 1 1 3 8 7 6 5 5 4 3 2 2 1 4 9 8 7 7 6 5 4 3 2 1 5 10 9 8 7 6 5 4 3 2 1 6 10 9 8 7 6 5 4 3 2 1 7 10 9 8 7 6 5 4 3 2 1 8 10 9 8 7 6 5 4 3 2 1 9 10 9 8 7 6 5 4 3 2 1 10 10 9 8 7 6 5 4 3 2 1 Gennemsnitlig gevinst ms = 16727 Hyppigheder af score h( 75)= 1 h( 80)= 1 h( 85)= 0 h( 90)= 3 h( 95)= 2 h(100)= 5 h(105)= 4 h(110)= 9 h(115)= 12 h(120)= 12 h(125)= 17 h(130)= 22 h(135)= 28 h(140)= 39 h(145)= 24 h(150)= 49 h(155)= 54 h(160)= 74 h(165)= 63 h(170)=117 h(175)= 63 h(180)= 91 h(185)= 57 h(190)= 72 h(195)= 39 h(200)= 36 h(205)= 35 h(210)= 29 h(215)= 14 h(220)= 21 h(225)= 1 h(230)= 5 h(235)= 1 h(240)= 0 h(245)= 0 h(250)= 0 h(255)= 0 h(260)= 0 h(265)= 0 h(270)= 0 h(275)= 0 h(280)= 0

Strategier ved spil 23

Frekvens af score F( 80)=00020 F( 85)=00020 F( 90)=00050 F( 95)=00070 F(100)=00120 F(105)=00160 F(110)=00250 F(115)=00370 F(120)=00490 F(125)=00660 F(130)=00880 F(135)=01160 F(140)=01550 F(145)=01790 F(150)=02280 F(155)=02820 F(160)=03560 F(165)=04190 F(170)=05360 F(175)=05990 F(180)=06900 F(185)=07470 F(190)=08190 F(195)=08580 F(200)=08940 F(205)=09290 F(210)=09580 F(215)=09720 F(220)=09930 F(225)=09940 F(230)=09990 F(235)=10000 F(240)=10000 F(245)=10000 F(250)=10000 F(255)=10000 F(260)=10000 F(265)=10000 F(270)=10000 F(275)=10000

Maringske er det ikke en saeligrlig imponerende forbedring fra den foslashrste strategi men det er en teoretisk milepaeligl at man er i stand til at angive den bedste strategi for bestemte typer af spil Som omtalt har vi ikke forsoslashgt at bevise at Snell-Strategien er den optimale Strategi men det kan bevises Det er vigtigt at notere sig at i alle de omtalte spil har udfaldene vaeligre stokastiske variable dvs uforudsigelige men med bestemte sandsynligheder og at disse sandsynligheder ikke bliver aeligndret af den strategi man foslashlger I mange af de spil hvor man ofte moslashder begrebet strategi feks skak krig finansmarked og markedsfoslashring er dette langt fra tilfaeligldet Hvis feks alle boslashrsspekulanter fulgte den samme optimale strategi med boslashrskursen som stokastisk variabel ville det nok vise sig at det var den daringrligste strategi af alle Teorien for dynamiske strategier hvor de stokastiske variable er funktioner af tiden og af den valgte strategi er teoretisk naeligsten ufremkommelige

Strategier ved spil 24

Indeks Casino516 Computersimulation18 definitionen af sandsynlighed 1 Den optimale Snell-strategi11 forsikringsmatematik 5 Indbrudstyvens pensionsproblem912 kortsigtede strategi 10 kumulerede frekvens 19 langsigtede strategi 10 lotto 1 Mandagschancen14 Mandags-chancen9 Martingale-systemet16

Optimale Strategier 10 Poker 3 rekursionsligning 6 roulette 57 Roulette spil 10 roulettespiller 7 ruinsandsynligheder 5 Skaeligbnen913 Snell-strategien 11 Stopbetingelsen11 strategi9 Taeligndstikspillet1018

Page 15: Sandsynligheder og strategier ved spil - Ole Witt-Hansen ...olewitthansen.dk/Matematik/Sandsynligheder_og_strategier_ved_spil… · 6dqgv\qoljkhghu yhg vslo 3n vdpph pngh ndq yl ilqgh

Strategier ved spil 13

21 Indbrudstyvens pensionsproblem Lad os antage at Arthurs gennemsnitlige gevinst ved hvert tyvetogt er K = 6000 kr og at chancen er at han bliver taget er 5 Lad os antage at hans hidtidige gevinst efter k - tyvetugt er Sk som bliver konfiskeret - og som han derved mister hvis han bliver snuppet I dette tilfaeliglde kan man - som vist nedenfor - se at den kortsigtede strategi er den optimale strategi Det haelignger sammen med at alle trin i spillet er identiske Gevinsten ved hvert tyvetogt er den samme ndash uafhaeligngigt af de foregaringende tyvetugter - bortset fra at den samlede gevinst vokser ved hvert vellykket tyvetogt Xk betegner den stokastiske variabel som er Arthurs gevinst ved eacutet tyvetugt Hermed er

Sk =X1+ X2+ X3+hellip Xk Xk+1 kan antage vaeligrdien K med sandsynlighed 1-ps = 1-P(Snuppet) (altsaring hvis det naeligste tyvetugt lykkes) og vaeligrdien ndashSk (han mister hele sin opsparing) med sandsynlighed ps = P(Snuppet) Vi opskriver nu Snell-strategien (Den kortsigtede strategi) for et trin i hans karriere

Gk = max Sk E(Sk+1| 1k)

Sk er hans gevinst efter k tyvetugter og E(Sk+1| 1k) er hans forventede gevinst efter k+1 tyvetugter E(Sk+1| 1k) kan beregnes som den hidtidige gevinst plus den forventede gevinst ved naeligste tyve- tugt i alt lig med Sk + E(Xk+1) E(Xk+1) er uafhaeligngig af de foslashrste k - tyvetugter derfor bliver stopbetingelsen Sk gt Sk + E(Xk+1) E(Xk+1) lt 0 Middelvaeligrdien E(Xk+1) kan saringledes udregnes efter den saeligdvanlige definition idet Xk+1 antager vaeligrdierne K (gevinsten ved et tyvetugt) og - Sk (mister hele sin opsparing) med sandsynlighederne 1-ps og ps henholdsvis E(Xk+1) = K(1- ps) - Sk ps Han skal standse naringr

E(Xk+1) lt 0 K(1- ps) lt Sk ps som med tal eksemplet giver

6000095 lt Sk005 Sk gt 114000- kr svarende til 114006000 = 095005 = 19 tyvetugter

(Det goslashr han nu nok ikke og er derfor henvist til at leve af folkepensionen efter nogle aringr i skyggen) Man kunne godt tro at dette eksempel kunne anvendes paring andre (ligesaring uetiske) problemstillinger Feks hvor mange gange det er optimalt at koslashre gratis i S-tog Det kan det imidlertid ikke helt

Strategier ved spil 14

Sagen er jo den at man faringr en fast boslashde hvis man bliver snuppet men man kommer ikke til at betale for de gange man har koslashrt gratis Med andre ord vurderingen om hvorvidt det er fordelagtigt at koslashre uden billet afhaelignger kun af middelgevinsten ved det naeligste forsoslashg Hvis den er positiv er det fordelagtigt at fortsaeligtte men hvis den er negativ er det fordelagtigt at loslashse billet (Det er i oslashvrigt uetisk at snyde ndash naturligvis) Tager vi et eksempel billetprisen er kr 50- Boslashden er kr 500 Sandsynligheden for at blive snuppet er Ps = 01 Hvis X er gevinsten ved at koslashre uden billet er E(X) = 50middot(1-Ps)-500middotPs = 50middot09-500middot01 = -50 Det er saringledes (med denne sandsynlighed for at blive snuppet) ikke fordelagtigt at koslashre uden billet i S-tog Da en laeligrebog i sandsynligheder ved spil naturligvis ikke maring tilskynde til uetiske handlinger undlader vi at foretage beregningen med Ps = 005

22 Skaeligbnen Vi betragter kast med to terninger X betegner summen af oslashjentallene ved eacutet kast Sandsynlighedsfordelingen for X er velkendt Feks er P(X=5) = 436 Sandsynligheden for at terningerne viser j oslashjne kan skrives som

36

76)(

jjXP

Lad os antage at spillerens skaeligbne er q Hvis man slaringr dette oslashjental er alt tabt Ellers adderes oslashjentallene for hvert kast Hvis ikke man har slaringet sin skaeligbne saring er den samlede gevinst efter n spil

Sn = X1+ X2+ X3+hellip +Xn

Og middelvaeligrdien af Sn er

E(Sn) = E(X1)+ E(X2)+E(X3)+hellip +E(Xn) = nE(X | X q) E(X | X q) er den betingede middelvaeligrdi af oslashjentallene givet at man ikke slaringr sin skaeligbne

E(X | X q) = 2P(2) +3P(3)+hellip(q-1)P(q-1) + (q+1)P(q+1)+hellip+12P(12) Den kortsigtede strategi (og Snell strategien) fastslaringr at man skal standse naringr middelvaeligrdien af den forventede gevinst ved naeligste kast er negativ Argumentet for dette kan overtages naeligsten ordret fra indbrudstyvens pensionsproblem E(Sk+1|S1 Sk) kan beregnes som den hidtidige gevinst Sk plus den forventede gevinst ved det naeligste kast i alt lig med Sk + E(Xk+1| S1 Sk) Stopbetingelsen er derfor

Sk gt Sk + E(Xk+1| S1 Sk) E(Xk+1| S1 Sk) lt 0

Strategier ved spil 15

E(X | X q) ndash SnP(q) lt 0 Sn gt E(X | X q) P(q) Det er ikke saeligrlig svaeligrt at udregne stopbetingelsen feks for q = 2 og q = 6 Nedenfor er vist udskriften fra et program som foretager beregningen for q = 212 Forventet gevinst i naeligste kast naringr ens skaeligbne er q q 2 3 4 5 6 7 8 9 10 11 12 694 683 667 644 617 583 589 600 617 639 667 Stop naringr din gevinst S gt EX(q)P(q) naringr skaeligbne er q q 2 3 4 5 6 7 8 9 10 11 12 25000 12300 8000 5800 4440 3500 4240 5400 7400 11500 24000

Som det fremgaringr er der endog meget stor forskel paring stoptiderne afhaeligngig af ens skaeligbne

23 Mandagschancen Dette spil er lidt mere interessant fordi det ikke er helt saring enkelt at gennemskue I dette tilfaeliglde kan man ikke forvente at den kortsigtede strategi vil foslashre til den optimale strategi At den faktisk goslashr det skyldes talvaeligrdierne Dette skal forstarings saringledes at hvis man aeligndrede paring praeligmiestoslashrrelserne ville Snell-strategien afvige fra den kortsigtede strategi Vi vil analysere spillet ved Snell-strategien Som naeligvnt har man i spillet 9 tildaeligkkede felter (101025255050100100250) Man kan afdaeligkke hoslashjest 3 felter Man faringr beloslashbet i 1000 kr som det sidste felt viser Hvis X er den stokastiske variabel som angiver vaeligrdien af et felt saring vil de fleste uden saring lange overvejelser vel fortsaeligtte hvis Xlt50 og standse hvis X100 Det kritiske er hvis man afdaeligkker 50 (X=50) Vi bemaeligrker foslashrst at summen af alle felterne er S=620 og at E(X) =6209=689 Vi opskriver foslashrst den fuldstaeligndige Snell-strategi for dette spil G3 =X3 Den Stokastiske variabel G3 = Gevinsten = X3 = vaeligrdien af det sidst afdaeligkkede felt G2 = max X2 E(G3| X1X2 ) Den stoslashrste af vaeligrdierne X2 (= vaeligrdien af det afdaeligkkede

felt) og den betingede middelvaeligrdi af G3 = X3 G1 = max X1 E(G2| X1 ) Som ovenfor Kriteriet for den optimale strategi er som tidligere Stop hvis paring noget trin Xk gt E(Gk+1| X1Xk ) Det er relativ nemt at opstille en formel for E(G3| X1X2 ) Naringr X1 og X2 er afdaeligkket er summen de resterende felter S - X1 - X2 Da alle felter har samme sandsynlighed er middelvaeligrdien simpelthen middeltallet af felterne E(G3| X1X2 ) = ( S - X1 - X2)(9-2)

Strategier ved spil 16

Det er noget mere teknisk at opstille en formel for E(G2| X1 ) og ogsaring lidt teknisk at foretage beregningen Vi vil noslashjes med at skitsere beregningen for en vaeligrdi af X1 og i oslashvrigt henvise til resultatet af et Computerprogram som kan ses nedenfor Lad os antage at X1 = 25 Vi lader nu X2 gennemloslashbe alle de mulige vaeligrdier (alle vaeligrdier skal taeliglles med det antal gange der er felter med denne vaeligrdi) For hver vaeligrdi af X2 (feks 50) skal vi vaeliglge max af X2 og E(G3| X1X2 ) = ( S - X1 - X2) (9-2) (= (620-50-25)7 = 778 i dette tilfaeliglde) og addere det til en sum S2 E(G2| X1 ) er da lig med S2(9-1) (da der er 9-1 felter X2 ) X2[1]= 1000 E(G3)= 8571 G2= 8571 X2[2]= 2500 E(G3)= 8357 G2= 8357 X2[3]= 5000 E(G3)= 8000 G2= 8000 X2[4]= 10000 E(G3)= 7286 G2= 10000 X2[5]= 25000 E(G3)= 5143 G2= 25000 X1[1]= 1000 E(G[2])= 10786 X2[1]= 1000 E(G3)= 8357 G2= 8357 X2[2]= 2500 E(G3)= 8143 G2= 8143 X2[3]= 5000 E(G3)= 7786 G2= 7786 X2[4]= 10000 E(G3)= 7071 G2= 10000 X2[5]= 25000 E(G3)= 4929 G2= 25000 X1[2]= 2500 E(G[2])= 10679 X2[1]= 1000 E(G3)= 8000 G2= 8000 X2[2]= 2500 E(G3)= 7786 G2= 7786 X2[3]= 5000 E(G3)= 7429 G2= 7429 X2[4]= 10000 E(G3)= 6714 G2= 10000 X2[5]= 25000 E(G3)= 4571 G2= 25000 X1[3]= 5000 E(G[2])= 10500 X2[1]= 1000 E(G3)= 7286 G2= 7286 X2[2]= 2500 E(G3)= 7071 G2= 7071 X2[3]= 5000 E(G3)= 6714 G2= 6714 X2[4]= 10000 E(G3)= 6000 G2= 10000 X2[5]= 25000 E(G3)= 3857 G2= 25000 X1[4]= 10000 E(G[2])= 9643 X2[1]= 1000 E(G3)= 5143 G2= 5143 X2[2]= 2500 E(G3)= 4929 G2= 4929 X2[3]= 5000 E(G3)= 4571 G2= 5000 X2[4]= 10000 E(G3)= 3857 G2= 10000 X1[5]= 25000 E(G[2])= 6268 Ser man resultaterne igennem kan de udmoslashntes i en simpel regel Fortsaeligt paring 50 eller derunder Stop paring 100 eller derover Det er maringske lidt overraskende at man ogsaring skal forsaeligtte paring 50000 hvis man kun har et forsoslashg tilbage ndash man kunne jo ende med 10000 og det er saring bare aeligrgerligt ndash og det er vist nok de fleste som standser ved 50000 - men det er ikke den bedste strategi

Strategier ved spil 17

24 Casino Som naeligvnt i indledningen til dette afsnit findes der ingen strategi som kan bringe en i stand til at vinde paring et Casino ndash i det lange loslashb Vil man goslashre Casino-spil til en levevej vil det altid med matematisk sikkerhed ende med ruin Det betyder imidlertid ikke at man ikke kan vinde ved at garing paring Casino men hvis man taelignker paring at spraelignge banken saring skal to krav i hvert fald vaeligre opfyldt for at der skal vaeligre en ikke forsvindende sandsynlighed for at det kan lade sig goslashre 1 Man skal have flere penge end Casino 2 Der maring ikke vaeligre loft over indsatserne Begge betingelser er som bekendt aldrig opfyldt Man kan som sagt godt vinde paring et Casino men hvis man satser paring at vinde mere (alle de gange man er paring Casino i sit liv) end det beloslashb man medbringer ved hvert besoslashg saring vil chancerne for at tabe det hele vaeligre stoslashrst Her er der tale om sandsynligheder og middelvaeligrdier ndash om odds Selvfoslashlgelig er de muligt at tabe hele sin formue ved foslashrste besoslashg eller vinde det tredobbelte ved det andet Der har i tidens loslashb vaeligret lanceret flere eksempler paring vinderstrategier som lyder uhyre besnaeligrende Den mest kendte er Martingale-systemet Man spiller kun paring sort og roslashd hvor faringr man faringr fordoblet sin indsats hvis man vinder Spillet er saringledes helt lige bortset fra at indsatserne bliver liggende naringr zero kommer ud og man kun faringr sin indsats en gang hvis man vinder i naeligste spil (zero har ingen farve) Spiller man efter Martingale-systemet skal man inkassere sin gevinst hvis man vinder Hvis man derimod taber skal man fordoble sin indsats Vi saeligtter grundindsatsen til 1 Har man spillet n gange og dermed doblet op n-1 gange har man lagt en indsats Sn = 1 + 2 + 22 +hellip2n-1 = 2n ndash1 Udregnet af kvotientraeligkkeformlen

1

10

q

qaS

n

n

for raeligkken Sn = a0 + a0q+ a0q

2+hellip+ a0qn-1

Vinder man det nte spil faringr man udbetalt 22

n-1 = 2n saring ens gevinst er 2n - (2n - 1) = 1 Der gaeliglder aringbenbart den simple kendsgerning at bliver man bare ved med at fordoble saring har man altid vundet eacuten indsats Foslashr man forsoslashger sig med dette skal man dog nok goslashre sig klart hvor mange gange man kan tabe foslashr man er ruineret

Strategier ved spil 18

Sandsynligheden for at man taber 5 spil er (frac12)5 = 132 Man har da tabt 25 ndash 1 gange vaeligrdien af en jeton (i Danmark 50 kr) dvs 1550 kr Vil man sikre sig bedre feks ved at kunne doble op 9 gange (sandsynligheden for at tabe 10 spil er 11024) saring skal man komme med kr 51150- men det kan man ikke engang gennemfoslashre da hoslashjeste indsats i Danmark er 24000- Man kunne imidlertid stille det sposlashrgsmaringl Hvis man har n-jetoner hvad er saring sandsynligheden for at vinde q-jetoner hvis man spiller efter Martingale-systemet Dette kan man faktisk godt udregne direkte men regningerne er ret omfattende Derimod er resultatet simpelt Vi vil ikke lave en direkte udregning men anvende de samme metoder som vi har anvendt for den bedste strategi Vi tager udgangspunkt i det faktum at sort roslashd Casino spil er et lige spil saring middelvaeligrdien af gevinsten er 0 ligegyldigt hvordan man spiller Middelvaeligrdien (som er nul ) af en gevinst paring q-jetoner er lig med q gange sandsynligheden P(q) for at vinde q jetoner minus ens kapital (n jetoner) gange med sandsynligheden for at man taber det sidste spil som er 1 ndash P(q)

qP(q) ndash n(1 ndashP(q)) = 0 qn

nqP

)(

Har man feks n = 31 jetoner (1550- kr) er sandsynligheden for at vinde q=10 (500 kr) lig med 0756 En rimelig stor sandsynlighed men altsaring stadig 25 chance for ruin Oslashnsker man derimod at blive rigtig rig og vinde 10000- kr dvs q=200 er P(200) = 0134 Konklusionen er den at satser man paring at vinde mere end man medbringer saring er sandsynligheden mindre end frac12 men kan man noslashjes med mindre saring er sandsynligheden stoslashrre end frac12 Men bemaeligrk dette gaeliglder fra foslashrste gang man garingr ind paring et Casino til man beslutter at holde op

25 Taeligndstikspillet Som beskrevet ovenfor garingr spillet ud paring at farve den ene af siderne roslashd paring 10 taeligndstikker Naringr taeligndstikken kasten op i luften er sandsynligheden for at den roslashde side vender opad naringr den rammer bordet lig med p=025 Man kaster paring skift 10 saringdanne taeligndstikker 10 gange For hvert kast skal man multiplicere antallet af roslashde med et af tallene 110 Hver tal maring kun bruges eacuten gang Den der faringr den stoslashrste sum har vundet Det er klart at en god strategi i det lange loslashb vil give en hoslashjere sum Vi minder om at antallet af X roslashde taeligndstikker er binomialfordelt med primaeligrsandsynlighed p og antalsparameter n=10

102104

3

4

110)(

10

jj

jXPjj

Strategier ved spil 19

Endvidere vil vi anvende de kumulerede sandsynligheder P(X j) og P(X j) Nedenfor er vist resultatet af en Computersimulation af spillet Primaeligr sandsynligheder for n= 10 og p= 0250 P(X=j) j 0 1 2 3 4 5 6 7 8 9 10 00563 01877 02816 02503 01460 00584 00162 00031 00004 00000 00000 Baglaeligns kumulerede sandsynligheder P(Xgt=q) j 0 1 2 3 4 5 6 7 8 9 10 10000 09437 07560 04744 02241 00781 00197 00035 00004 00000 00000 1 kast Antal = 2 Vaeliglg mellem 1 2 3 4 5 6 7 8 910 Faktor= 4 2 kast Antal = 4 Vaeliglg mellem 1 2 3 5 6 7 8 910 Faktor=10 3 kast Antal = 2 Vaeliglg mellem 1 2 3 5 6 7 8 9 Faktor= 5 4 kast Antal = 2 Vaeliglg mellem 1 2 3 6 7 8 9 Faktor= 3 5 kast Antal = 3 Vaeliglg mellem 1 2 6 7 8 9 Faktor= 8 6 kast Antal = 2 Vaeliglg mellem 1 2 6 7 9 Faktor= 6 7 kast Antal = 6 Vaeliglg mellem 1 2 7 9 Faktor=9 8 kast Antal = 3 Vaeliglg mellem 1 2 7 Faktor= 2 9 kast Antal = 2 Vaeliglg mellem 1 7 Faktor= 7 10 kast Antal = 2 Vaeliglg mellem 1 Faktor= 1 Din score er 176 Valget af tallene 110 er i dette tilfaeliglde foretaget ud fra den optimale strategi som vi vil omtale om et oslashjeblik Foslashr vi analyserer den optimale strategi for dette spil vil vi forsoslashge os med en intuitiv bedste strategi Vi belyser denne strategi med et konkret eksempel Lad os feks antage at vi slaringr 4 roslashde i den 3 kast (3 forsoslashg) De tal vi har tilbage kalder vi (y8 y7 y6 y5 y4 y3 y2 y1) Sposlashrgsmaringlet om vi skal gange med det stoslashrste y8 eller det naeligststoslashrste y7 osv Vi raeligsonnerer da som foslashlger Hvis sandsynligheden for at slaring mere end 4 roslashde i de resterende 7 kast er stoslashrre end frac12 saring skal vi vaeliglge det naeligststoslashrste Vi skaeligrper dette Hvis sandsynligheden for at slaring mindst 5 roslashde mindst en gang i de resterende 7 kast er stoslashrre end frac12 saring skal vi vaeliglge det naeligststoslashrste Tilsvarende hvis sandsynligheden for at slaring mindst 5 roslashde mindst 2 gange i de resterende 7 kast skal vi vaeliglge det 3 stoslashrstehellipog saringdan fremdeles Strategien virker umiddelbart meget plausibel Sandsynlighederne kan direkte farings af binomialfordelingen Foslashrst sandsynligheden for at faring mindst q-roslashde i et kast Dette er

P(X q) =

n

qj

jXP )( hvor P(X = j) er angivet ovenfor

Strategier ved spil 20

Sandsynligheden for at dette sker mindst r gange i n - k kast er ogsaring en binomialfordeling og kan skrives

P(X q mindst r gange i n - k kast ) = jknjkn

rj

qXPqXPj

kn

))(1()(

Beregningen af disse (110) sandsynligheder goslashres nok lettest paring en computer For at lave en strategi-tabel goslashr man det at for hvert kast og hvert antal mulige roslashde vaeliglger man foslashrst det stoslashrste af de resterende tal Dernaeligst beregner man sandsynligheden for at faring mindst 1 roslashd mere i et af de foslashlgende kast Hvis denne sandsynlighed er stoslashrre end frac12 ser man paring det naeligststoslashrste af de resterende tal Man beregner saring sandsynligheden for at faring mindst 1 roslashd mere i mindst to af de resterende kast Hvis denne sandsynlighed er stoslashrre end frac12 saring vaeliglger man det tredjestoslashrste af de resterende tal og saringdan fremdeleshellip Det bemaeligrkes at beregningen skal initialiseres med at man altid vaeliglger det mindste hvis man slaringr 0 roslashde og altid vaeliglger det stoslashrste hvis man slaringr 10 roslashde Nedenfor er vist en computerberegning af en strategi-tabel Endvidere er ogsaring lavet en saringkaldt Monte-Carlo simulation Dette betyder at man har ladet maskinen spille feks 10000 spil spillet efter strategi-tabellen Nederst er vist hyppighederne for ens score og endelig fordelingsfunktionen for observationerne (Den kumulerede frekvens) P(X =j) for n =10 and p = 0250 j 0 1 2 3 4 5 6 7 8 9 10 P(X =j)0056 0188 0282 0250 0146 0058 00162 0003 00004 0000 0000 P(Xgt=j) for n =10 and p = 0250 j 0 1 2 3 4 5 6 7 8 9 10 P(Xgt=j) 1000 0944 0756 0474 0224 0078 00197 00035 00004 0000 0000 Strategi tabel Tallene refererer ikke til faktorene selv men til den stoslashrste naeligststoslashrste osv Eksempel Hvis man slaringr 3 roslashde i den andet kast saring skal man vaeliglge (7) den tredjestoslashrste Kast no 1 2 3 4 5 6 7 8 9 10 score 0 1 1 1 1 1 1 1 1 1 1 1 3 3 3 2 2 2 2 1 1 1 2 6 5 5 4 4 3 3 2 2 1 3 8 7 7 6 5 4 3 3 2 1 4 9 9 8 7 6 5 4 3 2 1 5 10 9 8 7 6 5 4 3 2 1 6 10 9 8 7 6 5 4 3 2 1 7 10 9 8 7 6 5 4 3 2 1 8 10 9 8 7 6 5 4 3 2 1 9 10 9 8 7 6 5 4 3 2 1 10 10 9 8 7 6 5 4 3 2 1 Gennemsnitlig score = 16437

Strategier ved spil 21

Hyppighed af score h( 75)= 1 h( 80)= 7 h( 85)= 3 h( 90)= 5 h( 95)= 6 h(100)= 34 h(105)= 38 h(110)= 82 h(115)= 68 h(120)=161 h(125)=146 h(130)=320 h(135)=280 h(140)=534 h(145)=425 h(150)=752 h(155)=577 h(160)=878 h(165)=645 h(170)=956 h(175)=651 h(180)=863 h(185)=527 h(190)=609 h(195)=351 h(200)=389 h(205)=180 h(210)=203 h(215)= 93 h(220)= 86 h(225)= 47 h(230)= 32 h(235)= 21 h(240)= 13 h(245)= 8 h(250)= 3 h(255)= 0 h(260)= 4 h(265)= 1 h(270)= 1 h(275)= 0 h(280)= 0 Frekvens of score F( 80)=00008 F( 85)=00011 F( 90)=00016 F( 95)=00022 F(100)=00056 F(105)=00094 F(110)=00176 F(115)=00244 F(120)=00405 F(125)=00551 F(130)=00871 F(135)=01151 F(140)=01685 F(145)=02110 F(150)=02862 F(155)=03439 F(160)=04317 F(165)=04962 F(170)=05918 F(175)=06569 F(180)=07432 F(185)=07959 F(190)=08568 F(195)=08919 F(200)=09308 F(205)=09488 F(210)=09691 F(215)=09784 F(220)=09870 F(225)=09917 F(230)=09949 F(235)=09970 F(240)=09983 F(245)=09991 F(250)=09994 F(255)=09994 F(260)=09998 F(265)=09999 F(270)=10000 F(275)=10000

Som det fremgaringr af tabellen for P(X gt= j) er der kun 78 chance for at slaring 5 roslashde eller derover saring goslashr man det skal man altid vaeliglge det stoslashrste af de resterende tal For 3 eller 4 roslashde er situationen langt mere uigemmeskuelig og kun en beregning kan afgoslashre sagen Vi proslashver nu at finde den optimale strategi eller Snell-strategien Hvad angaringr sposlashrgsmaringlet om hvorvidt vi skal vaeliglge den stoslashrste eller naeligststoslashrste saring lader det sig faktisk goslashre at beregne Snell-strategien paring en computer De foslashlgende tilfaeliglde bliver derimod for komplicerede og der anvender vi en svagt forbedret version af vores intuitive strategi Forbedringen bestaringr i foslashlgende idet vi illustrerer det med et eksempel Lad os sige vi har slaringet 3 roslashde og vi overvejer om vi vil gange det med 7 eller 6 Ganger vi med 6 er det fordi vi forventer at slaring mindst 4 roslashde mindst en gang i de resterende kast Vores score vil vaeligre 73 og 74 henholdsvis og scoren vil blive forbedret med en faktor 43 hvis vi ganger med 6 under forventning af at slaring 4 roslashde Vores forbedring af strategien garingr da ud paring at vi vaeliglger det naeligststoslashrste 6 hvis sandsynligheden for at slaring 4 roslashde gange den relative forbedring 43 er stoslashrre end frac12 Vi rekapitulerer dernaeligst Snell-strategien G10 = X10 X10 Stokastisk variabel = antallet af roslashde i det 10 kast G9 = max X9 E(G10) E(G10) = E(X10) = np=10025 = 25 X9 = 01hellip10 Gk = max Xk E(Gk+1) E(Gk) kraeligver en laeligngere udregning men den udregnes som en

almindelig middelvaeligrdi altsaring som max af de to vaeligrdier gange P(X=Xk-1) G1 = max X1 E(G2) Som eksempel udregner vi E(G9) Da E(G10)=25 skal vi for X9 = 012 anvende E(G10)=25 i udregningen

Strategier ved spil 22

E(G9) = 25 (P(X=0)+P(X=1)+P(X=2))+ 3P(X=3)+hellip+10P(X=10) =306 Vaeligrdierne for E(Gk) er alle udregnet og vist i computerberegningen nedenfor Bemaeligrk isaeligr at de vokser fra 25 til 425 naringr k aftager fra 10 til 2 Strategien er nu foslashlgende Vaeliglg det stoslashrste af de resterende tal hvis Xk gt E(Gk+1) (altsaring det antal man har slaringet er er stoslashrre end det forventede stoslashrste antal) ellers vaeliglg det naeligststoslashrste Ved afgoslashrelsen om de 3 stoslashrste 4 stoslashrste osv anvender vi den hidtidige strategi med den modifikation at vi multiplicerer sandsynligheden med den formodede relative forbedring E(G10-kast)antal roslashde En computerberegning helt svarende til den foregaringende men med den aeligndrede strategi er vist nedenfor Man bemaeligrker for det foslashrste de smaring aeligndringer der er i strategien Den nye strategi er lidt mindre forsigtig men den giver altsaring ogsaring pote i form af en forbedring af gennemsnittet paring ca 275 Primaeligr sandsynligheder P(X=j) for n= 10 og p= 0250 j 0 1 2 3 4 5 6 7 8 9 10 P(X=j)0056 0188 0282 0250 0146 0058 0016 00031 00004 00000 00000 Baglaeligns Kumulerede sandsynligheder P(Xgt=j) j 0 1 2 3 4 5 6 7 8 9 10 P(Xgt=j) 1000 0944 0756 0474 0224 0078 00197 00035 00004 00000 00000 E(G[10])= 250 E(G[9])= 306 E(G[8])= 337 E(G[7])= 362 E(G[6])= 380 E(G[5])= 395 E(G[4])= 406 E(G[3])= 416 E(G[2])= 425 kast nr 1 2 3 4 5 6 7 8 9 10 score 0 1 1 1 1 1 1 1 1 1 1 1 2 2 1 1 1 1 1 1 1 1 2 5 4 4 3 3 3 2 2 1 1 3 8 7 6 5 5 4 3 2 2 1 4 9 8 7 7 6 5 4 3 2 1 5 10 9 8 7 6 5 4 3 2 1 6 10 9 8 7 6 5 4 3 2 1 7 10 9 8 7 6 5 4 3 2 1 8 10 9 8 7 6 5 4 3 2 1 9 10 9 8 7 6 5 4 3 2 1 10 10 9 8 7 6 5 4 3 2 1 Gennemsnitlig gevinst ms = 16727 Hyppigheder af score h( 75)= 1 h( 80)= 1 h( 85)= 0 h( 90)= 3 h( 95)= 2 h(100)= 5 h(105)= 4 h(110)= 9 h(115)= 12 h(120)= 12 h(125)= 17 h(130)= 22 h(135)= 28 h(140)= 39 h(145)= 24 h(150)= 49 h(155)= 54 h(160)= 74 h(165)= 63 h(170)=117 h(175)= 63 h(180)= 91 h(185)= 57 h(190)= 72 h(195)= 39 h(200)= 36 h(205)= 35 h(210)= 29 h(215)= 14 h(220)= 21 h(225)= 1 h(230)= 5 h(235)= 1 h(240)= 0 h(245)= 0 h(250)= 0 h(255)= 0 h(260)= 0 h(265)= 0 h(270)= 0 h(275)= 0 h(280)= 0

Strategier ved spil 23

Frekvens af score F( 80)=00020 F( 85)=00020 F( 90)=00050 F( 95)=00070 F(100)=00120 F(105)=00160 F(110)=00250 F(115)=00370 F(120)=00490 F(125)=00660 F(130)=00880 F(135)=01160 F(140)=01550 F(145)=01790 F(150)=02280 F(155)=02820 F(160)=03560 F(165)=04190 F(170)=05360 F(175)=05990 F(180)=06900 F(185)=07470 F(190)=08190 F(195)=08580 F(200)=08940 F(205)=09290 F(210)=09580 F(215)=09720 F(220)=09930 F(225)=09940 F(230)=09990 F(235)=10000 F(240)=10000 F(245)=10000 F(250)=10000 F(255)=10000 F(260)=10000 F(265)=10000 F(270)=10000 F(275)=10000

Maringske er det ikke en saeligrlig imponerende forbedring fra den foslashrste strategi men det er en teoretisk milepaeligl at man er i stand til at angive den bedste strategi for bestemte typer af spil Som omtalt har vi ikke forsoslashgt at bevise at Snell-Strategien er den optimale Strategi men det kan bevises Det er vigtigt at notere sig at i alle de omtalte spil har udfaldene vaeligre stokastiske variable dvs uforudsigelige men med bestemte sandsynligheder og at disse sandsynligheder ikke bliver aeligndret af den strategi man foslashlger I mange af de spil hvor man ofte moslashder begrebet strategi feks skak krig finansmarked og markedsfoslashring er dette langt fra tilfaeligldet Hvis feks alle boslashrsspekulanter fulgte den samme optimale strategi med boslashrskursen som stokastisk variabel ville det nok vise sig at det var den daringrligste strategi af alle Teorien for dynamiske strategier hvor de stokastiske variable er funktioner af tiden og af den valgte strategi er teoretisk naeligsten ufremkommelige

Strategier ved spil 24

Indeks Casino516 Computersimulation18 definitionen af sandsynlighed 1 Den optimale Snell-strategi11 forsikringsmatematik 5 Indbrudstyvens pensionsproblem912 kortsigtede strategi 10 kumulerede frekvens 19 langsigtede strategi 10 lotto 1 Mandagschancen14 Mandags-chancen9 Martingale-systemet16

Optimale Strategier 10 Poker 3 rekursionsligning 6 roulette 57 Roulette spil 10 roulettespiller 7 ruinsandsynligheder 5 Skaeligbnen913 Snell-strategien 11 Stopbetingelsen11 strategi9 Taeligndstikspillet1018

Page 16: Sandsynligheder og strategier ved spil - Ole Witt-Hansen ...olewitthansen.dk/Matematik/Sandsynligheder_og_strategier_ved_spil… · 6dqgv\qoljkhghu yhg vslo 3n vdpph pngh ndq yl ilqgh

Strategier ved spil 14

Sagen er jo den at man faringr en fast boslashde hvis man bliver snuppet men man kommer ikke til at betale for de gange man har koslashrt gratis Med andre ord vurderingen om hvorvidt det er fordelagtigt at koslashre uden billet afhaelignger kun af middelgevinsten ved det naeligste forsoslashg Hvis den er positiv er det fordelagtigt at fortsaeligtte men hvis den er negativ er det fordelagtigt at loslashse billet (Det er i oslashvrigt uetisk at snyde ndash naturligvis) Tager vi et eksempel billetprisen er kr 50- Boslashden er kr 500 Sandsynligheden for at blive snuppet er Ps = 01 Hvis X er gevinsten ved at koslashre uden billet er E(X) = 50middot(1-Ps)-500middotPs = 50middot09-500middot01 = -50 Det er saringledes (med denne sandsynlighed for at blive snuppet) ikke fordelagtigt at koslashre uden billet i S-tog Da en laeligrebog i sandsynligheder ved spil naturligvis ikke maring tilskynde til uetiske handlinger undlader vi at foretage beregningen med Ps = 005

22 Skaeligbnen Vi betragter kast med to terninger X betegner summen af oslashjentallene ved eacutet kast Sandsynlighedsfordelingen for X er velkendt Feks er P(X=5) = 436 Sandsynligheden for at terningerne viser j oslashjne kan skrives som

36

76)(

jjXP

Lad os antage at spillerens skaeligbne er q Hvis man slaringr dette oslashjental er alt tabt Ellers adderes oslashjentallene for hvert kast Hvis ikke man har slaringet sin skaeligbne saring er den samlede gevinst efter n spil

Sn = X1+ X2+ X3+hellip +Xn

Og middelvaeligrdien af Sn er

E(Sn) = E(X1)+ E(X2)+E(X3)+hellip +E(Xn) = nE(X | X q) E(X | X q) er den betingede middelvaeligrdi af oslashjentallene givet at man ikke slaringr sin skaeligbne

E(X | X q) = 2P(2) +3P(3)+hellip(q-1)P(q-1) + (q+1)P(q+1)+hellip+12P(12) Den kortsigtede strategi (og Snell strategien) fastslaringr at man skal standse naringr middelvaeligrdien af den forventede gevinst ved naeligste kast er negativ Argumentet for dette kan overtages naeligsten ordret fra indbrudstyvens pensionsproblem E(Sk+1|S1 Sk) kan beregnes som den hidtidige gevinst Sk plus den forventede gevinst ved det naeligste kast i alt lig med Sk + E(Xk+1| S1 Sk) Stopbetingelsen er derfor

Sk gt Sk + E(Xk+1| S1 Sk) E(Xk+1| S1 Sk) lt 0

Strategier ved spil 15

E(X | X q) ndash SnP(q) lt 0 Sn gt E(X | X q) P(q) Det er ikke saeligrlig svaeligrt at udregne stopbetingelsen feks for q = 2 og q = 6 Nedenfor er vist udskriften fra et program som foretager beregningen for q = 212 Forventet gevinst i naeligste kast naringr ens skaeligbne er q q 2 3 4 5 6 7 8 9 10 11 12 694 683 667 644 617 583 589 600 617 639 667 Stop naringr din gevinst S gt EX(q)P(q) naringr skaeligbne er q q 2 3 4 5 6 7 8 9 10 11 12 25000 12300 8000 5800 4440 3500 4240 5400 7400 11500 24000

Som det fremgaringr er der endog meget stor forskel paring stoptiderne afhaeligngig af ens skaeligbne

23 Mandagschancen Dette spil er lidt mere interessant fordi det ikke er helt saring enkelt at gennemskue I dette tilfaeliglde kan man ikke forvente at den kortsigtede strategi vil foslashre til den optimale strategi At den faktisk goslashr det skyldes talvaeligrdierne Dette skal forstarings saringledes at hvis man aeligndrede paring praeligmiestoslashrrelserne ville Snell-strategien afvige fra den kortsigtede strategi Vi vil analysere spillet ved Snell-strategien Som naeligvnt har man i spillet 9 tildaeligkkede felter (101025255050100100250) Man kan afdaeligkke hoslashjest 3 felter Man faringr beloslashbet i 1000 kr som det sidste felt viser Hvis X er den stokastiske variabel som angiver vaeligrdien af et felt saring vil de fleste uden saring lange overvejelser vel fortsaeligtte hvis Xlt50 og standse hvis X100 Det kritiske er hvis man afdaeligkker 50 (X=50) Vi bemaeligrker foslashrst at summen af alle felterne er S=620 og at E(X) =6209=689 Vi opskriver foslashrst den fuldstaeligndige Snell-strategi for dette spil G3 =X3 Den Stokastiske variabel G3 = Gevinsten = X3 = vaeligrdien af det sidst afdaeligkkede felt G2 = max X2 E(G3| X1X2 ) Den stoslashrste af vaeligrdierne X2 (= vaeligrdien af det afdaeligkkede

felt) og den betingede middelvaeligrdi af G3 = X3 G1 = max X1 E(G2| X1 ) Som ovenfor Kriteriet for den optimale strategi er som tidligere Stop hvis paring noget trin Xk gt E(Gk+1| X1Xk ) Det er relativ nemt at opstille en formel for E(G3| X1X2 ) Naringr X1 og X2 er afdaeligkket er summen de resterende felter S - X1 - X2 Da alle felter har samme sandsynlighed er middelvaeligrdien simpelthen middeltallet af felterne E(G3| X1X2 ) = ( S - X1 - X2)(9-2)

Strategier ved spil 16

Det er noget mere teknisk at opstille en formel for E(G2| X1 ) og ogsaring lidt teknisk at foretage beregningen Vi vil noslashjes med at skitsere beregningen for en vaeligrdi af X1 og i oslashvrigt henvise til resultatet af et Computerprogram som kan ses nedenfor Lad os antage at X1 = 25 Vi lader nu X2 gennemloslashbe alle de mulige vaeligrdier (alle vaeligrdier skal taeliglles med det antal gange der er felter med denne vaeligrdi) For hver vaeligrdi af X2 (feks 50) skal vi vaeliglge max af X2 og E(G3| X1X2 ) = ( S - X1 - X2) (9-2) (= (620-50-25)7 = 778 i dette tilfaeliglde) og addere det til en sum S2 E(G2| X1 ) er da lig med S2(9-1) (da der er 9-1 felter X2 ) X2[1]= 1000 E(G3)= 8571 G2= 8571 X2[2]= 2500 E(G3)= 8357 G2= 8357 X2[3]= 5000 E(G3)= 8000 G2= 8000 X2[4]= 10000 E(G3)= 7286 G2= 10000 X2[5]= 25000 E(G3)= 5143 G2= 25000 X1[1]= 1000 E(G[2])= 10786 X2[1]= 1000 E(G3)= 8357 G2= 8357 X2[2]= 2500 E(G3)= 8143 G2= 8143 X2[3]= 5000 E(G3)= 7786 G2= 7786 X2[4]= 10000 E(G3)= 7071 G2= 10000 X2[5]= 25000 E(G3)= 4929 G2= 25000 X1[2]= 2500 E(G[2])= 10679 X2[1]= 1000 E(G3)= 8000 G2= 8000 X2[2]= 2500 E(G3)= 7786 G2= 7786 X2[3]= 5000 E(G3)= 7429 G2= 7429 X2[4]= 10000 E(G3)= 6714 G2= 10000 X2[5]= 25000 E(G3)= 4571 G2= 25000 X1[3]= 5000 E(G[2])= 10500 X2[1]= 1000 E(G3)= 7286 G2= 7286 X2[2]= 2500 E(G3)= 7071 G2= 7071 X2[3]= 5000 E(G3)= 6714 G2= 6714 X2[4]= 10000 E(G3)= 6000 G2= 10000 X2[5]= 25000 E(G3)= 3857 G2= 25000 X1[4]= 10000 E(G[2])= 9643 X2[1]= 1000 E(G3)= 5143 G2= 5143 X2[2]= 2500 E(G3)= 4929 G2= 4929 X2[3]= 5000 E(G3)= 4571 G2= 5000 X2[4]= 10000 E(G3)= 3857 G2= 10000 X1[5]= 25000 E(G[2])= 6268 Ser man resultaterne igennem kan de udmoslashntes i en simpel regel Fortsaeligt paring 50 eller derunder Stop paring 100 eller derover Det er maringske lidt overraskende at man ogsaring skal forsaeligtte paring 50000 hvis man kun har et forsoslashg tilbage ndash man kunne jo ende med 10000 og det er saring bare aeligrgerligt ndash og det er vist nok de fleste som standser ved 50000 - men det er ikke den bedste strategi

Strategier ved spil 17

24 Casino Som naeligvnt i indledningen til dette afsnit findes der ingen strategi som kan bringe en i stand til at vinde paring et Casino ndash i det lange loslashb Vil man goslashre Casino-spil til en levevej vil det altid med matematisk sikkerhed ende med ruin Det betyder imidlertid ikke at man ikke kan vinde ved at garing paring Casino men hvis man taelignker paring at spraelignge banken saring skal to krav i hvert fald vaeligre opfyldt for at der skal vaeligre en ikke forsvindende sandsynlighed for at det kan lade sig goslashre 1 Man skal have flere penge end Casino 2 Der maring ikke vaeligre loft over indsatserne Begge betingelser er som bekendt aldrig opfyldt Man kan som sagt godt vinde paring et Casino men hvis man satser paring at vinde mere (alle de gange man er paring Casino i sit liv) end det beloslashb man medbringer ved hvert besoslashg saring vil chancerne for at tabe det hele vaeligre stoslashrst Her er der tale om sandsynligheder og middelvaeligrdier ndash om odds Selvfoslashlgelig er de muligt at tabe hele sin formue ved foslashrste besoslashg eller vinde det tredobbelte ved det andet Der har i tidens loslashb vaeligret lanceret flere eksempler paring vinderstrategier som lyder uhyre besnaeligrende Den mest kendte er Martingale-systemet Man spiller kun paring sort og roslashd hvor faringr man faringr fordoblet sin indsats hvis man vinder Spillet er saringledes helt lige bortset fra at indsatserne bliver liggende naringr zero kommer ud og man kun faringr sin indsats en gang hvis man vinder i naeligste spil (zero har ingen farve) Spiller man efter Martingale-systemet skal man inkassere sin gevinst hvis man vinder Hvis man derimod taber skal man fordoble sin indsats Vi saeligtter grundindsatsen til 1 Har man spillet n gange og dermed doblet op n-1 gange har man lagt en indsats Sn = 1 + 2 + 22 +hellip2n-1 = 2n ndash1 Udregnet af kvotientraeligkkeformlen

1

10

q

qaS

n

n

for raeligkken Sn = a0 + a0q+ a0q

2+hellip+ a0qn-1

Vinder man det nte spil faringr man udbetalt 22

n-1 = 2n saring ens gevinst er 2n - (2n - 1) = 1 Der gaeliglder aringbenbart den simple kendsgerning at bliver man bare ved med at fordoble saring har man altid vundet eacuten indsats Foslashr man forsoslashger sig med dette skal man dog nok goslashre sig klart hvor mange gange man kan tabe foslashr man er ruineret

Strategier ved spil 18

Sandsynligheden for at man taber 5 spil er (frac12)5 = 132 Man har da tabt 25 ndash 1 gange vaeligrdien af en jeton (i Danmark 50 kr) dvs 1550 kr Vil man sikre sig bedre feks ved at kunne doble op 9 gange (sandsynligheden for at tabe 10 spil er 11024) saring skal man komme med kr 51150- men det kan man ikke engang gennemfoslashre da hoslashjeste indsats i Danmark er 24000- Man kunne imidlertid stille det sposlashrgsmaringl Hvis man har n-jetoner hvad er saring sandsynligheden for at vinde q-jetoner hvis man spiller efter Martingale-systemet Dette kan man faktisk godt udregne direkte men regningerne er ret omfattende Derimod er resultatet simpelt Vi vil ikke lave en direkte udregning men anvende de samme metoder som vi har anvendt for den bedste strategi Vi tager udgangspunkt i det faktum at sort roslashd Casino spil er et lige spil saring middelvaeligrdien af gevinsten er 0 ligegyldigt hvordan man spiller Middelvaeligrdien (som er nul ) af en gevinst paring q-jetoner er lig med q gange sandsynligheden P(q) for at vinde q jetoner minus ens kapital (n jetoner) gange med sandsynligheden for at man taber det sidste spil som er 1 ndash P(q)

qP(q) ndash n(1 ndashP(q)) = 0 qn

nqP

)(

Har man feks n = 31 jetoner (1550- kr) er sandsynligheden for at vinde q=10 (500 kr) lig med 0756 En rimelig stor sandsynlighed men altsaring stadig 25 chance for ruin Oslashnsker man derimod at blive rigtig rig og vinde 10000- kr dvs q=200 er P(200) = 0134 Konklusionen er den at satser man paring at vinde mere end man medbringer saring er sandsynligheden mindre end frac12 men kan man noslashjes med mindre saring er sandsynligheden stoslashrre end frac12 Men bemaeligrk dette gaeliglder fra foslashrste gang man garingr ind paring et Casino til man beslutter at holde op

25 Taeligndstikspillet Som beskrevet ovenfor garingr spillet ud paring at farve den ene af siderne roslashd paring 10 taeligndstikker Naringr taeligndstikken kasten op i luften er sandsynligheden for at den roslashde side vender opad naringr den rammer bordet lig med p=025 Man kaster paring skift 10 saringdanne taeligndstikker 10 gange For hvert kast skal man multiplicere antallet af roslashde med et af tallene 110 Hver tal maring kun bruges eacuten gang Den der faringr den stoslashrste sum har vundet Det er klart at en god strategi i det lange loslashb vil give en hoslashjere sum Vi minder om at antallet af X roslashde taeligndstikker er binomialfordelt med primaeligrsandsynlighed p og antalsparameter n=10

102104

3

4

110)(

10

jj

jXPjj

Strategier ved spil 19

Endvidere vil vi anvende de kumulerede sandsynligheder P(X j) og P(X j) Nedenfor er vist resultatet af en Computersimulation af spillet Primaeligr sandsynligheder for n= 10 og p= 0250 P(X=j) j 0 1 2 3 4 5 6 7 8 9 10 00563 01877 02816 02503 01460 00584 00162 00031 00004 00000 00000 Baglaeligns kumulerede sandsynligheder P(Xgt=q) j 0 1 2 3 4 5 6 7 8 9 10 10000 09437 07560 04744 02241 00781 00197 00035 00004 00000 00000 1 kast Antal = 2 Vaeliglg mellem 1 2 3 4 5 6 7 8 910 Faktor= 4 2 kast Antal = 4 Vaeliglg mellem 1 2 3 5 6 7 8 910 Faktor=10 3 kast Antal = 2 Vaeliglg mellem 1 2 3 5 6 7 8 9 Faktor= 5 4 kast Antal = 2 Vaeliglg mellem 1 2 3 6 7 8 9 Faktor= 3 5 kast Antal = 3 Vaeliglg mellem 1 2 6 7 8 9 Faktor= 8 6 kast Antal = 2 Vaeliglg mellem 1 2 6 7 9 Faktor= 6 7 kast Antal = 6 Vaeliglg mellem 1 2 7 9 Faktor=9 8 kast Antal = 3 Vaeliglg mellem 1 2 7 Faktor= 2 9 kast Antal = 2 Vaeliglg mellem 1 7 Faktor= 7 10 kast Antal = 2 Vaeliglg mellem 1 Faktor= 1 Din score er 176 Valget af tallene 110 er i dette tilfaeliglde foretaget ud fra den optimale strategi som vi vil omtale om et oslashjeblik Foslashr vi analyserer den optimale strategi for dette spil vil vi forsoslashge os med en intuitiv bedste strategi Vi belyser denne strategi med et konkret eksempel Lad os feks antage at vi slaringr 4 roslashde i den 3 kast (3 forsoslashg) De tal vi har tilbage kalder vi (y8 y7 y6 y5 y4 y3 y2 y1) Sposlashrgsmaringlet om vi skal gange med det stoslashrste y8 eller det naeligststoslashrste y7 osv Vi raeligsonnerer da som foslashlger Hvis sandsynligheden for at slaring mere end 4 roslashde i de resterende 7 kast er stoslashrre end frac12 saring skal vi vaeliglge det naeligststoslashrste Vi skaeligrper dette Hvis sandsynligheden for at slaring mindst 5 roslashde mindst en gang i de resterende 7 kast er stoslashrre end frac12 saring skal vi vaeliglge det naeligststoslashrste Tilsvarende hvis sandsynligheden for at slaring mindst 5 roslashde mindst 2 gange i de resterende 7 kast skal vi vaeliglge det 3 stoslashrstehellipog saringdan fremdeles Strategien virker umiddelbart meget plausibel Sandsynlighederne kan direkte farings af binomialfordelingen Foslashrst sandsynligheden for at faring mindst q-roslashde i et kast Dette er

P(X q) =

n

qj

jXP )( hvor P(X = j) er angivet ovenfor

Strategier ved spil 20

Sandsynligheden for at dette sker mindst r gange i n - k kast er ogsaring en binomialfordeling og kan skrives

P(X q mindst r gange i n - k kast ) = jknjkn

rj

qXPqXPj

kn

))(1()(

Beregningen af disse (110) sandsynligheder goslashres nok lettest paring en computer For at lave en strategi-tabel goslashr man det at for hvert kast og hvert antal mulige roslashde vaeliglger man foslashrst det stoslashrste af de resterende tal Dernaeligst beregner man sandsynligheden for at faring mindst 1 roslashd mere i et af de foslashlgende kast Hvis denne sandsynlighed er stoslashrre end frac12 ser man paring det naeligststoslashrste af de resterende tal Man beregner saring sandsynligheden for at faring mindst 1 roslashd mere i mindst to af de resterende kast Hvis denne sandsynlighed er stoslashrre end frac12 saring vaeliglger man det tredjestoslashrste af de resterende tal og saringdan fremdeleshellip Det bemaeligrkes at beregningen skal initialiseres med at man altid vaeliglger det mindste hvis man slaringr 0 roslashde og altid vaeliglger det stoslashrste hvis man slaringr 10 roslashde Nedenfor er vist en computerberegning af en strategi-tabel Endvidere er ogsaring lavet en saringkaldt Monte-Carlo simulation Dette betyder at man har ladet maskinen spille feks 10000 spil spillet efter strategi-tabellen Nederst er vist hyppighederne for ens score og endelig fordelingsfunktionen for observationerne (Den kumulerede frekvens) P(X =j) for n =10 and p = 0250 j 0 1 2 3 4 5 6 7 8 9 10 P(X =j)0056 0188 0282 0250 0146 0058 00162 0003 00004 0000 0000 P(Xgt=j) for n =10 and p = 0250 j 0 1 2 3 4 5 6 7 8 9 10 P(Xgt=j) 1000 0944 0756 0474 0224 0078 00197 00035 00004 0000 0000 Strategi tabel Tallene refererer ikke til faktorene selv men til den stoslashrste naeligststoslashrste osv Eksempel Hvis man slaringr 3 roslashde i den andet kast saring skal man vaeliglge (7) den tredjestoslashrste Kast no 1 2 3 4 5 6 7 8 9 10 score 0 1 1 1 1 1 1 1 1 1 1 1 3 3 3 2 2 2 2 1 1 1 2 6 5 5 4 4 3 3 2 2 1 3 8 7 7 6 5 4 3 3 2 1 4 9 9 8 7 6 5 4 3 2 1 5 10 9 8 7 6 5 4 3 2 1 6 10 9 8 7 6 5 4 3 2 1 7 10 9 8 7 6 5 4 3 2 1 8 10 9 8 7 6 5 4 3 2 1 9 10 9 8 7 6 5 4 3 2 1 10 10 9 8 7 6 5 4 3 2 1 Gennemsnitlig score = 16437

Strategier ved spil 21

Hyppighed af score h( 75)= 1 h( 80)= 7 h( 85)= 3 h( 90)= 5 h( 95)= 6 h(100)= 34 h(105)= 38 h(110)= 82 h(115)= 68 h(120)=161 h(125)=146 h(130)=320 h(135)=280 h(140)=534 h(145)=425 h(150)=752 h(155)=577 h(160)=878 h(165)=645 h(170)=956 h(175)=651 h(180)=863 h(185)=527 h(190)=609 h(195)=351 h(200)=389 h(205)=180 h(210)=203 h(215)= 93 h(220)= 86 h(225)= 47 h(230)= 32 h(235)= 21 h(240)= 13 h(245)= 8 h(250)= 3 h(255)= 0 h(260)= 4 h(265)= 1 h(270)= 1 h(275)= 0 h(280)= 0 Frekvens of score F( 80)=00008 F( 85)=00011 F( 90)=00016 F( 95)=00022 F(100)=00056 F(105)=00094 F(110)=00176 F(115)=00244 F(120)=00405 F(125)=00551 F(130)=00871 F(135)=01151 F(140)=01685 F(145)=02110 F(150)=02862 F(155)=03439 F(160)=04317 F(165)=04962 F(170)=05918 F(175)=06569 F(180)=07432 F(185)=07959 F(190)=08568 F(195)=08919 F(200)=09308 F(205)=09488 F(210)=09691 F(215)=09784 F(220)=09870 F(225)=09917 F(230)=09949 F(235)=09970 F(240)=09983 F(245)=09991 F(250)=09994 F(255)=09994 F(260)=09998 F(265)=09999 F(270)=10000 F(275)=10000

Som det fremgaringr af tabellen for P(X gt= j) er der kun 78 chance for at slaring 5 roslashde eller derover saring goslashr man det skal man altid vaeliglge det stoslashrste af de resterende tal For 3 eller 4 roslashde er situationen langt mere uigemmeskuelig og kun en beregning kan afgoslashre sagen Vi proslashver nu at finde den optimale strategi eller Snell-strategien Hvad angaringr sposlashrgsmaringlet om hvorvidt vi skal vaeliglge den stoslashrste eller naeligststoslashrste saring lader det sig faktisk goslashre at beregne Snell-strategien paring en computer De foslashlgende tilfaeliglde bliver derimod for komplicerede og der anvender vi en svagt forbedret version af vores intuitive strategi Forbedringen bestaringr i foslashlgende idet vi illustrerer det med et eksempel Lad os sige vi har slaringet 3 roslashde og vi overvejer om vi vil gange det med 7 eller 6 Ganger vi med 6 er det fordi vi forventer at slaring mindst 4 roslashde mindst en gang i de resterende kast Vores score vil vaeligre 73 og 74 henholdsvis og scoren vil blive forbedret med en faktor 43 hvis vi ganger med 6 under forventning af at slaring 4 roslashde Vores forbedring af strategien garingr da ud paring at vi vaeliglger det naeligststoslashrste 6 hvis sandsynligheden for at slaring 4 roslashde gange den relative forbedring 43 er stoslashrre end frac12 Vi rekapitulerer dernaeligst Snell-strategien G10 = X10 X10 Stokastisk variabel = antallet af roslashde i det 10 kast G9 = max X9 E(G10) E(G10) = E(X10) = np=10025 = 25 X9 = 01hellip10 Gk = max Xk E(Gk+1) E(Gk) kraeligver en laeligngere udregning men den udregnes som en

almindelig middelvaeligrdi altsaring som max af de to vaeligrdier gange P(X=Xk-1) G1 = max X1 E(G2) Som eksempel udregner vi E(G9) Da E(G10)=25 skal vi for X9 = 012 anvende E(G10)=25 i udregningen

Strategier ved spil 22

E(G9) = 25 (P(X=0)+P(X=1)+P(X=2))+ 3P(X=3)+hellip+10P(X=10) =306 Vaeligrdierne for E(Gk) er alle udregnet og vist i computerberegningen nedenfor Bemaeligrk isaeligr at de vokser fra 25 til 425 naringr k aftager fra 10 til 2 Strategien er nu foslashlgende Vaeliglg det stoslashrste af de resterende tal hvis Xk gt E(Gk+1) (altsaring det antal man har slaringet er er stoslashrre end det forventede stoslashrste antal) ellers vaeliglg det naeligststoslashrste Ved afgoslashrelsen om de 3 stoslashrste 4 stoslashrste osv anvender vi den hidtidige strategi med den modifikation at vi multiplicerer sandsynligheden med den formodede relative forbedring E(G10-kast)antal roslashde En computerberegning helt svarende til den foregaringende men med den aeligndrede strategi er vist nedenfor Man bemaeligrker for det foslashrste de smaring aeligndringer der er i strategien Den nye strategi er lidt mindre forsigtig men den giver altsaring ogsaring pote i form af en forbedring af gennemsnittet paring ca 275 Primaeligr sandsynligheder P(X=j) for n= 10 og p= 0250 j 0 1 2 3 4 5 6 7 8 9 10 P(X=j)0056 0188 0282 0250 0146 0058 0016 00031 00004 00000 00000 Baglaeligns Kumulerede sandsynligheder P(Xgt=j) j 0 1 2 3 4 5 6 7 8 9 10 P(Xgt=j) 1000 0944 0756 0474 0224 0078 00197 00035 00004 00000 00000 E(G[10])= 250 E(G[9])= 306 E(G[8])= 337 E(G[7])= 362 E(G[6])= 380 E(G[5])= 395 E(G[4])= 406 E(G[3])= 416 E(G[2])= 425 kast nr 1 2 3 4 5 6 7 8 9 10 score 0 1 1 1 1 1 1 1 1 1 1 1 2 2 1 1 1 1 1 1 1 1 2 5 4 4 3 3 3 2 2 1 1 3 8 7 6 5 5 4 3 2 2 1 4 9 8 7 7 6 5 4 3 2 1 5 10 9 8 7 6 5 4 3 2 1 6 10 9 8 7 6 5 4 3 2 1 7 10 9 8 7 6 5 4 3 2 1 8 10 9 8 7 6 5 4 3 2 1 9 10 9 8 7 6 5 4 3 2 1 10 10 9 8 7 6 5 4 3 2 1 Gennemsnitlig gevinst ms = 16727 Hyppigheder af score h( 75)= 1 h( 80)= 1 h( 85)= 0 h( 90)= 3 h( 95)= 2 h(100)= 5 h(105)= 4 h(110)= 9 h(115)= 12 h(120)= 12 h(125)= 17 h(130)= 22 h(135)= 28 h(140)= 39 h(145)= 24 h(150)= 49 h(155)= 54 h(160)= 74 h(165)= 63 h(170)=117 h(175)= 63 h(180)= 91 h(185)= 57 h(190)= 72 h(195)= 39 h(200)= 36 h(205)= 35 h(210)= 29 h(215)= 14 h(220)= 21 h(225)= 1 h(230)= 5 h(235)= 1 h(240)= 0 h(245)= 0 h(250)= 0 h(255)= 0 h(260)= 0 h(265)= 0 h(270)= 0 h(275)= 0 h(280)= 0

Strategier ved spil 23

Frekvens af score F( 80)=00020 F( 85)=00020 F( 90)=00050 F( 95)=00070 F(100)=00120 F(105)=00160 F(110)=00250 F(115)=00370 F(120)=00490 F(125)=00660 F(130)=00880 F(135)=01160 F(140)=01550 F(145)=01790 F(150)=02280 F(155)=02820 F(160)=03560 F(165)=04190 F(170)=05360 F(175)=05990 F(180)=06900 F(185)=07470 F(190)=08190 F(195)=08580 F(200)=08940 F(205)=09290 F(210)=09580 F(215)=09720 F(220)=09930 F(225)=09940 F(230)=09990 F(235)=10000 F(240)=10000 F(245)=10000 F(250)=10000 F(255)=10000 F(260)=10000 F(265)=10000 F(270)=10000 F(275)=10000

Maringske er det ikke en saeligrlig imponerende forbedring fra den foslashrste strategi men det er en teoretisk milepaeligl at man er i stand til at angive den bedste strategi for bestemte typer af spil Som omtalt har vi ikke forsoslashgt at bevise at Snell-Strategien er den optimale Strategi men det kan bevises Det er vigtigt at notere sig at i alle de omtalte spil har udfaldene vaeligre stokastiske variable dvs uforudsigelige men med bestemte sandsynligheder og at disse sandsynligheder ikke bliver aeligndret af den strategi man foslashlger I mange af de spil hvor man ofte moslashder begrebet strategi feks skak krig finansmarked og markedsfoslashring er dette langt fra tilfaeligldet Hvis feks alle boslashrsspekulanter fulgte den samme optimale strategi med boslashrskursen som stokastisk variabel ville det nok vise sig at det var den daringrligste strategi af alle Teorien for dynamiske strategier hvor de stokastiske variable er funktioner af tiden og af den valgte strategi er teoretisk naeligsten ufremkommelige

Strategier ved spil 24

Indeks Casino516 Computersimulation18 definitionen af sandsynlighed 1 Den optimale Snell-strategi11 forsikringsmatematik 5 Indbrudstyvens pensionsproblem912 kortsigtede strategi 10 kumulerede frekvens 19 langsigtede strategi 10 lotto 1 Mandagschancen14 Mandags-chancen9 Martingale-systemet16

Optimale Strategier 10 Poker 3 rekursionsligning 6 roulette 57 Roulette spil 10 roulettespiller 7 ruinsandsynligheder 5 Skaeligbnen913 Snell-strategien 11 Stopbetingelsen11 strategi9 Taeligndstikspillet1018

Page 17: Sandsynligheder og strategier ved spil - Ole Witt-Hansen ...olewitthansen.dk/Matematik/Sandsynligheder_og_strategier_ved_spil… · 6dqgv\qoljkhghu yhg vslo 3n vdpph pngh ndq yl ilqgh

Strategier ved spil 15

E(X | X q) ndash SnP(q) lt 0 Sn gt E(X | X q) P(q) Det er ikke saeligrlig svaeligrt at udregne stopbetingelsen feks for q = 2 og q = 6 Nedenfor er vist udskriften fra et program som foretager beregningen for q = 212 Forventet gevinst i naeligste kast naringr ens skaeligbne er q q 2 3 4 5 6 7 8 9 10 11 12 694 683 667 644 617 583 589 600 617 639 667 Stop naringr din gevinst S gt EX(q)P(q) naringr skaeligbne er q q 2 3 4 5 6 7 8 9 10 11 12 25000 12300 8000 5800 4440 3500 4240 5400 7400 11500 24000

Som det fremgaringr er der endog meget stor forskel paring stoptiderne afhaeligngig af ens skaeligbne

23 Mandagschancen Dette spil er lidt mere interessant fordi det ikke er helt saring enkelt at gennemskue I dette tilfaeliglde kan man ikke forvente at den kortsigtede strategi vil foslashre til den optimale strategi At den faktisk goslashr det skyldes talvaeligrdierne Dette skal forstarings saringledes at hvis man aeligndrede paring praeligmiestoslashrrelserne ville Snell-strategien afvige fra den kortsigtede strategi Vi vil analysere spillet ved Snell-strategien Som naeligvnt har man i spillet 9 tildaeligkkede felter (101025255050100100250) Man kan afdaeligkke hoslashjest 3 felter Man faringr beloslashbet i 1000 kr som det sidste felt viser Hvis X er den stokastiske variabel som angiver vaeligrdien af et felt saring vil de fleste uden saring lange overvejelser vel fortsaeligtte hvis Xlt50 og standse hvis X100 Det kritiske er hvis man afdaeligkker 50 (X=50) Vi bemaeligrker foslashrst at summen af alle felterne er S=620 og at E(X) =6209=689 Vi opskriver foslashrst den fuldstaeligndige Snell-strategi for dette spil G3 =X3 Den Stokastiske variabel G3 = Gevinsten = X3 = vaeligrdien af det sidst afdaeligkkede felt G2 = max X2 E(G3| X1X2 ) Den stoslashrste af vaeligrdierne X2 (= vaeligrdien af det afdaeligkkede

felt) og den betingede middelvaeligrdi af G3 = X3 G1 = max X1 E(G2| X1 ) Som ovenfor Kriteriet for den optimale strategi er som tidligere Stop hvis paring noget trin Xk gt E(Gk+1| X1Xk ) Det er relativ nemt at opstille en formel for E(G3| X1X2 ) Naringr X1 og X2 er afdaeligkket er summen de resterende felter S - X1 - X2 Da alle felter har samme sandsynlighed er middelvaeligrdien simpelthen middeltallet af felterne E(G3| X1X2 ) = ( S - X1 - X2)(9-2)

Strategier ved spil 16

Det er noget mere teknisk at opstille en formel for E(G2| X1 ) og ogsaring lidt teknisk at foretage beregningen Vi vil noslashjes med at skitsere beregningen for en vaeligrdi af X1 og i oslashvrigt henvise til resultatet af et Computerprogram som kan ses nedenfor Lad os antage at X1 = 25 Vi lader nu X2 gennemloslashbe alle de mulige vaeligrdier (alle vaeligrdier skal taeliglles med det antal gange der er felter med denne vaeligrdi) For hver vaeligrdi af X2 (feks 50) skal vi vaeliglge max af X2 og E(G3| X1X2 ) = ( S - X1 - X2) (9-2) (= (620-50-25)7 = 778 i dette tilfaeliglde) og addere det til en sum S2 E(G2| X1 ) er da lig med S2(9-1) (da der er 9-1 felter X2 ) X2[1]= 1000 E(G3)= 8571 G2= 8571 X2[2]= 2500 E(G3)= 8357 G2= 8357 X2[3]= 5000 E(G3)= 8000 G2= 8000 X2[4]= 10000 E(G3)= 7286 G2= 10000 X2[5]= 25000 E(G3)= 5143 G2= 25000 X1[1]= 1000 E(G[2])= 10786 X2[1]= 1000 E(G3)= 8357 G2= 8357 X2[2]= 2500 E(G3)= 8143 G2= 8143 X2[3]= 5000 E(G3)= 7786 G2= 7786 X2[4]= 10000 E(G3)= 7071 G2= 10000 X2[5]= 25000 E(G3)= 4929 G2= 25000 X1[2]= 2500 E(G[2])= 10679 X2[1]= 1000 E(G3)= 8000 G2= 8000 X2[2]= 2500 E(G3)= 7786 G2= 7786 X2[3]= 5000 E(G3)= 7429 G2= 7429 X2[4]= 10000 E(G3)= 6714 G2= 10000 X2[5]= 25000 E(G3)= 4571 G2= 25000 X1[3]= 5000 E(G[2])= 10500 X2[1]= 1000 E(G3)= 7286 G2= 7286 X2[2]= 2500 E(G3)= 7071 G2= 7071 X2[3]= 5000 E(G3)= 6714 G2= 6714 X2[4]= 10000 E(G3)= 6000 G2= 10000 X2[5]= 25000 E(G3)= 3857 G2= 25000 X1[4]= 10000 E(G[2])= 9643 X2[1]= 1000 E(G3)= 5143 G2= 5143 X2[2]= 2500 E(G3)= 4929 G2= 4929 X2[3]= 5000 E(G3)= 4571 G2= 5000 X2[4]= 10000 E(G3)= 3857 G2= 10000 X1[5]= 25000 E(G[2])= 6268 Ser man resultaterne igennem kan de udmoslashntes i en simpel regel Fortsaeligt paring 50 eller derunder Stop paring 100 eller derover Det er maringske lidt overraskende at man ogsaring skal forsaeligtte paring 50000 hvis man kun har et forsoslashg tilbage ndash man kunne jo ende med 10000 og det er saring bare aeligrgerligt ndash og det er vist nok de fleste som standser ved 50000 - men det er ikke den bedste strategi

Strategier ved spil 17

24 Casino Som naeligvnt i indledningen til dette afsnit findes der ingen strategi som kan bringe en i stand til at vinde paring et Casino ndash i det lange loslashb Vil man goslashre Casino-spil til en levevej vil det altid med matematisk sikkerhed ende med ruin Det betyder imidlertid ikke at man ikke kan vinde ved at garing paring Casino men hvis man taelignker paring at spraelignge banken saring skal to krav i hvert fald vaeligre opfyldt for at der skal vaeligre en ikke forsvindende sandsynlighed for at det kan lade sig goslashre 1 Man skal have flere penge end Casino 2 Der maring ikke vaeligre loft over indsatserne Begge betingelser er som bekendt aldrig opfyldt Man kan som sagt godt vinde paring et Casino men hvis man satser paring at vinde mere (alle de gange man er paring Casino i sit liv) end det beloslashb man medbringer ved hvert besoslashg saring vil chancerne for at tabe det hele vaeligre stoslashrst Her er der tale om sandsynligheder og middelvaeligrdier ndash om odds Selvfoslashlgelig er de muligt at tabe hele sin formue ved foslashrste besoslashg eller vinde det tredobbelte ved det andet Der har i tidens loslashb vaeligret lanceret flere eksempler paring vinderstrategier som lyder uhyre besnaeligrende Den mest kendte er Martingale-systemet Man spiller kun paring sort og roslashd hvor faringr man faringr fordoblet sin indsats hvis man vinder Spillet er saringledes helt lige bortset fra at indsatserne bliver liggende naringr zero kommer ud og man kun faringr sin indsats en gang hvis man vinder i naeligste spil (zero har ingen farve) Spiller man efter Martingale-systemet skal man inkassere sin gevinst hvis man vinder Hvis man derimod taber skal man fordoble sin indsats Vi saeligtter grundindsatsen til 1 Har man spillet n gange og dermed doblet op n-1 gange har man lagt en indsats Sn = 1 + 2 + 22 +hellip2n-1 = 2n ndash1 Udregnet af kvotientraeligkkeformlen

1

10

q

qaS

n

n

for raeligkken Sn = a0 + a0q+ a0q

2+hellip+ a0qn-1

Vinder man det nte spil faringr man udbetalt 22

n-1 = 2n saring ens gevinst er 2n - (2n - 1) = 1 Der gaeliglder aringbenbart den simple kendsgerning at bliver man bare ved med at fordoble saring har man altid vundet eacuten indsats Foslashr man forsoslashger sig med dette skal man dog nok goslashre sig klart hvor mange gange man kan tabe foslashr man er ruineret

Strategier ved spil 18

Sandsynligheden for at man taber 5 spil er (frac12)5 = 132 Man har da tabt 25 ndash 1 gange vaeligrdien af en jeton (i Danmark 50 kr) dvs 1550 kr Vil man sikre sig bedre feks ved at kunne doble op 9 gange (sandsynligheden for at tabe 10 spil er 11024) saring skal man komme med kr 51150- men det kan man ikke engang gennemfoslashre da hoslashjeste indsats i Danmark er 24000- Man kunne imidlertid stille det sposlashrgsmaringl Hvis man har n-jetoner hvad er saring sandsynligheden for at vinde q-jetoner hvis man spiller efter Martingale-systemet Dette kan man faktisk godt udregne direkte men regningerne er ret omfattende Derimod er resultatet simpelt Vi vil ikke lave en direkte udregning men anvende de samme metoder som vi har anvendt for den bedste strategi Vi tager udgangspunkt i det faktum at sort roslashd Casino spil er et lige spil saring middelvaeligrdien af gevinsten er 0 ligegyldigt hvordan man spiller Middelvaeligrdien (som er nul ) af en gevinst paring q-jetoner er lig med q gange sandsynligheden P(q) for at vinde q jetoner minus ens kapital (n jetoner) gange med sandsynligheden for at man taber det sidste spil som er 1 ndash P(q)

qP(q) ndash n(1 ndashP(q)) = 0 qn

nqP

)(

Har man feks n = 31 jetoner (1550- kr) er sandsynligheden for at vinde q=10 (500 kr) lig med 0756 En rimelig stor sandsynlighed men altsaring stadig 25 chance for ruin Oslashnsker man derimod at blive rigtig rig og vinde 10000- kr dvs q=200 er P(200) = 0134 Konklusionen er den at satser man paring at vinde mere end man medbringer saring er sandsynligheden mindre end frac12 men kan man noslashjes med mindre saring er sandsynligheden stoslashrre end frac12 Men bemaeligrk dette gaeliglder fra foslashrste gang man garingr ind paring et Casino til man beslutter at holde op

25 Taeligndstikspillet Som beskrevet ovenfor garingr spillet ud paring at farve den ene af siderne roslashd paring 10 taeligndstikker Naringr taeligndstikken kasten op i luften er sandsynligheden for at den roslashde side vender opad naringr den rammer bordet lig med p=025 Man kaster paring skift 10 saringdanne taeligndstikker 10 gange For hvert kast skal man multiplicere antallet af roslashde med et af tallene 110 Hver tal maring kun bruges eacuten gang Den der faringr den stoslashrste sum har vundet Det er klart at en god strategi i det lange loslashb vil give en hoslashjere sum Vi minder om at antallet af X roslashde taeligndstikker er binomialfordelt med primaeligrsandsynlighed p og antalsparameter n=10

102104

3

4

110)(

10

jj

jXPjj

Strategier ved spil 19

Endvidere vil vi anvende de kumulerede sandsynligheder P(X j) og P(X j) Nedenfor er vist resultatet af en Computersimulation af spillet Primaeligr sandsynligheder for n= 10 og p= 0250 P(X=j) j 0 1 2 3 4 5 6 7 8 9 10 00563 01877 02816 02503 01460 00584 00162 00031 00004 00000 00000 Baglaeligns kumulerede sandsynligheder P(Xgt=q) j 0 1 2 3 4 5 6 7 8 9 10 10000 09437 07560 04744 02241 00781 00197 00035 00004 00000 00000 1 kast Antal = 2 Vaeliglg mellem 1 2 3 4 5 6 7 8 910 Faktor= 4 2 kast Antal = 4 Vaeliglg mellem 1 2 3 5 6 7 8 910 Faktor=10 3 kast Antal = 2 Vaeliglg mellem 1 2 3 5 6 7 8 9 Faktor= 5 4 kast Antal = 2 Vaeliglg mellem 1 2 3 6 7 8 9 Faktor= 3 5 kast Antal = 3 Vaeliglg mellem 1 2 6 7 8 9 Faktor= 8 6 kast Antal = 2 Vaeliglg mellem 1 2 6 7 9 Faktor= 6 7 kast Antal = 6 Vaeliglg mellem 1 2 7 9 Faktor=9 8 kast Antal = 3 Vaeliglg mellem 1 2 7 Faktor= 2 9 kast Antal = 2 Vaeliglg mellem 1 7 Faktor= 7 10 kast Antal = 2 Vaeliglg mellem 1 Faktor= 1 Din score er 176 Valget af tallene 110 er i dette tilfaeliglde foretaget ud fra den optimale strategi som vi vil omtale om et oslashjeblik Foslashr vi analyserer den optimale strategi for dette spil vil vi forsoslashge os med en intuitiv bedste strategi Vi belyser denne strategi med et konkret eksempel Lad os feks antage at vi slaringr 4 roslashde i den 3 kast (3 forsoslashg) De tal vi har tilbage kalder vi (y8 y7 y6 y5 y4 y3 y2 y1) Sposlashrgsmaringlet om vi skal gange med det stoslashrste y8 eller det naeligststoslashrste y7 osv Vi raeligsonnerer da som foslashlger Hvis sandsynligheden for at slaring mere end 4 roslashde i de resterende 7 kast er stoslashrre end frac12 saring skal vi vaeliglge det naeligststoslashrste Vi skaeligrper dette Hvis sandsynligheden for at slaring mindst 5 roslashde mindst en gang i de resterende 7 kast er stoslashrre end frac12 saring skal vi vaeliglge det naeligststoslashrste Tilsvarende hvis sandsynligheden for at slaring mindst 5 roslashde mindst 2 gange i de resterende 7 kast skal vi vaeliglge det 3 stoslashrstehellipog saringdan fremdeles Strategien virker umiddelbart meget plausibel Sandsynlighederne kan direkte farings af binomialfordelingen Foslashrst sandsynligheden for at faring mindst q-roslashde i et kast Dette er

P(X q) =

n

qj

jXP )( hvor P(X = j) er angivet ovenfor

Strategier ved spil 20

Sandsynligheden for at dette sker mindst r gange i n - k kast er ogsaring en binomialfordeling og kan skrives

P(X q mindst r gange i n - k kast ) = jknjkn

rj

qXPqXPj

kn

))(1()(

Beregningen af disse (110) sandsynligheder goslashres nok lettest paring en computer For at lave en strategi-tabel goslashr man det at for hvert kast og hvert antal mulige roslashde vaeliglger man foslashrst det stoslashrste af de resterende tal Dernaeligst beregner man sandsynligheden for at faring mindst 1 roslashd mere i et af de foslashlgende kast Hvis denne sandsynlighed er stoslashrre end frac12 ser man paring det naeligststoslashrste af de resterende tal Man beregner saring sandsynligheden for at faring mindst 1 roslashd mere i mindst to af de resterende kast Hvis denne sandsynlighed er stoslashrre end frac12 saring vaeliglger man det tredjestoslashrste af de resterende tal og saringdan fremdeleshellip Det bemaeligrkes at beregningen skal initialiseres med at man altid vaeliglger det mindste hvis man slaringr 0 roslashde og altid vaeliglger det stoslashrste hvis man slaringr 10 roslashde Nedenfor er vist en computerberegning af en strategi-tabel Endvidere er ogsaring lavet en saringkaldt Monte-Carlo simulation Dette betyder at man har ladet maskinen spille feks 10000 spil spillet efter strategi-tabellen Nederst er vist hyppighederne for ens score og endelig fordelingsfunktionen for observationerne (Den kumulerede frekvens) P(X =j) for n =10 and p = 0250 j 0 1 2 3 4 5 6 7 8 9 10 P(X =j)0056 0188 0282 0250 0146 0058 00162 0003 00004 0000 0000 P(Xgt=j) for n =10 and p = 0250 j 0 1 2 3 4 5 6 7 8 9 10 P(Xgt=j) 1000 0944 0756 0474 0224 0078 00197 00035 00004 0000 0000 Strategi tabel Tallene refererer ikke til faktorene selv men til den stoslashrste naeligststoslashrste osv Eksempel Hvis man slaringr 3 roslashde i den andet kast saring skal man vaeliglge (7) den tredjestoslashrste Kast no 1 2 3 4 5 6 7 8 9 10 score 0 1 1 1 1 1 1 1 1 1 1 1 3 3 3 2 2 2 2 1 1 1 2 6 5 5 4 4 3 3 2 2 1 3 8 7 7 6 5 4 3 3 2 1 4 9 9 8 7 6 5 4 3 2 1 5 10 9 8 7 6 5 4 3 2 1 6 10 9 8 7 6 5 4 3 2 1 7 10 9 8 7 6 5 4 3 2 1 8 10 9 8 7 6 5 4 3 2 1 9 10 9 8 7 6 5 4 3 2 1 10 10 9 8 7 6 5 4 3 2 1 Gennemsnitlig score = 16437

Strategier ved spil 21

Hyppighed af score h( 75)= 1 h( 80)= 7 h( 85)= 3 h( 90)= 5 h( 95)= 6 h(100)= 34 h(105)= 38 h(110)= 82 h(115)= 68 h(120)=161 h(125)=146 h(130)=320 h(135)=280 h(140)=534 h(145)=425 h(150)=752 h(155)=577 h(160)=878 h(165)=645 h(170)=956 h(175)=651 h(180)=863 h(185)=527 h(190)=609 h(195)=351 h(200)=389 h(205)=180 h(210)=203 h(215)= 93 h(220)= 86 h(225)= 47 h(230)= 32 h(235)= 21 h(240)= 13 h(245)= 8 h(250)= 3 h(255)= 0 h(260)= 4 h(265)= 1 h(270)= 1 h(275)= 0 h(280)= 0 Frekvens of score F( 80)=00008 F( 85)=00011 F( 90)=00016 F( 95)=00022 F(100)=00056 F(105)=00094 F(110)=00176 F(115)=00244 F(120)=00405 F(125)=00551 F(130)=00871 F(135)=01151 F(140)=01685 F(145)=02110 F(150)=02862 F(155)=03439 F(160)=04317 F(165)=04962 F(170)=05918 F(175)=06569 F(180)=07432 F(185)=07959 F(190)=08568 F(195)=08919 F(200)=09308 F(205)=09488 F(210)=09691 F(215)=09784 F(220)=09870 F(225)=09917 F(230)=09949 F(235)=09970 F(240)=09983 F(245)=09991 F(250)=09994 F(255)=09994 F(260)=09998 F(265)=09999 F(270)=10000 F(275)=10000

Som det fremgaringr af tabellen for P(X gt= j) er der kun 78 chance for at slaring 5 roslashde eller derover saring goslashr man det skal man altid vaeliglge det stoslashrste af de resterende tal For 3 eller 4 roslashde er situationen langt mere uigemmeskuelig og kun en beregning kan afgoslashre sagen Vi proslashver nu at finde den optimale strategi eller Snell-strategien Hvad angaringr sposlashrgsmaringlet om hvorvidt vi skal vaeliglge den stoslashrste eller naeligststoslashrste saring lader det sig faktisk goslashre at beregne Snell-strategien paring en computer De foslashlgende tilfaeliglde bliver derimod for komplicerede og der anvender vi en svagt forbedret version af vores intuitive strategi Forbedringen bestaringr i foslashlgende idet vi illustrerer det med et eksempel Lad os sige vi har slaringet 3 roslashde og vi overvejer om vi vil gange det med 7 eller 6 Ganger vi med 6 er det fordi vi forventer at slaring mindst 4 roslashde mindst en gang i de resterende kast Vores score vil vaeligre 73 og 74 henholdsvis og scoren vil blive forbedret med en faktor 43 hvis vi ganger med 6 under forventning af at slaring 4 roslashde Vores forbedring af strategien garingr da ud paring at vi vaeliglger det naeligststoslashrste 6 hvis sandsynligheden for at slaring 4 roslashde gange den relative forbedring 43 er stoslashrre end frac12 Vi rekapitulerer dernaeligst Snell-strategien G10 = X10 X10 Stokastisk variabel = antallet af roslashde i det 10 kast G9 = max X9 E(G10) E(G10) = E(X10) = np=10025 = 25 X9 = 01hellip10 Gk = max Xk E(Gk+1) E(Gk) kraeligver en laeligngere udregning men den udregnes som en

almindelig middelvaeligrdi altsaring som max af de to vaeligrdier gange P(X=Xk-1) G1 = max X1 E(G2) Som eksempel udregner vi E(G9) Da E(G10)=25 skal vi for X9 = 012 anvende E(G10)=25 i udregningen

Strategier ved spil 22

E(G9) = 25 (P(X=0)+P(X=1)+P(X=2))+ 3P(X=3)+hellip+10P(X=10) =306 Vaeligrdierne for E(Gk) er alle udregnet og vist i computerberegningen nedenfor Bemaeligrk isaeligr at de vokser fra 25 til 425 naringr k aftager fra 10 til 2 Strategien er nu foslashlgende Vaeliglg det stoslashrste af de resterende tal hvis Xk gt E(Gk+1) (altsaring det antal man har slaringet er er stoslashrre end det forventede stoslashrste antal) ellers vaeliglg det naeligststoslashrste Ved afgoslashrelsen om de 3 stoslashrste 4 stoslashrste osv anvender vi den hidtidige strategi med den modifikation at vi multiplicerer sandsynligheden med den formodede relative forbedring E(G10-kast)antal roslashde En computerberegning helt svarende til den foregaringende men med den aeligndrede strategi er vist nedenfor Man bemaeligrker for det foslashrste de smaring aeligndringer der er i strategien Den nye strategi er lidt mindre forsigtig men den giver altsaring ogsaring pote i form af en forbedring af gennemsnittet paring ca 275 Primaeligr sandsynligheder P(X=j) for n= 10 og p= 0250 j 0 1 2 3 4 5 6 7 8 9 10 P(X=j)0056 0188 0282 0250 0146 0058 0016 00031 00004 00000 00000 Baglaeligns Kumulerede sandsynligheder P(Xgt=j) j 0 1 2 3 4 5 6 7 8 9 10 P(Xgt=j) 1000 0944 0756 0474 0224 0078 00197 00035 00004 00000 00000 E(G[10])= 250 E(G[9])= 306 E(G[8])= 337 E(G[7])= 362 E(G[6])= 380 E(G[5])= 395 E(G[4])= 406 E(G[3])= 416 E(G[2])= 425 kast nr 1 2 3 4 5 6 7 8 9 10 score 0 1 1 1 1 1 1 1 1 1 1 1 2 2 1 1 1 1 1 1 1 1 2 5 4 4 3 3 3 2 2 1 1 3 8 7 6 5 5 4 3 2 2 1 4 9 8 7 7 6 5 4 3 2 1 5 10 9 8 7 6 5 4 3 2 1 6 10 9 8 7 6 5 4 3 2 1 7 10 9 8 7 6 5 4 3 2 1 8 10 9 8 7 6 5 4 3 2 1 9 10 9 8 7 6 5 4 3 2 1 10 10 9 8 7 6 5 4 3 2 1 Gennemsnitlig gevinst ms = 16727 Hyppigheder af score h( 75)= 1 h( 80)= 1 h( 85)= 0 h( 90)= 3 h( 95)= 2 h(100)= 5 h(105)= 4 h(110)= 9 h(115)= 12 h(120)= 12 h(125)= 17 h(130)= 22 h(135)= 28 h(140)= 39 h(145)= 24 h(150)= 49 h(155)= 54 h(160)= 74 h(165)= 63 h(170)=117 h(175)= 63 h(180)= 91 h(185)= 57 h(190)= 72 h(195)= 39 h(200)= 36 h(205)= 35 h(210)= 29 h(215)= 14 h(220)= 21 h(225)= 1 h(230)= 5 h(235)= 1 h(240)= 0 h(245)= 0 h(250)= 0 h(255)= 0 h(260)= 0 h(265)= 0 h(270)= 0 h(275)= 0 h(280)= 0

Strategier ved spil 23

Frekvens af score F( 80)=00020 F( 85)=00020 F( 90)=00050 F( 95)=00070 F(100)=00120 F(105)=00160 F(110)=00250 F(115)=00370 F(120)=00490 F(125)=00660 F(130)=00880 F(135)=01160 F(140)=01550 F(145)=01790 F(150)=02280 F(155)=02820 F(160)=03560 F(165)=04190 F(170)=05360 F(175)=05990 F(180)=06900 F(185)=07470 F(190)=08190 F(195)=08580 F(200)=08940 F(205)=09290 F(210)=09580 F(215)=09720 F(220)=09930 F(225)=09940 F(230)=09990 F(235)=10000 F(240)=10000 F(245)=10000 F(250)=10000 F(255)=10000 F(260)=10000 F(265)=10000 F(270)=10000 F(275)=10000

Maringske er det ikke en saeligrlig imponerende forbedring fra den foslashrste strategi men det er en teoretisk milepaeligl at man er i stand til at angive den bedste strategi for bestemte typer af spil Som omtalt har vi ikke forsoslashgt at bevise at Snell-Strategien er den optimale Strategi men det kan bevises Det er vigtigt at notere sig at i alle de omtalte spil har udfaldene vaeligre stokastiske variable dvs uforudsigelige men med bestemte sandsynligheder og at disse sandsynligheder ikke bliver aeligndret af den strategi man foslashlger I mange af de spil hvor man ofte moslashder begrebet strategi feks skak krig finansmarked og markedsfoslashring er dette langt fra tilfaeligldet Hvis feks alle boslashrsspekulanter fulgte den samme optimale strategi med boslashrskursen som stokastisk variabel ville det nok vise sig at det var den daringrligste strategi af alle Teorien for dynamiske strategier hvor de stokastiske variable er funktioner af tiden og af den valgte strategi er teoretisk naeligsten ufremkommelige

Strategier ved spil 24

Indeks Casino516 Computersimulation18 definitionen af sandsynlighed 1 Den optimale Snell-strategi11 forsikringsmatematik 5 Indbrudstyvens pensionsproblem912 kortsigtede strategi 10 kumulerede frekvens 19 langsigtede strategi 10 lotto 1 Mandagschancen14 Mandags-chancen9 Martingale-systemet16

Optimale Strategier 10 Poker 3 rekursionsligning 6 roulette 57 Roulette spil 10 roulettespiller 7 ruinsandsynligheder 5 Skaeligbnen913 Snell-strategien 11 Stopbetingelsen11 strategi9 Taeligndstikspillet1018

Page 18: Sandsynligheder og strategier ved spil - Ole Witt-Hansen ...olewitthansen.dk/Matematik/Sandsynligheder_og_strategier_ved_spil… · 6dqgv\qoljkhghu yhg vslo 3n vdpph pngh ndq yl ilqgh

Strategier ved spil 16

Det er noget mere teknisk at opstille en formel for E(G2| X1 ) og ogsaring lidt teknisk at foretage beregningen Vi vil noslashjes med at skitsere beregningen for en vaeligrdi af X1 og i oslashvrigt henvise til resultatet af et Computerprogram som kan ses nedenfor Lad os antage at X1 = 25 Vi lader nu X2 gennemloslashbe alle de mulige vaeligrdier (alle vaeligrdier skal taeliglles med det antal gange der er felter med denne vaeligrdi) For hver vaeligrdi af X2 (feks 50) skal vi vaeliglge max af X2 og E(G3| X1X2 ) = ( S - X1 - X2) (9-2) (= (620-50-25)7 = 778 i dette tilfaeliglde) og addere det til en sum S2 E(G2| X1 ) er da lig med S2(9-1) (da der er 9-1 felter X2 ) X2[1]= 1000 E(G3)= 8571 G2= 8571 X2[2]= 2500 E(G3)= 8357 G2= 8357 X2[3]= 5000 E(G3)= 8000 G2= 8000 X2[4]= 10000 E(G3)= 7286 G2= 10000 X2[5]= 25000 E(G3)= 5143 G2= 25000 X1[1]= 1000 E(G[2])= 10786 X2[1]= 1000 E(G3)= 8357 G2= 8357 X2[2]= 2500 E(G3)= 8143 G2= 8143 X2[3]= 5000 E(G3)= 7786 G2= 7786 X2[4]= 10000 E(G3)= 7071 G2= 10000 X2[5]= 25000 E(G3)= 4929 G2= 25000 X1[2]= 2500 E(G[2])= 10679 X2[1]= 1000 E(G3)= 8000 G2= 8000 X2[2]= 2500 E(G3)= 7786 G2= 7786 X2[3]= 5000 E(G3)= 7429 G2= 7429 X2[4]= 10000 E(G3)= 6714 G2= 10000 X2[5]= 25000 E(G3)= 4571 G2= 25000 X1[3]= 5000 E(G[2])= 10500 X2[1]= 1000 E(G3)= 7286 G2= 7286 X2[2]= 2500 E(G3)= 7071 G2= 7071 X2[3]= 5000 E(G3)= 6714 G2= 6714 X2[4]= 10000 E(G3)= 6000 G2= 10000 X2[5]= 25000 E(G3)= 3857 G2= 25000 X1[4]= 10000 E(G[2])= 9643 X2[1]= 1000 E(G3)= 5143 G2= 5143 X2[2]= 2500 E(G3)= 4929 G2= 4929 X2[3]= 5000 E(G3)= 4571 G2= 5000 X2[4]= 10000 E(G3)= 3857 G2= 10000 X1[5]= 25000 E(G[2])= 6268 Ser man resultaterne igennem kan de udmoslashntes i en simpel regel Fortsaeligt paring 50 eller derunder Stop paring 100 eller derover Det er maringske lidt overraskende at man ogsaring skal forsaeligtte paring 50000 hvis man kun har et forsoslashg tilbage ndash man kunne jo ende med 10000 og det er saring bare aeligrgerligt ndash og det er vist nok de fleste som standser ved 50000 - men det er ikke den bedste strategi

Strategier ved spil 17

24 Casino Som naeligvnt i indledningen til dette afsnit findes der ingen strategi som kan bringe en i stand til at vinde paring et Casino ndash i det lange loslashb Vil man goslashre Casino-spil til en levevej vil det altid med matematisk sikkerhed ende med ruin Det betyder imidlertid ikke at man ikke kan vinde ved at garing paring Casino men hvis man taelignker paring at spraelignge banken saring skal to krav i hvert fald vaeligre opfyldt for at der skal vaeligre en ikke forsvindende sandsynlighed for at det kan lade sig goslashre 1 Man skal have flere penge end Casino 2 Der maring ikke vaeligre loft over indsatserne Begge betingelser er som bekendt aldrig opfyldt Man kan som sagt godt vinde paring et Casino men hvis man satser paring at vinde mere (alle de gange man er paring Casino i sit liv) end det beloslashb man medbringer ved hvert besoslashg saring vil chancerne for at tabe det hele vaeligre stoslashrst Her er der tale om sandsynligheder og middelvaeligrdier ndash om odds Selvfoslashlgelig er de muligt at tabe hele sin formue ved foslashrste besoslashg eller vinde det tredobbelte ved det andet Der har i tidens loslashb vaeligret lanceret flere eksempler paring vinderstrategier som lyder uhyre besnaeligrende Den mest kendte er Martingale-systemet Man spiller kun paring sort og roslashd hvor faringr man faringr fordoblet sin indsats hvis man vinder Spillet er saringledes helt lige bortset fra at indsatserne bliver liggende naringr zero kommer ud og man kun faringr sin indsats en gang hvis man vinder i naeligste spil (zero har ingen farve) Spiller man efter Martingale-systemet skal man inkassere sin gevinst hvis man vinder Hvis man derimod taber skal man fordoble sin indsats Vi saeligtter grundindsatsen til 1 Har man spillet n gange og dermed doblet op n-1 gange har man lagt en indsats Sn = 1 + 2 + 22 +hellip2n-1 = 2n ndash1 Udregnet af kvotientraeligkkeformlen

1

10

q

qaS

n

n

for raeligkken Sn = a0 + a0q+ a0q

2+hellip+ a0qn-1

Vinder man det nte spil faringr man udbetalt 22

n-1 = 2n saring ens gevinst er 2n - (2n - 1) = 1 Der gaeliglder aringbenbart den simple kendsgerning at bliver man bare ved med at fordoble saring har man altid vundet eacuten indsats Foslashr man forsoslashger sig med dette skal man dog nok goslashre sig klart hvor mange gange man kan tabe foslashr man er ruineret

Strategier ved spil 18

Sandsynligheden for at man taber 5 spil er (frac12)5 = 132 Man har da tabt 25 ndash 1 gange vaeligrdien af en jeton (i Danmark 50 kr) dvs 1550 kr Vil man sikre sig bedre feks ved at kunne doble op 9 gange (sandsynligheden for at tabe 10 spil er 11024) saring skal man komme med kr 51150- men det kan man ikke engang gennemfoslashre da hoslashjeste indsats i Danmark er 24000- Man kunne imidlertid stille det sposlashrgsmaringl Hvis man har n-jetoner hvad er saring sandsynligheden for at vinde q-jetoner hvis man spiller efter Martingale-systemet Dette kan man faktisk godt udregne direkte men regningerne er ret omfattende Derimod er resultatet simpelt Vi vil ikke lave en direkte udregning men anvende de samme metoder som vi har anvendt for den bedste strategi Vi tager udgangspunkt i det faktum at sort roslashd Casino spil er et lige spil saring middelvaeligrdien af gevinsten er 0 ligegyldigt hvordan man spiller Middelvaeligrdien (som er nul ) af en gevinst paring q-jetoner er lig med q gange sandsynligheden P(q) for at vinde q jetoner minus ens kapital (n jetoner) gange med sandsynligheden for at man taber det sidste spil som er 1 ndash P(q)

qP(q) ndash n(1 ndashP(q)) = 0 qn

nqP

)(

Har man feks n = 31 jetoner (1550- kr) er sandsynligheden for at vinde q=10 (500 kr) lig med 0756 En rimelig stor sandsynlighed men altsaring stadig 25 chance for ruin Oslashnsker man derimod at blive rigtig rig og vinde 10000- kr dvs q=200 er P(200) = 0134 Konklusionen er den at satser man paring at vinde mere end man medbringer saring er sandsynligheden mindre end frac12 men kan man noslashjes med mindre saring er sandsynligheden stoslashrre end frac12 Men bemaeligrk dette gaeliglder fra foslashrste gang man garingr ind paring et Casino til man beslutter at holde op

25 Taeligndstikspillet Som beskrevet ovenfor garingr spillet ud paring at farve den ene af siderne roslashd paring 10 taeligndstikker Naringr taeligndstikken kasten op i luften er sandsynligheden for at den roslashde side vender opad naringr den rammer bordet lig med p=025 Man kaster paring skift 10 saringdanne taeligndstikker 10 gange For hvert kast skal man multiplicere antallet af roslashde med et af tallene 110 Hver tal maring kun bruges eacuten gang Den der faringr den stoslashrste sum har vundet Det er klart at en god strategi i det lange loslashb vil give en hoslashjere sum Vi minder om at antallet af X roslashde taeligndstikker er binomialfordelt med primaeligrsandsynlighed p og antalsparameter n=10

102104

3

4

110)(

10

jj

jXPjj

Strategier ved spil 19

Endvidere vil vi anvende de kumulerede sandsynligheder P(X j) og P(X j) Nedenfor er vist resultatet af en Computersimulation af spillet Primaeligr sandsynligheder for n= 10 og p= 0250 P(X=j) j 0 1 2 3 4 5 6 7 8 9 10 00563 01877 02816 02503 01460 00584 00162 00031 00004 00000 00000 Baglaeligns kumulerede sandsynligheder P(Xgt=q) j 0 1 2 3 4 5 6 7 8 9 10 10000 09437 07560 04744 02241 00781 00197 00035 00004 00000 00000 1 kast Antal = 2 Vaeliglg mellem 1 2 3 4 5 6 7 8 910 Faktor= 4 2 kast Antal = 4 Vaeliglg mellem 1 2 3 5 6 7 8 910 Faktor=10 3 kast Antal = 2 Vaeliglg mellem 1 2 3 5 6 7 8 9 Faktor= 5 4 kast Antal = 2 Vaeliglg mellem 1 2 3 6 7 8 9 Faktor= 3 5 kast Antal = 3 Vaeliglg mellem 1 2 6 7 8 9 Faktor= 8 6 kast Antal = 2 Vaeliglg mellem 1 2 6 7 9 Faktor= 6 7 kast Antal = 6 Vaeliglg mellem 1 2 7 9 Faktor=9 8 kast Antal = 3 Vaeliglg mellem 1 2 7 Faktor= 2 9 kast Antal = 2 Vaeliglg mellem 1 7 Faktor= 7 10 kast Antal = 2 Vaeliglg mellem 1 Faktor= 1 Din score er 176 Valget af tallene 110 er i dette tilfaeliglde foretaget ud fra den optimale strategi som vi vil omtale om et oslashjeblik Foslashr vi analyserer den optimale strategi for dette spil vil vi forsoslashge os med en intuitiv bedste strategi Vi belyser denne strategi med et konkret eksempel Lad os feks antage at vi slaringr 4 roslashde i den 3 kast (3 forsoslashg) De tal vi har tilbage kalder vi (y8 y7 y6 y5 y4 y3 y2 y1) Sposlashrgsmaringlet om vi skal gange med det stoslashrste y8 eller det naeligststoslashrste y7 osv Vi raeligsonnerer da som foslashlger Hvis sandsynligheden for at slaring mere end 4 roslashde i de resterende 7 kast er stoslashrre end frac12 saring skal vi vaeliglge det naeligststoslashrste Vi skaeligrper dette Hvis sandsynligheden for at slaring mindst 5 roslashde mindst en gang i de resterende 7 kast er stoslashrre end frac12 saring skal vi vaeliglge det naeligststoslashrste Tilsvarende hvis sandsynligheden for at slaring mindst 5 roslashde mindst 2 gange i de resterende 7 kast skal vi vaeliglge det 3 stoslashrstehellipog saringdan fremdeles Strategien virker umiddelbart meget plausibel Sandsynlighederne kan direkte farings af binomialfordelingen Foslashrst sandsynligheden for at faring mindst q-roslashde i et kast Dette er

P(X q) =

n

qj

jXP )( hvor P(X = j) er angivet ovenfor

Strategier ved spil 20

Sandsynligheden for at dette sker mindst r gange i n - k kast er ogsaring en binomialfordeling og kan skrives

P(X q mindst r gange i n - k kast ) = jknjkn

rj

qXPqXPj

kn

))(1()(

Beregningen af disse (110) sandsynligheder goslashres nok lettest paring en computer For at lave en strategi-tabel goslashr man det at for hvert kast og hvert antal mulige roslashde vaeliglger man foslashrst det stoslashrste af de resterende tal Dernaeligst beregner man sandsynligheden for at faring mindst 1 roslashd mere i et af de foslashlgende kast Hvis denne sandsynlighed er stoslashrre end frac12 ser man paring det naeligststoslashrste af de resterende tal Man beregner saring sandsynligheden for at faring mindst 1 roslashd mere i mindst to af de resterende kast Hvis denne sandsynlighed er stoslashrre end frac12 saring vaeliglger man det tredjestoslashrste af de resterende tal og saringdan fremdeleshellip Det bemaeligrkes at beregningen skal initialiseres med at man altid vaeliglger det mindste hvis man slaringr 0 roslashde og altid vaeliglger det stoslashrste hvis man slaringr 10 roslashde Nedenfor er vist en computerberegning af en strategi-tabel Endvidere er ogsaring lavet en saringkaldt Monte-Carlo simulation Dette betyder at man har ladet maskinen spille feks 10000 spil spillet efter strategi-tabellen Nederst er vist hyppighederne for ens score og endelig fordelingsfunktionen for observationerne (Den kumulerede frekvens) P(X =j) for n =10 and p = 0250 j 0 1 2 3 4 5 6 7 8 9 10 P(X =j)0056 0188 0282 0250 0146 0058 00162 0003 00004 0000 0000 P(Xgt=j) for n =10 and p = 0250 j 0 1 2 3 4 5 6 7 8 9 10 P(Xgt=j) 1000 0944 0756 0474 0224 0078 00197 00035 00004 0000 0000 Strategi tabel Tallene refererer ikke til faktorene selv men til den stoslashrste naeligststoslashrste osv Eksempel Hvis man slaringr 3 roslashde i den andet kast saring skal man vaeliglge (7) den tredjestoslashrste Kast no 1 2 3 4 5 6 7 8 9 10 score 0 1 1 1 1 1 1 1 1 1 1 1 3 3 3 2 2 2 2 1 1 1 2 6 5 5 4 4 3 3 2 2 1 3 8 7 7 6 5 4 3 3 2 1 4 9 9 8 7 6 5 4 3 2 1 5 10 9 8 7 6 5 4 3 2 1 6 10 9 8 7 6 5 4 3 2 1 7 10 9 8 7 6 5 4 3 2 1 8 10 9 8 7 6 5 4 3 2 1 9 10 9 8 7 6 5 4 3 2 1 10 10 9 8 7 6 5 4 3 2 1 Gennemsnitlig score = 16437

Strategier ved spil 21

Hyppighed af score h( 75)= 1 h( 80)= 7 h( 85)= 3 h( 90)= 5 h( 95)= 6 h(100)= 34 h(105)= 38 h(110)= 82 h(115)= 68 h(120)=161 h(125)=146 h(130)=320 h(135)=280 h(140)=534 h(145)=425 h(150)=752 h(155)=577 h(160)=878 h(165)=645 h(170)=956 h(175)=651 h(180)=863 h(185)=527 h(190)=609 h(195)=351 h(200)=389 h(205)=180 h(210)=203 h(215)= 93 h(220)= 86 h(225)= 47 h(230)= 32 h(235)= 21 h(240)= 13 h(245)= 8 h(250)= 3 h(255)= 0 h(260)= 4 h(265)= 1 h(270)= 1 h(275)= 0 h(280)= 0 Frekvens of score F( 80)=00008 F( 85)=00011 F( 90)=00016 F( 95)=00022 F(100)=00056 F(105)=00094 F(110)=00176 F(115)=00244 F(120)=00405 F(125)=00551 F(130)=00871 F(135)=01151 F(140)=01685 F(145)=02110 F(150)=02862 F(155)=03439 F(160)=04317 F(165)=04962 F(170)=05918 F(175)=06569 F(180)=07432 F(185)=07959 F(190)=08568 F(195)=08919 F(200)=09308 F(205)=09488 F(210)=09691 F(215)=09784 F(220)=09870 F(225)=09917 F(230)=09949 F(235)=09970 F(240)=09983 F(245)=09991 F(250)=09994 F(255)=09994 F(260)=09998 F(265)=09999 F(270)=10000 F(275)=10000

Som det fremgaringr af tabellen for P(X gt= j) er der kun 78 chance for at slaring 5 roslashde eller derover saring goslashr man det skal man altid vaeliglge det stoslashrste af de resterende tal For 3 eller 4 roslashde er situationen langt mere uigemmeskuelig og kun en beregning kan afgoslashre sagen Vi proslashver nu at finde den optimale strategi eller Snell-strategien Hvad angaringr sposlashrgsmaringlet om hvorvidt vi skal vaeliglge den stoslashrste eller naeligststoslashrste saring lader det sig faktisk goslashre at beregne Snell-strategien paring en computer De foslashlgende tilfaeliglde bliver derimod for komplicerede og der anvender vi en svagt forbedret version af vores intuitive strategi Forbedringen bestaringr i foslashlgende idet vi illustrerer det med et eksempel Lad os sige vi har slaringet 3 roslashde og vi overvejer om vi vil gange det med 7 eller 6 Ganger vi med 6 er det fordi vi forventer at slaring mindst 4 roslashde mindst en gang i de resterende kast Vores score vil vaeligre 73 og 74 henholdsvis og scoren vil blive forbedret med en faktor 43 hvis vi ganger med 6 under forventning af at slaring 4 roslashde Vores forbedring af strategien garingr da ud paring at vi vaeliglger det naeligststoslashrste 6 hvis sandsynligheden for at slaring 4 roslashde gange den relative forbedring 43 er stoslashrre end frac12 Vi rekapitulerer dernaeligst Snell-strategien G10 = X10 X10 Stokastisk variabel = antallet af roslashde i det 10 kast G9 = max X9 E(G10) E(G10) = E(X10) = np=10025 = 25 X9 = 01hellip10 Gk = max Xk E(Gk+1) E(Gk) kraeligver en laeligngere udregning men den udregnes som en

almindelig middelvaeligrdi altsaring som max af de to vaeligrdier gange P(X=Xk-1) G1 = max X1 E(G2) Som eksempel udregner vi E(G9) Da E(G10)=25 skal vi for X9 = 012 anvende E(G10)=25 i udregningen

Strategier ved spil 22

E(G9) = 25 (P(X=0)+P(X=1)+P(X=2))+ 3P(X=3)+hellip+10P(X=10) =306 Vaeligrdierne for E(Gk) er alle udregnet og vist i computerberegningen nedenfor Bemaeligrk isaeligr at de vokser fra 25 til 425 naringr k aftager fra 10 til 2 Strategien er nu foslashlgende Vaeliglg det stoslashrste af de resterende tal hvis Xk gt E(Gk+1) (altsaring det antal man har slaringet er er stoslashrre end det forventede stoslashrste antal) ellers vaeliglg det naeligststoslashrste Ved afgoslashrelsen om de 3 stoslashrste 4 stoslashrste osv anvender vi den hidtidige strategi med den modifikation at vi multiplicerer sandsynligheden med den formodede relative forbedring E(G10-kast)antal roslashde En computerberegning helt svarende til den foregaringende men med den aeligndrede strategi er vist nedenfor Man bemaeligrker for det foslashrste de smaring aeligndringer der er i strategien Den nye strategi er lidt mindre forsigtig men den giver altsaring ogsaring pote i form af en forbedring af gennemsnittet paring ca 275 Primaeligr sandsynligheder P(X=j) for n= 10 og p= 0250 j 0 1 2 3 4 5 6 7 8 9 10 P(X=j)0056 0188 0282 0250 0146 0058 0016 00031 00004 00000 00000 Baglaeligns Kumulerede sandsynligheder P(Xgt=j) j 0 1 2 3 4 5 6 7 8 9 10 P(Xgt=j) 1000 0944 0756 0474 0224 0078 00197 00035 00004 00000 00000 E(G[10])= 250 E(G[9])= 306 E(G[8])= 337 E(G[7])= 362 E(G[6])= 380 E(G[5])= 395 E(G[4])= 406 E(G[3])= 416 E(G[2])= 425 kast nr 1 2 3 4 5 6 7 8 9 10 score 0 1 1 1 1 1 1 1 1 1 1 1 2 2 1 1 1 1 1 1 1 1 2 5 4 4 3 3 3 2 2 1 1 3 8 7 6 5 5 4 3 2 2 1 4 9 8 7 7 6 5 4 3 2 1 5 10 9 8 7 6 5 4 3 2 1 6 10 9 8 7 6 5 4 3 2 1 7 10 9 8 7 6 5 4 3 2 1 8 10 9 8 7 6 5 4 3 2 1 9 10 9 8 7 6 5 4 3 2 1 10 10 9 8 7 6 5 4 3 2 1 Gennemsnitlig gevinst ms = 16727 Hyppigheder af score h( 75)= 1 h( 80)= 1 h( 85)= 0 h( 90)= 3 h( 95)= 2 h(100)= 5 h(105)= 4 h(110)= 9 h(115)= 12 h(120)= 12 h(125)= 17 h(130)= 22 h(135)= 28 h(140)= 39 h(145)= 24 h(150)= 49 h(155)= 54 h(160)= 74 h(165)= 63 h(170)=117 h(175)= 63 h(180)= 91 h(185)= 57 h(190)= 72 h(195)= 39 h(200)= 36 h(205)= 35 h(210)= 29 h(215)= 14 h(220)= 21 h(225)= 1 h(230)= 5 h(235)= 1 h(240)= 0 h(245)= 0 h(250)= 0 h(255)= 0 h(260)= 0 h(265)= 0 h(270)= 0 h(275)= 0 h(280)= 0

Strategier ved spil 23

Frekvens af score F( 80)=00020 F( 85)=00020 F( 90)=00050 F( 95)=00070 F(100)=00120 F(105)=00160 F(110)=00250 F(115)=00370 F(120)=00490 F(125)=00660 F(130)=00880 F(135)=01160 F(140)=01550 F(145)=01790 F(150)=02280 F(155)=02820 F(160)=03560 F(165)=04190 F(170)=05360 F(175)=05990 F(180)=06900 F(185)=07470 F(190)=08190 F(195)=08580 F(200)=08940 F(205)=09290 F(210)=09580 F(215)=09720 F(220)=09930 F(225)=09940 F(230)=09990 F(235)=10000 F(240)=10000 F(245)=10000 F(250)=10000 F(255)=10000 F(260)=10000 F(265)=10000 F(270)=10000 F(275)=10000

Maringske er det ikke en saeligrlig imponerende forbedring fra den foslashrste strategi men det er en teoretisk milepaeligl at man er i stand til at angive den bedste strategi for bestemte typer af spil Som omtalt har vi ikke forsoslashgt at bevise at Snell-Strategien er den optimale Strategi men det kan bevises Det er vigtigt at notere sig at i alle de omtalte spil har udfaldene vaeligre stokastiske variable dvs uforudsigelige men med bestemte sandsynligheder og at disse sandsynligheder ikke bliver aeligndret af den strategi man foslashlger I mange af de spil hvor man ofte moslashder begrebet strategi feks skak krig finansmarked og markedsfoslashring er dette langt fra tilfaeligldet Hvis feks alle boslashrsspekulanter fulgte den samme optimale strategi med boslashrskursen som stokastisk variabel ville det nok vise sig at det var den daringrligste strategi af alle Teorien for dynamiske strategier hvor de stokastiske variable er funktioner af tiden og af den valgte strategi er teoretisk naeligsten ufremkommelige

Strategier ved spil 24

Indeks Casino516 Computersimulation18 definitionen af sandsynlighed 1 Den optimale Snell-strategi11 forsikringsmatematik 5 Indbrudstyvens pensionsproblem912 kortsigtede strategi 10 kumulerede frekvens 19 langsigtede strategi 10 lotto 1 Mandagschancen14 Mandags-chancen9 Martingale-systemet16

Optimale Strategier 10 Poker 3 rekursionsligning 6 roulette 57 Roulette spil 10 roulettespiller 7 ruinsandsynligheder 5 Skaeligbnen913 Snell-strategien 11 Stopbetingelsen11 strategi9 Taeligndstikspillet1018

Page 19: Sandsynligheder og strategier ved spil - Ole Witt-Hansen ...olewitthansen.dk/Matematik/Sandsynligheder_og_strategier_ved_spil… · 6dqgv\qoljkhghu yhg vslo 3n vdpph pngh ndq yl ilqgh

Strategier ved spil 17

24 Casino Som naeligvnt i indledningen til dette afsnit findes der ingen strategi som kan bringe en i stand til at vinde paring et Casino ndash i det lange loslashb Vil man goslashre Casino-spil til en levevej vil det altid med matematisk sikkerhed ende med ruin Det betyder imidlertid ikke at man ikke kan vinde ved at garing paring Casino men hvis man taelignker paring at spraelignge banken saring skal to krav i hvert fald vaeligre opfyldt for at der skal vaeligre en ikke forsvindende sandsynlighed for at det kan lade sig goslashre 1 Man skal have flere penge end Casino 2 Der maring ikke vaeligre loft over indsatserne Begge betingelser er som bekendt aldrig opfyldt Man kan som sagt godt vinde paring et Casino men hvis man satser paring at vinde mere (alle de gange man er paring Casino i sit liv) end det beloslashb man medbringer ved hvert besoslashg saring vil chancerne for at tabe det hele vaeligre stoslashrst Her er der tale om sandsynligheder og middelvaeligrdier ndash om odds Selvfoslashlgelig er de muligt at tabe hele sin formue ved foslashrste besoslashg eller vinde det tredobbelte ved det andet Der har i tidens loslashb vaeligret lanceret flere eksempler paring vinderstrategier som lyder uhyre besnaeligrende Den mest kendte er Martingale-systemet Man spiller kun paring sort og roslashd hvor faringr man faringr fordoblet sin indsats hvis man vinder Spillet er saringledes helt lige bortset fra at indsatserne bliver liggende naringr zero kommer ud og man kun faringr sin indsats en gang hvis man vinder i naeligste spil (zero har ingen farve) Spiller man efter Martingale-systemet skal man inkassere sin gevinst hvis man vinder Hvis man derimod taber skal man fordoble sin indsats Vi saeligtter grundindsatsen til 1 Har man spillet n gange og dermed doblet op n-1 gange har man lagt en indsats Sn = 1 + 2 + 22 +hellip2n-1 = 2n ndash1 Udregnet af kvotientraeligkkeformlen

1

10

q

qaS

n

n

for raeligkken Sn = a0 + a0q+ a0q

2+hellip+ a0qn-1

Vinder man det nte spil faringr man udbetalt 22

n-1 = 2n saring ens gevinst er 2n - (2n - 1) = 1 Der gaeliglder aringbenbart den simple kendsgerning at bliver man bare ved med at fordoble saring har man altid vundet eacuten indsats Foslashr man forsoslashger sig med dette skal man dog nok goslashre sig klart hvor mange gange man kan tabe foslashr man er ruineret

Strategier ved spil 18

Sandsynligheden for at man taber 5 spil er (frac12)5 = 132 Man har da tabt 25 ndash 1 gange vaeligrdien af en jeton (i Danmark 50 kr) dvs 1550 kr Vil man sikre sig bedre feks ved at kunne doble op 9 gange (sandsynligheden for at tabe 10 spil er 11024) saring skal man komme med kr 51150- men det kan man ikke engang gennemfoslashre da hoslashjeste indsats i Danmark er 24000- Man kunne imidlertid stille det sposlashrgsmaringl Hvis man har n-jetoner hvad er saring sandsynligheden for at vinde q-jetoner hvis man spiller efter Martingale-systemet Dette kan man faktisk godt udregne direkte men regningerne er ret omfattende Derimod er resultatet simpelt Vi vil ikke lave en direkte udregning men anvende de samme metoder som vi har anvendt for den bedste strategi Vi tager udgangspunkt i det faktum at sort roslashd Casino spil er et lige spil saring middelvaeligrdien af gevinsten er 0 ligegyldigt hvordan man spiller Middelvaeligrdien (som er nul ) af en gevinst paring q-jetoner er lig med q gange sandsynligheden P(q) for at vinde q jetoner minus ens kapital (n jetoner) gange med sandsynligheden for at man taber det sidste spil som er 1 ndash P(q)

qP(q) ndash n(1 ndashP(q)) = 0 qn

nqP

)(

Har man feks n = 31 jetoner (1550- kr) er sandsynligheden for at vinde q=10 (500 kr) lig med 0756 En rimelig stor sandsynlighed men altsaring stadig 25 chance for ruin Oslashnsker man derimod at blive rigtig rig og vinde 10000- kr dvs q=200 er P(200) = 0134 Konklusionen er den at satser man paring at vinde mere end man medbringer saring er sandsynligheden mindre end frac12 men kan man noslashjes med mindre saring er sandsynligheden stoslashrre end frac12 Men bemaeligrk dette gaeliglder fra foslashrste gang man garingr ind paring et Casino til man beslutter at holde op

25 Taeligndstikspillet Som beskrevet ovenfor garingr spillet ud paring at farve den ene af siderne roslashd paring 10 taeligndstikker Naringr taeligndstikken kasten op i luften er sandsynligheden for at den roslashde side vender opad naringr den rammer bordet lig med p=025 Man kaster paring skift 10 saringdanne taeligndstikker 10 gange For hvert kast skal man multiplicere antallet af roslashde med et af tallene 110 Hver tal maring kun bruges eacuten gang Den der faringr den stoslashrste sum har vundet Det er klart at en god strategi i det lange loslashb vil give en hoslashjere sum Vi minder om at antallet af X roslashde taeligndstikker er binomialfordelt med primaeligrsandsynlighed p og antalsparameter n=10

102104

3

4

110)(

10

jj

jXPjj

Strategier ved spil 19

Endvidere vil vi anvende de kumulerede sandsynligheder P(X j) og P(X j) Nedenfor er vist resultatet af en Computersimulation af spillet Primaeligr sandsynligheder for n= 10 og p= 0250 P(X=j) j 0 1 2 3 4 5 6 7 8 9 10 00563 01877 02816 02503 01460 00584 00162 00031 00004 00000 00000 Baglaeligns kumulerede sandsynligheder P(Xgt=q) j 0 1 2 3 4 5 6 7 8 9 10 10000 09437 07560 04744 02241 00781 00197 00035 00004 00000 00000 1 kast Antal = 2 Vaeliglg mellem 1 2 3 4 5 6 7 8 910 Faktor= 4 2 kast Antal = 4 Vaeliglg mellem 1 2 3 5 6 7 8 910 Faktor=10 3 kast Antal = 2 Vaeliglg mellem 1 2 3 5 6 7 8 9 Faktor= 5 4 kast Antal = 2 Vaeliglg mellem 1 2 3 6 7 8 9 Faktor= 3 5 kast Antal = 3 Vaeliglg mellem 1 2 6 7 8 9 Faktor= 8 6 kast Antal = 2 Vaeliglg mellem 1 2 6 7 9 Faktor= 6 7 kast Antal = 6 Vaeliglg mellem 1 2 7 9 Faktor=9 8 kast Antal = 3 Vaeliglg mellem 1 2 7 Faktor= 2 9 kast Antal = 2 Vaeliglg mellem 1 7 Faktor= 7 10 kast Antal = 2 Vaeliglg mellem 1 Faktor= 1 Din score er 176 Valget af tallene 110 er i dette tilfaeliglde foretaget ud fra den optimale strategi som vi vil omtale om et oslashjeblik Foslashr vi analyserer den optimale strategi for dette spil vil vi forsoslashge os med en intuitiv bedste strategi Vi belyser denne strategi med et konkret eksempel Lad os feks antage at vi slaringr 4 roslashde i den 3 kast (3 forsoslashg) De tal vi har tilbage kalder vi (y8 y7 y6 y5 y4 y3 y2 y1) Sposlashrgsmaringlet om vi skal gange med det stoslashrste y8 eller det naeligststoslashrste y7 osv Vi raeligsonnerer da som foslashlger Hvis sandsynligheden for at slaring mere end 4 roslashde i de resterende 7 kast er stoslashrre end frac12 saring skal vi vaeliglge det naeligststoslashrste Vi skaeligrper dette Hvis sandsynligheden for at slaring mindst 5 roslashde mindst en gang i de resterende 7 kast er stoslashrre end frac12 saring skal vi vaeliglge det naeligststoslashrste Tilsvarende hvis sandsynligheden for at slaring mindst 5 roslashde mindst 2 gange i de resterende 7 kast skal vi vaeliglge det 3 stoslashrstehellipog saringdan fremdeles Strategien virker umiddelbart meget plausibel Sandsynlighederne kan direkte farings af binomialfordelingen Foslashrst sandsynligheden for at faring mindst q-roslashde i et kast Dette er

P(X q) =

n

qj

jXP )( hvor P(X = j) er angivet ovenfor

Strategier ved spil 20

Sandsynligheden for at dette sker mindst r gange i n - k kast er ogsaring en binomialfordeling og kan skrives

P(X q mindst r gange i n - k kast ) = jknjkn

rj

qXPqXPj

kn

))(1()(

Beregningen af disse (110) sandsynligheder goslashres nok lettest paring en computer For at lave en strategi-tabel goslashr man det at for hvert kast og hvert antal mulige roslashde vaeliglger man foslashrst det stoslashrste af de resterende tal Dernaeligst beregner man sandsynligheden for at faring mindst 1 roslashd mere i et af de foslashlgende kast Hvis denne sandsynlighed er stoslashrre end frac12 ser man paring det naeligststoslashrste af de resterende tal Man beregner saring sandsynligheden for at faring mindst 1 roslashd mere i mindst to af de resterende kast Hvis denne sandsynlighed er stoslashrre end frac12 saring vaeliglger man det tredjestoslashrste af de resterende tal og saringdan fremdeleshellip Det bemaeligrkes at beregningen skal initialiseres med at man altid vaeliglger det mindste hvis man slaringr 0 roslashde og altid vaeliglger det stoslashrste hvis man slaringr 10 roslashde Nedenfor er vist en computerberegning af en strategi-tabel Endvidere er ogsaring lavet en saringkaldt Monte-Carlo simulation Dette betyder at man har ladet maskinen spille feks 10000 spil spillet efter strategi-tabellen Nederst er vist hyppighederne for ens score og endelig fordelingsfunktionen for observationerne (Den kumulerede frekvens) P(X =j) for n =10 and p = 0250 j 0 1 2 3 4 5 6 7 8 9 10 P(X =j)0056 0188 0282 0250 0146 0058 00162 0003 00004 0000 0000 P(Xgt=j) for n =10 and p = 0250 j 0 1 2 3 4 5 6 7 8 9 10 P(Xgt=j) 1000 0944 0756 0474 0224 0078 00197 00035 00004 0000 0000 Strategi tabel Tallene refererer ikke til faktorene selv men til den stoslashrste naeligststoslashrste osv Eksempel Hvis man slaringr 3 roslashde i den andet kast saring skal man vaeliglge (7) den tredjestoslashrste Kast no 1 2 3 4 5 6 7 8 9 10 score 0 1 1 1 1 1 1 1 1 1 1 1 3 3 3 2 2 2 2 1 1 1 2 6 5 5 4 4 3 3 2 2 1 3 8 7 7 6 5 4 3 3 2 1 4 9 9 8 7 6 5 4 3 2 1 5 10 9 8 7 6 5 4 3 2 1 6 10 9 8 7 6 5 4 3 2 1 7 10 9 8 7 6 5 4 3 2 1 8 10 9 8 7 6 5 4 3 2 1 9 10 9 8 7 6 5 4 3 2 1 10 10 9 8 7 6 5 4 3 2 1 Gennemsnitlig score = 16437

Strategier ved spil 21

Hyppighed af score h( 75)= 1 h( 80)= 7 h( 85)= 3 h( 90)= 5 h( 95)= 6 h(100)= 34 h(105)= 38 h(110)= 82 h(115)= 68 h(120)=161 h(125)=146 h(130)=320 h(135)=280 h(140)=534 h(145)=425 h(150)=752 h(155)=577 h(160)=878 h(165)=645 h(170)=956 h(175)=651 h(180)=863 h(185)=527 h(190)=609 h(195)=351 h(200)=389 h(205)=180 h(210)=203 h(215)= 93 h(220)= 86 h(225)= 47 h(230)= 32 h(235)= 21 h(240)= 13 h(245)= 8 h(250)= 3 h(255)= 0 h(260)= 4 h(265)= 1 h(270)= 1 h(275)= 0 h(280)= 0 Frekvens of score F( 80)=00008 F( 85)=00011 F( 90)=00016 F( 95)=00022 F(100)=00056 F(105)=00094 F(110)=00176 F(115)=00244 F(120)=00405 F(125)=00551 F(130)=00871 F(135)=01151 F(140)=01685 F(145)=02110 F(150)=02862 F(155)=03439 F(160)=04317 F(165)=04962 F(170)=05918 F(175)=06569 F(180)=07432 F(185)=07959 F(190)=08568 F(195)=08919 F(200)=09308 F(205)=09488 F(210)=09691 F(215)=09784 F(220)=09870 F(225)=09917 F(230)=09949 F(235)=09970 F(240)=09983 F(245)=09991 F(250)=09994 F(255)=09994 F(260)=09998 F(265)=09999 F(270)=10000 F(275)=10000

Som det fremgaringr af tabellen for P(X gt= j) er der kun 78 chance for at slaring 5 roslashde eller derover saring goslashr man det skal man altid vaeliglge det stoslashrste af de resterende tal For 3 eller 4 roslashde er situationen langt mere uigemmeskuelig og kun en beregning kan afgoslashre sagen Vi proslashver nu at finde den optimale strategi eller Snell-strategien Hvad angaringr sposlashrgsmaringlet om hvorvidt vi skal vaeliglge den stoslashrste eller naeligststoslashrste saring lader det sig faktisk goslashre at beregne Snell-strategien paring en computer De foslashlgende tilfaeliglde bliver derimod for komplicerede og der anvender vi en svagt forbedret version af vores intuitive strategi Forbedringen bestaringr i foslashlgende idet vi illustrerer det med et eksempel Lad os sige vi har slaringet 3 roslashde og vi overvejer om vi vil gange det med 7 eller 6 Ganger vi med 6 er det fordi vi forventer at slaring mindst 4 roslashde mindst en gang i de resterende kast Vores score vil vaeligre 73 og 74 henholdsvis og scoren vil blive forbedret med en faktor 43 hvis vi ganger med 6 under forventning af at slaring 4 roslashde Vores forbedring af strategien garingr da ud paring at vi vaeliglger det naeligststoslashrste 6 hvis sandsynligheden for at slaring 4 roslashde gange den relative forbedring 43 er stoslashrre end frac12 Vi rekapitulerer dernaeligst Snell-strategien G10 = X10 X10 Stokastisk variabel = antallet af roslashde i det 10 kast G9 = max X9 E(G10) E(G10) = E(X10) = np=10025 = 25 X9 = 01hellip10 Gk = max Xk E(Gk+1) E(Gk) kraeligver en laeligngere udregning men den udregnes som en

almindelig middelvaeligrdi altsaring som max af de to vaeligrdier gange P(X=Xk-1) G1 = max X1 E(G2) Som eksempel udregner vi E(G9) Da E(G10)=25 skal vi for X9 = 012 anvende E(G10)=25 i udregningen

Strategier ved spil 22

E(G9) = 25 (P(X=0)+P(X=1)+P(X=2))+ 3P(X=3)+hellip+10P(X=10) =306 Vaeligrdierne for E(Gk) er alle udregnet og vist i computerberegningen nedenfor Bemaeligrk isaeligr at de vokser fra 25 til 425 naringr k aftager fra 10 til 2 Strategien er nu foslashlgende Vaeliglg det stoslashrste af de resterende tal hvis Xk gt E(Gk+1) (altsaring det antal man har slaringet er er stoslashrre end det forventede stoslashrste antal) ellers vaeliglg det naeligststoslashrste Ved afgoslashrelsen om de 3 stoslashrste 4 stoslashrste osv anvender vi den hidtidige strategi med den modifikation at vi multiplicerer sandsynligheden med den formodede relative forbedring E(G10-kast)antal roslashde En computerberegning helt svarende til den foregaringende men med den aeligndrede strategi er vist nedenfor Man bemaeligrker for det foslashrste de smaring aeligndringer der er i strategien Den nye strategi er lidt mindre forsigtig men den giver altsaring ogsaring pote i form af en forbedring af gennemsnittet paring ca 275 Primaeligr sandsynligheder P(X=j) for n= 10 og p= 0250 j 0 1 2 3 4 5 6 7 8 9 10 P(X=j)0056 0188 0282 0250 0146 0058 0016 00031 00004 00000 00000 Baglaeligns Kumulerede sandsynligheder P(Xgt=j) j 0 1 2 3 4 5 6 7 8 9 10 P(Xgt=j) 1000 0944 0756 0474 0224 0078 00197 00035 00004 00000 00000 E(G[10])= 250 E(G[9])= 306 E(G[8])= 337 E(G[7])= 362 E(G[6])= 380 E(G[5])= 395 E(G[4])= 406 E(G[3])= 416 E(G[2])= 425 kast nr 1 2 3 4 5 6 7 8 9 10 score 0 1 1 1 1 1 1 1 1 1 1 1 2 2 1 1 1 1 1 1 1 1 2 5 4 4 3 3 3 2 2 1 1 3 8 7 6 5 5 4 3 2 2 1 4 9 8 7 7 6 5 4 3 2 1 5 10 9 8 7 6 5 4 3 2 1 6 10 9 8 7 6 5 4 3 2 1 7 10 9 8 7 6 5 4 3 2 1 8 10 9 8 7 6 5 4 3 2 1 9 10 9 8 7 6 5 4 3 2 1 10 10 9 8 7 6 5 4 3 2 1 Gennemsnitlig gevinst ms = 16727 Hyppigheder af score h( 75)= 1 h( 80)= 1 h( 85)= 0 h( 90)= 3 h( 95)= 2 h(100)= 5 h(105)= 4 h(110)= 9 h(115)= 12 h(120)= 12 h(125)= 17 h(130)= 22 h(135)= 28 h(140)= 39 h(145)= 24 h(150)= 49 h(155)= 54 h(160)= 74 h(165)= 63 h(170)=117 h(175)= 63 h(180)= 91 h(185)= 57 h(190)= 72 h(195)= 39 h(200)= 36 h(205)= 35 h(210)= 29 h(215)= 14 h(220)= 21 h(225)= 1 h(230)= 5 h(235)= 1 h(240)= 0 h(245)= 0 h(250)= 0 h(255)= 0 h(260)= 0 h(265)= 0 h(270)= 0 h(275)= 0 h(280)= 0

Strategier ved spil 23

Frekvens af score F( 80)=00020 F( 85)=00020 F( 90)=00050 F( 95)=00070 F(100)=00120 F(105)=00160 F(110)=00250 F(115)=00370 F(120)=00490 F(125)=00660 F(130)=00880 F(135)=01160 F(140)=01550 F(145)=01790 F(150)=02280 F(155)=02820 F(160)=03560 F(165)=04190 F(170)=05360 F(175)=05990 F(180)=06900 F(185)=07470 F(190)=08190 F(195)=08580 F(200)=08940 F(205)=09290 F(210)=09580 F(215)=09720 F(220)=09930 F(225)=09940 F(230)=09990 F(235)=10000 F(240)=10000 F(245)=10000 F(250)=10000 F(255)=10000 F(260)=10000 F(265)=10000 F(270)=10000 F(275)=10000

Maringske er det ikke en saeligrlig imponerende forbedring fra den foslashrste strategi men det er en teoretisk milepaeligl at man er i stand til at angive den bedste strategi for bestemte typer af spil Som omtalt har vi ikke forsoslashgt at bevise at Snell-Strategien er den optimale Strategi men det kan bevises Det er vigtigt at notere sig at i alle de omtalte spil har udfaldene vaeligre stokastiske variable dvs uforudsigelige men med bestemte sandsynligheder og at disse sandsynligheder ikke bliver aeligndret af den strategi man foslashlger I mange af de spil hvor man ofte moslashder begrebet strategi feks skak krig finansmarked og markedsfoslashring er dette langt fra tilfaeligldet Hvis feks alle boslashrsspekulanter fulgte den samme optimale strategi med boslashrskursen som stokastisk variabel ville det nok vise sig at det var den daringrligste strategi af alle Teorien for dynamiske strategier hvor de stokastiske variable er funktioner af tiden og af den valgte strategi er teoretisk naeligsten ufremkommelige

Strategier ved spil 24

Indeks Casino516 Computersimulation18 definitionen af sandsynlighed 1 Den optimale Snell-strategi11 forsikringsmatematik 5 Indbrudstyvens pensionsproblem912 kortsigtede strategi 10 kumulerede frekvens 19 langsigtede strategi 10 lotto 1 Mandagschancen14 Mandags-chancen9 Martingale-systemet16

Optimale Strategier 10 Poker 3 rekursionsligning 6 roulette 57 Roulette spil 10 roulettespiller 7 ruinsandsynligheder 5 Skaeligbnen913 Snell-strategien 11 Stopbetingelsen11 strategi9 Taeligndstikspillet1018

Page 20: Sandsynligheder og strategier ved spil - Ole Witt-Hansen ...olewitthansen.dk/Matematik/Sandsynligheder_og_strategier_ved_spil… · 6dqgv\qoljkhghu yhg vslo 3n vdpph pngh ndq yl ilqgh

Strategier ved spil 18

Sandsynligheden for at man taber 5 spil er (frac12)5 = 132 Man har da tabt 25 ndash 1 gange vaeligrdien af en jeton (i Danmark 50 kr) dvs 1550 kr Vil man sikre sig bedre feks ved at kunne doble op 9 gange (sandsynligheden for at tabe 10 spil er 11024) saring skal man komme med kr 51150- men det kan man ikke engang gennemfoslashre da hoslashjeste indsats i Danmark er 24000- Man kunne imidlertid stille det sposlashrgsmaringl Hvis man har n-jetoner hvad er saring sandsynligheden for at vinde q-jetoner hvis man spiller efter Martingale-systemet Dette kan man faktisk godt udregne direkte men regningerne er ret omfattende Derimod er resultatet simpelt Vi vil ikke lave en direkte udregning men anvende de samme metoder som vi har anvendt for den bedste strategi Vi tager udgangspunkt i det faktum at sort roslashd Casino spil er et lige spil saring middelvaeligrdien af gevinsten er 0 ligegyldigt hvordan man spiller Middelvaeligrdien (som er nul ) af en gevinst paring q-jetoner er lig med q gange sandsynligheden P(q) for at vinde q jetoner minus ens kapital (n jetoner) gange med sandsynligheden for at man taber det sidste spil som er 1 ndash P(q)

qP(q) ndash n(1 ndashP(q)) = 0 qn

nqP

)(

Har man feks n = 31 jetoner (1550- kr) er sandsynligheden for at vinde q=10 (500 kr) lig med 0756 En rimelig stor sandsynlighed men altsaring stadig 25 chance for ruin Oslashnsker man derimod at blive rigtig rig og vinde 10000- kr dvs q=200 er P(200) = 0134 Konklusionen er den at satser man paring at vinde mere end man medbringer saring er sandsynligheden mindre end frac12 men kan man noslashjes med mindre saring er sandsynligheden stoslashrre end frac12 Men bemaeligrk dette gaeliglder fra foslashrste gang man garingr ind paring et Casino til man beslutter at holde op

25 Taeligndstikspillet Som beskrevet ovenfor garingr spillet ud paring at farve den ene af siderne roslashd paring 10 taeligndstikker Naringr taeligndstikken kasten op i luften er sandsynligheden for at den roslashde side vender opad naringr den rammer bordet lig med p=025 Man kaster paring skift 10 saringdanne taeligndstikker 10 gange For hvert kast skal man multiplicere antallet af roslashde med et af tallene 110 Hver tal maring kun bruges eacuten gang Den der faringr den stoslashrste sum har vundet Det er klart at en god strategi i det lange loslashb vil give en hoslashjere sum Vi minder om at antallet af X roslashde taeligndstikker er binomialfordelt med primaeligrsandsynlighed p og antalsparameter n=10

102104

3

4

110)(

10

jj

jXPjj

Strategier ved spil 19

Endvidere vil vi anvende de kumulerede sandsynligheder P(X j) og P(X j) Nedenfor er vist resultatet af en Computersimulation af spillet Primaeligr sandsynligheder for n= 10 og p= 0250 P(X=j) j 0 1 2 3 4 5 6 7 8 9 10 00563 01877 02816 02503 01460 00584 00162 00031 00004 00000 00000 Baglaeligns kumulerede sandsynligheder P(Xgt=q) j 0 1 2 3 4 5 6 7 8 9 10 10000 09437 07560 04744 02241 00781 00197 00035 00004 00000 00000 1 kast Antal = 2 Vaeliglg mellem 1 2 3 4 5 6 7 8 910 Faktor= 4 2 kast Antal = 4 Vaeliglg mellem 1 2 3 5 6 7 8 910 Faktor=10 3 kast Antal = 2 Vaeliglg mellem 1 2 3 5 6 7 8 9 Faktor= 5 4 kast Antal = 2 Vaeliglg mellem 1 2 3 6 7 8 9 Faktor= 3 5 kast Antal = 3 Vaeliglg mellem 1 2 6 7 8 9 Faktor= 8 6 kast Antal = 2 Vaeliglg mellem 1 2 6 7 9 Faktor= 6 7 kast Antal = 6 Vaeliglg mellem 1 2 7 9 Faktor=9 8 kast Antal = 3 Vaeliglg mellem 1 2 7 Faktor= 2 9 kast Antal = 2 Vaeliglg mellem 1 7 Faktor= 7 10 kast Antal = 2 Vaeliglg mellem 1 Faktor= 1 Din score er 176 Valget af tallene 110 er i dette tilfaeliglde foretaget ud fra den optimale strategi som vi vil omtale om et oslashjeblik Foslashr vi analyserer den optimale strategi for dette spil vil vi forsoslashge os med en intuitiv bedste strategi Vi belyser denne strategi med et konkret eksempel Lad os feks antage at vi slaringr 4 roslashde i den 3 kast (3 forsoslashg) De tal vi har tilbage kalder vi (y8 y7 y6 y5 y4 y3 y2 y1) Sposlashrgsmaringlet om vi skal gange med det stoslashrste y8 eller det naeligststoslashrste y7 osv Vi raeligsonnerer da som foslashlger Hvis sandsynligheden for at slaring mere end 4 roslashde i de resterende 7 kast er stoslashrre end frac12 saring skal vi vaeliglge det naeligststoslashrste Vi skaeligrper dette Hvis sandsynligheden for at slaring mindst 5 roslashde mindst en gang i de resterende 7 kast er stoslashrre end frac12 saring skal vi vaeliglge det naeligststoslashrste Tilsvarende hvis sandsynligheden for at slaring mindst 5 roslashde mindst 2 gange i de resterende 7 kast skal vi vaeliglge det 3 stoslashrstehellipog saringdan fremdeles Strategien virker umiddelbart meget plausibel Sandsynlighederne kan direkte farings af binomialfordelingen Foslashrst sandsynligheden for at faring mindst q-roslashde i et kast Dette er

P(X q) =

n

qj

jXP )( hvor P(X = j) er angivet ovenfor

Strategier ved spil 20

Sandsynligheden for at dette sker mindst r gange i n - k kast er ogsaring en binomialfordeling og kan skrives

P(X q mindst r gange i n - k kast ) = jknjkn

rj

qXPqXPj

kn

))(1()(

Beregningen af disse (110) sandsynligheder goslashres nok lettest paring en computer For at lave en strategi-tabel goslashr man det at for hvert kast og hvert antal mulige roslashde vaeliglger man foslashrst det stoslashrste af de resterende tal Dernaeligst beregner man sandsynligheden for at faring mindst 1 roslashd mere i et af de foslashlgende kast Hvis denne sandsynlighed er stoslashrre end frac12 ser man paring det naeligststoslashrste af de resterende tal Man beregner saring sandsynligheden for at faring mindst 1 roslashd mere i mindst to af de resterende kast Hvis denne sandsynlighed er stoslashrre end frac12 saring vaeliglger man det tredjestoslashrste af de resterende tal og saringdan fremdeleshellip Det bemaeligrkes at beregningen skal initialiseres med at man altid vaeliglger det mindste hvis man slaringr 0 roslashde og altid vaeliglger det stoslashrste hvis man slaringr 10 roslashde Nedenfor er vist en computerberegning af en strategi-tabel Endvidere er ogsaring lavet en saringkaldt Monte-Carlo simulation Dette betyder at man har ladet maskinen spille feks 10000 spil spillet efter strategi-tabellen Nederst er vist hyppighederne for ens score og endelig fordelingsfunktionen for observationerne (Den kumulerede frekvens) P(X =j) for n =10 and p = 0250 j 0 1 2 3 4 5 6 7 8 9 10 P(X =j)0056 0188 0282 0250 0146 0058 00162 0003 00004 0000 0000 P(Xgt=j) for n =10 and p = 0250 j 0 1 2 3 4 5 6 7 8 9 10 P(Xgt=j) 1000 0944 0756 0474 0224 0078 00197 00035 00004 0000 0000 Strategi tabel Tallene refererer ikke til faktorene selv men til den stoslashrste naeligststoslashrste osv Eksempel Hvis man slaringr 3 roslashde i den andet kast saring skal man vaeliglge (7) den tredjestoslashrste Kast no 1 2 3 4 5 6 7 8 9 10 score 0 1 1 1 1 1 1 1 1 1 1 1 3 3 3 2 2 2 2 1 1 1 2 6 5 5 4 4 3 3 2 2 1 3 8 7 7 6 5 4 3 3 2 1 4 9 9 8 7 6 5 4 3 2 1 5 10 9 8 7 6 5 4 3 2 1 6 10 9 8 7 6 5 4 3 2 1 7 10 9 8 7 6 5 4 3 2 1 8 10 9 8 7 6 5 4 3 2 1 9 10 9 8 7 6 5 4 3 2 1 10 10 9 8 7 6 5 4 3 2 1 Gennemsnitlig score = 16437

Strategier ved spil 21

Hyppighed af score h( 75)= 1 h( 80)= 7 h( 85)= 3 h( 90)= 5 h( 95)= 6 h(100)= 34 h(105)= 38 h(110)= 82 h(115)= 68 h(120)=161 h(125)=146 h(130)=320 h(135)=280 h(140)=534 h(145)=425 h(150)=752 h(155)=577 h(160)=878 h(165)=645 h(170)=956 h(175)=651 h(180)=863 h(185)=527 h(190)=609 h(195)=351 h(200)=389 h(205)=180 h(210)=203 h(215)= 93 h(220)= 86 h(225)= 47 h(230)= 32 h(235)= 21 h(240)= 13 h(245)= 8 h(250)= 3 h(255)= 0 h(260)= 4 h(265)= 1 h(270)= 1 h(275)= 0 h(280)= 0 Frekvens of score F( 80)=00008 F( 85)=00011 F( 90)=00016 F( 95)=00022 F(100)=00056 F(105)=00094 F(110)=00176 F(115)=00244 F(120)=00405 F(125)=00551 F(130)=00871 F(135)=01151 F(140)=01685 F(145)=02110 F(150)=02862 F(155)=03439 F(160)=04317 F(165)=04962 F(170)=05918 F(175)=06569 F(180)=07432 F(185)=07959 F(190)=08568 F(195)=08919 F(200)=09308 F(205)=09488 F(210)=09691 F(215)=09784 F(220)=09870 F(225)=09917 F(230)=09949 F(235)=09970 F(240)=09983 F(245)=09991 F(250)=09994 F(255)=09994 F(260)=09998 F(265)=09999 F(270)=10000 F(275)=10000

Som det fremgaringr af tabellen for P(X gt= j) er der kun 78 chance for at slaring 5 roslashde eller derover saring goslashr man det skal man altid vaeliglge det stoslashrste af de resterende tal For 3 eller 4 roslashde er situationen langt mere uigemmeskuelig og kun en beregning kan afgoslashre sagen Vi proslashver nu at finde den optimale strategi eller Snell-strategien Hvad angaringr sposlashrgsmaringlet om hvorvidt vi skal vaeliglge den stoslashrste eller naeligststoslashrste saring lader det sig faktisk goslashre at beregne Snell-strategien paring en computer De foslashlgende tilfaeliglde bliver derimod for komplicerede og der anvender vi en svagt forbedret version af vores intuitive strategi Forbedringen bestaringr i foslashlgende idet vi illustrerer det med et eksempel Lad os sige vi har slaringet 3 roslashde og vi overvejer om vi vil gange det med 7 eller 6 Ganger vi med 6 er det fordi vi forventer at slaring mindst 4 roslashde mindst en gang i de resterende kast Vores score vil vaeligre 73 og 74 henholdsvis og scoren vil blive forbedret med en faktor 43 hvis vi ganger med 6 under forventning af at slaring 4 roslashde Vores forbedring af strategien garingr da ud paring at vi vaeliglger det naeligststoslashrste 6 hvis sandsynligheden for at slaring 4 roslashde gange den relative forbedring 43 er stoslashrre end frac12 Vi rekapitulerer dernaeligst Snell-strategien G10 = X10 X10 Stokastisk variabel = antallet af roslashde i det 10 kast G9 = max X9 E(G10) E(G10) = E(X10) = np=10025 = 25 X9 = 01hellip10 Gk = max Xk E(Gk+1) E(Gk) kraeligver en laeligngere udregning men den udregnes som en

almindelig middelvaeligrdi altsaring som max af de to vaeligrdier gange P(X=Xk-1) G1 = max X1 E(G2) Som eksempel udregner vi E(G9) Da E(G10)=25 skal vi for X9 = 012 anvende E(G10)=25 i udregningen

Strategier ved spil 22

E(G9) = 25 (P(X=0)+P(X=1)+P(X=2))+ 3P(X=3)+hellip+10P(X=10) =306 Vaeligrdierne for E(Gk) er alle udregnet og vist i computerberegningen nedenfor Bemaeligrk isaeligr at de vokser fra 25 til 425 naringr k aftager fra 10 til 2 Strategien er nu foslashlgende Vaeliglg det stoslashrste af de resterende tal hvis Xk gt E(Gk+1) (altsaring det antal man har slaringet er er stoslashrre end det forventede stoslashrste antal) ellers vaeliglg det naeligststoslashrste Ved afgoslashrelsen om de 3 stoslashrste 4 stoslashrste osv anvender vi den hidtidige strategi med den modifikation at vi multiplicerer sandsynligheden med den formodede relative forbedring E(G10-kast)antal roslashde En computerberegning helt svarende til den foregaringende men med den aeligndrede strategi er vist nedenfor Man bemaeligrker for det foslashrste de smaring aeligndringer der er i strategien Den nye strategi er lidt mindre forsigtig men den giver altsaring ogsaring pote i form af en forbedring af gennemsnittet paring ca 275 Primaeligr sandsynligheder P(X=j) for n= 10 og p= 0250 j 0 1 2 3 4 5 6 7 8 9 10 P(X=j)0056 0188 0282 0250 0146 0058 0016 00031 00004 00000 00000 Baglaeligns Kumulerede sandsynligheder P(Xgt=j) j 0 1 2 3 4 5 6 7 8 9 10 P(Xgt=j) 1000 0944 0756 0474 0224 0078 00197 00035 00004 00000 00000 E(G[10])= 250 E(G[9])= 306 E(G[8])= 337 E(G[7])= 362 E(G[6])= 380 E(G[5])= 395 E(G[4])= 406 E(G[3])= 416 E(G[2])= 425 kast nr 1 2 3 4 5 6 7 8 9 10 score 0 1 1 1 1 1 1 1 1 1 1 1 2 2 1 1 1 1 1 1 1 1 2 5 4 4 3 3 3 2 2 1 1 3 8 7 6 5 5 4 3 2 2 1 4 9 8 7 7 6 5 4 3 2 1 5 10 9 8 7 6 5 4 3 2 1 6 10 9 8 7 6 5 4 3 2 1 7 10 9 8 7 6 5 4 3 2 1 8 10 9 8 7 6 5 4 3 2 1 9 10 9 8 7 6 5 4 3 2 1 10 10 9 8 7 6 5 4 3 2 1 Gennemsnitlig gevinst ms = 16727 Hyppigheder af score h( 75)= 1 h( 80)= 1 h( 85)= 0 h( 90)= 3 h( 95)= 2 h(100)= 5 h(105)= 4 h(110)= 9 h(115)= 12 h(120)= 12 h(125)= 17 h(130)= 22 h(135)= 28 h(140)= 39 h(145)= 24 h(150)= 49 h(155)= 54 h(160)= 74 h(165)= 63 h(170)=117 h(175)= 63 h(180)= 91 h(185)= 57 h(190)= 72 h(195)= 39 h(200)= 36 h(205)= 35 h(210)= 29 h(215)= 14 h(220)= 21 h(225)= 1 h(230)= 5 h(235)= 1 h(240)= 0 h(245)= 0 h(250)= 0 h(255)= 0 h(260)= 0 h(265)= 0 h(270)= 0 h(275)= 0 h(280)= 0

Strategier ved spil 23

Frekvens af score F( 80)=00020 F( 85)=00020 F( 90)=00050 F( 95)=00070 F(100)=00120 F(105)=00160 F(110)=00250 F(115)=00370 F(120)=00490 F(125)=00660 F(130)=00880 F(135)=01160 F(140)=01550 F(145)=01790 F(150)=02280 F(155)=02820 F(160)=03560 F(165)=04190 F(170)=05360 F(175)=05990 F(180)=06900 F(185)=07470 F(190)=08190 F(195)=08580 F(200)=08940 F(205)=09290 F(210)=09580 F(215)=09720 F(220)=09930 F(225)=09940 F(230)=09990 F(235)=10000 F(240)=10000 F(245)=10000 F(250)=10000 F(255)=10000 F(260)=10000 F(265)=10000 F(270)=10000 F(275)=10000

Maringske er det ikke en saeligrlig imponerende forbedring fra den foslashrste strategi men det er en teoretisk milepaeligl at man er i stand til at angive den bedste strategi for bestemte typer af spil Som omtalt har vi ikke forsoslashgt at bevise at Snell-Strategien er den optimale Strategi men det kan bevises Det er vigtigt at notere sig at i alle de omtalte spil har udfaldene vaeligre stokastiske variable dvs uforudsigelige men med bestemte sandsynligheder og at disse sandsynligheder ikke bliver aeligndret af den strategi man foslashlger I mange af de spil hvor man ofte moslashder begrebet strategi feks skak krig finansmarked og markedsfoslashring er dette langt fra tilfaeligldet Hvis feks alle boslashrsspekulanter fulgte den samme optimale strategi med boslashrskursen som stokastisk variabel ville det nok vise sig at det var den daringrligste strategi af alle Teorien for dynamiske strategier hvor de stokastiske variable er funktioner af tiden og af den valgte strategi er teoretisk naeligsten ufremkommelige

Strategier ved spil 24

Indeks Casino516 Computersimulation18 definitionen af sandsynlighed 1 Den optimale Snell-strategi11 forsikringsmatematik 5 Indbrudstyvens pensionsproblem912 kortsigtede strategi 10 kumulerede frekvens 19 langsigtede strategi 10 lotto 1 Mandagschancen14 Mandags-chancen9 Martingale-systemet16

Optimale Strategier 10 Poker 3 rekursionsligning 6 roulette 57 Roulette spil 10 roulettespiller 7 ruinsandsynligheder 5 Skaeligbnen913 Snell-strategien 11 Stopbetingelsen11 strategi9 Taeligndstikspillet1018

Page 21: Sandsynligheder og strategier ved spil - Ole Witt-Hansen ...olewitthansen.dk/Matematik/Sandsynligheder_og_strategier_ved_spil… · 6dqgv\qoljkhghu yhg vslo 3n vdpph pngh ndq yl ilqgh

Strategier ved spil 19

Endvidere vil vi anvende de kumulerede sandsynligheder P(X j) og P(X j) Nedenfor er vist resultatet af en Computersimulation af spillet Primaeligr sandsynligheder for n= 10 og p= 0250 P(X=j) j 0 1 2 3 4 5 6 7 8 9 10 00563 01877 02816 02503 01460 00584 00162 00031 00004 00000 00000 Baglaeligns kumulerede sandsynligheder P(Xgt=q) j 0 1 2 3 4 5 6 7 8 9 10 10000 09437 07560 04744 02241 00781 00197 00035 00004 00000 00000 1 kast Antal = 2 Vaeliglg mellem 1 2 3 4 5 6 7 8 910 Faktor= 4 2 kast Antal = 4 Vaeliglg mellem 1 2 3 5 6 7 8 910 Faktor=10 3 kast Antal = 2 Vaeliglg mellem 1 2 3 5 6 7 8 9 Faktor= 5 4 kast Antal = 2 Vaeliglg mellem 1 2 3 6 7 8 9 Faktor= 3 5 kast Antal = 3 Vaeliglg mellem 1 2 6 7 8 9 Faktor= 8 6 kast Antal = 2 Vaeliglg mellem 1 2 6 7 9 Faktor= 6 7 kast Antal = 6 Vaeliglg mellem 1 2 7 9 Faktor=9 8 kast Antal = 3 Vaeliglg mellem 1 2 7 Faktor= 2 9 kast Antal = 2 Vaeliglg mellem 1 7 Faktor= 7 10 kast Antal = 2 Vaeliglg mellem 1 Faktor= 1 Din score er 176 Valget af tallene 110 er i dette tilfaeliglde foretaget ud fra den optimale strategi som vi vil omtale om et oslashjeblik Foslashr vi analyserer den optimale strategi for dette spil vil vi forsoslashge os med en intuitiv bedste strategi Vi belyser denne strategi med et konkret eksempel Lad os feks antage at vi slaringr 4 roslashde i den 3 kast (3 forsoslashg) De tal vi har tilbage kalder vi (y8 y7 y6 y5 y4 y3 y2 y1) Sposlashrgsmaringlet om vi skal gange med det stoslashrste y8 eller det naeligststoslashrste y7 osv Vi raeligsonnerer da som foslashlger Hvis sandsynligheden for at slaring mere end 4 roslashde i de resterende 7 kast er stoslashrre end frac12 saring skal vi vaeliglge det naeligststoslashrste Vi skaeligrper dette Hvis sandsynligheden for at slaring mindst 5 roslashde mindst en gang i de resterende 7 kast er stoslashrre end frac12 saring skal vi vaeliglge det naeligststoslashrste Tilsvarende hvis sandsynligheden for at slaring mindst 5 roslashde mindst 2 gange i de resterende 7 kast skal vi vaeliglge det 3 stoslashrstehellipog saringdan fremdeles Strategien virker umiddelbart meget plausibel Sandsynlighederne kan direkte farings af binomialfordelingen Foslashrst sandsynligheden for at faring mindst q-roslashde i et kast Dette er

P(X q) =

n

qj

jXP )( hvor P(X = j) er angivet ovenfor

Strategier ved spil 20

Sandsynligheden for at dette sker mindst r gange i n - k kast er ogsaring en binomialfordeling og kan skrives

P(X q mindst r gange i n - k kast ) = jknjkn

rj

qXPqXPj

kn

))(1()(

Beregningen af disse (110) sandsynligheder goslashres nok lettest paring en computer For at lave en strategi-tabel goslashr man det at for hvert kast og hvert antal mulige roslashde vaeliglger man foslashrst det stoslashrste af de resterende tal Dernaeligst beregner man sandsynligheden for at faring mindst 1 roslashd mere i et af de foslashlgende kast Hvis denne sandsynlighed er stoslashrre end frac12 ser man paring det naeligststoslashrste af de resterende tal Man beregner saring sandsynligheden for at faring mindst 1 roslashd mere i mindst to af de resterende kast Hvis denne sandsynlighed er stoslashrre end frac12 saring vaeliglger man det tredjestoslashrste af de resterende tal og saringdan fremdeleshellip Det bemaeligrkes at beregningen skal initialiseres med at man altid vaeliglger det mindste hvis man slaringr 0 roslashde og altid vaeliglger det stoslashrste hvis man slaringr 10 roslashde Nedenfor er vist en computerberegning af en strategi-tabel Endvidere er ogsaring lavet en saringkaldt Monte-Carlo simulation Dette betyder at man har ladet maskinen spille feks 10000 spil spillet efter strategi-tabellen Nederst er vist hyppighederne for ens score og endelig fordelingsfunktionen for observationerne (Den kumulerede frekvens) P(X =j) for n =10 and p = 0250 j 0 1 2 3 4 5 6 7 8 9 10 P(X =j)0056 0188 0282 0250 0146 0058 00162 0003 00004 0000 0000 P(Xgt=j) for n =10 and p = 0250 j 0 1 2 3 4 5 6 7 8 9 10 P(Xgt=j) 1000 0944 0756 0474 0224 0078 00197 00035 00004 0000 0000 Strategi tabel Tallene refererer ikke til faktorene selv men til den stoslashrste naeligststoslashrste osv Eksempel Hvis man slaringr 3 roslashde i den andet kast saring skal man vaeliglge (7) den tredjestoslashrste Kast no 1 2 3 4 5 6 7 8 9 10 score 0 1 1 1 1 1 1 1 1 1 1 1 3 3 3 2 2 2 2 1 1 1 2 6 5 5 4 4 3 3 2 2 1 3 8 7 7 6 5 4 3 3 2 1 4 9 9 8 7 6 5 4 3 2 1 5 10 9 8 7 6 5 4 3 2 1 6 10 9 8 7 6 5 4 3 2 1 7 10 9 8 7 6 5 4 3 2 1 8 10 9 8 7 6 5 4 3 2 1 9 10 9 8 7 6 5 4 3 2 1 10 10 9 8 7 6 5 4 3 2 1 Gennemsnitlig score = 16437

Strategier ved spil 21

Hyppighed af score h( 75)= 1 h( 80)= 7 h( 85)= 3 h( 90)= 5 h( 95)= 6 h(100)= 34 h(105)= 38 h(110)= 82 h(115)= 68 h(120)=161 h(125)=146 h(130)=320 h(135)=280 h(140)=534 h(145)=425 h(150)=752 h(155)=577 h(160)=878 h(165)=645 h(170)=956 h(175)=651 h(180)=863 h(185)=527 h(190)=609 h(195)=351 h(200)=389 h(205)=180 h(210)=203 h(215)= 93 h(220)= 86 h(225)= 47 h(230)= 32 h(235)= 21 h(240)= 13 h(245)= 8 h(250)= 3 h(255)= 0 h(260)= 4 h(265)= 1 h(270)= 1 h(275)= 0 h(280)= 0 Frekvens of score F( 80)=00008 F( 85)=00011 F( 90)=00016 F( 95)=00022 F(100)=00056 F(105)=00094 F(110)=00176 F(115)=00244 F(120)=00405 F(125)=00551 F(130)=00871 F(135)=01151 F(140)=01685 F(145)=02110 F(150)=02862 F(155)=03439 F(160)=04317 F(165)=04962 F(170)=05918 F(175)=06569 F(180)=07432 F(185)=07959 F(190)=08568 F(195)=08919 F(200)=09308 F(205)=09488 F(210)=09691 F(215)=09784 F(220)=09870 F(225)=09917 F(230)=09949 F(235)=09970 F(240)=09983 F(245)=09991 F(250)=09994 F(255)=09994 F(260)=09998 F(265)=09999 F(270)=10000 F(275)=10000

Som det fremgaringr af tabellen for P(X gt= j) er der kun 78 chance for at slaring 5 roslashde eller derover saring goslashr man det skal man altid vaeliglge det stoslashrste af de resterende tal For 3 eller 4 roslashde er situationen langt mere uigemmeskuelig og kun en beregning kan afgoslashre sagen Vi proslashver nu at finde den optimale strategi eller Snell-strategien Hvad angaringr sposlashrgsmaringlet om hvorvidt vi skal vaeliglge den stoslashrste eller naeligststoslashrste saring lader det sig faktisk goslashre at beregne Snell-strategien paring en computer De foslashlgende tilfaeliglde bliver derimod for komplicerede og der anvender vi en svagt forbedret version af vores intuitive strategi Forbedringen bestaringr i foslashlgende idet vi illustrerer det med et eksempel Lad os sige vi har slaringet 3 roslashde og vi overvejer om vi vil gange det med 7 eller 6 Ganger vi med 6 er det fordi vi forventer at slaring mindst 4 roslashde mindst en gang i de resterende kast Vores score vil vaeligre 73 og 74 henholdsvis og scoren vil blive forbedret med en faktor 43 hvis vi ganger med 6 under forventning af at slaring 4 roslashde Vores forbedring af strategien garingr da ud paring at vi vaeliglger det naeligststoslashrste 6 hvis sandsynligheden for at slaring 4 roslashde gange den relative forbedring 43 er stoslashrre end frac12 Vi rekapitulerer dernaeligst Snell-strategien G10 = X10 X10 Stokastisk variabel = antallet af roslashde i det 10 kast G9 = max X9 E(G10) E(G10) = E(X10) = np=10025 = 25 X9 = 01hellip10 Gk = max Xk E(Gk+1) E(Gk) kraeligver en laeligngere udregning men den udregnes som en

almindelig middelvaeligrdi altsaring som max af de to vaeligrdier gange P(X=Xk-1) G1 = max X1 E(G2) Som eksempel udregner vi E(G9) Da E(G10)=25 skal vi for X9 = 012 anvende E(G10)=25 i udregningen

Strategier ved spil 22

E(G9) = 25 (P(X=0)+P(X=1)+P(X=2))+ 3P(X=3)+hellip+10P(X=10) =306 Vaeligrdierne for E(Gk) er alle udregnet og vist i computerberegningen nedenfor Bemaeligrk isaeligr at de vokser fra 25 til 425 naringr k aftager fra 10 til 2 Strategien er nu foslashlgende Vaeliglg det stoslashrste af de resterende tal hvis Xk gt E(Gk+1) (altsaring det antal man har slaringet er er stoslashrre end det forventede stoslashrste antal) ellers vaeliglg det naeligststoslashrste Ved afgoslashrelsen om de 3 stoslashrste 4 stoslashrste osv anvender vi den hidtidige strategi med den modifikation at vi multiplicerer sandsynligheden med den formodede relative forbedring E(G10-kast)antal roslashde En computerberegning helt svarende til den foregaringende men med den aeligndrede strategi er vist nedenfor Man bemaeligrker for det foslashrste de smaring aeligndringer der er i strategien Den nye strategi er lidt mindre forsigtig men den giver altsaring ogsaring pote i form af en forbedring af gennemsnittet paring ca 275 Primaeligr sandsynligheder P(X=j) for n= 10 og p= 0250 j 0 1 2 3 4 5 6 7 8 9 10 P(X=j)0056 0188 0282 0250 0146 0058 0016 00031 00004 00000 00000 Baglaeligns Kumulerede sandsynligheder P(Xgt=j) j 0 1 2 3 4 5 6 7 8 9 10 P(Xgt=j) 1000 0944 0756 0474 0224 0078 00197 00035 00004 00000 00000 E(G[10])= 250 E(G[9])= 306 E(G[8])= 337 E(G[7])= 362 E(G[6])= 380 E(G[5])= 395 E(G[4])= 406 E(G[3])= 416 E(G[2])= 425 kast nr 1 2 3 4 5 6 7 8 9 10 score 0 1 1 1 1 1 1 1 1 1 1 1 2 2 1 1 1 1 1 1 1 1 2 5 4 4 3 3 3 2 2 1 1 3 8 7 6 5 5 4 3 2 2 1 4 9 8 7 7 6 5 4 3 2 1 5 10 9 8 7 6 5 4 3 2 1 6 10 9 8 7 6 5 4 3 2 1 7 10 9 8 7 6 5 4 3 2 1 8 10 9 8 7 6 5 4 3 2 1 9 10 9 8 7 6 5 4 3 2 1 10 10 9 8 7 6 5 4 3 2 1 Gennemsnitlig gevinst ms = 16727 Hyppigheder af score h( 75)= 1 h( 80)= 1 h( 85)= 0 h( 90)= 3 h( 95)= 2 h(100)= 5 h(105)= 4 h(110)= 9 h(115)= 12 h(120)= 12 h(125)= 17 h(130)= 22 h(135)= 28 h(140)= 39 h(145)= 24 h(150)= 49 h(155)= 54 h(160)= 74 h(165)= 63 h(170)=117 h(175)= 63 h(180)= 91 h(185)= 57 h(190)= 72 h(195)= 39 h(200)= 36 h(205)= 35 h(210)= 29 h(215)= 14 h(220)= 21 h(225)= 1 h(230)= 5 h(235)= 1 h(240)= 0 h(245)= 0 h(250)= 0 h(255)= 0 h(260)= 0 h(265)= 0 h(270)= 0 h(275)= 0 h(280)= 0

Strategier ved spil 23

Frekvens af score F( 80)=00020 F( 85)=00020 F( 90)=00050 F( 95)=00070 F(100)=00120 F(105)=00160 F(110)=00250 F(115)=00370 F(120)=00490 F(125)=00660 F(130)=00880 F(135)=01160 F(140)=01550 F(145)=01790 F(150)=02280 F(155)=02820 F(160)=03560 F(165)=04190 F(170)=05360 F(175)=05990 F(180)=06900 F(185)=07470 F(190)=08190 F(195)=08580 F(200)=08940 F(205)=09290 F(210)=09580 F(215)=09720 F(220)=09930 F(225)=09940 F(230)=09990 F(235)=10000 F(240)=10000 F(245)=10000 F(250)=10000 F(255)=10000 F(260)=10000 F(265)=10000 F(270)=10000 F(275)=10000

Maringske er det ikke en saeligrlig imponerende forbedring fra den foslashrste strategi men det er en teoretisk milepaeligl at man er i stand til at angive den bedste strategi for bestemte typer af spil Som omtalt har vi ikke forsoslashgt at bevise at Snell-Strategien er den optimale Strategi men det kan bevises Det er vigtigt at notere sig at i alle de omtalte spil har udfaldene vaeligre stokastiske variable dvs uforudsigelige men med bestemte sandsynligheder og at disse sandsynligheder ikke bliver aeligndret af den strategi man foslashlger I mange af de spil hvor man ofte moslashder begrebet strategi feks skak krig finansmarked og markedsfoslashring er dette langt fra tilfaeligldet Hvis feks alle boslashrsspekulanter fulgte den samme optimale strategi med boslashrskursen som stokastisk variabel ville det nok vise sig at det var den daringrligste strategi af alle Teorien for dynamiske strategier hvor de stokastiske variable er funktioner af tiden og af den valgte strategi er teoretisk naeligsten ufremkommelige

Strategier ved spil 24

Indeks Casino516 Computersimulation18 definitionen af sandsynlighed 1 Den optimale Snell-strategi11 forsikringsmatematik 5 Indbrudstyvens pensionsproblem912 kortsigtede strategi 10 kumulerede frekvens 19 langsigtede strategi 10 lotto 1 Mandagschancen14 Mandags-chancen9 Martingale-systemet16

Optimale Strategier 10 Poker 3 rekursionsligning 6 roulette 57 Roulette spil 10 roulettespiller 7 ruinsandsynligheder 5 Skaeligbnen913 Snell-strategien 11 Stopbetingelsen11 strategi9 Taeligndstikspillet1018

Page 22: Sandsynligheder og strategier ved spil - Ole Witt-Hansen ...olewitthansen.dk/Matematik/Sandsynligheder_og_strategier_ved_spil… · 6dqgv\qoljkhghu yhg vslo 3n vdpph pngh ndq yl ilqgh

Strategier ved spil 20

Sandsynligheden for at dette sker mindst r gange i n - k kast er ogsaring en binomialfordeling og kan skrives

P(X q mindst r gange i n - k kast ) = jknjkn

rj

qXPqXPj

kn

))(1()(

Beregningen af disse (110) sandsynligheder goslashres nok lettest paring en computer For at lave en strategi-tabel goslashr man det at for hvert kast og hvert antal mulige roslashde vaeliglger man foslashrst det stoslashrste af de resterende tal Dernaeligst beregner man sandsynligheden for at faring mindst 1 roslashd mere i et af de foslashlgende kast Hvis denne sandsynlighed er stoslashrre end frac12 ser man paring det naeligststoslashrste af de resterende tal Man beregner saring sandsynligheden for at faring mindst 1 roslashd mere i mindst to af de resterende kast Hvis denne sandsynlighed er stoslashrre end frac12 saring vaeliglger man det tredjestoslashrste af de resterende tal og saringdan fremdeleshellip Det bemaeligrkes at beregningen skal initialiseres med at man altid vaeliglger det mindste hvis man slaringr 0 roslashde og altid vaeliglger det stoslashrste hvis man slaringr 10 roslashde Nedenfor er vist en computerberegning af en strategi-tabel Endvidere er ogsaring lavet en saringkaldt Monte-Carlo simulation Dette betyder at man har ladet maskinen spille feks 10000 spil spillet efter strategi-tabellen Nederst er vist hyppighederne for ens score og endelig fordelingsfunktionen for observationerne (Den kumulerede frekvens) P(X =j) for n =10 and p = 0250 j 0 1 2 3 4 5 6 7 8 9 10 P(X =j)0056 0188 0282 0250 0146 0058 00162 0003 00004 0000 0000 P(Xgt=j) for n =10 and p = 0250 j 0 1 2 3 4 5 6 7 8 9 10 P(Xgt=j) 1000 0944 0756 0474 0224 0078 00197 00035 00004 0000 0000 Strategi tabel Tallene refererer ikke til faktorene selv men til den stoslashrste naeligststoslashrste osv Eksempel Hvis man slaringr 3 roslashde i den andet kast saring skal man vaeliglge (7) den tredjestoslashrste Kast no 1 2 3 4 5 6 7 8 9 10 score 0 1 1 1 1 1 1 1 1 1 1 1 3 3 3 2 2 2 2 1 1 1 2 6 5 5 4 4 3 3 2 2 1 3 8 7 7 6 5 4 3 3 2 1 4 9 9 8 7 6 5 4 3 2 1 5 10 9 8 7 6 5 4 3 2 1 6 10 9 8 7 6 5 4 3 2 1 7 10 9 8 7 6 5 4 3 2 1 8 10 9 8 7 6 5 4 3 2 1 9 10 9 8 7 6 5 4 3 2 1 10 10 9 8 7 6 5 4 3 2 1 Gennemsnitlig score = 16437

Strategier ved spil 21

Hyppighed af score h( 75)= 1 h( 80)= 7 h( 85)= 3 h( 90)= 5 h( 95)= 6 h(100)= 34 h(105)= 38 h(110)= 82 h(115)= 68 h(120)=161 h(125)=146 h(130)=320 h(135)=280 h(140)=534 h(145)=425 h(150)=752 h(155)=577 h(160)=878 h(165)=645 h(170)=956 h(175)=651 h(180)=863 h(185)=527 h(190)=609 h(195)=351 h(200)=389 h(205)=180 h(210)=203 h(215)= 93 h(220)= 86 h(225)= 47 h(230)= 32 h(235)= 21 h(240)= 13 h(245)= 8 h(250)= 3 h(255)= 0 h(260)= 4 h(265)= 1 h(270)= 1 h(275)= 0 h(280)= 0 Frekvens of score F( 80)=00008 F( 85)=00011 F( 90)=00016 F( 95)=00022 F(100)=00056 F(105)=00094 F(110)=00176 F(115)=00244 F(120)=00405 F(125)=00551 F(130)=00871 F(135)=01151 F(140)=01685 F(145)=02110 F(150)=02862 F(155)=03439 F(160)=04317 F(165)=04962 F(170)=05918 F(175)=06569 F(180)=07432 F(185)=07959 F(190)=08568 F(195)=08919 F(200)=09308 F(205)=09488 F(210)=09691 F(215)=09784 F(220)=09870 F(225)=09917 F(230)=09949 F(235)=09970 F(240)=09983 F(245)=09991 F(250)=09994 F(255)=09994 F(260)=09998 F(265)=09999 F(270)=10000 F(275)=10000

Som det fremgaringr af tabellen for P(X gt= j) er der kun 78 chance for at slaring 5 roslashde eller derover saring goslashr man det skal man altid vaeliglge det stoslashrste af de resterende tal For 3 eller 4 roslashde er situationen langt mere uigemmeskuelig og kun en beregning kan afgoslashre sagen Vi proslashver nu at finde den optimale strategi eller Snell-strategien Hvad angaringr sposlashrgsmaringlet om hvorvidt vi skal vaeliglge den stoslashrste eller naeligststoslashrste saring lader det sig faktisk goslashre at beregne Snell-strategien paring en computer De foslashlgende tilfaeliglde bliver derimod for komplicerede og der anvender vi en svagt forbedret version af vores intuitive strategi Forbedringen bestaringr i foslashlgende idet vi illustrerer det med et eksempel Lad os sige vi har slaringet 3 roslashde og vi overvejer om vi vil gange det med 7 eller 6 Ganger vi med 6 er det fordi vi forventer at slaring mindst 4 roslashde mindst en gang i de resterende kast Vores score vil vaeligre 73 og 74 henholdsvis og scoren vil blive forbedret med en faktor 43 hvis vi ganger med 6 under forventning af at slaring 4 roslashde Vores forbedring af strategien garingr da ud paring at vi vaeliglger det naeligststoslashrste 6 hvis sandsynligheden for at slaring 4 roslashde gange den relative forbedring 43 er stoslashrre end frac12 Vi rekapitulerer dernaeligst Snell-strategien G10 = X10 X10 Stokastisk variabel = antallet af roslashde i det 10 kast G9 = max X9 E(G10) E(G10) = E(X10) = np=10025 = 25 X9 = 01hellip10 Gk = max Xk E(Gk+1) E(Gk) kraeligver en laeligngere udregning men den udregnes som en

almindelig middelvaeligrdi altsaring som max af de to vaeligrdier gange P(X=Xk-1) G1 = max X1 E(G2) Som eksempel udregner vi E(G9) Da E(G10)=25 skal vi for X9 = 012 anvende E(G10)=25 i udregningen

Strategier ved spil 22

E(G9) = 25 (P(X=0)+P(X=1)+P(X=2))+ 3P(X=3)+hellip+10P(X=10) =306 Vaeligrdierne for E(Gk) er alle udregnet og vist i computerberegningen nedenfor Bemaeligrk isaeligr at de vokser fra 25 til 425 naringr k aftager fra 10 til 2 Strategien er nu foslashlgende Vaeliglg det stoslashrste af de resterende tal hvis Xk gt E(Gk+1) (altsaring det antal man har slaringet er er stoslashrre end det forventede stoslashrste antal) ellers vaeliglg det naeligststoslashrste Ved afgoslashrelsen om de 3 stoslashrste 4 stoslashrste osv anvender vi den hidtidige strategi med den modifikation at vi multiplicerer sandsynligheden med den formodede relative forbedring E(G10-kast)antal roslashde En computerberegning helt svarende til den foregaringende men med den aeligndrede strategi er vist nedenfor Man bemaeligrker for det foslashrste de smaring aeligndringer der er i strategien Den nye strategi er lidt mindre forsigtig men den giver altsaring ogsaring pote i form af en forbedring af gennemsnittet paring ca 275 Primaeligr sandsynligheder P(X=j) for n= 10 og p= 0250 j 0 1 2 3 4 5 6 7 8 9 10 P(X=j)0056 0188 0282 0250 0146 0058 0016 00031 00004 00000 00000 Baglaeligns Kumulerede sandsynligheder P(Xgt=j) j 0 1 2 3 4 5 6 7 8 9 10 P(Xgt=j) 1000 0944 0756 0474 0224 0078 00197 00035 00004 00000 00000 E(G[10])= 250 E(G[9])= 306 E(G[8])= 337 E(G[7])= 362 E(G[6])= 380 E(G[5])= 395 E(G[4])= 406 E(G[3])= 416 E(G[2])= 425 kast nr 1 2 3 4 5 6 7 8 9 10 score 0 1 1 1 1 1 1 1 1 1 1 1 2 2 1 1 1 1 1 1 1 1 2 5 4 4 3 3 3 2 2 1 1 3 8 7 6 5 5 4 3 2 2 1 4 9 8 7 7 6 5 4 3 2 1 5 10 9 8 7 6 5 4 3 2 1 6 10 9 8 7 6 5 4 3 2 1 7 10 9 8 7 6 5 4 3 2 1 8 10 9 8 7 6 5 4 3 2 1 9 10 9 8 7 6 5 4 3 2 1 10 10 9 8 7 6 5 4 3 2 1 Gennemsnitlig gevinst ms = 16727 Hyppigheder af score h( 75)= 1 h( 80)= 1 h( 85)= 0 h( 90)= 3 h( 95)= 2 h(100)= 5 h(105)= 4 h(110)= 9 h(115)= 12 h(120)= 12 h(125)= 17 h(130)= 22 h(135)= 28 h(140)= 39 h(145)= 24 h(150)= 49 h(155)= 54 h(160)= 74 h(165)= 63 h(170)=117 h(175)= 63 h(180)= 91 h(185)= 57 h(190)= 72 h(195)= 39 h(200)= 36 h(205)= 35 h(210)= 29 h(215)= 14 h(220)= 21 h(225)= 1 h(230)= 5 h(235)= 1 h(240)= 0 h(245)= 0 h(250)= 0 h(255)= 0 h(260)= 0 h(265)= 0 h(270)= 0 h(275)= 0 h(280)= 0

Strategier ved spil 23

Frekvens af score F( 80)=00020 F( 85)=00020 F( 90)=00050 F( 95)=00070 F(100)=00120 F(105)=00160 F(110)=00250 F(115)=00370 F(120)=00490 F(125)=00660 F(130)=00880 F(135)=01160 F(140)=01550 F(145)=01790 F(150)=02280 F(155)=02820 F(160)=03560 F(165)=04190 F(170)=05360 F(175)=05990 F(180)=06900 F(185)=07470 F(190)=08190 F(195)=08580 F(200)=08940 F(205)=09290 F(210)=09580 F(215)=09720 F(220)=09930 F(225)=09940 F(230)=09990 F(235)=10000 F(240)=10000 F(245)=10000 F(250)=10000 F(255)=10000 F(260)=10000 F(265)=10000 F(270)=10000 F(275)=10000

Maringske er det ikke en saeligrlig imponerende forbedring fra den foslashrste strategi men det er en teoretisk milepaeligl at man er i stand til at angive den bedste strategi for bestemte typer af spil Som omtalt har vi ikke forsoslashgt at bevise at Snell-Strategien er den optimale Strategi men det kan bevises Det er vigtigt at notere sig at i alle de omtalte spil har udfaldene vaeligre stokastiske variable dvs uforudsigelige men med bestemte sandsynligheder og at disse sandsynligheder ikke bliver aeligndret af den strategi man foslashlger I mange af de spil hvor man ofte moslashder begrebet strategi feks skak krig finansmarked og markedsfoslashring er dette langt fra tilfaeligldet Hvis feks alle boslashrsspekulanter fulgte den samme optimale strategi med boslashrskursen som stokastisk variabel ville det nok vise sig at det var den daringrligste strategi af alle Teorien for dynamiske strategier hvor de stokastiske variable er funktioner af tiden og af den valgte strategi er teoretisk naeligsten ufremkommelige

Strategier ved spil 24

Indeks Casino516 Computersimulation18 definitionen af sandsynlighed 1 Den optimale Snell-strategi11 forsikringsmatematik 5 Indbrudstyvens pensionsproblem912 kortsigtede strategi 10 kumulerede frekvens 19 langsigtede strategi 10 lotto 1 Mandagschancen14 Mandags-chancen9 Martingale-systemet16

Optimale Strategier 10 Poker 3 rekursionsligning 6 roulette 57 Roulette spil 10 roulettespiller 7 ruinsandsynligheder 5 Skaeligbnen913 Snell-strategien 11 Stopbetingelsen11 strategi9 Taeligndstikspillet1018

Page 23: Sandsynligheder og strategier ved spil - Ole Witt-Hansen ...olewitthansen.dk/Matematik/Sandsynligheder_og_strategier_ved_spil… · 6dqgv\qoljkhghu yhg vslo 3n vdpph pngh ndq yl ilqgh

Strategier ved spil 21

Hyppighed af score h( 75)= 1 h( 80)= 7 h( 85)= 3 h( 90)= 5 h( 95)= 6 h(100)= 34 h(105)= 38 h(110)= 82 h(115)= 68 h(120)=161 h(125)=146 h(130)=320 h(135)=280 h(140)=534 h(145)=425 h(150)=752 h(155)=577 h(160)=878 h(165)=645 h(170)=956 h(175)=651 h(180)=863 h(185)=527 h(190)=609 h(195)=351 h(200)=389 h(205)=180 h(210)=203 h(215)= 93 h(220)= 86 h(225)= 47 h(230)= 32 h(235)= 21 h(240)= 13 h(245)= 8 h(250)= 3 h(255)= 0 h(260)= 4 h(265)= 1 h(270)= 1 h(275)= 0 h(280)= 0 Frekvens of score F( 80)=00008 F( 85)=00011 F( 90)=00016 F( 95)=00022 F(100)=00056 F(105)=00094 F(110)=00176 F(115)=00244 F(120)=00405 F(125)=00551 F(130)=00871 F(135)=01151 F(140)=01685 F(145)=02110 F(150)=02862 F(155)=03439 F(160)=04317 F(165)=04962 F(170)=05918 F(175)=06569 F(180)=07432 F(185)=07959 F(190)=08568 F(195)=08919 F(200)=09308 F(205)=09488 F(210)=09691 F(215)=09784 F(220)=09870 F(225)=09917 F(230)=09949 F(235)=09970 F(240)=09983 F(245)=09991 F(250)=09994 F(255)=09994 F(260)=09998 F(265)=09999 F(270)=10000 F(275)=10000

Som det fremgaringr af tabellen for P(X gt= j) er der kun 78 chance for at slaring 5 roslashde eller derover saring goslashr man det skal man altid vaeliglge det stoslashrste af de resterende tal For 3 eller 4 roslashde er situationen langt mere uigemmeskuelig og kun en beregning kan afgoslashre sagen Vi proslashver nu at finde den optimale strategi eller Snell-strategien Hvad angaringr sposlashrgsmaringlet om hvorvidt vi skal vaeliglge den stoslashrste eller naeligststoslashrste saring lader det sig faktisk goslashre at beregne Snell-strategien paring en computer De foslashlgende tilfaeliglde bliver derimod for komplicerede og der anvender vi en svagt forbedret version af vores intuitive strategi Forbedringen bestaringr i foslashlgende idet vi illustrerer det med et eksempel Lad os sige vi har slaringet 3 roslashde og vi overvejer om vi vil gange det med 7 eller 6 Ganger vi med 6 er det fordi vi forventer at slaring mindst 4 roslashde mindst en gang i de resterende kast Vores score vil vaeligre 73 og 74 henholdsvis og scoren vil blive forbedret med en faktor 43 hvis vi ganger med 6 under forventning af at slaring 4 roslashde Vores forbedring af strategien garingr da ud paring at vi vaeliglger det naeligststoslashrste 6 hvis sandsynligheden for at slaring 4 roslashde gange den relative forbedring 43 er stoslashrre end frac12 Vi rekapitulerer dernaeligst Snell-strategien G10 = X10 X10 Stokastisk variabel = antallet af roslashde i det 10 kast G9 = max X9 E(G10) E(G10) = E(X10) = np=10025 = 25 X9 = 01hellip10 Gk = max Xk E(Gk+1) E(Gk) kraeligver en laeligngere udregning men den udregnes som en

almindelig middelvaeligrdi altsaring som max af de to vaeligrdier gange P(X=Xk-1) G1 = max X1 E(G2) Som eksempel udregner vi E(G9) Da E(G10)=25 skal vi for X9 = 012 anvende E(G10)=25 i udregningen

Strategier ved spil 22

E(G9) = 25 (P(X=0)+P(X=1)+P(X=2))+ 3P(X=3)+hellip+10P(X=10) =306 Vaeligrdierne for E(Gk) er alle udregnet og vist i computerberegningen nedenfor Bemaeligrk isaeligr at de vokser fra 25 til 425 naringr k aftager fra 10 til 2 Strategien er nu foslashlgende Vaeliglg det stoslashrste af de resterende tal hvis Xk gt E(Gk+1) (altsaring det antal man har slaringet er er stoslashrre end det forventede stoslashrste antal) ellers vaeliglg det naeligststoslashrste Ved afgoslashrelsen om de 3 stoslashrste 4 stoslashrste osv anvender vi den hidtidige strategi med den modifikation at vi multiplicerer sandsynligheden med den formodede relative forbedring E(G10-kast)antal roslashde En computerberegning helt svarende til den foregaringende men med den aeligndrede strategi er vist nedenfor Man bemaeligrker for det foslashrste de smaring aeligndringer der er i strategien Den nye strategi er lidt mindre forsigtig men den giver altsaring ogsaring pote i form af en forbedring af gennemsnittet paring ca 275 Primaeligr sandsynligheder P(X=j) for n= 10 og p= 0250 j 0 1 2 3 4 5 6 7 8 9 10 P(X=j)0056 0188 0282 0250 0146 0058 0016 00031 00004 00000 00000 Baglaeligns Kumulerede sandsynligheder P(Xgt=j) j 0 1 2 3 4 5 6 7 8 9 10 P(Xgt=j) 1000 0944 0756 0474 0224 0078 00197 00035 00004 00000 00000 E(G[10])= 250 E(G[9])= 306 E(G[8])= 337 E(G[7])= 362 E(G[6])= 380 E(G[5])= 395 E(G[4])= 406 E(G[3])= 416 E(G[2])= 425 kast nr 1 2 3 4 5 6 7 8 9 10 score 0 1 1 1 1 1 1 1 1 1 1 1 2 2 1 1 1 1 1 1 1 1 2 5 4 4 3 3 3 2 2 1 1 3 8 7 6 5 5 4 3 2 2 1 4 9 8 7 7 6 5 4 3 2 1 5 10 9 8 7 6 5 4 3 2 1 6 10 9 8 7 6 5 4 3 2 1 7 10 9 8 7 6 5 4 3 2 1 8 10 9 8 7 6 5 4 3 2 1 9 10 9 8 7 6 5 4 3 2 1 10 10 9 8 7 6 5 4 3 2 1 Gennemsnitlig gevinst ms = 16727 Hyppigheder af score h( 75)= 1 h( 80)= 1 h( 85)= 0 h( 90)= 3 h( 95)= 2 h(100)= 5 h(105)= 4 h(110)= 9 h(115)= 12 h(120)= 12 h(125)= 17 h(130)= 22 h(135)= 28 h(140)= 39 h(145)= 24 h(150)= 49 h(155)= 54 h(160)= 74 h(165)= 63 h(170)=117 h(175)= 63 h(180)= 91 h(185)= 57 h(190)= 72 h(195)= 39 h(200)= 36 h(205)= 35 h(210)= 29 h(215)= 14 h(220)= 21 h(225)= 1 h(230)= 5 h(235)= 1 h(240)= 0 h(245)= 0 h(250)= 0 h(255)= 0 h(260)= 0 h(265)= 0 h(270)= 0 h(275)= 0 h(280)= 0

Strategier ved spil 23

Frekvens af score F( 80)=00020 F( 85)=00020 F( 90)=00050 F( 95)=00070 F(100)=00120 F(105)=00160 F(110)=00250 F(115)=00370 F(120)=00490 F(125)=00660 F(130)=00880 F(135)=01160 F(140)=01550 F(145)=01790 F(150)=02280 F(155)=02820 F(160)=03560 F(165)=04190 F(170)=05360 F(175)=05990 F(180)=06900 F(185)=07470 F(190)=08190 F(195)=08580 F(200)=08940 F(205)=09290 F(210)=09580 F(215)=09720 F(220)=09930 F(225)=09940 F(230)=09990 F(235)=10000 F(240)=10000 F(245)=10000 F(250)=10000 F(255)=10000 F(260)=10000 F(265)=10000 F(270)=10000 F(275)=10000

Maringske er det ikke en saeligrlig imponerende forbedring fra den foslashrste strategi men det er en teoretisk milepaeligl at man er i stand til at angive den bedste strategi for bestemte typer af spil Som omtalt har vi ikke forsoslashgt at bevise at Snell-Strategien er den optimale Strategi men det kan bevises Det er vigtigt at notere sig at i alle de omtalte spil har udfaldene vaeligre stokastiske variable dvs uforudsigelige men med bestemte sandsynligheder og at disse sandsynligheder ikke bliver aeligndret af den strategi man foslashlger I mange af de spil hvor man ofte moslashder begrebet strategi feks skak krig finansmarked og markedsfoslashring er dette langt fra tilfaeligldet Hvis feks alle boslashrsspekulanter fulgte den samme optimale strategi med boslashrskursen som stokastisk variabel ville det nok vise sig at det var den daringrligste strategi af alle Teorien for dynamiske strategier hvor de stokastiske variable er funktioner af tiden og af den valgte strategi er teoretisk naeligsten ufremkommelige

Strategier ved spil 24

Indeks Casino516 Computersimulation18 definitionen af sandsynlighed 1 Den optimale Snell-strategi11 forsikringsmatematik 5 Indbrudstyvens pensionsproblem912 kortsigtede strategi 10 kumulerede frekvens 19 langsigtede strategi 10 lotto 1 Mandagschancen14 Mandags-chancen9 Martingale-systemet16

Optimale Strategier 10 Poker 3 rekursionsligning 6 roulette 57 Roulette spil 10 roulettespiller 7 ruinsandsynligheder 5 Skaeligbnen913 Snell-strategien 11 Stopbetingelsen11 strategi9 Taeligndstikspillet1018

Page 24: Sandsynligheder og strategier ved spil - Ole Witt-Hansen ...olewitthansen.dk/Matematik/Sandsynligheder_og_strategier_ved_spil… · 6dqgv\qoljkhghu yhg vslo 3n vdpph pngh ndq yl ilqgh

Strategier ved spil 22

E(G9) = 25 (P(X=0)+P(X=1)+P(X=2))+ 3P(X=3)+hellip+10P(X=10) =306 Vaeligrdierne for E(Gk) er alle udregnet og vist i computerberegningen nedenfor Bemaeligrk isaeligr at de vokser fra 25 til 425 naringr k aftager fra 10 til 2 Strategien er nu foslashlgende Vaeliglg det stoslashrste af de resterende tal hvis Xk gt E(Gk+1) (altsaring det antal man har slaringet er er stoslashrre end det forventede stoslashrste antal) ellers vaeliglg det naeligststoslashrste Ved afgoslashrelsen om de 3 stoslashrste 4 stoslashrste osv anvender vi den hidtidige strategi med den modifikation at vi multiplicerer sandsynligheden med den formodede relative forbedring E(G10-kast)antal roslashde En computerberegning helt svarende til den foregaringende men med den aeligndrede strategi er vist nedenfor Man bemaeligrker for det foslashrste de smaring aeligndringer der er i strategien Den nye strategi er lidt mindre forsigtig men den giver altsaring ogsaring pote i form af en forbedring af gennemsnittet paring ca 275 Primaeligr sandsynligheder P(X=j) for n= 10 og p= 0250 j 0 1 2 3 4 5 6 7 8 9 10 P(X=j)0056 0188 0282 0250 0146 0058 0016 00031 00004 00000 00000 Baglaeligns Kumulerede sandsynligheder P(Xgt=j) j 0 1 2 3 4 5 6 7 8 9 10 P(Xgt=j) 1000 0944 0756 0474 0224 0078 00197 00035 00004 00000 00000 E(G[10])= 250 E(G[9])= 306 E(G[8])= 337 E(G[7])= 362 E(G[6])= 380 E(G[5])= 395 E(G[4])= 406 E(G[3])= 416 E(G[2])= 425 kast nr 1 2 3 4 5 6 7 8 9 10 score 0 1 1 1 1 1 1 1 1 1 1 1 2 2 1 1 1 1 1 1 1 1 2 5 4 4 3 3 3 2 2 1 1 3 8 7 6 5 5 4 3 2 2 1 4 9 8 7 7 6 5 4 3 2 1 5 10 9 8 7 6 5 4 3 2 1 6 10 9 8 7 6 5 4 3 2 1 7 10 9 8 7 6 5 4 3 2 1 8 10 9 8 7 6 5 4 3 2 1 9 10 9 8 7 6 5 4 3 2 1 10 10 9 8 7 6 5 4 3 2 1 Gennemsnitlig gevinst ms = 16727 Hyppigheder af score h( 75)= 1 h( 80)= 1 h( 85)= 0 h( 90)= 3 h( 95)= 2 h(100)= 5 h(105)= 4 h(110)= 9 h(115)= 12 h(120)= 12 h(125)= 17 h(130)= 22 h(135)= 28 h(140)= 39 h(145)= 24 h(150)= 49 h(155)= 54 h(160)= 74 h(165)= 63 h(170)=117 h(175)= 63 h(180)= 91 h(185)= 57 h(190)= 72 h(195)= 39 h(200)= 36 h(205)= 35 h(210)= 29 h(215)= 14 h(220)= 21 h(225)= 1 h(230)= 5 h(235)= 1 h(240)= 0 h(245)= 0 h(250)= 0 h(255)= 0 h(260)= 0 h(265)= 0 h(270)= 0 h(275)= 0 h(280)= 0

Strategier ved spil 23

Frekvens af score F( 80)=00020 F( 85)=00020 F( 90)=00050 F( 95)=00070 F(100)=00120 F(105)=00160 F(110)=00250 F(115)=00370 F(120)=00490 F(125)=00660 F(130)=00880 F(135)=01160 F(140)=01550 F(145)=01790 F(150)=02280 F(155)=02820 F(160)=03560 F(165)=04190 F(170)=05360 F(175)=05990 F(180)=06900 F(185)=07470 F(190)=08190 F(195)=08580 F(200)=08940 F(205)=09290 F(210)=09580 F(215)=09720 F(220)=09930 F(225)=09940 F(230)=09990 F(235)=10000 F(240)=10000 F(245)=10000 F(250)=10000 F(255)=10000 F(260)=10000 F(265)=10000 F(270)=10000 F(275)=10000

Maringske er det ikke en saeligrlig imponerende forbedring fra den foslashrste strategi men det er en teoretisk milepaeligl at man er i stand til at angive den bedste strategi for bestemte typer af spil Som omtalt har vi ikke forsoslashgt at bevise at Snell-Strategien er den optimale Strategi men det kan bevises Det er vigtigt at notere sig at i alle de omtalte spil har udfaldene vaeligre stokastiske variable dvs uforudsigelige men med bestemte sandsynligheder og at disse sandsynligheder ikke bliver aeligndret af den strategi man foslashlger I mange af de spil hvor man ofte moslashder begrebet strategi feks skak krig finansmarked og markedsfoslashring er dette langt fra tilfaeligldet Hvis feks alle boslashrsspekulanter fulgte den samme optimale strategi med boslashrskursen som stokastisk variabel ville det nok vise sig at det var den daringrligste strategi af alle Teorien for dynamiske strategier hvor de stokastiske variable er funktioner af tiden og af den valgte strategi er teoretisk naeligsten ufremkommelige

Strategier ved spil 24

Indeks Casino516 Computersimulation18 definitionen af sandsynlighed 1 Den optimale Snell-strategi11 forsikringsmatematik 5 Indbrudstyvens pensionsproblem912 kortsigtede strategi 10 kumulerede frekvens 19 langsigtede strategi 10 lotto 1 Mandagschancen14 Mandags-chancen9 Martingale-systemet16

Optimale Strategier 10 Poker 3 rekursionsligning 6 roulette 57 Roulette spil 10 roulettespiller 7 ruinsandsynligheder 5 Skaeligbnen913 Snell-strategien 11 Stopbetingelsen11 strategi9 Taeligndstikspillet1018

Page 25: Sandsynligheder og strategier ved spil - Ole Witt-Hansen ...olewitthansen.dk/Matematik/Sandsynligheder_og_strategier_ved_spil… · 6dqgv\qoljkhghu yhg vslo 3n vdpph pngh ndq yl ilqgh

Strategier ved spil 23

Frekvens af score F( 80)=00020 F( 85)=00020 F( 90)=00050 F( 95)=00070 F(100)=00120 F(105)=00160 F(110)=00250 F(115)=00370 F(120)=00490 F(125)=00660 F(130)=00880 F(135)=01160 F(140)=01550 F(145)=01790 F(150)=02280 F(155)=02820 F(160)=03560 F(165)=04190 F(170)=05360 F(175)=05990 F(180)=06900 F(185)=07470 F(190)=08190 F(195)=08580 F(200)=08940 F(205)=09290 F(210)=09580 F(215)=09720 F(220)=09930 F(225)=09940 F(230)=09990 F(235)=10000 F(240)=10000 F(245)=10000 F(250)=10000 F(255)=10000 F(260)=10000 F(265)=10000 F(270)=10000 F(275)=10000

Maringske er det ikke en saeligrlig imponerende forbedring fra den foslashrste strategi men det er en teoretisk milepaeligl at man er i stand til at angive den bedste strategi for bestemte typer af spil Som omtalt har vi ikke forsoslashgt at bevise at Snell-Strategien er den optimale Strategi men det kan bevises Det er vigtigt at notere sig at i alle de omtalte spil har udfaldene vaeligre stokastiske variable dvs uforudsigelige men med bestemte sandsynligheder og at disse sandsynligheder ikke bliver aeligndret af den strategi man foslashlger I mange af de spil hvor man ofte moslashder begrebet strategi feks skak krig finansmarked og markedsfoslashring er dette langt fra tilfaeligldet Hvis feks alle boslashrsspekulanter fulgte den samme optimale strategi med boslashrskursen som stokastisk variabel ville det nok vise sig at det var den daringrligste strategi af alle Teorien for dynamiske strategier hvor de stokastiske variable er funktioner af tiden og af den valgte strategi er teoretisk naeligsten ufremkommelige

Strategier ved spil 24

Indeks Casino516 Computersimulation18 definitionen af sandsynlighed 1 Den optimale Snell-strategi11 forsikringsmatematik 5 Indbrudstyvens pensionsproblem912 kortsigtede strategi 10 kumulerede frekvens 19 langsigtede strategi 10 lotto 1 Mandagschancen14 Mandags-chancen9 Martingale-systemet16

Optimale Strategier 10 Poker 3 rekursionsligning 6 roulette 57 Roulette spil 10 roulettespiller 7 ruinsandsynligheder 5 Skaeligbnen913 Snell-strategien 11 Stopbetingelsen11 strategi9 Taeligndstikspillet1018

Page 26: Sandsynligheder og strategier ved spil - Ole Witt-Hansen ...olewitthansen.dk/Matematik/Sandsynligheder_og_strategier_ved_spil… · 6dqgv\qoljkhghu yhg vslo 3n vdpph pngh ndq yl ilqgh

Strategier ved spil 24

Indeks Casino516 Computersimulation18 definitionen af sandsynlighed 1 Den optimale Snell-strategi11 forsikringsmatematik 5 Indbrudstyvens pensionsproblem912 kortsigtede strategi 10 kumulerede frekvens 19 langsigtede strategi 10 lotto 1 Mandagschancen14 Mandags-chancen9 Martingale-systemet16

Optimale Strategier 10 Poker 3 rekursionsligning 6 roulette 57 Roulette spil 10 roulettespiller 7 ruinsandsynligheder 5 Skaeligbnen913 Snell-strategien 11 Stopbetingelsen11 strategi9 Taeligndstikspillet1018