26
Hva legger vi i spillteori? Modell for rasjonelle aktørers adferd i mellom-menneskelige relasjoner Kan også brukes til å analysere helt vanlige spill, for å avdekke hva som skjer underveis og for å finne strategier for å vinne.

Lukkede spill

Embed Size (px)

Citation preview

Page 1: Lukkede spill

Hva legger vi i spillteori?

Modell for rasjonelle aktørers adferd i mellom-menneskelige relasjoner

Kan også brukes til å analysere helt vanlige spill, for å avdekke hva som skjer underveis og for å finne strategier for å vinne.

Page 2: Lukkede spill

Kravene vi stiller til et spill:

•  Lett å spille og enkelt å lære

•  Morsomt, fengende

•  Ha et matematisk innhold

Page 3: Lukkede spill

SPILLGEOGRAFI

Page 4: Lukkede spill

Landeveien:

Slå med tre terninger, innom alle rutene i rekkefølge, førstemann til mål. Antall øyne på terningene bestemmer hvor langt man kan gå.

1

5

3

4

2

1

7 8

12, mål

9

6

10

11

Start

Page 5: Lukkede spill

Nim med én bunke:

Trekk 1, 2 eller 3 fyrstikker annen hver gang, den som tar den siste har vunnet

Page 6: Lukkede spill

Nim med to bunker:

Trekk så mange fyrstikker du vil, men bare fra én bunke av gangen. Den som tar siste fyrstikken har vunnet.

Page 7: Lukkede spill

Børs:

1000 1000 367 524 633 476

Page 8: Lukkede spill

Juniper Green:

1 2 3 4 5

6 7 8 9 10

21 22 23 24 25

11 12 13 14 15

16 17 18 19 20

Ingen flere tall igjen !

Page 9: Lukkede spill

Lotto:

Velg ut et tall mellom 1 og 5 379 616, den som treffer riktig tall har vunnet og får premien.

Page 10: Lukkede spill

Spill-geografi:

I et åpent spill har alle spillerne full innsikt i hverandres strategier og legger det til grunn for egne valg. Det motsatte kalles et lukket spill.

I et strategispill er det kun spillernes valg som bestemmer spillets gang, mens i et lotteri er det innbakt noe form for tilfeldigheter

Page 11: Lukkede spill

Spill-geografi: Lotteri

Åpne spill Lukkede spill

Strategispill

Landevei

Sjakk, Nim

Lotto

Børs

Page 12: Lukkede spill

GRAF-TEORI

Page 13: Lukkede spill

Graftteori:

En rettet graf er en geometrisk figur som består av noder og rettede kanter mellom nodene. En vei i en rettet graf er en sekvens av påfølgende rettede kanter.

En sykel er en vei som starter og slutter i samme node

En rettet graf er sammenhengende dersom ethvert par av noder er forbundet med en (ikke-rettet) vei av kanter.

Page 14: Lukkede spill

Graftteori anvendt på spill:

Et spill er beskrevet av et beslutningstre. Et beslutningstre er en rettet, sammenhengende graf uten sykler

Page 15: Lukkede spill

Graftteori, fortsetter:

En forløper u til en node v er en node slik at det finnes en vei fra u til v. Tilsvarende sier vi at v er en etterfølger til u. Dersom det ikke finnes noder mellom u og v er kalles de en primær forløper/etterfølger.

En initial node er en node uten forløpere. En terminal node er en node uten etterfølgere. Hvis et beslutningstre kun har en initial node kalles denne treets rot.

Page 16: Lukkede spill

Graftteori, fortsetter:

Høyden til en node er det minimale antall kanter fram til en terminal node. Dybden til en node er antall kanter tilbake til rota. Lengden til et spill er høyden til rota.

Page 17: Lukkede spill

UTBYTTE-FUNKSJONER

Page 18: Lukkede spill

Utbyttefunksjoner: Funksjon på grafen med verdier i intervallet [0,1]

Fastsetter verdier på terminale noder

Bruker Zermelos algoritme for å bestemme verdien på de andre nodene.

Skille mellom I-noder og II-noder

I-node:

II-node:

0 1 1

1 0

0 1

1 0

0

0

0

1

0

Page 19: Lukkede spill

Utbyttefunksjon for Nim med én bunke: 5

4 3 2

3 2 1 2 1 1 0 0

2 1 0 1 0

1 0 0 0

0 0 0 0 1

0

0 Grøn 0 betyr at spiller I vinner, rød 0 betyr at spiller II vinner

Page 20: Lukkede spill

Utbyttefunksjon for lotterier:

U(x) = max U(v) hvor v gjennomløper alle primære etterfølgere til x

X er en I-node

X er en II-node

Zermelos algoritme:

U(x) = min U(v) hvor v gjennomløper alle primære etterfølgere til x

Vektet gjennomsnitt:

U(x) = ∑P(v)u(v) hvor v gjennomløper alle primære etterfølgere til x

Page 21: Lukkede spill

Utbyttefunksjon for Primo:

1/3 2/3 Verdi=4g/9 + 1/3

Verdi=1

Verdi=0

1/3 2/3

Verdi=g

Verdi=2g/3

Verdi=g

Page 22: Lukkede spill

LUKKEDE SPILL

Page 23: Lukkede spill

Lukkede spill:

To spillere med to mulige strategier hver. Spiller I velger strategi 1 med sannsynlighet x og spiller II velger strategi 1 med sannsynlighet y.Valgene gjøres simultant.

Blandede strategier som simultant optimaliserer utbyttefunksjonene for begge spillerne kalles en Nash-likevekt.

Page 24: Lukkede spill

Et pengespill:

To spillere viser samtidig fram en mynt, enten en 10-krone eller en 20-krone. Dersom begge viser det samme får spiller I begge myntene, dersom de er forskjellige får spiller II begge myntene.

Hvem tjener mest på dette spillet, I eller II, og hvordan lønner det seg å spille?

Page 25: Lukkede spill

Fangenes dilemma:

To fanger sitter i arrest og blir forhørt. Den ene vet ikke hva den andre sier. Begge to blir presentert for følgende problemstilling: Dersom ingen tilstår blir straffen 1 år for begge to. Dersom begge tilstår får de 8 år hver. Dersom den ene tilstår og den andre ikke, får den som tier 10 år og den andre går fri.

Hva gjør de?

Page 26: Lukkede spill

Da er det på tide å spille litt, men først tar vi en pause!