Teoria Gier i Optymalne Wykorzystanie Wspólnych...

Preview:

Citation preview

Teoria Gier i OptymalneWykorzystanie Wspólnych Zasobów

Krzysztof R. AptCWI, Amsterdam

Uniwersytet Amsterdamski

Teoria Gier i Optymalne Wykorzystanie Wspolnych Zasobow – p. 1/40

Plan

Gra strategiczna.

Najlepsza odpowiedz.

Równowaga Nasha.

Dobro społeczne.

Społeczne optimum.

Przykłady.

Współzawodnictwo Cournota.

Teoria Gier i Optymalne Wykorzystanie Wspolnych Zasobow – p. 2/40

Gry strategiczne: Definicja

Gra strategiczna dla n > 1 graczy:

Kazdy gracz ma pewien zbiór strategii.

Kazdy gracz chce zmaksymalizowac swój zysk(lub zminimalizowac swoje koszty).

Wszyscy gracze wybieraja swoje strategie jednoczesnie.

Nastepnie kazdy gracz otrzymuje wypłate(lub musi pokryc swoje koszty).

Teoria Gier i Optymalne Wykorzystanie Wspolnych Zasobow – p. 3/40

Zało zenia

Kazdy gracz działa racjonalnie: jego celem jestzmaksymalizowanie swojej wypłaty(lub zminimalizowanie swoich kosztów).

Zasady gry oraz załozenie racjonalnego działania sawspólna wiedza wszystkich graczy.

Teoria Gier i Optymalne Wykorzystanie Wspolnych Zasobow – p. 4/40

PrzykładyDylemat Wi eznia

C DC 2, 2 0, 3D 3, 0 1, 1

Walka PłciM B

M 2, 1 0, 0B 0, 0 1, 2

Orzeł czy Reszka

O RO 1,−1 −1, 1R −1, 1 1,−1

Teoria Gier i Optymalne Wykorzystanie Wspolnych Zasobow – p. 5/40

Równowaga Nasha

Wezmy jakas gre.

Załózmy, ze kazdy gracz wybrał swoja strategie.

Strategia gracza jest najlepsza odpowiedzia na wybórstrategii przeciwników jesli jest przynajmniej tak dobra jakkazda inna strategia.

Równowaga Nasha: kombinacja strategii graczy, w którejkazda strategia jest najlepsza odpowiedzia na wybór strategiiprzeciwników.

Intuicja: W równowadze Nasha kazdy gracz jest zadowolonyze swojego wyboru.

Teoria Gier i Optymalne Wykorzystanie Wspolnych Zasobow – p. 6/40

Równowaga NashaZałózmy, ze kazdy gracz wybrał swoja strategie.

Strategia gracza jest najlepsza odpowiedzia na wybórstrategii przeciwników jesli jest przynajmniej tak dobra jakkazda inna strategia.

Równowaga Nasha: kombinacja strategii graczy, w którejkazda strategia jest najlepsza odpowiedzia na wybór strategiiprzeciwników.

Notacja: si, s′i ∈ Si; s, s′, (si, s−i) ∈ S1 × . . . × Sn.

si jest najlepsza odpowiedzia na s−i jesli

∀s′i ∈ Si pi(si, s−i) ≥ pi(s′i, s−i).

s jest równowaga Nasha jesli dla kazdego i

∀s′i ∈ Si pi(si, s−i) ≥ pi(s′i, s−i).

Teoria Gier i Optymalne Wykorzystanie Wspolnych Zasobow – p. 7/40

Równowaga Nasha: PrzykładyDylemat Wi eznia 1 równowaga Nasha

C DC 2, 2 0, 3D 3, 0 1, 1

Walka Płci 2 równowagi Nasha

M BM 2, 1 0, 0B 0, 0 1, 2

Orzeł czy Reszka brak równowagi Nasha

O RO 1,−1 −1, 1R −1, 1 1,−1

Teoria Gier i Optymalne Wykorzystanie Wspolnych Zasobow – p. 8/40

John NashZ Wikipedii:

”John Forbes Nash Jr (ur. 13 czerwca 1928). Amerykanskimatematyk i ekonomista. [...] Był współlaureatem nagrodyBanku Szwecji im. Alfreda Nobla w dziedzinie ekonomii w 1994roku. [...] Nash cierpiał na schizofrenie paranoidalna. [...]Historia jego zycia została zekranizowana w 2001 roku w filmiePiekny umysł (A Beautiful Mind).”

Teoria Gier i Optymalne Wykorzystanie Wspolnych Zasobow – p. 9/40

Dodatkowe Poj ˛ecia

Dobro społeczne s:∑n

j=1 pj(s).

s jest społecznym optimum jesli dobro społeczne s jestmaksymalne.

Teoria Gier i Optymalne Wykorzystanie Wspolnych Zasobow – p. 10/40

Przykład: Dylemat Wi˛ eznia

C DC 2, 2 0, 3D 3, 0 1, 1

1 równowaga Nasha: (D,D),

1 społeczne optimum: (C,C).

Zauwaz:dobro społeczne w równowadze Nasha: 2,dobro społeczne w społecznym optimum: 4.

Teoria Gier i Optymalne Wykorzystanie Wspolnych Zasobow – p. 11/40

Dylemat Wi eznia w Praktyce

Teoria Gier i Optymalne Wykorzystanie Wspolnych Zasobow – p. 12/40

Współzawodnictwo CournotaAugustin Cournot (1838)

jeden produkt,

n > 1 firm decyduje jednoczesnie o wysokosci produkcji,

cena maleje ze wzrostem produkcji globalnej.

Teoria Gier i Optymalne Wykorzystanie Wspolnych Zasobow – p. 13/40

Współzawodnictwo Cournota formalnieModelowanie przy uzyciu gier strategicznych.

Załózmy, ze dla kazdego gracza i

jego zbiór strategii jest R+,

jego funkcja wypłaty jest

pi(s) := si(a − bn

j=1

sj) − csi,

gdzie a > c i b > 0.

Teoria Gier i Optymalne Wykorzystanie Wspolnych Zasobow – p. 14/40

Uwagi

Funkcja wypłaty:

pi(s) := si(a − bn

j=1

sj) − csi,

gdzie a > c i b > 0.

Cena produktu: a − b∑n

j=1 sj .Poniewaz b > 0 cena rzeczywiscie maleje ze wzrostemprodukcji globalnej.

Koszt produkcji jednego egzemplarza: c.

Gdyby a ≤ c wypłaty byłyby zawsze ujemne.

Teoria Gier i Optymalne Wykorzystanie Wspolnych Zasobow – p. 15/40

Analiza: Równowaga NashaDla danego i ∈ {1, . . ., n} i s−i niech t :=

j 6=i sj.

pi(si, t) = si(a − c − bt − bsi) = −bs2i + (a − c − bt)si.

Chcemy znalezc maksimum pi(si).p′i(si) = −2bsi + a − c − bt.

p′i(si) = 0 gdysi = a−c

2b− t

2 .

Czyli s jest równowaga Nasha gdy dla kazdego i

si = a−c2b

−P

j 6=isj

2 .

Ten system n liniowych równan ma dokładnie jednorozwiazanie:si = a−c

(n+1)b dla i ∈ {1, . . ., n}.

Wiec jest to jedyna równowaga Nasha.

Teoria Gier i Optymalne Wykorzystanie Wspolnych Zasobow – p. 16/40

Analiza: Społeczne Optimum

Niech t :=∑n

j=1 sj .Wówczas f(t) :=

∑nj=1 pj(s) = t(a − c − bt).

Chcemy znalezc maksimum f(t).

f ′(t) = 0 gdy

t =a − c

2b.

Teoria Gier i Optymalne Wykorzystanie Wspolnych Zasobow – p. 17/40

WnioskiRównowaga Nasha: gdy kazde si = a−c

(n+1)b .

Wówczas cena produktu: a+ncn+1 .

Społeczne optimum: gdy∑n

j=1 sj = a−c2b

.Wówczas cena produktu: a+c

2 .

Poniewaz a > c wiec a+c2 > a+nc

n+1 .Czyli cena w społecznym optimum jest wyzsza niz wrównowadze Nasha.

Gdy n wzrasta cena w równowadze Nasha, a+ncn+1 , spada.

Czyli zwiekszone współzawodnictwo jest pozyteczne dlaklientów.

limn → ∞a+ncn+1 = c.

Czyli zwiekszone współzawodnictwo prowadzi do zerowychzysków.

Teoria Gier i Optymalne Wykorzystanie Wspolnych Zasobow – p. 18/40

Plan

Tragedia wspólnot.

Gry sieciowe.

Przykłady.

Teoria Gier i Optymalne Wykorzystanie Wspolnych Zasobow – p. 19/40

Tragedia Wspólnot

Wspólne zasoby: dobra, z których kazdy moze za darmokorzystac, ale ich uzycie przez jakakolwiek osobe ograniczadostepnosc innym.

Przykłady: zatłoczone (darmowe) drogi samochodowe, rybyw morzu, srodowisko, . . .,

Problem: Naduzycie takich wspólnych zasób prowadzi do ichzniszczenia.

Ten problem nazywa sie tragedia wspólnot (Hardin ’81).

Teoria Gier i Optymalne Wykorzystanie Wspolnych Zasobow – p. 20/40

Tragedia Wspólnot: Przykład(Gardner ’95)

n > 1 graczy,

dwie strategie:1 (uzyj zasobu),0 (nie uzyj),

funkcja wypłat:

pi(s) :=

{

0.1 jesli si = 0

F (m)/m jesli si = 1

gdzie m =∑n

j=1 sj i F (m) := 1.1m − 0.1m2.

Funkcja F jest tak skonstruowana, ze F (m)/m maleje iszybko opada ponizej 0:F (9)/9 = 0.2, F (10)/10 = 0.1, F (11)/11 = 0.

Teoria Gier i Optymalne Wykorzystanie Wspolnych Zasobow – p. 21/40

Przykład: Równowagi NashaZałózmy n < 10.

pi(s) :=

{

0.1 jesli si = 0

F (m)/m jesli si = 1

gdzie m =∑n

j=1 sj i F (m) := 1.1m − 0.1m2.

F (9)/9 = 0.2, F (10)/10 = 0.1, F (11)/11 = 0.

Poniewaz n < 10 mamy m + 1 < 10, czyliF (m + 1)/(m + 1) > 0.1.A wiec jesli si = 1 gracz i jest zadowolony.

Jedyna równowaga Nasha:wszyscy gracze korzystaja ze wspólnego zasobu.

Gdy n ≥ 10 jedyne równowagi Nasha:9 lub 10 graczy korzysta ze wspólnego zasobu.

Teoria Gier i Optymalne Wykorzystanie Wspolnych Zasobow – p. 22/40

Przykład: Społeczne Optimum

pi(s) :=

{

0.1 jesli si = 0

F (m)/m jesli si = 1

gdzie m =∑n

j=1 sj i F (m) := 1.1m − 0.1m2.

Załózmy m sposród n graczy uzywa zasobu.Wówczas∑n

j=1 pj(s) = 0.1(n − m) + F (m).Alef(m) = 0.1(n − m) + F (m) = 0.1n + m − 0.1m2.Czylif ′(m) = 1 − 0.2m, wiec f ′(m) = 0 gdy m = 5.

Społeczne optimum: 5ciu graczy korzysta ze wspólnegozasobu.

Teoria Gier i Optymalne Wykorzystanie Wspolnych Zasobow – p. 23/40

Gry Sieciowe: Przykład5 kierowców.

Kazdy kierowca wybiera droge z Katowic do Gliwic,

Wiecej kierowców wybiera te sama droge: wiekszeopóznienia.

Uwaga: to sa gry z kosztami and nie z wypłatami.

1/2/3 1/4/5 1/5/6

GLIWICE

KATOWICE

Teoria Gier i Optymalne Wykorzystanie Wspolnych Zasobow – p. 24/40

Mozliwy Rozwój Wydarze n (1)

1/2/3 1/4/5 1/5/6

GLIWICE

KATOWICE

Teoria Gier i Optymalne Wykorzystanie Wspolnych Zasobow – p. 25/40

Mozliwy Rozwój Wydarze n (2)

1/2/3 1/4/5 1/5/6

GLIWICE

KATOWICE

Teoria Gier i Optymalne Wykorzystanie Wspolnych Zasobow – p. 26/40

Mozliwy Rozwój Wydarze n (3)

1/2/3 1/4/5 1/5/6

GLIWICE

KATOWICE

Teoria Gier i Optymalne Wykorzystanie Wspolnych Zasobow – p. 27/40

Mozliwy Rozwój Wydarze n (4)

1/2/3 1/4/5 1/5/6

GLIWICE

KATOWICE

Teraz kazdy kierowca jest zadowolony.

Teoria Gier i Optymalne Wykorzystanie Wspolnych Zasobow – p. 28/40

Jak znale zli smy równowag˛e Nasha?

Dynamika najlepszej odpowiedzi (‘Best response dynamics’).

Wybierz ‘sytuacje poczatkowa’: kazdy gracz wybieradowolna strategie.

‘Niezadowolony’ gracz moze zmienic swój wybór wybierajacnajlepsza odpowiedz.

Powtórz te procedure.

Jesli ta procedura sie konczy to osiagnelismyrównowage Nasha.

Twierdzenie (Rosenthal, 1973) W grach sieciowych dynamikanajlepszej odpowiedzi zawsze prowadzi do równowagi Nasha.

Teoria Gier i Optymalne Wykorzystanie Wspolnych Zasobow – p. 29/40

Inny PrzykładZałozenia:

4000 kierowców jedzie z A do B.

Kazdy kierowca ma 2 mozliwosci (strategie).

T/100

T/100

45

U

R

B

45

A

Problem: Znajdz równowage Nasha (T = liczba kierowców).

Teoria Gier i Optymalne Wykorzystanie Wspolnych Zasobow – p. 30/40

Równowaga Nasha

T/100

T/100

45

U

R

B

45

A

Odpowiedz: 2000/2000.

Czas jazdy: 2000/100 + 45 = 45 + 2000/100 = 65.

Teoria Gier i Optymalne Wykorzystanie Wspolnych Zasobow – p. 31/40

Paradoks BraessaDodaj szybka droge z U do R.

Kazdy kierowca ma teraz 3 mozliwosci (strategie):A - U - B,A - R - B,A - U - R - B.

T/100

T/100

45

U

R

B

45

A 0

Problem: Znajdz równowage Nasha.Teoria Gier i Optymalne Wykorzystanie Wspolnych Zasobow – p. 32/40

Równowaga Nasha

T/100

T/100

45

U

R

B

45

A 0

Odpowiedz: Kazdy kierowca wybierze droge A - U - R - B.

Dlaczego?: Droga A - U - R - B jest zawsze najlepszaodpowiedzia.

Teoria Gier i Optymalne Wykorzystanie Wspolnych Zasobow – p. 33/40

Mała komplikacja

T/100

T/100

45

U

R

B

45

A 0

Czas jazdy: 4000/100 + 4000/100 = 80!

Teoria Gier i Optymalne Wykorzystanie Wspolnych Zasobow – p. 34/40

Czy to si e zdarza?z Wikipedii (‘Braess Paradox’):

In Seoul, South Korea, a speeding-up in traffic around thecity was seen when a motorway was removed as part of theCheonggyecheon restoration project.

In Stuttgart, Germany after investments into the roadnetwork in 1969, the traffic situation did not improve until asection of newly-built road was closed for traffic again.

In 1990 the closing of 42nd street in New York City reducedthe amount of congestion in the area.

In 2008 Youn, Gastner and Jeong demonstrated specificroutes in Boston, New York City and London where thismight actually occur and pointed out roads that could beclosed to reduce predicted travel times.

Teoria Gier i Optymalne Wykorzystanie Wspolnych Zasobow – p. 35/40

Cena Stabilno sci

Definicja

CS: koszty społeczne najlepszej równowagi Nashaspołeczne optimum

Pytanie: Ile wynosi CS dla gier sieciowych?

Teoria Gier i Optymalne Wykorzystanie Wspolnych Zasobow – p. 36/40

Przykład

B

x

n

A

n - (parzysta) ilosc graczy.x - ilosc kierowców na dolnej drodze.

Dwie równowagi Nasha1/(n − 1), z kosztem społecznym n + (n − 1)2.0/n, z kosztem społecznym n2.

Społeczne optimumWezmy f(x) = x · x + (n − x) · n = x2 − n · x + n2.Chcemy znalezc minimum f .f ′(x) = 2x − n, wiec f ′(x) = 0 jesli x = n

2 .Teoria Gier i Optymalne Wykorzystanie Wspolnych Zasobow – p. 37/40

Przykład

B

x

n

A

Najlepsza równowaga Nasha1/(n − 1), z kosztem społecznym n + (n − 1)2.

Społeczne optimumf(x) = x2 − n · x + n2.Społeczne optimum = f(n

2 ) = 34n2.

CS = (n + (n − 1)2)/34n2 = 4

3n+(n−1)2

n2 .

limn→∞ CS = 43 .

Teoria Gier i Optymalne Wykorzystanie Wspolnych Zasobow – p. 38/40

Cena Stabilno sci

Twierdzenie (Roughgarden i Tárdos, 2002)Załózmy, ze funkcje opóznien sa liniowe (n.p. T/100).Wówczas CS gier sieciowych jest ≤ 4

3 .

Dobra równowage Nasha mozna osiagnac przy uzyciudynamiki najlepszej odpowiedzi (best response dynamics).

Niestety: czas niezbedny do osiagniecia równowagi mozebyc bardzo długi – jest wykładnicza funkcja liczby strategii.

Teoria Gier i Optymalne Wykorzystanie Wspolnych Zasobow – p. 39/40

Referencje

T. Roughgarden and E. Tardos, How bad is selfish routing?,Journal of the ACM, 49(2), pp. 236–259, 2002.

Modeling Network Traffic using Game Theory.(Rozdział 8 z D. Easley and J. Kleinberg,Networks, Crowds, and Markets:Reasoning About a Highly Connected World.Cambridge University Press, 2010. )www.cs.cornell.edu/home/kleinber/networks-book

Teoria Gier i Optymalne Wykorzystanie Wspolnych Zasobow – p. 40/40

Recommended