Emina Luli c - Odjel Za Matematikumdjumic/uploads/diplomski/LUL02.pdfTeorija igara je suvremena matemati cka disciplina ciji razvoj zapo cinje u 18. i 19. stolje cu. Antoine Augustin

Sveuciliste J.J. Strossmayera u Osijeku

Odjel za matematiku

Sveucilisni diplomski studij matematike

Poslovna i financijska matematika

Emina Lulic

Nasheva ravnoteza u kombiniranim strategijama

Diplomski rad

Osijek, 2011.

Sveuciliste J.J. Strossmayera u Osijeku

Odjel za matematiku

Sveucilisni diplomski studij matematike

Poslovna i financijska matematika

Emina Lulic


Diplomski rad

Voditelj: Doc. dr. sc. Kristian Sabo

Osijek, 2011.

Sadrzaj

Uvod 1

1. Povijesni razvoj teorije igara 3

2. Osnovni pojmovi teorije igara 4

2.1. Pravila igre........................................................................................................ 4

2.2. Ravnoteza.......................................................................................................... 5

3. Modeli igre 5

3.1. Ekstenzivan model............................................................................................. 5

3.2. Strategijski ili normalan model.......................................................................... 6

3.3. Kooperativni model........................................................................................... 8

4. Koncepti ravnoteze 8

4.1. Dominantne strategije....................................................................................... 8

4.1.1. Dilema zatvorenika..................................................................................... 9

4.1.2. Kooperativne i nekooperativne igre........................................................... 10

4.2. Iterirana dominacija.......................................................................................... 11

4.2.1. Bitka na jezeru Bismarck........................................................................... 11

4.3. Nasheva ravnoteza............................................................................................. 15

4.3.1. Zatvorene svinje......................................................................................... 15

4.3.2. Dilema modelatora..................................................................................... 16

4.3.3. Bitka spolova.............................................................................................. 17

5. Teoremi o fiksnoj tocki 18

5.1. Topoloski prostori.............................................................................................. 18

5.2. Banachov teorem o fiksnoj tocki........................................................................ 21

5.3. Brouwerov teorem o fiksnoj tocki....................................................................... 22

6. Kakutanijev teorem o fiksnoj tocki 24

7. Nashev teorem 30

7.1. Kombinirane strategije....................................................................................... 30

7.2. Veza najboljeg odgovora..................................................................................... 30

Literatura 33

Sazetak 34

Summary 35

Zivotopis 36

1

Uvod

U prvom dijelu rada dan je kratak Povijesni razvoj teorije igara. Teorija igara je suvremena

matematicka disciplina ciji razvoj zapocinje u 18. i 19. stoljecu. Antoine Augustin Cournot,

Francis Ysidro Edgeworth i Emile Borel svojim su radom postavili temelje moderne teorije

igara. Njezin razvoj tekao je paralelno s razvojem moderne ekonomije, u kojoj teorija igara

ima brojne primjene. U 20. stoljecu javljaju se najznacajnija imena ove discipline, a to su

John von Neumann i Oskar Morgenstern, cija knjiga Theory of Games and Economic Behavior

predstavlja pocetak analize moderne teorije igara, a proucava problematiku koncepta ravnoteze

u igrama. Toj problematici pozornost je pridavao i americki matematicar John Nash, cije ime

danas povezujemo s dva najznacajnija koncepta u teoriji igara, a to su Nashevo pogodbeno

rjesenje i Nasheva ravnoteza.

U drugom poglavlju Osnovni pojmovi teorije igara definiraju se elementi igre i pravila igre.

Svaka igra ima skup igraca koji sudjeluju u igri, a svaki igrac ima na raspolaganju set strategija.

Svaka situacija u igri donosi pojedinom igracu odredenu korisnost koja je definirana funkcijom

korisnosti igraca. Matematickim modeliranjem igre predvida se ishod igre, koji predstavlja

skup korisnosti pridruzenih svakom igracu po zavrsetku igre. Cilj modeliranja igre je pronaci

ravnotezu, odnosno kombinaciju strategija koja sadrzi najbolju strategiju za svakog od igraca

u igri.

Sljedece poglavlje Modeli igri opisuje tri osnovna modela, odnosno prikaza igre. Eksten-

zivan model promatra redoslijed igre i prikazuje taj redoslijed u obliku grafa koji nazivamo

stablo igre. Strategijski ili normalan model igre stavlja teziste na strategije igraca u igri i

prikazuje igru u obliku tablice, odnosno matrice igre. Kooperativni model promatra igru u

kojoj igraci medusobno komuniciraju, pregovaraju i suraduju jedni s drugima pri donosenju

odluka, odnosno odabiru strategija u igri.

U poglavlju Koncepti ravnoteze opisana su tri koncepta ravnoteze: ravnoteza dominantne

strategije, iterirana dominacija i Nasheva ravnoteza, najpoznatiji i najcesce upotrebljeni kon-

cept ravnoteze u teoriji igara. Dilema zatvorenika je primjer igre u kojoj je ilustriran koncept

ravnoteze dominantne strategije, dok bitka na jezeru Bismarck ilustrira koncept ravnoteze iteri-

rane dominacije. Nasheva ravnoteza opisana je kroz tri primjera: Zatvorene svinje, Dilema

modelatora i Bitka spolova. Sve igre opisane u ovom dijelu pronalaze brojne primjene u

ekonomskim situacijama iz stvarnog zivota.

Teoremi o fiksnoj tocki predstavljaju vazan alat u dokazivanju osnovnih teorema teorije

igara. U ovom poglavlju dane su definicije osnovnih topoloskih prostora i navedena neka

svojstva funkcija u tim prostorima. Iskazan je i dokazan Banachov teorem o fiksnoj tocki, koji

dokazuje postojanje fiksne tocke kontrakcije. Definiran je pojam simplexa te iskazan i dokazan

2

Brouwerov teorem o fiksnoj tocki.

Kakutanijev teorem o fiksnoj tocki cini sredisnji dio dokaza Nashevog teorema o postojanju

ravnoteze u nekooperativnim igrama. U ovom poglavlju definira se veza, postupak koji pres-

likava tocku u skup tocaka, i pojam neprekidnosti veze. Navedeni su teoremi koji prethode

Kakutanijevom teoremu u razvoju ove teorije te je iskazan i dokazan sam Kakutanijev teorem

o fiksnoj tocki.

U posljednjem poglavlju rada Nashev teorem definiran je pojam kombiniranih strategija i

veza najboljeg odgovora. Profil strategija je prema tome Nasheva ravnoteza ako je on fiksna

tocka veze najboljeg odgovora za cijelu igru. Na samom kraju iskazan je Nashev teorem koji

dokazuje da svaka igra sa konacno mnogo igraca ima Nashevu ravnotezu u kombiniranim

strategijama.

3

1. Povijesni razvoj teorije igara

Ideje na kojima pociva matematicka disciplina teorije igara javljaju se vec u ranoj povijesti.

Neke od tih ideja mogu se pronaci u Bibliji i Talmudu, potom u radovima Descartesa i Sun

Tzua, a kasnije u zapisima Charlesa Darwina.

Osnove moderne teorije igara proizlaze iz tri rada napisana u 18., odnosno 19. stoljecu. Prvi

rad napisao je francuski ekonomist Antoine Augustin Cournot. On je 1838. godine objavio

Researches into the Mathematical Principles of the Theory of Wealth, djelo u kojem je dao

intuitivno objasnjenje necega sto ce kasnije biti poznato kao Nasheva ravnoteza. Osim toga,

Cournot je predstavio koncept monopola, oligopola i savrsene konkurencije. U demonstraciji

ravnoteze u oligopolskoj igri, Cournot je uveo model ”best-reply” dynamics, u kojem svaki

proizvodac proizvodi kolicinu koja maksimizira njegov profit u odnosu na ukupni proizvod

proizveden u cijeloj industriji u prethodnom razdoblju.

Irski ekonomist, pravnik, matematicar i statisticar Francis Ysidro Edgeworth svojim je

radom uvelike doprinuo razvoju moderne teorije igara. U svom radu Mathematical Psychics,

objavljenom 1881. godine, objasnio je pojam konkurentske ravnoteze u trzisnoj ekonomiji.

Uocio je kako mnoge trzisne igre dopustaju vise rjesenja, ali da se broj rjesenja smanjuje s

rastom velicine trzista.

Francuski matematicar i politicar Emile Borel prvi je definirao pojam strategijskih igara.

Objavio je nekoliko radova o igri poker, u kojima je promatrao vaznost nesavrsenih informacija

i kredibiliteta igraca u igri. Borel je, proucavajuci teoriju mjere i vjerojatnost, sugerirao

postojanje kombiniranih strategija, odnosno vjerojatnosnih distrubicija strategija pojedinog

igraca.

Americki matematicar madarskog podrijetla John von Neumann je 1928. godine dao

dokaz minimax teorema. On je, zajedno s njemackim ekonomistom Oskarom Morgenster-

nom, postavio korijene analize moderne teorije igara u knjizi Theory of Games and Economic

Behavior, objavljenoj 1944. godine. Njhova knjiga stavila je fokus na koncepte ravnoteze u

igrama.

Sljedeci znacajan korak u razvoju ove discipline napravio je John Nash, americki matematicar

cije ime danas povezujemo s dva najznacajnija koncepta u teoriji igara, a to su Nashevo pogod-

beno rjesenje i Nasheva ravnoteza, koncept ravnoteze koji proucavamo u ovom radu. On je

u svom radu objavljenom 1950. godine uveo novi koncept ravnoteze i dokazao postojanje te

ravnoteze u svim konacnim igrama. John Nash, John Harsanyi i Reinhard Selten su 1994.

godine dobili Nobelovu nagradu za ekonomiju, kao priznanje njihovom doprinosu u analizi

ravnoteze u nekooperativnim igrama.

4

2. Osnovni pojmovi teorije igara

2.1. Pravila igre

Teorija igara je grana matematike koja se bavi matematickim modeliranjem problema donosenja

optimalnog rjesenja, odnosno odluke, u odredenoj situaciji pod odredenim uvjetima. Svaka

igra ima definiran skup igraca koji sudjeluju u igri. Svaki igrac u igri ima na raspolaganju skup

mogucih odluka, odnosno set strategija. Igrac odabirom strategije zeli maksimizirati svoju ko-

risnost. Kada svaki od igraca odabere svoju strategiju, imamo odredenu situaciju u igri. Skup

svih mogucih situacija zove se prostor strategija. U igri svaki igrac ima definiranu funkciju

korisnosti, koja svakoj situaciji u igri pridruzuje odredenu vrijednost, odnosno korisnost koju

ta situacija donosi igracu. Igraci donose odluke na temelju informacija koje posjeduju. Skup

informacija odredenog igraca predstavlja njegovo znanje o vrijednostima razlicitih varijabli u

odredenom trenutku. Informacije koje igraci posjeduju i akcije koje poduzimaju cine redoslijed

igre.

Svrha matematickog modeliranja igre je objasniti kako dani skup okolnosti dovodi do

odredenog rezultata. Taj rezultat zove se ishod igre i on predstavlja skup vrijednosti, odnosno

korisnosti pridruzenih svakom igracu nakon zavrsetka igre.

Ponekad je korisno u model igre ukljuciti i tzv. pseudo - igrace, cije su odluke u potpunosti

izvan utjecaja drugih igraca u igri. U poslovnim igrama pseudo - igrac je okolina u kojoj

se odredena igra odvija. Okolina donosi slucajne odluke na odredenom mjestu u igri i s

odredenom vjerojatnoscu. Razlicite realizacije u igri ovise o rezultatima slucajnih poteza.

Skup igraca koji sudjeluju igri oznacavamo sa I = {1, 2, ..., n}.Akcija ili potez igraca i ∈ I, oznacena s ai, predstavlja odluku, odnosno izbor koji on

donosi. Skup mogucih poteza igraca i je skup Ai = {ai}. Kombinacija poteza u igri je uredeni

skup akcija a = (ai), i = 1, ..., n svih n igraca u igri.

Korisnost πi(s1, ..., sn) igraca i je:

i) korisnost koju igrac i ostvaruje nakon sto svi igraci i okolina izaberu svoje strategije i igra

zavrsi, ili

ii) ocekivana korisnost igraca i kao funkcija njegove i strategija ostalih igraca u igri.

O kojoj se korisnosti radi, stvarnoj ili ocekivanoj, moze se zakljuciti iz konteksta odredene

situacije.

Strategija si igraca i je pravilo po kojem on donosi odluke, odnosno povlaci poteze u svakom

trenutku igre, na temelju danog skupa informacija. Svaki igrac i ∈ I ima na raspolaganju

konacan skup cistih strategija Si = {1, 2, ...,mi}, mi ≥ 2. Vektor s = (s1, s2, ..., sn) predstavlja

jednu kombinaciju strategija svih n igraca i zove se profil cistih strategija. Skup svih mogucih

profila cistih strategija je Kartezijev produkt

S =∏i∈I

Si = S1 × S2 × · · · × Sn.

5

Skup S zovemo prostor cistih strategija. Svaki profil strategija s ∈ S odreduje jedan ishod igre,

odnosno korisnost za svakog igraca i ∈ I. Dakle, svakom igracu je pridruzena njegova funkcija

korisnosti πi : S → R. Za svaki strategijski profil s ∈ S postoji i kombinirana funkcija korisnosti

cijele igre π : S → Rn definirana sa π(s) = (π1(s), π2(s), ..., πn(s)), gdje je πi, i = 1, ..., n

funkcija korisnosti i-tog igraca.

2.2. Ravnoteza

Predvidanje ishoda igre sastoji se od odabira jedne ili vise kombinacija strategija koje pred-

stavljaju racionalan izbor igraca u svrhu postizanja maksimalne korisnosti.

Ravnoteza s∗ = (s∗1, ..., s∗n) je kombinacija strategija koja sadrzi najbolju strategiju za

svakog od n igraca u igri. Ravnotezne strategije su strategije koje igraci odabiru s ciljem

maksimiziranja njihove korisnosti u igri.

Kako bi pronasao ravnotezu, modelator igre mora definirati pravilo temeljem kojeg odlucuje

sto je ”najbolja strategija” u igri. To pravilo zove se koncept ravnoteze.

Koncept ravnoteze ili koncept rjesenja F : {S1, ..., Sn, π1, ..., πn} → s∗ je pravilo koje

definira ravnotezu igre na temelju mogucih kombinacija strategija i funkcija korisnosti svih n

igraca u igri.

Poznato je vise koncepata ravnoteze, no samo su neki od njih generalno prihvaceni. U

nastavku rada su kroz primjere objasnjeni koncepti ravnoteze dominantne strategije i iterirane

dominacije, dok je naglasak stavljen na Nashevu ravnotezu, najpoznatiji i najcesce koristen

koncept ravnoteze u teoriji igara.

3. Modeli igre

Teorija igara razlikuje tri osnovna modela igre:

1. ekstenzivan model;

2. strategijski ili normalan model;

3. kooperativni model.

3.1. Ekstenzivan model

Promotrimo jednostavnu igru s dva igraca: Igrac 1 i Igrac 2. Igrac 1 prvi povlaci potez i

vrsi izbor izmedu dvije alternative. Nakon sto Igrac 1 odigra svoj potez, na redu je Igrac 2,

ali pritom pretpostavljamo da on ne zna koji je potez povukao Igrac 1. Igrac 2 takoder ima

ponudene dvije alternative i vrsi izbor izmedu njih. Kada su oba igraca povukla poteze, igra

je gotova i, ovisno o svom izboru, igraci ostvaruju odredenu korisnost.

Redoslijed igre mozemo prikazati u obliku grafa koji zovemo stablo igre.

6

Igrac 1t��

��

��

��

��

�

ZZZZZZZZZZZZZZ

1 2

t tIgrac 2 Igrac 2ZZZZZZ

��

��

1 2 1 2

(5,6) (-3,10) (10,-2) (-2,-1)

Slika 1. Stablo igre

Slika 1 prikazuje stablo ove igre. Svaki cvor u stablu je oznacen imenom igraca kojeg

predstavlja. Na prvoj razini stabla imamo jedan cvor koji predstavlja Igraca 1. Bridovi koji

izlaze iz tog cvora oznaceni su brojevima 1 i 2 i predstavljaju dvije alternative izmedu kojih

Igrac 1 vrsi izbor. Na drugoj razini stabla oba cvora nose oznaku Igrac 2 i smjestena su u

jednoj elipsi cime zelimo naglasiti da pripadaju istom skupu informacija. Ta cinjenica upucuje

na to da Igrac 2 ne zna koji je potez povukao Igrac 1.

U ovoj igri moguca su cetiri razlicita ishoda. Korisnosti koje proizlaze iz tih ishoda dane su

u obliku uredenih parova na kraju svake zavrsne grane. U svakom paru prvi clan predstavlja

korisnost Igraca 1, a drugi korisnost Igraca 2 po zavrsetku igre.

U teoriji igre poput saha, pokera ili cak poslovne igre mogu se prikazati ovim modelom

igre.

3.2. Strategijski ili normalan model

Najcesci oblik prikaza igre je tzv. matrica igre. Igra koju smo prikazali pomocu stabla igre na

Slici 1. moze se predstaviti u obliku matrice kao na Slici 2.

Strategije igraca 2

1 2

Strategije Igraca 112

5, 6 -3, 1110, -2 -2, -1

Slika 2. Matrica igre

Igra je prikazana u obliku matrice 2×2. Brojevi u celijama predstavljaju korisnosti Igraca

1 i Igraca 2, redom, sto je rezultat kombinacije njihovih izbora.

Promatrajuci stablo i matricu igre u ovom primjeru ne mozemo uociti razliku izmedu

poteza, odnosno akcije, i strategije igraca. Kako bismo uvidjeli tu razliku, razmotrimo igru u

7

kojoj Igrac 2 posjeduje informaciju o prethodno odigranom potezu Igraca 1. U ovom slucaju

Igrac 2 raspolaze s vise informacija. Cvorovi na drugoj razini stabla sada ne pripadaju is-

tom skupu informacija. Svaki cvor koji pripada Igracu 2 nalazi se unutar posebnog skupa

informacija, koji su prikazani u obliku kruznica na Slici 3.

Igrac 1t��

��

��

��

��

�

ZZZZZZZZZZZZZZ

1 2

t tIgrac 2 Igrac 2ZZZZZZ

��

��

&%'$

&%'$

1 2 1 2

(5,6) (-3,10) (10,-2) (-2,-1)

Slika 3. Stablo igre u kojoj Igrac 2 posjeduje informaciju o izboru strategije Igraca 1

Posjedovanje dodatne informacije o izboru Igraca 1 udvostrucilo je broj strategija koje su

na raspolaganju Igracu 2. On sada bira izmedu cetiri strategije:

1. strategija: ako Igrac 1 odigra potez 1, biraj 1; ako Igrac 1 odigra potez 2, biraj 1.




Ovu igru mozemo prikazati u obliku matrice, tj. kao strategijski ili normalan model igre.

Strategije Igraca 2

(1→ 1; 2→ 1) (1→ 1; 2→ 2) (1→ 2; 2→ 1) (1→ 2; 2→ 2)

Strategije 1

Igraca 1 25, 6 5, 6 -3, 11 -3, 1110, -2 -2,-1 10,-2 -2,-1

Slika 4. Matrica igre u kojoj Igrac 2 posjeduje informaciju o izboru strategije Igraca 1

Strategiju igraca mozemo shvatiti kao plan koji pokriva sve moguce ishode igre na osnovu

informacija dostupnih igracu u odredenom trenutku. U igri kao sto je poker, postoje milijuni

i milijuni strategija dostupnih igracu. Medutim, u stvarnom zivotu ljudi igraju poker kom-

binirajuci vise strategija prema razlicitim pravilima. Stoga modeliranje igre kao sto je poker

predstavlja ogroman posao za teoreticare ove matematicke discipline, jer moraju posvetiti

pozornost svakom pravilu koje igraci uzimaju u obzir u igri.

U prvom primjeru igra je imala dva igraca od kojih je svaki imao dvije strategije na

raspolaganju, no ovaj model igre moze se primijeniti na bilo koji broj igraca s bilo kojim

brojem strategija na raspolaganju.

8

Primjer 3.1 Na Slici 5. dan je matricni zapis igre s tri igraca od kojih svaki vrsi izbor izmedu

dvije alternative.

Strategije igraca 2

1 2


10, 10, 10 -1, -1, -1-1, -1, -1 5, 5, 5

Matrica 1

Strategije Igraca 3 ��7

-

Strategije igraca 2

1 2


10, 10, 10 -1, -1, -1-1, -1, -1 5, 5, 5

Matrica 2

Slika 5. Strategijski model igre s tri igraca

Strategijski model igre s tri igraca u kojem svaki igrac ima dvije opcije na raspolaganju

mozemo prikazati pomocu dvije matrice kao na Slici 3. Brojevi u celijama matrica predstavl-

jaju korisnosti prvog, drugog i treceg igraca, redom. Izbor strategije Igraca 1 znaci odabir

prvog ili drugog retka matrice. Strategija Igraca 2 predstavljena je stupcima matrice, a Igrac

3 izbor svoje strategije prikazuje odabirom Matrice 1 ili Matrice 2.

3.3. Kooperativni model

Pretpostavimo da nas ne zanima strategija pojedinog igraca, vec promatramo odnos igraca

u igri. Svi igraci iznose svoje razloge, raspravljaju i pregovaraju ili suraduju jedni s drugima

otkrivajuci svoje namjere o sljedecem potezu te odlucuju kako ce podijeliti korisnosti. Pojedini

igrac ili grupa igraca moze kao argument u pregovaranju ili prijetnju iskoristiti cinjenicu o

povecanju svoje osobne koristi u slucaju odbacivanja suradnje s ostalim igracima.

Dobitak ili zarada stecena u nekoj koaliciji igraca moze se predstaviti ocekivanjem skupa

funkcija koje zovemo karakteristicne funkcije igre. Pojam skup funkcija ovdje znaci da imamo

funkcije definirane za cijeli skup igraca u igri.

4. Koncepti ravnoteze

4.1. Dominantne strategije

Za bilo koji vektor y = (y1, ..., yn) sa y−i oznacavamo vektor (y1, ..., yi−1, yi+1, ..., yn). Za taj

dio vektora y kazemo da nije povezan s igracem i.

9

Upotrebljavajuci ovako definiranu notaciju, vektor s−i predstavlja kombinaciju strategija

svih igraca osim i-tog igraca. Ta kombinacija strategija je od velike vaznosti za igraca i, jer

on na osnovu nje izabire svoju strategiju.

Definicija 4.1 Najbolji odgovor igraca i na kombinaciju strategija s−i je strategija s∗i koja

mu donosi najvecu korisnost, odnosno za koju vrijedi

πi(s∗i , s−i) ≥ πi(si, s−i),∀si 6= s∗i .

Najbolji odgovor je strogo najbolji ukoliko nijedna druga strategija ne donosi toliko dobiti

kao strategija s∗i , inace je slabo najbolji.

Definicija 4.2 Strategija s∗i je dominantna strategija ukoliko je ona najbolji odgovor na

bilo koju kombinaciju strategija ostalih igraca, tj. ukoliko vrijedi

πi(s∗i , s−i) ≥ πi(si, s−i),∀s−i,∀si 6= s∗i .

Strategije podredene ovoj strategiji zovu se dominirane strategije. Ravnoteza domi-

nantne strategije je kombinacija strategija sastavljena od dominantnih strategija svakog

igraca.

Dominantna strategija igraca predstavlja njegov najbolji odgovor i na gotovo nemoguce i

nevjerojatne poteze ostalih igraca. Najveci broj igara nema dominantne strategije. U njima

igraci moraju predvidjeti poteze ostalih igraca kako bi odigrali svoj potez.

4.1.1. Dilema zatvorenika

(vidi [1], [2])

Dilema zatvorenika je poznati primjer igre koji ilustrira koncept ravnoteze dominantne

strategije. U ovoj igri sudjeluju dva zatvorenika, Zatvorenik 1 i Zatvorenik 2, koje istrazitelj

ispituje u odvojenim prostorijama. Ako obojica priznaju zlocin, svaki je osuden na sest go-

dina zatvora. Ako obojica poreknu svoju upletenost u zlocin, tada ce s vjerojatnoscu 0.1

ipak biti osudeni na 10 godina zatvora. Stoga je ocekivana korisnost u ovom slucaju -1 za

svakog zatvorenika. Ako samo jedan od zatvorenika prizna krivnju, bit ce pusten, ali ce drugi

zatvorenik u tom slucaju biti osuden na 10 godina zatvora. Svaki od igraca ima na raspola-

ganju dva poteza: priznati ili poreci krivnju.

Zatvorenik 2

Poricanje Priznanje

Zatvorenik 1PoricanjePriznanje

-1, -1 -10, 00, -10 -6, -6

Slika 6. Dilema zatvorenika

10

Svaki igrac u ovoj igri ima dominantnu strategiju. Zatvorenik 1 ne zna koji je potez odigrao

Zatvorenik 2. Medutim, u slucaju da je Zatvorenik 2 porekao krivnju, Zatovrenik 1 moze poreci

krivnju s ocekivanom korisnoscu -1 ili priznati krivnju s korisnoscu 0. U slucaju da Zatvorenik

2 prizna krivnju, Zatvorenik 1 moze poreci krivnju s ocekivanom korisnoscu -10 ili priznati

krivnju s korisnoscu -5. U oba slucaja, priznanje krivnje obecava vecu korisnost Zatvoreniku 1.

Buduci je igra simetricna, zakljucak je isti za Zatvorenika 2. Ravnoteza dominantne strategije

je (Priznanje, Priznanje), a ravnotezne korisnosti su (−6,−6), sto je losiji ishod za oba

igraca nego slucaj (−1,−1), jer je 12 najveci moguci zbroj godina zatvora na koje zatvorenici

mogu biti osudeni.

Ravnoteza dominantne strategije je snazan rezultat koji je robustan na bitne promjene

modela. Rezultat ostaje isti cak i u slucaju promjene skupa informacija. Na primjer, ako

Zatvorenik 2 zna je li Zatvorenik 1 priznao krivnju ili ne, ravnoteza se ne mijenja. Zatvorenik

2 ce u oba slucaja priznati krivnju, a Zatvorenik 1 takoder priznaje krivnju znajuci da ce

Zatvorenik 2 to isto uciniti nakon njega.

Dilema zatvorenika je model igre koji se moze primijeniti u mnogim stvarnim situacijama:

definiranje cijena u uvjetima oligopola, postizanje odredene cijene na drazbama, pokusaji

prodaje, politicko nadmetanje i rat vrsta. Uvijek kada promatramo igru pojedinaca u kojoj

oba mogu stradati, najbolji model kojim mozemo predvidjeti ishod igre i pronaci ravnotezu u

igri je model dileme zatvorenika.

4.1.2. Kooperativne i nekooperativne igre

U prethodnom dijelu promatrali smo igru u kojoj dva zatvorenika donose odluke neovisno

jedan od drugoga, nalazeci se u odvojenim prostorijama i ne znajuci koju je odluku donio

drugi igrac. Pitanje je mijenja li se ishod igre ako se zatvorenici dogovore o svojim iskazima

prije ispitivanja. To ovisi o snazi njihovih obecanja. Ako ih obecanja ne vezu, oba zatvorenika

ce priznati krivnju, mada su se netom prije dogovorili o zajednickom poricanju krivnje.

Definicija 4.3 Kooperativna igra je igra u kojoj igraci mogu sklopiti obvezujuci dogovor.

Nekooperativna igra je igra u kojoj nema mogucnosti sklapanja takvog dogovora.

Teorija kooperativnih igara je aksiomatska teorija koja stavlja fokus na ishod igre i njegove

posljedice, ne obazirujuci se pritom na strategije koje prethode tom ishodu igre. U primjen-

jenoj ekonomija teorija kooperativnih igara pronalazi svoje mjesto u modeliranju pregovora i

pogodbi.

Dilema zatvorenika je primjer nekooperativne igre. Medutim, ova igra se moze modelirati i

kao koperativna igra, ako dozvolimo zatvorenicima skalapanje obvezujuceg dogovora. Kooper-

ativne igre cesto dopustaju igracima podjelu zarade iz kooperacije na osnovu tzv. marginalnih

isplata - transfera izmedu igraca koji mijenjaju pretpostavljene korisnosti.

11

Razlika izmedu kooperativne i nekooperativne igre nije sukob ili odutnost sukoba u igri.

Sukob moze biti prisutan u modeliranju obje igre.

Primjer 4.1 i) Kooperativna igra bez sukoba: Svaki radnik postrojenja bira jedan zadatak

koji ce preuzeti na sebe. Svi zadaci su jednake tezine, a radnici ih biraju tako da zajednickim

radom, odnosno strategijom, ostvare najbolji moguci ucinak.

ii) Kooperativna igra sa sukobom: Pregovaranje oko cijene izmedu ponudaca i kupca u uvje-

tima monopola i monopsona (jedan ponudac i jedan kupac).

iii) Nekooperativna igra sa sukobom: Dilema zatvorenika.

iv) Nekooperativna igra bez sukoba: Dvije farmaceutske tvrtke koje prodaju isti lijek, a

medusobno ne komuniciraju.

4.2. Iterirana dominacija

U prethodnom dijelu naglasili smo da se ravnoteza dominantne strategije postize u malom

broju igara. Medutim, dominacija moze biti korisna i u slucaju kada ishodi igre nisu kristalno

jasni kao sto su u dilemi zatvorenika.

4.2.1. Bitka na jezeru Bismarck

(vidi [2])

Bitka na jezeru Bismarck vodena je 1943. godine na Juznom Pacifiku. Japanski general

Imamura imao je zadatak prevesti japanske trupe preko jezera Bismarck u Novu Gvineju. S

druge strane, general Kenney imao je namjeru bombardirati te trupe. General Imamura imao

je na raspolaganju dvije rute; kracu sjevernu ili duzu juznu rutu do Nove Gvineje. General

Kenney morao je odluciti na koju ce stranu poslati svoje zrakoplove da nadu i bombardiraju

Japance. Naravno da je general Kenney mogao opozvati svoje bombardere ako nije pogodio

rutu kojom su isli vojnici generala Imamure, ali u tom slucaju Kenney bi izgubio dragocjeno

vrijeme za bombardiranje japanskih trupa.

Igraci u ovoj igri su general Kenney i general Imamura. Oba igraca imaju isti skup mogucih

poteza: {Sjever, Jug}, ali njihove korisnosti nisu iste ni u jednom slucaju. U svakom slucaju

general Imamura gubi tocno onoliko koliko general Kenney dobiva.

Imamura

Sjever Jug

KenneySjever

Jug

2, -2 ↔ 2, -2↑ ↓

1, -1 ← 3, -3

Slika 7. Bitka na jezeru Bismarck

12

U ovoj igri nijedan igrac nema dominantnu strategiju. General Kenney ce izabrati Sjever

ako smatra da ce Imamura takoder odabrati Sjever. Medutim, ako Kenney misli da ce

Imamura izabrati Jug, Kenney u tom slucaju takoder odabire Jug. S druge strane, general

Imamura ce odabrati Sjever ako smatra da ce Kenney poci na Jug. U suprotnom, ako smatra

da ce Kenney poci na Sjever, Imamura je indiferentan u odabiru akcije. Odabir svakog potezu

ovisnosti o odluci drugog igraca, prikazuju strelice na gornjoj shemi. No, i u ovoj igri moguce

je postici ravnotezu, upotrebljavajuci koncept slabe dominacije.

Definicija 4.4 Strategija s′i je slabo dominirana ako postoji neka druga strategija s′′i koja u

svim situacijama igre nije losija od strategije s′i, a u nekim situacijama donosi vecu korisnost

igracu od strategije s′i. Preciznije, strategija s′i je slabo dominirana ako postoji strategija s′′itakva da vrijedi:

πi(s′′i , s−i) ≥ πi(s

′i, s−i), ∀s−i,

πi(s′′i , s−i) > πi(s

′i, s−i), za neki s−i.

Definicija 4.5 Ravnoteza slabo dominirane strategije je kombinacija strategija nastala

brisanjem svih slabo dominiranih strategija svakog igraca u igri.

Eliminiranje slabo dominiranih strategija nije korisno u slucaju ove igre. Strategija Jug je

slabo dominirana strategija za generala Imamuru jer korisnosti strategije Sjever nikada nisu

manje od onih za strategiju Jug, a u slucaju da Kenney izabere Jug, Sjever donosi vecu

korisnost Imamuri. Za Kenneya nijedna strategija nije slabo dominirana. Stoga nije moguce

pronaci ravnotezu slabo dominirane strategije u ovoj igri.

Definicija 4.6 Ravnoteza iterirane dominacije je kombinacija strategija nastala brisan-

jem slabo dominirane strategije iz skupa strategija jednog igraca, zatim trazenjem preostalih

slabo dominiranih strategija, brisanjem jedne od njih, nastavljajuci taj postupak sve dok svakom

igracu ne ostane samo jedna strategija na raspolaganju.

Ovaj koncept ravnoteze moze se primijeniti na igru koja predstavlja bitku na jezeru Bis-

marck. Prema ovom konceptu ravnoteze, general Kenney zna da ce Imamura izabrati strate-

giju Sjever, jer je to za Imamuru slabo dominantna strategija. Stoga Kenney moze eliminirati

potez ”Imamura izabire Jug”. Brisanjem drugog stupca u tablici 3, Kenney ima na raspo-

laganju jako dominantnu strategiju: on se odlucuje za Sjever, jer je to strategija koja mu

donosi strogo vecu korisnost od strategije Jug. Kombinacija strategija (Sjever, Sjever) je

ravnoteza iterirane dominacije u ovoj igri, a upravo je takav ishod imala i stvarna bitka na

jezeru Bismarck koja se odigrala 1943. g.

Zanimljivo je promatrati ishod ove igre ako promijenimo redoslijed igre ili strukturu skupa

informacija u igri. Ako general Kenney igra prvi, kombinacija strategija (Sjever, Sjever)

13

ostaje ravnoteza u igri, medutim, kombinacija (Sjever, Jug) postaje takoder ravnoteza. Ko-

risnosti su jednake za obje ravnoteze, ali su ishodi igre drugaciji.

Ako Imamura igra prvi, onda je (Sjever, Sjever) jedina ravnoteza u igri. Ono sto je vazno

uociti ovdje je da igrac koji igra prvi daje drugom igracu na raspolaganje vise informacija prije

nego sto drugi igrac povuce svoj potez. Tocno vrijeme poteza je manje vazno. Ako general

Kenney ”probije” japanski kod i sazna Imamurin plan, nije bitno hoce li igraci povuci svoje

poteze u isto vrijeme. U tom slucaju, igru shvacamo kao slijed poteza. Dakle, bez obzira na

to hoce li general Imamura prvi povuci potez ili ce Kenney razbiti japanski kod, Kenneyev

skup informacija bit ce {Imamura je krenuo na Sjever} ili {Imamura je krenuo na Jug},nakon Imamurine odluke. Stoga ce Kenneyeva strategija ravnoteze biti definirana na sljedeci

nacin: (Sjever ako Imamura izabere Sjever, Jug ako Imamura izabere Jug).

U ekonomskim modelima, tvrtke i pojedinci su cesto indiferentni prema njihovom ponasanju

u ravnotezi. U modelima savrsenog natjecanja, dobit koju tvrtke ostvaruju jednaka je nuli.

Medutim, cinjenica jest da neke tvrtke ostaju na trzistu, dok se druge povlace iz natjecanja. U

modelu monopola, ako monoplist zna da je kupac voljan platiti 100 kn vise za njegov proizvod,

on ce podici cijenu tog proizvoda za tocno 100 kn . Kupac je tada indiferentan u odluci kupnje

ili odustajanja od kupnje proizvoda, a ravnoteza je postignuta tek kada kupac kupi proizvod.

Problem koji takoder promatramo je pojavljivanje visestruke ravnoteze u igri. Ravnoteza

dominantne strategije u bilo kojoj igri je jedinstvena, ako postoji. Svaki igrac ima najvise jednu

strategiju cije su korisnosti u bilo kojoj kombinaciji strategija vece od bilo koje druge strategije

koju taj igrac ima na raspolaganju. Stoga dominantne strategije svih igraca mogu razultirati

samo jednom kombinacijom, koja u tom slucaju predstavlja ravnotezu dominantne strategije.

Ravnoteza jako iterirane dominacije je takoder jedinstvena, ako postoji. Ravnoteza slabo

iterirane dominacije ne mora biti jedinstvena, jer redoslijed brisanja strategija ima utjecaj na

konacan ishod igre. Ukoliko se sve slabo dominirane strategije brisu istovremeno, rezultirajuca

kombinacija strategija bit ce jedinstvena ravnoteza. No, moguce je da nakon brisanja slabo

dominiranih strategija ne ostane nijedna kombinacija strategija na raspolaganju.

Primjer 4.2 Igra ”Svicarski sir” (vidi [2])

Ivan

Lijevo Desno

MarkoGore

Dolje

0,0 ↔ 0,0l l

0,0 ↔ 0,0

Slika 8. Igra ”Svicarski sir”

U ovoj igri svaka od strategija je slabo dominirana za svakog igraca. Stoga, jedna ravnoteza

iterirane dominacije je kombinacija strategija (Gore, Lijevo), nastale eliminiranje Markove

14

strategije Dolje i Ivanove strategije Desno. Medutim, kombinacija strategija (Dolje, Desno)

je takoder ravnoteza iterirane dominacije. Naime, u ovoj igri svaka kombinacija strategija

predstavlja ravnotezu slabo dominantne strategije, kao i ravnotezu iterirane dominacije.

Primjer 4.3 Igra ”Ponavljajuci put” (vidi [2])

Stupac

s1 s2 s3

Redakr1r2r3

2, 12 1, 10 1, 120, 12 0, 10 0, 110 ,12 1, 10 0, 13

Slika 9. Igra ”Ponavljajuci put”

Kombinacije strategija (r1, s1) i (r1, s3) su ravnoteze iterirane dominacije, jer su obje

nastale brisanjem slabo dominiranih strategija. Brisanje slabo dominiranih strategija moze ici

u poretku (r3, s3, s2, r2) ili (r2, s2, s1, r3).

Bez obzira na probleme koji se javljaju prilikom trazenja slabo dominantne ravnoteze ili

ravnoteze iterirane dominacije, brisanje slabo dominantnih strategija koristan je alat i javlja

se kao dio mnogo slozenijih koncepata pronalazenja ravnoteze u igrama.

Bitka na jezeru Bismarck predstavlja poseban primjer igre, jer korisnosti igraca u svakoj

kombinaciji strategija u toj igri u zbroju daju nulu. Takva igra zove se zero− sum igra.

Definicija 4.7 Zero-sum igra je igra u kojoj zbroj korisnosti svih igraca u svakoj kombinaciji

strategija iznosi nula. Igra u kojoj taj zbroj nije uvijek nula zove se non-zero-sum igra.

U zero-sum igri ono sto jedan igrac osvoji, drugi mora izgubiti. Bitka na jezeru Bismarck

primjer je zero-sum igre, dok je Dilema zatvorenika primjer non-zero-sum igre. Zero-sum

igre zaokupljale su teoreticare u teoriji igara mnogo godina, no njihovo pojavljivanje u realno

svijetu i ekonomiji je neuobicajeno. Jedan od rijetkih primjera je igra pregovaranja izmedu

dva igraca koji dijele visak zarade. Medutim, i ova igra se danas cesto modelira kao non-zero-

sum igra, u kojoj se visak zarade smanjuje proporcionalno s vremenom koje igraci utrose na

odluku o podjeli zarade. U stvarnosti svaka podjela imovine moze rezultirati gubitkom jednog

njenog dijela. Primjer takvog gubitka je zarada koju si prisvajaju odvjetnici u brakorazvodnim

parnicama.

Iako se primjeri igara navedeni u ovom poglavlju cine smijesnima i jednostavnima, oni se

vrlo cesto koriste u modeliranju ekonomskih situacija. Bitka na jezeru Bismarck je igra koja

moze posluziti kao model korporativnih strategija. Pretpostavimo da su na trzistu konstantne

velicine prisutne dvije tvrtke, Kenney d.o.o. i Imamura d.d., koje zele maksimizirati svoj udio

15

na trzistu izborom izmedu dva proizvoda dizajna Sjever i Jug. Kenney ima marketinsku pred-

nost i zeli izravno natjecanje, dok bi se Imamura radije sam izborio za svoj udio. Ravnoteza je

(Sjever, Sjever), sto znaci da ce obje tvrtke u ovom trzisnom natjecanju odabrati proizvod

Sjever.

4.3. Nashova ravnoteza

Nashova ravnoteza je najvazniji koncept ravnoteze u ekonomiji. Ime je dobio po Johnu Nashu,

matematicaru i ekonomistu koji je uveo taj koncept i, koristeci Kakutanijev teorem o fiksnoj

tocki, dokazao postojanje te ravnoteze u svim konacnim igrama.

4.3.1. Zatvorene svinje

(vidi [2])

Dvije svinje zatvorene su u uskom oboru koji na jednom kraju ima panel, a na drugom

valov za hranu. Kada svinja pritisne panel, taj potez ”kosta” ju dvije jedinice korisnosti. U

tom trenutku, na drugom kraju obora u valov za hranu dospijeva 10 jedinica hrane. Jedna

svinja je ”dominantna” (pretpostavimo da je to velika svinja) i ako ona stigne prva na valov,

druga svinja ce dobiti samo njene ostatke, koji vrijede jednu jedinicu hrane. Ako mala svinja

stigne prva na valov, pojest ce 4 jedinice hrane, a ukoliko obje svinje stignu na valov u isto

vrijeme, mala svinja dobiva 3 jedinice hrane.

Mala svinja

Pritisnuti Cekati

Velika svinjaPritisnuti

Cekati

5,1 → 4,4↓ ↑

9,-1 → 0,0

Slika 10. Zatvorene svinje

Ova igra nema ravnotezu dominantne strategije, jer odluka velike svinje ovisi o njenoj

pretpostavci odluke koju ce donijeti mala svinja. Ako velika svinja misli da ce mala svinja

pritisnuti panel, ona ce tada cekati na valovu. U suprotnom, ukoliko velika svinja misli da ce

mala svinja cekati na valovu, velika svinja ce pritisnuti panel. U ovoj igri postoji ravnoteza

iterirane dominacije: to je kombinacija strategija (Pritisnuti, Cekati). Medutim, u nastavku

rada upotrijebit cemo drugaciji slijed razmisljanja koji nas dovodi do novog koncepta ravnoteze

u teoriji igra, a to je Nashova ravnoteza.

Definicija 4.8 Kombinacija strategija s∗ je Nasheva ravnoteza ukoliko nijedan igrac ne

zeli promijeniti svoju strategiju, promatrajuci ju u odnosu na izabrane strategije drugih igraca.

Preciznije, Nashova ravnoteza je kombinacija strategija s∗ za koju vrijedi:

∀i, πi(s∗i , s∗−i) ≥ πi(s

′i, s∗−i), ∀s′i. (1)

16

Kako bismo shvatili koncept Nashove ravnoteze, potrebno je odabrati kombinaciju strate-

gija i promatrati je li svaka strategija u toj kombinaciji najbolji odgovor pojedinog igraca na

strategije ostalih igraca. Promotrimo kombinaciju strategija (Pritisnuti, Cekati). Ako velika

svinja odabere strategiju Pritisnuti, mala svinja, koja vrsi izbor izmedu korisnosti 1 iz strate-

gije Pritisnuti i korisnosti 4 iz strategije Cekati, odabrat ce strategiju Cekati. Ako mala

svinja odabere strategiju Cekati, velika svinja, koja vrsi izbor izmedu korisnosti 4 iz strate-

gije Pritisnuti i korisnosti 0 iz strategije Cekati, odabrat ce strategiju Pritisnuti. Stoga je

kombinacija strategija (Pritisnuti, Cekati) Nashova ravnoteza. Moze se pokazati da je ova

kombinacija strategija jedinstvena Nashova ravnoteza.

”Zatvorene svinje” imaju svoju analogiju u ekonomiji. Ako tvrtka Velika svinja d.o.o. uvodi

novi proizvod na trziste, sa znacajnim marketinskim troskom zbog educiranja potencijalnih

kupaca, tvrtka Mala svinja d.d. moze na trziste uvesti imitaciju tog proizvoda i ostvariti

profit, bez narusavanja zarade Velike svinje d.o.o.

Kao i u slucaju ravnoteze dominantne strategije, Nasheva ravnoteza moze biti slaba ili

jaka. Definicija (4.8) definira slabu Nashevu ravnotezu. Jaka Nasheva ravnoteza podrazumi-

jeva strogu nejednakost u izrazu (1), odnosno zahtijeva da u tom slucaju nijedan igrac nije

indiferentan izmedu ravnotezne strategije i neke druge strategije.

4.3.2. Dilema modelatora

(vidi [2])

Svaka dominantna ravnoteza je Nashova ravnoteza, ali svaka Nashova ravnoteza nije ravnoteza

dominantne strategije. Ako je strategija nekog igraca dominantna, ona je najbolji odgovor tog

igraca na bilo koje strategije ostalih igraca, ukljucujuci i njihove ranotezne strategije. Ako

je strategija igraca dio Nashove ravnoteze, ona treba biti najbolji odgovor igraca samo na

ravnotezne strategije ostalih igraca.

Situacija u dilemi modelatora ista je kao u dilemi zatvorenika, s jednom iznimkom: iako

policija ima dovoljno dokaza da uhiti zatvorenike kao vjerojatne pocinitelje zlocina, nece imati

dovoljno dokaza da ih osudi ako nijedan od zatvorenika ne prizna zlocin. Stoga su korisnosti

igraca u kombinaciji strategija (Priznanje, Priznanje) sada (0, 0) umjesto (-1, -1).

Stupac

Poricanje Priznanje

RedakPoricanjePriznanje

0, 0 -10, 00, -10 -6, -6

Slika 11. Dilema modelatora

Dilema modelatora nema ravnotezu dominantne strategije. Moze se pokazati da je kom-

binacija strategija (Priznanje, Priznanje) ravnoteza iterirane dominacije i jaka Nasheva

17

ravnoteza. Stoga je (Priznanje, Priznanje) vrlo vjerojatan ishod ove igre. Medutim, u

dilemi modelatora postoji jos jedna Nasheva ravnoteza: kombinacija strategija (Poricanje, Poricanje)

je slaba Nasheva ravnoteza u ovoj igri. Nadalje, iako je (Poricanje, Poricanje) slaba, a

(Priznanje, Priznanje) jaka Nasheva ravnoteza, poricanje krivnje u oba slucaja ima bitnu

prednost nad priznanjem i taj ishod igre je pareto-superioran: (0, 0) je uniformno vece od (-6,

-6). Ova cinjenica uvelike otezava predvidanje ishoda igre.

Dilema modelatora ilustrira uobicajen problem modelatora igre: sto predvidjeti u slucaju

postojanja dvije Nasheve ravnoteze u igri. Modelator moze rijesiti taj problem dodavanjem

novih detalja u pravila igre ili dodavanjem novih uvjeta na osnovni koncept ravnoteze u igri,

sve dok samo jedna strategija ne zadovoljava rafinirani koncept ravnoteze. Nasheva ravnoteza

moze se rafinirati na vise nacina. Modelator igre moze inzistirati na strogoj ravnotezi, elimini-

rati slabo dominirane strategije ili koristiti ravnotezu iterirane dominacije. U dilemi modela-

tora, nakon ovih rafiniranja, jedina ravnotezna strategija je (Priznanje, Priznanje). Mode-

lator moze izabrati Nashevu ravnotezu koja je pareto-dominantna nad ostalim ravnotezama;

u tom slucaju u dilemi modelatora ravnotezna strategija je (Poricanje, Poricanje).

4.3.3. Bitka spolova

(vidi [2])

U bitci spolova promatramo sukob izmedu muskaraca koji zele gledati boks i zena koje zele

ici na balet. Njihove korisnosti dane su u sljedecoj tablici.

Zena

Boks Balet

MuskaracBoks

Balet

2, 1 ← 0, 0↑ ↓

0, 0 → 1, 2

Slika 12. Bitka spolova

U ovoj igri postoje dvije Nasheve ravnoteze, a to su kombinacije strategija (Boks, Boks)

i (Balet, Balet). Postavlja se pitanje koju ce ravnotezu igraci izabrati. Nasheva ravnoteza

pretpostavlja da igraci donose odluke na temelju korektnih i konzistentnih ocekivanja. Ukoliko

igraci ne komuniciraju prije donosenja odluke, postoji mogucnost da muskarac ode na balet,

a zena na boks, vjerujuci da tako ispunjavaju zelju svog partnera. Medutim, i u tom slucaju

moguce je postici Nashevu ravnotezu ponavljajuci igru vise puta. Nakon vise ponavljanja,

razumno je ocekivati da ce igra zavrsiti u jednoj od Nashevih ravnoteza.

Obje Nasheve ravnoteze u ovoj igri su pareto-superiorne; nijedna druga kombinacija strate-

gija ne donosi vise korisnosti jednom igracu bez smanjenja korisnosti drugog igraca. U mnogim

igrama Nasheva ravnoteza nije pareto-superiorna kombinacija strategija. U dilemi zatvorenika

18

kombinacija strategija (Priznanje, Priznanje) je jedinstvena Nasheva ravnoteza, iako su ko-

risnosti (-6,-6) pareto-inferiorne u odnosu na korisnosti (-1,-1) koje donosi kombinacija strate-

gija (Poricanje, Poricanje).

U bitci spolova jako je bitno tko povlaci prvi potez. Ako muskarac ranije kupi karte za

boks, njegov potez potaknut ce zenu da odluci gledati boks. Na taj nacin, u mnogim igrama

igrac koji prvi povlaci potez ima prednost.

Bitka spolova ima mnoge primjene u ekonomiji. Jedna od njih je izbor jezika pri sklapanju

ugovora izmedu dvije tvrtke koje zele postici dogovor o prodaji, ali preferiraju razlicite uvjete.

Druga je postavljanje standarda u industriji gdje dvije tvrtke zele postaviti zajednici standard

kako bi pridobile kupce za kupnju proizvoda, ali pritom imaju razlicite afinitete.

5. Teoremi o fiksnoj tocki

Teorija fiksne tocke je vazan alat u dokazivanju osnovnih teorema teorije igara. Ova teorija

proucava pod kojim uvjetima funkcija f preslikava neku tocku u nju samu, tj. pod kojim uvje-

tima postoji tocka x∗ takva da vrijedi f(x∗) = x∗. Teoremi fiksne tocke dokazuju postojanje

ravnoteze u igri, mada je ponekad gotovo nemoguce pronaci tu tocku ravnoteze. Ako do-

bro izaberemo preslikavanje f , teorem fiksne tocke dokazuje postojanje, ali ne i jedinstvenost

ravnoteze.

Ideja koja stoji iza ovih teorema je sljedeca: Ako dozvolimo mogucnost kombiniranih

strategija, prostor strategija bit ce kompaktan i konveksan skup. Tada mozemo definirati

funkciju reakcije koja svaku situaciju u igri preslikava u nove strategije igraca. Funkciju

definiramo tako da ona, na osnovu teorema o fiksnoj tocki, ima fiksnu tocku koja nam jamci

postojanje ravnoteze u igri.

Definicija 5.1 Neka je f : X → X preslikavanje. Za tocku x∗ ∈ X kazemo da je fiksna

tocka preslikavanja f ako je f(x∗) = x∗.

Teorem 5.1 (vidi [7]) Neka je f : X → X, X = [0, 1], neprekidna funkcija. Tada postoji

tocka x∗ ∈ X takva da je f(x∗) = x∗.

5.1. Topoloski prostori

Kako bismo iskazali i dokazali sljedece teoreme o fiksnoj tocki, potrebno je uvesti neke topoloske

prostore i navesti osnovna svojstva funkcija u tim prostorima.

Definicija 5.2 Hausdorffov prostor je topoloski prostor u kojem svake dvije tocke imaju

disjunktne okoline.

19

Definicija 5.3 Neka je X bilo koji neprazan skup. Metrika na X je funkcija d : X×X → Rkoja ima sljedeca svojstva:

i) d(x, y) ≥ 0, ∀x, y ∈ X;

ii) d(x, y) = 0⇔ x = y, ∀x, y ∈ X;

iii) d(x, y) = d(y, x), ∀x, y ∈ X;

iv) d(x, y) ≤ d(x, z) + d(z, y), ∀x, y, z ∈ X.

Uredeni par (X, d) tada zovemo metricki prostor.

Primijetimo da je metricki prostor ujedno i Hausdorffov prostor.

Teorem 5.2 (vidi [7]) Neka je (X, d) metricki prostor i A ⊆ X, A 6= ∅. Tada je d(x,A)

neprekidna funkcija.

Dokaz.

Buduci je (X, d) metricki prostor, za svaki z ∈ A vrijedi nejednakost trokuta: d(x, z) ≤d(x, y) +d(y, z). Odavde slijedi d(x,A) ≤ d(x, y) +d(y, A). Na isti nacin iz d(y, z) ≤ d(y, x) +

d(x, z), ∀z ∈ A slijedi d(y, A) ≤ d(y, x) + d(x,A). Iz ovih nejednakosti imamo

d(x, y) ≥ d(x,A)− d(y, A)

i

d(y, x) ≥ d(y, A)− d(x,A),

odnosno vrijedi:

d(x, y) ≥ |d(x,A)− d(y, A)|.

Neka je ε > 0. Tada postoji δ > 0 tako da je |d(x,A) − d(y, A)| < ε , ∀x, y takve da je

d(x, y) < δ, sto je upravo definicija neprekidnosti.

2

Definicija 5.4 Normalan prostor je Hausdorffov prostor u kojem svaka dva disjunktna

zatvorena skupa imaju disjunktne okoline.

Teorem 5.3 (vidi [7]) Svaki metricki prostor je normalan prostor.

Dokaz.

Neka su A i B dva disjunktna zatvorena skupa u metrickom prostoru (X, d). Definiramo

funkciju h : X → R na sljedeci nacin:

h(x) = d(x,A)− d(x,B).

Prema teoremu (5.2) funkcija h je neprekidna funkcija.

20

Nadalje definiramo skupove

U = {x ∈ X|h(x) < 0}, V = {x ∈ X|h(x) > 0}.

Skupovi U i V su otvoreni disjunktni skupovi.

Neka je x ∈ A. Tada je d(x,A) = 0 i d(x,B) > 0, jer je prema pretpostavci A ∩ B = ∅.Slijedi h(x) < 0, odnosno x ∈ U . Stoga zakljucujemo da je A ⊂ U .

Na isti nacin, ako je x ∈ B, onda je d(x,B) = 0 i d(x,A) > 0. Slijedi h(x) > 0, odnosno

x ∈ V . Dakle, B ⊂ V .

Kako su U i V disjunktne otvorene okoline skupova A i B, prema definiciji zakljucujemo

da je (X, d) normalan prostor.

2

Definicija 5.5 Neka je X bilo koji neprazan skup, a U familija njegovih podskupova sa svo-

jstvima:

i) Unija svake familije clanova iz U je clan iz U.

ii) Presjek konacno mnogo clanova iz U je clan iz U.

iii) ∅, X su clanovi iz U.

Tada se U zove topologija ili topoloska struktura na X,a uredeni par (X,U) naziva se

topoloski prostor.

Definicija 5.6 Topoloski prostor X je regularan prostor ako za svaki zatvoreni skup A ⊂ X

i tocku x /∈ A postoje disjunktne otvorene okoline Nε(x) i Nδ(A) takve da je Nε(x)∩Nδ(A) = ∅.

Primijetimo da je regularan prostor ujedno i normalan prostor.

Definicija 5.7 Familija {Uα}α∈A podskupova topoloskog prostora X je lokalno ogranicena

ako za svaki x ∈ X postoji otvorena okolina Nε(x) takva da je Nε(x) ∩ Uα = ∅ za konacno

mnogo α ∈ A.

Teorem 5.4 Ako je {Uα}α∈A lokalno ogranicena familija podskupova topoloskog prostora X,

onda zatvorene ljuske Uα skupova Uα takoder cine lokalno ogranicenu familiju {Uα}α∈A.

Dokaz.

Buduci je {Uα}α∈A lokalno ogranicena familija, svaka tocka x ∈ X ima otvorenu okolinu Nε(x)

takvu da je Nε(x) ∩ Uα = ∅, za konacno mnogo α ∈ A. Ako je Nε(x) ∩ Uα = ∅, onda je

Uα ⊂ Nε(x)c. Buduci je Nε(x)c zatvoren skup, slijedi Uα ⊂ Nε(x)c. Stoga je Nε(x) ∩ Uα = ∅,dakle familija {Uα}α∈A je lokalno ogranicena.

2

Teorem 5.5 Ako je {Uα}α∈A lokalno ogranicena familija zatvorenih skupova u topoloskom

prostoru X, onda je skup U =⋃Uα zatvoren.

21

Dokaz.

Neka je x ∈ U c i Nε(x) otvorena okolina tocke x.

Ako je Nε(x) ∩ Uα = ∅ za svaki α ∈ A, onda je Nε(x) ∈ U c.

Ako je Nε(x) ∩ Uα 6= ∅ za α1, α2, ..., αn, onda je Nε(x)⋂{∩U c

α} otvoren skup u U c.

Zakljucujemo da je U c otvoren, odnosno U je zatvoren skup.

2

5.2. Banachov teorem o fiksnoj tocki

Jedan od osnovnih teorema ove teorije je Banachov teorem o fiksnoj tocki. On dokazuje

postojanje jedinstvene fiksne tocke kontrakcije.

Definicija 5.8 Niz (xk), k ∈ N u metrickom prostoru (X, d) je Cauchyjev niz ako ∀ε > 0

∃k0 ∈ N takav da je d(xm, xn) < ε, ∀m,n ≥ k0.

Definicija 5.9 Neka je (X, d) metricki prostor. Funkcija f : X → X je kontrakcija ako

∃λ ∈ [0, 1〉 tako da vrijedi d(f(x), f(y)) ≤ λd(x, y), ∀x, y ∈ X.

Teorem 5.6 (Banachov teorem o fiksnoj tocki)

Neka je (X, d) potpun metricki prostor, a f : X → X kontrakcija s konstantom λ. Tada vrijedi:

i) funkcija f ima jedinstvenu fiksnu tocku x∗ ∈ X;

ii) ∀x1 ∈ X niz (xk), k ∈ N definiran formulom xk = f(xk−1), k ≥ 2 konvergira prema toj

jedinstvenoj fiksnoj tocki x∗; (1)

iii) d(xk, x∗) ≤ λk−1

1−λ d(x1, x2).

Dokaz.

Neka je x1 ∈ X tocka, a (xk) niz definiran sa (1). Pokazimo da je (xk) Cauchyjev niz:

d(xk, xk+1) = d(f(xk−1), f(xk))

≤ λd(xk−1, xk) = λd(f(xk−2), f(xk−1))

≤ λ2d(xk−2, xk−1) = λ2d(f(xk−3), f(xk−2))...

≤ λk−1d(x1, x2)

Neka je i ∈ N. Tada vrijedi:

d(xk, xk+j) ≤ d(xk, xk+1)d(xk+1, xk+2) + · · · d(xk+i−1, xk+i)

≤ (λk−1 + λk + · · ·+ λk+i−2)d(x1, x2)

= λk−1(1 + λ+ · · ·+ λi−1)d(x1, x2)

= λk−1 1−λi

1−λ d(x1, x2)

≤ λk−1

1−λ d(x1, x2) (2)

Neka je ε > 0. Buduci λk−1 → 0, k →∞, ∃k0 ∈ N takav da vrijediλk−1

1−λ d(x1, x2) < ε, ∀k ≥ k0.

22

Stoga iz (2) slijedi d(xk, xk+i) < ε, ∀k ≥ k0, sto znaci da je niz (xk) Cauchyjev niz.

Neka niz (xk) konvergira prema tocki x∗. Pokazimo da je tocka x∗ fiksna tocka funkcije f .

0 ≤ d(x∗, f(x∗)) ≤ d(x∗, xk) + d(xk, f(x∗))

= d(x∗, xk) + d(f(xk−1), f(x∗))

≤ d(x∗, xk) + λd(xk−1, x∗), ∀k ∈ N

Iz xk → x∗ slijedi d(x∗, xk)→ 0 i d(xk−1, x∗)→ 0.

Sada, iz 0 ≤ d(x∗, f(x∗)) ≤ 0 slijedi d(x∗, f(x∗)) = 0 sto povlaci da je x∗ = f(x∗). Prema

definiciji, x∗ je fiksna tocka funkcije f .

Dokazimo jedinstvenost te fiksne tocke. Pretpostavimo suprotno, tj. da postoji neka druga

fiksna tocka x ∈ X. Tada vrijedi:

d(x∗, x) = d(f(x∗), f(x)) ≤ λd(x∗, x) < d(x∗, x)

sto je kontradikcija. Time smo dokazali da ne postoji nijedna druga fiksna tocka x funkcije

f .

Ocjena iii) slijedi iz (2) kada i→∞.2

5.3. Brouwerov teorem o fiksnoj tocki

Brouwerov teorem o fiksnoj tocki pomoci ce nam u dokazu Kakutanijevog teorema o fiksnoj

tocki, koji predstavlja osnovu dokaza teorema o Nashevoj ravnotezi.

Definicija 5.10 Za skup K ⊆ Rn kazemo da je konveksan skup ako ∀x, y ∈ K i λ ∈ [0, 1]

vrijedi λx+ (1− λ)y ∈ K.

Najjednostavniji konveksan skup zove se simplex. Simplex u nula dimenzija je tocka, u

jednoj dimenziji duzina, u dvije dimenzije trokut, u tri dimenzije tetraedar itd.

x0 a a x1 x0 a a x1��ax3TTTTT x0 a�� ax

1

��ax3

ccc

cCCCCCCax2

```` ��

Slika 13. Primjer simplexa u jednoj, dvije i tri dimenzije

Definicija 5.11 Neka su x0, x1, ..., xn medusobno nezavisni vektori. Skup{n∑i=0

λixi|λi > 0, i = 0, 1, ..., n;

n∑i=0

λi = 1

}= x0x1 · · · xn

23

zovemo euklidski n - dimenzionalni simplex x0x1 · · ·xn. Vektori x0, x1, ..., xn koji raza-

pinju ovaj prostor zovu se vrhovi simplexa. Svaki vrh xi i svaki k - simplex xi0xi

1 · · · xik ,

k ≤ n, zove se strana simplexa x0x1 · · ·xn.

Primijetimo da je zatvarac simplexa x0x1 · · ·xn jednak konveksnoj ljuski vrhova x0, x1, ...xn.

Osim toga, unija svih strana simplexa x0x1 · · ·xn je njegov zatvarac.

Definicija 5.12 Za y =∑n

i=0 λixi ∈ co{x0, x1, ..., xn} neka je χ(y) = {i : λi > 0}. Pritom

vrijedi: ako je χ(y) ∈ i0, i1, ..., ik, onda je y ∈ xi0xi1 · · · xiK . Tu stranu simplexa zovemo nosac

od y.

Definicija 5.13 Jedinicni simplex je skup vektora{x ∈ Rn+1|xi > 0, i = 0, ..., n;

n∑x=0

xi = 1

}= e0e1 · · · en

. Sa ∆n oznacavamo zatvarac ovog skupa u n dimenzija.

Definicija 5.14 Neka je T = x0x1 · · ·xn n - dimenzionalni simplex i T njegov zatvarac.

Simpleksna subdivizija zatvaraca T je konacan skup simplexa {Ti|i ∈ I} takvih da je⋃i∈I Ti = T , a T i

⋂T j, ∀i, j ∈ I, je ili prazan skup ili zatvarac odgovarajuce strane simplexa.

Definicija 5.15 Neka je T zatvarac simplexa x0x1 · · ·xn. Neka je dana simpleksna subdiviz-

ija zatvaraca T i neka je V skup vrhova svih podsimplexa. Funkciju λ : V → {0, ..., n} za

koju vrijedi λ(v) ∈ χ(v), tj. λ pripada nosacu od v, zovemo pravilno oznacavanje subdiviz-

ije. Kazemo da je podsimplex potpuno oznacen ako λ poprima sve vrijednosti 0, 1, ..., n na

njegovom skupu vrhova.

Lema 5.1 Spernerova lema Neka je K simpleksna subdivizija zatvorenog simplexa T =

clx0x1 · · ·xn i neka je skup svih vrhova sudivizije pravilno oznacen funkcijom λ : V → {0, 1, ..., n}tako da vrijedi λ(v) ∈ χ(v). Tada postoji neparan broj potpuno oznacenih podsimplexa u sub-

diviziji.

Teorem 5.7 Brouwerov teorem o fiksnoj tocki

Neka je f : ∆n → ∆n neprekidna funkcija. Tada funkcija f ima fiksnu tocku.

Dokaz.

Neka je ε > 0. Podijelimo skup ∆n na podsimplexe promjera ≤ ε. Neka je V skup vrhova ove

subdivizije.

Definirajmo funkciju oznacavanja λ : V → {0, 1, ..., n} na sljedeci nacin: za v ∈ xi0xi1 · · ·xik

je

λ(v) ∈ {i0, i1, ..., ik}⋂{i|fi(v) ≤ vi}.

24

Primijetimo da ovaj presjek nije prazan skup. Naime, ako bi vrijedilo fi(v) > vi, ∀i ∈{i0, i1, ..., ik}, onda bi bilo

1 =n∑i=0

fi(v) >k∑j=0

vij =n∑i=0

vi = 1

sto je kontradikcija. (Druga jednakost slijedi iz v ∈ xi0xi1 · · ·xik .)Funkcija λ je definirana tako da zadovoljava uvjete pravilnog oznacavanja, a samim tim

i pretpostavke Spernerove leme. Stoga postoji simplex εp0 εp1 · · · εpn u subdiviziji koji je

potpuno oznacen i vrijedi:

fi(εpi) ≤ εpi, ∀i ∈ {0, 1, ..., n}.

Neka ε→ 0 i pretpostavimo εpi → z, ∀i, gdje je z = (z0, z1, ..., zn). Buduci je f neprekidna,

vrijedi fi(z) ≤ zi, a kako su fi(z) i zi oba u simplexu, slijedi f(z) = z.

2

6. Kakutanijev teorem o fiksnoj tocki

Sredisnji dio dokaza Nashevog teorema o postojanju ravnoteze u nekooperativnim igrama cini

upravo Kakutanijev teorem o fiksnoj tocki. Kako bismo razumijeli matematicku teoriju koja

stoji u pozadini ovih teorema, potrebno je uvesti neke pojmove. Za razliku od funkcije, koja

predstavlja preslikavanje tocke u tocku, ovdje promatramo vezu, tj. postupak koji predstavlja

preslikavanje tocke u skup tocaka, i pojam neprekidnosti veze.

Preslikavanje f tocke u tocku oznacavamo sa f : X → Y , dok preslikavanje tocke u skup

tocaka oznacavamo sa f : X →→ Y .

Definicija 6.1 Neka je 2Y partitivni skup od Y . Veza γ iz X u Y , u oznaci γ : X →→ Y ,

je funkcija iz X u 2Y .

s -xγ

γ(x)&%'$X Y

Slika 14. Veza γ : X →→ Y

Primijetimo da je klasa svih funkcija sadrzana u klasi svih veza.

Graf funkcije f : X → Y je skup uredenih parova Γf = {(x, y) ∈ X × Y |y = f(x)}. Na

slican nacin definiramo graf veze γ.

25

Definicija 6.2 Graf veze γ : X →→ Y je skup

Γγ = {(x, y) ∈ X × Y |y ∈ γ(x)}.

6

-x

γ(x)

Slika 15. Graf veze Γγ

Definicija 6.3 Neka je γ : X →→ Y veza i D ⊆ X. Slika od D je skup

γ(D) =⋃x∈D

γ(x).

��

-Dγ

γ(D)&%'$X Y

Slika 16. Slika od D

Definicija 6.4 Neka je γ : X →→ Y veza i K ⊆ Y . Gornji ili jaki inverz skupa K , u

oznaci γ+[K], je skup

γ+[K] = {x ∈ X|γ(x) ⊆ K}.

Definicija 6.5 Neka je γ : X →→ Y veza i K ⊆ Y . Donji ili slabi inverz skupa K , u

oznaci γ−[K], je skup

γ−[K] = {x ∈ X|γ(x) ∩K 6= ∅}.

Slicno pojmu semi-neprekidnosti funkcije, uvodimo pojam hemi-neprekidnosti veze.

Definicija 6.6 Veza γ : X →→ Y je jako hemi-neprekidna u tocki x0 ako vrijedi: ako

se tocka x0 nalazi u jakom inverzu otvorenog skupa D, onda je i otvorena okolina tocke x0

Nε(x0) takoder sadrzana u tom inverzu. Preciznije, γ : X →→ Y je jako hemi-neprekidna u

tocki x0 ako vrijedi:

x0 ∈ γ+[D] = {x ∈ X|γ(x) ⊆ D} ⇒ Nε(x0) ⊆ γ+[D],

26

za neki ε > 0.

Veza γ : X →→ Y je slabo hemi-neprekidna u tocki x0 ako vrijedi: ako se tocka

x0 nalazi u slabom inverzu otvorenog skupa D, onda je i otvorena okolina tocke x0 Nε(x0)

takoder sadrzana u tom inverzu. Preciznije, γ : X →→ Y je slabo hemi-neprekidna u tocki x0

ako vrijedi:

x0 ∈ γ−[D] = {x ∈ X|γ(x) ∩D 6= ∅} ⇒ Nε(x0) ⊆ γ−[D],

za neki ε > 0.

Veza γ : X →→ Y je jako hemi-neprekidna (slabo hemi- neprekidna) ako je jako

hemi-neprekidna (slabo hemi-neprekidna) u svakoj tocki x ∈ X. Veza je neprekidna ako je

jako i slabo hemi-neprekidna.

Definicija 6.7 Veza γ : D →→ K je zatvorena u tocki x ako iz xn → x, yn ∈ γ(xn) i

yn → y slijedi y ∈ γ(x). Veza γ je zatvorena ako je zatvorena u svakoj tocki x ∈ D.

Teorem 6.1 (vidi [1]) Neka je D ⊆ Rn, K ⊆ Rm i γ : D →→ K.

1. Ako je γ jako hemi-neprekidna i njene vrijednosti su zatvoreni skupovi, onda je γ zatvorena

veza.

2. Ako je K kompaktan skup i γ zatvorena veza, onda je γ jako hemi-neprekidna.

Kako bismo dokazali Kakutanijev teorem o fiksnoj tocki, potrebno je navesti neke teoreme

koji su mu prethodili u razvoju ove teorije.

Teorem 6.2 1 Neka je D ⊆ Rn kompaktan i K ⊆ Rm konveksan skup. Neka je nadalje

γ : D →→ K jako hemi - neprekidna veza cije su vrijednosti neprazni kompaktni i konveksni

skupovi. Za δ > 0 definirajmo γδ na sljedeci nacin:

γδ(x) = co

⋃z∈Nδ(x)

γ(z)

.

Tada za svaki ε > 0 postoji δ > 0 tako da vrijedi

Γγδ(x) ⊆ Nε(Γγ(x)).

Dokaz.

Pretpostavimo suprotno, tj. pretpostavimo da postoji ε > 0 tako da vrijedi

Γγδ(x) * Nε(Γγ(x)), ∀δ > 0.

To znaci da postoji niz (xn, yn) takav da je

(xn, yn) ∈ Γγ1n = {(x, y) ∈ D ×K|y ∈ γ

1n (x)}

1Cellina, 1969.

27

i |(xn, yn)− Γγ(x)| ≥ ε > 0. Iz (xn, yn) ∈ Γγ1n slijedi yn ∈ γ 1

n (x), sto znaci da je

yn ∈ co

⋃z∈N 1

n(xn)

γ(z)

.

Buduci je konveksna ljuska skup svih linearnih kombinacija vektora iz⋃z∈N 1

n(xn) γ(z), vektor

yn mozemo izraziti kao linearnu kombinaciju vektora iz⋃z∈N 1

n(xn) γ(z). Dakle, za svaki n

postoji skup vektora

y0,n, y1,n, ..., yk,n ∈⋃

z∈N 1n(xn)

γ(z)

tako da vrijedi

yn =k∑i=0

λi,nyi,n, λi ≥ 0,

k∑i=0

λi = 1.

Takoder, za svaki yi,n postoji zi,n ∈ N 1n(xn) tako da je yi,n ∈ γ(zi,n), a iz zi,n ∈ N 1

n(xn) slijedi

|zi,n − xn| < 1n.

Niz (xn) je beskonacan niz na kompaktnom skupu D. Stoga postoji konvergentan podniz

xn′

takav da xn′ → x. Iz navedenog slijedi:

|zi,n − xn| < 1

n⇒ |zi,n′ − xn′ | < 1

n′⇒ zi,n

′ → x, n′ →∞.

Takoder, za svaki i vrijedi

yi,n ∈ γ(zi,n)⇒ yi,n′ ∈ γ(zi,n

′)⇒ yi,n

′ ∈ γ(x), n′ →∞.

Buduci je γ(x) kompaktan skup, niz yn′

ima konvergentan podniz yn′′, yn

′′ → yi ∈ γ(x).

Stoga yn′′

=∑k

i=0 λi,n′′yi,n′′ konvergira yn

′′=∑k

i=0 λi,n′′yi, yi ∈ γ(x), ∀i. Nadalje, γ(x) je

konveksan skup pa je yn′′ ∈ γ(x) za dovoljno veliki n′′, odakle slijedi (x, yn

′′) ∈ Γγ sto je

u kontradikciji s pretpostavkom |(xn, yn) − Γγ(x)| ≥ ε > 0. Stoga zakljucujemo Γγδ(x) ⊆Nε(Γγ(x)).

2

U iducem teoremu John von Neumann je pokazao da mozemo graf zatvorene veze s

nepraznim konveksnim vrijednostima aproksimirati grafom neprekidne funkcije. Naime, za

svaki ε > 0 mozemo izabrati graf neprekidne funkcije koji lezi u ε - okolini grafa veze. Rezul-

tat ovog teorema omogucuje nam da rezulate koji se odnose na funkcije prosirimo na veze.

Prije iskaza i dokaza samog teorema, uvodimo pojmove particije jedinice i rezultate vezane

uz particiju jedinice koji ce nam pomoci u dokazu von Neumannove tvrdnje.

Definicija 6.8 Neka je X topoloski prostor i f : X → R neprekidna funkcija. Uporiste od

f , u oznaci supp(f), je zatvorena ljuska tocaka x ∈ X za koje je f(x) 6= 0, tj.

supp(f) = {x ∈ X|f(x) 6= 0}.

28

Definicija 6.9 Particija jedinice na topoloskom prostoru X je familija nenegativnih funkcija

{fα : X → R}α∈A takvih da njihova uporista cine konacan pokrivac od X i∑

α∈A fα ≡ 1,

∀x ∈ X.

Definicija 6.10 Neka je {Uα}α∈A familija podskupova topoloskog prostora X. Kazemo da

je familija {fα : X → R} neprekidnih funkcija na X podredena familiji {Uα}α∈A ako je

supp(fα) ⊂ Uα, ∀α ∈ A.

Teorem 6.3 (vidi [1]) Neka je {Pα}α∈A konacan otvoreni pokrivac normalnog prostora X.

Tada postoji otvoreni pokrivac {Qα}α∈A takav da je Qα ⊂ Pα, ∀α ∈ A.

Teorem 6.4 (vidi [1]) Neka je X normalan prostor, K ⊂ X kompaktan skup i {Pα}α∈Aotvoreni pokrivac skupa K. Tada postoji particija jedinice podredena familiji {Pα}α∈A.

Dokaz.

Prema prethodnom teoremu postoji otvoreni pokrivac {Uα}α∈A takav da je Uα ⊂ Pα, ∀α ∈ A.

Buduci je K kompaktan skup, pokrivac {Uα} ima konacan pod pokrivac U1, U2, ..., Uk.

Definirajmo funkciju gi : K → R+ na sljedeci nacin: gi(x) = min{|x − z| : z ∈ U ci }.

Funkcija gi je neprekidna funkcija i supp(gi) = Ui. Nadalje, skupovi Ui, i = 1, ..., k cine

pokrivac skupa K pa ne moze biti gi(x) = 0, ∀i. Stoga mozemo definirati familiju funkcija

{fi}i=1,...k na sljedeci nacin:

fi =gi∑j gj

.

Ovako definirana familija {f1, f2, ..., fk} predstavlja trazenu particiju jedinice podredenu famil-

iji {Pα}α∈A.

2

Teorem 6.5 2 Neka je D ⊆ Rn kompaktan i K ⊆ Rm konveksan skup te γ : D →→ K jako

hemi neprekidna veza s nepraznim kompaktnim i konveksnim vrijednostima. Tada za svaki

ε > 0 postoji neprekidna funkcija f : D → K takva da je Γf ⊆ Nε(Γγ).

Dokaz.

Iz prethodnog teorema znamo da vrijedi: ako je γδ = co(⋃

z∈Nδ(x) γ(z))

, onda za svaki ε > 0

postoji δ > 0 tako da je

Γγδ ⊆ Nε(Γγ).

Buduci je skup D kompaktan, postoje x1, x2, ...xn ∈ D tako da skupovi {Nδ(xi)} cine otvoreni

pokrivac skupa D. Tada postoji particija jedinice f1, f2, ..., fn podredena familiji {Nδ(xi)}.

2John von Neumann, 1937.

29

Particiju jedinice izaberemo tako da vrijedi: fi(x) = 0, ∀x /∈ {Nδ(xi)}. Za svaki γ(xi) izaber-

emo y ∈ γ(xi) i definiramo funkciju g : D → K na sljedeci nacin:

g(x) =n∑i=1

fi(x)yi.

Buduci su sve fi neprekidne, funkcija g je takoder neprekidna funkcija. Nadalje, na temelju

gore definiranog izbora particije, fi(x) > 0 povlaci x ∈ {Nδ(xi)}. Buduci je g(x) linearna

kombiniacija nenegativnih funkcija fi(x) i y ∈ γ(xi) slijedi:

g(x) ∈ γδ(x) = co

⋃z∈Nδ(xi)

γ(z)

.

Sada imamo

g(x) ∈ γδ(x)⇒ Γg ⊆ Γγδ ⊆ Nε(Γγ).

2

Teorem 6.6 (vidi [1]) Neka je K ⊆ Rn neprazan, konveksan i konkavan skup te µ : K →→ K.

Neka je γ : K →→ F , gdje je F ⊆ Rn kompaktan i konveksan skup, zatvorena veza cije su

vrijednosti neprazni, kompaktni i konveksni skupovi, a funkcija f : K × F → K neprekidna,

tako da je za svaki x ∈ Kµ(x) = {f(x, y)|y ∈ γ(x)}.

Tada µ ima fiksnu tocku, odnosno postoji x ∈ K za koji vrijedi x ∈ µ(x).

Kakutanijev teorem slijedi kao korolar gore navedenog teorema.

Teorem 6.7 Kakutanijev teorem o fiksnoj tocki

Neka je K ⊆ Rn kompaktan i konveksan skup te γ : K →→ K jako hemi-neprekidna veza cije

su vrijednosti neprazni, konveksni i kompaktni skupovi. Tada veza γ ima fiksnu tocku.

Dokaz.

Buduci je K neprazan, kompaktan i konveksan skup, a γ jako hemi-neprekidna veza sa

zatvorenim vrijednostima, po teoremu (6.1) slijedi da je γ zatvorena.

Definirajmo funkciju f : K ×K → K na sljedeci nacin: f(x, y) = y.

Sada imamo

γ(x) = {f(x, y)|y ∈ γ(x)} ⇒ γ(x) = {y|y ∈ γ(x)}.

Dakle, veza γ ima fiksnu tocku x ∈ γ(x).

2

30

7. Nashev teorem

Koncept ravnoteze koji je uveo John Nash bez sumnje je najcesce upotrebljeni alat teorije igara

u brojnim aplikacijama i primjenama. U ovom poglavlju iskoristit cemo prethodno dokazane

teoreme i dokazati da sve nekooperativne igre imaju Nashevu ravnotezu u igri kombiniranih

strategija.

7.1. Kombinirane strategije

Kombinirana strategija xi igraca i ∈ I je vjerojatnosna distribucija vektora cistih strategija

Si igraca i. Skup svih mogucih kombiniranih strategija igraca i ∈ I je vektor kombiniranih

strategija Xi. Prostor kombiniranih strategija je Kartezijev produkt

X =∏i∈I

Xi = X1 ×X2 × · · · ×Xn.

Vektor x ∈ X predstavlja kombinirane strategije svih igraca i naziva se profil kombiniranih

strategija. Takoder, vektor x−i predstavlja kombinirane strategije svih igraca osim i-tog.

Svaki profil kombiniranih strategija donosi odredenu korisnost ili, tocnije, ocekivanu korisnost

za svakog igraca i ∈ I. Kombinirane strategije svakog igraca odredene su prije pocetka igre,

stoga su njihove vjerojatnosti medusobno nezavisne. Ako ce u igri biti odigran profil kombini-

ranih strategija x ∈ X, tada je vjerojatnost da ce u igri biti iskoristen profil cistih strategija

s ∈ S jednaka

x(s) =n∏i=1

xi(si)

gdje je xi(si) vjerojatnost koju igrac i ∈ I dodjeljuje njegovoj cistoj strategiji si. Ocekivana

korisnost iz vektora kombiniranih strategija x ∈ X za igraca i ∈ I je

πi(x) =∑s∈S

x(s)πi(s).

7.2. Veza najboljeg odgovora

Nasheva ravnoteza u igri kombiniranih strategija zahtijeva da u profilu kombiniranih strategija

x ∈ X svaki element, odnosno kombinirana strategija xi ∈ Xi svakog igraca bude optimalna,

pod pretpostavkom da ce u igri biti odigran upravo profil x. Za definiciju Nasheve ravnoteze

u igri kombiniranih strategija potrebno je uvesti pojam veze najboljeg odogovora.

Definicija 7.1 Najbolji odgovor igraca i na profil kombiniranih strategija x ∈ X je strate-

gija xi ∈ Xi takva da nijedna druga strategija dostupna igracu ne donosi vecu korisnost od x.

Veza najboljeg odgovora γi : X →→ Xi je veza koja preslikava profil strategije u neprazan

skup na sljedeci nacin:

γi(x) = {xi ∈ Xi|πi(xi, x−i) ≥ πi(x′i, x−i),∀x′i ∈ Xi}.

31

Veze najboljeg odgovora svih igraca mogu se prikazati pomocu veze najboljeg odogovora

za cijelu igru, γ : X →→ X, definirane kao γ(x) = (γ1(x), γ2(x), ..., γn(x)).

Ako je xi ∈ γi(x) za nekog igraca i, tada igrac i ne zeli promijeniti svoju strategiju sve dok

se igra profil x. Ako je xi ∈ γi(x), ∀i ∈ I, onda je x ∈ γ(x) i nijedan igrac ne zeli promijeniti

svoju strategiju. U tom slucaju igra ostaje na profilu x ∈ X, odnosno taj profil strategija

predstavlja Nashevu ravnotezu.

Definicija 7.2 Profil strategija x ∈ X je Nasheva ravnoteza ako je x ∈ γ(x).

Prema gornjoj definiciji, profil strategija je Nasheva ravnoteza ako je on fiksna tocka veze

najboljeg odgovora za cijelu igru. Iz Kakutanijevog teorema o fiksnoj tocki znamo da veza

γ : X →→ X ima fiksnu tocku ako vrijedi:

i) X je kompaktan i konveksan skup,

ii) vrijednosti veze γ su neprazni, kompaktni i konveksni skupovi,

iii) veza γ je jako hemi-neprekidna veza.

Pokazimo da veza najboljeg odgovora zadovoljava sve pretpostavke Kakutanijevog teorema.

i) U prostoru kombiniranih strategija, svaki Xi je zatvarac jedinicnog simplexa u n dimenzija.

Buduci je X Kartezijev produkt simplexa X =∏n

i=1Xi = X1 × X2 × · · · × Xn, on je ocito

konveksan i kompaktan skup.

ii) Funkcija korisnosti svakog igraca πi(x) =∑

s∈S x(s)πi(s) je linearna, dakle i neprekidna

funkcija. Svaka neprekidna funkcija na kompaktnom skupu postize maksimum, stoga su vri-

jednosti veze najboljeg odogovora neprazne.

Pretpostavimo da γ(x) nije konveksan skup. Tada postoje najbolji odgovori x′ ∈ γ(x),

x′′ ∈ γ(x) i λ ∈ (0, 1) tako da je λx′ + (1− λ)x′′ /∈ γ(x). Medutim, za svaki i ∈ I vrijedi:

πi(λx′i + (1− λ)x′′i , x−i) = λπi(x

′i, x−i) + (1− λ)πi(x

′′i , x−i).

Ako su x′i i x′′i najbolji odgovori igraca i na x−i, onda je i njihova ponderirana sredina najbolji

odgovor, dakle γ(x) je konveksan skup.

Nadalje, γ(x) je, kao podskup simplexa, kompaktan skup.

iii) Prema teoremu (6.1) veza γ je jako hemi-neprekidna ako je skup X kompaktan i γ

zatvorena veza. Iz definicije zatvorene veze znamo da iz xn → x, yn ∈ γ(xn) i yn → y

slijedi y ∈ γ(x).

Pretpostavimo da γ nije zatvorena veza. Onda postoji niz xn takav da xn → x, yn ∈ γ(xn)

i yn → y, ali y /∈ γ(x). Tada je yi /∈ γ(xi) za nekog igraca i. Stoga postoji ε > 0 i kombinirana

strategija x′i takvi da je

πi(x′i, x−i) > πi(yi, x−i) + 3ε.

Buduci je πi : X → R naprekidna funkcija, za dovoljno velik n imamo:

πi(x′i, x

n−i) > πi(x

′i, x−i)− ε > πi(yi, x−i) + 2ε > πi(y

ni , x

n−i) + ε.

32

Dakle, x′ni donosi igracu i strogo vecu korisnost od yni , sto je u kontradikciji s pretpostavkom

yni ∈ γi(xn). Stoga zakljucujemo da je γ zatvorena i jako hemi-neprekidna veza.

Na osnovu ovih zakljucaka lako dokazujemo Nashev teorem.

Teorem 7.1 Nashev teorem

Svaka igra s konacno mnogo igraca ima Nashevu ravnotezu u kombiniranim strategijama.

Dokaz.

Veza najboljeg odgovora za cijelu igru γ : X →→ X zadovoljava sve pretpostavke Kakutani-

jevog teorema o fiksnoj tocki, stoga zakljucujemo da γ ima fiksnu tocku x ∈ γ(x), odnosno

igra ima Nashevu ravnotezu.

2

33

Literatura

[1] Anders Nilsson, Game Theory - Mathematical Fundaments and Examples of Applications,

Department of Mathematics, Lulea Tekniska Universitet, Lulea 1997.

[2] Eric Rasmusen, Games and Information, Third Edition, Blackwell Publishers, Oxford,

2001.

[3] Adam M. Brandenburger, Barry J. Nalebuff, The Right Game: Use Game Theory to

Shape Strategy, Harvard Business Review, July-August 1995.

[4] Jasminka Sohinger, Nash Equilibrium and Nash Bargaining Solution: the 1994 Nobel

Prize for Economics, Faculty of Economics, Zagreb, 1996.

[5] Sibe Mardesic, Matematicka analiza 1, Skolska knjiga, Zagreb, 1979.

[6] Sime Ungar, Matematicka analiza 3, Zagreb, 2004.

[7] Walter Rudin, Principles of Mathematical Analysis, McGraw-Hill Book Company, New

York, 1976

[8] Game theory, A resource for educators and students of game theory,

http://www.gametheory.net/

34

Sazetak


Teorija igara suvremena je matematicka disciplina s brojnim primjenama u ekonomiji. Jedan

od najpoznatijih i najcesce koristenih pojmova u modernoj teoriji igara je Nasheva ravnoteza,

koncept ravnoteze u igri koji je dobio ime prema americkom matematicaru Johnu Nashu,

dobitniku Nobelove nagrade u ekonomiji za doprinos u analizi ravnoteze u nekooperativnim

igrama. Vazan alat u dokazivanju teorema teorije igara predstavljaju teoremi o fiksnoj tocki.

Kakutanijev teorem o fiksnoj tocki cini sredisnji dio dokaza Nashevog teorema u kojem je John

Nash dokazao da svaka igra s konacno mnogo igraca ima Nashevu ravnotezu u kombiniranim

strategijama.

Kljucne rijeci: koncept ravnoteze, Nasheva ravnoteza, Kakutanijev teorem o fiksnoj tocki,

kombinirana strategija, Nashev teorem

35

Summary

Nash equlibrium in mixed strategies

Game theory is a contemporary mathematical discipline with numerous applications in econ-

omy. One of the best known and most used concepts in the modern game theory is Nash

equlibrium, which is the equlibrium in game named after the American mathematician John

Nash, a Nobel prize winner for economy for his contribution in equilibrium analysis in non-

cooperative games. An important tool in approval of the game theory theorems are the fixed

point theorems. Kakutani fixed point theorem forms the middle part of the proof of the Nash

theorem, in which John Nash proved that every game with finitely many players has a Nash

equilibrium in mixed strategies.

Key words: equlibrium concept, Nash equlibrium, Kakutani fixed point theorem, mixed

strategy, Nash theorem

36

Zivotopis

Zovem se Emina Lulic. Rodena sam 21. listopada 1986. g. u Dakovu. Od rodenja zivim

u Kusevcu, prigradskom naselju grada Dakova. Od 1993. g. do 2001. g. pohadala sam

osnovnu skolu J. A Colnica u Kusevcu (prva cetiri razreda), odnosno Dakovu (visi razredi

osnovne skole). 2001. g. upisala sam opcu gimnazija A. G. Matosa u Dakovu, koju sam

2005. g. zavrsila i primila nagradu kao najbolja ucenica u generaciji. Iste godine upisala

sam preddiplomski studij matematike na Odjel za metematiku, Sveuciliste J. J. Strossmayera

u Osijeku. 2007. g. primila sam posebnu godisnju nagradu Lions Cluba Osijek za najbolje

studente Sveucilista J. J. Strossmayera. Preddiplomski studij matematike zavrsila sam 2008.

godine s prosjekom ocjena 5,00 tijekom studiranja. Tada sam primila priznanje i nagradu

Odjela za matematiku, Sveuciliste J. J. Strossmayera u Osijeku. Po zavrsetku preddiplom-

skog studija upisala sam diplomski studij poslovne i financijske matematike na Odjelu za

matematiku. Tijekom ove akademske godine pohadala sam izvanredni studij Pedagosko -

psiholoskog obrazovanja na Filozofskom fakultetu u Osijeku, gdje sam polozila pedagogiju,

didaktiku, psihologiju odgoja i obrazovanja i metodiku nastave matematike, te tako stekla

potrebne kompetencije za rad u odgojno - obrazovnim ustanovama.

Documents

Emina Luli c - Odjel Za Matematikumdjumic/uploads/diplomski/LUL02.pdfTeorija igara je suvremena matemati cka disciplina ciji razvoj zapo cinje u 18. i 19. stolje cu. Antoine Augustin