Upload
others
View
1
Download
0
Embed Size (px)
Citation preview
Sveuciliste J.J. Strossmayera u Osijeku
Odjel za matematiku
Sveucilisni diplomski studij matematike
Poslovna i financijska matematika
Emina Lulic
Nasheva ravnoteza u kombiniranim strategijama
Diplomski rad
Osijek, 2011.
Sveuciliste J.J. Strossmayera u Osijeku
Odjel za matematiku
Sveucilisni diplomski studij matematike
Poslovna i financijska matematika
Emina Lulic
Nasheva ravnoteza u kombiniranim strategijama
Diplomski rad
Voditelj: Doc. dr. sc. Kristian Sabo
Osijek, 2011.
Sadrzaj
Uvod 1
1. Povijesni razvoj teorije igara 3
2. Osnovni pojmovi teorije igara 4
2.1. Pravila igre........................................................................................................ 4
2.2. Ravnoteza.......................................................................................................... 5
3. Modeli igre 5
3.1. Ekstenzivan model............................................................................................. 5
3.2. Strategijski ili normalan model.......................................................................... 6
3.3. Kooperativni model........................................................................................... 8
4. Koncepti ravnoteze 8
4.1. Dominantne strategije....................................................................................... 8
4.1.1. Dilema zatvorenika..................................................................................... 9
4.1.2. Kooperativne i nekooperativne igre........................................................... 10
4.2. Iterirana dominacija.......................................................................................... 11
4.2.1. Bitka na jezeru Bismarck........................................................................... 11
4.3. Nasheva ravnoteza............................................................................................. 15
4.3.1. Zatvorene svinje......................................................................................... 15
4.3.2. Dilema modelatora..................................................................................... 16
4.3.3. Bitka spolova.............................................................................................. 17
5. Teoremi o fiksnoj tocki 18
5.1. Topoloski prostori.............................................................................................. 18
5.2. Banachov teorem o fiksnoj tocki........................................................................ 21
5.3. Brouwerov teorem o fiksnoj tocki....................................................................... 22
6. Kakutanijev teorem o fiksnoj tocki 24
7. Nashev teorem 30
7.1. Kombinirane strategije....................................................................................... 30
7.2. Veza najboljeg odgovora..................................................................................... 30
Literatura 33
Sazetak 34
Summary 35
Zivotopis 36
1
Uvod
U prvom dijelu rada dan je kratak Povijesni razvoj teorije igara. Teorija igara je suvremena
matematicka disciplina ciji razvoj zapocinje u 18. i 19. stoljecu. Antoine Augustin Cournot,
Francis Ysidro Edgeworth i Emile Borel svojim su radom postavili temelje moderne teorije
igara. Njezin razvoj tekao je paralelno s razvojem moderne ekonomije, u kojoj teorija igara
ima brojne primjene. U 20. stoljecu javljaju se najznacajnija imena ove discipline, a to su
John von Neumann i Oskar Morgenstern, cija knjiga Theory of Games and Economic Behavior
predstavlja pocetak analize moderne teorije igara, a proucava problematiku koncepta ravnoteze
u igrama. Toj problematici pozornost je pridavao i americki matematicar John Nash, cije ime
danas povezujemo s dva najznacajnija koncepta u teoriji igara, a to su Nashevo pogodbeno
rjesenje i Nasheva ravnoteza.
U drugom poglavlju Osnovni pojmovi teorije igara definiraju se elementi igre i pravila igre.
Svaka igra ima skup igraca koji sudjeluju u igri, a svaki igrac ima na raspolaganju set strategija.
Svaka situacija u igri donosi pojedinom igracu odredenu korisnost koja je definirana funkcijom
korisnosti igraca. Matematickim modeliranjem igre predvida se ishod igre, koji predstavlja
skup korisnosti pridruzenih svakom igracu po zavrsetku igre. Cilj modeliranja igre je pronaci
ravnotezu, odnosno kombinaciju strategija koja sadrzi najbolju strategiju za svakog od igraca
u igri.
Sljedece poglavlje Modeli igri opisuje tri osnovna modela, odnosno prikaza igre. Eksten-
zivan model promatra redoslijed igre i prikazuje taj redoslijed u obliku grafa koji nazivamo
stablo igre. Strategijski ili normalan model igre stavlja teziste na strategije igraca u igri i
prikazuje igru u obliku tablice, odnosno matrice igre. Kooperativni model promatra igru u
kojoj igraci medusobno komuniciraju, pregovaraju i suraduju jedni s drugima pri donosenju
odluka, odnosno odabiru strategija u igri.
U poglavlju Koncepti ravnoteze opisana su tri koncepta ravnoteze: ravnoteza dominantne
strategije, iterirana dominacija i Nasheva ravnoteza, najpoznatiji i najcesce upotrebljeni kon-
cept ravnoteze u teoriji igara. Dilema zatvorenika je primjer igre u kojoj je ilustriran koncept
ravnoteze dominantne strategije, dok bitka na jezeru Bismarck ilustrira koncept ravnoteze iteri-
rane dominacije. Nasheva ravnoteza opisana je kroz tri primjera: Zatvorene svinje, Dilema
modelatora i Bitka spolova. Sve igre opisane u ovom dijelu pronalaze brojne primjene u
ekonomskim situacijama iz stvarnog zivota.
Teoremi o fiksnoj tocki predstavljaju vazan alat u dokazivanju osnovnih teorema teorije
igara. U ovom poglavlju dane su definicije osnovnih topoloskih prostora i navedena neka
svojstva funkcija u tim prostorima. Iskazan je i dokazan Banachov teorem o fiksnoj tocki, koji
dokazuje postojanje fiksne tocke kontrakcije. Definiran je pojam simplexa te iskazan i dokazan
2
Brouwerov teorem o fiksnoj tocki.
Kakutanijev teorem o fiksnoj tocki cini sredisnji dio dokaza Nashevog teorema o postojanju
ravnoteze u nekooperativnim igrama. U ovom poglavlju definira se veza, postupak koji pres-
likava tocku u skup tocaka, i pojam neprekidnosti veze. Navedeni su teoremi koji prethode
Kakutanijevom teoremu u razvoju ove teorije te je iskazan i dokazan sam Kakutanijev teorem
o fiksnoj tocki.
U posljednjem poglavlju rada Nashev teorem definiran je pojam kombiniranih strategija i
veza najboljeg odgovora. Profil strategija je prema tome Nasheva ravnoteza ako je on fiksna
tocka veze najboljeg odgovora za cijelu igru. Na samom kraju iskazan je Nashev teorem koji
dokazuje da svaka igra sa konacno mnogo igraca ima Nashevu ravnotezu u kombiniranim
strategijama.
3
1. Povijesni razvoj teorije igara
Ideje na kojima pociva matematicka disciplina teorije igara javljaju se vec u ranoj povijesti.
Neke od tih ideja mogu se pronaci u Bibliji i Talmudu, potom u radovima Descartesa i Sun
Tzua, a kasnije u zapisima Charlesa Darwina.
Osnove moderne teorije igara proizlaze iz tri rada napisana u 18., odnosno 19. stoljecu. Prvi
rad napisao je francuski ekonomist Antoine Augustin Cournot. On je 1838. godine objavio
Researches into the Mathematical Principles of the Theory of Wealth, djelo u kojem je dao
intuitivno objasnjenje necega sto ce kasnije biti poznato kao Nasheva ravnoteza. Osim toga,
Cournot je predstavio koncept monopola, oligopola i savrsene konkurencije. U demonstraciji
ravnoteze u oligopolskoj igri, Cournot je uveo model ”best-reply” dynamics, u kojem svaki
proizvodac proizvodi kolicinu koja maksimizira njegov profit u odnosu na ukupni proizvod
proizveden u cijeloj industriji u prethodnom razdoblju.
Irski ekonomist, pravnik, matematicar i statisticar Francis Ysidro Edgeworth svojim je
radom uvelike doprinuo razvoju moderne teorije igara. U svom radu Mathematical Psychics,
objavljenom 1881. godine, objasnio je pojam konkurentske ravnoteze u trzisnoj ekonomiji.
Uocio je kako mnoge trzisne igre dopustaju vise rjesenja, ali da se broj rjesenja smanjuje s
rastom velicine trzista.
Francuski matematicar i politicar Emile Borel prvi je definirao pojam strategijskih igara.
Objavio je nekoliko radova o igri poker, u kojima je promatrao vaznost nesavrsenih informacija
i kredibiliteta igraca u igri. Borel je, proucavajuci teoriju mjere i vjerojatnost, sugerirao
postojanje kombiniranih strategija, odnosno vjerojatnosnih distrubicija strategija pojedinog
igraca.
Americki matematicar madarskog podrijetla John von Neumann je 1928. godine dao
dokaz minimax teorema. On je, zajedno s njemackim ekonomistom Oskarom Morgenster-
nom, postavio korijene analize moderne teorije igara u knjizi Theory of Games and Economic
Behavior, objavljenoj 1944. godine. Njhova knjiga stavila je fokus na koncepte ravnoteze u
igrama.
Sljedeci znacajan korak u razvoju ove discipline napravio je John Nash, americki matematicar
cije ime danas povezujemo s dva najznacajnija koncepta u teoriji igara, a to su Nashevo pogod-
beno rjesenje i Nasheva ravnoteza, koncept ravnoteze koji proucavamo u ovom radu. On je
u svom radu objavljenom 1950. godine uveo novi koncept ravnoteze i dokazao postojanje te
ravnoteze u svim konacnim igrama. John Nash, John Harsanyi i Reinhard Selten su 1994.
godine dobili Nobelovu nagradu za ekonomiju, kao priznanje njihovom doprinosu u analizi
ravnoteze u nekooperativnim igrama.
4
2. Osnovni pojmovi teorije igara
2.1. Pravila igre
Teorija igara je grana matematike koja se bavi matematickim modeliranjem problema donosenja
optimalnog rjesenja, odnosno odluke, u odredenoj situaciji pod odredenim uvjetima. Svaka
igra ima definiran skup igraca koji sudjeluju u igri. Svaki igrac u igri ima na raspolaganju skup
mogucih odluka, odnosno set strategija. Igrac odabirom strategije zeli maksimizirati svoju ko-
risnost. Kada svaki od igraca odabere svoju strategiju, imamo odredenu situaciju u igri. Skup
svih mogucih situacija zove se prostor strategija. U igri svaki igrac ima definiranu funkciju
korisnosti, koja svakoj situaciji u igri pridruzuje odredenu vrijednost, odnosno korisnost koju
ta situacija donosi igracu. Igraci donose odluke na temelju informacija koje posjeduju. Skup
informacija odredenog igraca predstavlja njegovo znanje o vrijednostima razlicitih varijabli u
odredenom trenutku. Informacije koje igraci posjeduju i akcije koje poduzimaju cine redoslijed
igre.
Svrha matematickog modeliranja igre je objasniti kako dani skup okolnosti dovodi do
odredenog rezultata. Taj rezultat zove se ishod igre i on predstavlja skup vrijednosti, odnosno
korisnosti pridruzenih svakom igracu nakon zavrsetka igre.
Ponekad je korisno u model igre ukljuciti i tzv. pseudo - igrace, cije su odluke u potpunosti
izvan utjecaja drugih igraca u igri. U poslovnim igrama pseudo - igrac je okolina u kojoj
se odredena igra odvija. Okolina donosi slucajne odluke na odredenom mjestu u igri i s
odredenom vjerojatnoscu. Razlicite realizacije u igri ovise o rezultatima slucajnih poteza.
Skup igraca koji sudjeluju igri oznacavamo sa I = {1, 2, ..., n}.Akcija ili potez igraca i ∈ I, oznacena s ai, predstavlja odluku, odnosno izbor koji on
donosi. Skup mogucih poteza igraca i je skup Ai = {ai}. Kombinacija poteza u igri je uredeni
skup akcija a = (ai), i = 1, ..., n svih n igraca u igri.
Korisnost πi(s1, ..., sn) igraca i je:
i) korisnost koju igrac i ostvaruje nakon sto svi igraci i okolina izaberu svoje strategije i igra
zavrsi, ili
ii) ocekivana korisnost igraca i kao funkcija njegove i strategija ostalih igraca u igri.
O kojoj se korisnosti radi, stvarnoj ili ocekivanoj, moze se zakljuciti iz konteksta odredene
situacije.
Strategija si igraca i je pravilo po kojem on donosi odluke, odnosno povlaci poteze u svakom
trenutku igre, na temelju danog skupa informacija. Svaki igrac i ∈ I ima na raspolaganju
konacan skup cistih strategija Si = {1, 2, ...,mi}, mi ≥ 2. Vektor s = (s1, s2, ..., sn) predstavlja
jednu kombinaciju strategija svih n igraca i zove se profil cistih strategija. Skup svih mogucih
profila cistih strategija je Kartezijev produkt
S =∏i∈I
Si = S1 × S2 × · · · × Sn.
5
Skup S zovemo prostor cistih strategija. Svaki profil strategija s ∈ S odreduje jedan ishod igre,
odnosno korisnost za svakog igraca i ∈ I. Dakle, svakom igracu je pridruzena njegova funkcija
korisnosti πi : S → R. Za svaki strategijski profil s ∈ S postoji i kombinirana funkcija korisnosti
cijele igre π : S → Rn definirana sa π(s) = (π1(s), π2(s), ..., πn(s)), gdje je πi, i = 1, ..., n
funkcija korisnosti i-tog igraca.
2.2. Ravnoteza
Predvidanje ishoda igre sastoji se od odabira jedne ili vise kombinacija strategija koje pred-
stavljaju racionalan izbor igraca u svrhu postizanja maksimalne korisnosti.
Ravnoteza s∗ = (s∗1, ..., s∗n) je kombinacija strategija koja sadrzi najbolju strategiju za
svakog od n igraca u igri. Ravnotezne strategije su strategije koje igraci odabiru s ciljem
maksimiziranja njihove korisnosti u igri.
Kako bi pronasao ravnotezu, modelator igre mora definirati pravilo temeljem kojeg odlucuje
sto je ”najbolja strategija” u igri. To pravilo zove se koncept ravnoteze.
Koncept ravnoteze ili koncept rjesenja F : {S1, ..., Sn, π1, ..., πn} → s∗ je pravilo koje
definira ravnotezu igre na temelju mogucih kombinacija strategija i funkcija korisnosti svih n
igraca u igri.
Poznato je vise koncepata ravnoteze, no samo su neki od njih generalno prihvaceni. U
nastavku rada su kroz primjere objasnjeni koncepti ravnoteze dominantne strategije i iterirane
dominacije, dok je naglasak stavljen na Nashevu ravnotezu, najpoznatiji i najcesce koristen
koncept ravnoteze u teoriji igara.
3. Modeli igre
Teorija igara razlikuje tri osnovna modela igre:
1. ekstenzivan model;
2. strategijski ili normalan model;
3. kooperativni model.
3.1. Ekstenzivan model
Promotrimo jednostavnu igru s dva igraca: Igrac 1 i Igrac 2. Igrac 1 prvi povlaci potez i
vrsi izbor izmedu dvije alternative. Nakon sto Igrac 1 odigra svoj potez, na redu je Igrac 2,
ali pritom pretpostavljamo da on ne zna koji je potez povukao Igrac 1. Igrac 2 takoder ima
ponudene dvije alternative i vrsi izbor izmedu njih. Kada su oba igraca povukla poteze, igra
je gotova i, ovisno o svom izboru, igraci ostvaruju odredenu korisnost.
Redoslijed igre mozemo prikazati u obliku grafa koji zovemo stablo igre.
6
Igrac 1t��
��
���
���
���
�
ZZZZZZZZZZZZZZ
1 2
t tIgrac 2 Igrac 2ZZZZZZ
���
���
1 2 1 2
(5,6) (-3,10) (10,-2) (-2,-1)
Slika 1. Stablo igre
Slika 1 prikazuje stablo ove igre. Svaki cvor u stablu je oznacen imenom igraca kojeg
predstavlja. Na prvoj razini stabla imamo jedan cvor koji predstavlja Igraca 1. Bridovi koji
izlaze iz tog cvora oznaceni su brojevima 1 i 2 i predstavljaju dvije alternative izmedu kojih
Igrac 1 vrsi izbor. Na drugoj razini stabla oba cvora nose oznaku Igrac 2 i smjestena su u
jednoj elipsi cime zelimo naglasiti da pripadaju istom skupu informacija. Ta cinjenica upucuje
na to da Igrac 2 ne zna koji je potez povukao Igrac 1.
U ovoj igri moguca su cetiri razlicita ishoda. Korisnosti koje proizlaze iz tih ishoda dane su
u obliku uredenih parova na kraju svake zavrsne grane. U svakom paru prvi clan predstavlja
korisnost Igraca 1, a drugi korisnost Igraca 2 po zavrsetku igre.
U teoriji igre poput saha, pokera ili cak poslovne igre mogu se prikazati ovim modelom
igre.
3.2. Strategijski ili normalan model
Najcesci oblik prikaza igre je tzv. matrica igre. Igra koju smo prikazali pomocu stabla igre na
Slici 1. moze se predstaviti u obliku matrice kao na Slici 2.
Strategije igraca 2
1 2
Strategije Igraca 112
5, 6 -3, 1110, -2 -2, -1
Slika 2. Matrica igre
Igra je prikazana u obliku matrice 2×2. Brojevi u celijama predstavljaju korisnosti Igraca
1 i Igraca 2, redom, sto je rezultat kombinacije njihovih izbora.
Promatrajuci stablo i matricu igre u ovom primjeru ne mozemo uociti razliku izmedu
poteza, odnosno akcije, i strategije igraca. Kako bismo uvidjeli tu razliku, razmotrimo igru u
7
kojoj Igrac 2 posjeduje informaciju o prethodno odigranom potezu Igraca 1. U ovom slucaju
Igrac 2 raspolaze s vise informacija. Cvorovi na drugoj razini stabla sada ne pripadaju is-
tom skupu informacija. Svaki cvor koji pripada Igracu 2 nalazi se unutar posebnog skupa
informacija, koji su prikazani u obliku kruznica na Slici 3.
Igrac 1t��
���
��
���
���
�
ZZZZZZZZZZZZZZ
1 2
t tIgrac 2 Igrac 2ZZZZZZ
���
���
&%'$
&%'$
1 2 1 2
(5,6) (-3,10) (10,-2) (-2,-1)
Slika 3. Stablo igre u kojoj Igrac 2 posjeduje informaciju o izboru strategije Igraca 1
Posjedovanje dodatne informacije o izboru Igraca 1 udvostrucilo je broj strategija koje su
na raspolaganju Igracu 2. On sada bira izmedu cetiri strategije:
1. strategija: ako Igrac 1 odigra potez 1, biraj 1; ako Igrac 1 odigra potez 2, biraj 1.
2. strategija: ako Igrac 1 odigra potez 1, biraj 1; ako Igrac 1 odigra potez 2, biraj 2.
3. strategija: ako Igrac 1 odigra potez 1, biraj 2; ako Igrac 1 odigra potez 2, biraj 1.
4. strategija: ako Igrac 1 odigra potez 1, biraj 2; ako Igrac 1 odigra potez 2, biraj 2.
Ovu igru mozemo prikazati u obliku matrice, tj. kao strategijski ili normalan model igre.
Strategije Igraca 2
(1→ 1; 2→ 1) (1→ 1; 2→ 2) (1→ 2; 2→ 1) (1→ 2; 2→ 2)
Strategije 1
Igraca 1 25, 6 5, 6 -3, 11 -3, 1110, -2 -2,-1 10,-2 -2,-1
Slika 4. Matrica igre u kojoj Igrac 2 posjeduje informaciju o izboru strategije Igraca 1
Strategiju igraca mozemo shvatiti kao plan koji pokriva sve moguce ishode igre na osnovu
informacija dostupnih igracu u odredenom trenutku. U igri kao sto je poker, postoje milijuni
i milijuni strategija dostupnih igracu. Medutim, u stvarnom zivotu ljudi igraju poker kom-
binirajuci vise strategija prema razlicitim pravilima. Stoga modeliranje igre kao sto je poker
predstavlja ogroman posao za teoreticare ove matematicke discipline, jer moraju posvetiti
pozornost svakom pravilu koje igraci uzimaju u obzir u igri.
U prvom primjeru igra je imala dva igraca od kojih je svaki imao dvije strategije na
raspolaganju, no ovaj model igre moze se primijeniti na bilo koji broj igraca s bilo kojim
brojem strategija na raspolaganju.
8
Primjer 3.1 Na Slici 5. dan je matricni zapis igre s tri igraca od kojih svaki vrsi izbor izmedu
dvije alternative.
Strategije igraca 2
1 2
Strategije Igraca 112
10, 10, 10 -1, -1, -1-1, -1, -1 5, 5, 5
Matrica 1
Strategije Igraca 3 ����������7
-
Strategije igraca 2
1 2
Strategije Igraca 112
10, 10, 10 -1, -1, -1-1, -1, -1 5, 5, 5
Matrica 2
Slika 5. Strategijski model igre s tri igraca
Strategijski model igre s tri igraca u kojem svaki igrac ima dvije opcije na raspolaganju
mozemo prikazati pomocu dvije matrice kao na Slici 3. Brojevi u celijama matrica predstavl-
jaju korisnosti prvog, drugog i treceg igraca, redom. Izbor strategije Igraca 1 znaci odabir
prvog ili drugog retka matrice. Strategija Igraca 2 predstavljena je stupcima matrice, a Igrac
3 izbor svoje strategije prikazuje odabirom Matrice 1 ili Matrice 2.
3.3. Kooperativni model
Pretpostavimo da nas ne zanima strategija pojedinog igraca, vec promatramo odnos igraca
u igri. Svi igraci iznose svoje razloge, raspravljaju i pregovaraju ili suraduju jedni s drugima
otkrivajuci svoje namjere o sljedecem potezu te odlucuju kako ce podijeliti korisnosti. Pojedini
igrac ili grupa igraca moze kao argument u pregovaranju ili prijetnju iskoristiti cinjenicu o
povecanju svoje osobne koristi u slucaju odbacivanja suradnje s ostalim igracima.
Dobitak ili zarada stecena u nekoj koaliciji igraca moze se predstaviti ocekivanjem skupa
funkcija koje zovemo karakteristicne funkcije igre. Pojam skup funkcija ovdje znaci da imamo
funkcije definirane za cijeli skup igraca u igri.
4. Koncepti ravnoteze
4.1. Dominantne strategije
Za bilo koji vektor y = (y1, ..., yn) sa y−i oznacavamo vektor (y1, ..., yi−1, yi+1, ..., yn). Za taj
dio vektora y kazemo da nije povezan s igracem i.
9
Upotrebljavajuci ovako definiranu notaciju, vektor s−i predstavlja kombinaciju strategija
svih igraca osim i-tog igraca. Ta kombinacija strategija je od velike vaznosti za igraca i, jer
on na osnovu nje izabire svoju strategiju.
Definicija 4.1 Najbolji odgovor igraca i na kombinaciju strategija s−i je strategija s∗i koja
mu donosi najvecu korisnost, odnosno za koju vrijedi
πi(s∗i , s−i) ≥ πi(si, s−i),∀si 6= s∗i .
Najbolji odgovor je strogo najbolji ukoliko nijedna druga strategija ne donosi toliko dobiti
kao strategija s∗i , inace je slabo najbolji.
Definicija 4.2 Strategija s∗i je dominantna strategija ukoliko je ona najbolji odgovor na
bilo koju kombinaciju strategija ostalih igraca, tj. ukoliko vrijedi
πi(s∗i , s−i) ≥ πi(si, s−i),∀s−i,∀si 6= s∗i .
Strategije podredene ovoj strategiji zovu se dominirane strategije. Ravnoteza domi-
nantne strategije je kombinacija strategija sastavljena od dominantnih strategija svakog
igraca.
Dominantna strategija igraca predstavlja njegov najbolji odgovor i na gotovo nemoguce i
nevjerojatne poteze ostalih igraca. Najveci broj igara nema dominantne strategije. U njima
igraci moraju predvidjeti poteze ostalih igraca kako bi odigrali svoj potez.
4.1.1. Dilema zatvorenika
(vidi [1], [2])
Dilema zatvorenika je poznati primjer igre koji ilustrira koncept ravnoteze dominantne
strategije. U ovoj igri sudjeluju dva zatvorenika, Zatvorenik 1 i Zatvorenik 2, koje istrazitelj
ispituje u odvojenim prostorijama. Ako obojica priznaju zlocin, svaki je osuden na sest go-
dina zatvora. Ako obojica poreknu svoju upletenost u zlocin, tada ce s vjerojatnoscu 0.1
ipak biti osudeni na 10 godina zatvora. Stoga je ocekivana korisnost u ovom slucaju -1 za
svakog zatvorenika. Ako samo jedan od zatvorenika prizna krivnju, bit ce pusten, ali ce drugi
zatvorenik u tom slucaju biti osuden na 10 godina zatvora. Svaki od igraca ima na raspola-
ganju dva poteza: priznati ili poreci krivnju.
Zatvorenik 2
Poricanje Priznanje
Zatvorenik 1PoricanjePriznanje
-1, -1 -10, 00, -10 -6, -6
Slika 6. Dilema zatvorenika
10
Svaki igrac u ovoj igri ima dominantnu strategiju. Zatvorenik 1 ne zna koji je potez odigrao
Zatvorenik 2. Medutim, u slucaju da je Zatvorenik 2 porekao krivnju, Zatovrenik 1 moze poreci
krivnju s ocekivanom korisnoscu -1 ili priznati krivnju s korisnoscu 0. U slucaju da Zatvorenik
2 prizna krivnju, Zatvorenik 1 moze poreci krivnju s ocekivanom korisnoscu -10 ili priznati
krivnju s korisnoscu -5. U oba slucaja, priznanje krivnje obecava vecu korisnost Zatvoreniku 1.
Buduci je igra simetricna, zakljucak je isti za Zatvorenika 2. Ravnoteza dominantne strategije
je (Priznanje, Priznanje), a ravnotezne korisnosti su (−6,−6), sto je losiji ishod za oba
igraca nego slucaj (−1,−1), jer je 12 najveci moguci zbroj godina zatvora na koje zatvorenici
mogu biti osudeni.
Ravnoteza dominantne strategije je snazan rezultat koji je robustan na bitne promjene
modela. Rezultat ostaje isti cak i u slucaju promjene skupa informacija. Na primjer, ako
Zatvorenik 2 zna je li Zatvorenik 1 priznao krivnju ili ne, ravnoteza se ne mijenja. Zatvorenik
2 ce u oba slucaja priznati krivnju, a Zatvorenik 1 takoder priznaje krivnju znajuci da ce
Zatvorenik 2 to isto uciniti nakon njega.
Dilema zatvorenika je model igre koji se moze primijeniti u mnogim stvarnim situacijama:
definiranje cijena u uvjetima oligopola, postizanje odredene cijene na drazbama, pokusaji
prodaje, politicko nadmetanje i rat vrsta. Uvijek kada promatramo igru pojedinaca u kojoj
oba mogu stradati, najbolji model kojim mozemo predvidjeti ishod igre i pronaci ravnotezu u
igri je model dileme zatvorenika.
4.1.2. Kooperativne i nekooperativne igre
U prethodnom dijelu promatrali smo igru u kojoj dva zatvorenika donose odluke neovisno
jedan od drugoga, nalazeci se u odvojenim prostorijama i ne znajuci koju je odluku donio
drugi igrac. Pitanje je mijenja li se ishod igre ako se zatvorenici dogovore o svojim iskazima
prije ispitivanja. To ovisi o snazi njihovih obecanja. Ako ih obecanja ne vezu, oba zatvorenika
ce priznati krivnju, mada su se netom prije dogovorili o zajednickom poricanju krivnje.
Definicija 4.3 Kooperativna igra je igra u kojoj igraci mogu sklopiti obvezujuci dogovor.
Nekooperativna igra je igra u kojoj nema mogucnosti sklapanja takvog dogovora.
Teorija kooperativnih igara je aksiomatska teorija koja stavlja fokus na ishod igre i njegove
posljedice, ne obazirujuci se pritom na strategije koje prethode tom ishodu igre. U primjen-
jenoj ekonomija teorija kooperativnih igara pronalazi svoje mjesto u modeliranju pregovora i
pogodbi.
Dilema zatvorenika je primjer nekooperativne igre. Medutim, ova igra se moze modelirati i
kao koperativna igra, ako dozvolimo zatvorenicima skalapanje obvezujuceg dogovora. Kooper-
ativne igre cesto dopustaju igracima podjelu zarade iz kooperacije na osnovu tzv. marginalnih
isplata - transfera izmedu igraca koji mijenjaju pretpostavljene korisnosti.
11
Razlika izmedu kooperativne i nekooperativne igre nije sukob ili odutnost sukoba u igri.
Sukob moze biti prisutan u modeliranju obje igre.
Primjer 4.1 i) Kooperativna igra bez sukoba: Svaki radnik postrojenja bira jedan zadatak
koji ce preuzeti na sebe. Svi zadaci su jednake tezine, a radnici ih biraju tako da zajednickim
radom, odnosno strategijom, ostvare najbolji moguci ucinak.
ii) Kooperativna igra sa sukobom: Pregovaranje oko cijene izmedu ponudaca i kupca u uvje-
tima monopola i monopsona (jedan ponudac i jedan kupac).
iii) Nekooperativna igra sa sukobom: Dilema zatvorenika.
iv) Nekooperativna igra bez sukoba: Dvije farmaceutske tvrtke koje prodaju isti lijek, a
medusobno ne komuniciraju.
4.2. Iterirana dominacija
U prethodnom dijelu naglasili smo da se ravnoteza dominantne strategije postize u malom
broju igara. Medutim, dominacija moze biti korisna i u slucaju kada ishodi igre nisu kristalno
jasni kao sto su u dilemi zatvorenika.
4.2.1. Bitka na jezeru Bismarck
(vidi [2])
Bitka na jezeru Bismarck vodena je 1943. godine na Juznom Pacifiku. Japanski general
Imamura imao je zadatak prevesti japanske trupe preko jezera Bismarck u Novu Gvineju. S
druge strane, general Kenney imao je namjeru bombardirati te trupe. General Imamura imao
je na raspolaganju dvije rute; kracu sjevernu ili duzu juznu rutu do Nove Gvineje. General
Kenney morao je odluciti na koju ce stranu poslati svoje zrakoplove da nadu i bombardiraju
Japance. Naravno da je general Kenney mogao opozvati svoje bombardere ako nije pogodio
rutu kojom su isli vojnici generala Imamure, ali u tom slucaju Kenney bi izgubio dragocjeno
vrijeme za bombardiranje japanskih trupa.
Igraci u ovoj igri su general Kenney i general Imamura. Oba igraca imaju isti skup mogucih
poteza: {Sjever, Jug}, ali njihove korisnosti nisu iste ni u jednom slucaju. U svakom slucaju
general Imamura gubi tocno onoliko koliko general Kenney dobiva.
Imamura
Sjever Jug
KenneySjever
Jug
2, -2 ↔ 2, -2↑ ↓
1, -1 ← 3, -3
Slika 7. Bitka na jezeru Bismarck
12
U ovoj igri nijedan igrac nema dominantnu strategiju. General Kenney ce izabrati Sjever
ako smatra da ce Imamura takoder odabrati Sjever. Medutim, ako Kenney misli da ce
Imamura izabrati Jug, Kenney u tom slucaju takoder odabire Jug. S druge strane, general
Imamura ce odabrati Sjever ako smatra da ce Kenney poci na Jug. U suprotnom, ako smatra
da ce Kenney poci na Sjever, Imamura je indiferentan u odabiru akcije. Odabir svakog potezu
ovisnosti o odluci drugog igraca, prikazuju strelice na gornjoj shemi. No, i u ovoj igri moguce
je postici ravnotezu, upotrebljavajuci koncept slabe dominacije.
Definicija 4.4 Strategija s′i je slabo dominirana ako postoji neka druga strategija s′′i koja u
svim situacijama igre nije losija od strategije s′i, a u nekim situacijama donosi vecu korisnost
igracu od strategije s′i. Preciznije, strategija s′i je slabo dominirana ako postoji strategija s′′itakva da vrijedi:
πi(s′′i , s−i) ≥ πi(s
′i, s−i), ∀s−i,
πi(s′′i , s−i) > πi(s
′i, s−i), za neki s−i.
Definicija 4.5 Ravnoteza slabo dominirane strategije je kombinacija strategija nastala
brisanjem svih slabo dominiranih strategija svakog igraca u igri.
Eliminiranje slabo dominiranih strategija nije korisno u slucaju ove igre. Strategija Jug je
slabo dominirana strategija za generala Imamuru jer korisnosti strategije Sjever nikada nisu
manje od onih za strategiju Jug, a u slucaju da Kenney izabere Jug, Sjever donosi vecu
korisnost Imamuri. Za Kenneya nijedna strategija nije slabo dominirana. Stoga nije moguce
pronaci ravnotezu slabo dominirane strategije u ovoj igri.
Definicija 4.6 Ravnoteza iterirane dominacije je kombinacija strategija nastala brisan-
jem slabo dominirane strategije iz skupa strategija jednog igraca, zatim trazenjem preostalih
slabo dominiranih strategija, brisanjem jedne od njih, nastavljajuci taj postupak sve dok svakom
igracu ne ostane samo jedna strategija na raspolaganju.
Ovaj koncept ravnoteze moze se primijeniti na igru koja predstavlja bitku na jezeru Bis-
marck. Prema ovom konceptu ravnoteze, general Kenney zna da ce Imamura izabrati strate-
giju Sjever, jer je to za Imamuru slabo dominantna strategija. Stoga Kenney moze eliminirati
potez ”Imamura izabire Jug”. Brisanjem drugog stupca u tablici 3, Kenney ima na raspo-
laganju jako dominantnu strategiju: on se odlucuje za Sjever, jer je to strategija koja mu
donosi strogo vecu korisnost od strategije Jug. Kombinacija strategija (Sjever, Sjever) je
ravnoteza iterirane dominacije u ovoj igri, a upravo je takav ishod imala i stvarna bitka na
jezeru Bismarck koja se odigrala 1943. g.
Zanimljivo je promatrati ishod ove igre ako promijenimo redoslijed igre ili strukturu skupa
informacija u igri. Ako general Kenney igra prvi, kombinacija strategija (Sjever, Sjever)
13
ostaje ravnoteza u igri, medutim, kombinacija (Sjever, Jug) postaje takoder ravnoteza. Ko-
risnosti su jednake za obje ravnoteze, ali su ishodi igre drugaciji.
Ako Imamura igra prvi, onda je (Sjever, Sjever) jedina ravnoteza u igri. Ono sto je vazno
uociti ovdje je da igrac koji igra prvi daje drugom igracu na raspolaganje vise informacija prije
nego sto drugi igrac povuce svoj potez. Tocno vrijeme poteza je manje vazno. Ako general
Kenney ”probije” japanski kod i sazna Imamurin plan, nije bitno hoce li igraci povuci svoje
poteze u isto vrijeme. U tom slucaju, igru shvacamo kao slijed poteza. Dakle, bez obzira na
to hoce li general Imamura prvi povuci potez ili ce Kenney razbiti japanski kod, Kenneyev
skup informacija bit ce {Imamura je krenuo na Sjever} ili {Imamura je krenuo na Jug},nakon Imamurine odluke. Stoga ce Kenneyeva strategija ravnoteze biti definirana na sljedeci
nacin: (Sjever ako Imamura izabere Sjever, Jug ako Imamura izabere Jug).
U ekonomskim modelima, tvrtke i pojedinci su cesto indiferentni prema njihovom ponasanju
u ravnotezi. U modelima savrsenog natjecanja, dobit koju tvrtke ostvaruju jednaka je nuli.
Medutim, cinjenica jest da neke tvrtke ostaju na trzistu, dok se druge povlace iz natjecanja. U
modelu monopola, ako monoplist zna da je kupac voljan platiti 100 kn vise za njegov proizvod,
on ce podici cijenu tog proizvoda za tocno 100 kn . Kupac je tada indiferentan u odluci kupnje
ili odustajanja od kupnje proizvoda, a ravnoteza je postignuta tek kada kupac kupi proizvod.
Problem koji takoder promatramo je pojavljivanje visestruke ravnoteze u igri. Ravnoteza
dominantne strategije u bilo kojoj igri je jedinstvena, ako postoji. Svaki igrac ima najvise jednu
strategiju cije su korisnosti u bilo kojoj kombinaciji strategija vece od bilo koje druge strategije
koju taj igrac ima na raspolaganju. Stoga dominantne strategije svih igraca mogu razultirati
samo jednom kombinacijom, koja u tom slucaju predstavlja ravnotezu dominantne strategije.
Ravnoteza jako iterirane dominacije je takoder jedinstvena, ako postoji. Ravnoteza slabo
iterirane dominacije ne mora biti jedinstvena, jer redoslijed brisanja strategija ima utjecaj na
konacan ishod igre. Ukoliko se sve slabo dominirane strategije brisu istovremeno, rezultirajuca
kombinacija strategija bit ce jedinstvena ravnoteza. No, moguce je da nakon brisanja slabo
dominiranih strategija ne ostane nijedna kombinacija strategija na raspolaganju.
Primjer 4.2 Igra ”Svicarski sir” (vidi [2])
Ivan
Lijevo Desno
MarkoGore
Dolje
0,0 ↔ 0,0l l
0,0 ↔ 0,0
Slika 8. Igra ”Svicarski sir”
U ovoj igri svaka od strategija je slabo dominirana za svakog igraca. Stoga, jedna ravnoteza
iterirane dominacije je kombinacija strategija (Gore, Lijevo), nastale eliminiranje Markove
14
strategije Dolje i Ivanove strategije Desno. Medutim, kombinacija strategija (Dolje, Desno)
je takoder ravnoteza iterirane dominacije. Naime, u ovoj igri svaka kombinacija strategija
predstavlja ravnotezu slabo dominantne strategije, kao i ravnotezu iterirane dominacije.
Primjer 4.3 Igra ”Ponavljajuci put” (vidi [2])
Stupac
s1 s2 s3
Redakr1r2r3
2, 12 1, 10 1, 120, 12 0, 10 0, 110 ,12 1, 10 0, 13
Slika 9. Igra ”Ponavljajuci put”
Kombinacije strategija (r1, s1) i (r1, s3) su ravnoteze iterirane dominacije, jer su obje
nastale brisanjem slabo dominiranih strategija. Brisanje slabo dominiranih strategija moze ici
u poretku (r3, s3, s2, r2) ili (r2, s2, s1, r3).
Bez obzira na probleme koji se javljaju prilikom trazenja slabo dominantne ravnoteze ili
ravnoteze iterirane dominacije, brisanje slabo dominantnih strategija koristan je alat i javlja
se kao dio mnogo slozenijih koncepata pronalazenja ravnoteze u igrama.
Bitka na jezeru Bismarck predstavlja poseban primjer igre, jer korisnosti igraca u svakoj
kombinaciji strategija u toj igri u zbroju daju nulu. Takva igra zove se zero− sum igra.
Definicija 4.7 Zero-sum igra je igra u kojoj zbroj korisnosti svih igraca u svakoj kombinaciji
strategija iznosi nula. Igra u kojoj taj zbroj nije uvijek nula zove se non-zero-sum igra.
U zero-sum igri ono sto jedan igrac osvoji, drugi mora izgubiti. Bitka na jezeru Bismarck
primjer je zero-sum igre, dok je Dilema zatvorenika primjer non-zero-sum igre. Zero-sum
igre zaokupljale su teoreticare u teoriji igara mnogo godina, no njihovo pojavljivanje u realno
svijetu i ekonomiji je neuobicajeno. Jedan od rijetkih primjera je igra pregovaranja izmedu
dva igraca koji dijele visak zarade. Medutim, i ova igra se danas cesto modelira kao non-zero-
sum igra, u kojoj se visak zarade smanjuje proporcionalno s vremenom koje igraci utrose na
odluku o podjeli zarade. U stvarnosti svaka podjela imovine moze rezultirati gubitkom jednog
njenog dijela. Primjer takvog gubitka je zarada koju si prisvajaju odvjetnici u brakorazvodnim
parnicama.
Iako se primjeri igara navedeni u ovom poglavlju cine smijesnima i jednostavnima, oni se
vrlo cesto koriste u modeliranju ekonomskih situacija. Bitka na jezeru Bismarck je igra koja
moze posluziti kao model korporativnih strategija. Pretpostavimo da su na trzistu konstantne
velicine prisutne dvije tvrtke, Kenney d.o.o. i Imamura d.d., koje zele maksimizirati svoj udio
15
na trzistu izborom izmedu dva proizvoda dizajna Sjever i Jug. Kenney ima marketinsku pred-
nost i zeli izravno natjecanje, dok bi se Imamura radije sam izborio za svoj udio. Ravnoteza je
(Sjever, Sjever), sto znaci da ce obje tvrtke u ovom trzisnom natjecanju odabrati proizvod
Sjever.
4.3. Nashova ravnoteza
Nashova ravnoteza je najvazniji koncept ravnoteze u ekonomiji. Ime je dobio po Johnu Nashu,
matematicaru i ekonomistu koji je uveo taj koncept i, koristeci Kakutanijev teorem o fiksnoj
tocki, dokazao postojanje te ravnoteze u svim konacnim igrama.
4.3.1. Zatvorene svinje
(vidi [2])
Dvije svinje zatvorene su u uskom oboru koji na jednom kraju ima panel, a na drugom
valov za hranu. Kada svinja pritisne panel, taj potez ”kosta” ju dvije jedinice korisnosti. U
tom trenutku, na drugom kraju obora u valov za hranu dospijeva 10 jedinica hrane. Jedna
svinja je ”dominantna” (pretpostavimo da je to velika svinja) i ako ona stigne prva na valov,
druga svinja ce dobiti samo njene ostatke, koji vrijede jednu jedinicu hrane. Ako mala svinja
stigne prva na valov, pojest ce 4 jedinice hrane, a ukoliko obje svinje stignu na valov u isto
vrijeme, mala svinja dobiva 3 jedinice hrane.
Mala svinja
Pritisnuti Cekati
Velika svinjaPritisnuti
Cekati
5,1 → 4,4↓ ↑
9,-1 → 0,0
Slika 10. Zatvorene svinje
Ova igra nema ravnotezu dominantne strategije, jer odluka velike svinje ovisi o njenoj
pretpostavci odluke koju ce donijeti mala svinja. Ako velika svinja misli da ce mala svinja
pritisnuti panel, ona ce tada cekati na valovu. U suprotnom, ukoliko velika svinja misli da ce
mala svinja cekati na valovu, velika svinja ce pritisnuti panel. U ovoj igri postoji ravnoteza
iterirane dominacije: to je kombinacija strategija (Pritisnuti, Cekati). Medutim, u nastavku
rada upotrijebit cemo drugaciji slijed razmisljanja koji nas dovodi do novog koncepta ravnoteze
u teoriji igra, a to je Nashova ravnoteza.
Definicija 4.8 Kombinacija strategija s∗ je Nasheva ravnoteza ukoliko nijedan igrac ne
zeli promijeniti svoju strategiju, promatrajuci ju u odnosu na izabrane strategije drugih igraca.
Preciznije, Nashova ravnoteza je kombinacija strategija s∗ za koju vrijedi:
∀i, πi(s∗i , s∗−i) ≥ πi(s
′i, s∗−i), ∀s′i. (1)
16
Kako bismo shvatili koncept Nashove ravnoteze, potrebno je odabrati kombinaciju strate-
gija i promatrati je li svaka strategija u toj kombinaciji najbolji odgovor pojedinog igraca na
strategije ostalih igraca. Promotrimo kombinaciju strategija (Pritisnuti, Cekati). Ako velika
svinja odabere strategiju Pritisnuti, mala svinja, koja vrsi izbor izmedu korisnosti 1 iz strate-
gije Pritisnuti i korisnosti 4 iz strategije Cekati, odabrat ce strategiju Cekati. Ako mala
svinja odabere strategiju Cekati, velika svinja, koja vrsi izbor izmedu korisnosti 4 iz strate-
gije Pritisnuti i korisnosti 0 iz strategije Cekati, odabrat ce strategiju Pritisnuti. Stoga je
kombinacija strategija (Pritisnuti, Cekati) Nashova ravnoteza. Moze se pokazati da je ova
kombinacija strategija jedinstvena Nashova ravnoteza.
”Zatvorene svinje” imaju svoju analogiju u ekonomiji. Ako tvrtka Velika svinja d.o.o. uvodi
novi proizvod na trziste, sa znacajnim marketinskim troskom zbog educiranja potencijalnih
kupaca, tvrtka Mala svinja d.d. moze na trziste uvesti imitaciju tog proizvoda i ostvariti
profit, bez narusavanja zarade Velike svinje d.o.o.
Kao i u slucaju ravnoteze dominantne strategije, Nasheva ravnoteza moze biti slaba ili
jaka. Definicija (4.8) definira slabu Nashevu ravnotezu. Jaka Nasheva ravnoteza podrazumi-
jeva strogu nejednakost u izrazu (1), odnosno zahtijeva da u tom slucaju nijedan igrac nije
indiferentan izmedu ravnotezne strategije i neke druge strategije.
4.3.2. Dilema modelatora
(vidi [2])
Svaka dominantna ravnoteza je Nashova ravnoteza, ali svaka Nashova ravnoteza nije ravnoteza
dominantne strategije. Ako je strategija nekog igraca dominantna, ona je najbolji odgovor tog
igraca na bilo koje strategije ostalih igraca, ukljucujuci i njihove ranotezne strategije. Ako
je strategija igraca dio Nashove ravnoteze, ona treba biti najbolji odgovor igraca samo na
ravnotezne strategije ostalih igraca.
Situacija u dilemi modelatora ista je kao u dilemi zatvorenika, s jednom iznimkom: iako
policija ima dovoljno dokaza da uhiti zatvorenike kao vjerojatne pocinitelje zlocina, nece imati
dovoljno dokaza da ih osudi ako nijedan od zatvorenika ne prizna zlocin. Stoga su korisnosti
igraca u kombinaciji strategija (Priznanje, Priznanje) sada (0, 0) umjesto (-1, -1).
Stupac
Poricanje Priznanje
RedakPoricanjePriznanje
0, 0 -10, 00, -10 -6, -6
Slika 11. Dilema modelatora
Dilema modelatora nema ravnotezu dominantne strategije. Moze se pokazati da je kom-
binacija strategija (Priznanje, Priznanje) ravnoteza iterirane dominacije i jaka Nasheva
17
ravnoteza. Stoga je (Priznanje, Priznanje) vrlo vjerojatan ishod ove igre. Medutim, u
dilemi modelatora postoji jos jedna Nasheva ravnoteza: kombinacija strategija (Poricanje, Poricanje)
je slaba Nasheva ravnoteza u ovoj igri. Nadalje, iako je (Poricanje, Poricanje) slaba, a
(Priznanje, Priznanje) jaka Nasheva ravnoteza, poricanje krivnje u oba slucaja ima bitnu
prednost nad priznanjem i taj ishod igre je pareto-superioran: (0, 0) je uniformno vece od (-6,
-6). Ova cinjenica uvelike otezava predvidanje ishoda igre.
Dilema modelatora ilustrira uobicajen problem modelatora igre: sto predvidjeti u slucaju
postojanja dvije Nasheve ravnoteze u igri. Modelator moze rijesiti taj problem dodavanjem
novih detalja u pravila igre ili dodavanjem novih uvjeta na osnovni koncept ravnoteze u igri,
sve dok samo jedna strategija ne zadovoljava rafinirani koncept ravnoteze. Nasheva ravnoteza
moze se rafinirati na vise nacina. Modelator igre moze inzistirati na strogoj ravnotezi, elimini-
rati slabo dominirane strategije ili koristiti ravnotezu iterirane dominacije. U dilemi modela-
tora, nakon ovih rafiniranja, jedina ravnotezna strategija je (Priznanje, Priznanje). Mode-
lator moze izabrati Nashevu ravnotezu koja je pareto-dominantna nad ostalim ravnotezama;
u tom slucaju u dilemi modelatora ravnotezna strategija je (Poricanje, Poricanje).
4.3.3. Bitka spolova
(vidi [2])
U bitci spolova promatramo sukob izmedu muskaraca koji zele gledati boks i zena koje zele
ici na balet. Njihove korisnosti dane su u sljedecoj tablici.
Zena
Boks Balet
MuskaracBoks
Balet
2, 1 ← 0, 0↑ ↓
0, 0 → 1, 2
Slika 12. Bitka spolova
U ovoj igri postoje dvije Nasheve ravnoteze, a to su kombinacije strategija (Boks, Boks)
i (Balet, Balet). Postavlja se pitanje koju ce ravnotezu igraci izabrati. Nasheva ravnoteza
pretpostavlja da igraci donose odluke na temelju korektnih i konzistentnih ocekivanja. Ukoliko
igraci ne komuniciraju prije donosenja odluke, postoji mogucnost da muskarac ode na balet,
a zena na boks, vjerujuci da tako ispunjavaju zelju svog partnera. Medutim, i u tom slucaju
moguce je postici Nashevu ravnotezu ponavljajuci igru vise puta. Nakon vise ponavljanja,
razumno je ocekivati da ce igra zavrsiti u jednoj od Nashevih ravnoteza.
Obje Nasheve ravnoteze u ovoj igri su pareto-superiorne; nijedna druga kombinacija strate-
gija ne donosi vise korisnosti jednom igracu bez smanjenja korisnosti drugog igraca. U mnogim
igrama Nasheva ravnoteza nije pareto-superiorna kombinacija strategija. U dilemi zatvorenika
18
kombinacija strategija (Priznanje, Priznanje) je jedinstvena Nasheva ravnoteza, iako su ko-
risnosti (-6,-6) pareto-inferiorne u odnosu na korisnosti (-1,-1) koje donosi kombinacija strate-
gija (Poricanje, Poricanje).
U bitci spolova jako je bitno tko povlaci prvi potez. Ako muskarac ranije kupi karte za
boks, njegov potez potaknut ce zenu da odluci gledati boks. Na taj nacin, u mnogim igrama
igrac koji prvi povlaci potez ima prednost.
Bitka spolova ima mnoge primjene u ekonomiji. Jedna od njih je izbor jezika pri sklapanju
ugovora izmedu dvije tvrtke koje zele postici dogovor o prodaji, ali preferiraju razlicite uvjete.
Druga je postavljanje standarda u industriji gdje dvije tvrtke zele postaviti zajednici standard
kako bi pridobile kupce za kupnju proizvoda, ali pritom imaju razlicite afinitete.
5. Teoremi o fiksnoj tocki
Teorija fiksne tocke je vazan alat u dokazivanju osnovnih teorema teorije igara. Ova teorija
proucava pod kojim uvjetima funkcija f preslikava neku tocku u nju samu, tj. pod kojim uvje-
tima postoji tocka x∗ takva da vrijedi f(x∗) = x∗. Teoremi fiksne tocke dokazuju postojanje
ravnoteze u igri, mada je ponekad gotovo nemoguce pronaci tu tocku ravnoteze. Ako do-
bro izaberemo preslikavanje f , teorem fiksne tocke dokazuje postojanje, ali ne i jedinstvenost
ravnoteze.
Ideja koja stoji iza ovih teorema je sljedeca: Ako dozvolimo mogucnost kombiniranih
strategija, prostor strategija bit ce kompaktan i konveksan skup. Tada mozemo definirati
funkciju reakcije koja svaku situaciju u igri preslikava u nove strategije igraca. Funkciju
definiramo tako da ona, na osnovu teorema o fiksnoj tocki, ima fiksnu tocku koja nam jamci
postojanje ravnoteze u igri.
Definicija 5.1 Neka je f : X → X preslikavanje. Za tocku x∗ ∈ X kazemo da je fiksna
tocka preslikavanja f ako je f(x∗) = x∗.
Teorem 5.1 (vidi [7]) Neka je f : X → X, X = [0, 1], neprekidna funkcija. Tada postoji
tocka x∗ ∈ X takva da je f(x∗) = x∗.
5.1. Topoloski prostori
Kako bismo iskazali i dokazali sljedece teoreme o fiksnoj tocki, potrebno je uvesti neke topoloske
prostore i navesti osnovna svojstva funkcija u tim prostorima.
Definicija 5.2 Hausdorffov prostor je topoloski prostor u kojem svake dvije tocke imaju
disjunktne okoline.
19
Definicija 5.3 Neka je X bilo koji neprazan skup. Metrika na X je funkcija d : X×X → Rkoja ima sljedeca svojstva:
i) d(x, y) ≥ 0, ∀x, y ∈ X;
ii) d(x, y) = 0⇔ x = y, ∀x, y ∈ X;
iii) d(x, y) = d(y, x), ∀x, y ∈ X;
iv) d(x, y) ≤ d(x, z) + d(z, y), ∀x, y, z ∈ X.
Uredeni par (X, d) tada zovemo metricki prostor.
Primijetimo da je metricki prostor ujedno i Hausdorffov prostor.
Teorem 5.2 (vidi [7]) Neka je (X, d) metricki prostor i A ⊆ X, A 6= ∅. Tada je d(x,A)
neprekidna funkcija.
Dokaz.
Buduci je (X, d) metricki prostor, za svaki z ∈ A vrijedi nejednakost trokuta: d(x, z) ≤d(x, y) +d(y, z). Odavde slijedi d(x,A) ≤ d(x, y) +d(y, A). Na isti nacin iz d(y, z) ≤ d(y, x) +
d(x, z), ∀z ∈ A slijedi d(y, A) ≤ d(y, x) + d(x,A). Iz ovih nejednakosti imamo
d(x, y) ≥ d(x,A)− d(y, A)
i
d(y, x) ≥ d(y, A)− d(x,A),
odnosno vrijedi:
d(x, y) ≥ |d(x,A)− d(y, A)|.
Neka je ε > 0. Tada postoji δ > 0 tako da je |d(x,A) − d(y, A)| < ε , ∀x, y takve da je
d(x, y) < δ, sto je upravo definicija neprekidnosti.
2
Definicija 5.4 Normalan prostor je Hausdorffov prostor u kojem svaka dva disjunktna
zatvorena skupa imaju disjunktne okoline.
Teorem 5.3 (vidi [7]) Svaki metricki prostor je normalan prostor.
Dokaz.
Neka su A i B dva disjunktna zatvorena skupa u metrickom prostoru (X, d). Definiramo
funkciju h : X → R na sljedeci nacin:
h(x) = d(x,A)− d(x,B).
Prema teoremu (5.2) funkcija h je neprekidna funkcija.
20
Nadalje definiramo skupove
U = {x ∈ X|h(x) < 0}, V = {x ∈ X|h(x) > 0}.
Skupovi U i V su otvoreni disjunktni skupovi.
Neka je x ∈ A. Tada je d(x,A) = 0 i d(x,B) > 0, jer je prema pretpostavci A ∩ B = ∅.Slijedi h(x) < 0, odnosno x ∈ U . Stoga zakljucujemo da je A ⊂ U .
Na isti nacin, ako je x ∈ B, onda je d(x,B) = 0 i d(x,A) > 0. Slijedi h(x) > 0, odnosno
x ∈ V . Dakle, B ⊂ V .
Kako su U i V disjunktne otvorene okoline skupova A i B, prema definiciji zakljucujemo
da je (X, d) normalan prostor.
2
Definicija 5.5 Neka je X bilo koji neprazan skup, a U familija njegovih podskupova sa svo-
jstvima:
i) Unija svake familije clanova iz U je clan iz U.
ii) Presjek konacno mnogo clanova iz U je clan iz U.
iii) ∅, X su clanovi iz U.
Tada se U zove topologija ili topoloska struktura na X,a uredeni par (X,U) naziva se
topoloski prostor.
Definicija 5.6 Topoloski prostor X je regularan prostor ako za svaki zatvoreni skup A ⊂ X
i tocku x /∈ A postoje disjunktne otvorene okoline Nε(x) i Nδ(A) takve da je Nε(x)∩Nδ(A) = ∅.
Primijetimo da je regularan prostor ujedno i normalan prostor.
Definicija 5.7 Familija {Uα}α∈A podskupova topoloskog prostora X je lokalno ogranicena
ako za svaki x ∈ X postoji otvorena okolina Nε(x) takva da je Nε(x) ∩ Uα = ∅ za konacno
mnogo α ∈ A.
Teorem 5.4 Ako je {Uα}α∈A lokalno ogranicena familija podskupova topoloskog prostora X,
onda zatvorene ljuske Uα skupova Uα takoder cine lokalno ogranicenu familiju {Uα}α∈A.
Dokaz.
Buduci je {Uα}α∈A lokalno ogranicena familija, svaka tocka x ∈ X ima otvorenu okolinu Nε(x)
takvu da je Nε(x) ∩ Uα = ∅, za konacno mnogo α ∈ A. Ako je Nε(x) ∩ Uα = ∅, onda je
Uα ⊂ Nε(x)c. Buduci je Nε(x)c zatvoren skup, slijedi Uα ⊂ Nε(x)c. Stoga je Nε(x) ∩ Uα = ∅,dakle familija {Uα}α∈A je lokalno ogranicena.
2
Teorem 5.5 Ako je {Uα}α∈A lokalno ogranicena familija zatvorenih skupova u topoloskom
prostoru X, onda je skup U =⋃Uα zatvoren.
21
Dokaz.
Neka je x ∈ U c i Nε(x) otvorena okolina tocke x.
Ako je Nε(x) ∩ Uα = ∅ za svaki α ∈ A, onda je Nε(x) ∈ U c.
Ako je Nε(x) ∩ Uα 6= ∅ za α1, α2, ..., αn, onda je Nε(x)⋂{∩U c
α} otvoren skup u U c.
Zakljucujemo da je U c otvoren, odnosno U je zatvoren skup.
2
5.2. Banachov teorem o fiksnoj tocki
Jedan od osnovnih teorema ove teorije je Banachov teorem o fiksnoj tocki. On dokazuje
postojanje jedinstvene fiksne tocke kontrakcije.
Definicija 5.8 Niz (xk), k ∈ N u metrickom prostoru (X, d) je Cauchyjev niz ako ∀ε > 0
∃k0 ∈ N takav da je d(xm, xn) < ε, ∀m,n ≥ k0.
Definicija 5.9 Neka je (X, d) metricki prostor. Funkcija f : X → X je kontrakcija ako
∃λ ∈ [0, 1〉 tako da vrijedi d(f(x), f(y)) ≤ λd(x, y), ∀x, y ∈ X.
Teorem 5.6 (Banachov teorem o fiksnoj tocki)
Neka je (X, d) potpun metricki prostor, a f : X → X kontrakcija s konstantom λ. Tada vrijedi:
i) funkcija f ima jedinstvenu fiksnu tocku x∗ ∈ X;
ii) ∀x1 ∈ X niz (xk), k ∈ N definiran formulom xk = f(xk−1), k ≥ 2 konvergira prema toj
jedinstvenoj fiksnoj tocki x∗; (1)
iii) d(xk, x∗) ≤ λk−1
1−λ d(x1, x2).
Dokaz.
Neka je x1 ∈ X tocka, a (xk) niz definiran sa (1). Pokazimo da je (xk) Cauchyjev niz:
d(xk, xk+1) = d(f(xk−1), f(xk))
≤ λd(xk−1, xk) = λd(f(xk−2), f(xk−1))
≤ λ2d(xk−2, xk−1) = λ2d(f(xk−3), f(xk−2))...
≤ λk−1d(x1, x2)
Neka je i ∈ N. Tada vrijedi:
d(xk, xk+j) ≤ d(xk, xk+1)d(xk+1, xk+2) + · · · d(xk+i−1, xk+i)
≤ (λk−1 + λk + · · ·+ λk+i−2)d(x1, x2)
= λk−1(1 + λ+ · · ·+ λi−1)d(x1, x2)
= λk−1 1−λi
1−λ d(x1, x2)
≤ λk−1
1−λ d(x1, x2) (2)
Neka je ε > 0. Buduci λk−1 → 0, k →∞, ∃k0 ∈ N takav da vrijediλk−1
1−λ d(x1, x2) < ε, ∀k ≥ k0.
22
Stoga iz (2) slijedi d(xk, xk+i) < ε, ∀k ≥ k0, sto znaci da je niz (xk) Cauchyjev niz.
Neka niz (xk) konvergira prema tocki x∗. Pokazimo da je tocka x∗ fiksna tocka funkcije f .
0 ≤ d(x∗, f(x∗)) ≤ d(x∗, xk) + d(xk, f(x∗))
= d(x∗, xk) + d(f(xk−1), f(x∗))
≤ d(x∗, xk) + λd(xk−1, x∗), ∀k ∈ N
Iz xk → x∗ slijedi d(x∗, xk)→ 0 i d(xk−1, x∗)→ 0.
Sada, iz 0 ≤ d(x∗, f(x∗)) ≤ 0 slijedi d(x∗, f(x∗)) = 0 sto povlaci da je x∗ = f(x∗). Prema
definiciji, x∗ je fiksna tocka funkcije f .
Dokazimo jedinstvenost te fiksne tocke. Pretpostavimo suprotno, tj. da postoji neka druga
fiksna tocka x ∈ X. Tada vrijedi:
d(x∗, x) = d(f(x∗), f(x)) ≤ λd(x∗, x) < d(x∗, x)
sto je kontradikcija. Time smo dokazali da ne postoji nijedna druga fiksna tocka x funkcije
f .
Ocjena iii) slijedi iz (2) kada i→∞.2
5.3. Brouwerov teorem o fiksnoj tocki
Brouwerov teorem o fiksnoj tocki pomoci ce nam u dokazu Kakutanijevog teorema o fiksnoj
tocki, koji predstavlja osnovu dokaza teorema o Nashevoj ravnotezi.
Definicija 5.10 Za skup K ⊆ Rn kazemo da je konveksan skup ako ∀x, y ∈ K i λ ∈ [0, 1]
vrijedi λx+ (1− λ)y ∈ K.
Najjednostavniji konveksan skup zove se simplex. Simplex u nula dimenzija je tocka, u
jednoj dimenziji duzina, u dvije dimenzije trokut, u tri dimenzije tetraedar itd.
x0 a a x1 x0 a a x1�����ax3TTTTT x0 a������� ax
1
�����ax3
ccc
cCCCCCCax2
```` ���
Slika 13. Primjer simplexa u jednoj, dvije i tri dimenzije
Definicija 5.11 Neka su x0, x1, ..., xn medusobno nezavisni vektori. Skup{n∑i=0
λixi|λi > 0, i = 0, 1, ..., n;
n∑i=0
λi = 1
}= x0x1 · · · xn
23
zovemo euklidski n - dimenzionalni simplex x0x1 · · ·xn. Vektori x0, x1, ..., xn koji raza-
pinju ovaj prostor zovu se vrhovi simplexa. Svaki vrh xi i svaki k - simplex xi0xi
1 · · · xik ,
k ≤ n, zove se strana simplexa x0x1 · · ·xn.
Primijetimo da je zatvarac simplexa x0x1 · · ·xn jednak konveksnoj ljuski vrhova x0, x1, ...xn.
Osim toga, unija svih strana simplexa x0x1 · · ·xn je njegov zatvarac.
Definicija 5.12 Za y =∑n
i=0 λixi ∈ co{x0, x1, ..., xn} neka je χ(y) = {i : λi > 0}. Pritom
vrijedi: ako je χ(y) ∈ i0, i1, ..., ik, onda je y ∈ xi0xi1 · · · xiK . Tu stranu simplexa zovemo nosac
od y.
Definicija 5.13 Jedinicni simplex je skup vektora{x ∈ Rn+1|xi > 0, i = 0, ..., n;
n∑x=0
xi = 1
}= e0e1 · · · en
. Sa ∆n oznacavamo zatvarac ovog skupa u n dimenzija.
Definicija 5.14 Neka je T = x0x1 · · ·xn n - dimenzionalni simplex i T njegov zatvarac.
Simpleksna subdivizija zatvaraca T je konacan skup simplexa {Ti|i ∈ I} takvih da je⋃i∈I Ti = T , a T i
⋂T j, ∀i, j ∈ I, je ili prazan skup ili zatvarac odgovarajuce strane simplexa.
Definicija 5.15 Neka je T zatvarac simplexa x0x1 · · ·xn. Neka je dana simpleksna subdiviz-
ija zatvaraca T i neka je V skup vrhova svih podsimplexa. Funkciju λ : V → {0, ..., n} za
koju vrijedi λ(v) ∈ χ(v), tj. λ pripada nosacu od v, zovemo pravilno oznacavanje subdiviz-
ije. Kazemo da je podsimplex potpuno oznacen ako λ poprima sve vrijednosti 0, 1, ..., n na
njegovom skupu vrhova.
Lema 5.1 Spernerova lema Neka je K simpleksna subdivizija zatvorenog simplexa T =
clx0x1 · · ·xn i neka je skup svih vrhova sudivizije pravilno oznacen funkcijom λ : V → {0, 1, ..., n}tako da vrijedi λ(v) ∈ χ(v). Tada postoji neparan broj potpuno oznacenih podsimplexa u sub-
diviziji.
Teorem 5.7 Brouwerov teorem o fiksnoj tocki
Neka je f : ∆n → ∆n neprekidna funkcija. Tada funkcija f ima fiksnu tocku.
Dokaz.
Neka je ε > 0. Podijelimo skup ∆n na podsimplexe promjera ≤ ε. Neka je V skup vrhova ove
subdivizije.
Definirajmo funkciju oznacavanja λ : V → {0, 1, ..., n} na sljedeci nacin: za v ∈ xi0xi1 · · ·xik
je
λ(v) ∈ {i0, i1, ..., ik}⋂{i|fi(v) ≤ vi}.
24
Primijetimo da ovaj presjek nije prazan skup. Naime, ako bi vrijedilo fi(v) > vi, ∀i ∈{i0, i1, ..., ik}, onda bi bilo
1 =n∑i=0
fi(v) >k∑j=0
vij =n∑i=0
vi = 1
sto je kontradikcija. (Druga jednakost slijedi iz v ∈ xi0xi1 · · ·xik .)Funkcija λ je definirana tako da zadovoljava uvjete pravilnog oznacavanja, a samim tim
i pretpostavke Spernerove leme. Stoga postoji simplex εp0 εp1 · · · εpn u subdiviziji koji je
potpuno oznacen i vrijedi:
fi(εpi) ≤ εpi, ∀i ∈ {0, 1, ..., n}.
Neka ε→ 0 i pretpostavimo εpi → z, ∀i, gdje je z = (z0, z1, ..., zn). Buduci je f neprekidna,
vrijedi fi(z) ≤ zi, a kako su fi(z) i zi oba u simplexu, slijedi f(z) = z.
2
6. Kakutanijev teorem o fiksnoj tocki
Sredisnji dio dokaza Nashevog teorema o postojanju ravnoteze u nekooperativnim igrama cini
upravo Kakutanijev teorem o fiksnoj tocki. Kako bismo razumijeli matematicku teoriju koja
stoji u pozadini ovih teorema, potrebno je uvesti neke pojmove. Za razliku od funkcije, koja
predstavlja preslikavanje tocke u tocku, ovdje promatramo vezu, tj. postupak koji predstavlja
preslikavanje tocke u skup tocaka, i pojam neprekidnosti veze.
Preslikavanje f tocke u tocku oznacavamo sa f : X → Y , dok preslikavanje tocke u skup
tocaka oznacavamo sa f : X →→ Y .
Definicija 6.1 Neka je 2Y partitivni skup od Y . Veza γ iz X u Y , u oznaci γ : X →→ Y ,
je funkcija iz X u 2Y .
s -xγ
γ(x)&%'$X Y
Slika 14. Veza γ : X →→ Y
Primijetimo da je klasa svih funkcija sadrzana u klasi svih veza.
Graf funkcije f : X → Y je skup uredenih parova Γf = {(x, y) ∈ X × Y |y = f(x)}. Na
slican nacin definiramo graf veze γ.
25
Definicija 6.2 Graf veze γ : X →→ Y je skup
Γγ = {(x, y) ∈ X × Y |y ∈ γ(x)}.
6
-x
γ(x)
Slika 15. Graf veze Γγ
Definicija 6.3 Neka je γ : X →→ Y veza i D ⊆ X. Slika od D je skup
γ(D) =⋃x∈D
γ(x).
����
-Dγ
γ(D)&%'$X Y
Slika 16. Slika od D
Definicija 6.4 Neka je γ : X →→ Y veza i K ⊆ Y . Gornji ili jaki inverz skupa K , u
oznaci γ+[K], je skup
γ+[K] = {x ∈ X|γ(x) ⊆ K}.
Definicija 6.5 Neka je γ : X →→ Y veza i K ⊆ Y . Donji ili slabi inverz skupa K , u
oznaci γ−[K], je skup
γ−[K] = {x ∈ X|γ(x) ∩K 6= ∅}.
Slicno pojmu semi-neprekidnosti funkcije, uvodimo pojam hemi-neprekidnosti veze.
Definicija 6.6 Veza γ : X →→ Y je jako hemi-neprekidna u tocki x0 ako vrijedi: ako
se tocka x0 nalazi u jakom inverzu otvorenog skupa D, onda je i otvorena okolina tocke x0
Nε(x0) takoder sadrzana u tom inverzu. Preciznije, γ : X →→ Y je jako hemi-neprekidna u
tocki x0 ako vrijedi:
x0 ∈ γ+[D] = {x ∈ X|γ(x) ⊆ D} ⇒ Nε(x0) ⊆ γ+[D],
26
za neki ε > 0.
Veza γ : X →→ Y je slabo hemi-neprekidna u tocki x0 ako vrijedi: ako se tocka
x0 nalazi u slabom inverzu otvorenog skupa D, onda je i otvorena okolina tocke x0 Nε(x0)
takoder sadrzana u tom inverzu. Preciznije, γ : X →→ Y je slabo hemi-neprekidna u tocki x0
ako vrijedi:
x0 ∈ γ−[D] = {x ∈ X|γ(x) ∩D 6= ∅} ⇒ Nε(x0) ⊆ γ−[D],
za neki ε > 0.
Veza γ : X →→ Y je jako hemi-neprekidna (slabo hemi- neprekidna) ako je jako
hemi-neprekidna (slabo hemi-neprekidna) u svakoj tocki x ∈ X. Veza je neprekidna ako je
jako i slabo hemi-neprekidna.
Definicija 6.7 Veza γ : D →→ K je zatvorena u tocki x ako iz xn → x, yn ∈ γ(xn) i
yn → y slijedi y ∈ γ(x). Veza γ je zatvorena ako je zatvorena u svakoj tocki x ∈ D.
Teorem 6.1 (vidi [1]) Neka je D ⊆ Rn, K ⊆ Rm i γ : D →→ K.
1. Ako je γ jako hemi-neprekidna i njene vrijednosti su zatvoreni skupovi, onda je γ zatvorena
veza.
2. Ako je K kompaktan skup i γ zatvorena veza, onda je γ jako hemi-neprekidna.
Kako bismo dokazali Kakutanijev teorem o fiksnoj tocki, potrebno je navesti neke teoreme
koji su mu prethodili u razvoju ove teorije.
Teorem 6.2 1 Neka je D ⊆ Rn kompaktan i K ⊆ Rm konveksan skup. Neka je nadalje
γ : D →→ K jako hemi - neprekidna veza cije su vrijednosti neprazni kompaktni i konveksni
skupovi. Za δ > 0 definirajmo γδ na sljedeci nacin:
γδ(x) = co
⋃z∈Nδ(x)
γ(z)
.
Tada za svaki ε > 0 postoji δ > 0 tako da vrijedi
Γγδ(x) ⊆ Nε(Γγ(x)).
Dokaz.
Pretpostavimo suprotno, tj. pretpostavimo da postoji ε > 0 tako da vrijedi
Γγδ(x) * Nε(Γγ(x)), ∀δ > 0.
To znaci da postoji niz (xn, yn) takav da je
(xn, yn) ∈ Γγ1n = {(x, y) ∈ D ×K|y ∈ γ
1n (x)}
1Cellina, 1969.
27
i |(xn, yn)− Γγ(x)| ≥ ε > 0. Iz (xn, yn) ∈ Γγ1n slijedi yn ∈ γ 1
n (x), sto znaci da je
yn ∈ co
⋃z∈N 1
n(xn)
γ(z)
.
Buduci je konveksna ljuska skup svih linearnih kombinacija vektora iz⋃z∈N 1
n(xn) γ(z), vektor
yn mozemo izraziti kao linearnu kombinaciju vektora iz⋃z∈N 1
n(xn) γ(z). Dakle, za svaki n
postoji skup vektora
y0,n, y1,n, ..., yk,n ∈⋃
z∈N 1n(xn)
γ(z)
tako da vrijedi
yn =k∑i=0
λi,nyi,n, λi ≥ 0,
k∑i=0
λi = 1.
Takoder, za svaki yi,n postoji zi,n ∈ N 1n(xn) tako da je yi,n ∈ γ(zi,n), a iz zi,n ∈ N 1
n(xn) slijedi
|zi,n − xn| < 1n.
Niz (xn) je beskonacan niz na kompaktnom skupu D. Stoga postoji konvergentan podniz
xn′
takav da xn′ → x. Iz navedenog slijedi:
|zi,n − xn| < 1
n⇒ |zi,n′ − xn′ | < 1
n′⇒ zi,n
′ → x, n′ →∞.
Takoder, za svaki i vrijedi
yi,n ∈ γ(zi,n)⇒ yi,n′ ∈ γ(zi,n
′)⇒ yi,n
′ ∈ γ(x), n′ →∞.
Buduci je γ(x) kompaktan skup, niz yn′
ima konvergentan podniz yn′′, yn
′′ → yi ∈ γ(x).
Stoga yn′′
=∑k
i=0 λi,n′′yi,n′′ konvergira yn
′′=∑k
i=0 λi,n′′yi, yi ∈ γ(x), ∀i. Nadalje, γ(x) je
konveksan skup pa je yn′′ ∈ γ(x) za dovoljno veliki n′′, odakle slijedi (x, yn
′′) ∈ Γγ sto je
u kontradikciji s pretpostavkom |(xn, yn) − Γγ(x)| ≥ ε > 0. Stoga zakljucujemo Γγδ(x) ⊆Nε(Γγ(x)).
2
U iducem teoremu John von Neumann je pokazao da mozemo graf zatvorene veze s
nepraznim konveksnim vrijednostima aproksimirati grafom neprekidne funkcije. Naime, za
svaki ε > 0 mozemo izabrati graf neprekidne funkcije koji lezi u ε - okolini grafa veze. Rezul-
tat ovog teorema omogucuje nam da rezulate koji se odnose na funkcije prosirimo na veze.
Prije iskaza i dokaza samog teorema, uvodimo pojmove particije jedinice i rezultate vezane
uz particiju jedinice koji ce nam pomoci u dokazu von Neumannove tvrdnje.
Definicija 6.8 Neka je X topoloski prostor i f : X → R neprekidna funkcija. Uporiste od
f , u oznaci supp(f), je zatvorena ljuska tocaka x ∈ X za koje je f(x) 6= 0, tj.
supp(f) = {x ∈ X|f(x) 6= 0}.
28
Definicija 6.9 Particija jedinice na topoloskom prostoru X je familija nenegativnih funkcija
{fα : X → R}α∈A takvih da njihova uporista cine konacan pokrivac od X i∑
α∈A fα ≡ 1,
∀x ∈ X.
Definicija 6.10 Neka je {Uα}α∈A familija podskupova topoloskog prostora X. Kazemo da
je familija {fα : X → R} neprekidnih funkcija na X podredena familiji {Uα}α∈A ako je
supp(fα) ⊂ Uα, ∀α ∈ A.
Teorem 6.3 (vidi [1]) Neka je {Pα}α∈A konacan otvoreni pokrivac normalnog prostora X.
Tada postoji otvoreni pokrivac {Qα}α∈A takav da je Qα ⊂ Pα, ∀α ∈ A.
Teorem 6.4 (vidi [1]) Neka je X normalan prostor, K ⊂ X kompaktan skup i {Pα}α∈Aotvoreni pokrivac skupa K. Tada postoji particija jedinice podredena familiji {Pα}α∈A.
Dokaz.
Prema prethodnom teoremu postoji otvoreni pokrivac {Uα}α∈A takav da je Uα ⊂ Pα, ∀α ∈ A.
Buduci je K kompaktan skup, pokrivac {Uα} ima konacan pod pokrivac U1, U2, ..., Uk.
Definirajmo funkciju gi : K → R+ na sljedeci nacin: gi(x) = min{|x − z| : z ∈ U ci }.
Funkcija gi je neprekidna funkcija i supp(gi) = Ui. Nadalje, skupovi Ui, i = 1, ..., k cine
pokrivac skupa K pa ne moze biti gi(x) = 0, ∀i. Stoga mozemo definirati familiju funkcija
{fi}i=1,...k na sljedeci nacin:
fi =gi∑j gj
.
Ovako definirana familija {f1, f2, ..., fk} predstavlja trazenu particiju jedinice podredenu famil-
iji {Pα}α∈A.
2
Teorem 6.5 2 Neka je D ⊆ Rn kompaktan i K ⊆ Rm konveksan skup te γ : D →→ K jako
hemi neprekidna veza s nepraznim kompaktnim i konveksnim vrijednostima. Tada za svaki
ε > 0 postoji neprekidna funkcija f : D → K takva da je Γf ⊆ Nε(Γγ).
Dokaz.
Iz prethodnog teorema znamo da vrijedi: ako je γδ = co(⋃
z∈Nδ(x) γ(z))
, onda za svaki ε > 0
postoji δ > 0 tako da je
Γγδ ⊆ Nε(Γγ).
Buduci je skup D kompaktan, postoje x1, x2, ...xn ∈ D tako da skupovi {Nδ(xi)} cine otvoreni
pokrivac skupa D. Tada postoji particija jedinice f1, f2, ..., fn podredena familiji {Nδ(xi)}.
2John von Neumann, 1937.
29
Particiju jedinice izaberemo tako da vrijedi: fi(x) = 0, ∀x /∈ {Nδ(xi)}. Za svaki γ(xi) izaber-
emo y ∈ γ(xi) i definiramo funkciju g : D → K na sljedeci nacin:
g(x) =n∑i=1
fi(x)yi.
Buduci su sve fi neprekidne, funkcija g je takoder neprekidna funkcija. Nadalje, na temelju
gore definiranog izbora particije, fi(x) > 0 povlaci x ∈ {Nδ(xi)}. Buduci je g(x) linearna
kombiniacija nenegativnih funkcija fi(x) i y ∈ γ(xi) slijedi:
g(x) ∈ γδ(x) = co
⋃z∈Nδ(xi)
γ(z)
.
Sada imamo
g(x) ∈ γδ(x)⇒ Γg ⊆ Γγδ ⊆ Nε(Γγ).
2
Teorem 6.6 (vidi [1]) Neka je K ⊆ Rn neprazan, konveksan i konkavan skup te µ : K →→ K.
Neka je γ : K →→ F , gdje je F ⊆ Rn kompaktan i konveksan skup, zatvorena veza cije su
vrijednosti neprazni, kompaktni i konveksni skupovi, a funkcija f : K × F → K neprekidna,
tako da je za svaki x ∈ Kµ(x) = {f(x, y)|y ∈ γ(x)}.
Tada µ ima fiksnu tocku, odnosno postoji x ∈ K za koji vrijedi x ∈ µ(x).
Kakutanijev teorem slijedi kao korolar gore navedenog teorema.
Teorem 6.7 Kakutanijev teorem o fiksnoj tocki
Neka je K ⊆ Rn kompaktan i konveksan skup te γ : K →→ K jako hemi-neprekidna veza cije
su vrijednosti neprazni, konveksni i kompaktni skupovi. Tada veza γ ima fiksnu tocku.
Dokaz.
Buduci je K neprazan, kompaktan i konveksan skup, a γ jako hemi-neprekidna veza sa
zatvorenim vrijednostima, po teoremu (6.1) slijedi da je γ zatvorena.
Definirajmo funkciju f : K ×K → K na sljedeci nacin: f(x, y) = y.
Sada imamo
γ(x) = {f(x, y)|y ∈ γ(x)} ⇒ γ(x) = {y|y ∈ γ(x)}.
Dakle, veza γ ima fiksnu tocku x ∈ γ(x).
2
30
7. Nashev teorem
Koncept ravnoteze koji je uveo John Nash bez sumnje je najcesce upotrebljeni alat teorije igara
u brojnim aplikacijama i primjenama. U ovom poglavlju iskoristit cemo prethodno dokazane
teoreme i dokazati da sve nekooperativne igre imaju Nashevu ravnotezu u igri kombiniranih
strategija.
7.1. Kombinirane strategije
Kombinirana strategija xi igraca i ∈ I je vjerojatnosna distribucija vektora cistih strategija
Si igraca i. Skup svih mogucih kombiniranih strategija igraca i ∈ I je vektor kombiniranih
strategija Xi. Prostor kombiniranih strategija je Kartezijev produkt
X =∏i∈I
Xi = X1 ×X2 × · · · ×Xn.
Vektor x ∈ X predstavlja kombinirane strategije svih igraca i naziva se profil kombiniranih
strategija. Takoder, vektor x−i predstavlja kombinirane strategije svih igraca osim i-tog.
Svaki profil kombiniranih strategija donosi odredenu korisnost ili, tocnije, ocekivanu korisnost
za svakog igraca i ∈ I. Kombinirane strategije svakog igraca odredene su prije pocetka igre,
stoga su njihove vjerojatnosti medusobno nezavisne. Ako ce u igri biti odigran profil kombini-
ranih strategija x ∈ X, tada je vjerojatnost da ce u igri biti iskoristen profil cistih strategija
s ∈ S jednaka
x(s) =n∏i=1
xi(si)
gdje je xi(si) vjerojatnost koju igrac i ∈ I dodjeljuje njegovoj cistoj strategiji si. Ocekivana
korisnost iz vektora kombiniranih strategija x ∈ X za igraca i ∈ I je
πi(x) =∑s∈S
x(s)πi(s).
7.2. Veza najboljeg odgovora
Nasheva ravnoteza u igri kombiniranih strategija zahtijeva da u profilu kombiniranih strategija
x ∈ X svaki element, odnosno kombinirana strategija xi ∈ Xi svakog igraca bude optimalna,
pod pretpostavkom da ce u igri biti odigran upravo profil x. Za definiciju Nasheve ravnoteze
u igri kombiniranih strategija potrebno je uvesti pojam veze najboljeg odogovora.
Definicija 7.1 Najbolji odgovor igraca i na profil kombiniranih strategija x ∈ X je strate-
gija xi ∈ Xi takva da nijedna druga strategija dostupna igracu ne donosi vecu korisnost od x.
Veza najboljeg odgovora γi : X →→ Xi je veza koja preslikava profil strategije u neprazan
skup na sljedeci nacin:
γi(x) = {xi ∈ Xi|πi(xi, x−i) ≥ πi(x′i, x−i),∀x′i ∈ Xi}.
31
Veze najboljeg odgovora svih igraca mogu se prikazati pomocu veze najboljeg odogovora
za cijelu igru, γ : X →→ X, definirane kao γ(x) = (γ1(x), γ2(x), ..., γn(x)).
Ako je xi ∈ γi(x) za nekog igraca i, tada igrac i ne zeli promijeniti svoju strategiju sve dok
se igra profil x. Ako je xi ∈ γi(x), ∀i ∈ I, onda je x ∈ γ(x) i nijedan igrac ne zeli promijeniti
svoju strategiju. U tom slucaju igra ostaje na profilu x ∈ X, odnosno taj profil strategija
predstavlja Nashevu ravnotezu.
Definicija 7.2 Profil strategija x ∈ X je Nasheva ravnoteza ako je x ∈ γ(x).
Prema gornjoj definiciji, profil strategija je Nasheva ravnoteza ako je on fiksna tocka veze
najboljeg odgovora za cijelu igru. Iz Kakutanijevog teorema o fiksnoj tocki znamo da veza
γ : X →→ X ima fiksnu tocku ako vrijedi:
i) X je kompaktan i konveksan skup,
ii) vrijednosti veze γ su neprazni, kompaktni i konveksni skupovi,
iii) veza γ je jako hemi-neprekidna veza.
Pokazimo da veza najboljeg odgovora zadovoljava sve pretpostavke Kakutanijevog teorema.
i) U prostoru kombiniranih strategija, svaki Xi je zatvarac jedinicnog simplexa u n dimenzija.
Buduci je X Kartezijev produkt simplexa X =∏n
i=1Xi = X1 × X2 × · · · × Xn, on je ocito
konveksan i kompaktan skup.
ii) Funkcija korisnosti svakog igraca πi(x) =∑
s∈S x(s)πi(s) je linearna, dakle i neprekidna
funkcija. Svaka neprekidna funkcija na kompaktnom skupu postize maksimum, stoga su vri-
jednosti veze najboljeg odogovora neprazne.
Pretpostavimo da γ(x) nije konveksan skup. Tada postoje najbolji odgovori x′ ∈ γ(x),
x′′ ∈ γ(x) i λ ∈ (0, 1) tako da je λx′ + (1− λ)x′′ /∈ γ(x). Medutim, za svaki i ∈ I vrijedi:
πi(λx′i + (1− λ)x′′i , x−i) = λπi(x
′i, x−i) + (1− λ)πi(x
′′i , x−i).
Ako su x′i i x′′i najbolji odgovori igraca i na x−i, onda je i njihova ponderirana sredina najbolji
odgovor, dakle γ(x) je konveksan skup.
Nadalje, γ(x) je, kao podskup simplexa, kompaktan skup.
iii) Prema teoremu (6.1) veza γ je jako hemi-neprekidna ako je skup X kompaktan i γ
zatvorena veza. Iz definicije zatvorene veze znamo da iz xn → x, yn ∈ γ(xn) i yn → y
slijedi y ∈ γ(x).
Pretpostavimo da γ nije zatvorena veza. Onda postoji niz xn takav da xn → x, yn ∈ γ(xn)
i yn → y, ali y /∈ γ(x). Tada je yi /∈ γ(xi) za nekog igraca i. Stoga postoji ε > 0 i kombinirana
strategija x′i takvi da je
πi(x′i, x−i) > πi(yi, x−i) + 3ε.
Buduci je πi : X → R naprekidna funkcija, za dovoljno velik n imamo:
πi(x′i, x
n−i) > πi(x
′i, x−i)− ε > πi(yi, x−i) + 2ε > πi(y
ni , x
n−i) + ε.
32
Dakle, x′ni donosi igracu i strogo vecu korisnost od yni , sto je u kontradikciji s pretpostavkom
yni ∈ γi(xn). Stoga zakljucujemo da je γ zatvorena i jako hemi-neprekidna veza.
Na osnovu ovih zakljucaka lako dokazujemo Nashev teorem.
Teorem 7.1 Nashev teorem
Svaka igra s konacno mnogo igraca ima Nashevu ravnotezu u kombiniranim strategijama.
Dokaz.
Veza najboljeg odgovora za cijelu igru γ : X →→ X zadovoljava sve pretpostavke Kakutani-
jevog teorema o fiksnoj tocki, stoga zakljucujemo da γ ima fiksnu tocku x ∈ γ(x), odnosno
igra ima Nashevu ravnotezu.
2
33
Literatura
[1] Anders Nilsson, Game Theory - Mathematical Fundaments and Examples of Applications,
Department of Mathematics, Lulea Tekniska Universitet, Lulea 1997.
[2] Eric Rasmusen, Games and Information, Third Edition, Blackwell Publishers, Oxford,
2001.
[3] Adam M. Brandenburger, Barry J. Nalebuff, The Right Game: Use Game Theory to
Shape Strategy, Harvard Business Review, July-August 1995.
[4] Jasminka Sohinger, Nash Equilibrium and Nash Bargaining Solution: the 1994 Nobel
Prize for Economics, Faculty of Economics, Zagreb, 1996.
[5] Sibe Mardesic, Matematicka analiza 1, Skolska knjiga, Zagreb, 1979.
[6] Sime Ungar, Matematicka analiza 3, Zagreb, 2004.
[7] Walter Rudin, Principles of Mathematical Analysis, McGraw-Hill Book Company, New
York, 1976
[8] Game theory, A resource for educators and students of game theory,
http://www.gametheory.net/
34
Sazetak
Nasheva ravnoteza u kombiniranim strategijama
Teorija igara suvremena je matematicka disciplina s brojnim primjenama u ekonomiji. Jedan
od najpoznatijih i najcesce koristenih pojmova u modernoj teoriji igara je Nasheva ravnoteza,
koncept ravnoteze u igri koji je dobio ime prema americkom matematicaru Johnu Nashu,
dobitniku Nobelove nagrade u ekonomiji za doprinos u analizi ravnoteze u nekooperativnim
igrama. Vazan alat u dokazivanju teorema teorije igara predstavljaju teoremi o fiksnoj tocki.
Kakutanijev teorem o fiksnoj tocki cini sredisnji dio dokaza Nashevog teorema u kojem je John
Nash dokazao da svaka igra s konacno mnogo igraca ima Nashevu ravnotezu u kombiniranim
strategijama.
Kljucne rijeci: koncept ravnoteze, Nasheva ravnoteza, Kakutanijev teorem o fiksnoj tocki,
kombinirana strategija, Nashev teorem
35
Summary
Nash equlibrium in mixed strategies
Game theory is a contemporary mathematical discipline with numerous applications in econ-
omy. One of the best known and most used concepts in the modern game theory is Nash
equlibrium, which is the equlibrium in game named after the American mathematician John
Nash, a Nobel prize winner for economy for his contribution in equilibrium analysis in non-
cooperative games. An important tool in approval of the game theory theorems are the fixed
point theorems. Kakutani fixed point theorem forms the middle part of the proof of the Nash
theorem, in which John Nash proved that every game with finitely many players has a Nash
equilibrium in mixed strategies.
Key words: equlibrium concept, Nash equlibrium, Kakutani fixed point theorem, mixed
strategy, Nash theorem
36
Zivotopis
Zovem se Emina Lulic. Rodena sam 21. listopada 1986. g. u Dakovu. Od rodenja zivim
u Kusevcu, prigradskom naselju grada Dakova. Od 1993. g. do 2001. g. pohadala sam
osnovnu skolu J. A Colnica u Kusevcu (prva cetiri razreda), odnosno Dakovu (visi razredi
osnovne skole). 2001. g. upisala sam opcu gimnazija A. G. Matosa u Dakovu, koju sam
2005. g. zavrsila i primila nagradu kao najbolja ucenica u generaciji. Iste godine upisala
sam preddiplomski studij matematike na Odjel za metematiku, Sveuciliste J. J. Strossmayera
u Osijeku. 2007. g. primila sam posebnu godisnju nagradu Lions Cluba Osijek za najbolje
studente Sveucilista J. J. Strossmayera. Preddiplomski studij matematike zavrsila sam 2008.
godine s prosjekom ocjena 5,00 tijekom studiranja. Tada sam primila priznanje i nagradu
Odjela za matematiku, Sveuciliste J. J. Strossmayera u Osijeku. Po zavrsetku preddiplom-
skog studija upisala sam diplomski studij poslovne i financijske matematike na Odjelu za
matematiku. Tijekom ove akademske godine pohadala sam izvanredni studij Pedagosko -
psiholoskog obrazovanja na Filozofskom fakultetu u Osijeku, gdje sam polozila pedagogiju,
didaktiku, psihologiju odgoja i obrazovanja i metodiku nastave matematike, te tako stekla
potrebne kompetencije za rad u odgojno - obrazovnim ustanovama.