41
Öffentliches Gut, Kooperation in strukturierten Populationen Sebastian Kraus 29.11.2011 Karl Sigmund: The Calculus of Selfishness, Princeton, Kapitel 6,7

Öffentliches Gut, Kooperation in strukturierten … · 2015-03-19 · 1.N(>1) Anzahl der teilnehmenden Individuen 2.Jedes Individuum kann kooperieren X oder nicht kooperieren Y

Embed Size (px)

Citation preview

Öffentliches Gut, Kooperation instrukturierten Populationen

Sebastian Kraus

29.11.2011

Karl Sigmund: The Calculus of Selfishness, Princeton,Kapitel 6,7

Öffentliches Gut, Kooperation in strukturiertenPopulationen

InhaltÖffentliches Gut-SpieleModellierung eines Öffentliches Gut-SpielÖffentliches Gut-Spiel mit BestrafungEndliche PopulationenDie Strategie Freiwillige vorDie Möglichkeit nicht teilzunehmenStrukturierte PopulationenVerwandtenausleseHamilton-RegelGitterspiele

Öffentliches Gut-Spiele

I Gemeinsames Bemühen im Team wird durch sogenannteÖffentliches Gut-Spiele modeliertBsp.: Eine Gemeinschaft legt Geld bei einer Bank anKooperierende/Nicht Kooperierende

I Ein Öffentliches Gut-Spiel benötigt mehr als einenTeilnehmer

I Was passiert, wenn jemand kooperiert bzw. nichtkooperiert?Vorteile als Nichtkooperierender

I Wie sollte man sich selbst verhalten?Lohnt sich meine momentane Strategie?

I Es kommt zur Bildung von Mehrheiten→ Zwang zurKooperation wird gesteigert

I Soziales Dilemma: Nichtkooperierende sind besser dranals KooperierendeMan investiert nichts, zieht trotzdem ein Nutzen

Modellierung eines Öffentliches Gut-Spiel

Bedingungen1. N(>1) Anzahl der teilnehmenden Individuen2. Jedes Individuum kann kooperieren X oder nicht

kooperieren Y3. Die Kooperierenden zahlen einen Fixkostenbeitrag c4. r(>1) gibt an, wie lohnend ein öffentliches Gut ist

I Zwei Fälle werden unterschieden

1. SR (self return), ein Teil des Beitrags geht zurück an denGeber

2. OO (others only)

Modellierung eines Öffentliches Gut-Spiel

I Im ersten Fall SR erhält jeder Spieler den Lohn

rcNc

N= cNc

rN

I cNcN ist der Betrag, den jeder erhalten würde, wenn man

alle Investitionen c zusammenlegt und aufteilt.

I Kooperierende haben die Investition c zu tragen

I Erst für r < N hat man ein soziales Dilemma

I Für r > N ist die Betrachtung uninteressant, dann erhältjeder einzelne mehr als cNc

weil

cNcrN> cNc mit

rN> 1

Modellierung eines Öffentliches Gut-Spiel

I Im zweiten Fall OO erhält ein Y den Lohn

rcNc

N − 1

I Hierbei erhält der einzelne den Lohnteil nicht zurückI Somit wird rcNc nur auf N − 1 Spieler aufgeteilt

I Ein X erhält den Lohn

rc(Nc − 1)N − 1

I Kooperierender erhält weniger und muss noch zusätzlichdie Investition c tragen.

Modellierung eines Öffentliches Gut-Spiel

Bsp.: 6 Spieler, 4 Kooperierende, 2 NichtkooperierendeKooperierende investieren c = 10,dieses Geld wird mit r = 3/2 vermehrt

Nc = 4,N = 6, c = 10, r = 3/2

I Im ersten Fall (SR) erhält jeder

rcNc

N=

432106

= 10

wobei ein Kooperierender c = 10 investiert hat.I Im zweiten Fall (OO) erhält ein Y den Lohn

rcNc

N − 1=

432105

= 12

I und ein X erhält den Lohnrc(Nc − 1)

N − 1=

332105

= 9

(hat c=10 investiert)

Modellierung eines Öffentliches Gut-Spiel

I Schon an diesem beliebig gewählten Beispiel kann manerkennen, dass Nichtkooperierende die bessere Strategiegewählt haben.

I Es kann aber nicht der Sinn eines Öffentliches Gut-Spielsein, dass Nichtkooperieren die beste Strategie ist

Modellierung eines Öffentliches Gut-Spiel

I Was passiert wenn ein Spieler von Y zu X wechselt?Es ergeben sich Kosten

I im Fall SR : c − crN = c(1− r

N )

(c ist die Investition, crN ist der Teil der Investition den man

zurück erhält)I im Fall OO ist es einfach c, die anderen (Others Only)

erhalten c.

I Würden alle Spieler kooperieren, (Nc = N)

rcNc

N− c =

rcNc

Nc− c = (r − 1)c (SR)

I rcNcNc

ist der bekannte Term, c ist die Investition

Modellierung eines Öffentliches Gut-Spiel

I Würden alle Spieler kooperieren,(Nc = N)

rcNc

N − 1−c+

cN − 1

=rcNc

Nc − 1−c+

cNc − 1

= (r−1)c (OO)

I rcNcN−1 ist der bekannte Term, −c ist die Investition und c

N−1ist der Anteil der Investition, den die Allgemeinheitzurückerhält.

I Zunächst nutzt man Nc = N aus und weiteres Umformenergibt die rechte Seite der Gleichung

Modellierung eines Öffentliches Gut-Spiel

I Betrachte eine unendliche Population, aus der von Zeit zuZeit eine zufällige Auswahl an N Spielern ein ÖffentlichesGut-Spiel spielen.

I Sei x die Häufigkeit der X und y die Häufigkeit der Y in derPopulation

I Im Fall OO ist der zu erwartende Lohn für einen X

Px = c(rx − 1) = crx − c

Vergleiche, den bekannten Term crNcN − c in endlicher

Population,setzt man x = NcN ,so erhält man Px

Modellierung eines Öffentliches Gut-Spiel

I Im Fall OO ist der zu erwartende Lohn für einen Y

Py = crx

Bekannter Term crNcN für endliche Populationen, setzt man hier

x = NcN , so erhält man Py

der Term für den Fall SR unterscheidet sich nur um den Faktor(N−1

N ), (der Anteil jedes Einzelnen wird kleiner)

Modellierung eines Öffentliches Gut-Spiel

I Multipliziert man die Löhne mit

(N − 1)N

(∗)

so erhält man die Werte für den SR Fall.I Betrachtet man die Löhne im OO Fall

Py = crx > crx − c = Px

folgt natürlich auch direkt für den SR Fall aus (*), dass

Py > Px

d.h. die Strategie der Nichtkooperierenden Y wird sichdurchsetzen.

Modellierung eines Öffentliches Gut-Spiel

I Jedoch kann dies nicht das Ziel sein, dass letzendlichniemand kooperiert.

I Kann dieses Dilemma vielleicht durch Einführung vonpositiven/negativen Anreizen vermieden werden?

I Zum Beispiel durch die Einführung von Bestrafungen fürnicht Kooperierende durch die anderen Spieler.

Öffentliches Gut-Spiele mit Bestrafung

Idee: Ein Öffentliches Gut-Spiele mit BestrafungI Ein PGG mit Bestrafung ist wie folgt aufgebaut:

I Spieler können e1-kooperieren oder e2-nicht kooperieren

I Spieler können f1-bestrafen oder f2-nicht bestrafen

I D.h. Spieler können andere, die nicht koop. bestrafen

Bestrafte zahlen γ , Bestrafende zahlen β (γ, β > 0)

Nun ist die Überlegung, ist es sinnvoll etwas zu investieren, umandere zu strafen? Sollte man sich vielleicht darauf verlassen,dass andere das übernehmen? Oder ist es vielleicht amsinnvollsten überhaupt nicht zu kooperieren?

Öffentliches Gut-Spiel mit Bestrafung

Aus der Wahl zwischen e1, e2 und f1 ,f2 ergeben sich diefolgenden vier Strategien

xi ist der Anteil der Population, der eine Strategie Gi wählt.I G1 = e1f1, die soziale Strategie, kooperieren und bestrafen

(x1)I G2 = e2f1, die widersprüchliche Strategie,

nichtkooperieren und bestrafen (x2)I G3 = e2f2, weder kooperieren noch bestrafen (x3)I G4 = e1f2, kooperieren und nicht bestrafen (x4)

I Durch Einführung der Bestrafung erhofft man die Strategie desNichtkooperierens unbeliebter zu machen. Im Folgendenwerden wieder die Löhne der 4 Strategien betrachtet undverglichen.

Öffentliches Gut-Spiel mit Bestrafung

Betrachte nur den SR-Fall

I Alle Spieler, egal ob G1,G2 ,G3oder G4 erhalten dendruchschnittlichen Grundbetrag

B :=rc(N − 1)

N(x1 + x4)

Hier taucht der Term N−1N auf, der den SR Fall kennzeichnet.

Multipliziert mit dem bekannten rc und (x1 + x4), die den Anteilderer darstellen, die kooperieren und somit einen Beitragleisten.Jeder Spieler erhält abhängig von seiner Strategie, die ergewählt hat, einen Lohn Pi , der sich aus dem Grundbetrag undeinem weiteren Term zusammensetzt.

Öffentliches Gut-Spiel mit Bestrafung

Seien P1,P2,P3,P4 die Löhne zu den vier Strategien

P1 = B − c(1− rN)− (N − 1)γ(x2 + x3)

I c(1− rN ) sind die Kosten, die entstehen, wenn man von

Nichtkooperieren zu Kooperieren wechselt. d.h. diesenBetrag hat ein Kooperierender weniger.

I γ(x2 + x3) Die Strategie G1 zu Lohn P1 beinhaltet auchBestrafung. Die Kosten hierfür sind γ und jeder, der nichtkooperiert wird bestraft. Der Anteil derNichtkooperierenden in der Population ist x2 + x3.

Man könnte jetzt schon vermuten, dass es sich nicht lohnt zukooperieren und zu bestrafen, da hiermit einige Kostenverbunden sind

Öffentliches Gut-Spiel mit Bestrafung

Der Lohn P2

P2 = B − (N − 1)β(x1 + x2)− (N − 1)γ(x2 + x3)

I (N − 1)β(x1 + x2) Den Spielern G2 droht eine Bestrafungin Höhe β durch bestrafende Mitspieler, deren Anteilx1 + x2 der Population ist.

I (N − 1)γ(x2 + x3)Die Spieler G2 bestrafennichtkooperierende Mitspieler, was sie selbst γ kostet. DerAnteil der nichtkooperierenden Mitspieler an derPopulation ist x2 + x3.

Diese Stratgie ist wohl auch nur theoretsich denkbar, daBestrafen von Nichtkooperierenden und gleichzeitigNichtkooperierender zu sein ist sehr widersprüchlich undunwahrscheinlich.

Öffentliches Gut-Spiel mit Bestrafung

Der Lohn P3

P3 = B − (N − 1)β(x1 + x2)

I (N − 1)β(x1 + x2) Die Spieler mit Strategie G3 sindnichtkooperierend und nichtbestrafend. Ihnen droht alsoBestrafung in Höhe β durch Strafende, deren Anteil an derPopulation ist x1 + x2.

Der Lohn P4

P4 = B − c(1− rN)

I c(1− rN ) Spieler mit Strategie G4 sind kooperierend und

nichtbestrafend. Sie bezahlen den Preis einesKooperators. Dies sind genau die Kosten, die entstehen,wenn man von Nichtkooperieren zu Kooperieren wechselt.

Öffentliches Gut-Spiel mit Bestrafung

Über lange Zeit betrachtet landet diese Population jedoch auchin der Strategie G3 weil:

1. Man andere nicht bestraft und keinen Beitrag zahlen muss,was Kosten spart

2. Wenn viele nicht strafen, dann müssen Nichtkooperierendeauch nur geringe Bestrafung befürchten

3. Einzelne Kooperierende müssen hohe Summen fürBestrafung zahlen und deshalb lohnt sich ein Wechsel zuG3

Endliche Populationen

PGG mit IMITATION, INOVATION und Populationsstärke M

N Spieler (zufällig) spielen ein Öffentliches Gut-SpielI Es gibt 3 Strategien

I X - Kooperieren, aber nicht bestrafen (G4)I Y - Nicht kooperieren und nicht bestrafen (G3)I Z - Kooperieren und bestrafen (G1)

I Von Zeit zu Zeit vergleichen 2 zufällig ausgewählte Spielerihren Lohn u. wechseln zur Strategie des höheren Lohn(gleicher Lohn, entscheidet die Münze)- IMITATION

I Es ergeben sich 3 homogene Zustände(M,0,0)-ALLX(0,M,0)-ALLY(0,0,M)-ALLZImitation führt nicht aus diesen Zuständen heraus

I Selten kann durch INOVATION der Zustand plötzlichzufällig geändert werden

Endliche Populationen

Der Wechsel von einem homogenen Status zum nächsten wirddurch die folgende Übergangsmatrix beschrieben 1

2 −1

2M12

12M

0 1 01

2M 0 1− 12M

Bsp. Wechsel von AllX zu AllY ist 1

2 oder AllZ zu AllY ist 0.

I Betrachte stationäre Verteilung (0,1,0) der MatrixStationäre Verteilung bleibt invariant unter derÜbergangsmatrixDie stationäre Verteilung ist der Eigenvektor zumEigenwert λ = 1

I Der unausweichliche Zustand ist AllYAlso übernehmen die Nichtkooperierenden das Spiel überlange Zeit gesehen.

D.h. es müssen andere Strategien bedacht werden, die einePopulation nicht in einem AllY Staat enden lassen.

Die Strategie Freiwillige vor

Zusätzliche Strategie W nicht an dem PGG teilnehmenI Für den Verdienst σ eines solchen Spielers gilt

0 < σ < (r − 1)c

I D.h. der Lohn σ ist

1. kleiner als der Lohn eines Kooperierenden in einem PGG,in dem alle kooperieren

2. größer als der Lohn eines Nichtkooperierenden in einemAllY PGG

I Folgende Übergangsmatrix beschreibt den Wechsel dervier homogenen Zustände (AllX ,AllY ,AllZ ,AllW )ineinander zu

23 −

13M

13

13M 0

0 23 0 1

31

3M 0 1− 13M 0

16 0 1

623

Die Strategie Freiwillige vor

Man erkennt, dass die Übergangsmatrix nur eine stationäreVerteilung hat

(p,p,1− 3p,p) mit p = 2M+8

I Für beispielsweise M = 100sieht die stationäre Verteilung der Matrix so aus( 1

54 , 154 ,17

18 , 154)

D.h. zu 95% der Zeit besteht die Population nur aus demTyp Z , also nur aus Kooperierenden, die bestrafen.

I Nichtkooperierende bilden nur noch 2% der Population,obwohl diese bei zuvorigem PGG das gesamte Spieldominierten

I Den entscheidenden Unterschied muss also diezusätzliche Strategie W gebracht haben, dass man sichentscheiden kann, ob man an dem PGG teilnimmt odernicht

Die Möglichkeit nicht teilzunehmen

Um den Effekt der freiwilligen Teilnahme besser zu verstehenBetrachte das PGG mit Strategien: X, Y, W.

I Die Übergangsmatrix ist dann 12

12 0

0 12

12

14 0 3

4

I Die stationäre Verteilung der Matrix ist

(14 ,

14 ,

12)

1. Zur Hälfte der Zeit nehmen alle an dem Spiel Teil, wobeidies alle Nichtkooperierende oder alle Kooperierende sind

2. Zur Hälfte der Zeit nimmt niemand teil

Die Matrix beschreibt eine sogenannte Schere-Stein-PapierStruktur,d.h.

1. AllX → AllY → AllZ → AllX , dieser Kreislauf verhindert einDead-lock im Zustand ALLY (jeder ist nichtkooperierend)

Die Möglichkeit nicht teilzunehmen

Betrachte eine unendliche Population mit

1. X (Koop. Nichtbestr.), Y (Nichtkooper. Nichtbestr.), W(Nichtteilnehmer)

2. x , y ,w die relative Häufigkeit der 3 Strategien3. deren zu erwartenden Löhne Px , Py , Pw

Offensichtlich ist Pw = σ

Die Wahrscheinlichkeit, dass ein Spieler h teilnehmendeMitspieler hat, ist(

N − 1h

)(1− w)hwN−1−h

Die Wahrscheinlichkeit, dass m von diesen kooperieren ist(h

m

)( x

1−w )m( y1−w )h−m

Die Möglichkeit nicht teilzunehmen

Betrachte die Löhne Px , Py ,

Das Vorzeichen des Terms Py − Px ist entscheidendI Ist es positiv, so lohnt sich der Wechsel von X zu YI Ist es negativ, so lohnt sich der Wechsel von X zu Y nicht

Es gilt: Py − Px = cFN(w)Mit:

FN(w) := 1 + (r − 1)wN−1 − ( rn )(

1−wN

1−w )

Für r > 2 hat die FN(w) eine Nullstelle in [0,1[

d.h., es gibt einen Grenzwert an Nichtteilnehmern, sobalddieser überschritten ist, ist es lohnender Kooperierender zusein als Nichtkooperierender

Die Möglichkeit nicht teilzunehmen

Im Folgenden ist der Verlauf von FN(w) abgebildet

Strukturierte Populationen

Bisherige Annahme, dass Population beliebig durchmischt ist,d.h. sie ist nicht strukturiert und nach keinen Kriterienangeordnet.

→← sehr unrealistisch

I Für gewöhnlich sind menschliche Populationen hochgradigstrukturiert und organisiert.

Bsp.: Individuen interagieren vorzugsweise innnerhalb vonFamilien, Nachbarschaft...

I Offensichtlich spielen diese Strukturen eine wichtige Rollein der Entwicklung von Kooperationen

I Bisher wurden solche Strukturen ausgeklammert

Verwandtenauslese

VerwandtenausleseI Abgeleitet aus der darwinistischen ÜberlebenstheorieI Ausgangspunkt sind solche Gene, die ihre eigene

Ausbreitung fördern, indem sie die Überlebenschancenund Fruchtbarkeit ihres Trägers erhöhen

→ Solche Gene werden häufiger auftauchen, als solche, diedies nicht tunBeispiel: Ein Gen, dass mich dazu veranlasst meinem Bruderzu helfenSolch ein Gen hilft sich hiermit selbst, da

I Wenn man seinem Bruder hilft, so erhöht man dessenÜberlebenswahrscheinlichkeit

I Da er ein Verwandter ist, trägt er auch dieses Gen undkann dieses weitergeben

I Somit ehöht das Gen die eigenen VerbreitungschancenDies ist die grundlegende Idee der Verwandtenauslese-Theorie

Hamilton-Regel

Eine wichtige Folgerung aus der Verwandtenauslese Theorieist die Hamilton-Regel

Zunächst eine Definition:Man bezeichnet dieGesamtfitness eines Lebewesens als die Anzahl dereigenen Gene, die an die nachfolgende Generationweitergegeben werden.Die Gesamtfitness setzt sichzusammen aus:

II1. Der direkten Fitness: Anzahl der eigenen Gene in deneigenen Nachkommen

2. Der indirekten Fitness: Anzahl der eigenen Gene, diedurch Verwandte zusätzlich an fremde Nachkommenweitergegeben werden.

Mit 2. lässt sich auch das Helferverhalten aus dem letztenBeispiel erklären.

Hamilton-Regel

Eine Aussage über die Anzahl der eigenen Gene in einemVerwandten macht der Verwandtschaftsgrad p

I Beispiel Kleinfamilie

A und B sind verheiratet.C und D sind Kinder von A und B.E ist Kind von C und PartnerF ist Kind von D und Partner.

Hamilton-Regel

I Die Wahrscheinlichkeit, dass ein bestimmtes Gen von Anach C übertragen wird ist 1

2I D.h. auch, dass der Verwandtschaftsgrad p von A und C

p = 12 ist.

Für den Verwandtschaftsgrad von C und D kann man folgern:I C und D übernehmen beide die Gene von A mit

Wahrscheinlichkeit 12

12 =1

4Analog dazu, dass beide die Gene von B übernehmen istdie Wahrscheinlichkeit auch 1

4I D.h. nun, dass C und D Verwandtschaftsgrad 1

2 = 14 + 1

4haben.

I Analog dazu ergibt sich ein Verwandschaftsgrad für F undC, also Neffe und Onkel von ( 1

2 )3 + ( 1

2 )3 = ( 1

4 )

Hamilton-Regel

I Betrachte das Donation Game mit Nutzen (b) und Kosten(c)In Bezug auf die Gene ist Nutzen bzw. Kosten alsFortpflanzungserfolg zu sehen

I Seien A, a zwei Strategien mit A: altruistisch und a:egoistisch

I A bedeutet: Man hilft, was Kosten c mit sich bringt undNutzen b für den anderen Spieler

I a bedeutet: Man hilft nicht, was keine Kosten und keinenNutzen bringt

Daraus ergibt sich folgende Matrix(b − c −c

b 0

)=

((A,A) (A,a)(a,A) (a,a)

)die 2. Strategie(a) ist der 1. Strategie(A) überlegen (sieheMatrix)

Hamilton-Regel

Man muss die Matrix jedoch in Bezug auf die Genemodifizieren.

I Denn hilft man jemandem mit Verwandschaftsgrad p, sohilft man sich indirekt selbst in Bezug auf Vermehrung dereigenen Gene.

I Dies geschieht dann zum Anteil p des Nutzens für denSpieler,dem man hilft.

Bsp.: Hat ein Spieler durch meine Hilfe den Gesamtnutzen b,so fällt für mich dabei der Nutzen pb, zusätzlich zu meinembestehenden Nutzen ab

I D.h. natürlich auch, je höher der Verwandtschaftsgrad,desto höher der abfallende Nutzen

Hamilton-Regel

Dadurch ergibt sich eine neue Matrix für die Strategien A,a mit2 Spielern(

(b − c) + p(b + c) −c + bpb − cp 0

)=

((A,A) (A,a)(a,A) (a,a)

)Man kann erkennen, dass wenn man pb > c wählt die 1.Strategie (A) die dominierende Strategie ist.

Als Hamilton Regel bezeichnet man die Ungleichung

p >cb

I Ist die Hamilton-Ungleichnung erfüllt, lohnt es sich immerzu kooperieren(helfen).

Gitterspiele

GitterspieleI Man betrachte eine starre Population, die nur mit den

Nachbarn interagiert.I Jeder hat 8 Nachbarn und spielt mit jedem das

Donation-Game mit bekannter MatrixI Jeder bleibt bei der gleichen Strategie mit seinen 8

Nachbarn, also C(koop.), D(nichtkoop.)

I Was wird passieren?I Lohn eines D ist: Ncb mit 0 < Nc < 8I Lohn eines C ist: Ncb − 8cI Jeder spielt eine Runde mit all seinen Nachbarn und

imitiert nach der Runde die lohnendste Strategie

→ Ein einzelner D infiziert alle C und ein einzelner C wird zu Dwechseln.

Gitterspiele

Unterschiedliche Anordnungen→ unterschiedliche Löhne

I Im linken Bild verdienen Kooperatorenan der Front (5b-8c)in der 2. Reihe (8b-8c)

I Nichtkooperatoren verdienenan der Front (3b)

I D.h. Kooperatoren sind besser dran als Nichtkooperatoren,wenn b/c > 4

Gitterspiele

In der Realität werden Nachbarschaftsverhältnisse

I eher durch kompliziertere Graphen dargestelltI viel zufälliger angeordnet seinI Strategien werden sich nicht nur durch Imitation verbreiten

I Eine Faustregel ist, dass die Kooperatoren gewinnen,wenn

k < bc mit k Anzahl der Nachbarn.

I Interaktionen im Netzwerk dürfen nicht zu unregelmässigsein

Zusammenfassung

Zusammenfassend kann man festhalten:I Bei offfentlichen Gütern entsteht oft das Dilemma, dass

Nichtkooperierende besser dran sind als Kooperierende

I Um dem entgegen zu wirken, stellte sich die freiwilligeTeilnahme am öffentlichen Gut als effektives Mittel heraus

I Versieht man eine Population mit vielen Strategien undHandlungsmöglichkeiten werden die Berechnungenschnell sehr kompliziert und aufwendig

I Versieht man eine Population noch mit Strukturen wieNachbarschaften, Familien, Freundschaften entstehensehr komplexe Systeme

I Es ist nicht möglich alle Faktoren in einer Population zuberücksichtigen, bzw. zu kennen