32
STI-2 LEERDOELEN Kennismaking met model- en theorievorming in de sociologie (of eigenlijk de sociale wetenschappen in het algemeen) Toepassen van model- en theorievorming op onderwerpen van eigen wetenschappelijke of maatschappelijke interesse Specifiek: inleiding in en kennismaking met Speltheorie Simulaties als methode van theorievorming Leertheorie

STI-2 LEERDOELEN Kennismaking met model- en theorievorming in de sociologie (of eigenlijk de sociale wetenschappen in het algemeen) Toepassen van model-

Embed Size (px)

Citation preview

Page 1: STI-2 LEERDOELEN Kennismaking met model- en theorievorming in de sociologie (of eigenlijk de sociale wetenschappen in het algemeen) Toepassen van model-

STI-2

LEERDOELEN

• Kennismaking met model- en theorievorming in de sociologie (of eigenlijk de sociale wetenschappen in het algemeen)

• Toepassen van model- en theorievorming op onderwerpen van eigen wetenschappelijke of maatschappelijke interesse

• Specifiek: inleiding in en kennismaking met– Speltheorie– Simulaties als methode van theorievorming– Leertheorie

Page 2: STI-2 LEERDOELEN Kennismaking met model- en theorievorming in de sociologie (of eigenlijk de sociale wetenschappen in het algemeen) Toepassen van model-

Oplossingen voor het dilemma der gevangenen

Het Prisoner’s Dilemma leidt tot een uitkomst die Pareto suboptimaal is: individuele rationaliteit leidt tot collectieve irrationaliteit

Drie oplossingen: - sancties [al gezien]- normen [al gezien]- herhaling van het spel

We laten steeds zien: als je <sancties / normen / herhaling van het spel> toelaat, dan is de evenwichtsvoorspelling mogelijk wél Pareto-optimaal.

situatie in de wereld model uitkomst van het model terugvertaling naar situatie in de wereld

Page 3: STI-2 LEERDOELEN Kennismaking met model- en theorievorming in de sociologie (of eigenlijk de sociale wetenschappen in het algemeen) Toepassen van model-

Oplossingen voor het dilemma der gevangenen 1

NB de kunst is bij al dit soort modelmatige analyses te beargumenteren waarom de oplossing in de praktijk werkt. Je moet dat laten zien door te laten zien dat deze werkt in het onderliggende model.

Oplossing 1: zet een straf op onwenselijk gedrag [Hobbes](uitgevoerd door derden).Dit maakt defectie minder aantrekkelijk.<toelichting op bord>

Wordt toegepast: - bij de belastingen- bij de bibliotheek- …

Aannames: - defectief gedrag moet observeerbaar zijn- in Assurance Games wordt het Pareto optimale evenwicht gespeeld

Page 4: STI-2 LEERDOELEN Kennismaking met model- en theorievorming in de sociologie (of eigenlijk de sociale wetenschappen in het algemeen) Toepassen van model-

Sancties op defectief gedrag

C D

C 3 , 3 0 , 5

D 5 , 0 1 , 1

C D

C 3 , 3 0 , 5-4

D 5-4 , 0 1-4 , 1-4

C D

C 3 , 3 0 , 1

D 1 , 0 -3 , -3

Defectie kost een straf van 4

Origineel Prisoner’s Dilemma

Resulterend spel

Page 5: STI-2 LEERDOELEN Kennismaking met model- en theorievorming in de sociologie (of eigenlijk de sociale wetenschappen in het algemeen) Toepassen van model-

Oplossingen voor het dilemma der gevangenen 2

• Oplossing 2: Normen. Zorg dat men een ‘mentale bonus’ ervaart voor het bijdragen aan het collectief. Dit maakt cooperatief gedrag aantrekkelijker.<toelichting op bord>

Aanname:- Observeerbaarheid niet meer nodig- Nog steeds: in assurance games wordt Pareto optimale evenwicht gespeeld

Praktijk:- Normen en waarden- Sesamstraat

Page 6: STI-2 LEERDOELEN Kennismaking met model- en theorievorming in de sociologie (of eigenlijk de sociale wetenschappen in het algemeen) Toepassen van model-

Normen: “coöperatie geeft een prettig gevoel”

C D

C 3 , 3 0 , 5

D 5 , 0 1 , 1

C D

C 3+3 ,3+3 0+3 , 5

D 5 , 0+3 1 , 1

C D

C 6 , 6 3 , 5

D 5 , 3 1 , 1

Coöperatie +3Origineel Prisoner’s Dilemma

Resulterend spel

Page 7: STI-2 LEERDOELEN Kennismaking met model- en theorievorming in de sociologie (of eigenlijk de sociale wetenschappen in het algemeen) Toepassen van model-

Coleman schema in deze toepassing van normen

Sociale condities:

Al dan niet vigerende normen

Wie/wat zijn de actoren? Wat zijn hun doelen en voorkeuren?

Homogene populatie actoren, doel=geld, n-actoren, simultane keuze, volledige informatie, …

Tot welk individueel gedrag leidt dit?

Bij sterke normen: evenwichten bij (C,C) en (D,D), maar (C,C) is Pareto optimaal.

Welke aannames zijn nodig voor je op het micro-niveau begint? Zie vorige slide.

Transformatie van individuele uitkomsten tot collectief gedrag?

In Assurance games wordt het PO-evenwicht gespeeld

Het Coleman-bootje

Handelingstheorie: speltheorie, actoren spelen hetgene in evenwicht is

Sociaal verschijnsel:

Productie collectieve goederen

Page 8: STI-2 LEERDOELEN Kennismaking met model- en theorievorming in de sociologie (of eigenlijk de sociale wetenschappen in het algemeen) Toepassen van model-

Oplossingen voor het dilemma der gevangenen 3

OPLOSSING: HERHALING VAN HET SPEL[voorbeeld: The Trench warfare]

Computertoernooi liet zien:

Tit-for-Tat is een goede strategie in het herhaalde gevangenendilemma.

Of puur theoretisch beargumenteerd:

1. Het eindig vaak herhaalde spel alleen wederzijdse defectie is evenwicht

2. Het oneindig vaak herhaalde spel met discounting / het zich met zekere kans herhalende spel. evenwicht dat leidt tot wederzijdse

coöperatie is mogelijk

Robert Axelrod

C D

C 3 , 3 0 , 5

D 5 , 0 1 , 1

“The evolution of cooperation” (1984)

Page 9: STI-2 LEERDOELEN Kennismaking met model- en theorievorming in de sociologie (of eigenlijk de sociale wetenschappen in het algemeen) Toepassen van model-

Strategieën in het herhaalde Prisoner’s Dilemma (1)

Random – cooperate (and defect) with probability 50%

Always Defect

Always Cooperate

Tit For Tat – Start with cooperating in round 1, then repeat opponent's last choice (ingediend door Anatol Rapoport)

Suspicious Tit For Tat - As for Tit For Tat except it begins by defecting.

Tit For Tat and Random - Repeat opponent's last choice skewed by random setting.*

Naive Prober (Tit For Tat with Random Defection) - Repeat opponent's last choice (as in Tit For Tat), but sometimes probe by defecting in stead of cooperating.*

Remorseful Prober (Tit For Tat with Random Defection) - Repeat opponent's last choice (as in Tit For Tat), but sometimes probe by defecting instead of cooperating. If the opponent defects in response to probing, show remorse by cooperating on the next round.*

Page 10: STI-2 LEERDOELEN Kennismaking met model- en theorievorming in de sociologie (of eigenlijk de sociale wetenschappen in het algemeen) Toepassen van model-

Strategieën in het herhaalde Prisoner’s Dilemma (2)

Naive Peace Maker (Tit For Tat with Random Co-operation) - Repeat opponent's last choice (ie Tit For Tat), but sometimes make peace by co-operating in lieu of defecting.*

True Peace Maker (hybrid of Tit For Tat and Tit For Two Tats with Random Co-operation) - Co-operate unless opponent defects twice in a row, then defect once, but sometimes make peace by co-operating in lieu of defecting.*

Grudger (Co-operate, but only be a sucker once) - Co-operate until the opponent defects. Then always defect unforgivingly.

Pavlov (repeat last choice if good outcome) - If 5 or 3 points scored in the last round then repeat last choice.

Adaptive - Starts with c,c,c,c,c,c,d,d,d,d,d and then takes choices which have given the best average score re-calculated after every move.

Gradual - Cooperates until the opponent defects, in such case defects the total number of times the opponent has defected during the game. Followed up by two co-operations.

Soft Grudger - Cooperates until the opponent defects, in such case opponent is punished with d,d,d,d,c,c.

Customised strategy 1 - default setting is T=1, P=1, R=1, S=0, B=1, always co-operate unless suckered (ie 0 points scored).

* Strategies with random intervention

Page 11: STI-2 LEERDOELEN Kennismaking met model- en theorievorming in de sociologie (of eigenlijk de sociale wetenschappen in het algemeen) Toepassen van model-

Axelrod’s conclusies op basis van zijn computertoernooien

• Tit-for-Tat doet het heel goed in dit soort toernooien

• Dit komt doordat Tit-for-Tat de volgende eigenschappen heeft:- aardig (begint niet met defecteren)- provoceerbaar- vergevingsgezind- eenvoudig

Later onderzoek heeft deze resultaten wel genuanceerd:

- Tit-for-Tat wint lang niet altijd, dat is maar helemaal afhankelijk van de andere strategieën die meedoen- Aardige strategieen doen het ook lang niet altijd het beste- zie ook http://www.iterated-prisoners-dilemma.net/

Page 12: STI-2 LEERDOELEN Kennismaking met model- en theorievorming in de sociologie (of eigenlijk de sociale wetenschappen in het algemeen) Toepassen van model-

Dilemma der gevangenen: algemeen

cooperatie defectie

cooperatie3 , 3 R , R

0 , 5 S , T

defectie5 , 0 T , S

1 , 1 P , P

rij

kolom

S < P < R < T (en vaak ook 2R > S + T)

Page 13: STI-2 LEERDOELEN Kennismaking met model- en theorievorming in de sociologie (of eigenlijk de sociale wetenschappen in het algemeen) Toepassen van model-

<toelichting op bord>

[TFT met TFT is in evenwicht als w groot genoeg is]

Page 14: STI-2 LEERDOELEN Kennismaking met model- en theorievorming in de sociologie (of eigenlijk de sociale wetenschappen in het algemeen) Toepassen van model-

Oplossingen voor het dilemma der gevangenen 3

• Oplossing 3: herhaling

• In het met zekere kans w herhaalde dilemma der gevangenen geldt het volgende:

De strategieëncombinatie (altijd D, altijd D) is in evenwicht.

Als w > (T-R) / (T-P) dan is de strategieëncombinatie (Tit-For-Tat , Tit-For-Tat) in evenwicht.

Implicatie: als een gezamenlijke toekomst maar belangrijk/waarschijnlijk genoeg is, dan is wederzijds coöperatief gedrag mogelijk (in de zin dat het wordt ondersteund door een evenwicht).

(NB hier staat dus “mogelijk”, en niet “noodzakelijk” of “altijd de juiste keuze” oid)

Page 15: STI-2 LEERDOELEN Kennismaking met model- en theorievorming in de sociologie (of eigenlijk de sociale wetenschappen in het algemeen) Toepassen van model-

“Folk theorem”: welke evenwichten zijn mogelijk?

1 3 50

1

3

5

Gem. uitbetaling voor speler 1

Gem. uitbetaling voor speler 2

Evenwicht met wederzijdse cooperatie op het evenwichts-pad[als w>(5-3)/(5-1)=0.5]

Evenwicht met wederzijdse defectie op het evenwichtspad.

Folk theorem zegt:

Alle elementen in het rode gebied zijn evenwicht als w maar groot genoeg is! (dwz er is een strategieencombinatie te verzinnen die als gemiddelde uitbetaling een punt in het rode gebied heeft)

Als Pareto-optimale evenwichten worden verkozen boven Pareto-suboptimale evenwichten voorspelling is dat alleen de evenwichten op de donkerrode “Pareto rand” voor zullen komen

Page 16: STI-2 LEERDOELEN Kennismaking met model- en theorievorming in de sociologie (of eigenlijk de sociale wetenschappen in het algemeen) Toepassen van model-

Voorspellingen o.b.v. Axelrod’s herhaalde PD

• Strikte voorspelling:

als w < (T-R)/(T-P), dan NOOIT coöperatief gedrag

als w > (T-R)/(T-P), dan wordt coöperatief gedrag door een speltheoretisch evenwicht ondersteund (net zoals veel andere soorten gedrag)

met w = kans op het halen van de volgende rondeen P, R en T uitbetalingen in het gevangenendilemma

• Iets minder strikte voorspelling

hoe groter w is (hoe groter de ‘shadow of the future’), des te waarschijnlijker dat coöperatief gedrag voorkomt[coöperatief gedrag wordt makkelijker als er een grotere kans op een gezamenlijke toekomst is]

hoe groter (T-R)/(T-P) is, des te onwaarschijnlijker dat coöperatief gedrag voorkomt[coöperatief gedrag wordt moeilijker als de omstandigheden in het onderliggende spel ongunstiger zijn]

Page 17: STI-2 LEERDOELEN Kennismaking met model- en theorievorming in de sociologie (of eigenlijk de sociale wetenschappen in het algemeen) Toepassen van model-

Herhaling kan werken

Dus: bij collectief goed problemen …

… zorg voor herhaling van interactie tussen de betrokken actoren ... met een onzeker einde.

- samen aan een werkstuk werken- etc

Page 18: STI-2 LEERDOELEN Kennismaking met model- en theorievorming in de sociologie (of eigenlijk de sociale wetenschappen in het algemeen) Toepassen van model-

Bezwaren tegen “het rationele model”

(zoals o.a. vaak in speltheoretische of i.h.a. In economische modellen wordt gebruikt)

(Nb staat niet in de reader)

Page 19: STI-2 LEERDOELEN Kennismaking met model- en theorievorming in de sociologie (of eigenlijk de sociale wetenschappen in het algemeen) Toepassen van model-

Bezwaar tegen het “strikt rationele model”

Bezwaar: speltheorie is dusdanig ingewikkeld, dat het ontzettend onwaarschijnlijk is dat mensen dit bij echte beslissingen toepassen. Zo rationeel zijn mensen niet.

Tegenargumenten tegen dit bezwaar:

• Nash evenwichten zijn (onder bepaalde voorwaarden) ‘evolutionair stabiel’. Je mag dus hopen dat over de loop van de tijd optimaal gedrag van individuen, wellicht onbewust, is ‘ingesleten’.

• De (minder strikte) voorspellingen komen toch aardig uit.

• Mensen zijn weliswaar niet volledig rationeel, maar het rationele model levert een goed basis voor uitbouw (“als we het voor rationele egoïsten geregeld krijgen, dan lukt het voor de altruïsten ook wel”)

• Als je aanneemt dat mensen niet volledig rationeel zijn, wat moet je dan aannemen over menselijk gedrag? [antw: de consistente irrationaliteiten]

Page 20: STI-2 LEERDOELEN Kennismaking met model- en theorievorming in de sociologie (of eigenlijk de sociale wetenschappen in het algemeen) Toepassen van model-

Het “model of man” in sociaalwetenschappelijke theorieen

• In veel gevallen: een model waarin rationele handelingen de basis zijn (ook al klopt dat niet helemaal) is voldoende.

• Als blijkt dat dat toch onvoldoende is (te zien bijv omdat je voorspellingen op basis van je model niet kloppen): controleer eerst of de uitwerking van de sociale condities op de individuen misschien anders gemodelleerd kan worden.

• Als dat ook niet werkt, neem iets anders aan over het gedrag van individuen: neem aan dat ze rationeel zijn, maar op een wat eenvoudiger manier (bijv. ze kijken naar hun mede-actoren, en doen vervolgens na wat succesvolle mede-actoren doen).

• Als dat niet werkt, neem dan aan dat mensen irrationeel zijn, maar neem dan wel aan dat ze allemaal op dezelfde manier irrationeel zijn.

NB voor dit laatste is het nodig te weten waar mensen typisch (=op consistente wijze) afwijken van de voorspellingen van het rationele model, en daar zullen we een paar voorbeelden van langslopen.

Page 21: STI-2 LEERDOELEN Kennismaking met model- en theorievorming in de sociologie (of eigenlijk de sociale wetenschappen in het algemeen) Toepassen van model-

Afwijkingen van het rationele model - 1

Prospect Theory (Kahneman & Tversky) Wat heb je liever: 

A 300B 400 met kans 75% (anders 0)

  Wat heb je liever: 

C 300 verliesD 400 verlies met kans 75% (anders 0)

 Meeste mensen: liever A dan B, maar … liever D dan C. Mensen zijn risicomijdend voor winsten, risicozoeken voor verliezen.

Page 22: STI-2 LEERDOELEN Kennismaking met model- en theorievorming in de sociologie (of eigenlijk de sociale wetenschappen in het algemeen) Toepassen van model-

Afwijkingen van het rationele model - 2

Framing (Kahneman & Tversky) 

Er zal een ziekte uitbreken die naar verwacht 600 mensen zal doden. Er zijn twee mogelijke ‘plannen van aanpak’.

   A 200 mensen zijn te redden 

B een kans van 1 op 3 dat 600 mensen zullen worden gered, en een kans van 2 op 3 dat geen mensen zullen worden

gered. = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = =

Idem, maar nu met de volgende ‘plannen van aanpak’: 

C 400 mensen zullen zeker sterven 

D een kans van 1 op 3 dat niemand sterft, en een kans van 2 op 3 dat 600 mensen sterven

  [72% prefereert A] [22% prefereert C]

Page 23: STI-2 LEERDOELEN Kennismaking met model- en theorievorming in de sociologie (of eigenlijk de sociale wetenschappen in het algemeen) Toepassen van model-

Afwijkingen van het rationele model - 3

The conjunction effect

Mark is 34 jaar oud. Hij is intelligent, maar niet erg spontaan, hij gedraagt zich enigszins dwangmatig. Op school was hij goed in de beta-vakken maar zwakker in talen. Hij heeft weinig echte vrienden en communiceert wat moeilijk.

Mark ...

1 is huisarts, en heeft als hobby pokeren2 is architect3 is programmeur4 houdt van Star Wars5 heeft als hobby wildwatervaren6 is journalist7 is programmeur en houdt van Star Wars8 houdt van bergbeklimmen

Page 24: STI-2 LEERDOELEN Kennismaking met model- en theorievorming in de sociologie (of eigenlijk de sociale wetenschappen in het algemeen) Toepassen van model-

Afwijkingen van het rationele model - 4

Base-rate fallacy

2% van de mensen heeft ziekte Z. Als je inderdaad ziekte Z hebt, geeft een bepaalde test een positief resultaat met kans 90%. Als je ziekte Z niet hebt, geeft de test een positief resultaat met kans 5%. Je wordt getest; het resultaat is positief. Wat is de kans dat je de ziekte Z hebt?

Test pos. Test neg.

Ziek 18 2 20Niet ziek 49 931 980

Dus: als je weet dat je positief bent getest, dan is de kans dat je de ziekte hebt 18 / (18 + 49) = 27%

NB Die 2% en die 5% maken nogal uit voor het resultaat!

Page 25: STI-2 LEERDOELEN Kennismaking met model- en theorievorming in de sociologie (of eigenlijk de sociale wetenschappen in het algemeen) Toepassen van model-

Base rate neglect - vervolg

Verwarren van Kans(A|B) met Kans(B|A)

Voorbeeld: er is een moord gepleegd. Het enige bewijsmateriaal is DNA, gevonden op de plaats van de misdaad. Het resultaat laat een match zien met jouw DNA. De kans dat iemand anders een match heeft met het DNA bewijsmateriaal is 1 op 100.000. Wat is de kans dat je de dader bent?

Stel: de moord was gepleegd in Eindhoven (700.000 inwoners). Die komen allemaal in aanmerking om de dader te zijn. Zeven daarvan ‘matchen’ op hetzelfde DNA materiaal. De kans dat jij het hebt gedaan is daarom niet meer dan 1 op 7. Als er verder geen bewijsmateriaal is, zou je moeten worden vrijgesproken.

Verwisseling: Kans (DNA match | jij bent dader)Kans (jij bent dader | DNA match)

Page 26: STI-2 LEERDOELEN Kennismaking met model- en theorievorming in de sociologie (of eigenlijk de sociale wetenschappen in het algemeen) Toepassen van model-

Afwijkingen van het rationele model - 5

De Wason selectie taak (oorzaak en gevolg)

Hypothese: als je leidt aan paranoia, teken je gezichten met in verhouding heel grote ogen

Er zijn kaartjes met aan de ene kant de diagnose (“paranoia” of iets anders) en aan de andere kant een tekening van een gezicht, getekend door de betreffende patient.

Er liggen vier kaartjes:

A een kaartje met “paranoia”B een kaartje met “niet paranoia: normaal”C een kaartje met een gezicht met grote ogenD een kaartje met een gezicht met normale ogen

Vraag: welke kaartjes moet je omdraaien om de hypothese te toetsen?

Resultaat: men kiest voor A, soms C, soms B, zelden D.Iha: mensen zoeken naar bevestigend feitenmateriaal.

Page 27: STI-2 LEERDOELEN Kennismaking met model- en theorievorming in de sociologie (of eigenlijk de sociale wetenschappen in het algemeen) Toepassen van model-

Afwijkingen van het rationele model – 6

Overconfidence (Fischhoff, Slovic, Lichtenstein, 1977)

Test: Trivial Pursuit achtige vragen, waarbij men per vraag behalve het antwoord aangeeft hoe zeker men is van het antwoord

Algemeen: te veel vertrouwen in eigen kunnen

“debiasing” is bijna onmogelijk

Te veel vertrouwen speelt sterker bij personen met – in principe – kennis van het onderwerp!

Page 28: STI-2 LEERDOELEN Kennismaking met model- en theorievorming in de sociologie (of eigenlijk de sociale wetenschappen in het algemeen) Toepassen van model-

Afwijkingen van het rationele model - 7

Anchoring

Draai roulettewiel, kijk waar het balletje op valt, en lees dit voor.

Vraag aan respondent (bijvoorbeeld): hoeveel Afrikaanse staten zitten er in de Verenigde Naties?

Hoe hoger het roulettenummer was, des te hoger de antwoorden (!).

Page 29: STI-2 LEERDOELEN Kennismaking met model- en theorievorming in de sociologie (of eigenlijk de sociale wetenschappen in het algemeen) Toepassen van model-

Conclusie: afwijkingen van het rationele model

• Als je een situatie modelmatig wilt beschrijven: blijf af van afwijkingen van het rationele model zolang het kan

• Als je toch afwijkingen van het rationele model mee wilt modelleren: neem dan gedocumenteerde afwijkingen (zoals hiervoor genoemd).

nb er staan een paar voorbeelden op de website van onderzoek dat juist gebruik maakt van “irrationeel gedrag” (Prospect theory)

Page 30: STI-2 LEERDOELEN Kennismaking met model- en theorievorming in de sociologie (of eigenlijk de sociale wetenschappen in het algemeen) Toepassen van model-

Terug naar rationeel gedrag: “paniek in het theater” (Coleman, zie reader)

Bij brand in een theater krijg je soms paniek (iedereen rent tegelijkertijd naar de uitgang), soms niet.Wanneer krijg je paniek, en wanneer niet?

nb dit voorbeeld laat zien dat irrationeel ogend gedrag te begrijpen kan zijn als rationeel gedrag “in vermomming”

< zie verder uitleg bord >

Page 31: STI-2 LEERDOELEN Kennismaking met model- en theorievorming in de sociologie (of eigenlijk de sociale wetenschappen in het algemeen) Toepassen van model-
Page 32: STI-2 LEERDOELEN Kennismaking met model- en theorievorming in de sociologie (of eigenlijk de sociale wetenschappen in het algemeen) Toepassen van model-

Simulatiemodellen: voors en tegens

TEGEN

• Resultaten van simulaties moeten actief onderzocht (“er komt niet één antwoord uit”) …

• … en dat is typisch lastig omdat bij een beetje model er zo veel parameters zijn die kunnen variëren.

• Reproduceerbaarheid is lastiger dan bij wiskundige modellen.

• Tests voor robuustheid zijn nodig (je wilt juist niet dat je conclusie sterk afhangt van een irrelevant ogende aanname)

• ‘Externe validiteit’ is, zoals bij ieder model, altijd betwistbaar (“de werkelijkheid is ingewikkelder, dus wat heb ik aan zo’n model waar niet alles in zit”) NB Oplossing hiervoor is simpelweg om de implicaties van de modellen met echte gegevens uit de wereld te toetsen.