Samenvatting An Introduction to Game Theory (Osborne, M.J.)

Deze samenvatting bij An Introduction to Game Theory (Osborne) is geschreven in 2014


Hoofdstuk 1 - Inleiding

Wat houdt het vak speltheorie in? De vakbeschrijving speltheorie:

‘Game Theory’ gaat over het maken van strategisch onderling afhankelijke beslissingen. In zulke situaties hangen de resultaten van jouw handelingen ook af van de handelingen van anderen. Wanneer jij je keuze maakt heb je rekening te houden met wat andere zullen doen, zij zullen op hun beurt bedenken wat jij gaat doen en zo gaat het door. ‘Game theory’ biedt verschillende concepten en inzichten om zulke situaties te begrijpen en te analyseren, zo kunnen er betere strategische beslissingen gemaakt worden. Deze cursus zal enige basis ideeën creëren van de speltheorie. Formele theorie (Nash evenwicht, deelspel met een perfect evenwicht, Bayesian Nash evenwicht, sequentieel evenwicht) zal worden geïllustreerd met voorbeelden. Deze bevatten: oligopolie, veilingen, publieke goederen, onderhandelingen, signaleren en stemmen. Deze cursus is analytisch uitdagend en vereist een bereidheid en vermogen te denken.

Wat is het doel van het bestuderen van de speltheorie?

Vele situaties in de economie kunnen beschouwd worden als een spel. Bedrijven in dezelfde markt concurreren door middel van prijzen of door middel van hun aanbod: niet voor niets is er in krantenberichten vaak sprake van ‘spelers’ in een markt. Bieders in een veiling – van kunstvoorwerpen, maar ook van openbare aanbestedingen van publieke projecten – spelen onderling een spel: men tracht te gissen wat andere bieders zullen doen, en probeert het eigen bod daaraan aan te passen. Ook in de politiek is er vaak sprake van een spel. Politieke partijen kiezen onderling posities om zoveel mogelijk stemmen te verwerven. Kiezers maken een inschatting van hoe andere kiezers zullen stemmen, en bepalen op basis daarvan hun eigen keuze.

De speltheorie biedt een uitgebreid instrumentarium om dergelijke situaties wiskundig te modelleren en te analyseren. We zullen hiervan een aantal voorbeelden zien. Het belangrijkste hierbij is de eerste fase: die van het modelleren. Dit betekent in de eerste plaats: vaststellen wie de spelers zijn. Vervolgens moet worden bepaald welke mogelijke acties en welke mogelijke strategieën een speler heeft. Het verschil tussen ‘actie’ en ‘strategie’ is vergelijkbaar met het verschil tussen het uitspelen van een kaart en het maken van een volledig speelplan in een spelletje bridge. Tenslotte moet bepaald worden welke uitbetalingen de spelers krijgen, afhankelijk van de gespeelde strategieën. Daarnaast moet ook nog vastgelegd worden welke informatie de spelers aan het begin van het spel hebben, en welke informatie ze gedurende het spel krijgen.

De beste manier om met de speltheorie kennis te maken is door middel van voorbeelden, en deze staan in het boek dan ook centraal.

Hoe ziet deze samenvatting eruit?

Deel I – Spellen met perfecte informatie

Dit deel beschrijft de meest gebruikte modellen van de speltheorie.

  • Een strategisch spel – Acties van individuen – acties zijn definitief

  • Een extensief spel – Acties van individuen – acties kunnen in het verloop van het spel worden veranderd.

  • Een coalitie spel – Acties van groepen - acties zijn definitief

Deel II – Spellen met imperfecte informatie

Dit deel beschrijft de strategische en extensieve spellen in situaties waarin de spelers niet helemaal op de hoogte zijn van dezelfde informatie.

Deel III – Varianten en extensies

Dit deel beschrijft delen buiten de basistheorie, zoals alternatieven van het evenwicht en evolutionaire druk.

De samenvatting volgt dezelfde indeling als het boek. De delen en hoofdstukken zijn gelijk. Echter zijn er sommige subkopjes (bijvoorbeeld: 2.5) uit het boek weggelaten. In het boek zijn dit voornamelijk herhalingen, voorbeelden of toelichtingen die in de samenvatting niet relevant zijn. Het is echter sterk aan te raden om deze wel goed door te lezen om meer grip te krijgen op de stof. De rode draad, de belangrijke subkopjes, zijn wel beschreven in de samenvatting. Ook zijn sommige wiskundige berekeningen of moeilijke wiskundige notaties achterwege gelaten; deze berekeningen en notaties dienen slechts als ‘achtergrond verklaring’ die het boek moet geven om de stellingen en definities te bewijzen. Echter zijn deze voor de tentamenstof niet relevant. De focus ligt vooral op de toepassing van de speltheorie, niet de verklaring.

Als je de stof uit het boek bestudeert leg dan vooral de nadruk op hoofdstuk 2, 4, 5, 9 en 10.

Introductie

Wat is speltheorie? Het is een spel wat ons helpt bij het begrijpen van situaties waarin verschillende partijen met elkaar in interactie zijn.

The theory of rational choice’

De theorie van de rationele keuze is een component wat je in veel spellen terugvindt. Het betekent dat de beslisser de beste actie kiest gegeven zijn preferenties. Rationaliteit speelt een belangrijke rol; men laat zich niet leiden door emoties. Deze gegevens leiden tot de volgende stelling:

‘De actie gekozen door de beslisser is tenminste zo goed, gezien zijn preferenties, als een andere beschikbare actie’

Verschillende elementen van een spel:

  • Acties (A): Alle acties die beschikbaar zijn voor de beslisser.

  • Actieprofiel: Een lijst van alle spelers hun acties.

  • Specifieke actie (a): Een van de acties die beschikbaar is voor de beslisser.

  • Preferentie: Men gaat ervan uit dat de beslisser weet welke actie hij prefereert of dat er sprake is van geen preferentie – ofwel indifferentie (actie a is gelijk aan actie b). Men gaat ervan uit dat de beslisser consistent is in zijn preferentie (actie a zal dus altijd gelijk zijn aan actie b als de omstandigheden niet veranderen ceteris paribus).

  • ‘Payoff’ functie (u) of de ‘utility’ functie: het representeren van de preferenties in een curve. Let op, een ‘payoff’ functie is altijd ordinaal. Dit betekent dat je er nooit de schaal van af kan lezen; je zal nooit weten of de beslisser actie a twee keer zo graag wilt laten voorkomen als actie b. Je weet alleen dat hij actie a prefereert boven actie b.

Men moet zich bij de uitkomsten altijd beseffen dat dit niet de complete werkelijkheid bevat. In modellen en theorieën wordt vaak een afweging gemaakt tussen het aantal implicaties wat wordt toegevoegd waardoor het model de werkelijkheid beter weergeeft en de bruikbaarheid van het model.

Hier wordt er slechts rekening gehouden met een enkele beslisser. Als er een andere speler of beslisser in het spel is, ontstaat er meer dynamiek. In dit geval wordt het ook officieel een spel (game) genoemd. In een spel houden spelers rekening met de keuze van de andere speler(s).

Deel I – Spellen met perfecte informatie

Hoofdstuk 2 – Nash evenwicht: theorie

Strategische spellen

Een strategisch spel is een interactie tussen beslissers. Deze beslissers worden ‘spelers’ genoemd. Dit spel bestaat tenminste uit:

  • Spelers

  • Voor elke speler een aantal mogelijke acties

  • Voor elke speler een voorkeur voor actie(s)

Daarnaast heeft een strategisch spel een aantal kenmerken:

  • De voorkeuren zijn ordinaal

  • De beste keuzes worden gerepresenteerd door de voorkeuren van spelers, dus niet door hun uitbetalingen.

  • Er zit geen tijd verwerkt in het model

  • Elke speler kiest zijn actie voor altijd – dit betekent dat in de loop van het spel de acties niet meer worden veranderd

  • De spelers kiezen gelijkertijd hun actie, zodat ze niet op elkaar kunnen reageren.

Het ‘prisoner’s’ dilemma

Twee verdachten worden vastgehouden in een cel. Er is genoeg bewijs om beiden te veroordelen. Echter is er niet genoeg bewijs om een van hen te veroordelen voor de misdaad, tenzij de andere als informant optreedt. Als ze beiden hun mond houden krijgen ze allebei 1 jaar gevangenisstraf. Als een van hen de ander verraad dan wordt de verrader vrij gelaten en krijgt de ander 4 jaar. Als ze beiden elkaar verraden krijgen ze allebei 3 jaar gevangenisstraf.

De opzet van het spel:

Spelers: Twee gevangenen

Acties: Zwijgen en verraden

Preferenties: Als jij verraad en de ander zwijgt.

Nut: voor elke spelers is een maximale strategie. Speler 1 staat altijd links, speler 2 staat altijd rechts van de komma.

Speler 1 - u1 (Verraden, zwijgen) > u1 (zwijgen, zwijgen) > u1 (verraden, verraden) > u1 (zwijgen, verraden)

Speler 2 – u2 (zwijgen, verraden) > u2(zwijgen, zwijgen) > u2 (verraden, verraden) > u2 (verraden, zwijgen)

Dit kan je weergeven in een tabel:

 

Zwijgen

Verraden

Zwijgen

2,2

0,3

Verraden

3,0

1,1

Links staat altijd speler 1, boven staat altijd speler 2 – de linkse getallen gelden dus altijd voor speler 1, de rechter getallen voor speler 2. Dit wordt de rest van de samenvatting aangehouden – (speler1, speler2).

Het ‘prisoner’s’ dilemma laat een situatie zien waar samenwerking tot de beste uitkomst leidt. Echter heeft elke speler de mogelijkheid om te ‘freeriden’, oftewel afwijken van deze samenwerking. De speler zal in dit geval flink profiteren van het afwijken, hij krijgt namelijk geen gevangenisstraf.

Er zijn veel vergelijkbare situaties waarin het ‘prisoner’s’ dilemma kan worden gebruikt, zoals in een duopolie en een wapenwedloop.

 

 

Zwijgen

Verraden

Zwijgen

keuze A

keuze B

Verraden

keuze C

keuze D

Een situatie is pas vergelijkbaar als de volgorde van preferentie hetzelfde is als bij het ‘prisoner’s’ dilemma:

Speler 1 keuze:

C

Gaat voor

A

Gaat voor

D

Gaat voor

B

Battle of the sexes’ (BoS spel)

Een ander voorbeeld van een spel is het ‘battle of the sexes’ spel. Hierbij moet een echtpaar een keuze maken uit uitstapje 1 of uitstapje 2. De man (speler 1) prefereert uitstapje 1 – een voetbalwedstrijd. De vrouw (speler 2) prefereert uitstapje 2 – een balletvoorstelling.

De tabel ziet er als volgt uit:

 

Voetbal

Ballet

Voetbal

2,1

0,0

Ballet

0,0

1,2

Uit de tabel kan worden opgemaakt dat beiden hun eigen preferentie hebben, echter vinden ze het ook leuker om iets samen te doen dan allebei apart naar hun eigen preferentie te gaan.

Matching pennies’

Het ‘matching pennies’-spel is een spel van conflict. Twee mensen kiezen, gelijkertijd, munt of kop.

  • Als beiden dezelfde kant hebben gekozen: Persoon 2 betaalt een euro aan persoon 1

  • Als beiden een andere kant hebben gekozen: Persoon 1 betaalt een euro aan persoon 2

Allebei de personen willen zo veel mogelijk geld verdienen.

 

Munt

Kop

Munt

1,-1

-1,1

Kop

-1,1

1,-1

In dit spel willen spelers altijd precies het omgekeerde, samenwerking is onmogelijk.

Het Nash-evenwicht

Essentie: ‘In de speltheorie is een Nash-evenwicht een strategie-profiel waarbij het voor geen enkele speler voordelig is daarvan af te wijken, als de andere spelers dat niet ook doen.’

Dit uitgelegd in tekens: ‘Actie profiel a* is het Nash-evenwicht aangezien geen enkele speler i zichzelf beter kan maken door af te wijken van a*i, gegeven dat de andere speler j zich houdt aan a*j.’

Notering:

a actie profiel

ai actie van speler i

aj actie van speler j

a’i een willekeurige actie van speler i (kan gelijk zijn aan ai, maar hoeft niet!)

a’j een willekeurige actie van speler j (kan gelijk zijn aan aj, maar hoeft niet!)

-i Met uitzondering van i (a-i betekent dus alle andere spelers dan speler i)

a-i Alle andere spelers dan i

a* Nash-evenwicht

Bi(a-i) Beste response

n aantal spelers

Het nash-evenwicht is een vaste staat; geen enkele speler zal afwijken. In de bovenstaande notering is deze staat als volgt: (ai, a*-i).

Voorbeeld:

In dit spel kiezen 2 spelers ieder kop of munt. Als ze hetzelfde kiezen krijgen ze een prijs, anders niet. De uitbetalingen staan in onderstaande tabel. In onderstaand voorbeeld kiest i (speler 1) eerst en daarna j (speler 2).

 

Munt

Kop

Munt

2,2

0,0

Kop

0,0

2,2

i en j overleggen en kiezen ervoor om beide kop te kiezen. Dat is dan het strategieprofiel wat bij dit spel hoort: [kop, kop] voor [Speler1, speler2]. Dit strategieprofiel is een Nash-evenwicht. Op het moment dat i kop heeft gekozen en j moet zijn keuze nog bepalen, heeft het voor j geen zin om nog van strategie te veranderen. Als j afwijkt van de afspraak dan zal hij hierdoor geen extra inkomen vergaren. Conclusie: geen van de spelers zal afwijken van de afspraak – er is een vaste staat, oftewel een Nash-evenwicht.

Hierbij staat vast dat: gegeven dat speler i de strategie ai kiest zal speler j strategie a*j kiezen. Oftewel: ui(a*) ≥ ui(ai, a*-i) voor elke actie ai van speler i.

Let op dat niet elk spel een Nash evenwicht heeft. Daarnaast hebben sommige spellen meer dan een nash-evenwicht.

Het Nash-evenwicht in combinatie met het ‘prisoner’s’ dilemma – 1 Nash-evenwicht

In het ‘Prisoner's’ dilemma kiezen 2 verdachten tussen bekennen en zwijgen. Van deze actie hangt hun (eventuele) straf af. In onderstaand voorbeeld kiest i eerst tussen zwijgen of bekennen en vervolgens kiest j. Er wordt dus niet tegelijkertijd gekozen.

 

Zwijgen

Verraden

Zwijgen

2,2

0,3

Verraden

3,0

1,1

Als je kijkt wat de beste strategie is voor beide spelers als ze samenwerken, zou je kunnen verwachten dat ze ervoor kiezen om allebei te zwijgen. In dat geval krijgen ze namelijk alleen maar een geldboete. Dit strategieprofiel is geen Nash-evenwicht. Beiden spelers hebben een motivatie om af te wijken van dit evenwicht. Het actieprofiel (verraden, verraden) is wel een Nash evenwicht. Geen enkele speler zal afwijken – oftewel zwijgen.

Het Nash evenwicht in combinatie met het BoS spel – 2 Nash evenwichten

In dit spel kiest een echtpaar tussen twee uitjes, voetbal of ballet.

 

Voetbal

Ballet

Voetbal

2,1

0,0

Ballet

0,0

1,2

(Voetbal, voetbal) – in dit geval is het voor beide spelers niet zinvol om af te wijken, ze zullen er alleen maar door achteruit gaan. Dit is dus een Nash evenwicht

(Voetbal, ballet) – in dit geval is het wel zinvol om af te wijken. Dit is geen Nash evenwicht.

(Ballet, voetbal) – in dit geval is het tevens zinvol om af te wijken. Dit is geen Nash evenwicht.

(Ballet, ballet) – in dit geval is niet zinvol om af te wijken. Dit is ook een Nash evenwicht.

Het BoS spel heeft dus twee Nash evenwichten. Dat betekent dat beide uitkomsten in een vaste staat verkeren, niemand zal afwijken.

Echter, als het spel iets wordt aangepast en men gaat uit van een lesbisch stel waar beiden partners een voetbal wedstrijd prefereren boven een ballet voorstelling, gaan de twee Nash evenwichten dan nog steeds op?

 

Voetbal

Ballet

Voetbal

2,2

0,0

Ballet

0,0

1,1

Volgens de normen van het Nash-evenwicht wel. Mocht men terecht komen in de situatie (ballet, ballet) dan heeft geen enkele speler een motivatie om daarvan af te wijken. Ook dit evenwicht is dus een Nash-evenwicht.

Het Nash-evenwicht in combinatie met het ‘matching pennies’-spel – Geen Nash-evenwicht

De spelers kiezen tegelijkertijd kop of munt.

 

Munt

Kop

Munt

1,-1

-1,1

Kop

-1,1

1,-1

Dit spel heeft geen Nash evenwicht. Alle spelers zullen in alle gevallen altijd beter afzijn door af te wijken. Er is geen vaste staat waarin beiden spelers tevreden zijn.

Strikt en een niet strikt evenwicht

Volgens de definitie van het Nash evenwicht moet een speler ´slechter af zijn´als hij afwijkt van het evenwicht. Het kan echter voorkomen dat een speler ´even goed´ af is door af te wijken van het evenwicht.

 

L

M

R

T

1,1

1,0

0,1

B

1,0

0,1

1,0

In dit geval is de actie (T,L) een Nash evenwicht, echter geen strikt Nash evenwicht. Als speler 2 L kiest dan kan speler 1 zowel T als B kiezen, speler 1 is onverschillig.

Een Nash evenwicht is pas strikt als dat evenwicht beter is voor alle spelers, gegeven de tegenstander zijn actie. Kortom, ui(a*) > ui(ai, a*-i) voor elke actie ai ≠ a*i.

Beste reactie functies

Tot dusver zijn er alleen gemakkelijke spellen voorbij gekomen. Als de spellen ingewikkelder worden is het goed om een beste reactie functie uit te werken.

Bi(a-i) Speler i zijn beste actieprofiel gegeven dat de andere spelers a-i spelen

Kortom, in het vorige voorbeeld is B1(L) = {T, B}.

Bi is de beste response functie van speler ì. Dit houdt in dat er voor elke actie van de tegenstander een reactie wordt gevormd. De verzameling van deze reacties is Bi.

Elke uikomst van de set Bi(a-i) is een beste reactie van speler i naar a-i.

Hoe kan dit gebruikt worden om het Nash evenwicht te vinden?

  • Vind de beste response functie voor elke speler

  • Vind de actieprofielen die voldoen aan: a*i is in Bi (a*-i) voor elke speler i.

Voorbeeld:

 

L

C

R

T

1,2

2,1

1,0

M

2,1

0,1

0,0

B

0,1

0,0

1,2

Hoe moet je te werk gaan? Zet een sterretje bij alle mogelijke Bi. Dit houdt in dat er eerst gekeken wordt naar speler 1: Als deze T speelt, wat is voor speler twee dan de beste optie? In dit geval is dat L. Zet hier een sterretje. Vervolgens wordt er gekeken naar M, als speler 1 M speelt, wat is dan de beste optie op voor speler 2? In dit geval is dat L of C. Zet achter beiden een sterretje. Dit proces moet toegepast worden voor beide spelers. Bedenk dus ook wat speler 1 zou spelen als speler 2 L, C en R speelt. De hokjes waarin achter beide antwoorden een sterretje staat zijn een Nash evenwicht.

Dominerende en gedomineerde acties

Zoals het woord al zegt is een dominante actie superieur aan welke andere actie dan ook, ongeacht wat de andere spelers doen.

Ui (a’’i, a-i) > ui (a’i, a-i):

  1. a’’i is de strikt dominante actie

  2. a’i is de strikt gedomineerde actie

Dominante en gedomineerde acties in de voorbeelden:

Prisoner’s dilemma Verraden is de dominerende actie; dit zal altijd de beste keuze zijn

BoS Geen enkele keuze is strikt dominant

Een strikt gedomineerde actie is niet de beste response op een gegeven actie. Een strikt gedomineerde actie komt dus niet voor in een Nash-evenwicht. Als je dit voor lief aanneemt kan je dus ook het Nash-evenwicht vinden door alle gedomineerde acties door te strepen. In een prisoner’s dilemma kan je ‘zwijgen’ doorstrepen waardoor het evenwicht (verraden, verraden) ontstaat.

Let op, een dominante actie (a’’i) betekent dat deze actie (a’’i) een andere actie (a’i) domineert. Echter betekent het niet dat a’’i alle acties domineert. Hij kan zelf door bijvoorbeeld een andere actie (a’’’i) gedomineerd worden.

Zwak dominerende acties

Er ontstaat een zwak dominerende actie als deze actie (a’’i) tenminste zo goed is als een andere actie (a’i), ongeacht wat andere spelers doen.

Ui (a’’i, a-i) ≥ ui (a’i, a-i) en Ui (a’’i, a-i) > ui (a’i, a-i)

Voorbeeld:

 

L

R

T

1

0

M

2*

0

B

2*

1*

De bovenste tabel geeft de betaling weer van een enkele speler – dit omdat het gaat over de strategie ongeacht wat andere spelers doen, de betaling van andere spelers is irrelevant.

In dit geval:

  • M domineert zwak T – als speler 2 R kiest dan maakt het namelijk niet uit of speler 1 T of M heeft gekozen

  • B domineert zwak M – als speler 2 L kiest dan maakt het namelijk niet uit of speler 1 B of M heeft gekozen

  • B domineert strikt T – als speler 2 L kiest dan is speler 1 beter af met B dan met T, als speler 2 R kiest dan is speler 1 ook beter af met B dam met T.

Strikt Nash-evenwicht ⇒ Geen elke actie is zwak gedomineerd in het evenwicht. Men kan niet meer of gelijke winsten behalen door van het evenwicht af te wijken.

Zwak Nash evenwicht ⇒ De acties zijn wel gedomineerd in het evenwicht. Echter bestaat dit evenwicht toch.

Symmetrische spellen in een eenduidige populatie

Een spel wordt als symmetrisch gezien als voor alle spelers de uitkomsten gelijk zijn. De actieprofielen moeten gelijk zijn en de preferenties van beide spelers worden gerepresenteerd door de uitbetaling functies u1 en u2 waarvoor u1 (a1,a2) = u2 (a2,a1).

Dus schematisch weergegeven:

 

A

B

A

W,W

X,Y

B

Y,X

Z,Z

Symmetrisch Nash-evenwicht ⇒ A*i is voor beide spelers gelijk. Het betekent niet dat in elk symmetrisch spel zich een symmetrisch Nash evenwicht bevindt!

Voorbeeld:

 

A

B

C

A

1,1

2,1

4,1

B

1,2

5,5

3,6

C

1,4

6,3

0,0

In dit geval is er drie maal een Nash evenwicht, (A,A), (A,C) en (C,A). Echter is alleen (A,A) een symmetrisch Nash evenwicht. Voor beide spelers levert a* het meeste en gelijke op, dus u1 (a1,a2) = u2 (a2,a1).

Hoofdstuk 3 – Nash evenwicht: illustraties

Dit hoofdstuk draait voornamelijk om het Cournot en Bertrand evenwicht.

Oligopolie = Een situatie waarin een economisch product of dienst door slechts een beperkt aantal aanbieders wordt aangeboden.

Binnen een oligopolie kan er naar twee soorten modellen worden gekeken. Er wordt verondersteld dat er twee bedrijven zijn die een homogeen – dat wil zeggen ongeveer hetzelfde – product aanbieden. Er is sprake van een Cournot competitie (Cournot, 1838) wanneer deze bedrijven wedijveren door middel van (de grootte van) hun aanbod. Daarnaast is er sprake van een Bertrand competitie (Bertrand, 1883) wanneer deze bedrijven wedijveren door middel van prijzen.

Beide situaties worden weer gemodelleerd als een twee-persoonsspel. Een Nash-evenwicht heet in het geval van Cournot competitie ook wel Cournot evenwicht, en in het geval van Bertrand competitie Bertrand evenwicht.

Een verschil met de voorafgaande paragrafen is dat in deze situaties de spelers oneindig veel strategieën hebben: elke mogelijke hoeveelheid in het ene geval, en elke mogelijke prijs in het andere geval, zal een strategie zijn. In werkelijkheid is het aantal mogelijke hoeveelheden/prijzen eindig maar wel heel groot, zodat het eenvoudiger is uit te gaan van oneindig veel strategieën. Bijgevolg kunnen deze competities niet gerepresenteerd worden door middel van een simpele tabel zoals hierboven vaak is gedaan.

Het Cournot model van oligopolie – gaat uit van hoeveelheid

Een voorbeeld van een Cournot model: duopolie

Twee bedrijven, 1 en 2, produceren hetzelfde product.

Bedrijf 1: q1 ≥ 0

Bedrijf 2: q2 ≥ 0

Prijs bij verkoop totale hoeveelheid: p = a−q1 −q2

Hierbij is a een gegeven positief getal. Met andere woorden, er wordt een lineaire vraagfunctie verondersteld.

Voor het gemak wordt er tevens verondersteld dat voor elk bedrijf de vaste kosten 0 zijn en de variabele kosten gelijk aan c per eenheid product, waarbij 0 < c < a. Hierop kan gevarieerd worden bijvoorbeeld door te veronderstellen dat de twee bedrijven verschillende variabele kosten c1 en c2 per eenheid product hebben, maar de bijbehorende berekeningen laten we verder achterwege.

Wanneer bedrijf 1 een hoeveelheid q1 aanbiedt en bedrijf 2 een hoeveelheid q2, is de winst voor bedrijf 1 gelijk aan:

Winst:

Bedrijf 1: q*p - c = q1(a − q1 − q2) − cq1 als q1 + q2 ≤ a, en 0 anders

Bedrijf 2: q*p - c = q2(a − q1 − q2) − cq2 als q1 + q2 ≤ a, en 0 anders

Hiermee is in feite het spel gedefinieerd. Een Nash evenwicht in dit spel is, net als bij de voorgaande simpelere spellen, een vaste staat; geen elke speler zal afwijken. Dat betekent in dit geval een paar (q∗ 1, q∗ 2) zodanig dat, gegeven q∗ 2, de strategie q∗ 1 de winst van bedrijf 1 maximaliseert en, gegeven q∗ 1, de strategie q∗ 2 de winst van bedrijf 2 maximaliseert.

Hoe wordt een Cournot evenwicht berekend?

Allereerst wordt de beste reactie functie opgesteld. Daarvoor zijn de uitbetalingen van de bedrijven nodig. Veronderstel dus eerst dat speler 2 de hoeveelheid q2 ≥ 0 kiest. Het beste antwoord van speler 1 wordt gevonden door diens winstfunctie te maximaliseren:

  1. Winstfunctie bedrijf 1: q1(a − q1 − q2) − cq1 vereenvoudigen

  2. = q1(a − q1 − q2 − c)

  3. = q1a – q1^(2) – q1q2 – q1c

  4. afgeleide naar q1 bepalen

  5. = a − 2q1 − q2 – c

  6. afgeleide gelijk stellen aan 0

  7. q1 = (a – q2 − c) / 2

Merk echter eerst op dat als q2 > a − c, dan valt er voor bedrijf 1 geen positieve winst te behalen en is zodoende het beste antwoord van speler 1 gelijk aan 0.

Kortom:

als q2 ≤ a – c q1 = (a − q2 − c)/2

als q2 > a – c q1 = 0

De berekening van het beste antwoord van speler 2 op de (elke) hoeveelheid q ≥ 0 van speler 1 gaat precies hetzelfde:

als q1 ≤ a – c q2 = (a − q2 − c)/2

als q1 > a – c q2 = 0

Het Cournot evenwicht bestaat uit hoeveelheden die het beste antwoord op elkaar zijn, en is daarom gelijk aan het snijpunt van de reactiefuncties. De situatie is weergegeven het onderstaande figuur:

Uit het figuur blijkt dat het Cournot evenwicht verkregen wordt uit het snijpunt van de lijnen.

  1. Snijpunt van de lijnen berekenen

  2. q1 = (a − c − q2)/2 en q2 = (a − c − q1)/2.

  3. q1 = (a − c − q2)/2 = q2 = (a − c − q1)/2.

  4. Oplossen van de vergelijkingen

  5. q1*=q2*= 1/3 (a-c).

In het figuur zijn ook de curves getekend waarop de winsten van de spelers gelijk zijn aan de winst in het Cournot evenwicht. Het gekleurde gebied bevat de combinaties van strategieën waarbij de winsten voor beide bedrijven minstens gelijk. Merk op dat elk bedrijf hierbij de helft van de monopolie hoeveelheid (a − c)/2 aanbiedt, en dat daarmee de totale gezamenlijke winst gemaximaliseerd wordt.

Conclusie:

Elk spel heeft zijn eigen unieke Nash evenwicht: (q*1,q*2) = ((a – c)/3, (a – c)/3)

In dit evenwicht is de winst van elk bedrijf: (a – c)^(2) / 9

(dit ligt logischer wijs tussen de monopolie output ((a – c)/2) en de volledige competitie output (a – c))

Samenwerken

De twee bedrijven kunnen echter ook een samenwerking aangaan. Nu ontstaat er geen Nash-evenwicht, aangezien het evenwicht niet meer door concurrentie wordt bepaald, maar door de hoeveelheid afspraken. De winst zal in deze samenwerking hoger zijn. Er zijn namelijk meer dan twee bedrijven in een Cournot spel.

Als er meer dan twee bedrijven meedoen aan het spel zal de prijs lager worden.

Het Bertrand model van oligopolie – gaat uit van de prijs

Een voorbeeld van een Betrand model: duopolie

Twee bedrijven, 1 en 2, produceren hetzelfde product. De totale marktvraag is afhankelijk van de prijs.

q = a − p

Voor het gemak wordt ook hier verondersteld dat voor elk bedrijf de vaste kosten 0 zijn en de constante variabele kosten gelijk aan c per eenheid product, waarbij 0 < c < a. Verder wordt aangenomen dat het bedrijf dat de laagste prijs vraagt en de hele markt bedient. Het product is tenslotte homogeen waardoor de consument geen enkele motivatie heeft om hetzelfde product bij de duurdere producent te kopen. Bij gelijke prijzen bedient elk bedrijf de helft van de markt.

Wanneer bedrijf 1 een prijs p1 vraagt en bedrijf 2 een prijs p2, is de winst voor bedrijf 1 gelijk aan

Winst:

Bedrijf 1: q*p1 - c = (p1-c)*q = (p1-c)(a-p1) als p1 < p2

(p1-c)(a-p1)/2 als p1 = p2

  1. als p1 > p2

Bedrijf 2: q*p2 – c = (p2-c)q= (p2-c)(a-p2) als p2 < p1

(p2-c)(a-p2) als p1 = p2

  1. als p2 > p1

Een Nash-evenwicht is nu een paar prijzen p1*p2* zodanig dat p1* het beste antwoord is op p2* en omgekeerd. Dit specifieke evenwicht heet een Bertrand evenwicht. Hoe wordt dit evenwicht berekend?

Het berekenen van het evenwicht is makkelijker dan bij een Cournot evenwicht. Allereerst wordt er uitgegaan van een evenwicht van p1* = p2*. Deze zijn minstens gelijk aan c, anders hebben de spelers negatieve winsten. De prijzen kunnen ook nog hoger zijn dan c, aangezien een speler zijn winsten dan aanzienlijk kan verhogen als hij zijn prijs wat verlaagt. Bij deze extreme vorm van prijscompetitie worden de prijzen dus omlaag gedreven tot ze gelijk zijn aan de marginale kosten. Bedrijven maken een winst van 0.

Kortom: p1* = p2* = c

Er kan worden geconcludeerd dat de prijzen in een Bertrand evenwicht lager liggen dan in een Cournot evenwicht. Als het aantal bedrijven binnen de markt van een Cournot evenwicht groter wordt dan daalt de prijs langzaam naar c – hetzelfde als in het Bertrand evenwicht. Als het aantal bedrijven binnen de markt van een Bertrand evenwicht groter wordt dan blijft de prijs nog steeds gelijk aan c.

Electorale competitie – ‘Hotelling’s model of electoral competition’

Een strategisch spel met betrekking tot politieke partijen wordt als volgt gespeeld:

  • De politieke kandidaten hebben een nummer, positie genoemd (vaak op een as van links naar rechts)

  • De kiezers kiezen hun favoriete positie op de as

  • De kandidaat met de meeste stemmen wint

  • Elke kandidaat wil alleen maar winnen, gelijke gedeelde eerste plek heeft dus minder voorkeur dan eerste worden

  • De verdeling van de kiezers hun favoriete positie is arbitrair over de complete as

  • De verdeling is niet uniform – veel stemmers kunnen bijvoorbeeld in het midden zitten – belangrijk hierin is de mediaan (m), het middelste getal in een geordende verdeling

  • De kiezers hebben een gebied waarin zij stemmen. Dit gebied bestaat uit een bepaalde plek op de as (x*) met een plus en minus range waarin de kiezer de posities ook prima vind (x*-k en x*+k)

Kortom: elke kandidaat trekt de stemmen van mensen die dichter bij hen liggen dan bij een andere kandidaat op de as.

In het geval van het plaatje hierboven wint kandidaat 1.

In dit geval kan het Nash-evenwicht gevonden worden door de best response functies te bestuderen:

  1. Stel je voor dat xj < m. Wat is dan het beste voor xi om te doen?

Zolang xi een positie kiest die ligt tussen xj en 2m – xj, wint xj de verkiezing

  1. Stel je voor dat xj > m. Wat is dan het beste voor xi om te doen?

Deze vraag is symetrisch aan vraag 1. De beste keus voor xi is om tussen xj en 2m – xj in te zitten

  1. Stel je voor dat xj = m. Wat is dan het beste voor xi om te doen?

Het enige dat xi dan kan doen is ook op m te gaan zitten. Ze zullen dan gedeelde eerste plek eindigen.

Wat is dan het Nash-evenwicht?

Dit is waar allebei de kandidaten op de positie m gaan zitten. Bij elke andere positie is er een betere positie denkbaar, waardoor er pas een Nash evenwicht ontstaat op de mediaan.

Kortom, een verkiezing waarbij partijen alleen gedreven worden door het behalen van de meeste stemmen (en niet door ideologie) zorgt ervoor dat alle partijen dezelfde positie zullen innemen.

De oorlog van het afslijten

Situatie: Twee mensen geven van te voren een bepaalde tijd (t) op om een bepaalde prijs te ontvangen. Degene die het langste wacht – oftewel het meeste tijd opgeeft van te voren – zal de prijs in ontvangst nemen.

v = waarde die men toebedeelt aan de prijs

t = is de tijd die men geeft om te wachten op de prijs

De uitbetalingsfunctie zal er als volgt uitzien:

Ui (t1,t2) = - ti als ti < tj

½(vi – ti) als ti = tj

vi – tj als ti > tj

Hoe wordt hier het Nash-evenwicht gevonden? Weer door de uitbetalingsfuncties te maken voor de spelers.

Eerst wordt er gekeken naar speler i. Zijn waarde voor de prijs bedraagt v1 wat gelijk staat aan het maximale aantal tijd dat hij ervoor wil wachten, t1.

1. Eerste situatie is een korte wachttijd van speler j.

tj < vi

Kortom: Elke tijd die langer is dan tj is voor speler i de beste reactie.

2. Een situatie waarin de wachttijd van speler j gelijk is aan die van speler i.

tj = ti

Kortom: de tijd op 0 zetten of de tijd op elke tijd achter tj zetten is de beste response voor speler i.

  1. Een situatie waarin de wachttijd van speler j erg lang is.

tj > ti

Kortom: de tijd op 0 zetten is de beste response van speler i.

Het Nash evenwicht zal zich positioneren waar:

Ti = 0 en tj ≥ vi

Of

Tj = 0 en ti ≥ vj

Dat betekent dat of speler i meteen opgeeft met wachten – dus zijn tijd op 0 stelt en dat speler j wacht tot tenminste vi of dat speler j meteen opgeeft met wachten – dus zijn tijd op 0 stelt en dat speler i wacht tot tenminste vj.

Dit impliceert dat:

  • Er in het evenwicht dus geen wachttijd plaatsvindt; de ene speler geeft meteen op waardoor de andere speler de prijs in de wacht sleept

  • Er is een evenwicht waarin beide spelers meteen opgeven

  • Elk evenwicht is asymmetrisch

Biedingen/veilingen

Speltheorie kan helpen te begrijpen hoe de verschillende soorten manieren van veilen plaatsvinden. Er wordt aangenomen dat elke bieder weet wat voor waarde hij hecht aan het product en hoeveel waarde andere bieders hechten aan het product – oftewel er is perfecte informatie.

Er worden verschillende vormen van veilingen behandeld:

Tweede-bod gesloten-bieding veilingen

Situatie: iedereen heeft de mogelijkheid om elkaar te overbieden tot dat niemand meer wil bieden. De laatste bieder ontvangt het product.

Dit impliceert:

  • Degene die vooraf het meeste waarde aan het product hecht wint

  • Degene die de meeste waarde aan het product hecht en degene die als tweede het meeste waarde aan het product hecht blijven over en zullen tegen elkaar opbieden

  • De prijswinnaar zal een prijs betalen die gelijk is aan de tweede hoogste bieding (gegeven dat hij net even iets meer moet bieden en dit verwaarloosbaar is).

Kortom: degene met de vooraf bepaalde hoogste waarde voor de prijs wint. De prijs die hij betaald is gelijk aan de hoogste waarde van de twee na hoogste bieder

Het spel:

Spelers: n bieders waar n ≥ 2

Acties: alle biedingen boven 0

Preferenties: bi is het bod van speler i. Als dit groter is dan het hoogste bod (p) van een andere speler dan zal de uitbetaling vi – p bedragen. Als dit niet groter is dan het hoogste bod (p) van een andere spelers dan zal dit 0 bedragen.

Maar wat is het Nash-evenwicht?

Er zijn meerdere Nash-evenwichten te vinden:

  1. Speler 1 ontvangt de prijs voor v2 (tweede hoogste bieding) en de uitbetaling is v1 – v2.

Waarom?

  • Als speler 1 z’n bod omhoog gooit dan wint hij alsnog en moet hij hetzelfde bedrag (v2) betalen.

  • Als speler 1 z’n bod onder die van speler 2 plaats dan verliest hij en is zijn uitbetaling 0.

  • Als speler 2 z’n bod uiteindelijk boven die van speler 1 plaatst, dan wint speler 2 maar heeft hij meer betaald voor de prijs dan dat het hem waard is; hij verliest dus (vi – v1 < 0).

  1. Speler 1 ontvangt de prijs voor 0 en de uitbetaling is v1

Waarom?

  • Als speler 1 zijn bieding veranderd heeft dit geef effect op de uikomst

  • Als speler 2 zijn bieding verhoogt dan betaald hij meer dan hij de prijs waard vindt

  1. Speler 2 ontvangt de prijs voor v2; alle uitbetalingen zijn 0.

Waarom?

  • Als speler 1 zijn bieding verhoogt zodat b1 ≥ v1 dan ontvangt hij inderdaad de prijs maar heeft een uitbetaling van 0

  • Als speler 2 zijn bieding verlaagt naar ≤ v2 dan verliest hij en is zijn uitbetaling 0

  • Als enkele andere speler zijn bieding verhoogt naar ≥ v1, dan wint hij de prijs maar betaald er meer voor dan hij er aanvankelijk voor over had.

In een tweede-bod gesloten-bieding veiling is een bieding (bi) die gelijk staat aan de waarde die de persoon over heeft voor de prijs (vi) altijd een zwak dominerende actie (bi = vi = zwak dominerend). Speler i kan nooit een betere actie vinden dan vi bieden, ongeacht wat andere bieders doen.

Kortom; het evenwicht (b1, … , bn) = (v1, … , vn) – evenwicht nummer 1 – is het enige evenwicht waar alle spelers hun acties dominant zijn aan de andere acties die ze kunnen spelen.

Eerste-bod gesloten-bieding veilingen

Situatie: vaak wordt dit spel gespeeld door een veilingmeester die begint bij een hoge prijs te noemen en dit langzaam verlaagt totdat iemand bereidt is om het te kopen.

Dit verschilt alleen in het feit dat de winnaar niet v2 betaald voor de prijs maar daadwerkelijk de waarde die hij ervoor wilt geven, dus v1.

Het spel:

Spelers: n bieders waar n ≥ 2

Acties: alle biedingen boven 0

Preferenties: bi is het bod van speler i. Als dit groter is dan het hoogste bod (p) van een andere speler dan zal de uitbetaling vi – bi bedragen. Als dit niet groter is dan het hoogste bod (p) van een andere spelers dan zal dit 0 bedragen.

Maar wat is het Nash-evenwicht?

In alle evenwichten wordt de prijs verworven door degene die de prijs het hoogst waardeert (in ons voorbeeld speler 1)

Waarom?

Stel je voor dat speler 3 meer bied dan speler 1 (b2 > b1), dan wint speler 3 de prijs. Echter er is dan geen evenwicht en speler 3 kan een betere, efficiëntere beslissing maken.

  • Als b3 > v2 (de prijs van de bieding) dan is speler 2 uitbetaling negatief. Hij zou zijn bieding moeten verlagen en wint de prijs dan niet meer.

  • Als b3 ≤ v2 (de prijs van de bieding) dan kan speler 1 (degene die oorspronkelijk de hoogste waarde hechtte aan de prijs) zijn uitbetaling (v1 – b1) verhogen door b1 te bieden (b1 ≥ b3).

Kortom: speler 1 – degene die vooraf de hoogste waarde hechtte aan het product – zal altijd de winnaar van de veiling zijn.

Ook in deze vorm wordt de actie b1 > v1 zwak gedomineerd door de actie b1 = v1. Echter wordt in een eerste-bod gesloten-bieding veiling een bieding b1 < v1 niet zwak gedomineerd door b1 = v1. Waarom? Als speler i een bieding (bi) doet die onder de waarde ligt die speler i aan de prijs hecht (vi) en gegeven dat alle andere spelers lager biedingen dan het bod van speler i (bi), dan betaald hij dus minder voor de prijs dan hij het aanvankelijk waard vond. Hij maakt dus meer winst dan dat hij bi = vi had geboden.

Dit impliceert dat in elke Nash evenwicht van een eerste-bod gesloten-bieding veiling er tenminste 1 speler is waarvan de actie zwak gedomineerd wordt.

Opbrengst equivalent ⇒ In elke vorm van beide veilingen (eerste-bod en tweede-bod) wordt uiteindelijk de prijs weggegeven aan speler 1 (die vooraf het meeste waarde eraan hechtte) tegen de prijs v2.

Hoofdstuk 4 – Gemixt strategisch evenwicht

Introductie

In dit hoofdstuk wordt er rekening gehouden met kansen - kansberekening: er kan ook een vaste staat ontstaan die stochastisch is. Dit wordt een gemixt strategisch Nash-evenwicht genoemd.

Voorbeeld ‘matching pennies’

De spelers kiezen tegelijkertijd kop of munt.

 

Munt

Kop

Munt

1,-1

-1,1

Kop

-1,1

1,-1

Dit spel heeft geen Nash-evenwicht. Echter heeft het spel wel een stochastische vaste staat waar elke speler zijn actie met een kans van ½ kiest. Geen enkele speler kan een betere actie kiezen.

vNM (von Neumann and Morgenstern) voorkeuren⇒ Verwachte waarde van een uitbetalingsfunctie over deterministische (met zekerheid) uitkomsten.

Bernoulli uitbetalingsfunctie ⇒ Een uitbetalingsfunctie van de deterministische uitkomsten met verwachtte waarden die representatief zijn voor de preferenties.

Strategische spellen waar spelers willekeurig kiezen

Een strategisch spel (met vNM preferenties) bestaat uit:

  • Spelers

  • Voor elke speler een aantal mogelijke acties

  • Voor elke speler een voorkeur voor actie(s) die worden gerepresenteerd door de verwachte waarde van een (bernoulli) uitbetalingsfunctie.

Maar wat is er nu precies verschillend aan een normaal strategisch spel (zoals hiervoor altijd gespeeld) en een strategische spel met vNM preferenties?

Het grote verschil zit hem in de loterij (of kansspel).

Tabel 1

Q

F

Q

2,2

0,3

F

3,0

1,1

 

Tabel 2

Q

F

Q

3,3

0,4

F

4,0

1,1

Bij deze twee bovenste tabellen zal bij het normaal strategische spel bij beide spellen een Nash-evenwicht van (F,F) uitkomen. Echter, als er waarde wordt gehecht aan de preferenties – of voorkeuren – van personen dan verandert het spel.

In tabel 1 is de verwachte opbrengst van (Q,Q) gelijk aan die van ½ (F,Q) en een ½ (F,F).

Zie berekening: ( ½ * 3 ) + ( ½ * 1 ) = 2 = u1 (Q,Q)

In tabel 2 is de verwachte opbrengst van (Q,Q) echter groter dan die van ½ (F,Q) en een ½ (F,F).

Zie berekening: ( ½ * 4) + ( ½ * 1) = 2.5 < u1 (Q,Q)

Gemixt strategisch Nash evenwicht

Elke speler mag een kansverdeling geven van keuzes van acties in plaats van zich vast te pinnen op een actie.

Een Nash evenwicht in een gemixte strategie (met vNM preferenties) houdt dus in dat:

Ui (a*) ≥ Ui(ai,a*-i) voor elke gemixte strategie ai van speler i.

Pure strategie: Als een speler een kans kiest van 1. Dit leidt dan weer tot een deterministische keuze – men gaat altijd voor de specifieke keuze waarbij de kans 1 is – zoals in voorgaande voorbeelden.

Maar hoe vind je dit Nash-evenwicht? Weer door de uitbetalingsfunctie te bepalen.

a* = Gemixte strategie Nash-evenwicht. Dit komt alleen voor als a*i voorkomt in Bi (a*- i) voor elke speler i.

  • Speler 1 heeft een gemixte strategie genaamd a1

  • Deze strategie (a1) houdt in dat er a1(T) kans naar actie T gaat en a1(B) kans naar actie B gaat

  • Deze kansen moet gecumuleerd 1 bedragen (a1(T) + a1(B) = 1)

  • Kortom: P = a1(T) en 1-p = a1(B)

Als we dit voor beide spelers in een tabel zetten krijgen we het volgende kansspel:

 

L

R (1-q)

T

pq

p(1-q)

B(1-p)

(1-p)q

(1-p)(1-q)

Wat is dan de verwachte uitbetaling van bijvoorbeeld speler 1?

pq * u1(T,L) + p(1-q) * u1(T,R) + (1-p)q * u1(B,L) + (1-p)(1-q) * u1(B,R)

Dit kan je herschrijven (naar p toe):

p [q * u1(T,L) + (1-q) * u1(T,R)] + (1-p) [q * u1(B,L) + (1-q) * u1(B,R)]

Nu staat er eigenlijk:

p [speler 1’s uitbetaling als hij een pure strategie (kans T = 1) speelt en speler twee een gemixte strategie speelt] + (1-p) [speler 1’s uitbetaling als hij pure strategie (kans B = 1) speelt en speler twee een gemixte strategie speelt]

Herschreven als deze pure strategieën E1 worden genoemd:

pE1 (T, a2) + (1-p)E1 (B, a2)

Dus speler 1’s uitbetaling bij een gemixte strategie (a1, a2) is het gewogen gemiddelde van de verwachte uitbetaling van T en B – gegeven dat speler 2 een gemixte strategie speelt.

Een gemixte strategie (in het geval van E1(T, a2) = E1(B,a2)) heeft nooit een uniek beste response; het is of geen best response of alle gemixte strategieën zijn een beste response.

Voorbeeld BoS

 

B

S

B

2,1

0,0

S

0,0

1,2

Wat is het gemixt strategisch evenwicht in dit spel?

Eerst speler 1 uitbetalingsfunctie opstellen:

  • Uitbetaling voor B (gegeven dat men kans q toeschrijft aan B): (2*q) + (0*(1-q)) = 2Q

  • Uitbetaling voor Q (gegeven dat men de kans 1-q toeschrijft aan S): (0*q) + (1*(1-q)) = 1 – q

Dus als:

2q > 1-q = bij q > 1/3 is de unieke best response B

q < 1/3 is de unieke best response S.

q = 1/3 is de best response zowel B als S

Kortom, speler 1’s beste response functie is:

De beste response functies van zowel speler 1 en als 2 staan in de volgende grafiek:

Er zijn in de grafiek drie evenwichten te vinden. (0,0) en (1,1) zijn beide pure Nash-evenwichten die in de voorgaande spellen ook te vinden zouden zijn – spelers spelen een unieke pure strategie en mogen nog niet improviseren met kansen. Evenwicht (2/3, 1/3) is nieuw; elke speler heeft hier B of S gekozen met een bepaalde kans – dit is dus geen pure strategie.

Een bruikbare generalisatie van een gemixt strategisch Nash evenwicht

Voor een twee-speler, twee acties spel kan men concluderen dat een speler zijn verwachte uitbetaling in een gemixte strategie het gewogen gemiddelde van de kansen is die men toebedeelt aan de verwachte uitbetaling in de pure strategie – oftewel, met alleen de uitkomsten van de pure strategieën (een speler bedeelt kans 1 to aan X) kan men bepalen of er een evenwicht is in een gemixte strategie.

Echter moeten deze gemixte strategieën wel aan twee voorwaarden voldoen:

  1. De verwachte uitbetalingen van elke actie waar de speler een positieve kans aan heeft toebedeeld (dus niet de kans van 0) moeten hetzelfde zijn.

  2. De verwachte uitbetaling van elke actie waaraan de speler een 0 kans heeft toebedeeld moet niet groter zijn dan de verwachte uitbetaling van elke actie waaraan de speler een positieve kans aan heeft toebedeeld.

Voorbeeld:

 

L (0)

C (1/3)

R (2/3)

T (3/4)

-,0

3,3

1,1

M (0)

-,-

0,-

2,-

B (1/4)

-,4

5,1

0,7

(de streepjes zijn irrelevante getallen)

Zijn de strategieën van speler 1 (3/4, 0, ¼) en speler 2 (0, 1/3, 2/3) gemixt strategische Nash-evenwichten?

Dit moet volgens de generalisatie onderzocht worden door naar de 3 pure strategieën van speler 1 te kijken:

  1. T: (1/3 * 3) + (2/3 * 1) = 5/3 = 1,6667

  2. M: (2/3 * 2) = 4/3 = 1,3333

  3. B: (1/3 * 5) = 5/3 = 1,6667

En naar de pure strategieën van speler 2:

  1. L: (3/4 * 2) + (1/4 * 4) = 2,5

  2. C: (3/4 * 3) + (1/4 * 5) = 2,5

  3. R: (3/4 * 1) + (1/4 * 7) = 2,5

Bij beide spelers wordt er aan de beide voorwaarden van de generalisatie voldaan, er is dus sprake van een gemist strategisch Nash-evenwicht.

Bestaan van een evenwicht in eindige spellen

In elk spel waarin een spelen eindig veel acties heeft zit op z’n minst een gemixt strategisch Nash evenwicht.

Wat impliceert dit?

  • Dat men opzoek moet gaan naar dit evenwicht

  • Dat er best spellen kunnen zijn die oneindig veel acties hebben, maar ook een gemixt strategisch evenwicht

Gedomineerde acties

Definitie: een actie strikt domineert een andere actie als het superieur is, ongeacht wat andere spelers doen.

Dit geldt ook voor spellen met vNM preferenties zoals hierboven uitgelegd. Een gemixte strategie kan dominant zijn over een pure strategie.

Voorbeeld:

In de volgende tabel staat alleen de uitbetaling voor speler 1, de rest is irrelevant.

 

L

R

T

1

1

M

4

0

B

0

3

De actie T is niet strikt gedomineerd door actie M of B, maar is strikt gedomineerd door een gemixte strategie: een kans van een ½ naar M en een kans van ½ naar B. Waarom?

De uitbetaling van de gemixte strategie ½ M en ½ B:

  • Als speler 2 L kiest dan zorgt dit voor een uitbetaling van 2 voor speler 1 (½*4 + ½*0 = 2)

  • Als speler 2 R kiest dan zorgt dit voor een uitbetaling van 1,5 voor speler 1 (½*0 + ½*3 = 1,5)

De uitbetaling van de pure strategie T:

  • Als speler 2 L kiest dan zorgt dit voor een uitbetaling van 1 voor speler 1

  • Als speler 2 R kiest dan zorgt dit voor een uitbetaling van 1 voor speler 1

Hieruit kan men concluderen dat de gemixte strategie de pure strategie T domineert.

Een strikt gedomineerde actie is nooit de beste response op een gemixte strategie van andere spelers – oftewel, opzoek naar het evenwicht kan je dat doen door alle strikt gedomineerde acties te elimineren

Dominante acties

Als de uitbetaling van een actie 1 tenminste zo hoog is als een uitbetaling van een andere actie 2 dan is actie 1 een zwak dominante actie.

Een zwak dominante actie kan voorkomen in een gemixt strategisch evenwicht, je kan deze dus niet elimineren.

Pure evenwichten als men kansen mag toebedelen

Een puur strategisch evenwicht blijft als men overstapt van een kans toebedelen spel naar een spel waar dit niet mag – oftewel, het evenwicht zal niet wijzigen.

Evenwicht in een enkele populatie

Definitie: een twee-spelers spel is symmetrisch als elke speler de zelfde set van acties tot zijn beschikking heeft. Elke speler-evaluatie van een uitkomst heeft dus betrekking op zijn actie en op de actie van de tegenstander, niet op het feit of het speler 1 of speler 2 is.

Dit geldt ook voor een strategisch spel met vNM preferenties.

Elke symmetrisch strategisch spel met vNM preferenties waarin een speler zijn acties eindig zijn heeft een symmetrisch gemixt strategisch Nash-evenwicht.

De formatie van de spelers’ overtuiging

Tot dusver is er altijd vanuit gegaan dat de spelers op de hoogte waren van elkaars strategieën. Dit vanuit de redenering dat de deelnemers dat geleerd hebben door ervaringen uit eerdere spellen die ze met elkaar gespeeld hebben. Maar hoe zit het met nieuwe spelers?

Het hoeft niet altijd een probleem te zijn met nieuwe spelers. Soms zijn er genoeg gedomineerde acties die geëlimineerd kunnen worden.

Voorbeeld:

 

L

R

T

0,2

0,0

M

2,1

1,2

B

1,1

2,2

Het redeneringproces is als volgt:

  • Speler 1 actie T is strikt gedomineerd door M en B; hij zal dit dus niet spelen

  • Dit ziet speler 2. Hij zal dus niet voor L kiezen, wetende dat speler 1 nooit voor T zal kiezen

  • Speler 1 ziet dat speler 2 nooit voor L zal kiezen. Logischerwijs zal speler 2 dus voor R gaan

  • Wetende dat speler 2 actie R kiest zal speler 1 actie B kiezen, aangezien dit meer oplevert (2) dan actie M (1)

Het evenwicht (B,R) is dus een Nash evenwicht; geen enkele speler heeft een motivatie om af te wijken. Een vaste staat is, ondanks het feit dat de spelers elkaar nog niet kenden, bereikt.

Ook kunnen spelers leren van elkaar door bijvoorbeeld observatie. Twee theorieën waar spelers van elkaar leren worden in het boek behandeld:

  1. Beste response dynamiek: Er wordt vanuit gegaan dat elke speler de actie kiest die hij in de vorige periode (het vorige spel) ook al heeft gekozen. In het eerste spel wat wordt gespeeld volgt de speler zijn intuïtie. Daarna zal de speler uitgaan van het feit dat de tegenspeler dezelfde actie kiest als bij het vorige spel en zal daarnaar handelen. Echter een anekdote hierbij is dat dit ‘evenwicht’ vaak niet opgaat. Het Bos spel zal bijvoorbeeld niet naar een evenwicht toe groeien.

  1. Onwaar spel: De speler leert van de andere speler zijn acties en zal dit gewogen meenemen in zijn volgende keuze. Dat betekent dat als twee spelers 6 keer een spel hebben gespeeld en speler 2 actie A twee, actie B drie keer en actie C een keer heeft gekozen, dat speler 1 in het 7e spel de kans 1/3 toerekent dat speler 2 A kiest, de kans ½ toerekent dat speler 2 B kiest en de kans 1/6 toerekent dat speler 2 C kiest.

Hoofdstuk 5 – Extensieve spellen met perfecte informatie: theorie

Strategisch spel ⇒ gaat ervan uit dat elke speler zijn strategie voor altijd kiest; dus zich niet tussentijds aanpast aan de tegenstander. Dit komt doordat de spelers tegelijkertijd hun actie kiezen.

Extensief spel ⇒ gaat ervan uit dat elke speler zijn strategie aanpast aan de gebeurtenissen en zetten van de andere speler(s). Dit komt doordat spelers na elkaar hun actie kiezen.

In dit hoofdstuk wordt een spel bestudeerd waarin elke speler compleet op de hoogte is van alle voorgaande acties van de tegenspeler.

Extensieve spellen met perfecte informatie

Een extensief spel heeft 4 componenten:

  • ‘terminale geschiedenis’: elke volgorde van gedane acties

  • spelers functie: hoe de speler zich in de terminale geschiedenis heeft bewogen – de geschiedenis van de speler zijn acties (P)

  • Spelers

  • Preferenties van de spelers

Voorbeeld:

Een bedrijf i in een markt heeft een bedreiging van een mogelijke concurrent (bedrijf j) die ook dezelfde markt wil betreden. Deze concurrent kan de markt betreden (in) of de markt niet betreden (uit). Bedrijf i kan reageren op de entree van bedrijf j door deze aan te vechten of zich over te geven.

De componenten van het spel:

  • ‘terminale geschiedenis’: (In, overgeven), (in, aanvechten) en uit.

  • spelers functie: P (Ø) = Bedrijf j en P (In) = bedrijf i

  • Spelers: Bedrijf i en bedrijf j

  • Preferenties van de spelers: (zie uitbetalingen hieronder)

De uitbetalingen zijn als volgt:

  • Bedrijf j: 1, bedrijf i: 2 ⇒ gegeven dat bedrijf j de markt niet betreedt

  • Bedrijf j: 2, bedrijf i: 1 ⇒ gegeven dat bedrijf j de markt betreedt en bedrijf i zich overgeeft

  • Bedrijf j: 0, bedrijf i: 0 ⇒ gegeven dat bedrijf j de markt betreedt en bedrijf i dit aanvecht

‘Sub histories’⇒ gedeelten van voorgaande acties die zijn gemaakt om tot de huidige staat te komen. In het voorbeeld zijn de sub histories om tot de staat (in, overgeven) te komen als volgt: lege geschiedenis (Ø geeft de start van het spel aan), de actie (in) en de actie (in, overgeven).

Proper sub histories ⇒ een sub historie die niet gelijk staat aan de totale serie van acties. In het voorbeeld zijn de proper sub histories de lege geschiedenis en de actie (in).

A (h) = {a: (h,a) is een geschiedenis} - het aantal van beschikbare acties na geschiedenis h.

Dit houdt in dat a een van de acties is die beschikbaar is nadat de tegenstander actie h heeft gekozen. Bij het voorbeeld hierboven zijn de geschiedenissen:

  • Lege geschiedenis Ø

  • In

  • Uit

  • (In, aanvechten )

  • (in, overgeven)

De set van acties die beschikbaar zijn voor de speler die als eerst mag kiezen (in dit geval bedrijf j) is: A (Ø) = {In, uit}

De set van acties die beschikbaar zijn voor de speler die daarna mag kiezen (in dit geval bedrijf i) is: A (in) = {overgeven, aanvechten}

Strategie en uitkomsten

Een strategie is een beschrijving van het verloop van het spel (P(h) = i) – of van het ‘plan van actie’. Er wordt zelfs een strategie geschreven voor een verloop van het spel wat gegeven de geschiedenis onmogelijk is – zie het boomdiagram voor een verdere verklaring hiervan.

Hieronder is een boomdiagram getekend waarin de mogelijke acties voor bedrijf i en j zijn uitgeschreven in A, B, C, D, E en F:

Mogelijke strategieën voor speler 1 (bedrijf j)

  • AE, AF, BE, BF

Mogelijke strategieën voor speler 2 (bedrijf i)

  • C, D

Merk hierbij op de BE en BF eigenlijk niet kunnen voorkomen gegeven de geschiedenis dat speler i (bedrijf j) eerst (uit) kiest. Echter moeten deze wel worden meegenomen. Dit wordt vaak gedaan onder het mom van, ‘ik wilde actie B kiezen, maar koos per ongeluk actie A waardoor ik nu actie E kies’.

Oplossing:

Nu we alle informatie op een rijtje hebben gezet en de essentie van het spel hebben uitgetekend in een boomdiagram moeten we tot een oplossing komen.

Gegeven het feit dat bedrijf i nooit het gevecht aan zal gaan met bedrijf j als deze toetreedt tot de markt – dit brengt tenslotte een uitbetaling van 0 met zich mee terwijl opgeven een uitbetaling van 1 met zich meebrengt - is een reden voor j om toe te treden. De manier waarop we dit benaderen heet ‘backward induction’ (achterwaartse inductie). Er wordt ‘achteraf’ bepaald met behulp van een boomdiagram wat de beste strategie is.

Echter heeft deze manier drie nadelen:

  • Bij sommige spellen kan er geen antwoord worden gevonden omdat er irrelevante keuzes tussen zitten: bijvoorbeeld als (in, aanvechten een waarde had opgeleverd van 1 voor bedrijf i, dan was bedrijf i onverschillig geweest tussen aanvechten of opgeven.

  • Als er een oneindig spel plaatsvindt dan is er geen punt waar men kan starten en kan achterwaartse inductie niet worden toegepast

  • Als spelers tegelijkertijd een keuze maken kan er geen achterwaartse inductie worden toegepast omdat keuzes niet zo zeer een directe reactie zijn.

Een andere mogelijkheid is het Nash-evenwicht, oftewel de vaste staat van het spel vinden.

Nash-evenwicht

Een Nash-evenwicht is een strategie profiel s* waarbij geen enkele speler wil afwijken, gegeven de tegenspeler zijn strategie.

Definitie van een Nash-evenwicht met perfecte informatie:

ui (O(s*)) ≥ (O (ri, s*-i))

Waarbij O(s*) = terminale geschiedenis

s* = strategie profiel

ri = strategie van speler i

Een manier om dit evenwicht te vinden is om een extensief spel als een strategisch spel te modelleren – dit wordt een ‘strategic form’ genoemd.

Voorbeeld:

Er wordt doorgewerkt met het spel wat in de vorige paragraaf ook is gespeeld, maar nu in tabel vorm:

 

Overgeven

Aanvechten

In

2,1

0,0

Uit

1,2

1,2

De twee Nash-evenwichten zijn:

(In, overgeven) en (uit, aanvechten)

Het eerste evenwicht is het patroon wat ook gevonden werd door achterwaartse inductie. Het is duidelijk dat het evenwicht (aanvechten) een nutteloze dreiging is. Het is geen vaste staat aangezien in de tabel de reeks acties niet goed weergeeft. Bedrijf j zal de bedreiging van bedrijf i om te vechten nooit serieus nemen omdat bedrijf i geen motivatie heeft om meer te vechten zodra bedrijf j toetreedt. Een anomalie dus.

Sub-spel perfect evenwicht (SPE)

Wat is een sub-spel? Eigenlijk zoals je zou verwachten is dat een gedeelte van het spel. Als je een boom diagram tekent is een ‘tak’ hiervan een proper sub-spel. Als je naar de boomdiagram uit het vorige voorbeeld kijkt zijn er twee proper sub-spellen te vinden + uiteraard het hele spel:

en

Een sub-spel perfect evenwicht (SPE) is een strategie profiel s* met de wetenschap dat in geen enkel ander sub-spel speler i een betere keuze kan maken dan strategie s*i, gegeven dat de tegenspeler zich houdt aan s*j.

Maar wat betekent dit nu precies? In het voorbeeld wat hierboven steeds wordt aangehaald is de actie (uit, aanvechten) geen sub-spel perfect evenwicht (SPE). Dit komt omdat zodra bedrijf j kiest voor (in), (aanvechten) geen optimale keuze meer is voor bedrijf i. Dan is bedrijf i beter af door (overgeven) te kiezen.

Het evenwicht (in, overgeven) is wel een sub-spel perfect evenwicht (SPE). Geen enkele speler kan een betere keuze maken. Een Sub-spel evenwicht (SPE) is dus een klein evenwicht wat zich bevind in dat specifieke sub spel.

Dit leidt tot de volgende vergelijking:

ui (Oh (s*)) ≥ ui (Oh (ri, s*-i))

Waarbij h = geschiedenis

O(s*) = terminale geschiedenis

s* = strategie profiel

ri = strategie van speler i

Kortom een SPE wordt hierboven gevonden door op zoek te gaan naar het Nash-evenwicht en daarna te bekijken of dit evenwicht voldoet aan de SPE criteria. Je doet kan dit doen door Achterwaartse inductie of door gewoon de sub-spellen van achter naar voren apart te bekijken.

Let hierbij op een aantal punten:

  • De strategie (s*) optimaal moet zijn voor elke geschiedenis h.

  • Elk SPE is een Nash-evenwicht

  • Niet alle Nash-evenwichten zijn SPE

  • Een oneindig spel kan geen SPE hebben

  • Een eindig spel met perfecte informatie heeft altijd een SPE

  • Een SPE is niet altijd uniek – een speler kan soms onverschillig zijn over een uitkomst

  • Een extensie van de manier van achterwaartse inductie kan worden gebruikt om alle SPE’s in een eindig spel te vinden

Het vinden van SPE’s in eindige spellen door middel van achterwaartse inductie

Het SPE kan niet alleen worden gevonden door naar het Nash-evenwicht te kijken, maar ook door een extensie van achterwaartse inductie. Dit proces loopt van de laatste keus in het boomdiagram naar de eerste keus van de boomdiagram, alle sub-spellen worden apart bekeken. Hoe werkt dat precies?

In de boomdiagram hierboven wordt eerst naar het laatste sub-spel gekeken, oftewel de keus van speler 2. Gegeven dat speler 1 ‘low’ kiest zal speler twee voor ‘don’t buy’ gaan – 1 > 0. Gegeven dat speler 1 ‘high’ kiest zal speler twee voor ‘buy’ gaan – 2 > 1. Dit wetende nemen we een stap terug. We kijken nu naar het eerste sub-spel. Hier zal speler 1 voor ‘high’ kiezen omdat de finale uitbetaling van (2,2) groter is dan (1,1). Het unieke evenwicht is dus (hight, buy).

Hoofdstuk 6 – Extensieve spellen met perfecte informatie: Illustraties

In dit hoofdstuk worden voornamelijk voorbeelden gegeven van spellen met ene lengte van twee of drie sub-spellen. Als laatste wordt er een voorbeeld gegeven van een spel met een wisselde eindige horizon.

Het ultimatum spel en het ‘holdup’ spel

Het ultimatum spel

Twee mensen moeten een euro delen. Persoon 1 doet een verzoek waarin hij het geld verdeelt. Persoon 2 kan dit accepteren, dan wordt het geld inderdaad verdeeld of weigeren, dan krijgt geen van beide geld.

Het spel:

Spelers: Twee spelers

Terminale geschiedenis: (x, Z). 0 ≤ x ≤ c, oftwel de hoeveelheid die persoon 1 aan persoon 2 geeft. Z is of Y ‘accepteren’ of N ‘niet accepteren’.

Speler functie: P (Ø) = 1 en P (x) = 2 voor alle x

Preferenties: Persoon 1 krijgt c – x en persoon 2 krijgt x.

Maar wat is nu het evenwicht?

Twee situaties kunnen zich voordoen:

  1. Persoon 2 accepteert alle aanbiedingen (ook die van 0!) – Hierdoor zal speler 1 speler 2 een aanbieding geven van x = 0.

  2. Persoon 2 accepteert alle aanbiedingen boven 0 (x > 0) – Hierdoor zal speler 1 speler 2 een aanbieding geven van x > 0.

Het enige sub-spel evenwicht wat hierin zit verwerkt is situatie 1. In dit evenwicht zal persoon 1 een uitbetaling ontvangen van c en persoon 2 een uitbetaling van 0.

Let op dat dit spel compleet veranderd als speler 2 ook een mogelijkheid heeft om te beïnvloeden; als hij in de tweede beurt een aanbieding mag doen dan zal speler 1 hier rekening mee houden.

Het ‘holdup’ spel

Dit is een vervolg van het vorige spel waarbij speler 2 nog een actie kan ondernemen voordat hij akkoord gaat met de aanbieding van speler 1. Met deze actie kan hij de totale hoeveelheid geld wat wordt verdeeld (c) vergroten. Veel moeite zal hij moeten doen voor een grotere c (ch) en weinig moeite zal hij moeten doen voor een kleine extra c (cl).

Het spel:

Spelers: Twee spelers

Terminale geschiedenis: (low, x, Z) 0 ≤ x ≤ cl (hoeveelheid geld dat persoon 1 aanbiedt als de taart klein is). (high, x, Z) 0 ≤ x ≤ ch (hoeveelheid geld dat persoon 1 aanbiedt als de taart groot is). Z is of Y ‘accepteren’ of N ‘niet accepteren’.

Speler functie: P (Ø) = 2 en P (low) = P (high) = 1, en P (low,x) = P (high,x) = 2 voor alle x.

Preferenties: Persoon 1 krijgt cl – x of ch - x en persoon 2 krijgt x – L of x – H. In het slechtste geval krijgt persoon 2 alleen – L of – H.

Wat is het sub-spel perfect evenwicht (SPE)?

Aangezien net zoals bij het vorige voorbeeld speler 1 altijd 0 zal aanbieden aan speler 2 is het een sub-spel evenwicht als speler 2 het minste moeite doet voor de grootte van c (dus cl kiest) en speler 1 een aanbieding aan speler 2 doet van 0. Dit evenwicht wordt dus niet gebaseerd op de waarden van cl, ch, L en H.

Stackelberg’s model van duopolie

In deze paragraaf gaan we terug naar het Cournot spel van paragraaf 3.1, maar veronderstellen nu dat speller (bedrijf) 1 eerst een hoeveelheid q1 kiest, en dat speller 2 deze hoeveelheid observeert en vervolgens q2 kiest. Dit betekent dat we te maken hebben met een spel in uitgebreide vorm. We kunnen dit niet weergeven op de manier van de voorafgaande paragraaf, aangezien elke speler oneindig veel acties heeft. Dit spel wordt ook wel Stackelberg spel genoemd met speler 1 als leider en speler 2 als volger.

Het figuur hieronder geeft de handelingen van bedrijf 1 en 2 weer:

De golvende lijnen geven aan dat een speler oneindig veel verschillende acties heeft.

Spelers: Twee bedrijven

Terminale geschiedenis: Alle voorgaande outputs (q1, q2)

Speler functie: P (Ø) = 1 en P (q1) = 2 voor alle q1.

Preferenties: Uitbetaling voor het bedrijf i gezien de terminale geschiedenis (q1, q2) = qi Pd(q1 + q2) – Ci (qi) voor i = 1,2.

Om het sub-spel evenwicht te vinden moeten voor elke strategie van speler 1 bepaald worden – net als in het Cournot evenwicht – wat het beste antwoord is van speller 2. Dit hoeft niet opnieuw berekend te worden, in paragraaf 3.1 is de reactiefunctie van speler 2 al gevonden:

als q2 ≤ a – c q1 = (a − q2 − c)/2

als q2 > a – c q1 = 0

Prijs P = a – q1 – q2

Winst:

Bedrijf 1: q*p - c = q1(a − q1 − q2) − cq1 als q1 + q2 ≤ a, en 0 anders

Bedrijf 2: q*p - c = q2(a − q1 − q2) − cq2 als q1 + q2 ≤ a, en 0 anders

Speler 1 weet dus wat de reactie van speler 2 zal zijn, vandaar dat speler 1 zijn hoeveelheid q1 zodanig kiest zodat hij zijn winst maximaliseert.

  • Herschrijf de functie van bedrijf 1 naar q1

  • q1(a – q1 – (a – q1 – c/2)) – cq1 = q1 (a – c – q1)/ 2 = (q1a – q1c – q1^(2)) / 2 = ½ q1a – ½ q1c – ½ q1^(2)

  • Bepaal hiervan de afgeleide en stel deze gelijk aan 0

  • ½ a – ½ c – q1 = 0

  • Herschrijf dit naar q1

  • q1 = (a-c)/2

Bereken nu de hoeveelheid dit speler 2 aanbiedt:

  1. q1 = omgekeerde van q2

  2. q2 = (a − q1 − c)/2

  3. Vul q1 in, die weet je tenslotte nu

  4. q2 = (a − ((a-c)/2) − c)/2

  5. werk dit uit

  6. q2 = (a – c)/4

Kortom, de hoeveelheden aangeboden in het Stackelberg evenwicht zijn voor speler 1 (a-c)/2 en voor speler 2 (a – c)/4. De winsten zijn respectievelijk (a – c)^(2) / 8 en (a – c)^(2) / 16.

Vergeleken met het Cournot evenwicht gaat speler 1 er dus op vooruit en speler 2 er op achteruit. Dat is logisch want speler 1 heeft de eerste keus en hoeft zich dus niet aan te passen aan speler 2 – dit wordt het ‘first-mover’s advantage’ genoemd.

Om nog even een overzicht te krijgen van het verschil tussen monopolie, Stackelberg duopolie en Cournot duopolie het volgende plaatje:

Hierbij is:

P = 130 – q

Q = x1 + x2

C = 10

Bedrijf 1 is als eerste aan zet (‘first mover’)

Bedrijf 2 uitbetalingsfunctie: P = (130 – x1) – x2

Je ziet op het plaatje dat bedrijf 2 in geval van monopolie (enige aanbieder in de markt) een hoeveelheid van 60 aanbiedt (max. productie capaciteit). Bedrijf 1 is uit de markt en biedt dus 0 aan. In het geval van een Cournot evenwicht (twee aanbieders bieden tegelijk hun product aan) bieden bedrijven dezelfde hoeveelheid q aan – dat is ook de reden waarom er bij het cournot model de q1 en q2 bepaald kan worden door het snijpunt te berekenen. In het geval van een Stackelberg evenwicht met bedrijf 1 als eerste aan zet, biedt bedrijf 2 slechts een hoeveelheid aan van 30, terwijl bedrijf 1 60 eenheden verkoopt. Hierbij heeft bedrijf 1 dus een groot voordeel gegeven dat de prijs voor beide bedrijven hetzelfde is.

Het kopen van stemmen

In dit spel draait het om het omkopen van bewindslieden voor hun stemmen – waarbij de heerlijke voetnoot wordt gegeven dat het in sommige echte verkiezingen de Amerikaanse wetgevende macht op een wat subtielere manier wordt omgekocht..

k = aantal bewindslieden

A = de kamer

X = een wetsvoorstel 1

Y = een wetsvoorstel 2

Vx = de waarde die groep X wil geven om wetsvoorstel X erdoor heen te drukken

Vxy = de waarde die groep Y wil geven om wetsvoorstel Y erdoor heen te drukken

Mx = totale bedrag wat Y moet betalen om een meerderheid van de stemmen te krijgen

U = ½ (k + 1) = uitbetalingsfunctie

Spelers: De twee geïnteresseerde groepen, X en Y.

Terminale geschiedenis: (x, y). Hierbij is x een lijst van betalingen die worden gedaan vanuit de groep X en y een lijst van betalingen die worden gedaan vanuit de groep Y.

Speler functie: P (Ø) = X en P (x) = Y voor alle x

Preferenties: De uitbetalingsfunctie luidt als volgt:

Vx – (x1 + … + xk) Als wetsvoorstel X erdoorheen gaat

- (x1 + … + xk) Als wetsvoorstel X er niet doorheen gaat

Hoe vind je het Nash-evenwicht?

  • Als Mx < Vy dan kan groep Y een meerderheid omkopen voor minder dan dat de groep er werkelijk voor over heeft. Ze zullen een betaling doen die gelijk is aan Vx ⇒ Wetsvoorstel Y wint

  • Als Mx > Vy dan zal Y geen betalingen doen aangezien ze boven hun waarde gaat ⇒ Wetsvoorstel X wint

  • Als Mx = Vy dan zijn beide bovenste reacties een best response van Y.

Er is een uniek sub-spel evenwicht waarin:

Strategie Y

  • Als Mx < Vy dan moet Y een betaling doen die gelijk is aan die van x

  • Als Mx ≥ Vy moet Y helemaal geen betalingen doen

Strategie X

  • Als Vx < kVy / u dan moet X helemaal geen betalingen doen

  • Als Vx > kVy / u dan moet X elk bewindslied Vy / u betalen

Hoofdstuk 7 – Extensieve spellen met perfecte informatie: Extensies en discussies

Het toelaten van spelers die tegelijk een zet doen

In dit hoofdstuk wordt beschreven hoe men spellen bestudeerd waarvan de spelers na een aantal zetten een zet tegelijk doen. Dit wordt beschreven door:

  • Een aantal spelers

  • Terminale geschiedenis

  • Een spelers’ functie

  • Ai (h): de set van acties die beschikbaar zijn voor speler i, na de geschiedenis h

  • Preferenties

Het Nash-evenwicht en SPE worden op dezelfde manier gevonden als hiervoor.

Voorbeeld:

Dit is een variant van het BoS spel. Het bestaat uit twee keuzes. Een boek lezen of naar een concert gaan. Als men voor het laatste kiest dan staat het echtpaar voor nog een keuze, hierbij kiezen ze niet na elkaar maar tegelijkertijd: naar het concert van U2 of naar het concert van CP?

Dit kan je weergeven in een tabel zoals bij een strategisch spel:

Het zoeken van het Nash-evenwicht kan op dezelfde manier als voorheen. Zet een sterretje achter elke voorkeur van speler 1 en 2.

De Nash-evenwichten zijn als volgt:

  • {(Concert, U2), U2}

  • {(Book, U2), CP}

  • {(Book, CP), CP}

SPE zijn als volgt:

  1. {(Concert, U2), U2}

  2. {(Book, CP), CP}

Waarom is {(Book, U2), CP} geen SPE? Dit is het geval, omdat bij terugrekenen met terugwerkende inductie het geen evenwicht is in een sub-spel. In de matrix kan je twee evenwichten vinden: (U2, U2) en (CP, CP). Maar zijn deze voor speler 1 optimaal?

Als speler 1 voor {(Concert, CP), CP} kiest kan hij beter voor het boek kiezen aangezien de uitbetaling respectievelijk 1 en 2 bedragen.

Als speler 1 voor {(Concert, U2), U2} kiest in plaats van het boek is het wel een goede keuze aangezien de uitbetaling respectievelijk 3 en 2 bedragen.

Uiteindelijk blijft het evenwicht {(Concert, U2), U2} en het evenwicht {(Book, CP), CP} dus over.

Illustratie: een monopolie markt betreden

Een (nieuw) bedrijf 2 wil toetreden tot een markt waar tot dusver slechts 1 producent bedrijf 1 aanwezig was.

f = kosten die bedrijf 2 moet maken om toe te treden tot de nieuwe markt

Ci(qi) = productiekosten

Pd(Q) = marktprijs

Het spel:

Spelers: De twee bedrijven i (de monopolist) en j (de toetreder)

Terminale geschiedenis: (In, (q1,q2)) voor elk paar (q1, q2) van output. En (Out, q1)

Acties: A2 (Ø) = {In, Out}, P(In), A1(Out) en A2(In)

Preferenties: worden gevonden door hun winst.

  • Als bedrijf 2 toetreedt: Bij bedrijf 1 is de uitbetaling q1Pd(q1+q2) – C1(q1) en bij bedrijf 2 is de uitbetaling q2Pd(q1+q2) – C2(q2) – f

  • Als bedrijf 2 niet toetreedt: Bij bedrijf 1 is de uitbetaling q1Pd(q1) – C1(q1) en bij bedrijf 2 is de uitbetaling 0.

Gegevens:

Kosten: C1(q1) = cq1 voor bedrijf 1, C2(q2) = c q2 - f voor bedrijf 2.

Inverse vraagfunctie: Pd(Q) = a – Q voor Q ≥ a

Als bedrijf 2 besluit toe te treden dan onstaat er een een Cournot spel waarin beide tegelijk een keuze maken. Wat is het SPE?

In geval van het niet toetreden van bedrijf 2 blijft bedrijf 1 in een monopolie positie:

- qm = (1/2)(a - c)

- winst bedrijf 1 = (1/4)(a - c)2

In geval van het wel toetreden van bedrijf 2 ontstaat er een Cournot evenwicht:

- winst bedrijf 1 = (1/9)(a - c)2

- winst bedrijf 2 = (1/9)(a - c)2 – f

De sub-spel perfecte evenwichten hangen af van de kosten van het toetreden (f). In alle evenwichten is het het beste voor bedrijf 1 om 1/3 (a-c) te produceren als bedrijf 2 toetreedt en ½ (a-c) als bedrijf 2 niet toetreedt.

  • Als f < 1/9(a-c)2: Dan is er een uniek sub-spel perfect evenwicht waarin beide bedrijven 1/3 (a-c) produceren.

  • Als f > 1/9(a-c)2: Dan is er een uniek sub-spel perfect evenwicht waarin bedrijf 2 niets produceert en bedrijf 1 ½ (a-c).

  • Als f = 1/9(a-c)2: Dan heeft het spel twee sub-spel perfecte evenwichten, namelijk beiden die hierboven uitgeschreven staan.

Het toelaten van exogene onderzekerheid

Als het voorgaande model wordt uitgebreidt met deze exogene onderzekerheid dan ontstaat er een variant waarin ‘kansen’ een grote rol spelen.

Hoe wordt hier het SPE opgelost?

Weer door achterwaartse inductie ⇒

Kijk eerst naar de keuze van speler 2. Hij zal in dit geval voor 0,1 – optie C. Gegeven dat speler 1 dit weet heeft hij een keuze voor A of B. A geeft een uitbetaling van 1. B geeft een uitbetalingskans ½ van 3 en kans ½ van 0. Gemiddeld genomen dus 1.5. Speler 1 zal dus voor B kiezen. Er ontstaat een uniek sub-spel perfect evenwicht in (B, C).

Discussie: SPE en terugwerkende inductie

Tot dusver is er altijd uitgegaan van de rationaliteit van spelers. Maar zijn spelers wel rationeel?

Een voorbeeld:

Een bedrijf k wil een nieuwe markt betreden waar chain store al in opereert.

Het spel:

De spelers: De chain store en de uitdager k

Terminale geschiedenis: Out, (In, A) of (In, F)

Speler functie: P (Ø) = (In, out) en P(In) = (In, A) of (In, F)

Preferenties: worden weergeven door hun opbrengsten

Wat zal er gebeuren in het SPE?

Als er terugwerkende inductie wordt toegepast dan zie je dat de Chain-store altijd zal vechten. Zijn uitbetaling is dan namelijk 1 > 0. De challenger k zal altijd (In) kiezen. Gegeven dat hij weet dat de chain-store zal vechten, zal hij een uitbetaling van 2 krijgen (i.p.v. 1).

Dit betekent in de praktijk dat bedrijf k naar 1 periode altijd weer de markt zal moeten verlaten – is dit wel rationeel? Als het vanuit de kant van de chain-store wordt bekeken wel. Deze wil een reputatie opbouwen als ‘vechter’ waardoor het volgende bedrijf k de weg (out) zal kiezen en de chain-store een uitbetaling van 2 in ontvangst mag nemen. Als de chain-store keer op keer het nieuwe bedrijf eruit concurreert, zal er op den duur geen bedrijven meer aanbieden die de markt betreden. Het is echter rationeel gezien ook de beste optie om de markt niet te betreden aangezien het nieuwe bedrijf niet lang zal standhouden.

Hieruit valt te concluderen dat ratio niet samenvalt met het SPE. Er vindt op den duur een deviatie plaats van het SPE omdat nieuwe bedrijven (uit) zullen kiezen.

Hoofdstuk 8: Coalitie spellen en ‘De core’

Coalitie spellen

In dit hoofdstuk wordt besproken hoe groepen mensen gezamenlijk een ‘speler’ zijn. Ze moeten een beslissing maken door bijvoorbeeld een persoon naar voren te schuiven als speler of door allen gezamenlijk te besluiten (vorm van een directe democratie). Het komt erop neer dat de individuele spelers beter af zijn als een groep vormen.

Een coalitie spel bestaat uit:

  • Een aantal spelers

  • Voor elke coalitie een aantal acties

  • Voor elke speler preferenties over het aantal acties van de coalitie

  • N: grote coalitie (iedereen doet mee)

  • S: arbitraire coalitie (een gedeelte van de mensen doet mee)

Maar wat wordt er met deze spellen bereikt? De spellen worden gebruikt om uit te zoeken welke coalities er naar alle waarschijnlijkheid worden gevormd. Daarnaast is het belangrijk te weten hoe de uitbetaling wordt verdeeld onder de spelers die een coalitie vormen.

In deze vorm van spelen worden altijd sociale situaties nagepeeld waarin mensen met verschillende toegevoegde waarden (de een kan timmeren dan andere kan schilderen) een ‘coalitie’ moeten vormen om gezamenlijk een bepaald doel na te streven (bijvoorbeeld een product maken). Daarna wordt gekeken hoeveel de timmerman en hoeveel de schilder ontvangt van de ‘verhandelbare uitbetaling’ (v(S)) die is gegenereerd.

Een cohesie spel betekent dat N – alle spelers doen mee tenminste zoveel uitbetaling oplevert als een spel waarin slechts S - een gedeelte van spelers participeert. Dus de opbrengst van v(S1) + v(S2) + v(S3) + … v(Sn) ≤ v(N).

The core’

Als de grote coalitie (N) een stabiel evenwicht heeft gevonden waarin geen enkele coalitie (S) de neiging heeft om uit te stappen dan wordt N ‘the core’ genoemd.

S zou er kunnen uitstappen als alle leden van S een andere actie prefereren dan N.

Kortom, ‘the core’ is een de groep N waarbij geen enkele sub-groep zich kan verbeteren door eruit te stappen en subgroep (S) te vormen.

Voorbeeld:

Twee spelers kunnen samen een product produceren. Elke speler geeft alleen om de uitbetaling die hij van het gezamenlijke product krijgt.

Het spel:

Spelers: twee mensen (1 en 2)

Acties: Coalitie {1,2} is voor elke set acties van (x1, x2) een positief getal zodat x1+x2 = 1.

Preferenties: de uitbetaling die elke speler verdient

{ (x1, x2) : x1 + x2 = 1 en xi ≥ 0 voor i = 1,2 }

The core zijn alle acties van N. Waarom? Als een speler (1 of 2) afwijkt van the core dat ontvangt deze speler geen output (het product wordt tenslotte niet vervaardigd).

Een ander voorbeeld:

Een landeigenaar kan samen met zijn landbewerkers een product vervaardigen. De output f(k+1) komt tot stand waarin f een groeiende functie is. Er zijn in totaal twee landbewerkers aangenomen (k=2)

Spelers: landeigenaar en 2 landbewerkers

Acties: f (k+1)

Preferenties: de uitbetaling die elke speler verdient

  • (x1, x2, x3) is de N die zorgt voor een output van f (3)

  • (x1) is de S die zorgt voor een output van f (1)

  • (x1, x2) is de S die zorgt voor een output van f (2)

(x1, x2, x3) is the core alleen als:

x1 ≥ f(1)

x2 ≥ 0

x3 ≥ 0

x1 + x2 ≥ f(2)

x1 + x3 ≥ f(2)

x1 + x2 + x3 = f(3)

Kortom (x1, x2, x3) is the core als er geen andere mogelijkheden zijn van een coalitie (S) waarbij de uitbetaling hoger is dan in de grote coalitie (N).

In principe wordt hier het Nash evenwicht van een enkele persoon verwisseld voor ‘the core’ van een groep. Echter, de individuelen in een groep moeten oppassen dat ze geen beslissingen nemen buiten hun (sub)groep om.

Deel II – Spellen met imperfecte informatie

Hoofdstuk 9: Bayesian spellen

In het Nash evenwicht is er door de hoofdstukken heen vanuit gegaan dat spelers alles over elkaar weten, de tegenstander zijn acties en preferenties. Echter is dit natuurlijk niet altijd het geval. Het bestuderen van spellen waarin de spelers niet compleet geïnformeerd zijn over hun omgeving worden Bayesian spellen genoemd.

Voorbeeld:

Neem nog eens het voorbeeld van het BoS spel. Nu zijn de uitbetalingen iets veranderd, aangezien speler 1 niet op de hoogte is van de preferenties van speler 2. In het figuur hieronder wordt aangegeven dat speler 1 met een kans van ½ denkt dat speler 2 graag een uitstapje met haar wil maken. Speler 1 denkt met een kans van ½ dat speler 2 liever geen uitstapje met haar maakt. De tabel bestaat dus weer uit bernoulli uitbetalingen, zoals we in de voorgaande hoofdstukken ook hebben gezien.

Als deze tabel wordt omgezet in een tabel van louter de uitbetaling van speler 1 ontstaat er het volgende:

Hoe wordt dit gelezen?

De 2 rechtsboven bestaat uit een keuze B, (B,B). Hiervoor staat de eerste B uit (B,B) voor het spel wat gespeeld wordt als speler 2 voor links (2 wishes to meet 1) kiest. De tweede B uit (B,B) staat voor het spel wat gespeeld wordt als speler 2 voor rechts (2 wishes to avoid 1) kiest. De linker B staat voor de keuze van speler 1. Kortom, de 1 rechtsonder staat voor: ½ x 1 (Het linker spel; (S,S)) + ½ x 1 (Het rechter spel; (S,S)) = 1.

Maar wat is dan het Nash evenwicht?

Dit bepaal je door 3 acties te definiëren; een voor speler 1 en twee voor speler 2:

  • De actie van speler 1 moet optimaal zijn; gegeven de acties van speler 2

  • De acties van speler 2 moeten optimaal zijn; gegeven de actie van speler 1

Dus, we behandelen de twee acties van speler 2 als twee verschillende spelers.

Het Nash-evenwicht in dit spel is (B, (B,S))

Gegeven dat speler 2 (B of S) kiest is B het beste antwoord van speler 1. Daarnaast is B en S het beste antwoord van speler 2 op B van speler 1. Als speler 1 S zou kiezen, dan zou speler 2 (S,B) kiezen, echter is speler 1 dan beter af door B te kiezen. S is dus geen puur evenwicht.

Generale definities

  • State ⇒complete beschrijving van een spelers collectie van relevante karakteristieken: dus zowel preferenties als informatie (w)

  • Signaal ⇒ een signaal dat informatie geeft over de state

Een Bayesian spel bestaat uit

  • Een aantal spelers

  • Een aantal staten (w)

En voor elke speler:

  • Een aantal acties (a)

  • Signalen (en een signaal functie) Ti(w)

  • Een geloof over of de staat consistent is met het signaal dat wordt uitgezonden

  • Bernoulli uitbetalingsfunctie:

Het Nash-evenwicht is in zo’n spel is dus gelijk aan een Nash-evenwicht in een strategisch spel, behalve dat alle keuzes van een speler a priori worden gezien als een ‘aparte speler’ in het spel waardoor er in het evenwicht een rij van acties voor elke zogenaamde speler ontstaat.

Het volgende voorbeeld legt dit helder uit:

‘Meer informatie kan tot last zijn’

Er zijn twee tabellen die allebei met een kans van ½ door speler 2 worden gekozen:

Men zou denken dat in een spel iemand met meer informatie (dan de ander) beter af is. Echter, zal je zien vanuit dit spel dat dit niet helemaal waar is.

0 < e < ½

Als nu opzoek wordt gegaan naar het Nash-evenwicht, gaat er gekeken worden wat het beste is voor speler 1 om te doen:

  • Speler 2: hij kan het beste L kiezen. Als speler 1 T kiest is de uitbetaling voor speler 2: 2e (aan allebei de kanten, dus met zekerheid 2). Als speler 2 M zou kiezen zou zijn uitbetaling 3/2e zijn. Als speler 2 R zou kiezen zou zijn uitbetaling tevens 3/2e zijn.

  • Speler 2: hij kan het beste L kiezen. Als speler 1 voor B kiest dan is de uitbetaling voor speler 2: 2 (aan allebei de kanten, dus met zekerheid 2). Als speler 2 M zou kiezen zou zijn uitbetaling 3/2 zijn. Als speler 2 R zou kiezen zou zijn uitbetaling tevens 3/2 zijn.

  • Speler 1: Als speler 1 weet dat speler 2 L gaat kiezen, dan is het zijn beste reactie om B te kiezen. Hierdoor behaalt hij een uitbetaling van 2 (met zekerheid). Als speler 1 T zou kiezen zou hij een uitbetaling van 1 behalen (met zekerheid)

Het Nash-evenwicht in dit spel is dan ook (B, L).

Stel dat er een variant is waarbij speler 2 is geïnformeerd over de acties van speler 1. Hij weet dat speler 1 voor B zal kiezen en zal zijn strategie hierop aanpassen. Voor speler 2 is het het beste om, gegeven dat speler 1 voor B kiest, om bij w1 voor R te kiezen bij w2 voor M te kiezen. Dit is ook precies wat hij zal doen. Gegeven het feit dat speler 1 weet dat speler 2 geïnformeerd is over zijn keuze, zal speler 1 switchen van B naar T (aangezien hij hierdoor zijn uitbetaling kan vergroten met in staat w1 van 0 naar 1 en ook in staat w2 van 0 naar 1).

Hierdoor ontstaat er een nieuw Nash-evenwicht van (T, (R, M)).

Gegeven dat 0 < e < ½ is speler 2 dus slechter af in het nieuwe Nash-evenwicht (3e), dan in het oude Nash-evenwicht (2)! Dat betekent dat met meer informatie de spelers toch slechter af zijn in het spel.

Voorbeeld:

‘Imperfecte informatie over de kosten in een Cournot duopoly’

Ga uit van twee bedrijven in een markt. Beide bedrijven weten de productiekosten van bedrijf 1, maar alleen bedrijf 2 weet ook de productiekosten van bedrijf 2. Bedrijf 1 denkt dat de productiekosten van bedrijf cl met een kans van k en ch met de kans van 1 – k. Hierbij is:

  • cl < ch

  • 0 < p < 1

Het spel:

  • Spelers: Bedrijf 1 en bedrijf 2

  • Staten: { L, H }

  • Acties: mogelijke output (q)

  • Signalen: Bedrijf 1: t1 (H) = t1 (L) en bedrijf 2: t2 (H) ≠ t2 (L)

  • Geloven: bedrijf 1 geeft een kans van k aan L en een kans van 1 – k aan H.

  • Bernoulli uitbetalingen: zijn de opbrengsten die elk bedrijf heeft.

In dit spel is er sprake van een driedubbel Nash-evenwicht (q1*, ql*, qh*). Om dit te vinden moeten we eerst de best response functies bepalen.

De beste reactie van bedrijf 1 (b1) naar (ql, qh) is:

Max [ k(P(q1 + ql) – c)q1 + (1 – k)(P(q1 + qh) – c)q1 ]

De beste reactie van bedrijf 2 bl(q1) naar q1 als de kosten cl is:

Max [ (P(q1 + ql) – cl) ql ]

De beste reactie van bedrijf 2 bh(q1) naar q1 als de kosten ch zijn:

Max [ (P(q1 + qh) – ch) qh ]

Het Nash-evenwicht is dan:

q1* = b1(ql*, qh*), ql* = bl(q1*) = qh* = bh(q1*)

Hoofdstuk 10: Extensieve spellen met imperfecte informatie

In dit hoofdstuk wordt vooral de nadruk gelegd op het feit dat de spelers niet op de hoogte zijn van elkaars (gedane) acties.

De extra gegevens die men moet toevoegen in een spel met imperfecte informatie is Hi, die ‘information partition’ – vaak een onvolledige set van informatie.

Een voorbeeld:

We leggen extensieve spellen zonder perfecte informatie uit door middel van een voorbeeld met een kaartspel.

Er zijn twee spelers, 1 en 2. Beide stoppen ze een euro in een pot. Allebei de spelers pakken een kaart van een stapel met 50% ‘low’ kaarten en 50% ‘high’ kaarten. De speler die ‘high’ pakt mag de pot hebben, als allebei de spelers ‘high’ pakken dan moeten ze pot evenredig delen. Er zit echter ook nog een ‘bluf’ element in. Speler 1 mag namelijk beslissing of hij wil verhogen of niet (raise of see). Hij stelt een bedrag voor dat extra in de pot wordt gelegd bij verhogen, speler 2 moet beslissing of hij mee gaat (meet of pass). Als speler 2 mee gaat (meet) moet hij het desbetreffende bedrag bijleggen en dan laten beide spelers de kaarten zien. Als speler 2 niet mee gaat (pass), dan is de pot voor speler 1.

Het spel wordt in de volgende diagram beschreven:

Hoe kan dit diagram worden gelezen?

Begin bij het middelste open puntje. Dit is het begin waarbij de kaarten die beiden hebben worden opgenoemd; HH, LH, HL, LL. Vervolgens moet speler 1 kiezen, see of raise? See mond uit in een bepaalde uitbetaling. Raise leidt echter tot nog een spel; pass of meet? – dit is de keuze van speler 2. Uiteindelijk mond dit weer uit in een uitbetaling.

Strategieën

De (pure) strategie is de actie die men gaat nemen zodra met een actie moet ondernemen. Het betekent dus dat speler i in een extensief spel naar aanleiding van de informatie set I een actie A(Ii) opstelt.

Voorbeeld:

In het voorgaande kaartspel heeft elke speler twee informatie sets en twee acties in elke informatie set. Elke speler heeft dus 4 strategieën:

  • Speler 1: SS, SR, RS en RR

  • Speler 2: PP, PM, MP en MM

Nash-evenwicht

Een strategie profiel is een Nash-evenwicht als geen enkele speler een alternatieve strategie heeft die zijn uitbetaling kan verhogen.

Een manier om dit te vinden is door een strategisch spel te construeren en het te analyseren (zoals we ook in extensieve spellen delen met perfecte informatie).

Voorbeeld:

‘Commitment and observability’

  1. Met perfecte informatie en tegelijkertijd actie:

Stel je voor dat twee mensen een spel spelen, er is perfecte informatie en allebei de spelers moeten hun actie uitvoeren op hetzelfde moment:

Het (perfecte) Nash-evenwicht is in dit geval (Y,Y)

  1. Met perfecte informatie maar acties die achter elkaar plaatsvinden

In dit geval mag speler 1 eerst en zet doen en dan moet speler twee hierop reageren

In dit geval zal het Nash-evenwicht uitkomen op (X,X). Waarom? Als speler 1 Y kiest dan zal zijn uitbetaling (speler 2 kiest ook Y) 2 zijn. Als speler 1 X kiest dan zal zijn uitbetaling (speler 2 kiest X) 3 zijn.

  1. Met imperfecte informatie en acties die achter elkaar plaatsvinden

In dit geval is speler 2 niet helemaal op de hoogte van de actie die speler 1 heeft genomen. Hij krijgt wel een signaal (speler 1 kiest X of Y) maar dat signaal is niet helemaal betrouwbaar. Als speler 1 de actie X kiest dan is de kans dat het signaal X correct wordt doorgegeven 1 – e. Met een zekerheid van 1 –e wordt dus signaal X doorgegeven, met een zekerheid van ‘e’ wordt het signaal Y doorgegeven.

Ga ervan uit dan 0 ≤ e < ¼

Extensief spel: figuur 1

Strategische vorm: figuur 2

Nash evenwicht strategie paren: figuur 3

Om deze tabellen te kunnen lezen moet je eerst naar de 2 bij 2 tabel erboven kijken:

Als speler 1 X kiest, dan kiest speler 2 dit ook. Als speler 1 Y kiest, dan kiest speler 2 dit ook – dit levert namelijk voor speler 2 de hoogste uitbetaling op. Nu passen we deze kennis toe op figuur 1 en 2.

In figuur 2 staat in het hokje linksboven bij de actie (X, (X,X)) 3,2. Als speler 1 X kiest (zie figuur 1) dan krijgt speler 2 dit met een kans van 1 – e goed door. In dit geval krijgt hij het goed door en speelt hij, logischerwijs, ook X. De uitbetaling is dan (zie figuur 1 linksboven) 3,2.

Let op in figuur 2 dat de eerst X of Y slaat op de laatste keuze van speler 2 en dat de tweede X of Y slaat op het signaal dat speler 2 heeft doorgekregen.

Een Nash-evenwicht ontstaat in figuur 3 bij (Y, (Y,Y)).

Hieruit kan men concluderen dat speler 1 dus niet zoveel voordeel heeft als ‘first mover’. Dit komt door de onvolledige informatie die speler 2 heeft, waardoor er meer ‘random’ antwoorden ontstaan dan in een spel met perfecte informatie.

In de voorgaande hoofdstukken hebben we vaak geleerd dat sub-spel perfecte evenwichten een oplossing zijn voor extensieve spellen met perfecte informatie waarin een Nash-evenwicht in altijd adequaat is. Dit idee kunnen we ook toepassen op extensieve spellen met imperfecte informatie. Het ging bij een sub-spel perfect evenwicht om dat dit evenwicht optimaal was gegeven andere spelers hun strategie en gegeven de geschiedenis. Bij deze gegevens is het dus belangrijk wat de speler ‘denkt’, dit geloof is belangrijk.

Geloof en sequentieel evenwicht

In deze paragraaf wordt er een oplossing gegeven voor extensieve spellen waarbij rekening wordt gehouden met het ‘geloof’ van de spelers.

In de voorgaande spellen was ‘geloof’ altijd gelijk aan ‘strategie’. Waarom? Omdat er werd aangenomen dat het geloof van elke speler over elkaar correct was (perfecte informatie). Bij imperfecte informatie is dat niet het geval. We moeten nu geloof van strategie scheiden.

Geloof

Een geloof wordt gevormd nadat er een geschiedenis heeft plaatsgevonden. Met vormt dan een geloof met kansen waarbij men aan elke gebeurtenis is het verleden een kans toebedeeld (vaak evenredig). Dit wordt een geloof systeem genoemd.

Strategieën

In dit geval valt een strategie samen met een gemengde strategie – deze hebben we in de voorgaande hoofdstukken al behandeld. In plaats van een kansverdeling geven over de pure strategieën mag een speler nu een kansverdeling geven voor elke geschiedenis van de informatie set. Dit wordt een gedragsmatige strategie genoemd.

Een gedragsmatige strategie waarbij een speler de kans 1 toebedeeld aan een enkele actie is dus een pure strategie.

Evenwicht

Een evenwicht van een assessment (een actie) moet aan de volgende twee voorwaarden voldoen:

  1. Sequentiële rationaliteit: Elke speler zijn strategie is optimaal, gegeven zijn geloof en andere spelers hun strategieën

  2. Consistentie van het geloof in strategieën: Elke speler zijn geloof is optimaal, gegeven zijn strategie profiel.

Dit is allemaal erg abstract, vandaar dat de termen nog een keer worden uitgelegd m.b.v. een voorbeeld:

Wat zijn de optimale strategieën van speler 1 en speler 2?

Eerst wordt er gekeken naar speler 1:

Deze kan 3 opties kiezen, C, D en E. Bij actie E en D is er geen vervolg keuze voor speler 1. Voor de actie C eventueel wel. Gegeven dat speler 1 actie C kiest en speler 2 actie F zal speler 1 daarna voor I kiezen.

We kijken nu naar speler 2:

Deze kan de strategie F kiezen ⇒ uitbetaling: 2/3 * 0 + 1/3 * 1 = 1/3

Deze kan de strategie G kiezen ⇒ uitbetaling: 2/3 * 1 + 1/3 * 0 = 2/3

Speler 2 zal gegeven dat hij sequentieel rationeel is voor actie G kiezen. G is de optimale strategie voor speler 2.

Nu wordt er weer gekeken naar speler 1:

Gegeven dat hij weet dat speler 2 voor actie G zal kiezen maakt het voor speler 1 niet meer uit of hij actie D of E kiest. Beiden leveren een uitbetaling van 2 voor hem op.

Kortom, de optimale strategie voor speler 1 is DI en EI.

Nu wordt er binnen extensieve spellen met imperfecte informatie gebruik gemaakt van het zwakke sequentiële evenwicht. Deze moet aan de volgende twee voorwaarden voldoen:

  1. Sequentiële rationaliteit: Elke strategie die de speler kiest is optimaal in het gedeelte van het spel

  2. Zwakke consistentie van het geloof over de strategieën

Weer een redelijk abstract verhaal, hierna volgt meer informatie aan de hand van het voorgaande voorbeeld:

Het voorgaande spel illustreert dit evenwicht. Speler 1’s keuze om EI te kiezen is sequentieel rationeel gegeven dat speler 2 strategie G kiest. Daarnaast is speler 2’s keuze G ook sequentieel rationeel aangezien hij gelooft in de kansen toebedeelt in het spel en weet dat speler 1 de strategie EI speelt. Kortom (EI, G) is een zwak sequentieel evenwicht.

Maar is het voorgaande evenwicht (DI, G) wat we hebben gevonden ook een zwak sequentieel evenwicht? De keuzes van zowel speler 1 als 2 zijn sequentieel rationeel. Maar de keuze van speler 2 is niet optimaal in het gedeelte van het spel. Als speler 1 optie D kiest met een kans van 1 dan zal speler 2 niet G spelen, maar F. Dit is dus geen zwak sequentieel evenwicht.

Bij deze spellen staat het zwak sequentieel evenwicht gelijkt aan een subspel perfect evenwicht. Daarnaast is het strategie profiel in een zwak sequentieel evenwicht een Nash-evenwicht.

Waarom heet dit eigenlijk een ‘zwak’ evenwicht? Dit komt omdat er uit wordt gegaan van bepaalde limieten (zoals de kansverdeling van wat speler 2 denkt dat speler 1 gaat spelen) door het gebrek aan informatie. In sommige spellen kunnen enorm veel zwak sequentiële evenwichten ontstaan die zeker niet allemaal een vaste staat inhouden.

Signaling spellen

Vaak is er sprake van asymmetrische informatie: de ene partij weet meer over het spel dan de andere partij. In sommige gevallen wachten de niet-geïnformeerde partijen de actie van de geïnformeerde partij af aangezien deze vaak een ‘signaal’ geeft over de informatie die de partij heeft.

Hoe werkt dit precies? Dit kan het beste worden uitgelegd door middel van een voorbeeld:

In dit figuur wordt duidelijk dat twee bedrijven een strijd aangaan om een marktpositie. Het uitdagende bedrijf(UB) weet of hij een sterke of zwakke positie heeft. Het andere bedrijf(AB) weet dat echter niet! Deze observeert alleen de actie die het UB neemt; klaar of niet. Uit deze actie probeert zij vervolgens op te maken of het UB een sterke of zwakke positie heeft.

Lees het getal voor de komma als de uitbetaling voor het UB en het getal achter de komma als de uitbetaling voor het AB. De lege geschiedenis is het middelste open puntje waar ‘change’ bij staat. Het UB kiest klaar of onklaar. Vervolgens kiest het AB toestemmen of vechten (A of F)

Hoe kan dit spel gelezen worden?

Het UB heeft een sterke positie:

  • Stel je voor dat UB niet weet dat hij een sterke positie heeft. Als hij “klaar” kiest, dan zal AB voor A kiezen. Dit levert een uitbetaling voor UB van 4 en voor AB van 2 op.

  • Stel je voor dat UB wel weet dat hij een sterke positie heeft. Als hij “onklaar”kiest, dan zal AB voor A kiezen. Dit levert een uitbetaling voor UB van 5 en voor AB van 2 op.

Het UB heeft een zwakke positie:

  • Stel je voor dat UB niet weet dat hij een zwakke positie heeft. Als hij “klaar” kiest, dan zal AB voor F kiezen. Dit levert een uitbetaling voor UB van 0 en voor AB van 1 op.

  • Stel je voor dat UB wel weet dat hij een zwakke positie heeft. Als hij “onklaar” kiest, dan zalAB voor F kiezen. Dit levert een uitbetaling voor UB van 3 en voorAB van 1 op.

UB zal, gegeven dat hij een zwakke positie heeft, nooit voor klaar kiezen. Zijn uitbetaling zal altijd kleiner zijn dan onklaar, of AB nou voor A kiest of voor F. Kortom, als UB een zwakke positie heeft kiest hij altijd voor onklaar.

UB zal, gegeven dat hij een sterke positie heeft, niet voor onklaar kiezen. Is dat vreemd? Nee, wat als hij voor onklaar kiest geeft hij een signaal af dat hij een zwakke positie heeft, waardoor AB waarschijnlijk voor F zal kiezen. Dit levert een uitbetaling op voor UBvan 3, terwijl, als hij voor klaar zou kiezen en F dus logischer wijs voor A, hij een uitbetaling van 4 ontvangt.

Kortom, UB kiest klaar als hij een sterke positie heeft en onklaar als hij een zwakke positie heeft. Dit is een zwak sequentieel evenwicht.

Maar is dit het enige evenwicht? Nee, want er is nog geen rekening gehouden met het gedragsmatige evenwicht. In het figuur staan tenslotte kansen die toebedeeld kunnen worden (p) en (1- p).

AB gelooft dat een onklare UB sterk is met een kans p. AB gelooft dan ook dat een onklare UB zwak is met een kans van 1 –p. Als p ≥ ¼ dan heeft het spel een evenwicht waarin AB de actie A speelt. Als p ≤ ¼ dan heeft het spel een evenwicht waar ABde actie F speelt.

Kortom, UB kiest dus altijd onklaar, ongeacht of hij een sterke of zwakke positie heeft/ Dit is tevens een zwak sequentieel evenwicht.

In dit spel zijn dus twee soorten evenwichten te vinden:

  1. Een gescheiden evenwicht: Als UB een sterke positie heeft kiest hij een andere actie dan wanneer hij een zwakke positie heeft. Doordat AB dit observeert kan hij het ‘type’ van UB achterhalen.

  2. Een samengebracht evenwicht: Of UB nou een sterke of zwakke positie heeft hij zal altijd onklaar kiezen. Hierdoor heeft AB geen idee wat voor ‘type’ UB nou daadwerkelijk is. In dit geval kan UB ook een mix van beide types zijn.

Deel III – Varianten en Extensies

Hoofdstuk 11: Strikt competitieve spellen en maximalisatie

In dit hoofdstuk wordt er in gegaan op de procedure van ‘maxminimization’. Dit houdt in dat de speler het ‘beste van het slechtste kiest’, ongeacht wat een andere speler kiest.

Een voorbeeld:

In de volgende tabel staat de uitbetaling van speler 1 – de uitbetaling van speler 2 zijn in het geval van ‘maxminimization’ irrelevant.

 

Zwijgen

Verraden

Zwijgen

3

0

Verraden

1

2

In het slechtste geval dat speler 1 zwijgen kiest zal zijn uitbetaling 0 zijn. In het slechtste geval dat speler 1 verraden kiest zal zijn uitbetaling 1 zijn. Als men de ‘maxminimization’ regel toepast zal speler 1 dus kiezen voor verraden aangezien hij daarbij zijn minimale uitbetaling ‘maximaliseert’. Kortom, de speler maximaliseert haar uitbetaling in een nogal pessimistische situatie. Een Nederlandse uitdrukking hiervoor is ‘eieren voor je geld kiezen’. Het komt er dus op neer dat in het slechtste geval speler 1 een uitbetaling krijgt van Ui, en in het beste geval een uitbetaling > dan Ui.

In tekens wordt dit uitgelegd door: mix min Ui (ai, ai-1).

Hierbij is Ui (a) de verwachte uitbetaling gegeven dat hij strategie profiel a volgt. Als a*i een ‘maxminimization’ strategie weergeeft dan leidt dit tot de volgende uitbetaling:

Min (a-i) Ui (a*i, ai-1).

Strikt competitieve spellen

In het geval dat er twee spelers zijn en elke speler zijn eigen winst wil maximaliseren en de winst van zijn tegenstander wil minimaliseren kom je zeer dicht in de buurt van een Nash-evenwicht. In dit geval is het spel omgekeerd vijandig. Dit noemen we strikt competitief.

Een strikt competitief spel wordt ook wel een zerosum spel genoemd; in dit geval gaat de extra opbrengst van speler 1 altijd ten koste van de opbrengst van speler 2. Een voorbeeld hiervan is een gebakje door tweeën delen; als de een meer krijgt, krijg de ander per definitie minder.

Een voorbeeld daarvan is het ‘matching pennies’ spel. De uitkomsten zijn precies tegenovergesteld. Een ander voorbeeld behandelen we hier:

 

Z

W

A

2,1

0,5

B

1,3

5,0

Speler 1 prefereert (B, W) boven (A,Z) boven (B,Z) boven (A,W). De preferentie van speler 2 is precies (spiegelend) het omgekeerde. Oftewel een strikt competitief of zerosum spel.

 

Access: 
Public
This content is related to:
Samenvatting Essential Mathematics for Economics and Business (Bradley)
Samenvatting: Essential mathematics for economics Analysis
Check more of this topic?
Work for WorldSupporter

Image

JoHo can really use your help!  Check out the various student jobs here that match your studies, improve your competencies, strengthen your CV and contribute to a more tolerant world

Working for JoHo as a student in Leyden

Parttime werken voor JoHo

Image

Comments, Compliments & Kudos:

Add new contribution

CAPTCHA
This question is for testing whether or not you are a human visitor and to prevent automated spam submissions.
Image CAPTCHA
Enter the characters shown in the image.
Check how to use summaries on WorldSupporter.org


Online access to all summaries, study notes en practice exams

Using and finding summaries, study notes en practice exams on JoHo WorldSupporter

There are several ways to navigate the large amount of summaries, study notes en practice exams on JoHo WorldSupporter.

  1. Starting Pages: for some fields of study and some university curricula editors have created (start) magazines where customised selections of summaries are put together to smoothen navigation. When you have found a magazine of your likings, add that page to your favorites so you can easily go to that starting point directly from your profile during future visits. Below you will find some start magazines per field of study
  2. Use the menu above every page to go to one of the main starting pages
  3. Tags & Taxonomy: gives you insight in the amount of summaries that are tagged by authors on specific subjects. This type of navigation can help find summaries that you could have missed when just using the search tools. Tags are organised per field of study and per study institution. Note: not all content is tagged thoroughly, so when this approach doesn't give the results you were looking for, please check the search tool as back up
  4. Follow authors or (study) organizations: by following individual users, authors and your study organizations you are likely to discover more relevant study materials.
  5. Search tool : 'quick & dirty'- not very elegant but the fastest way to find a specific summary of a book or study assistance with a specific course or subject. The search tool is also available at the bottom of most pages

Do you want to share your summaries with JoHo WorldSupporter and its visitors?

Quicklinks to fields of study (main tags and taxonomy terms)

Field of study

Check related topics:
Activities abroad, studies and working fields
Access level of this page
  • Public
  • WorldSupporters only
  • JoHo members
  • Private
Statistics
2675