Fångens dilemma

Från Wikipedia
Hoppa till: navigering, sök
Prison.jpg

Fångarnas dilemma är ett känt exempel inom spelteori, där det tillhör kategorin icke-nollsummespel. Den matematiska versionen av spelet skapades ursprungligen av Merrill Flood och Melvin Dresher när de arbetade vid den amerikanska tankesmedjan RAND Corporation på 1950-talet. Det var dock matematikern Albert W. Tucker som gav spelet dess namn och som hittade på exemplet med fångarna när han ville formulera en mer populär och lättförståelig version av Flood och Dreshers resultat.

Det klassiska exemplet[redigera | redigera wikitext]

Det klassiska exemplet lyder enligt följande. Två fångar, A och B, ställs inför två val: om en vittnar mot den andre och den andre håller tyst, går den som vittnade fri och den som inte gjorde det hamnar i fängelse i 10 år. Om båda håller tyst hamnar båda i fängelse i 6 månader. Om båda vittnar mot varandra får båda 2 års fängelsevistelse var. Båda fångarna måste göra ett val, men vet inte vad den andre kommer att välja. Vad kommer att hända?

Valen i Fångarnas dilemma ser ut som följer:

  A håller tyst A vittnar
B håller tyst Båda får 6 mån. A friges, B får 10 år
B vittnar B friges, A får 10 år Båda får 2 år

Dilemmat uppstår, när det antas att båda fångarna bara bryr sig om att minimera sin egen tid i fängelse. Varje fånge har två val: att samarbeta med sin kumpan och vara tyst, eller att förråda sin kumpan och ge bevis. Valets resultat beror på kumpanens val, däremot känner den ene fången inte till den andre fångens val.

Om man antar att var och en ser till sitt eget bästa, är det bästa valet att förråda både om den andre är tyst och om den andre också förråder. Båda dessa minimerar straffsatsen.

Om man istället resonerar efter gruppens optimala resultat, är båda fångarnas bästa val att samarbeta, eftersom detta skulle minimera den totala tiden i fängelse. Alla andra resultat skulle försämra det sammanlagda resultatet.

Modern variant[redigera | redigera wikitext]

Siffrorna anger relativa tidsvinster
Andras val
Buss Bil
Ditt val Buss 0, 0*n -100, -90*n
Bil +10, 0*n -90, -90*n

En modern variant av fångarnas dilemma (med många deltagare) är en uppställning, där målet är att ta sig så snabbt som möjligt till jobbet och man har valet att antingen ta bilen eller bussen. Det går alltid snabbare för individen att ta bilen än att ta bussen, men om många tar bilen, så uppstår köer, vilket även drabbar bussarna. Detta resulterar i att alla tar bilen, och den genomsnittliga restiden blir längre än om de flesta tog bussen. Dessutom finns det ingen anledning att ta bussen om alla andra tar bilen: då drabbas man dubbelt. [1]

Upprepat spel[redigera | redigera wikitext]

Vid upprepat spel förändras spelets dynamik markant. Det går då att tala om "metastrategier", där spelarna väljer allmänna principer för att välja strategier, till exempel att alltid samarbeta, eller att samarbeta varannan gång. Den amerikanske statsvetaren Robert Axelrod anordnade i början av 1980-talet en datorspelsturnering med Fångarnas Dilemma, där deltagarna fick skicka in bidrag i form av metastrategier. Det visade sig att den metastrategi, som klarade sig bäst, var "Tit for Tat", som innebär att spelaren börjar med att samarbeta, och sedan upprepar det drag som motspelaren gjorde i föregående spelomgång. På så sätt kommer spelare som inte samarbetar att själva bli bestraffade, men kan bli förlåtna om de återgår till att samarbeta.

Senare forskning har i huvudsak bekräftat och utvecklat Axelrods resultat. Bland annat har man funnit, att rykte spelar en viktig roll då spelarna spelar spelet upprepade gånger, men hela tiden möter nya motspelare: om motspelarna får kunskap om spelarens tidigare strategi kan de bättre upptäcka om spelaren försöker lura dem.

Ett exempel från verkliga livet kan vara auktionssajter på Internet. Om en person vill sälja en vara till en annan person för pengar, hamnar de i ett Fångarnas Dilemma och inget köp blir av om de handlar rationellt: det ligger i säljarens intresse att inte skicka varan, och det ligger i köparens intresse att inte skicka några pengar, i synnerhet om ingen av dem med säkerhet kan identifieras då deras identitet döljs av användarnamn. Men eftersom tidigare bytespartners kan lägga upp rapporter på nätet om hur personerna har agerat vid tidigare transaktioner får båda parterna kunskap om hur motparten har agerat tidigare, och de blir måna om att framstå i en positiv dager och samarbeta, om de har tänkt sig att handla med andra i framtiden. Deras rykte föregår dem, och för att bevara sitt rykte kommer de att samarbeta.

Se även[redigera | redigera wikitext]

Referenser[redigera | redigera wikitext]

  1. ^ Pihl, Håkan (2007) Miljöekonomi för en hållbar utveckling. SNS

Vidare läsning[redigera | redigera wikitext]

Robert Axelrod: The Evolution of Cooperation, New York 1984.

Hermansson, Spelteorins nytta: Om rationalitet i vetenskap och politik, Uppsala 1990.

Tersman, Folke: Fem filosofiska frågor, W & W 2001.