Main » algoritmisk handel » Prisoner's Dilemma

Prisoner's Dilemma

algoritmisk handel : Prisoner's Dilemma
Hva er fangens dilemma?

Fangens dilemma er et paradoks i beslutningsanalyse der to individer som opptrer i egne egeninteresser ikke gir det optimale resultatet. Den typiske fangens dilemma er satt opp på en slik måte at begge parter velger å beskytte seg på bekostning av den andre deltakeren. Som et resultat er begge deltakerne i en dårligere tilstand enn om de hadde samarbeidet med hverandre i beslutningsprosessen. Fangens dilemma er et av de mest kjente begrepene i moderne spillteori.

Viktige takeaways

  • En fangers dilemma er en situasjon der individuelle beslutningstakere alltid har et insentiv til å velge på en måte som skaper et mindre enn optimalt resultat for individene som gruppe.
  • Fangens dilemmaer forekommer i mange aspekter av økonomien.
  • Mennesker har utviklet mange metoder for å overvinne fangers dilemmaer for å velge bedre kollektive resultater til tross for tilsynelatende ugunstige individuelle insentiver.
01:46

Prisoner's Dilemma

Forstå fangens dilemma

Fangens dilemma presenterer en situasjon der to parter, atskilt og ute av stand til å kommunisere, hver må velge mellom å samarbeide med den andre eller ikke. Den høyeste belønningen for hvert parti oppstår når begge parter velger å samarbeide.

Det klassiske fangens dilemma går slik: to medlemmer av en gjeng med bankranere, Dave og Henry, er blitt arrestert og blir avhørt i separate rom. Myndighetene har ingen andre vitner, og kan bare bevise saken mot dem hvis de kan overbevise minst en av ranerne til å forråde hans medskyldige og vitne om forbrytelsen. Hver bankraner blir møtt med valget om å samarbeide med sin medskyldige og være stille eller å avverge fra gjengen og vitne for påtalemyndigheten. Hvis de begge samarbeider og forblir tause, vil myndighetene bare kunne dømme dem på en mindre siktelse for plyndring, noe som vil bety ett års fengsel hver (1 år for Dave + 1 år for Henry = 2 års fengsel tid). Hvis den ene vitner og den andre ikke, vil den som vitner gå fri og den andre får tre år (0 år for den som mangler + 3 for den som er dømt = 3 år totalt). Imidlertid, hvis begge vitner mot den andre, vil begge få to års fengsel for å ha delvis ansvarlig for ranet (2 år for Dave + 2 år for Henry = 4 års total fengselstid).

I dette tilfellet har hver røver alltid et insentiv til mangel, uavhengig av hvilket valg den andre gjør. Fra Dave synspunkt, hvis Henry forholder seg taus, kan Dave enten samarbeide med Henry og gjøre et år i fengsel, eller mangel og gå fri. Det er klart han ville være bedre med å forråde Henry og resten av gjengen i dette tilfellet. På den annen side, hvis Henry defekterer og vitner mot Dave, blir Daves valg enten å tie og gjøre tre år eller å snakke og gjøre to år i fengsel. Igjen, tydeligvis, foretrekker han å gjøre de to årene over tre.

I begge tilfeller, enten Henry samarbeider med Dave eller mangler påtalemyndigheten, vil Dave ha det bedre hvis han selv mangler og vitner. Siden Henry står overfor det samme settet med valg, vil han også alltid ha det bedre å avverge. Paradokset med fangens dilemma er dette: begge ranerne kan minimere den totale fengselstiden som de to vil gjøre bare hvis de begge samarbeider (2 år totalt), men insentivene som de hver for seg møter hver for seg vil alltid drive dem hver å avverge og ende opp med å gjøre maksimal fengslingstid mellom de to (totalt 4 år).

Eksempler på fangens dilemma

Økonomien er fylt med eksempler på fangers dilemmaer med kan ha utfall som enten er gunstig eller skadelig for økonomien og samfunnet som helhet. Den vanlige tråden er situasjoner der insentivene som hver enkelt beslutningstaker står overfor, og som får velge, ville få dem til å oppføre seg på en måte som gjør dem alle samlet dårligere, mens de individuelt unngår valg som vil gjøre dem alle samlet bedre hvis alle kunne noen på en eller annen måte samarbeidsvillig.

Et slikt eksempel er tragedien til allmenningene. Det kan være i alles kollektive fordel å bevare og reinvestere i forplantningen av en felles basseng-naturressurs for å kunne fortsette å konsumere den, men hver enkelt har alltid et insentiv til i stedet å konsumere så mye som mulig så raskt som mulig, som deretter uttømmer ressursen. Å finne en måte å samarbeide på ville klart gjøre alle bedre her.

På den annen side kan atferden til karteller også betraktes som en fanges dilemma. Alle medlemmer av et kartell kan kollektivt berike seg ved å begrense produksjonen for å holde prisen som hver mottar høy nok til å fange økonomiske leier fra forbrukerne, men hvert kartellmedlem har individuelt et insentiv til å jukse på kartellet og øke produksjonen til også å fange husleier vekk fra de andre kartellmedlemmene. Når det gjelder velferden i det samlede samfunnet som kartellet opererer i, er dette et eksempel på hvordan en fanges dilemma som bryter ned kartellet noen ganger faktisk kan gjøre samfunnet bedre av som helhet.

Flykte fra fangens dilemma

Over tid har folk arbeidet ut en rekke løsninger på fangers dilemmaer for å få bukt med individuelle insentiver til fordel for allmennheten.

For det første gjentas de fleste økonomiske og andre menneskelige interaksjoner i den virkelige verden mer enn en gang. Et ekte fanges dilemma spilles vanligvis bare en gang ellers klassifiseres det som et iterert fanges dilemma. I et iterert fangers dilemma kan spillerne velge strategier som belønner samarbeid eller straffer avhending over tid. Ved gjentatte ganger å samhandle med de samme individene kan vi til og med bevisst gå fra en engangs fange-dilemma til en gjentatt fanges dilemma.

For det andre har mennesker utviklet formelle institusjonelle strategier for å endre insentivene som individuelle beslutningstakere står overfor. Kollektiv handling for å håndheve kooperativ atferd gjennom omdømme, regler, lover, demokratisk eller annen kollektiv beslutningstaking, og eksplisitt sosial avstraffelse for bråk forvandler mange fangers dilemmaer mot de mer kollektivt fordelaktige samarbeidsresultatene.

Til slutt har noen mennesker og grupper av mennesker utviklet psykologiske og atferdsmessige skjevheter over tid, for eksempel høyere tillit til hverandre, langsiktig fremtidig orientering i gjentatte samhandlinger, og tilbøyeligheter til positiv gjensidighet av samarbeidsoppførsel eller negativ gjensidighet ved å avverge atferd. Disse tendensene kan utvikle seg gjennom et slags naturlig utvalg i et samfunn over tid, eller gruppevalg på tvers av konkurrerende samfunn. Faktisk leder de grupper av individer til å "irrasjonelt" velge utfall som faktisk er det mest fordelaktige for dem alle sammen.

Disse tre faktorene (gjentatte fangers dilemmaer, formelle institusjoner som bryter fangens dilemmaer og atferdsfordeling som undergraver “rasjonelle” individuelle valg i fangers dilemmaer) bidrar til å løse de mange fangens dilemmaer vi ellers alle vil møte.

Sammenlign Navn på leverandør av investeringskontoer Beskrivelse Annonsørens avsløring × Tilbudene som vises i denne tabellen er fra partnerskap som Investopedia mottar kompensasjon fra.

Relaterte vilkår

Iterated Prisoner's Dilemma Definisjon Iterated Prisoners dilemma spilles gjentatte ganger av de samme deltakerne, og hjelper spillere å lære om atferdstendensene til sin motpart. mer Hvordan Game Theory Works Spillteori er et rammeverk for modellering av scenarier der interessekonflikter eksisterer blant spillerne. mer Tit for Tat Definisjon Tit for tat er en spillteori-strategi der en spiller velger handlingen som motstanderens spiller valgte i forrige spillerunde. mer Nash Equilibrium Nash Equilibrium er et konsept innen spillteori der det optimale resultatet av et spill er der det ikke er noe insentiv til å avvike fra deres opprinnelige strategi. mer Definisjon av dollarauksjon En dollarauksjon er et sekvensielt spill uten null-sum der høyestbydende mottar en dollar og taperen må betale beløpet de også byr. mer Oligopol Definisjon Oligopol er en markedsstruktur med et lite antall firmaer, hvorav ingen kan hindre de andre i å ha betydelig innflytelse. mer Partnerkoblinger
Anbefalt
Legg Igjen Din Kommentar