Main » virksomhet » Bakoverinduksjon

Bakoverinduksjon

virksomhet : Bakoverinduksjon
Hva er bakoverinduksjon?

Bakover induksjon i spillteori er en iterativ prosess med å resonnere bakover i tid, fra slutten av et problem eller en situasjon, for å løse begrenset omfattende form og sekvensielle spill, og utlede en sekvens av optimale handlinger.

Bakoverinduksjon forklart

Bakoverinduksjon har blitt brukt for å løse spill siden John von Neumann og Oskar Morgenstern etablerte spillteori som et akademisk emne da de i 1944 publiserte boken sin, Theory of Games and Economic Behaviour .

På hvert trinn i spillet bestemmer induksjon bakover den optimale strategien til spilleren som gjør det siste trekket i spillet. Deretter bestemmes den optimale handlingen fra den neste til siste spilleren som beveger seg, og tar den siste spillerens handling som gitt. Denne prosessen fortsetter bakover til den beste handlingen for hvert tidspunkt er bestemt. Effektivt bestemmer man Nash-likevekten for hvert underspill i det originale spillet.

Resultatene som trekkes ut av tilbaketrekning, klarer imidlertid ikke å forutsi faktisk menneskelig lek. Eksperimentelle studier har vist at "rasjonell" atferd (som forutsagt av spillteori) sjelden vises i det virkelige liv. Irrasjonelle spillere kan faktisk ende opp med å oppnå høyere utbetaling enn spådd av tilbaketaking, som illustrert i tusenbeins-spillet.

I tusenbeinsspillet får to spillere vekselvis en sjanse til å ta en større andel av en økende pott med penger, eller til å gi potten videre til den andre spilleren. Utbetalingen er ordnet slik at hvis potten blir gitt til ens motstander og motstanderen tar potten på neste runde, får man litt mindre enn om man hadde tatt potten på denne runden. Spillet avsluttes så snart en spiller tar stash, med at spilleren får den større delen og den andre spilleren får den mindre delen.

Eksempel på bakoverinduksjon

For eksempel antar at spiller A går først og må bestemme seg for om han skal “ta” eller “passere” stashen, som for tiden utgjør $ 2. Hvis han tar, får A og B $ 1 hver, men hvis A passerer, må avgjørelsen om å ta eller passere nå tas av spiller B. Hvis B tar, får hun $ 3 (dvs. forrige stash på $ 2 + $ 1) og A får $ 0. Men hvis B passerer, får A nå bestemme seg for å ta eller bestå, og så videre. Hvis begge spillerne alltid velger å passere, mottar de hver en utbetaling på $ 100 på slutten av spillet.

Poenget med spillet er at A og B begge samarbeider og fortsetter å passere til slutten av spillet, de får den maksimale utbetalingen på $ 100 hver. Men hvis de mistroer den andre spilleren og forventer at de skal "ta" ved første mulighet, spår Nash-likevekten at spillerne vil ta lavest mulig krav ($ 1 i dette tilfellet).

Nash-likevekten i dette spillet, der ingen spillere har et insentiv til å avvike fra sin valgte strategi etter å ha vurdert en motstanders valg, antyder at den første spilleren vil ta potten på den aller første runden av spillet. Imidlertid, i virkeligheten, gjør relativt få spillere det. Som et resultat får de en høyere utbetaling enn utbetalingen spådd av likevektsanalysen.

Løs rekkefølgende spill ved hjelp av bakoverinduksjon

Nedenfor er et enkelt sekvensielt spill mellom to spillere. Etikettene med Player 1 og Player 2 i dem er informasjonssettene for henholdsvis en eller to spillere. Tallene i parentesene nederst på treet er utbetalingen på hvert respektive punkt. Spillet er også sekvensielt, så spiller 1 tar den første avgjørelsen (venstre eller høyre) og spiller 2 tar sin beslutning etter spiller 1 (opp eller ned).

Figur 1

Bakover induksjon, som all spillteori, bruker forutsetningene om rasjonalitet og maksimalisering, noe som betyr at spiller 2 vil maksimere gevinsten sin i en gitt situasjon. Ved begge informasjonssettene har vi to valg, fire i alt. Ved å eliminere valgene som spiller 2 ikke vil velge, kan vi begrense treet vårt. På denne måten vil vi fede linjene som maksimerer spillerens utbetaling ved det gitte informasjonssettet.

Figur 2

Etter denne reduksjonen kan Player 1 maksimere utbetalingen nå som Player 2s valg blir gjort kjent. Resultatet er en likevekt funnet ved tilbaketrekking av spiller 1 som velger "riktig" og spiller 2 velger "opp." Nedenfor er løsningen på spillet med likevektsveien med fet skrift.

Figur 3

For eksempel kunne man enkelt sette opp et spill som ligner det ovenfor ved å bruke selskaper som spillere. Dette spillet kan omfatte produktutgivelsesscenarier. Hvis Company 1 ønsket å gi ut et produkt, hva kan Company 2 gjøre som svar "> prognoser salg av dette nye produktet i forskjellige scenarier, kan vi sette opp et spill for å forutsi hvordan hendelser kan utfolde seg. Nedenfor er et eksempel på hvordan man kan modellere et slikt spill.

Figur 4

Sammenlign Navn på leverandør av investeringskontoer Beskrivelse Annonsørens avsløring × Tilbudene som vises i denne tabellen er fra partnerskap som Investopedia mottar kompensasjon fra.

Relaterte vilkår

Centipede Game Definition Centipede-spillet i spillteorien innebærer at to spillere vekselvis får en sjanse til å ta større andel av en økende pengestash. mer Hvordan Game Theory Works Spillteori er et rammeverk for modellering av scenarier der interessekonflikter eksisterer blant spillerne. mer Zero-Sum Game En situasjon der en persons gevinst tilsvarer en annens tap, slik at netto endring i formue eller fordel er null. Et nullsumspill kan ha så få som to spillere, eller millioner av deltakere. mer Nash Equilibrium Nash Equilibrium er et konsept innen spillteori der det optimale resultatet av et spill er der det ikke er noe insentiv til å avvike fra deres opprinnelige strategi. mer Reisendes dilemma Definisjon Reisendes dilemma demonstrerer rasjonalitetens paradoks - at å ta beslutninger ulogisk ofte gir en bedre gevinst i spillteorien. mer Matching Pennies Definition Matching pennies er et grunnleggende eksempel på spillteori som demonstrerer hvordan rasjonelle beslutningstakere søker å maksimere gevinsten. mer Partnerkoblinger
Anbefalt
Legg Igjen Din Kommentar