Mis on vangide dilemma?

Mängus endas esindab karistusi (ja vajadusel preemiaid) utiliit numbrid. Positiivsed numbrid tähistavad häid tulemusi, negatiivsed numbrid tähistavad halbu tulemusi ja üks tulemus on parem kui teine, kui sellega seotud arv on suurem. (Olge siiski ettevaatlik, kuidas see töötab negatiivsete arvude korral, kuna näiteks -5 on suurem kui -20!)

Ülaltoodud tabelis viitab iga kasti esimene number mängija 1 tulemusele ja teine number mängija 2 tulemusele. Need numbrid tähistavad vaid ühte paljudest numbrikomplektidest, mis on kooskõlas vangide dilemma seadistusega.

Kui mäng on määratletud, on mängu analüüsimisel järgmine samm hinnata mängijate strateegiaid ja proovida mõista, kuidas mängijad tõenäoliselt käituvad. Majandusteadlased teevad mängude analüüsimisel mõned eeldused - esiteks eeldavad nad, et mõlemad mängijad on sellest teadlikud väljamaksed nii endale kui ka teisele mängijale ning teiseks eeldavad nad, et mõlemad mängijad otsivad kuni ratsionaalselt maksimeerida oma mängu väljamakseid.

instagram viewer

Üks lihtne esialgne lähenemisviis on otsida nn domineerivad strateegiad- strateegiad, mis on parimad sõltumata sellest, millise strateegia teine mängija valib. Ülaltoodud näites on ülestunnistuse valimine mõlema mängija jaoks domineeriv strateegia:

Arvestades, et ülestunnistamine on mõlemale mängijale parim, pole üllatav, et tulemus, kus mõlemad mängijad tunnistavad, on mängu tasakaalutu tulemus. Sellegipoolest on oluline olla meie määratlusega pisut täpsem.

Mõiste a Nashi tasakaal kodifitseeris matemaatik ja mänguteoreetik John Nash. Lihtsustatult öeldes on Nashi tasakaal parimate reageerimisstrateegiate kogum. Kahe mängijaga mängu puhul on Nashi tasakaal tulemus, kus mängija 2 strateegia on parim vastus mängija 1 strateegiale ja mängija 1 strateegia on parim vastus mängija 2 strateegiale.

Neassi tasakaalu leidmist selle põhimõtte abil saab illustreerida tulemuste tabelis. Selles näites on mängija 2 parimad vastused mängijale ringis roheline. Kui mängija 1 tunnistab üles, on mängija 2 parim vastus tunnistada, kuna -6 on parem kui -10. Kui mängija 1 ei tunnista ülestunnistust, on mängija 2 parim vastus tunnistada, kuna 0 on parem kui -1. (Pange tähele, et see arutluskäik sarnaneb väga domineerivate strateegiate tuvastamiseks kasutatud põhjendustega.)

1. mängija parimad vastused on sinised. Kui mängija 2 tunnistab ülestunnistust, on mängija 1 parim vastus tunnistada, kuna -6 on parem kui -10. Kui mängija 2 ei tunnista ülestunnistust, on mängija 1 parim vastus tunnistada, kuna 0 on parem kui -1.

Nashi tasakaal on tulemus, kus on olemas nii roheline kui ka sinine ring, kuna see kujutab mõlema mängija jaoks parimat reageerimisstrateegiat. Üldiselt on võimalik mitut Nessi tasakaalu või üldse mitte ühtegi (vähemalt siin kirjeldatud puhaste strateegiate korral).

Võib-olla olete märganud, et selle näite Nassi tasakaal näib olevat teatud viisil optimaalne (eriti kuna see pole Pareto jaoks optimaalne), kuna mõlemal mängijal on võimalik saada -1 mitte -6. See on mängus esineva interaktsiooni loomulik tulemus - teoorias ei oleks ülestunnistamine vajalik grupi jaoks optimaalne strateegia, kuid individuaalsed stiimulid takistavad selle tulemuse saavutamist saavutatud. Näiteks kui mängija 1 arvas, et mängija 2 jääb vait, siis oleks tal stiimul teda pigem vaikselt rännata ja vastupidi.

Sel põhjusel võib Nashi tasakaalu pidada ka tulemuseks, kus ühelgi mängijal pole stiimulit ühepoolselt (s.o iseenesest) kalduda kõrvale strateegiast, mis selle tulemuseni viis. Ülaltoodud näites, kui mängijad on otsustanud tunnistada, ei saa kumbki mängija paremini teha, kui ta ise meelt muudab.