Què és el dilema del viatger?
El dilema del viatger, en teoria de jocs, és un joc de suma zero que en el qual dos jugadors intenten maximitzar la seva recompensa, sense tenir en compte l’altre. El joc demostra la "paradoxa de la racionalitat": la ironia que la presa de decisions de forma il·lògica o ingènua sovint produeix un millor benefici en la teoria dels jocs.
Punts clau
- El dilema del viatger és un joc en què dos jugadors cadascun fan una recompensa proposada i tots dos reben l’oferta inferior, més o menys una bonificació. Segons la teoria del joc, l'estratègia racional per als dos jugadors és triar el mínim resultat possible. Això dóna lloc a que ambdós jugadors reben bonificacions inferiors a les que podrien assolir seguint una estratègia irracional. En estudis experimentals, la gent va triar consistents guanys més elevats i va obtenir millors resultats que l'estratègia racional prevista per la teoria dels jocs.
Comprensió del dilema del viatger
El joc de dilema del viatger, formulat el 1994 per l’economista Kaushik Basu, presenta un escenari en què una companyia aèria perjudica greument antiguitats comprades per dos viatgers diferents. El gestor de la companyia aèria està disposat a compensar-los per la pèrdua de les antiguitats, però com que no en té ni idea del seu valor, diu als dos viatgers que anotin per separat la seva estimació del valor com qualsevol nombre entre 2 i 100 dòlars sense haver-ne de confiar. un altre.
Tot i això, hi ha un parell de advertències:
- Si els dos viatgers anoten el mateix número, reemborsarà a cadascun d'ells aquest import. Si escriuen nombres diferents, el gestor assumirà que el preu més baix és el valor real i que la persona amb un nombre més gran està fent trampes. Si bé pagarà la xifra inferior a tots dos, la persona amb un nombre inferior obtindrà una bonificació de 2 dòlars per honestedat, mentre que el que hagi escrit el nombre superior obtindrà una penalització de 2 dòlars.
L’elecció racional, en termes de l’equilibri Nash, és de 2 dòlars. El raonament va de la següent manera. El primer impuls del viatger A pot ser anotar 100 dòlars. si el viatger B també anota 100 dòlars, aquest és l’import que tots dos rebran del gestor de la companyia aèria. Però, segons el segon pensament, el viatger A raona que si escriu 99 dòlars i B rebi 100 dòlars, A obtindria 101 dòlars (bonificació de 99 $ + 2 dòlars). Però A creu que aquesta idea de pensament també passarà a B i, si B també rebaixa 99 dòlars, tots dos rebrien 99 dòlars. De manera que A seria millor posar-hi 98 dòlars i rebre 100 dòlars (bonificació de $ 98 + 2 dòlars) si B escrigui 99 dòlars. Però, atès que aquest mateix pensament d’escriure 98 dòlars es podria produir a B, A considera que es rebaixava 97 dòlars, etc. Aquesta línia d'inducció endarrerida permetrà als viatgers fins arribar al nombre mínim permès, que és de 2 dòlars.
La gent tria realment l'equilibri de Nash?
En estudis experimentals, contràriament a les prediccions de la teoria de jocs, la majoria de persones trien 100 dòlars o un número proper, ja sigui sense pensar el problema o bé conscienciant plenament que es desvien de l’elecció racional. Així, mentre que la majoria de les persones intueixen intuïtivament que seleccionarien un nombre molt superior a 2 dòlars, aquesta intuïció sembla contradir el resultat lògic previst per la teoria de jocs, que cada viatger seleccionaria 2 dòlars. En rebutjar l’elecció lògica i actuar de manera il·lògica escrivint un nombre més elevat, les persones acaben obtenint un benefici substancialment més gran.
Aquests resultats coincideixen amb estudis similars amb altres jocs com el joc del Prisoner Dilemma i el Public Goods, on els subjectes experimentals no solen triar l'equilibri Nash. A partir d’aquests estudis, els investigadors han proposat que les persones semblin tenir una actitud natural i positiva a favor de la cooperació. Aquesta actitud condueix a uns equilibris de cooperació que ofereixen majors beneficis a tots els jugadors en jocs únics o repetits i es pot explicar mitjançant pressions evolutives selectives que afavoreixen aquest tipus d’estratègies aparentment irracionals però beneficioses.
Tot i això, els estudis sobre el dilema del viatger també han demostrat que quan la penalització / bonificació és més gran o quan els jugadors es componen d’equips de diverses persones que prenen una decisió comuna, els jugadors més sovint opten per seguir l’estratègia racional que condueix a l’equilibri Nash. Aquests efectes també interaccionen, ja que els equips de jugadors no només trien l'estratègia més racional, sinó que tenen una resposta encara més gran a la mida de la penalització / bonus que els jugadors individuals. Aquests estudis suggereixen que estratègies evolucionades que tendeixen a crear resultats socials beneficiosos es poden compensar amb estratègies més racionals que tendeixen a l'equilibri Nash, segons l'estructura dels incentius i la presència de divisions socials.
