Equilibri de nash. Teoria de jocs per a economistes (John Nash)

Als anys trenta, John von Neumann i Oscar Morgenstern es van convertir en els fundadors d'una nova àrea interessant de matemàtiques, que es va anomenar "teoria de jocs". A la dècada de 1950, el jove matemàtic John Nash es va interessar per aquesta àrea. La teoria de l'equilibri es va convertir en el tema de la seva dissertació, que va escriure quan tenia 21 anys. Així va néixer una nova estratègia per als jocs anomenada Nash Equilibrium, que va obtenir el premi Nobel molts anys després, el 1994.

La llarga bretxa entre escriure una tesi i l’acceptació universal era una prova per al matemàtic. Genius sense reconeixement va provocar greus violacions mentals, però John Nash va poder resoldre aquest problema gràcies a la seva excel·lent ment lògica. La seva teoria del "equilibri Nash" va ser guardonada amb el premi Nobel i la seva adaptació cinematogràfica a la pel·lícula "Beautiful mind" ("Jocs de la ment").

Teoria del joc breument

Atès que la teoria de l'equilibri Nash explica el comportament de les persones en termes d'interacció, val la pena considerar els conceptes bàsics de la teoria del joc.

La teoria de jocs estudia el comportament dels participants (agents) en condicions d’interacció amb els altres segons el tipus de joc, quan el resultat depèn de la decisió i el comportament de diverses persones. El participant pren decisions, guiat per les seves previsions sobre el comportament dels altres, que s’anomena estratègia de joc.

També hi ha una estratègia dominant en la qual el participant obté el resultat òptim per a qualsevol comportament d'altres participants. Aquesta és la millor estratègia de guanyar-guanyar del jugador.

Dilema del presoner i avenç científic

El dilema del pres és un cas amb un joc quan els participants es veuen obligats a prendre decisions racionals, arribant a un objectiu comú en el context d’un conflicte d’alternatives. La pregunta és quina d’aquestes opcions triarà, reconeixent el seu interès personal i comú, així com la incapacitat d’obtenir totes dues. Els jugadors semblen estar tancats en dures condicions de joc, fet que de vegades els fa pensar molt productivament.

Aquest dilema va ser explorat pel matemàtic nord-americà John Nash. L’equilibri que va treure es va convertir en aquest tipus de revolucionaris. De manera particularment vivencial, aquest nou pensament va influir en l’opinió dels economistes sobre com els agents del mercat prenen decisions, tenint en compte els interessos dels altres, amb una estreta interacció i una intersecció d’interessos.

El millor és estudiar la teoria del joc amb exemples concrets, ja que aquesta mateixa disciplina matemàtica no és una teòrica seca.

Exemple de dilema del pres

Per exemple, dues persones van robar, van caure a les mans de la policia i se’ls interroga en cel·les separades. Al mateix temps, els agents de policia ofereixen a cada participant condicions favorables en què serà alliberat si testifica contra la seva parella. Cadascun dels delinqüents té la següent estratègia que tindrà en compte:

Ambdós testifiquen simultàniament i reben 2, 5 anys de presó.
Tots dos callen al mateix temps i reben un any cadascun, ja que en aquest cas la base de proves de la seva culpabilitat serà petita.
Un dóna proves i obté llibertat, mentre que l’altre calla i té 5 anys de presó.

Thebviament, el resultat del cas depèn de la decisió dels dos participants, però no poden arribar a un acord perquè estan asseguts a diferents cèl·lules. El conflicte dels seus interessos personals en la lluita per un interès comú també és clarament visible. Cada pres té dues opcions d’acció i 4 d’opcions de resultats.

Cadena d’inferència

Per tant, el criminal A té en compte les opcions següents:

Em quedo en silenci i la meva parella queda en silenci: tots dos rebran 1 any de presó.
Li dono a la meva parella i ell em dóna, tots dos portem 2, 5 anys de presó.
Estic en silenci, i la meva parella em lliura: rebré 5 anys de presó i serà lliure.
Llogo la meva parella i ell calla: tinc llibertat i té 5 anys de presó.

Donem una matriu de possibles solucions i resultats per a la claredat.

La taula de resultats probables del dilema del pres.

La pregunta és què triarà cada participant?

"Silenci, no es pot parlar" o "Silenci no es pot parlar"

Per entendre l’elecció del participant, heu de passar per la cadena dels seus pensaments. Seguint el raonament del criminal A: si callo i callo la meva parella, obtindrem un termini mínim (1 any), però no puc saber com es comportarà. Si ell testifica contra mi, aleshores també és millor que ho testifiqui, si no, em puc asseure 5 anys. Prefereixo seure 2, 5 anys que cinc anys. Si no diu res, aleshores més necessito testificar, perquè així aconseguiré la llibertat. El membre B també argumenta de la mateixa manera.

És fàcil entendre que l’estratègia dominant per a cadascun dels delinqüents és testificar. El punt òptim d’aquest joc es produeix quan els dos delinqüents donen proves i reben el seu “premi”: 2, 5 anys de presó. La teoria de jocs de Nash l’anomena equilibri.

Nash Optimal Solució òptima

La revolució de la visió de Nashev és que aquest equilibri no és òptim si tenim en compte el participant individual i el seu interès personal. Al cap i a la fi, la millor opció és guardar silenci i alliberar-se.

L’equilibri Nash és un punt de contacte, on cada participant tria una opció que és òptima per a ell només si els altres participants trien una estratègia específica.

Tenint en compte l’opció quan els dos delinqüents callen i reben només un any cadascun, podem anomenar-la l’opció Pareto-òptima. Tanmateix, només és possible si els delinqüents podrien haver acordat amb antelació. Però fins i tot això no garantiria aquest resultat, ja que la temptació de revertir la persuasió i evitar el càstig és gran. La manca de plena confiança l’un en l’altre i el perill de tenir 5 anys obliga a triar l’opció amb reconeixement. Reflexionar sobre el fet que els participants s’adhereixen a l’opció amb silenci, actuant en concert, és simplement irracional. Aquesta conclusió es pot fer si estudiem l'equilibri de Nash. Exemples només ho demostren.

Egoista o racional

La teoria de l'equilibri Nash ha donat conclusions impressionants, refutant els principis existents abans. Per exemple, Adam Smith va considerar el comportament de cadascun dels participants com absolutament egoista, cosa que va posar en equilibri el sistema. Aquesta teoria es va anomenar la "mà invisible del mercat".

John Nash va veure que si tots els participants actuen seguint els seus propis interessos, això no conduirà mai a un resultat òptim del grup. Tenint en compte que el pensament racional és inherent a cada participant, és més probable l’elecció que ofereix l’estratègia d’equilibri Nash.

Experiment purament masculí

Un exemple viu és el joc de "paradoxa rossa" que, tot i que sembla inapropiat, és una il·lustració viva que mostra el funcionament de la teoria de jocs de Nash.

En aquest joc heu d’imaginar que la companyia de nois lliures venia al bar. A continuació hi ha una companyia de noies, una de les quals és preferible a les altres, diguem-ne una rossa. Com es comporten els nois per aconseguir la millor núvia per ells mateixos?

Per tant, el raonament dels nois: si tothom comença a conèixer-se amb la rossa, el més probable és que no arribi a ningú, els seus amics no voldran conèixer-se. Ningú vol ser el segon fallback. Però si els nois opten per evitar la rossa, és probable que cadascun dels nois trobi una bona núvia entre les noies.

La situació d’equilibri Nash no és òptima per als nois, ja que, perseguint només els seus interessos egoistes, tothom triaria una rossa. És evident que la recerca de només interessos egoistes equivalen al col·lapse dels interessos del grup. L’equilibri Nash significa que cada noi actua en els seus propis interessos personals, que estan en contacte amb els interessos de tot el grup. Aquesta no és una opció òptima per a tothom personalment, sinó òptima per a tothom, basada en l’estratègia d’èxit global.

Tota la nostra vida és un joc

La presa de decisions en condicions reals és molt similar a un joc quan espereu un cert comportament racional dels altres participants. En el negoci, en el treball, en equip, en una empresa i fins i tot en relacions amb el sexe oposat. Des de grans transaccions fins a situacions habituals de la vida, tot obeeix a una llei o a una altra.

Per descomptat, les situacions de joc considerades amb els delinqüents i el bar són només una excel·lent il·lustració que demostra l'equilibri de Nash. Exemples d’aquest tipus de dilemes sovint es presenten al mercat real, i això funciona especialment en casos amb dos monopolistes que controlen el mercat.

Estratègies mixtes

Sovint no participem en un, sinó en diversos jocs alhora. L'elecció d'una de les opcions per a un joc, guiada per una estratègia racional, però entra en un altre joc. Després de diverses decisions racionals, és possible que trobareu que el resultat no us convé. Què fer?

Considereu dos tipus d’estratègia:

Una estratègia pura és el comportament d’un participant que ve de pensar en el possible comportament d’altres participants.
Una estratègia mixta o una estratègia aleatòria és l’alternança d’estratègies pures a l’atzar o l’elecció d’una estratègia pura amb una certa probabilitat. Aquesta estratègia també s’anomena aleatòria.

Tenint en compte aquest comportament, obtenim una nova mirada sobre l'equilibri de Nash. Si abans es deia que el jugador tria una estratègia una vegada, es pot imaginar un altre comportament. Podem admetre l’opció que els jugadors trien una estratègia aleatòriament amb una certa probabilitat. Els jocs en què no es pot trobar l’equilibri Nash en estratègies pures sempre els tenen en mixtes.

L’equilibri nash en estratègies mixtes s’anomena equilibri mixt. Aquest és un balanç, on cada participant tria la freqüència òptima per triar les seves estratègies, sempre que altres participants triïn les seves estratègies amb una freqüència determinada.