Dilemma del prigioniero

Il dilemma del prigioniero, proposto negli Cinquanta da Albert Tucker, è forse il più famoso gioco presso il pubblico non specializzato nella teoria dei giochi.

Ne viene data di seguito una versione romanzata.
A San Vittore vengono imprigionati due noti criminali della mala milanese, Gin e Fizz, d'ora in poi G e F, accusati di aver effettuato una rapina a mano armata al Bar Sport, portandosi via l'amata e indifesa sbrisolona. Non ci sono prove dirette, perché i due indossavano delle maschere, quindi si decide di farli confessare. Ognuno dei due viene chiuso in una cella diversa in modo che non possa comunicare con il complice. A ognuno vengono esposte le regole di questo gioco.

a) potrà confessare, fare la "SPIA", oppure non confessare, "OMERTÀ", l'accaduto.
b) se solo uno dei due "SPIA" l'altro viene condannato a sette anni e lui rilasciato.
c) se entrambi fanno "SPIA" entrambi verranno condannati a sei anni.
d) se entrambi fanno "OMERTÀ" entrambi verranno condannati ad un anno.

Questo gioco puo' essere descritto con la seguente bimatrice

... SPIA OMERTÀ
SPIA (6,6) (0,7)
OMERTÀ (7,0) (1,1)

Facendo il minimax e il maximin si scopre che il punto di equilibrio è, controintuitivamente, (SPIA, SPIA), questo perché lo scopo di G e di F è minimizzare la propria permanenza in carcere, ma non potendo sapere se anche il compare terrà il silenzio la scelta più conveniente è quella di fare la spia. Questa situazione di equilibrio risponde all'"Equilibrio di Nash", uno dei teoremi più importanti della teoria dei giochi, enunciato dal matematico statunitense John Forbes Nash.

Il dilemma del prigioniero ha causato interesse come esempio di gioco in cui l'assioma di razionalità pare apparentemente fallire, prescrivendo un'azione che procura più danno ad entrambi i contendenti della scelta alternativa (OMERTÀ, OMERTÀ). Gli studiosi fanno, pignolescamente, notare che chi la pensa così probabilmente si immagina un gioco, diverso, in cui la vittoria viene valutata sulla somma degli anni di carcere.

Ovvero il gioco:

... SPIA OMERTÀ
SPIA (12) (7)
OMERTÀ (7) (2)

È facile vedere che questo nuovo gioco, semplificando le strategie dominanti, ha come equilibrio (OMERTÀ, OMERTÀ).


Questa seconda formulazione (sommando gli anni di carcere) prevede che il prigioniero debba preferire il danno minore per la coppia... ma non è questo ciò che vuole: lui non è interessato al sistema completo, ma solo ai rischi che corre personalmente.

Riconsideriamo le opzioni che ha ogni prigioniero:

può mettersi in SPIA: rischia 0 o 6 anni
può mettersi in OMERTÀ: rischia 1 o 7 anni

Da questo schema risulta chiaro che nessuno si metterà mai in OMERTÀ di propria spontanea volontà: infatti, qualsiasi cosa dica l'altro prigioniero, da SPIA si assicura un anno di meno. Il problema sta nel fatto che anche l'altro prigioniero, trovandosi nella stessa situazione, farà lo stesso ragionamento e giungerà alla stessa conclusione...

...risultato: avranno 6 anni di carcere a testa!

Al 100%, senza speranza!

A questo punto ci si potrebbe domandare:

"È possibile che non esista nessuna conclusione logica che permetta al prigioniero di sperare di rimanere in prigione un solo anno o addirittura nessuno?"

"È possibile che la logica non giunga a nessun'altra soluzione oltre alla triste accettazione di venire condannati a 6 anni?"


Una possibile soluzione è la seguente, ma richiede un paio di precisazioni (e comunque non è universalmente accettata):

a) Si deve dare per scontato che tutti i personaggi abbiano una capacità logica pressoché perfetta. Questo non vuol dire che debbano essere buoni, altruisti o altro, ma solo che tutti capiscano il gioco allo stesso modo, e non facciano alcun errore;

b) Dato il punto a) è facile capire che tutti prenderanno la stessa decisione. Non può esistere uno che fa il furbo a scapito degli altri, perché questo automaticamente vorrebbe dire che anche gli altri faranno come lui. Solo il lettore "disattento" può pensare di far fare il furbo ad un solo personaggio.

A questo punto appare chiaro che, se uno dei prigionieri capisce che le conclusioni a cui arriva lui sono le stesse a cui arriva l'altro, scegliere l'OMERTÀ è l'unica azione possibile.

Infatti se ci si convince che è impossibile che diano risposte diverse (vedi il punto b), allora il discorso egoista cade. Rimanendo solamente le possibilità Spia-Spia e Omertà-Omertà la scelta è a prova di dubbio.


Paradossalmente se tutti e due tirassero una moneta avrebbero comunque più possibilità di fare poco carcere piuttosto che utilizzare la strategia furba; infatti:

Scelta furba: 100% di prendere 6 anni
Scelta con la moneta: 25% di prendere 7 anni
25% di prendere 6 anni
25% di prendere 1 anno
25% di prendere 0 anni

Nella scelta con la moneta è chiaro che la situazione è migliore per entrambi. Nel 25% dei casi infatti tutto rimane invariato. Ma il restante 75% è diviso nettamente in nostro favore: infatti solo il 25% ci peggiora la pena (e di un solo anno), il restante 50% ci diminuisce la pena (e di molto!).

See also: Dilemma del prigioniero, Anni 1950, Bimatrice, Carcere di San Vittore, Equilibrio di Nash, Gin e Fizz, Gioco, John Forbes Nash, Matematico, Sbrisolona