Indietro

ⓘ Dilemma del prigioniero




Dilemma del prigioniero
                                     

ⓘ Dilemma del prigioniero

Il dilemma del prigioniero è un gioco ad informazione completa proposto negli anni cinquanta del XX secolo da Albert Tucker come problema di teoria dei giochi. Oltre ad essere stato approfonditamente studiato in questo contesto, il "dilemma" è anche piuttosto noto al pubblico non tecnico come esempio di paradosso.

Il dilemma in sé, anche se usa lesempio dei due prigionieri per spiegare il fenomeno, può descrivere altrettanto bene la corsa agli armamenti, proprio degli anni cinquanta, da parte di USA e URSS i due prigionieri durante la guerra fredda.

Il corollario a questo dilemma, detto di Aie dai nomi dei 3 professori universitari che lo teorizzarono nel 1988 Astegy, Inglot e Elghi prevede sempre che uno dei due tradisca laltro.

                                     

1. Il dilemma

Il dilemma può essere descritto come segue. Due criminali vengono accusati di aver commesso un reato. Gli investigatori li arrestano entrambi e li chiudono in due celle diverse, impedendo loro di comunicare. Ad ognuno di loro vengono date due scelte: collaborare, oppure non collaborare. Viene inoltre spiegato loro che:

  • se solo uno dei due collabora accusando laltro, chi ha collaborato evita la pena; laltro viene però condannato a 7 anni di carcere.
  • se nessuno dei due collabora, entrambi vengono condannati a 1 anno, perché comunque già colpevoli di porto abusivo di armi.
  • se entrambi accusano laltro, vengono entrambi condannati a 6 anni.

Questo gioco può essere descritto con la seguente bimatrice:

La miglior strategia di questo gioco non cooperativo è collabora, collabora perché non sappiamo cosa sceglierà di fare laltro. Per ognuno dei due lo scopo è infatti di minimizzare la propria condanna; e ogni prigioniero:

La strategia non collabora è strettamente dominata dalla strategia collabora. Eliminando le strategie strettamente dominate si arriva allequilibrio di Nash, dove i due prigionieri collaborano e hanno 6 anni di carcere. Il risultato migliore per i due "ottimo paretiano" è naturalmente di non collaborare 1 anno di carcere invece di 6, ma questo non è un equilibrio.

Supponiamo che i due si siano promessi di non collaborare in caso di arresto. Sono ora rinchiusi in due celle diverse e si domandano se la promessa sarà mantenuta dallaltro; se un prigioniero non rispetta la promessa e laltro sì, il primo è allora liberato. Cè dunque un dilemma: collaborare o non collaborare. La teoria dei giochi ci dice che cè un solo equilibrio collabora, collabora.

Se pensiamo agli Stati Uniti e allURSS come ai due prigionieri, e alla confessione come larmamento con latomica per contro la negazione equivarrebbe al disarmo unilaterale, il dilemma descrive come per le due nazioni fosse inevitabile al tempo della guerra fredda la corsa agli armamenti, benché questo risultato finale fosse non ottimale per nessuna delle due superpotenze e per lintero mondo.

                                     

2. Il paradosso

Il dilemma del prigioniero ha causato interesse come esempio di gioco in cui lassioma di razionalità apparentemente fallisce, prescrivendo unazione che procura più danno ad entrambi i contendenti della scelta alternativa non collabora, non collabora. Gli studiosi di teoria dei giochi fanno notare che chi la pensa in questo modo probabilmente si immagina un gioco diverso, in cui la vittoria viene valutata sulla somma degli anni di carcere.

Ovvero il gioco:

È facile vedere che questo nuovo gioco, semplificando le strategie dominanti, ha come equilibrio il non collabora, non collabora, ovvero la scelta che conduce al miglior risultato possibile per entrambi.

Questa seconda formulazione sommando gli anni di carcere prevede che il prigioniero debba preferire il danno minore per la coppia ma non è questo il suo obiettivo nella formulazione originaria. In quella si suppone sia interessato solo ai rischi che corre personalmente.

                                     

3. Possibili soluzioni

A questo punto ci si potrebbe domandare:

  • "È possibile che non esista alcuna conclusione logica che permetta al prigioniero di sperare di rimanere in prigione un solo anno o addirittura nessuno?"
  • "È possibile che la logica non giunga a nessunaltra soluzione oltre allaccettazione di venire condannati a 6 anni senza alcuna speranza?"

Una possibile soluzione è la seguente, ma richiede due precisazioni e non è universalmente accettata:

a) si deve dare per scontato che tutti i personaggi abbiano una capacità logica pressoché perfetta. Questo non vuol dire che debbano essere buoni, altruisti o altro, ma solo che tutti capiscano il gioco allo stesso modo, e non facciano alcun errore; b) dato il punto a) è facile capire che tutti prenderanno la stessa decisione. Non può esistere uno che fa il furbo a scapito degli altri, perché questo automaticamente vorrebbe dire che anche gli altri faranno come lui. Solo il lettore "disattento" può pensare di far fare il furbo ad un solo personaggio.

A questo punto appare chiaro che, se uno dei prigionieri capisce che le conclusioni a cui arriva lui sono le stesse a cui arriva laltro, scegliere non collabora è lunica azione possibile.

Infatti se ci si convince che è impossibile che diano risposte diverse vedi il punto b, allora il discorso egoista cade. Rimanendo solamente le possibilità collabora, collabora e non collabora, non collabora la scelta è a prova di dubbio.

Unaltra soluzione è quella proposta dalla teoria dei giochi ad informazione incompleta.



                                     

4. Il dilemma del prigioniero e la dimensione temporale

Possiamo osservare due diverse soluzioni delle situazioni del tipo "dilemma del prigioniero" se gli attori del modello devono riprendere la stessa decisione più e più volte.

Costruiamo una matrice di pay off ordinale, dove a > b > c > d. Consideriamo un gioco del tipo dilemma del prigioniero con N giocatori ponendo nella nostra matrice in verticale la scelta di un giocatore ed in orizzontale la scelta di tutti gli altri.

Per i giocatori il migliore dei mondi possibili è quello di vivere in un mondo pulito immaginiamo che giochino un numero N di giocatori abbastanza grande da far sì che il comportamento del singolo influisca molto poco sul risultato finale ma abbia un diretto effetto sul proprio pay off, senza però affrontare i costi per mantenerlo pulito la classica situazione da "free rider".

Poniamo che:

  • Un giocatore che tradisce gli accordi è considerato costantemente non credibile dunque cade la possibilità di un accordo.
  • Gli agenti abbiano contratto un accordo che li obbligherebbe ad un atteggiamento cooperativo come abbiamo visto una soluzione cooperativa garantirebbe un migliore risultato.
  • Ogni volta ognuno di essi, potendo osservare il comportamento degli altri giocatori, possa decidere se gli altri siano degni di fiducia.
  • tutti gli agenti siano portati a decidere cosa fare infinite volte.

Consideriamo r come un tasso di sconto che viene applicato ai pay off per attualizzare il valore dei pay off futuri un tasso insomma che esprima le preferenze intertemporali dei singoli giocatori.

                                     

4.1. Il dilemma del prigioniero e la dimensione temporale Equilibrio cooperativo

b + r b + r 2 b + r 3 b + r 4 b +. = b 1 − r {\displaystyle b+rb+r^{2}b+r^{3}b+r^{4}b+.={\frac {b}{1-r}}\!}
                                     

4.2. Il dilemma del prigioniero e la dimensione temporale Equilibrio non cooperativo

a + r c + r 2 c + r 3 c + r 4 c +. = a + r c 1 − r {\displaystyle a+rc+r^{2}c+r^{3}c+r^{4}c+.=a+{\frac {rc}{1-r}}\!}

come si può notare, il giocatore guadagna molto nel primo periodo raggiungendo un pay off a, ma nei periodi successivi si cade in un equilibrio non cooperativo.

la scelta dei giocatori sarà cooperativa se:

b 1 − r > a + r c 1 − r {\displaystyle {\frac {b}{1-r}}\!> a+{\frac {rc}{1-r}}}

ed in particolare ponendo che r sia uguale per entrambi i giocatori cioè che le preferenze intertemporali siano uguali tra i due se:

1 ≥ r ≥ a − b a − c {\displaystyle 1\geq r\geq {\frac {a-b}{a-c}}}
                                     

5. Falso paradosso della probabilità contro la logica

Si vede facilmente che se tutti e due tirassero una moneta avrebbero comunque più possibilità di fare poco carcere piuttosto che utilizzare la strategia furba ; infatti:

Nella scelta con la moneta è chiaro che la situazione è migliore per entrambi 0.25*7+0.25*6+0.25*1+0.25*0=3.5 anni di media che prenderebbero. Abbiamo a favore un buon 75% dei casi: nel 50% dei casi la pena verrà diminuita sensibilmente di 5 oppure 6 anni in questultimo caso sarà addirittura azzerata, e nel 25% dei casi invece rischieremo di ottenere la stessa pena che avremmo giocando da furbi. Apparirebbe dunque un paradosso, essendo una scelta migliore lanciare una moneta piuttosto che applicare la logica.

Daltra parte, tirare una moneta non è una scelta conveniente per un giocatore razionale, a meno di un accordo vincolante che obblighi entrambi a tirare la moneta; a quel punto, però, meglio ancora sarebbe un accordo vincolante che obbligasse entrambi a tacere.

Nel caso in cui uno dei due tirasse la moneta e laltro effettuasse una scelta "furba", infatti, sapendo che laltro ha tirato la moneta ma senza conoscere lesito del tiro, la situazione spingerebbe comunque il secondo a collaborare: infatti in questo modo nel 50% dei casi prenderebbe 0 anni rispetto a 1 se laltro non collabora e nel 50% dei casi 6 anni rispetto a 7 se laltro collabora.

Lapparente paradosso dunque non sussiste e un giocatore razionale, in assenza di accordi vincolanti, sceglierà sempre di collaborare.



                                     
  • gioco dell ultimatum e il gioco del centipede. Mentre sono giochi ad informazione completa il Dilemma del prigioniero e il Trust game. Fudenberg, D. and
  • modo da giocare con più frequenza Forbici, oppure pensando al Dilemma del prigioniero si può supporre che una ripetizioni aumenti le possibilità di
  • Napoli, 1806 postumo Nico Perrone, Il truglio. Infami, delatori e pentiti nel Regno di Napoli, Palermo, Sellerio, 2000. Omertà Dilemma del prigioniero
  • l altro automaticamente aveva perso. Il dilemma del prigioniero - che ipotizza la situazione di due prigionieri a ciascuno dei quali è data la scelta di
  • l esperimento di Robbers Cave. Harold Kelley e Anthony Stahelski col dilemma del prigioniero trovavano la correlazione con i risultati della scala F, il legame
  • articoli e modelli. Nel 1950, ha dato il nome e l interpretazione del dilemma del prigioniero al modello di collaborazione e conflitto di Merrill M. Flood
  • la rimanente batteria del cellulare di Ja per registrare un messaggio di addio a Sara. Titolo originale: The Prisoner s Dilemma Diretto da: Guy Ferland
  • Taxi Driver, 2. Person of Interest: Fine del gioco, 2. Person of Interest: Il giorno fatale, 2. Person of Interest: Il dilemma del prigioniero 2.
  • scientifica sottoposto a revisione paritaria, una pubblicazione sul dilemma del prigioniero del 1996. Nel 1998, Lomborg pubblica sul popolare giornale danese
  • l applicazione del principio del minimax sembra portare a strategie non ottimali. Per esempio nel gioco del dilemma del prigioniero la strategia minimax

Anche gli utenti hanno cercato:

dilemma del prigioniero e equilibrio di nash, dilemma del prigioniero film, il dilemma del prigioniero istruzioni,

...
...
...