Il dilemma del prigioniero

6/24/2015 02:02:00 AM

Il dilemma del prigioniero

La storia del prigioniero, per chi ancora non la conosce, è questa.

Un giudice ha a sua disposizione i due indiziati di un omicidio, ma non sa chi dei due sia il colpevole; li tiene in due celle lontane e nell'impossibilità di comunicare fra loro. Propone quindi a ciascuno lo stesso patto in tre punti, semplicissimo e del tutto logico: a) se uno dei due accusa l'altro andrà subito libero e l'altro sarà condannato a trent'anni; b) se ambedue tacciono saranno liberi dopo due anni, perché mancano le prove e a quel punto scadono i termini; c) se si accusano a vicenda, la pena si divide a metà e prenderanno quindici anni ciascuno.

Ogni prigioniero ha quindi una sola alternativa: o sceglie di cooperare (beninteso con l'altro, non col giudice), tacendo di fronte al giudice; oppure sceglie, come si dice in termini tecnici, di defezionare, accusando l'altro. Una è la scelta amichevole, l'altra la scelta ostile. La strategia più giusta è evidentemente una doppia scelta amichevole, ossia che tacciano ambedue: saranno liberi dopo due anni. È ben possibile però che uno dei due prigionieri, dopo essersi orientato sulla scelta amichevole, ci ripensi perché spaventato dalla prospettiva dei due anni di reclusione e mediti di tradire l'altro, optando dunque per la scelta defezionante: in tal modo, denunciandolo, andrà subito libero e l'altro prenderà trent'anni. Ma a questo punto gli viene un sospetto terribile: se l'altro ha avuto la stessa idea sarà lui a farsi i trent'anni. Il risultato è che i due si accuseranno a vicenda. Qui accusare l'altro non è la strategia ottimale perché conduce alla seria probabilità di prendersi quindici anni di prigione invece che due anni soli: ma è una strategia razionale, anzi la strategia razionale, perché è l'unico modo di essere assolutamente certi di non passare trent'anni al fresco.

La parte interessante comincia ora e riguarda l'ipotesi che il gioco venga «esteso» o «prolungato»: invece di giocare una volta sola (one shot) si gioca un numero indefinito di volte. Ci possiamo quindi chiedere cosa accadrebbe se, continuando a giocare, ogni volta ciascun prigioniero conoscesse la scelta dell'altro la volta precedente (amichevole oppure ostile), decidendo su questa base come comportarsi nel turno successivo. Il quesito è: riusciranno i due a fidarsi l'uno dell'altro? È evidente che ciascun prigioniero ha interesse a scegliere la mossa amichevole, vantaggiosa per ambedue, esclusivamente se prevede che l'altro farà contemporaneamente la stessa mossa.

[…]

Fin dall'inizio di questa celebre vicenda teoretica (anni cinquanta) emerse che, facendo giocare i due per piccole somme intorno alle 100 volte di seguito (e non sono poche!) nel 60 per cento dei casi cominciava a prevalere la cooperazione; questa tendenza diventava egemonica se il gioco si prolungava indefinitamente. Nell'ambito del comportamento animale John Maynard-Smith dimostrò la presenza di equilibri molto simili, in rapporto al naturale selezionarsi di fattori genetici che inducono i comportamenti più vantaggiosi.

Ancora una volta abbiamo un risultato, per così dire, automatico: i soggetti umani interessati non saprebbero spiegare molto bene come vi siano giunti, e meno che mai lo saprebbero dire gli animali. Si tratta sostanzialmente di un processo di «prova ed errore», sia pure sofisticato: i due giocatori finiscono con il comportarsi, magari senza avvedersene, come un'unità operativa che a lungo andare fa prevalere il comportamento che rende di più. Esiste una condizione di fondo affinché questo accada? Certo: ed è che il gioco non si interrompa mai, o almeno che i giocatori non sappiano in anticipo quando verrà interrotto. Infatti la mossa amichevole è sensata quando prevede, per il futuro immediato, l'amichevolezza dell'altro: se i due giocatori sapessero di essere arrivati ormai all'ultima battuta si ritroverebbero nel caso che abbiamo visto all'inizio, della contesa unica, one shot, e quindi agirebbero di conseguenza la mossa ostile.

Quest'ultimo punto viene chiarito efficacemente dall'Exchange Visit Game. Se due persone che non si conoscono e vivono in due paesi diversi decidono attraverso un'agenzia di scambiarsi la casa per un lungo periodo di vacanza (poniamo, un anno sabbatico), una volta che ciascuno sia ben sistemato nell'appartamento dell'altro cominceranno a mandarsi delle mail amichevolissime e per molti mesi avranno la massima cura di muri e oggetti: ma solo fino all'ultimo giorno. L'ultima sera, infatti, ognuno dei due invita un bel po' di amici per una festa di addio ricca di alcol e – per la prima volta – senza alcun riguardo per pareti, mobili e suppellettili. Perché? Semplice: tutto era filato liscio finché ciascuno teneva in ostaggio l'appartamento dell'altro, ma nelle ultime ore non c'era più tempo per le ritorsioni. Il loro rapporto finiva di lì a poco e nell'ultimo atto era sparita quella che Axelrod (vedi sotto) chiamava l'ombra del futuro.

L'importanza di tutta questa tematica diventa più evidente se la si considera alla luce di una possibile elaborazione di una strategia ottimale. Supponendo che chi legge queste righe si trovi a essere uno dei due prigionieri, è naturale che si ponga un quesito: quale sarà il modo migliore per trascinare l'altro a cooperare, sapendo che non possiamo parlarci, cioè che non comunicheremo direttamente in alcun modo? Bisogna essere sempre amichevoli? Certo no, l'altro ne approfitterebbe sistematicamente, è come essere condannati a trent'anni ogni volta. Essere sempre ostili? Alternare?

Nel 1979 Robert Axelrod, un giovane studioso di scienze politiche, organizzò un torneo internazionale, invitando ciascun concorrente a inviare un programma che si proponesse come strategia ottimale per il singolo prigioniero. Ogni programma venne fatto interagire, tramite calcolatore, per 200 volte contro ciascuno degli altri. La strategia che risultò vincente, proposta da uno psicologo canadese, Anatol Rapoport, fu quella denominata «tit for tat», cioè «occhio per occhio» o «colpo su colpo» ed era la più semplice di tutte. Essa consisteva nell'iniziare con la mossa amichevole e poi nel fare ogni volta quello che l'altro aveva fatto la volta prima: la mossa ostile se l'altro era stato ostile, quella amichevole se era stato amichevole.

In questo modo, ciascuno impara a capire che se fa la mossa non amichevole verrà punito perché la volta dopo l'altro contendente sarà anche lui non amichevole: un minimo di vendicatività è ingrediente indispensabile in questo tipo di contrattazione. Ma appunto, bisogna che sia sempre possibile «una volta dopo». Come insiste Axelrod, «in assenza dell'ombra del futuro diventa impossibile sostenere la cooperazione». Nel 1981 il valore universale della strategia «tit for tat» (TFT) venne sostenuto da un articolo che Axelrod pubblicò con William Hamilton circa la sua presenza nel mondo animale.

Sia il dilemma del prigioniero, sia al suo interno la strategia «tit for tat», costituiscono lo schema principale, si potrebbe dire la colonna, su cui si reggono tutti gli accordi cooperativi. Questi accordi comportano un rischio, cioè la non-collaborazione dell'altro, e più precisamente la sua eventuale tendenza ad approfittarsi di noi. Il dilemma del prigioniero è dappertutto. Nella specie umana è il modello base della collaborazione fra estranei in condizione di libertà e parità, cioè in persone non legate in partenza da vincoli solidaristici di tipo familistico e/o tribale. Questo modello vale dunque nella cooperazione commerciale in generale; o vale per i tentativi di accordo fra due flottiglie di pescherecci in un grande golfo pescoso, dove la tendenza di ciascuna delle due di pescare più pesci possibile rischierebbe di svuotare quel mare da ogni forma di vita (è questa la cosiddetta «tragedia dei beni comuni»); oppure riguarda i nostri primi rapporti con un nuovo vicino di casa, soprattutto se manchi in partenza una chiara grammatica con cui intendersi (supponiamo che sia straniero, che parli malissimo la nostra lingua, che abbia costumi che non ci somigliano); oppure la situazione che si crea quando i responsabili di una ONG in un paese disastrato debbano decidere quanta fiducia accordare agli abitanti locali nel gestire un programma di aiuti, ben consapevoli del fatto che il regalare soldi e beni senza criterio servirebbe solo ad ingrassare ladri e speculatori. In tutti questi casi il problema nasce dalla necessità di fidarsi degli altri in una situazione in cui non sappiamo realmente se possiamo fidarci. Qui l'esplorazione della lealtà altrui necessita di cautela non meno che di coraggio, oltre che di un briciolo di ottimismo: ma ha anche bisogno di strategie.

Giovanni Jervis, Pensare dritto, pensare storto. Introduzione alle illusioni sociali, Bollati Boringhieri, 2007, pp. 127-131.

Commenti

Roberto B.24 giugno 2015 alle ore 02:11
Porgere l'altra guancia non è mai stata la strategia giusta. La teoria dei giochi ce lo dimostra. La strategia giusta è invece il biblico «occhio per occhio, dente per dente», partendo però sempre da una posizione iniziale non aggressiva e collaborativa.
RispondiElimina
Risposte

Aggiungi commento

Posta un commento

Comments are welcome, if they are in topic. For spam problems your comment will not appear immediately, but only after a while: be patient! Thank you!

Cerca nel blog

Le api di Mandeville

Il dilemma del prigioniero

Commenti

Posta un commento