Pagine improbabili

by Massimo Lauria

Introduzione

Il tema del Carnevale di questo mese è il rapporto tra letteratura e matematica. È noto che (almeno in Italia) il rapporto tra la sfera umanistica della cultura e quella più tecnico-scientifica non sia mai stato stretto. Tolte felici eccezioni come Italo Calvino, sono pochi i padri della letteratura italiana che hanno rivendicato una buona formazione scientifica, matematica, o tecnica.

Dal mondo anglosassone l’esempio più degno di nota è quello dello scrittore David Foster Wallace, che non ha mai nascosto il suo interesse per la matematica. Questo pallino infatti si esprime nel personaggio di Michael Pemulis di “Infinite Jest” e nei continui riferimenti alle geometrie dei movimenti tennistici (altra passione dell’autore).

DFW ha addirittura scritto un libro interamente dedicato alla storia del concetto di infinito1, libro che è stato di recente tradotto anche in italiano. Ma gli esempi nel mondo anglosassone non si fermano qui: in una corrispondenza tra il solito DFW e Don DeLillo2, il secondo accenna alle sue letture di matematica. Dice di essersi reso conto attraverso di esse che la precisione è uno strumento fondamentale della poetica, forse più della vaga ambiguità.

Se poi ci avventuriamo nella letteratura di genere, non possiamo che osservare come la fantascienza sia per definizione ispirata dal pensiero scientifico tecnico.

Un autore di cui non si può non fare menzione nel 42esimo carnevale della matematica è quello di Douglas Adams3. Un classico dei suoi libri è il motore ad improbabilità, ovvero un meccanismo di propulsione che permette ad una navicella di viaggiare nello spazio fisico muovendosi all’interno di uno “spazio di probabilità”. Ed è sempre lui che ipotizza come la risposta alla vita, l’universo e tutto quanto sia un numero4.

Scimmie che battono tasti a caso.

Fino ad ora ho parlato di scrittori che hanno omaggiato la matematica nei loro lavori. In senso opposto notiamo il contributo piuttosto ingrato derivato dal “Paradosso del Cervello di Boltzmann”5, che viene espresso in questa forma popolare:

Se si hanno abbastanza scimmie che battono sulla tastiera a caso abbastanza a lungo, allora prima o poi quasi certamente una di queste scimmie scriverà “Infinite Jest”.

Che cattiveria! Con tutta la passione che DFW aveva per la matematica, ecco che si vuole sostituirlo con un folto gruppo di scimmie indisciplinate! Beh, in fondo non deve prenderla sul personale visto che questo paradosso vale per qualunque libro o qualunque tipo di testo. La Bibbia, i lavori di Shakespeare, le poesie Vogon.

L’irrispettoso paradosso non è altro che l’affermazione di una verità matematica piuttosto semplice, messa in una forma che possa stimolare la curiosità. Le scimmie sono un pretesto “narrativo” per postulare che ogni lettera sia scelta a caso e che sia indipendente dalle precedenti. Questo processo probabilistico induce una sequenza casuale di lettere, numeri, spazi e simboli di interpunzione.

Facciamo un esempio più semplice: abbiamo solamente le nostre solite eurocentriche 26 lettere, dalla ‘a’ alla ‘z’.

Qual’è la probabilità che la parola “autostoppista” venga generata? La probabilità che la prima lettera sia ‘a’ è \frac{1}{26}, la probabilità che la seconda sia ‘u’ è ancora \frac{1}{26}, ecc… per 13 lettere. Dunque la probabilità di ottenere la parola cercata “autostoppista” è

\displaystyle    {\frac{1}{26}}^{13} = \frac{1}{2,481,152,873,203,736,576}.

Per comodità chiamiamo B il numero 2,481,152,873,203,736,576. È chiaro che la probabilità di ottenere questa parola sia minuscola, tuttavia se avessimo 10,000\cdot B scimmie (ovvero ripetessimo l’esperimento per 10,000  \cdot  B volte), allora qualunque sequenza di 13 caratteri apparirebbe una media di 10,000 volte. Se la media è di 10,000 occorrenze allora possiamo stare tranquilli: quasi certamente la parola “autostoppista” apparirà almeno una volta. E non solo, anche tutte le altre sequenze di 13 caratteri appariranno con alta probabilità.

Nonostante ci siamo limitati a studiare la generazione di una sola parola, questi numeri sono enormi. A maggior ragione lo è il numero di tentativi necessari per riprodurre un intero romanzo con questa tecnica; romanzo che può essere visto come una singola parola molto lunga. Consideriamo solo una modesta introduzione di 1,000 caratteri, ignorando punteggiatura e separatori.

Facendo conti simili ai precedenti vediamo che le chance di ottenere uno specifico testo di 1,000 caratteri è

\displaystyle    {\frac{1}{26}}^{1000} = \frac{1}{0.9 \times {10}^{1415}}

È chiaro allora che un libro non possa essere scritto attraverso un processo di generazione casuale. Questo a meno che uno non bari…

Non tutti i processi casuali sono uguali.

Recentemente Jesse Anderson ha intrapreso un esperimento ispirato a questa idea delle scimmie con la macchina da scrivere. No, non vi preoccupate; non ha messo alla catena uno stuolo di poveri primati co.co.pro. per fargli scrivere opere immortali, bensì ha preparato un programma che simulasse un esercito di scimmie disciplinate e immuni al blocco dello scrittore. Ha poi messo in moto questo programma per fargli riscrivere le opere di Shakespeare.

Naturalmente i lettori attenti avranno capito che qualcosa non va: prendiamo ad esempio “The Taming of the Shrew” con i suoi bei 94,762 caratteri6. Per generare a caso una sequenza di caratteri così lunga sono necessari circa

\displaystyle    {26}^{94762} = 5.062 \times {10}^{134085}

tentativi, con una valore atteso di un solo successo.

Un numero enorme. Anche ammettendo che il sistema di Jesse Anderson produca un miliardo di tentativi al secondo (e questa è pura fantascienza con le tecnologie attuali!) gli ci vorrebbero

\displaystyle    5.063  \times  10^{134074}  \text{  secondi  }  \approx  1.6  \times   10^{134067} \text{ anni }.

Quindi c’è sicuramente qualcosa che non va… in effetti Jesse Anderson utilizza un metodo diverso da quello auspicato nel paradosso delle scimmie alla macchina da scrivere. Con il suo software ha generato in maniera casuale sequenze di 10 caratteri, che sono 141,167,095,653,376 in tutto7. Per ogni sequenza ha controllato che questa fosse contenuta nel lavoro di Shakespeare, e in quel caso il segmento di testo prodotto veniva marcato come “scritto” dalle scimmie.

In questo modo è stato possibile ottenere “The Taming of the Shrew” e tutti gli altri lavori di Shakespeare in pochi mesi. Anzi, è chiaro che utilizzando questo metodo è più semplice “scrivere” diversi testi contemporaneamente piuttosto che concentrarsi su uno in particolare: il tempo impiegato dall’esperimento è proporzionale al numero di sequenze di 10 caratteri da generare. Indipendentemente dal testo, quasi tutte le possibili sequenze dovranno essere prodotte. Lavorare su testi più lunghi permette semplicemente di sprecarne di meno.

Questa enorme differenza tra la durata dei due esperimenti è legata ad una differenza concettuale molto importante: nel primo esperimento si tenta di produrre a caso l’intero testo. Nel secondo si producono a caso brevi segmenti che poi vengono messi al posto giusto dal programma.

Il primo esperimento e “pura casualità” mentre il secondo è “casualità guidata”, nel senso che le scelte casuali vengono filtrate e selezionate da un processo deterministico e con un obbiettivo preciso (il testo di Shakespeare). Un po’ come avere davanti le istruzioni per una scatola di costruzioni i cui pezzetti sono mischiati insieme a quelli di molte altre scatole. In questo caso si procede secondo un progetto prestabilito, ma rovistando a caso nel cesto dei pezzettini, fino a che non si trova un pezzo “utile”.

Conclusioni

Il processo casuale immaginato da Boltzmann e quello realizzato da Jesse Anderson sono molto diversi. Nonostante entrambi utilizzino il caso in maniera fondamentale, nel primo processo non c’è modo di migliorare un testo “quasi corretto”. Se una delle scimmie scrivesse l’intero Amleto con un singolo carattere sbagliato, ai fini del primo esperimento sarebbe un testo da buttare. Per quanto ci si avvicini al testo finale, nessun progresso viene registrato fino a che non si ottiene il risultato sperato.

Nel secondo esperimento sono solo piccoli segmenti ad essere prodotti, e lo schema procede verso il prodotto finale a velocità spedita e uniforme.

Nel mezzo tra questi due estremi possiamo metterci i processi evolutivi: il progredire delle specie non è affatto casuale come il lavoro delle scimmie, ma non è neppure “guidato” verso un risultato finale come nel caso delle simulazioni di Jesse Anderson.

Footnotes:

1 “Everything and More: A Compact History of Infinity”, Wikipedia Inglese.

2 Corrispondenza tra Don DeLillo e David Foster Wallace, su kottke.org. Don DeLillo e David Foster Wallace si scrivono. Il primo accenna alle sue letture di matematica, ed il secondo parla delle sue chiacchierate con Jonathan Franzen. Ah, la conventicola dei romanzieri!

3 Douglas Adams, Wikipedia Italiana.

4 42.

5 Boltzmann Brain, Wikipedia Inglese.

6 Fonte, lo stesso sito di Jesse Anderson.

7 In un esperimento successivo le sequenze sono state accorciate a 9 caratteri, forse per avere una frequenza di successi più alta.

Advertisements