Aeneas aiuta a ricostruire i frammenti perduti delle iscrizioni latine con livelli di rapidità ed efficienza impossibili per un solo cervello umano. È un esempio di come algoritmi e reti neurali trasformeranno la nostra conoscenza dell'antichità e il futuro della ricerca.
Il futuro degli epigrafisti riguarda tutti, perché ci dice qualcosa su come potrebbe cambiare il modo in cui conosciamo, studiamo e capiamo il mondo. Mi attirerò qualche antipatia per il paragone che sto per fare, ma credo che il lavoro di un epigrafista sia un po’ come una partita di La Ruota della Fortuna, il programma di Mike Bongiorno in cui i concorrenti cercavano di indovinare una frase misteriosa rivelando, una alla volta, le lettere mancanti per vincere un’automobile, un viaggio o qualche altro bottino. Anche l’epigrafista ha davanti a sé un testo interrotto, spezzato, consumato dai millenni. Ma ogni lettera “indovinata” deve essere sorretta da fonti e logica storica. È qui che il paragone con Mike Bongiorno si ferma: quello dell’epigrafista è un lavoro che richiede anni di studio e una pazienza fuori dal tempo. Uno degli strumenti fondamentali per completare un frammento sono i cosiddetti “paralleli”: iscrizioni simili a quella incompleta, che aiutano a intuire cosa potrebbe essere andato perduto. I paralleli contengono somiglianze con il testo misterioso: una terminazione verbale, una formula rituale, un nome imperiale, una certa struttura grammaticale, il riferimento a una persona. A volte si trova il gemello perfetto. Un frammento trovato su una lastra di marmo a Roma potrebbe trovare il suo doppio integro in Anatolia o in Nord Africa. Se due testi si parlano si ricostruisce il senso, si traduce, si può datare, e improvvisamente si può dare voce a quello che era muto. Cent’anni fa per trovare paralleli si faceva affidamento alla propria memoria di ferro: si ricordava un’incisione vista dieci anni prima, il racconto di un collega, magari si apriva d’istinto il libro giusto. Era lavoro artigianale sporco e poetico – dunque anche molto fallibile. Poi sono arrivati i repertori, le banche dati e i motori di ricerca. E adesso c’è lui, il modello, l’algoritmo: Aeneas.
Aeneas è un modello di intelligenza artificiale che a partire da un frammento, in pochi secondi, è in grado di suggerire il possibile contenuto mancante di un’iscrizione e poi proporre datazione, geolocalizzazione, e dozzine di “paralleli”. È stato progettato da un team di ricercatori guidato da Yannis Assael di Google DeepMind e dalla storica italiana Thea Sommerschield dell’Università di Nottingham. È allenato su 176.000 iscrizioni latine, e non ne dimentica mai nemmeno una. Al momento della prova ha fatto quello che ci si aspettava: ha lasciato gli umani indietro di decine di punti percentuali. In uno studio pubblicato da poco su «Nature», i ricercatori hanno chiesto a 23 epigrafisti di analizzare iscrizioni con e senza l’ausilio di Aeneas. Quando il modello e gli umani hanno lavorato per conto proprio, l’IA ha superato di gran lunga gli epigrafisti in tutti e tre i compiti: completamento del testo, datazione e attribuzione geografica. Ho chiesto a Sommerschield se questi risultati potessero essere influenzati dal modo in cui si era costruito l’esperimento – gli storici avevano solo due ore per completare lavori per cui solitamente si prenderebbero più tempo – e mi ha risposto che l’obiettivo era mettere alla prova l’utilità del modello come supporto agli studiosi, non misurare la loro obsolescenza. La vera notizia, per Sommerschield, non è la competizione tra umani e algoritmi ma il frutto della loro collaborazione. L’assenza dell’umano non è nemmeno contemplata, senza umani non si va da nessuna parte. “Il risultato che abbiamo ottenuto è il migliore che si potesse desiderare: la sinergia produce i risultati più accurati”. Nel 90% dei casi i partecipanti hanno considerato il modello un buon punto di partenza per la ricerca. Per alcuni di loro Aeneas ha addirittura “completamente cambiato” il modo in cui guardavano le iscrizioni. Forse facciamo fatica ad ammettere che, in molti settori, l’intelligenza artificiale stia mostrando di saper fare meglio di noi proprio quei compiti che da sempre associamo all’unicità del pensiero umano: stabilire nessi, capire il contesto, costruire significati. E sì, senza dubbio serviremo ancora noi per architettare e orchestrare, ma sul piano del lavoro cognitivo non è chiaro chi dei due sarà l’assistente dell’altro. Di certo, per gli epigrafisti, Aeneas è un nuovo tipo di collega. Uno che non invecchia, non dorme, non dimentica e non sbaglia quanto loro.
“La capacità di contestualizzazione di Aeneas è veramente interessante” ha commentato Silvia Ferrara, archeologa e filologa classica all’Università di Bologna, che sul coinvolgimento di Google nel progetto e nello studio ha commentato “se è uno strumento per consentire ai ricercatori di fare blue sky research, ricerca scientifica libera da vincoli applicativi o commerciali, mi sembra una cosa favolosa, lodevole”. Ferrara dice che in fondo uno dei motivi per cui l’università italiana ha così pochi fondi è anche che non ha avuto la capacità o la lungimiranza di mettersi in gioco con il privato. Ben vengano le collaborazioni con chi può investire sul sapere, purchè, ovviamente – e questo Ferrara lo ripete molte volte – la ricerca sia blue sky. Senza limiti come il cielo.
“Aeneas è allenato su 176.000 iscrizioni latine, e non ne dimentica mai nemmeno una. Per gli epigrafisti è un nuovo tipo di collega. Uno che non invecchia, non dorme, non sbaglia quanto loro”.
Prevedere-il-passato è il nome del sito lanciato insieme allo studio pubblicato su «Nature»: predictingthepast.com. Un sito che oltre a Aeneas rende gratuito e aperto a tutti anche Ithaca (un antenato di Aeneas specializzato sui testi della Grecia antica, appena aggiornato con il progresso algoritmico di Aeneas), per la gioia di ricercatori, studenti, insegnanti, curatori museali ed epigrafisti autodidatti. Prevedere-il-passato è un nome paradossale ma efficace perché ricostruire l’antichità, quando è così remota e frammentaria, non è tanto diverso da prevedere il futuro. Richiede gli stessi azzardi, lo stesso coraggio e la stessa presunzione. Ed è particolarmente difficile quando non si parla di imperatori e conquiste ma di quello che succedeva alla maggior parte delle persone – la vita vera. “Il motivo per cui faccio epigrafia è che è una delle uniche fonti del mondo antico che riporta le voci dirette delle persone” dice Sommerschield. “Anche gli strati sociali più bassi potevano commissionare un’iscrizione elementare”. Non le voci dei generali né quelle dei filosofi. Voci che dicevano ti amo, sono nato qui, ti ricorderò per sempre, mi devi questi soldi, vieni al mio compleanno. “La vita delle donne e degli schiavi nel mondo romano non la raccontano Tucidide o Tacito” aggiunge Sommerschield, “la raccontano le iscrizioni”.
I ricercatori però non hanno resistito alla tentazione di vedere come Aeneas se la sarebbe cavata con la madre di tutte le iscrizioni latine: la Res Gestae Divi Augusti. Una lastra di propaganda incisa nella pietra per rendere eterno un mito. Il racconto in prima persona di Ottaviano, poi diventato Augusto, primo imperatore di Roma, e poi diventato divino. “Volevamo testare il modello sull’iscrizione più famosa, era troppo bello per non provarci e siamo contenti dei risultati” dice Sommerschield. Le Res Gestae hanno fatto dannare gli storici per secoli: quando sono state scritte? Davvero prima che Augusto morisse, dettate da lui come vuole la leggenda? O dopo, magari decenni dopo, quando a dettare il tono era qualcun altro? Se fossero state scritte dopo allora non sarebbe Augusto a parlare. Magari Tiberio, per legittimare il suo regime rievocando un’epoca fondativa idealizzata. Aeneas ha studiato, confrontato centinaia di migliaia di testi, e nel giro di pochi secondi si è espresso. Sul portale gratuito e aperto a tutti possiamo scrutare il ragionamento del modello: si è concentrato per esempio sullo spelling di “aheneis”, che diventa “aeneis” nel primo secolo dopo Cristo e che quindi consente di diagnosticare che questo testo dovesse essere stato scritto prima. Ha fatto ragionamenti classici da storico, ma con la potenza di calcolo di centinaia di cervelli. E ha formulato due ipotesi coerenti con il dibattito storico: una colloca la stesura del testo a pochi anni prima della morte di Augusto, l’altra fino a sei anni dopo. Insomma il modello non ha risolto il dibattito, lo ha confermato. Ma il punto cruciale è che solo a partire dal linguaggio, in pochi secondi, Aeneas sia arrivato a formulare le stesse ipotesi su cui gli storici lavorano da secoli. Su altri testi di cui abbiamo la datazione precisa il margine di errore medio di Aeneas è stato di tredici anni. Non male per documenti vecchi di duemila anni. La media per gli epigrafisti, nello studio, è stata di trentuno – impressionante pure quella, a pensarci bene.
Certo le iscrizioni usate per testare Aeneas venivano dallo stesso corpus di addestramento del modello. Non è un dettaglio da poco. È come interrogare un allievo poco dopo avergli fatto una lezione che gli forniva tutti i materiali utili per l’interrogazione. I dati di addestramento erano naturalmente separati da quelli per i test, ma la matrice, l’universo di interpretazione testuale, era quello. “Abbiamo lavorato tantissimo a pulire i dati, armonizzarli, eliminare i duplicati” racconta Sommerschield. “È stato un lavoro molto intenso. I dati sono fondamentali alla performance del modello”. E se i dati non ci fossero? Se ci fosse da lavorare su iscrizioni nuove, sporche, ignorate? Aeneas sarebbe ancora così brillante?
“Non lo abbiamo ancora testato su iscrizioni inedite, perché un’analisi credibile avrebbe richiesto tempo, rigore e lavoro sul campo: bisogna esaminare l’iscrizione dal vivo, confrontarla con fonti specialistiche, costruire un’interpretazione solida. Senza contare che magari qualcuno ha un parallelo chiuso dentro una scatola dimenticata e io non lo so. Possono volerci anni. In questo caso volevamo mostrare l’utilità di Aeneas ai ricercatori il prima possibile.” L’epigrafe dentro una scatola dimenticata è un dettaglio rivelatore: Aeneas è tanto intelligente quanto i dati che riceve. E la digitalizzazione delle epigrafi oggi la fanno a mano volontari, studenti, ragazzi che passano pomeriggi a catalogare iscrizioni dimenticate in qualche archivio italiano. “In questo momento la copertura storica e geografica è tutt’altro che completa,” ammette Sommerschield, “senza i dati digitalizzati dagli studenti delle università non esisterebbe nessuna intelligenza artificiale”.
“Nelle discipline umanistiche resta ancora forte l’idea del genio isolato, dell’intuizione folgorante e individuale, dell’esperto solitario che interpreta e firma. Nelle discipline STEM è scontato da tempo che la conoscenza sia un processo collettivo e iterativo. L’intelligenza artificiale potrebbe erodere quel confine rigido tra umanisti e scienziati, alzato nell’Ottocento e rafforzato nel Novecento, che separa chi studia la storia da chi risolve le equazioni”.
C’è anche chi sta lavorando a un tipo di intelligenza artificiale che aiuti a cominciare il lavoro epigrafico e non solo a rivisitarlo o completarlo. Ci sono casi in cui i testi sono indecifrabili e indecifrati. Vediamo solo segni, e quei segni non ci dicono nulla. Capirci qualcosa è parte del lavoro di Silvia Ferrara. Con il suo gruppo di ricerca sta addestrando un algoritmo per studiare le iscrizioni cipro-minoiche, tra le scritture più misteriose del mondo antico. Un sillabario che non abbiamo mai capito e quindi una lingua che non abbiamo mai letto – e che potrebbe aiutarci a rileggere l’antichità. A differenza di Aeneas, che lavora in un campo coltivato e sorvegliato, il modello di Ferrara opera quasi alla cieca. Cerca strutture e pattern. Cerca una logica da zero. “Voglio capire che diamine scrivevano a Cipro migliaia di anni fa” dice Ferrara. Le dico che mi ricorda Louise Banks, la linguista interpretata da Amy Adams che nel film Arrival è incaricata di decifrare la lingua degli alieni. “Ho visto il film sette volte. Quella maledetta di Amy Adams mi ha rubato il ruolo”. Il sogno di Ferrara è vedere la nascita di nuove discipline: lo studio dei testi minoici, delle iscrizioni dell’Isola di Pasqua, della Valle dell’Indo, cioè “far parlare testi che non ci parlavano più da millenni”.
Non tutti però applaudono all’arrivo di questi strumenti. Molti storcono il naso. L’epigrafia, come molte discipline, si è nutrita nei decenni del lavoro di studiosi sempre più specializzati. Un epigrafista potrebbe passare la sua intera carriera a studiare iscrizioni funerarie latine del II secolo dopo Cristo trovate in Sicilia orientale. Capiamo bene che quando uno passa la sua vita a studiare un pezzetto, i suoi colleghi si vedranno bene dal contraddirlo proprio su quello. Ma è così che nascono anche gli errori e i pregiudizi, che si incrostano e si ripetono.
A un certo punto in Arrival, Amy Adams cita lo psicologo statunitense Abraham Maslow: “Se l’unica cosa che hai è un martello, suppongo sia allettante trattare tutto come se fosse un chiodo”. Per molto tempo il martello sono state le singole teorie degli esperti, con tutti i rischi che comporta una voce iper-specializzata e incontestabile. Ora quel martello si è trasformato in una rete neurale, con la potenza di centinaia se non migliaia di cervelli messi insieme. Ma dovremmo chiederci: stiamo costruendo un nuovo strumento capace di farci vedere le iscrizioni con uno sguardo più sfaccettato (per smettere di vedere solo chiodi)? O stiamo semplicemente colpendo più forte con lo stesso martello?
Il rischio più insidioso è che l’errore e il pregiudizio, una volta appreso da un modello come Aeneas, diventi norma. Se un modello apprende una lettura sbagliata e la riproduce all’infinito, quella lettura rischia di cristallizzarsi ancora di più come verità. L’autorità algoritmica può trasformare una teoria in dogma senza che nessuno se ne accorga. Ma se quel modello riceve in pasto idee diverse, interpretazioni diverse, scuole di pensiero diverse, allora questo rischio si riduce. Secondo Sommerschield, modelli come Aeneas possono “contribuire a democratizzare la ricerca, rendendola accessibile anche al di fuori dei percorsi tradizionali dell’epigrafia”. Con percorsi tradizionali s’intende lo studio diretto dei monumenti sul campo, la consultazione di archivi e biblioteche specializzati – un lavoro che rimane fondamentale ma per cui oggi molti studiosi faticano a reperire fondi. “Strumenti come Aeneas possono offrire un supporto concreto a chi non ha sempre la possibilità di lavorare direttamente sui monumenti, aiutando a trovare connessioni tra testi e contesti finora difficili da immaginare”.
In un contesto accademico in cui l’intelligenza artificiale è ancora, per molti, sinonimo di sciatteria e mancanza di pensiero originale, questo è un esempio di come tutto dipende da come la usiamo. Può diventare una stampella che ci aiuta a fare il minimo indispensabile e ci accompagna lentamente verso la nostra obsolescenza, o una leva che ci consente di guardare più lontano, immaginare l’impossibile, trovare nuove strategie per la nostra rilevanza. Certo, usare questi strumenti significherà non affezionarsi troppo alle proprie teorie. “Ho delle idee e delle ipotesi, se riuscissimo a validarle o anche solo a falsificarle io sarei felicissima” dice Ferrara.
Modelli come questi potrebbero restituire vitalità proprio a quelle discipline che più temono di esserne travolte. Nelle discipline umanistiche resta ancora forte l’idea del genio isolato, dell’intuizione folgorante e individuale, dell’esperto solitario che interpreta e firma. Nelle discipline STEM è scontato da tempo che la conoscenza sia un processo collettivo e iterativo. L’intelligenza artificiale potrebbe erodere quel confine rigido tra umanisti e scienziati, alzato nell’Ottocento e rafforzato nel Novecento, che separa chi studia la storia da chi risolve le equazioni. “Sono una delle persone che pensa che chiamarle humanities non abbia assolutamente senso” dice Sommerschield. Forse, chissà, l’era dell’intelligenza artificiale ci restituirà gli studiosi poliedrici. E forse, in questa era, gli indispensabili saranno gli umili. Di sicuro saranno i curiosi. “Molti pensano che se usi strumenti di intelligenza artificiale hai abbandonato il tuo seminato. Ma a me gli stimoli più grandi sono sempre arrivati da fuori” dice Ferrara. “Ogni tanto per farsi venire le idee migliori bisogna cambiare pollaio”.