La CRISPR, cioè la tecnica che oggi corregge le malattie ereditarie, è un sistema di difesa che i procarioti usano da miliardi di anni contro i virus. Noi l'abbiamo smontato, semplificato e reso programmabile.
Parliamo di CRISPR come di una delle invenzioni più sofisticate della biologia recente: una tecnologia capace di entrare in una cellula e correggere una singola lettera del codice genetico. L’immagine è corretta, ma incompleta, perché lo strumento non è stato inventato in laboratorio. È un sistema di difesa che i batteri usano da miliardi di anni contro i virus, e che noi abbiamo riconosciuto, smontato e reso programmabile.
Nel 1987, mentre studiava il gene iap di Escherichia coli, il gruppo di Yoshizumi Ishino notò, subito dopo quel gene, un tratto di DNA organizzato in modo insolito: brevi sequenze quasi identiche si ripetevano più volte, separate da tratti variabili. C’era un ordine evidente, ma nessuna funzione che lo spiegasse. Il dato rimase per anni in una nicchia della genomica batterica, registrato come una struttura ripetitiva interessante ma priva di un significato biologico.
La stessa architettura ricomparve poi in moltissimi batteri e archei. Gli archei sono microrganismi unicellulari privi di nucleo, distinti dai batteri per molte caratteristiche molecolari; insieme ai batteri formano i procarioti, cioè gli organismi in cui il DNA non è racchiuso in un nucleo delimitato da membrana. Man mano che si rendevano disponibili più genomi da confrontare, divenne chiaro che quelle sequenze non erano una particolarità isolata di E. coli, ma un motivo diffuso: ripetizioni brevi, intervallate con regolarità da tratti variabili.
A quelle regioni fu dato il nome CRISPR, Clustered Regularly Interspaced Short Palindromic Repeats, cioè brevi ripetizioni raggruppate e separate da intervalli regolari. La parola più tecnica del nome è “palindromiche”. Nel DNA non significa, come nel linguaggio comune, una sequenza leggibile uguale nei due sensi, ma una simmetria fra una sequenza e la sua complementare letta in direzione opposta; una proprietà che può favorire particolari ripiegamenti dell’RNA prodotto da quella regione. Fra una ripetizione e l’altra si trovano gli spaziatori, ossia le sequenze variabili inserite negli intervalli. Proprio gli spaziatori, all’inizio i più difficili da interpretare, si sarebbero rivelati la parte più importante dell’intero sistema.
Accanto ai loci CRISPR comparivano spesso geni conservati fra specie diverse, battezzati Cas, abbreviazione di CRISPR-associated, cioè “associati a CRISPR”. Un locus è una posizione precisa del genoma; parlare di locus CRISPR significa quindi indicare il punto in cui si trovano le ripetizioni con i loro spaziatori. Le proteine Cas sono invece gli strumenti molecolari che permettono alla cellula di usare quelle sequenze. Il sistema CRISPR-Cas comprende perciò due cose distinte: una regione del genoma che contiene informazione e un apparato proteico che la mette in opera.
Il passaggio decisivo arrivò quando Francisco Mojica, Alexander Bolotin e altri confrontarono gli spaziatori con le sequenze depositate nelle banche dati. Molti spaziatori corrispondevano a frammenti di batteriofagi o di plasmidi. I batteriofagi, o fagi, sono virus che infettano i batteri. I plasmidi sono piccole molecole di DNA, di solito circolari, capaci di passare da un batterio all’altro e di trasportare geni, per esempio quelli della resistenza agli antibiotici. La corrispondenza indicava che i batteri conservavano nel proprio genoma frammenti degli elementi genetici che li avevano invasi.
Gli spaziatori non erano dunque inserti casuali fra sequenze ripetute, ma tracce genetiche di infezioni passate. Il genoma batterico conteneva un archivio molecolare degli aggressori incontrati. Restava però da dimostrare, in laboratorio, che quella memoria servisse a difendersi. La prova arrivò nel 2007, con Rodolphe Barrangou e colleghi, che studiavano Streptococcus thermophilus, un batterio usato nell’industria lattiero-casearia e quindi molto esposto agli attacchi dei fagi. Quando il batterio sopravviveva a un’infezione, poteva acquisire nel proprio locus CRISPR nuovi spaziatori ricavati dal genoma del fago; e i batteri che incorporavano lo spaziatore giusto diventavano resistenti a quel fago. Togliendo o aggiungendo specifici spaziatori, la resistenza cambiava di conseguenza.
Una difesa così elaborata si spiega con la pressione a cui i batteri sono sottoposti. Negli oceani i fagi sono gli oggetti biologici più abbondanti e ogni giorno uccidono una quota enorme dei batteri presenti; in queste condizioni, conservare memoria degli aggressori già incontrati e reagire più in fretta a una seconda esposizione fa la differenza fra sopravvivere e no.
CRISPR-Cas è dunque un sistema immunitario adattativo dei procarioti. Immunitario, perché protegge la cellula da un’invasione genetica; adattativo, perché si modifica dopo l’esposizione e conserva memoria dell’invasore. Una conoscenza nata in una nicchia della microbiologia, lo studio delle interazioni fra batteri e virus, conteneva il principio di una tecnologia generale. I batteri avevano trovato un modo per trasformare frammenti di DNA estraneo in strumenti di riconoscimento; la ricerca successiva ha isolato quella logica, l’ha ricostruita in condizioni controllate e l’ha resa programmabile. Il passaggio è stato premiato nel 2020 con il Nobel per la Chimica a Emmanuelle Charpentier e Jennifer Doudna, che avevano mostrato come uno dei sistemi più importanti, CRISPR-Cas9, potesse diventare uno strumento per tagliare il DNA in punti scelti.
“Una difesa così elaborata si spiega con la pressione a cui i batteri sono sottoposti. Negli oceani i fagi sono gli oggetti biologici più abbondanti e ogni giorno uccidono una quota enorme dei batteri presenti; in queste condizioni, conservare memoria degli aggressori già incontrati e reagire più in fretta a una seconda esposizione fa la differenza fra sopravvivere e no”.
Ma come funziona, esattamente? Nel sistema naturale, quando un fago infetta un batterio, vi introduce il proprio materiale genetico. In certe condizioni, il batterio integra nel locus CRISPR un piccolo frammento di quel DNA invasore: il frammento diventa uno spaziatore, cioè una voce nuova nell’archivio. Se in seguito lo stesso fago, o uno abbastanza simile, ritorna, lo spaziatore consente di riconoscerne la sequenza corrispondente. Questo archivio, inoltre, non si riempie a caso: il batterio aggiunge ogni nuovo frammento sempre allo stesso estremo del locus, accanto ai più recenti, così che le ripetizioni formano un registro ordinato nel tempo, con le infezioni più nuove a un capo e le più antiche all’altro. Leggendo il proprio locus CRISPR, la cellula scorre, in pratica, la cronologia degli incontri che lei e i suoi antenati hanno avuto con virus e plasmidi.
Per usare questa memoria la cellula trascrive il locus CRISPR in RNA. Il lungo RNA prodotto viene poi tagliato in molecole più piccole, i crRNA (da CRISPR RNA, cioè l’RNA prodotto a partire dalle sequenze CRISPR). Ogni crRNA porta con sé uno spaziatore e funziona come una guida molecolare: riconosce il bersaglio attraverso la complementarità delle basi, ossia il fatto che una sequenza di RNA può appaiarsi con la sequenza di DNA corrispondente, come due metà che combaciano. Tutta la specificità del sistema dipende da qui, dall’informazione scritta nella guida. Nel CRISPR-Cas9 più studiato, quello di Streptococcus pyogenes, entra in gioco anche un secondo RNA, il tracrRNA (da trans-activating CRISPR RNA, cioè un RNA ausiliario che attiva e completa il primo), che aiuta a maturare il crRNA, cioè a trasformare il lungo trascritto in una guida funzionale, e a formare il complesso con la proteina Cas9. In laboratorio i due RNA sono stati fusi in un’unica molecola artificiale, l’sgRNA (da single-guide RNA, cioè la guida singola), che contiene insieme la parte che riconosce il bersaglio e la parte che dialoga con Cas9. Questa semplificazione rese il sistema molto più facile da programmare.
Cas9 è una nucleasi, cioè un enzima che taglia gli acidi nucleici. Per tagliare, però, non le basta la corrispondenza fra guida e bersaglio. Accanto alla sequenza da colpire deve trovare anche un breve segnale chiamato PAM (protospacer adjacent motif, un brevissimo motivo che fiancheggia la sequenza bersaglio). Nel caso della Cas9 di Streptococcus pyogenes, il PAM più comune è indicato come NGG: una base qualsiasi seguita da due guanine. La proteina percorre il DNA, riconosce prima un PAM compatibile, apre localmente la doppia elica e verifica se la sequenza adiacente combacia con la guida; solo allora taglia. Il PAM funziona come una parola d’ordine: senza, Cas9 non procede, anche quando la sequenza bersaglio è presente.
Questo dettaglio ha una conseguenza importante nel sistema naturale. Il batterio conserva nel proprio archivio lo spaziatore corrispondente al virus, ma quel tratto non è accompagnato dal PAM corretto; il DNA dell’invasore, invece, porta la sequenza bersaglio nel contesto riconoscibile da Cas9. In questo modo la cellula non attacca la propria memoria scambiandola per il nemico: distingue l’archivio dall’originale grazie a una piccola differenza di contorno.
Il taglio vero e proprio è eseguito da due domini catalitici di Cas9, HNH e RuvC. Un dominio è una porzione di proteina con struttura e funzione riconoscibili; “catalitico” significa che partecipa direttamente alla reazione chimica. HNH e RuvC sono semplicemente i nomi di queste due parti della proteina: la prima taglia il filamento complementare alla guida, la seconda quello opposto. Il risultato è una rottura a doppio filamento, cioè l’interruzione contemporanea delle due catene del DNA.
Da qui nasce l’editing: dal modo in cui la cellula ripara la rottura. CRISPR-Cas9 produce il taglio, poi la riparazione la fa la cellula, con i suoi mezzi. La via più frequente è la NHEJ (non-homologous end joining, giunzione di estremità senza omologia): la cellula riavvicina in fretta le estremità rotte, spesso aggiungendo o perdendo qualche base, piccole alterazioni dette indel. Se queste modifiche cambiano la lettura del gene, la proteina corrispondente risulta tronca o non funzionante. Per questo CRISPR è usato anzitutto per spegnere geni e studiarne la funzione, così da capire cosa accade quando vengono a mancare. La seconda via è la HDR (homology-directed repair, riparazione guidata da omologia): la cellula usa una sequenza modello come stampo per ricostruire il tratto danneggiato. Se il ricercatore fornisce un modello che contiene una modifica precisa, la cellula può copiarla nel genoma. È una correzione più controllata, ma in molte cellule è meno efficiente della NHEJ, soprattutto in quelle adulte che si dividono poco.
Il punto di svolta tecnologico è del 2012, quando Doudna, Charpentier e colleghi mostrarono in vitro, cioè in un sistema ricostruito fuori dalla cellula con i soli componenti molecolari, che Cas9 poteva essere riprogrammata semplicemente cambiando la guida a RNA. Strumenti per modificare il DNA in punti precisi esistevano già prima di CRISPR, ma si basavano su proteine costruite su misura: per ogni nuovo bersaglio bisognava progettare da capo una proteina capace di riconoscerlo, un lavoro lungo e costoso. Con CRISPR-Cas9 il riconoscimento veniva affidato soprattutto a una breve sequenza di RNA: per cambiare bersaglio bastava cambiare la guida. La difficoltà si spostava dalla progettazione di una proteina alla sintesi di una sequenza di nucleotidi, qualcosa di rapido, modulare ed economico. È la differenza fra dover costruire una chiave nuova ogni volta e potersi limitare a riscrivere un indirizzo.
Lo strumento di quel passaggio, Cas9, è in realtà soltanto uno dei molti sistemi CRISPR esistenti in natura. Alcuni batteri affidano il riconoscimento e il taglio a un complesso formato da più proteine diverse che lavorano insieme; altri, come quello di Streptococcus pyogenes, concentrano tutto in una sola proteina di grandi dimensioni. È stata questa seconda famiglia a rivelarsi più adatta a diventare uno strumento: una macchina a componente unico è più facile da trasferire in un’altra cellula, da produrre in laboratorio e da dirigere su un bersaglio scelto, rispetto a un apparato di molte parti che devono assemblarsi correttamente. Per questo, fra i tanti sistemi disponibili, Cas9 è diventato il più usato.
Dal 2013 diversi gruppi dimostrarono che il sistema funzionava anche nelle cellule umane e in altri organismi eucariotici, cioè dotati di nucleo. In pochi anni la tecnica entrò nella genetica funzionale, nella biologia dello sviluppo, nella microbiologia, nella ricerca biomedica, nelle biotecnologie vegetali. Si potevano spegnere geni, introdurre mutazioni, costruire modelli cellulari di malattia, modificare più punti del genoma nello stesso esperimento, esplorare reti genetiche complesse, cioè l’insieme dei geni e dei loro prodotti che cooperano nel controllo di un processo biologico, intervenendo direttamente sui componenti e misurando le conseguenze. La diffusione fu rapidissima proprio perché la barriera d’ingresso era bassa: un laboratorio con competenze ordinarie poteva progettare una guida e ottenere in poche settimane una modifica che con i metodi precedenti avrebbe richiesto mesi di lavoro e risorse molto maggiori. In breve tempo CRISPR è diventato uno strumento di routine in migliaia di laboratori.
“Il controllo dell’informazione, fuori di noi nella comunicazione così come dentro di noi a livello di una sequenza di DNA, è la chiave”.
Le tappe successive hanno cercato di trasformare CRISPR da strumento che taglia a strumento che corregge, anche per superare il limite della riparazione precisa, modificando il DNA senza produrre una rottura completa a doppio filamento. Il base editing permette di cambiare una singola base del DNA senza quella rottura: una Cas9 modificata porta sul bersaglio un enzima capace di convertire chimicamente una base in un’altra, trasformando per esempio una coppia C-G in T-A, oppure una A-T in G-C. È una strategia particolarmente preziosa per le malattie dovute a mutazioni puntiformi, in cui il problema dipende da una sola lettera sbagliata. Evitare la rottura completa del DNA è anche un modo per ridurre gli errori: senza due estremità libere da ricucire, sono meno probabili le piccole perdite o i riarrangiamenti di sequenza che la riparazione può introdurre. Il prime editing va oltre: usa una Cas9 che incide un solo filamento, accoppiata a una trascrittasi inversa, l’enzima che fabbrica DNA usando un RNA come stampo. La guida impiegata in questo caso, chiamata pegRNA (prime editing guide RNA, la guida del prime editing), è un RNA che svolge due compiti insieme: indica il punto del genoma da modificare e contiene la sequenza da inserire. Il sistema può così introdurre sostituzioni, piccole inserzioni e piccole delezioni. La sua logica somiglia più a una riscrittura guidata del testo che a un taglio seguito dalla riparazione spontanea.
Ed eccoci alla medicina, il campo che più ha attirato l’attenzione del pubblico. Qui il percorso è lento e sorvegliato, perché i vincoli biologici e regolatori sono stringenti. Le prime applicazioni approvate sono di tipo ex vivo: le cellule vengono prelevate dal paziente, modificate fuori dal corpo, verificate e poi reinfuse. Casgevy, una terapia basata su CRISPR-Cas9, lavora su cellule staminali ematopoietiche autologhe; “ematopoietiche” indica le staminali da cui derivano le cellule del sangue, “autologhe” che provengono dallo stesso paziente che le riceverà. È stata sviluppata per l’anemia falciforme e la beta-talassemia, e agisce su una regione regolatrice del gene BCL11A, cioè su un tratto di DNA che controlla quanto quel gene è attivo in certe cellule. BCL11A contribuisce a spegnere, dopo la nascita, l’emoglobina fetale; riducendone l’attività nelle cellule che daranno i globuli rossi, se ne riattiva la produzione e questa emoglobina fetale compensa almeno in parte il difetto di quella adulta. In questo caso CRISPR non corregge la mutazione che causa la malattia, ma modifica il programma regolatorio della cellula per riattivare una funzione normalmente silenziata dopo la nascita.
Più complesso è l’editing in vivo, cioè dentro l’organismo. Qui l’editor genetico va somministrato al paziente, deve raggiungere il tessuto giusto, entrare nelle cellule giuste, modificare il bersaglio previsto e limitare gli effetti altrove. La consegna, il modo in cui i componenti arrivano alle cellule bersaglio, diventa allora una parte centrale della terapia. Fra i veicoli più studiati ci sono le nanoparticelle lipidiche, capaci di proteggere l’RNA e di favorirne l’ingresso nelle cellule. Un esempio avanzato riguarda l’amiloidosi da transtiretina, malattia in cui la transtiretina, una proteina prodotta soprattutto dal fegato, forma depositi anomali nei tessuti. La terapia NTLA-2001 usa nanoparticelle lipidiche per portare nel fegato l’informazione necessaria a produrre Cas9 e una guida diretta contro il gene TTR, che porta le istruzioni per la transtiretina, in modo da inattivarlo nelle cellule epatiche e ridurre la proteina che alimenta i depositi. Il fegato è uno dei primi bersagli in vivo perché molte nanoparticelle lipidiche, dopo la somministrazione nel sangue, tendono ad accumularsi proprio lì. Altri approcci usano invece virus resi innocui come navette: il loro guscio entra nelle cellule con grande efficienza e, al posto dei geni virali, porta le istruzioni dell’editor. Ogni veicolo ha vantaggi e limiti propri, per quantità di materiale trasportabile, durata dell’effetto e reazione del sistema immunitario.
La stessa logica di consegna apre una frontiera ancora più ambiziosa: fabbricare cellule terapeutiche direttamente nel paziente. Le CAR-T tradizionali sono linfociti T modificati perché esprimano un recettore artificiale, il CAR (chimeric antigen receptor, recettore antigenico chimerico). “Chimerico” indica che il recettore combina in un’unica struttura parti molecolari di origine diversa: una porzione esterna che riconosce il bersaglio sulla cellula da colpire e una interna che attiva il linfocita T. Oggi questi linfociti vengono prelevati dal paziente, modificati in laboratorio, moltiplicati e reinfusi; la procedura può essere efficace in alcuni tumori del sangue, ma richiede strutture specializzate, tempi lunghi e gestione complessa. L’in vivo CAR-T prova a spostare questa fabbricazione dentro il corpo, consegnando ai linfociti T, là dove sono, l’informazione per produrre da sé il recettore. Alcuni approcci usano RNA messaggero trasportato da nanoparticelle lipidiche indirizzate contro marcatori specifici dei linfociti T; un marcatore è una molecola che identifica un tipo cellulare, e se la nanoparticella lo riconosce può entrare di preferenza in quelle cellule. La difficoltà maggiore è la selettività: raggiungere solo le cellule giuste, produrre una quantità controllata di recettore, non scatenare reazioni immunitarie, poter seguire le cellule modificate nel tempo.
CRISPR, del resto, non si è fermato alla medicina umana. In agricoltura serve a intervenire su geni legati alla resistenza ai patogeni, alla tolleranza alla siccità, alla qualità nutrizionale, alla resa, per ottenere piante più adatte ad ambienti difficili. Nei microbi industriali permette di ridisegnare le vie metaboliche, le sequenze ordinate di reazioni con cui una cellula produce una molecola utile, così che batteri e lieviti possano fabbricare farmaci, enzimi, biocarburanti, composti di interesse tecnologico. Anche la diagnostica ha messo al lavoro proteine Cas diverse da Cas9: Cas12 riconosce DNA, Cas13 riconosce RNA, e in alcuni sistemi, una volta trovato il bersaglio, attivano un taglio collaterale su molecole-segnale aggiunte al test, producendo fluorescenza o un altro segnale misurabile. È il principio dei test rapidi per identificare sequenze virali, batteriche o genetiche.
I batteri usano CRISPR-Cas per conservare le tracce dei loro invasori e dirigere proteine di difesa contro le sequenze riconosciute. Da questa funzione i ricercatori hanno ricavato uno strumento che spegne geni, corregge mutazioni, costruisce modelli di malattia, sviluppa terapie cellulari, modifica piante e alimenta test diagnostici. Sotto le sigle e gli enzimi, il principio che rende possibile tutto questo è uno solo: due sequenze complementari si appaiano. È la stessa regola che tiene insieme i due filamenti del DNA in ogni nostra cellula e che permette di copiarlo; CRISPR la usa per portare una proteina a tagliare nel punto indicato dalla guida.
Questo principio, però, non basta a garantire precisione. Dipende dal tipo di guida, dalla proteina Cas, dal veicolo di consegna, dal tessuto e dal modo in cui la cellula ripara il DNA, e una guida può legarsi anche a sequenze simili a quella voluta, producendo tagli in punti del genoma diversi da quello previsto. Per questo ogni applicazione richiede prove di efficacia e sicurezza.
C’è poi una distinzione che conta più di ogni dettaglio tecnico, e riguarda dove si interviene. Tutte le terapie di cui si è parlato modificano cellule somatiche, cioè le cellule del corpo di un individuo già nato: il cambiamento riguarda quel paziente e non passa ai figli. Modificare invece le cellule germinali, quelle che danno origine a spermatozoi e ovuli, oppure un embrione ai primi stadi, significa introdurre una modifica ereditabile, presente in ogni cellula della persona che nascerà e nei suoi discendenti. L’editing germinale sull’uomo è oggi vietato o fortemente limitato quasi ovunque: sia perché un errore si propagherebbe a un intero organismo e alle generazioni successive, sia per le implicazioni di una scelta che ricadrebbe su individui non ancora nati e incapaci di acconsentirvi.
A oggi le prime terapie ex vivo sono già state approvate per alcune malattie del sangue, l’editing in vivo ha dato i primi risultati nel fegato, dove i veicoli di consegna arrivano più facilmente, e la ricerca prova a costruire le cellule terapeutiche direttamente nel paziente.
Il controllo dell’informazione, fuori di noi nella comunicazione così come dentro di noi a livello di una sequenza di DNA, è la chiave.
immagine: Deposition authors: Mulepati, S., Bailey, S.; visualization author: User:Astrojan