Dal metodo Sanger a oggi: 40 anni di sequenziamento del DNA

Il metodo di sequenziamento del DNA inventato da Fred Sanger ha da poco compiuto 40 anni: storia di una metodica che ha rivoluzionato la genetica, e non solo

Il 24 febbraio del 1977 la rivista Nature pubblica un articolo che non può passare inosservato. Delle otto pagine destinate all’articolo, oltre due sono occupate da una distesa ordinata di quattro lettere: A, C, T e G. Non si tratta di un errore tipografico: la sequenza di lettere è la carta di identità genomica del batteriofago ΦX174. L’articolo descrive il primo sequenziamento di un genoma e porta la firma di Frederick Sanger. Dopo pochi mesi, lo scienziato pubblicherà un altro articolo che decreterà il successo del metodo Sanger per il sequenziamento degli acidi nucleici e lo porterà a vincere nel 1980 il secondo premio Nobel per la chimica della sua carriera.
A poco più di 40 anni dalla pubblicazione di questi articoli, ripercorriamo le tappe del sequenziamento del DNA, la tecnologia che ha inaugurato una nuova era della biologia e che ha portato al sequenziamento del genoma umano.

Come siamo arrivati a sequenziare il primo genoma?

Da quando aveva iniziato gli studi di biochimica, Fred Sanger aveva il pallino per il sequenziamento. I suoi studi iniziali si concentrarono sulle proteine: Sanger scelse l’insulina, per le importanti ricadute che questo ormone aveva in ambito medico nel trattamento del diabete. Prima identificò la sequenza di amminoacidi che costituisce i due peptidi che formano l’insulina e poi chiarì la natura dei legami (ponti disolfuro) che li tiene uniti. Questa scoperta, datata 1953, dimostrò che le proteine sono sequenze ordinate (e non casuali) di amminoacidi, e che questo ordine preciso è importante per la funzione della proteina. La scoperta portò Sanger a vincere il premio Nobel per la chimica nel 1958, il primo della sua carriera di scienziato.

Ritratto di Frederick Sanger, premio Nobel per la chimica nel 1958 e nel 1980. L’Istituto Sanger, fondato nel 1993, porta avanti la ricerca di questo scienziato nel campo del sequenziamento del DNA (Wikimedia Commons).

Dopo questo traguardo Sanger rivolse il suo interesse al sequenziamento del DNA. Nel frattempo altri scienziati erano riusciti, con grande fatica, a sequenziare il primo tRNA (1965) e le estremità del genoma del batteriofago lambda (1968). Per sequenziare i 76 nucleotidi del tRNA per l’alanina gli scienziati avevano impiegato circa 3 anni: risultati che oggi, ai nostri occhi, appaiono limitati, ma che all’epoca spianarono la strada verso lo sviluppo di metodi sempre più efficienti.
Il 1977 fu l’anno della svolta: a febbraio, Maxam e Gilbert pubblicarono il loro metodo di sequenziamento, in grado di garantire – seppure in modo lento e laborioso – l’identificazione di circa 100 nucleotidi. Ma l’arena genetica era in pieno fermento ed entro la fine dell’anno furono pubblicati altri due articoli destinati a fare la storia del sequenziamento, entrambi a firma di Fred Sanger: il primo (citato in apertura) riportava, per la prima volta, il sequenziamento di un intero genoma, quello del batteriopfago ΦX174, lungo oltre cinquemila basi. Il secondo articolo descriveva un nuovo metodo di sequenziamento, più rapido e affidabile di quello usato per ΦX174: la nuova tecnologia usava per la prima volta i nucleotidi terminatori di catena. Nasce così il metodo Sanger, che relega in soffitta il laborioso protocollo di Maxam e Gilbert e apre la strada a una nuova era della ricerca genetica.
In questo post di Lisa Vozza sull’Aula di Scienze potete trovare un ritratto di Fred Sanger, scomparso a 95 anni il 19 novembre 2013: Fred Sanger, studente ordinario, due volte Premio Nobel.

Come funziona il metodo Sanger?

La rivoluzione introdotta nel metodo di Sanger si basa sull’impiego dei nucleotidi terminatori di catena, ovvero didesossinucleotidi (ddNTP): rispetto ai nucleotidi usati dalle cellule per la sintesi del DNA, i ddNTP sono privi del gruppo 3’-OH dello zucchero, che è necessario per formare il legame fosfodiesterico con il nucleotide successivo. Una volta incorporati nella catena nascente di DNA, i ddNTP causano l’interruzione della sintesi.
Per sequenziare un frammento di DNA (filamento stampo) il metodo Sanger sfrutta la capacità della DNA polimerasi di copiare la sequenza e sintetizzare un nuovo filamento complementare. Al procedere della reazione, vengono incorporati nel nuovo filamento sia dNTP normali, che permettono alla reazione di proseguire, sia ddNTP che bloccano la sintesi: al termine della reazione, si avrà una miscela di filamenti con lunghezza diversa, a seconda di dove è avvenuto l’inserimento del ddNTP terminatore di catena. Grazie all’elettroforesi su gel i diversi frammenti vengono ordinati in base alla loro lunghezza: la disposizione dei frammenti svelerà la sequenza dei nucleotidi e la stringa del DNA stampo che si voleva sequenziare.

 

Negli anni, il metodo di Sanger è stato ottimizzato con l’impiego dell’elettroforesi capillare (in cui il gel di separazione è inserito in un tubo capillare) e con lo sviluppo di sequenziatori automatici che uniscono la sensibilità della PCR all’uso di ddNTP legati a molecole fluorescenti. Questo sistema offre il grande vantaggio di non dover più preparare quattro reazioni separate, ma può svolgersi contemporaneamente per tutti i nucleotidi in un’unica provetta. Ogni ddNTP è infatti associato a un colore diverso e un raggio laser permette di stabilire l’identità del nucleotide via via che viene inserito nel filamento sintetizzato dalla PCR. Il risultato è una sequenza di picchi di quattro colori diversi (cromatogramma), uno per ogni nucleotide.

La sequenza nucleotidica è rappresentata sotto forma di un grafico in cui ognuno dei quattro nucleotidi è identificato da un colore diverso (Wikimedia Commons).

Quali tecnologie di sequenziamento sono seguite al metodo Sanger?

Il metodo di Sanger ha segnato l’inizio della ricerca genomica ed è stato impiegato con successo da Craig Venter per il sequenziamento del genoma umano. Questo progetto, nonostante il successo raggiunto nel 2001, ha dimostrato alcuni dei limiti del metodo Sanger e nel corso degli ultimi anni la sinergia tra istituiti di ricerca e compagnie biotech ha permesso di inaugurare una nuova generazione di metodi di sequenziamento.
Tra le nuove tecnologie, il Next Generation Sequencing (chiamata comunemente NGS) è quella che più di tutte ha contribuito ad archiviare il metodo Sanger. I primi sequenziatori NGS commerciali sono stati introdotti sul mercato nel 2005 e oggi fanno parte degli strumenti di base di molti laboratori di ricerca genetica.
Esistono diversi tipi di sequenziatori NGS, spesso identificati con il nome della compagnia che li ha sviluppati. Tutti i metodi sono però accomunati da quattro fasi. La prima fase prevede la preparazione della libreria di DNA da sequenziare: l’acido nucleico viene frammentato e unito a speciali sequenze adattatrici. Nella seconda fase si ha la generazione di clusters, in cui i frammenti di DNA sono attaccati a un supporto solido simile a un vetrino e amplificati mediante bridge amplification (un processo che ripiega le sequenze di DNA a ponte). Nella terza fase si ha il vero e proprio sequenziamento, che spesso ricorre all’uso di ddNTP uniti a molecole fluorescenti. L’ultima fase è quella della analisi bioinformatica, basata sul confronto tra le sequenze ottenute e un DNA di riferimento.


Questo video (in inglese) illustra le fasi principali della NGS (Video: Youtube).

La NGS è un esempio di tecnologia high-throughput, ovvero di sequenziamento ad alta resa. A differenza del metodo Sanger tradizionale, la NGS permette oggi di analizzare moltissime sequenze in parallelo, abbattendo i tempi di analisi e i costi: il sequenziamento del primo genoma umano, basato sul metodo Sanger, ha richiesto un investimento di quasi 100 milioni di dollari, mentre oggi la sequenza di un genoma umano si può ottenere con appena 1500 dollari.
Questo non significa che la ricerca di tecnologie ancora più efficienti si sia arrestata. La NGS ha infatti alcuni limiti: richiede l’amplificazione iniziale delle sequenze di DNA (che potrebbe introdurre errori casuali nella sequenza) e porta alla perdita di informazioni “accessorie”, come per esempio la costellazione di modificazioni epigenetiche che sono importanti per comprendere la funzione di un frammento di genoma. Per ovviare a questi limiti, la ricerca sta ora puntando verso metodiche di terza generazione, come per esempio il sequenziamento basato su nanopori (nanopore sequencing). Questa tecnologia deriva da un’osservazione emersa già negli anni Ottanta: quando un DNA a singolo filamento passa attraverso un canale molto stretto (nanoporo) genera un flusso di ioni con un pattern caratteristico, che dipende in modo univoco dalla sua sequenza. Questa tecnologia permetterebbe di sequenziare milioni di nucleotidi, senza ricorrere all’amplificazione dei frammenti di DNA.

Quali sono state le principali applicazioni del sequenziamento del DNA?

I 40 anni che ci separano dalla pubblicazione del primo genoma sono punteggiati da una successione di traguardi importanti: al genoma di ΦX174 hanno fatto seguito quello del batteriofago lambda (sequenziato nel 1982), quello del batterio Haemophilus influenzae (1995) e i genomi dei principali organismi modello usati nella ricerca: S. cerevisiae (1996), C. elegans (1998), D. melanogaster (2000), A. thaliana (2000) e M. musculus, il comune topolino da laboratorio (2002). Ma la data che fa da spartiacque nella storia del sequenziamento è senza dubbio il 2001, anno in cui fu completato il sequenziamento del genoma umano.
I 25 anni del Progetto Genoma Umano: in questo articolo dell’Aula di Scienze puoi trovare un approfondimento sui traguardi raggiunti dall’avvio del Progetto Genoma Umano nel 1991.
Il Progetto Genoma Umano rimane una pietra miliare della ricerca genetica, non solo per il valore dei suoi risultati, ma anche perché ha gettato le basi per un nuovo modo di fare ricerca: ha dimostrato i vantaggi della collaborazione internazionale tra enti di ricerca pubblici e privati; ha messo benzina alla ricerca bioinformatica spronando lo sviluppo di software in grado di gestire immense quantità di dati e favorendo la creazione di banche dati (come GenBank) e software di confronto delle sequenze (come BLAST) aperti a tutti; ha creato una competizione benefica che, nel giro di pochi anni, ha permesso di abbattere i costi e i tempi della ricerca genomica. Tutti questi traguardi hanno permesso di inaugurare un nuovo capitolo della ricerca genetica, in cui – superate le difficoltà di costi, tempi e analisi dei dati – gli scienziati possono ora sbizzarrirsi con le più svariate applicazioni.
L’ambito che più ha beneficiato dei progressi del sequenziamento è quello biomedico: sequenziare il genoma di qualsiasi essere umano e dei suoi tessuti è oggi un obiettivo non fantascientifico come poteva sembrare fino a pochi anni fa. L’obiettivo è ottenere un panorama completo non solo della variabilità genetica tra individui, ma anche dei tessuti di uno stesso individuo e, nell’ambito di uno stesso tessuto, confrontare cellule sane e tumorali. In questa direzione va il progetto Cancer Genome Atlas, che mira a catalogare le caratteristiche genetiche associate di oltre 30 tipi di tumori. Sulla stessa linea, altri progetti cercano di individuare le caratteristiche genetiche associate a malattie cardiache, al diabete o a problemi di sviluppo e malformazioni. Oltre alla sequenza di DNA, oggi è inoltre possibile mappare le modifiche epigenetiche di una sequenza e risalire al suo pattern di espressione, contribuendo ad arricchire il panorama di informazioni che si possono ricavare dal genoma di una cellula. L’applicazione più sofisticata in questo ambito è il sequenziamento su singola cellula, ribattezzato “microscopio genomico” per la sua capacità di studiare le caratteristiche genetiche di una cellula per volta: un’applicazione destinata a rivoluzionare il campo della biologia dello sviluppo e l’oncologia.
Le applicazioni non si limitano alla però medicina: il sequenziamento del DNA è uno strumento indispensabile con cui archeologi e genetisti ricostruiscono il passato evolutivo dei nostri antenati e il tracciato dei loro flussi migratori nel tempo. Un esempio emblematico è Ötzi, la mummia ritrovata tra i ghiacci del Similaun, il cui DNA è stato sequenziato nel 2012.
Oltre alla genetica umana, gli stessi strumenti possono essere applicati allo studio del genoma di qualsiasi specie vivente: questo fa del sequenziamento uno strumento chiave per tassonomisti, ecologi e anche microbiologi, che grazie alla metagenomica hanno potuto affacciarsi sullo sconfinato mondo della “materia oscura” microbiologica. Il sequenziamento di questi batteri sconosciuti potrebbe aiutare a scoprire nuovi antibiotici in grado di far fronte alla attuale crisi della antibiotico-resistenza.

Quale sarà il futuro del sequenziamento?

Dalle sequenze ricostruite manualmente dai ricercatori al primo sequenziamento eseguito nello spazio: in appena 40 anni questa tecnologia ha fatto molta di strada, e non accenna a volersi fermare. Di certo, l’abbattimento dei costi favorirà la disseminazione di questa tecnologia anche nei paesi meno industrializzati: un esempio è il Global Virome Project, che mira a individuare i principali virus trasmissibili all’uomo e che, proprio nei paesi in via di sviluppo, sono causa di gravi malattie.


L’astronauta Kathleen Rubins ha portato a termine, a bordo della Stazione Spaziale Internazionale ISS, il primo esperimento di sequenziamento del DNA nello spazio (Immagine: Wikimedia Commons).

Ma il futuro del sequenziamento potrebbe andare ben oltre il bancone di un laboratorio: alcuni studiosi parlano già di sequenziamento ubiquitario, grazie al quale questa metodica potrebbe entrare nelle case di tutti e diventare un importante sistema di monitoraggio dell’ambiente domestico e della salute di chi ci abita: il DNA contenuto nelle feci può essere usato per monitorare la salute di una persona e una semplice toilette potrebbe trasformarsi in uno strumento di screening biomedico.
Nel campo del monitoraggio ambientale, la svolta potrebbe arrivare con i sequenziatori a nanopori: alcuni sono così piccoli da pesare appena 70 g e gli scienziati stanno sviluppando sensori portatili che potrebbero sequenziare il DNA in appena 30 minuti e fornire in tempo reale informazioni sul genoma di specie diverse. Questa tecnologia, unita a sistemi di localizzazione GPS, sarebbe uno strumento prezioso per il monitoraggio dell’aria, delle acque e del cibo.
Nonostante i vantaggi che queste tecnologie potrebbero apportare, è innegabile che il monitoraggio genetico dell’ambiente e delle persone pone quesiti etici che non possono essere ignorati. Per esempio, nell’ambito della genetica forense, il sequenziamento istantaneo potrebbe essere usato dalle forze dell’ordine per identificare immediatamente il DNA di un sospettato sulla scena di un crimine. Tuttavia, un uso indiscriminato di questo strumento potrebbe minacciare la libertà degli individui.
Il tema della privacy delle informazioni genetiche è già da tempo sul tavolo di chi si occupa di diritti umani, e molti temono che il profilo genetico possa essere usato per discriminare un individuo: basti pensare al caso di una compagnia di assicurazione sanitaria che neghi l’assistenza a una persona portatrice di varianti genetiche ritenute “sfavorevoli”.
Su cosa sia una variante “sfavorevole” esiste comunque ancora un grande dibattito. Alcuni polimorfismi sono stati associati a un aumentato rischio di sviluppare, per esempio, certi tipi di tumore, ma un aumento del rischio non corrisponde a una certezza. Ecco perché i servizi di compagnie come 23andMe, che offrono l’analisi del proprio genoma a prezzi contenuti, sono considerati ancora controversi: se da un lato aumentano la diffusione degli screening genetici, l’interpretazione dei risultati è ancora fumosa e, nelle mani di persone inesperte, potrebbe portare a conclusioni errate o affrettate.

Lara Rossi, da Zanichelli Aula di Scienze

Immagine: Pixabay