Sequenziato interamente il cromosoma X umano

Ricercatori del Santa Cruz Institute sono riusciti a sequenziare il genoma del cromosoma X, da telomero a telomero, grazie a una tecnica nominata nanopore sequencing


Il genoma umano è incredibilmente lungo, composto da circa 6 miliardi di basi (Pikaia ne ha parlato qui), e le macchine di sequenziamento del DNA non riescono a leggere questo grande numero di basi contemporaneamente. I genetisti sono quindi costretti a tagliare il genoma in frammenti più piccoli. Queste sequenze di DNA più brevi devono poi essere riassemblate. Nonostante il genoma della nostra specie sia il più studiato, ci sono ancora centinaia di lacune o sequenze di DNA sconosciute. Queste lacune spesso contengono segmenti di DNA ripetitivi che sono eccezionalmente difficili da sequenziare. Tuttavia, questi segmenti ripetitivi includono geni e altri elementi funzionali che possono essere rilevanti per diversi aspetti fisiologici e immunologici.

In un recente studio, pubblicato sulla rivista Nature, ricercatori del Santa Cruz Institute sono riusciti a sequenziare sequenze molto lunghe grazie a nuove tecnologie, come la cosiddetta nanopore sequencing. Con questa recente tecnologia, spiegano gli scienziati, si possono ottenere letture lunghissime di centinaia di migliaia di coppie di base che possono comprendere un’intera regione di ripetizione. I ricercatori hanno scelto di completare la sequenza del cromosoma X, data la sua rilevanza per molte malattie ereditarie (per l’appunto, definite malattie legate al cromosoma X; Pikaia ne ha parlato qui).

I ricercatori hanno usato genoma proveniente da una cellula con due cromosomi X identici (nelle cellule femminili, le X contengono generalmente sequenze differenti) per evitare le differenze di sequenza. Inoltre tale cellula fornisce più DNA per il sequenziamento rispetto a una cellula maschile, che ha solo una singola copia di un cromosoma X. Per completare il cromosoma X, il team ha dovuto sequenziare 29 lacune rimanenti nella sequenza che veniva usata come riferimento, tra cui quella localizzata nel centromero, una regione di DNA ripetitivo che si trova in ogni cromosoma. Nel cromosoma X, il centromero comprende una regione di DNA altamente ripetitivo che si estende su 3,1 milioni di coppie di basi. Gli scienziati sono stati in grado di identificare varianti all’interno della sequenza ripetuta per utilizzarle come marcatori che hanno usato poi per allineare le lunghe letture e collegarle insieme per coprire l’intera regione genomica. Il passaggio successivo è stata una pulizia con tecniche di sequenziamento multiple per garantire la maggiore accuratezza possibile nell’identificazione di ogni base nella sequenza. La tecnica nanopore sequencing oltre a fornire letture ultra-lunghe, può anche rilevare basi che sono state modificate per metilazione, un cambiamento epigenetico che non altera la sequenza ma che ha importanti effetti sulla struttura del DNA e sull’espressione genica (Pikaia ne ha parlato qui).

Con le nuove tecnologie a disposizione, ora i ricercatori hanno la possibilità di raggiungere regioni di ripetizione che coprono milioni di basi che prima erano considerate intrattabili. La capacità di generare sequenze veramente complete di cromosomi e genomi è un’impresa che ci aiuterà ad acquisire una comprensione completa della funzione genomica e che permetterà l’uso delle informazioni genomiche nelle cure mediche.


Fonti:
K.H. Miga et al. Telomere-to-telomere assembly of a complete human X chromosome. Nature, published July 14, 2020; doi: 10.1038/s41586-020-2547-7

Immagine: Prateek Pattanaik / CC BY-SA, via Wikimedia Commons