Cosa è una read?

Un concetto solo apparentemente difficile

hands pipetting in a labUna read è una piccola sequenza di DNA di sintesi che si ottiene da una reazione di sequenziamento. Il sequenziamento può essere fatto essenzialmente seguendo uno dei seguenti due principi: (1) chromosome walking: la reazione procede in modo ordinato lungo il cromosoma, (2) shotgun sequencing: vengono amplificati e sequenziati pezzi a caso del genoma, che vengono poi riallineati con operazioni bioinformatiche di alignment.

Un prodotto dello shotgun sequencing

Si capisce bene cosa è una read guardando più da vicino le fasi dello shotgun sequencing. Dapprima si procede alla rottura del DNA del paziente in tanti piccoli frammenti, a ciascuno dei quali vengono aggiunte delle corte sequenze nucletodiche (dette adattoriadaptors) che servono ad ancorare i frammenti di DNA al supporto sul quale avverrà la reazione di sequenziamento. L’insieme dei frammenti di DNA preparati tramite l’aggiunta degli adattatori costituisce la sequencing library. I frammenti della sequencing library vengono amplificati e sequenziati fino a ottenere numerose copie complementari di ciascun frammento. Sono proprio queste copie complementari ad essere chiamate reads (in italiano potremmo tradurlo anche con”letture”).

Coverage

Il numero di reads (letture) può essere settato all’inizio. In un sequenziamento NGS di buon livello a scopo di ricerca si producono almeno 30 reads per ogni frammento. In altre parole è un po’ come se ogni frammento della sequencing library fosse letto e riletto 30 volte. In gergo si dice coverage 30x (trenta per – thirty x). In diagnostica il minimo livello accettabile è 50x, anche se la resa dipende spesso dalla metodica e dai kit utilizzati. Non di rado si arriva a 80x o 100x.  Ottenere tutte queste reads è necessario per (1) raggiungere una quantità di segnale sufficiente ad essere captato e (2) coprire il segnale delle reads che contengono errori (il sequenziamento NGS è più impreciso del sequenziamento Sanger, ed è perciò necessario mitigare i segnali di errore con un numero elevato di segnali corretti: ciò si ottiene producendo molte reads). Quando si rende necessario rilevare mutazioni somatiche, ad esempio nel DNA delle cellule tumorali, il livello di coverage arriva a 500x o 1000x.

Come si fa a ricostruire le sequenze geniche del paziente a partire dalle reads?

Molto semplice (almeno concettualmente): gli enrichment kits delle piattaforme NGS sono disegnati per produrre reads con estremità sovrapposte. Le reads possono quindi essere riassemblate sovrapponendone le estremità. Il concomitante allineamento (alignment) delle reads con le sequenze di riferimento (reference sequences) del genoma umano consente di ricostruire interamente le sequenze geniche e intergeniche del paziente. L’intera operazione non è dissimile da quanto si fa con un puzzle, nel quale ogni tessera deve concatenarsi in modo univoco con le altre fino a ricostruire l’immagine originale completa.

Posted in Academia, Technohub, Ultimo Aggiornamento and tagged , , , , , .

One Comment

Leave a Reply

Your email address will not be published. Required fields are marked *