Una rivoluzione in termini di resa, costi e tempi
La Next Generation Sequencing (NGS) ha rivoluzionato l’approccio allo studio del genoma. Per molti anni il sequenziamento è stato fatto tramite elettroforesi capillare (tipicamente sequenziamento Sanger), che consente di ricostituire la sequenza di un singolo frammento di DNA. Il sequenziamento Sanger avviene tramite la registrazione dei segnali di incorporazione di nucleotidi fluoromarcati che vengono utilizzati per sintetizzare un filamento complementare al frammento di DNA. Anche la NGS si basa su un principio analogo, solo che la reazione può essere fatta per moltissimi frammenti di DNA in parallelo e non per uno soltanto. Tramite NGS è quindi possibile ottenere in modo rapido (e persino più economico) una grandissima quantità di sequenze (in una singola corsa è possibile ottenere gigabasi o addirittura terabasi di informazioni). Per questo motivo la NGS è nota anche come high-throughput sequencing.
Reads e coverage
Nella NGS, il DNA di un individuo viene rotto in numerosissimi piccoli frammenti (ad esempio attraverso l’uso di ultrasuoni – sonicazione) a costituire la cosiddetta libreria di sequenziamento (sequencing library). Questi piccoli frammenti fungono da stampo per la sintesi di numerosi frammenti complementari (detti reads). Ogni piccolo frammento del DNA originario viene cioè copiato molte volte in un numero variabile di reads. A seconda del livello di precisione desiderato è possibile settare il sistema per ottenere un certo livello di coverage, ossia un certo numero di reads (ad esempio, 100 reads per frammento – che si definirebbero in gergo ‘coverage 100x‘ – sono già sufficienti per la diagnostica di routine delle malattie mendeliane, mentre la diagnostica delle mutazioni somatiche tipiche dei tumori può richiedere coverage fino a 500x o 1000x). Un computer raccoglie poi tutte le sequenze delle reads ottenute e le allinea con le sequenze di riferimento (reference sequence) annotate nei database. In questo modo le sequenze delle reads possono essere ricomposte come in un puzzle fino ad ottenere la sequenza del gene o del genoma dell’individuo analizzato. Per ulteriori dettagli tecnici sul funzionamento della NGS potete leggere qui.
Principali applicazioni
Le macchine NGS ad oggi disponibili sono dispositivi molto flessibili. In effetti, una sequenziatore NGS può essere utilizzato per diversi tipi di applicazioni:
1. Whole Genome Sequencing – WGS, noto anche come Whole Genome Shotgun: analisi dell’intero genoma di un individuo
2. Whole Exome Sequencing – WES: analisi dell’intera regione codificante di tutti i geni di un individuo
3. Targeted Sequencing: analisi di un gruppo di geni (pannello) o di singolo gene.
4. Transcriptome Analysis: analisi di tutti gli RNA prodotti da una cellula (trascrittoma).
Multiplexing
Le applicazioni 2 e 3 richiedono uno step aggiuntivo (il cosidetto Target Enrichment) e possono essere eseguite anche per molti campioni in contemporanea, tramite il cosiddetto Multiplexing. I DNA di ciascun individuo possono essere distinti attaccando alle estremità di ogni frammento della sequencing library delle sequenze specifiche (dette sequenze barcode). Poiché nella sintesi delle reads vengono copiate anche le sequenze barcode è possibile distinguere in un secondo momento le reads di ciascun individuo e separarle (de-multiplexing) prima di procedere all’allineamento con le reference sequence.