Low-pass genome sequencing: una nuova prospettiva per l’analisi delle CNV!

NGS, coverage e identificazione delle CNV

Il sequenziamento di nuova generazione (NGS, Next Generation Sequencing) ha cambiato profondamente il mondo dei test genetici, permettendoci di sequenziare l’intero esoma o l’intero genoma in un singolo esperimento, e con un livello di efficienza, convenienza e scalabilità senza precedenti. Il sequenziamento ad alta resa basato sulla produzione di short reads ha potenziato i laboratorio di tutto il mondo. Ora possiamo vagliare un’enorme quantità di dati per individuare le mutazioni patogene in modo più rapido. Questo è molto utile nel campo delle malattie genetiche rare, in particolare per i casi di odissea diagnostica.

Il coverage è importante in NGS. Il coverage è definito come il numero di reads che mappano in maniera non ambigua su un tratto di DNA specifico o su una posizione nucleotidica. È richiesto un numero sufficiente di reads adeguatamente allineate per leggere correttamente un tratto di DNA. Livelli più alti di coverage richiedono costi maggiori, ma minimizzano la probabilità di falsi positivi e falsi negativi.

Nelle malattie Mendeliane, le Copy Number Variation (CNV) possono essere eseguite a partire dai dati NGS. Soprattutto quando si esegue il sequenziamento dell’intero esoma, migliore è la copertura, più raffinati sono i risultati dell’analisi CNV! Nell’analisi CNV basata sul sequenziamento dell’intero esoma, uno dei passaggi chiave è il confronto del coverage medio delle regioni genomiche target con un insieme di controlli ben curato.

Biologia molecolare vs Matematica

OK, facciamo un passo indietro. Cosa sono le CNV? Le Copy Number Variation (CNV) sono varianti strutturali che consistono in una perdita o in un acquisto di grandi porzioni di genoma. La maggior parte di queste contribuisce alla diversità genomica umana, mentre altre possono causare malattie genetiche. Sebbene il sequenziamento dell’intero esoma e dell’intero genoma siano utilizzati principalmente per identificate piccole variazioni di un singolo nucleotide (SNV), oggi possono essere utilizzati anche per rilevare le CNV.

L’analisi dei microarray cromosomici (o CMA, chromosomal microarray analysis, comprendente array-CGH e high-density SNP-array) è stata a lungo considerata il gold standard per l’analisi delle CNV. La CMA è il test genetico raccomandato come primo approccio il ritardo mentale e le anomalie congenite. La CMA è una tecnologia basata su un microchip, quindi è molecolare (il DNA del paziente viene materialmente utilizzato per eseguire un’analisi “umida” su un array).

L’analisi algoritmica delle CNV consiste nell’identificazione di grandi delezioni/duplicazioni sulla base di calcoli (quindi non è molecolare, è un metodo matematico, basato sui valori medi di un pool di riferimento di controlli e sulla validità dell’algoritmo applicato).

Low-pass genome sequencing: meno è meglio!

Il low-pass genome sequencing (LPGS, o low-pass GS, o sequenziamento del genoma a basso coverage) consiste nel sequenziamento ad alta resa dell’intero genoma umano ad un basso coverage.

Una pietra miliare è l’articolo pubblicato nel 2015 dal Consorzio The 1000 Genomes Project. Gli autori riportano il completamento del progetto 1000 Genomi, conclusosi con la ricostruzione della sequenza genomica di 2504 individui provenienti da 26 popolazioni differenti. In questo progetto, gli individui di controllo sono stati sequenziati con il sequenziamento del genoma a basso coverage (con una copertura media di 7,4x) accompagnato dal sequenziamento dell’esoma con coverage medio di 65,7x. Sorprendentemente, il sequenziamento del genoma a basso coverage si è dimostrato in grado di  identificare le CNV in maniera corretta nei campioni di DNA.

Tieniti forte, ora entriamo nei dettagli tecnici!

Un LPGS condotto su un campione di DNA umano con un coverage dello 0,5x dovrebbe produrre almeno una read su 33 milioni degli 85 milioni di siti presenti nel progetto 1000 Genomi, laddove, invece, una genotipizzazione con CMA riesce a identificare un numero di varianti di uno o due ordini di grandezza inferiore. Inoltre, nell’LPGS non c’è l’errore sistematico in fase d’identificazione della variante poiché funziona indipendentemente dalla regione del DNA in cui si trovano le varianti.

Inoltre, i risultati della CMA dipendono dalla densità delle sonde dell’array, mentre il sequenziamento dell’intero genoma dovrebbe mappare la CNV attraverso l’intero DNA umano.

Passando dalla teoria alla pratica…

In uno studio, l’LPGS è stato utilizzato per l’analisi delle CNV su una coorte di 1077 coppie con poliabortività in parallelo con analisi cromosomiche standard. Gli autori sono stati in grado di trovare anomalie cromosomiche anche nelle coppie che in precedenza avevano ricevuto un cariotipo normale. Dunque, l’LPGS ha portato ad un incremento del tasso di successo diagnostico (Dong et al., 2019).

Il low-pass GS è stato anche valutato rispetto al CMA nella diagnostica prenatale.  L’LPGS non solo ha identificato tutti i riarrangiamenti cromosomici rilevati dai microarray, ma ha rilevato anomalie cromosomiche aggiuntive in altri casi. Utilizzando i risultati CMA come riferimento, il low-pass genome sequencing ha mostrato una sensibilità del 99.9% e una specificità dell’87.7%. Questi risultati suggeriscono che l’LPGS potrebbe essere applicato come test diagnostico prenatale alternativo (Wang et al., 2019).

Inoltre, l’LPGS ha mostrato la sua efficacia anche nel rilevare le CNV a mosaico. Più precisamente, se la dimensione della variante strutturale è maggiore di 2,5 Mb, l’LPGS potrebbe identificare CNV con una percentuale di mosaico inferiore al 20%.

Studi recenti hanno convalidato il LPGS come metodica alternativa, più economica e a maggior risoluzione rispetto alla CMA per l’identificazione delle CNV. Testato su centinaia di campioni per l’identificazione di microdelezioni/microduplicazioni, isodisomia uniparentale, triploidia e aneuploidie dell’intero cromosoma, l‘LPGS ha mostrato accuratezza, precisione, specificità e livelli di sensibilità tali da consentire l’identificazione di tutte le CNV precedentemente identificate con la CMA. Ciò ha portato a pensare che il LPGS possa essere la nuova tecnologia all’avanguardia per l’identificazione delle CNV, con costi inferiori e una risoluzione maggiore, forse in sostituzione al CMA come gold standard per l’analisi dei CNV.

La nostra posizione sul low-pass genome sequencing

La Breda Genetics ha avviato una review sistematica interna della letteratura riguardante l’utilizzo del LPGS nello screening delle CNV. Stanno emergendo le seguenti prove:

costi accessibili;
100% di precisione, accuratezza, specificità e sensibilità (usando come riferimento i dati CMA);
maggiore capacità di detection di riarrangiamenti cromosomici rispetto all’analisi microarray, con un aumento del tasso di successo diagnostico;
possibile identificazione delle CNV a mosaico;
applicazione nell’ambito dei test genetici prenatali e postnatali.

Sebbene siano necessari ulteriori studi per confermare queste buone premesse, il sequenziamento del genoma a basso coverage si sta dimostrando un metodo potente che potrebbe diventare il nuovo gold standard nell’analisi dei CNV.

[siteorigin_widget class=”FrmShowForm”][/siteorigin_widget]

Fonti

Miller et al., 2010. Consensus statement: chromosomal microarray is a first-tier clinical diagnostic test for individuals with developmental disabilities or congenital anomalies. Am J Hum Genet. 2010 May 14;86(5):749-64. PMID: 20466091.

Petrackova et al., 2019. Standardization of Sequencing Coverage Depth in NGS: Recommendation for Detection of Clonal and Subclonal Mutations in Cancer Diagnostics. Front Oncol. 2019 Sep 4;9:851. PMID: 31552176.

The 1000 Genomes Project Consortium, 2015. A global reference for human genetic variation. Nature. 2015 Oct 1;526(7571):68-74. PMID: 26432245.

Li et al., 2021. Low-pass sequencing increases the power of GWAS and decreases measurement error of polygenic risk scores compared to genotyping arrays. Genome Res. 2021 Feb 3;gr.266486.120. PMID: 33536225

Chaubey et al., 2020. Low-Pass Genome Sequencing. Validation and Diagnostic Utility from 409 Clinical Cases of Low-Pass Genome Sequencing for the Detection of Copy Number Variants to Replace Constitutional Microarray. J Mol Diagn. 2020 Jun;22(6):823-840. PMID: 32344035.

Hoi Kin Chau et al., 2020. Low-pass genome sequencing: a validated method in clinical cytogenetics. Hum Genet. 2020 Nov;139(11):1403-1415. PMID: 32451733.

Dong et al., 2019. Genome Sequencing Explores Complexity of Chromosomal Abnormalities in Recurrent Miscarriage. Am J Hum Genet. 2019 Dec 5;105(6):1102-1111. PMID: 31679651.

Wang et al., 2019. Low-pass genome sequencing versus chromosomal microarray analysis: implementation in prenatal diagnosis. Genet Med. 2020 Mar;22(3):500-510. PMID: 31447483.

Tag

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *

Contattaci telefonicamente per fissare un appuntamento

MODULO DI CONTATTO

MODULO DI CONTATTO

Email
Conferma Email
Invio

Subscribe to our newsletter to receive news on the world of genetics.

We regularly send specific information for Patients and Professionals with updates and news.
No Spam, that's information.

Newsletter Iscrizione

Newsletter Iscrizione

Nome
Cognome