Analisi delle CNV: una chimera?

[siteorigin_widget class=”WP_Widget_Media_Video”][/siteorigin_widget]

Analisi delle CNV basata su dati NGS: il sogno si è avverato?

Il termine Variazioni del Numero di Copie (CNV) si riferisce tradizionalmente a grandi delezioni/duplicazioni di dimensioni intermedie (da 1 kb a 5 kb). Tuttavia, in pratica, quando l’analisi si basa sui dati ottenuti con la Next Generation Sequencing (NGS), CNV viene utilizzato ogni giorno di più per identificare delezioni/duplicazioni di qualsiasi dimensione superiore a 50 pb, da un singolo esone a delezioni/duplicazioni dell’intero gene.

Genetisti e bioinformatici hanno iniziato a immaginare l’analisi CNV basata sui dati NGS molto tempo fa. Da allora, hanno progettato diversi algoritmi e piattaforme, provando e riprovando, revisionando e perfezionando i calcoli. Fino a poco tempo fa il risultato tendeva ad essere sempre lo stesso: un bicchiere mezzo pieno (o un bicchiere mezzo vuoto). I problemi principali riguardavano la risoluzione (che raggiunge difficilmente il livello esonico), la sensibilità (che rimane all’incirca intorno all’85%, ben lontano dal 99% dei metodi molecolari diretti), la necessità di mettere a punto manualmente l’algoritmo a seconda della regione genomica e la risoluzione desiderata e un’interfaccia utente per lo più ostile.

La risoluzione è importante

In generale, gli algoritmi rilasciati per l’analisi delle CNV erano in grado di rilevare ampie delezioni di diverse kilobasi (ad es. una delezione dell’intero gene), ma affidarsi a loro per la rilevazione di del/dup di uno o due esoni era certamente un rischio. Le delezioni esoniche o multiesoniche sono più piccole delle delezioni dell’intero gene, ma possono essere ugualmente patogene, e per questo devono essere sottoposte a screening per avere un quadro genetico approfondito e completo (ad esempio per BRCA1 e BRCA2, ma anche per molti altri geni associati a sindromi e malattie rare). Quindi, praticamente non c’era alternativa: poiché l’aCGH ha una potenza di risoluzione troppo bassa, l’unica alternativa erano l’MLPA e la qPCR (o aCGH ad alta risoluzione). Tuttavia, MLPA, qPCR e aCGH ad alta risoluzione presentano un grande svantaggio in quanto il medico deve sapere esattamente quale/i gene/i  desidera testare. Quindi, fondamentalmente devi avere un sospetto clinico molto ben definito per una specifica malattia o sindrome genetica e rinunciare alla possibilità di test su tutto il genoma.

In Breda Genetics, abbiamo iniziato ad avvicinarci seriamente all’opzione dell’identificazione delle CNV basato sul sequenziamento dell’intero esoma e dell’intero genoma sin dall’inizio, nel 2016. Lo abbiamo eseguito in un buon numero di casi, anche su campioni di controllo di qualità esterni, e nella maggior parte dei casi abbiamo eseguito in parallelo anche metodi molecolari classici per confermare i risultati. I nostri risultati erano sostanzialmente in linea con la media: possibilità molto alte di identificare le delezioni di interi geni (che è già un grande vantaggio rispetto all’aCGH), ma difficoltà consistenti nel rilevare le delezioni di un singolo esone.

Al giorno d’oggi i protocolli sembrano iniziare a migliorare in modo significativo, offrendo miglioramenti consistenti per quanto riguarda il potere di risoluzione e persino nuove tecniche di sequenziamento (leggi di seguito sul low-pass genome sequencing).

Analisi CNV in pannelli tg-NGS, nel sequenziamento dell’intero esoma e nel sequenziamento dell’intero genoma: la differenza.

L’analisi algoritmica delle CNV può essere eseguita su pannelli NGS targeted (tg-NGS), sul sequenziamento dell’intero esoma e sul sequenziamento dell’intero genoma. La maggior parte degli algoritmi sono stati progettati per funzionare sia sui dati di sequenziamento dell’intero esoma che dell’intero genoma; tuttavia, sperimentalmente sono stati applicati anche a pannelli target.

L’analisi algoritmica delle CNV si basa sostanzialmente sul confronto. Per eseguire l’analisi delle CNV basata sui dati NGS è necessario un pool di campioni arricchiti con lo stesso kit di cattura e sequenziati alla stessa profondità di coverage. Quindi, il tuo campione verrà confrontato con quel pool, per vedere se ci sono differenze significative nella profondità di coverage provenienti da regioni geniche specifiche. Solo nel caso del sequenziamento dell’intero genoma, il campione può essere analizzato da solo, poiché la stabilità della copertura consente di utilizzare il campione come controllo di se stesso. Tuttavia, anche per il sequenziamento dell’intero genoma, la corsa su un pool di campioni di controllo è consigliata da molti. Un’altra caratteristica dell’analisi delle CNV basata sul sequenziamento dell’intero genoma è la sua potenzialità di raggiungere livelli estremamente elevati di accuratezza, consentendo l’identificazione della posizione e dell’orientamento della CNV rilevata.

Elencare tutte le varianti o escludere quelle comuni?

Alcuni algoritmi applicati nel test delle CNV sono progettati per evidenziare qualsiasi variazione del numero di copie nel campione. Altri algoritmi, invece, sono progettati per escludere dai risultati tutte le variazioni presenti in due o più campioni (partendo dal presupposto che, se frequenti, siano benigne). Il secondo approccio riduce decisamente la quantità di dati che lo scienziato deve eventualmente valutare. Il primo approccio è sicuramente più completo, ma è molto più laborioso, in quanto qualsiasi CNV deve essere valutata per la sua possibile patogenicità. Per aiutare gli scienziati, alcune piattaforme stanno ora annotando le CNV come patogene, incerte o benigne sulla base di database pubblici. Tuttavia, i database di annotazioni di CNV sono ancora incompleti.

Low-pass genome sequencing: un sostituto per aCGH?

Una nuova tecnica di sequenziamento, chiamata low-pass genome sequencing (cioè sequenziamento dell’intero genoma a basso livello di copertura: 5x), è stata proposta come nuovo strumento per la scansione e il rilevamento delle CNV con una sensibilità maggiore rispetto all’aCGH e, ovviamente, una maggiore livello di risoluzione. Alcuni autori sottolineano che il low-pass genome sequencing è più potente nel rilevare anche le CNV a mosaico. Dando questi risultati incoraggianti, il low-pass genome sequencing è già stato suggerito come alternativa all’aCGH, anche prenatale.

Perché a bassa copertura? Il sequenziamento dell’intero genoma standard utilizzato per l’identificazioni di varianti a singolo nucleotide (SNV) viene solitamente eseguito a 30x (che è più o meno l’equivalente del sequenziamento dell’intero esoma a 100x) e, come detto sopra, è già utilizzato per eseguire l’analisi delle CNV. Tuttavia, il sequenziamento dell’intero genoma a 30x presenta degli svantaggi relativi ai costi, alle dimensioni del file e agli oneri di calcolo. Così gli scienziati hanno avuto l’idea di eseguire il sequenziamento dell’intero genoma con una copertura inferiore per ridurre i costi e accelerare l’analisi, apparentemente con successo.

Curiosamente, il low-pass genome sequencing per il rilevamento delle CNV è già stato testato nella diagnostica prenatale non invasiva (NIPT) su DNA circolante libero da cellule. Secondo quanto riferito, la sensibilità varia in base alle dimensioni della CNV e alla frazione di DNA fetale, ma, ancora più coinvolgente è il fatto che il test si è dimostrato in grado di indicare l’origine dell’alterazione cromosomica (cioè se è esclusivamente fetale o fetomaterno/materno), un aspetto che può essere certamente di aiuto nella valutazione della patogenicità e nella consulenza genetica.

Il futuro: dove stiamo andando?

Non c’è dubbio che molti ricercatori stanno andando nella direzione di trovare un singolo test per testare qualsiasi tipo di malattia genetica. Sarebbe sicuramente un grande risultato, soprattutto in un campo come la Genetica Medica, dove, ancora oggi, l’approccio rimane frammentato in una varietà di test che devono essere messi insieme per confermare una diagnosi (dal test del portatore familiare al sequenziamento dell’intero esoma , a test di pseudogene, a MLPA e altro).

Dopo le glorie del sequenziamento Sanger (l’intero genoma umano è stato sequenziato mediante elettroforesi capillare!), l’ NGS aveva fornito alla comunità scientifica il primo strumento per mettere insieme centinaia di geni per testare un gruppo di malattie: i cosiddetti pannelli NGS multigenici targeted (es. pannelli per il ritardo mentale, per disturbi oftalmologici, per patologie neurogeniche e miopatiche, per la perdita dell’udito, per le malattie metaboliche e così via). Tuttavia, il più grande rimane il salto al sequenziamento dell’intero esoma e dell’intero genoma, due tecniche che, per la prima volta, hanno consentito lo screening dell’intero materiale genomico di un individuo per l’identificazione di SNV. Il prossimo grande passo sembra ora il raggiungimento di test algoritmici delle CNV affidabili e sensibili basati sui dati NGS, sia che si tratti di un’aggiunta al sequenziamento dell’intero esoma e dell’intero genoma ad alta profondità di copertura o come test autonomo attraverso il low-pass genome sequencing in sostituzione di aCGH.

Mentre le istituzioni pubbliche e le aziende private probabilmente faranno sforzi ingenti verso questo passaggio successivo, prove della letteratura più uniformi, conoscenza condivisa (comprese annotazioni CNV più ricche) e piattaforme più facili da usare sono certamente necessarie per convalidare le pipeline ed espandere l’analisi delle CNV in più centri e a costi inferiori. Ma forse la direzione è già stata definita una volta per tutte.

[siteorigin_widget class=”FrmShowForm”][/siteorigin_widget]

Citazioni

Exome sequencing and whole genome sequencing for the detection of copy number variation. PMID: 26088785.

Free-access copy-number variant detection tools for targeted next-generation sequencing data. PMID: 31097148

Clinical Validation of Copy Number Variant Detection from Targeted Next-Generation Sequencing Panels. PMID: 28818680

Low-pass genome sequencing versus chromosomal microarray analysis: implementation in prenatal diagnosis. PMID: 26088785

Copy-Number Variants Detection by Low-Pass Whole-Genome Sequencing. PMID: 28696555

Validation of Copy Number Variants Detection from Pregnant Plasma Using Low-Pass Whole-Genome Sequencing in Noninvasive Prenatal Testing-Like Settings. PMID: 32784382

Tag

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *

Contattaci telefonicamente per fissare un appuntamento

MODULO DI CONTATTO

MODULO DI CONTATTO

Email
Conferma Email
Invio

Subscribe to our newsletter to receive news on the world of genetics.

We regularly send specific information for Patients and Professionals with updates and news.
No Spam, that's information.

Newsletter Iscrizione

Newsletter Iscrizione

Nome
Cognome