ClinVar o HGMD?

Qual è il database migliore?

ClinVar - Database geneticiFra tutta l’analitica di laboratorio la diagnosi genetica rimane a tutt’oggi la più difficile, sia dal punto di vista tecnico che dal punto di vista medico. Per raggiungere buoi risultati è necessaio dotarsi di eccellenti protocolli di analisi bioinformatica, il che significa saper scegliere fra le tante soluzioni oggi disponibili. Durante il processamento dei dati, e prima della produzione del referto medico finale, tutte le varianti genetiche vanno analizzate almeno sotto un paio di aspetti: (1) se e come le varianti siano già state annotate nei database più importanti e (2) se e come sia possibile predire il loro effetto in vivo (analisi in silico).

La consultazione dei database

Ci focalizzaremo qui sul primo aspetto. Esistono molti database che elencano le varianti già descritte in letteratura. Alcuni sono ad accesso libero (e.g. ClinVar, sbSNP, dbVar, DECIPHER, ExAC e vari database locus-specifici come, ad esempio, LOVD, il Cystic Fibrosis Mutation Database, il database CFTR2, il RettBASE, ecc), mentre altri sono a pagamento (uno fra tutti: HGMD Professional).

HGMD

HGMD è acronimo di Human Gene Mutation Database, risorsa disponibile a pagamento (HGMD Professional). HGMD tradizionalmente gode di un’ottima reputazione nella comunità scientifica. Le istituzione accademiche possono richiedere un accesso limitato in forma gratuita e alcuni dati (quello meno recenti) sono liberamente  disponibili anche in Genome Browser o Ensembl (pur restando nome e significato della mutazione oscurati). Il contenuto di HGMD Professional viene curato manualmente e le varianti sono suddivise in mutazioni-malattia o possibili mutazioni-malattia (per le malattie Mendeliane) o in varianti associate alla malattia (per le condizioni ad eziologia multifattoriale). Le voci di HGMD vengono selezionate e classificate sulla base degli articoli scientifici pubblicati in PubMed. Scrivere un referto genetico sulla scorta di questo tipo di informazioni è certamente rassicurante, sebbene vada sottolineato come neemno HGMD, nonstante il suo elevato livello di qualità, sia scevro da errori e incompletezze. In HGMD sono contenute sia varianti si singolo nucleotide che grandi delezioni e duplicazioni (per quanto riguarda queste ultime, poiché i dati sono elencati per geni e non per posizione cromosomica, risulta più difficile individuare le mutazioni associate a sindromi da geni contigui).

ClinVar

Un’altro articolo ufficiale su ClinVar è appena stato pubblicato. Il database ClinVar è alimentato da voci che vengono curate a partire da altri database, sia generici che locus-specifici, come OMIM, Generviews, dbSNP, e Uniprot, nonché da sottomissioni dirette provenienti da un ristretto gruppo di laboratori clinici e da alcuni gruppi di ricerca. È importante sottolineare che lo staff di ClinVar non si occupa di arbitrare il significato delle varie sottomissioni, anche quando queste siano discordanti. Ad ogni associazione variante-malattia viene semplicemente assegnato un numero univoco con il prefisso SCV. Ne consegue che per una stessa variante ci possano essere diverse SCV. In ClinVar sono riportate varianti di qualsiasi tipo e grandezza, da variazioni di singolo nucleotide (SNP) a variazioni del numero di copie (CNVs = Copy Number Variations) fino ai grandi riarrangiamenti citogenetici. Gli SNP e le altre varianti di piccole dimensioni (meno di 50 bp) vengono sottomesse dallo staff di ClinVar e per conto dell’autore anche a dbSNP, mentre tutte le varianti di dimensioni maggiori di 50 bp vengono sottomesse anche in dbVar. Per esempio, se facciamo un ricerca per ZEB2 e osserviamo il filtro sulla sinistra dedicato alle dimensioni delle varianti, noteremo che ci sono varianti inferiori a 51 bp, varianti maggiori di 5 Mb e tutte le varianti di dimensioni intermedie. Grazie al Mutation Viewer è inoltre possibile visualizzare i grossi riarrangiamenti su una rappresentazione grafica del cromosoma, il che facilita lo screening delle sindromi da geni contigui.

ClinVar o HGMD?

Più opzioni sono meglio di una sola opzione. Sebbene dare priorità ad un solo database possa essere di una certa utilità pratica almeno nella fase di annotazione automatica, quando cioè si vagliano tutte le varianti ottenute nel pannello o nel genoma/esoma, tenere a portata di mano tutte le alternative, integrandole in modo intelligente, è certamente raccomandabile (in effetti, ogni pipeline bionformatica di buon livello, per determinati parametri, prevede l’analisi multipla attraverso l’impiego di algoritmi diversi: si pensi alle predizioni sulle mutazioni missenso che, da Mutation Taster a PROVEAN e Polyphen2, vengono calcolate utilizzando due o più software diversi, o a strumenti come Alamut – a pagamento – che, per le sole mutazioni di splicing, integra i punteggi di ben cinque software diversi). Una volta selezionato un gruppo ristretto di varianti candidate, confrontarne manualmente la descrizione in diversi database mutazionali può risultare decisivo. Sebbene HGMD sia tradizionalmente, e a ragione, considerato un ottimo strumento, è ormai evidente come anche i database pubblici stiano diventando sempre più affidabili. Le risorse ad accesso libero come ClinVar beneficiano inoltre dal fatto che le riviste scientifiche rendono ormai obbligatoria, prima di accettare un articolo per la pubblicazione, la sottomissione di tutte le nuove varianti nei database pubblici come GenBank, Genomes (WGS), Complete Genomes, Transcriptome Shotgun Assembly (TSA), Short Read Archive (SRA), Gene Expression Omnibus (GEO), BioProject, BioSample, e dbSNP. Sotto questo aspetto ClinVar può essere di particolare appeal per gli autori perché ogni sottomissione fatta a Clinvar viene poi automaticamente inviata anche a dbSNP e dbVar. Ciò potrebbe dunque incrementare ulteriormente l’accumulo di dati in ClinVar, portando auspicabilmente ad una riduzione delle voci con interpretazioni conflittuali.

Referencze: PMID: 26582918, 25812041, 2578268925262649.

Posted in Academia, Technohub and tagged , , , , , , , , , , .

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *