Accanto a DGV, DGVa e DECIPHER, c’è un altro database che elenca le variazioni strutturali del DNA. Si tratta di dbVar, che ci si aspetta essere il più completo dato il suo illustre marchio di fabbrica: NCBI.
Cosa sono le variazioni strutturali
Prima di proseguire ricordiamo la definizione di variazione o variante strutturale, che è di solito descritta come una variazione del numero di copie (Copy Number Variation – CNV) o altro tipo di riarrangiamento (inversione, traslocazione) che coinvolga un frammento cromosomico maggiore di 1000 paia di basi (1Kb). Questa definizione può variare (nel database DGV, ad esempio, si considerano variazioni strutturali tutte quelle più grandi di sole 50 paia di basi – 50bp). Il concetto può tuttavia essere semplificato se lo guardiamo da un punto di vista pratico, definendo come variazioni strutturali tutte quelle mutazioni che sono troppo grandi per essere rilevate dal sequenziamento e troppo piccole per essere rilevate dal cariotipo standard o dalla FISH e che richiedono metodi alternativi per essere identificate, in tutto o in parte (ad esempio qPCR, MLPA, CGH array, ROMA, ecc.).
Le tre voci principali di dbVar

Il database dbVar è strutturato intorno a tre voci principali:
– STUDIES [std]: questo rappresenta il CHI. L’identificativo std rappresenta lo studio (e quindi l’autore) nel quale la variante è stata pubblicata. A differenza delle variazioni di singolo nucleotide come gli SNP, che sono diffusissimi nella popolazione, una variazione strutturale è in genere rara, essendo stata identificata non di rado in un singolo paziente (naturalmente esistono eccezioni). In linea di massima, dunque, ad ogni variazione strutturale corrisponde una precisa pubblicazione, nella quale per altro si trova la descrizione dettagliata del fenotipo clinico associato alla variazione. Nota: l’acronimo nstd identifica gli studi originariamente inseriti in NCBI, mentre l’acronimo estd identifica gli studi originariamente inseriti in EBI.
– VARIANT REGIONS [sv]: questo è il DOVE. Le variant regions sono le regioni che gli autori dello studio definiscono come l’area genomica all’interno della quale la variazione strutturale ricade. La variant region non può considerarsi di per sè la “regione di riferimento”, ma rappresenta semplicemente l’asserzione dell’autore sulla localizzazione della variante strutturale. dbVar infatti recita “poiché la rilevazione sistematica delle variazioni strutturali è ancora agli inizi, non è possibile definire varianti di riferimento [come ad esempio si fa in dbSNP con i numeri rs, ndr]. Man mano che la tecnologia avanza, sarà possibile determinare con maggior precisione i breakpoint e definire dunque una serie di varianti strutturali di riferimento”. Nota: nsv identifica le variant regions originariamente inserite in NCBI, mentre l’acronimo esv identifica le variant regions originariamente inserite in EBI.
– VARIANT CALLS [ssv]: questo è il COSA. Le variant calls sono le varianti vere e proprie, descritte nelle loro caratteristiche e nella loro estensione. L’ontologia di dbVar accoglie diversi tipi di varianti strutturali (“copy number gain”, “copy number loss”, “deletion”, “duplication”, ecc). Nota: nssv identifica le variant calls originariamente inserite in NCBI, mentre l’acronimo essv identifica le variant calls originariamente inserite in EBI.
Il browser NCBI
Tutte le varianti strutturali possono essere visualizzate nel browser NCBI, dove a barre di differenti colori corrispondono diverse classi di varianti (dal blu all’indaco sono rappresentate tutte: dalle duplicazioni alle delezioni alle inversioni – si veda anche il paragrafo “dbVar variant rendering”). In questa grafica possono essere rappresentati sia i punti di rottura (breakpoint) che sono stati identificati in modo preciso (la barra è un semplice rettangolo ben definito) sia quelli che sono stati identificati in modo incerto (la barra è contenuta all’interno di due frecce che possono essere rivolte all’interno o all’esterno: le frecce rivolte all’interno indicano che i breakpoint giacciono all’interno della regione identificata dalla barra, mentre le frecce rivolte all’esterno indicano che i breakpoint giacciono al di fuori della regione).