La regione maschio-specifica del cromosoma Y umano (MSY) include una classe di sequenze, nota come X-trasposta (XTR), originatasi in tempi evolutivi relativamente recenti (~4,7 milioni di anni fa). Tale regione si estende per circa 3,4 Mb, ed esibisce un'elevata (>99%) identità di sequenza con la banda Xq21 del cromosoma X. Data l'elevata omologia di sequenza X-Y, tale regione può essere interessata da un particolare evento di ricombinazione, noto come conversione genica, che consiste nello scambio non reciproco di informazione genetica da una sequenza "donatrice" ad una "accettrice", ed il cui principale effetto è quello di diminuire la divergenza tra le regioni coinvolte. Lo scopo di questo progetto è quello di esplorare la dinamica della possibile conversione genica inter-cromosomica in queste paraloghe, tenendo presente le complicazioni relative al mappaggio non univoco delle reads di sequenziamento in corrispondenza di regioni genomiche dotate di elevata omologia. A tal proposito partiremo dall'analisi di sequenze rese disponibili pubblicamente dal Simons Genome Diversity Project (SGDP), ottenute mediante deep-sequencing di genomi completi ad alta coverage. L'elevata depth di sequenziamento (43X) ci permetterà di eseguire una dettagliata analisi bioinformatica sulla sequenza di 10 campioni del SGDP, disponibili in commercio, il cui DNA è stato già acquisito anche nel nostro laboratorio, che ci consentirà di estrarre tutte le varianti putative contenute nella porzione X-Y in esame. Le posizioni estratte saranno sottoposte ad un'analisi comparativa nei 10 campioni esaminati, al fine di identificare gli eventi di conversione genica, mentre le varianti di sequenze paraloghe (PSV, differenze tra X e Y) saranno sottoposte a validazione sperimentale mediante PCR cromosoma-specifica e sequenziamento di tipo Sanger, al fine di determinare la loro fase sui cromosomi sessuali, e risalire alla direzionalità dell'evento di conversione.
La scelta preferenziale di analizzare una regione finora poco esplorata, dal punto di vista della variabilità genetica, è legata alla volontà di apportare nuove conoscenze circa l'evoluzione molecolare e le dinamiche di conversione genica X-Y. In generale, i dati ottenuti dal deep-sequencing di duplicazioni segmentali, così come i blocchi di sequenza contenuti nelle regioni paraloghe dell'XTR, risultano da sempre di difficile interpretazione. L'output del sequenziamento di nuova generazione consiste, infatti, in corti frammenti di DNA di circa 200 bp, che non possono essere mappati in modo univoco in una specifica regione genomica, nel caso in cui la porzione sequenziata risieda all'interno di duplicazioni segmentali. Per questo motivo abbiamo consultato alcuni dei più noti database pubblici, al fine di selezionare un set di campioni che rispondesse alle nostre esigenze. Nel progetto SGPD il sequenziamento è stato condotto con una depth media elevata (43X), ed è proprio questa caratteristica essenziale che ci permetterà di identificare all'interno delle regioni duplicate un set attendibile di varianti eterozigoti, le quali saranno utilizzate sia come indicatori di eventi di conversione genica, sia per analizzare la variabilità genetica dell'XTR, che è ancora poco nota. A tal proposito, mediante la validazione sperimentale dei siti varianti X-Y, saremo in grado di risalire alla loro fase e attribuire una direzionalità all'evento di conversione, definendo, quindi, se si è trattato di conversione genica da X a Y, o viceversa. Data l'intenzione di selezionare campioni appartenenti ad aplogruppi differenti dell'albero filogenetico del cromosoma Y, ci proponiamo, inoltre, di mappare filogeneticamente l'evento di conversione.
E' noto che l'X-trasposta si sia originata nell'uomo in tempi evolutivi piuttosto recenti (4,7 milioni di anni fa), in seguito alla sua divergenza dallo scimpanzé (Skaletsky et al. 2003; Ross et al. 2005), pertanto, assumendo che le regioni ortologhe sui rispettivi cromosomi X siano rimaste invariate, da un allineamento a 3 sequenze, rispettivamente, tra il cromosoma X di scimpanzé, cromosoma X umano e cromosoma Y umano, si potrebbe definire quale sia lo stato ancestrale delle varianti X-Y osservate, e indagare su eventuali bias nella direzione nell'evento di conversione. Dal punto di vista funzionale, infatti, nell'XTR è nota la presenza di due geni ad espressione tessuto specifica, per cui potrebbe risultare interessante indagare se la conversione genica agisce, effettivamente, in direzione dello stato ancestrale, come è stato osservato per le palindromi del cromosoma Y (Hallast et al. 2013), eliminando le nuove mutazioni che insorgono nelle regioni codificanti.
Questo progetto può essere considerato uno studio pilota per la risoluzione dei problemi legati all'analisi di regioni duplicate, tramite deep-sequencing; i dati ottenuti potranno, quindi, essere utilizzati come punto di partenza per ulteriori studi sulle duplicazioni segmentali in altre regioni del genoma.
Bibliografia
Chen JM et al. (2007) Nat Rev Genet. 8:762-775.
De Marco et al. (2000) Am J Med Genet. 95:216-223.
Hallast P et al. (2013) PLoS Genet. 9:e1003666.
Li H et al. (2009) Bioinformatics. 25:2078-2079.
Mallick et al. (2016) Nature. 538:201-206.
Massaia A and Xue Y (2017) Hum Genet. 36:591-603.
Ross MT et al. (2005) Nature. 434:325-337.
Rozen S et al. (2003) Nature. 423:873-876.
Skaletsky H et al. (2003) Nature. 423:825-837.
Skov L et al. (2017) PLoS Genet. 13:e1006834.
Szostak JW et al. (1983) Cell. 33:25-35.
Trombetta B et al. (2010) Mol Biol Evol. 27:714-725.
Trombetta B et al. (2014) Mol Biol Evol. 31:2108-2123.
Trombetta B and Cruciani F. (2017) Hum Genet. 136:605-619.