Isole CpG

Le isole CpG sono regioni genomiche, lunghe fino a circa 3 kb, inusualmente arricchite in dinucleotidi CpG nei genomi dei vertebrati altrimenti impoveriti di CpG (Bird 1986). Il genoma dei vertebrati possiede delle isole CpG a monte di molti geni (Bird, 1986).1

La generale mancanza di CpGs nei genomi dei vertebrati è probabilmente una conseguenza della metilazione del DNA, che avviene esclusivamente sulle citosine nei contesti CpG. Dato che le citosine metilate nelle CpGs sono altamente vulnerabili nei confronti di mutazioni spontanee verso le timine, la metilazione del DNA riduce effettivamente i conenuti di dinucleotidi CpG (Coulondre et al. 1978; Bird 1980). Il genoma umano, per esempio, contiene soltanto circa il 20% di CpGs rispetto a quanto è atteso dal suo contenuto di G + C (Bird 1980; Cooper and Krawczak 1989; Elango et al. 2008). Le isole CpG, tuttavia, evitano la metilazione del DNA e preservano i loro CpGs (Antequera and Bird 1993).

Isole CpG ed espressione genica

In una sequenza di DNA di un vertebrato, queste isole sono un forte indizio che un gene inizi nella regione subito a valle. Per esempio, nell'uomo, il 40-50% dei geni è localizzato in vicinanza di isole CpG, e lo stato di metilazione dell'isola CpG riflette il profilo di espressione del gene adiacente.
(Più del 50% dei geni umani iniziano la trascrizione da regioni ricche di dinucleotidi CpG referenziate come isole CpG. [4])
Le isole CpG possono contenere sequenze coinvolte nella regolazione genica.

I promotori dei geni costitutivi contengono isole CpG

La presenza/assenza di isole CpG nei promotori distingue chiaramente i geni rispetto a profili di espressione costitutivi (housekeeping) vs tessuto-specifici (Antequera 2003; Saxonov et al. 2006; Weber et al. 2007) attraverso taxa di vertebrati correlati distantemente (Elango and Yi 2008).
I promotori dei geni housekeeping sono ben legati dall'RNA polimerasi II (RNAP) in differenti tessuti e i promotori di questi geni sono noti per contenere isole CpG. [3]

In H. sapiens, geni con promotori contenenti isole CpG ("geni con promotori CpG") codificano geni costitutivi espressi in tutti i tipi cellulari, ma comprendono anche un numero sostanziale di regolatori "master" dello sviluppo, come i geni HOX. AL contrario, geni con promotori non-CpG tendono ad avere profili di espressione più ristretti e ad essere espressi più tardi nello sviluppo, durante la differenziazione dei tessuti. [4]
Sebbene i promotori di questi geni costitutivi siano noti per contenere isole CpG, le specifiche sequenze di DNA che sono associate ad un elevato legame dell'RNAP ai promotori housekeeping non sono state descritte (Rozenberg et al., 2008). [3]

Questi geni mostrano differenze nei loro profili di inizio trascrizione, e sembrano avere livelli più alti di modificazioni della cromatina associate alla trascrizione. [4]
Diverse linee di evidenza suggeriscono che il processo di inizio della trascrizione differisca tra promotori CpG e non-CpG. Una identificazione sistematica dei terminali 5' dei trascritti dei mammiferi ha rivelato che la trascrizione tende ad iniziare da un'ampia regione nei promotori non-CpG mentre in un picco netto nei promotori CpG. I promotori CpG, inoltre, più frequentemente iniziano la trascrizione in entrambi i sensi, e producono RNA non codificanti instabili persino in assenza de produzione di mRNA di lunghezza completa. [4]

Correlazioni tra lunghezza isole CpG ed espressione genica

Interessantemente, le lunghezze delle isole CpG nei genomi dei mammiferi esibiscono variazioni sostanziali. Per esempio, nel genoma umano, le isole CpG variano in lunghezza di circa 30 volte, secondo le annotazioni dell'University of California, Santa Cruz (UCSC) genome browser. Si ipotizza che a questa variazione corrisponda una differenza funzionale. [2]

I promotori con lunghe isole CpG (LCGI) sono associati con geni espressi in un minor numero di tessuti se comparati ai geni aventi promotori con corte isole CpG (SCGI).

  • Isole CpG lunghe sono associate con una tessuto-specificità intermedia;
  • promotori LCGI contengono un gran numero di TSS orientati verso un'espressione tessuto-specifica;
  • promotori LCGI sono associati preferenzialmente con sviluppo e regolazione.

In generale, TFBS che non contengono una CpG sono coinvolte in espressione genica regolata mentre TFBS che contengono una CpG sono coinvolte in un'espressione genica costituitiva, con alcune sequenze contenenti CpG coinvolte anche in una regolazione genica inducibile e tessuto-specifica.

La metilazione dei dinucleotidi CpG reprime la trascrizione

I geni costitutivi - espressi in tutti i tessuti - presentano isole CpG non metilate, mentre le isole CpG di geni tessuto-specifici sono non-metilate solo nei tessuti in cui il gene adiacente è espresso.
I TFBS non sono legati quando la CpG è metilata. Dinucleotidi CpG non metilati nei TFBS nelle isole CpG permettono ai fattori di trascrizione di trovare i loro siti di legame che accorrono solo nei promotori, a loro volta localizzando RNAP ai promotori. [3] (V. abstract)

Il modo in cui la metilazione influenza l'espressione del genoma è stato un enigma per molti anni. Ora sappiamo che le *proteine di legame al metil-CpG (MeCPs)* sono componenti di entrambi i complessi Sin3 e NuRD di deacetilazione degli istoni. Ciò ha portato a formulare un modello in cui le isole CpG metilate sono i siti bersaglio dell'attacco dei complessi HDAC che modificano la cromatina circostante allo scopo di silenziare i geni adiacenti.

Vedi Metilazione del DNA.

Pubblicazioni correlate

Unless otherwise stated, the content of this page is licensed under Creative Commons Attribution-ShareAlike 3.0 License