Classificazione computazionale dei promotori eucariotici

Questa pagina è in attesa di essere ampliata. Vedi le altre pagine da completare.

Cos'è il promotore

Il promotore di un gene è definito come la regione regolativa in cis rispetto a una specifica locazione (il sito di inizio trascrizione, o TSS) che può guidare la trascrizione del suo gene target in risposta ai segnali ambientali.

Computazionalmente, è spesso convenientemente diviso in 3 regioni: il core-promoter (~80-100 bp circostanti al TSS), il promotore prossimale (250-1000 bp a monte del core-promoter), e il promotore distale (ancora più a monte, normalmente escludendo gli enhancers o altre regioni regolatorie le cui influenze sono indipendenti da posizione/orientamento).

Sebbene molti elementi dei core-promoters siano stati identificati (e nessuno di essi compare in tutti i core-promoters), il codice regolativo combinatoriale entro i core-promoters rimane elusivo.

Infine, circa il 25% dei promotori umani appaiono mancanti degli elementi core-promoter. Questo potrebbe indicare l'esistenza di sequenze core-promoter che devono essere ancora identificate e caratterizzate funzionalmente.

Classificazione computazionale dei core-promoters

È necessaria un'ulteriore caratterizzazione biochimica dei fattori di legame core-promoter in varie condizioni funzionali, prima che diventi possibile una classificazione computazionale dei core-promoters affidabile.

Sebbene siano stati fatti molti progressi nella previsione dei promotori e nella scoperta dei motivi regolatori in cis, i falsi positivi sono ancora il problema principale nella scansione dei genomi interi. Ciò fondamentalmente avviene perché le informazioni sulla struttura della cromatina sono ancora mancanti in tutti i nostri modelli!

La specificità del legame proteine-DNA è parzialmente determinato da fattori energetici e parzialmente dall'"entropia", che dipende da quanto del genoma è accessibile alle proteine leganti il DNA. Senza sapere quali regioni di cromatina sono aperte o chiuse (e in quale misura), i ricercatori devono supporre che l'intero genoma sia accessibile per il legame, il che è ovviamente sbagliato e porterà a più falsi positivi (e falsi negativi a causa del rumore extra). Questo è chiaramente mostrato dai recenti dati ChIP-chip a livello di genoma come pure dai dati di mappatura ad ipersensitività della DNasi I. C'è necessita, per gli algoritmi di ordine predittivo superiore, che siano in grado di predire gli stati della cromatina in base, magari, a misure epigenetiche a livello di genoma, alle isole CpG, e alle caratteristiche di ripetitività, in aggiunta alle sequenze genomiche. È una fortuna che tali tipi di dati si stiano generando rapidamente e gli strumenti di analisi corrispondenti stiano anch'essi arrivando.

Bibliography
1. Tratto da [Review] Computational analyses of eukaryotic promoters (Michael Q Zhang)
Unless otherwise stated, the content of this page is licensed under Creative Commons Attribution-ShareAlike 3.0 License