Regolazione combinatoriale in cis

Questa pagina è in attesa di essere ampliata. Vedi le altre pagine da completare.

Analisi della regolazione combinatoriale in cis su promotori sintetici e genomici

I siti per i fattori di trascrizione vengono scoperti con un ritmo veloce.
Problema: capire come questi siti lavorano in combinazione per regolare l'espressione genica.

Qui presentiamo un modello basato sull'analisi delle librerie di promotori sintetici del lievito (Saccharomyces cerevisiae).

Modelli termodinamici basati solo sull'equilibrio di legame dei fattori di trascrizione al DNA e tra di loro hanno catturato una larga frazione della variazione di espressione in ciascuna libreria. Analisi termodinamiche di queste librerie hanno portato alla luce diversi fenomeni nel nostro sistema, compresi la cooperatività e gli effetti dei siti di legame debole.
Quando applicato al genoma di S. cerevisiae, un modello di repressione da parte di Mig1 (che è stato testato in promotori sintetici) predice un numero di geni regolati da Mig1 che mancano di significativi siti di legame per Mig1 nei loro promotori.

Il successo dell'approccio termodinamico suggerisce che l'informazione codificata dalle combinazioni dei siti cis-regolatori è interpretata principalmente attraverso le semplici interazioni proteina-DNA e proteina-proteina, con complicate reazioni biochimiche - quali le modificazioni dei nucleosomi - che costituiscono gli eventi a valle.

I modelli termodinamici di regolazione genica hanno mostrato promettenti risultati in sistemi eucariotici quando applicati a piccoli insiemi di geni.

Le librerie di promotori sintetici

Sono costituite da combinazioni casuali di 3 o 4 siti di legami per fattori di trascrizione (TFBS), o blocchi di costruzione (building blocks).
In totale, abbiamo analizzato 2,807 promotori su 7 librerie usando 18 differenti blocchi di costruzione.
Tutti i promotori sono stati piazzati a valle di un promotore basale di media forza che veicola una proteina fluorescente gialla e integrati nel genoma di lievito a livello del locus TRP1. Il livello di espressione genica diretto da ciascun promotore sintetico è stato quantificato dal flusso citometrico di 25,000 cellule individuali per promotore.

Il modello

La principale assunzione di questo modello è che la regolazione genica è controllata completamente dall'equilibrio di legame delle proteine al DNA e a loro stesse. Gli eventi enzimatici (come le modificazioni della cromatina e la fosforilazione della polimerasi) non sono prese in considerazione.

Il modello consiste di parametri che descrivono i cambiamenti di energia libera in particolari interazioni DNA-proteina e proteina-proteina che possono occorrere nei promotori. Questi parametri sono usati per calcolare le probabilità dell'RNA polimerasi (RNAP) di essere legata a ciascun promotore nella libreria.
Noi assumiamo che la probabilità dell'RNAP di essere legata ad un dato promotore è direttamente proporzionale all'intensità della fluorescenza di YFP misurata per quel promotore.

In ciascuna libreria, i modelli termodinamici hanno spiegato il 44-59% della varianza di espressione, che è più del doppio della quantità di varianza spiegata dai migliori modelli di dati di espressione a livello genomico.

Il valore predittivo del modello

Per la libreria L1 abbiamo costruito una libreria di test che consiste di nuove combinazioni dei blocchi di costruzione L1. Con gli stessi parametri il modello continua a catturare il 44 % della varianza d'espressione, mostrando che il modello non è over-fitted.
Questa mancanza di over-fitting non sorprende, considerando che ciascun modello contiene circa 6 parametri adattati ad una media di oltre 400 promotori.

Il modello riesce a prevedere che il blocco di costruzione 'Spaziatore', che è stato progettato per contenere elementi di sequenza regolatoria predetti o non noti, può reclutare RNAP ai promotori. Siccome metà delle proteine leganti il DNA in lievito non sono state associate a motivi cis-regolatori, è probabile che il sito Spaziatore sia effettivamente un elemento cis-regolatore non identificato. La capacità del modello di incorporare un elemento di sequenza sconosciuto e di prevederne accuratamente il comportamento, punta verso la forza dell'approccio.

Le analisi del modello per la libreria L1 suggeriscono che Mig1 si lega cooperativamente ai promotori sintetici.

Siccome non c'è niente nella precedente letteratura che suggerisca cooperatività tra i monomeri Mig1, abbiamo deciso di analizzare la cooperatività di Mig1 indipendentemente dal modello e abbiamo trovato dati che effettivamente, consistentemente col modello termodinamico, suggeriscono che Mig1 agisca cooperativamente per reprimere la trascrizione nel nostro sistema, il che ci ha portato ad esaminare l'influenza dei TFBS a bassa affinità nell'espressione.

I TFBS a bassa affinità, o deboli, sono noti per svolgere importanti ruoli nei promotori eucariotici e si è ipotizzato che siano importanti nella regolazione genica eucariotica. Comunque, il loro effetto quantitativo nell'espressione genica è difficie da determinare.
Per studiare questi effetti, abbiamo costruito una libreria (L1-debole) incorporando un building block corrispondente a un sito di legame per Mig1 che era noto avere bassa affinità per Mig1 in vitro.

[…]

In S. cerevisiae, siti deboli sono stati trovati nel 24 % di tutti i promotori, mentre il 39 % dei promotori contenente una significativa corrispondenza con una matrice di pesi Mig1 contiene anche un sito debole, indicando che siti deboli e forti tendono a co-comprarire. Su 33 geni noti per essere regolati da Mig1, e i cui promotori contengono una significativa corrispondenza con una matrice di pesi Mig1, 20 contengono anche un sito Mig1 più debole nei loro promotori, rispetto agli 8 geni attesi per caso.
In accordo col nostro modello di regolazione genica, i promotori con un sito forte ed uno debole sono più sensibili ai cambiamenti nella concentrazione di Mig1 rispetto ai promotori con due siti forti o due siti deboli.

Conclusioni

Usando un semplice sistema, abbiamo avuto successo nel costruire un accurato modello della relazione tra sequenza promotrice ed espressione genica. In parte ciò è avvenuto perché abbiamo campionato una frazione molto più ampia di spazio di promotori usando la nostra libreria rispetto a ciò che avremmo potuto fare utilizzando promotori genomici. Quindi siamo stati in grado di adattare modelli contenenti un piccolo numero di parametri ai dati che contenevano un grande numero di osservazioni. Abbiamo trovato che un modello completamente termodinamico basato sull'equilibrio di legame reciproco dei fattori di trascrizione e della RNAP e ai loro siti cis-regolatori, era un modo ragionevole di catturare la relazione tra sequenza promotore ed espressione genica, nel nostro sistema, per tutte le librerie esaminate.
Questo non significa che i processi cinetici, quali la modificazione degli istoni o dell'RNAP, non siano importanti nella regolazione genica; comunque, ciò suggerisce che l'informazione codificata in un promotore è decodificata in prima istanza dal legame sequenza-specifico dei fattori di trascrizione.
I nostri risultati supportano l'idea che la complessità e la variazione della regolazione genica potrebbero derivare da regole molto semplici che descrivono il legame della proteine al DNA e tra loro stesse.

Riferimenti

Voci correlate

Unless otherwise stated, the content of this page is licensed under Creative Commons Attribution-ShareAlike 3.0 License