Corps de l’article
Polycomb, trithorax et la mémoire des états transcriptionnels
L’homéostasie est un processus physiologique fondamental des organismes multicellulaires, dont la régulation implique que les relations biologiques entre différents tissus très spécialisés, ou entre les tissus et l’environnement extérieur, doivent fournir une réponse constante à des conditions de vie hautement dynamiques. Ce processus essentiel à la vie cellulaire concerne l’organisme à tous les niveaux, et il inclut en particulier le contrôle et le maintien des destinées cellulaires. En effet, lorsqu’une cellule s’engage dans un programme de différenciation, son identité doit être conservée après chaque mitose. Ce qui, en termes plus moléculaires, signifie qu’à chaque état différencié correspond un profil d’expression génique spécifique. Pour une cellule embryonnaire « totipotente », le choix de s’engager dans une voie particulière dépend de l’influence de multiples facteurs, dont la conséquence première est l’établissement de profils d’expression géniques spécifiques. Or, de tels stimulus sont très souvent transitoires, et pourtant la cellule engagée dans une voie de différenciation maintient un certain profil d’expression génique après la disparition de ces facteurs de différenciation. Un défaut, ne serait-ce que mineur, dans ce processus de mémoire, peut avoir des conséquences catastrophiques sur le développement ou sur la physiologie de l’organisme. Les protéines des groupes de gènes Polycomb et Trithorax (PcG et trxG) sont des facteurs chromatiniens très conservés au cours de l’évolution des métazoaires, qui sont à la base de ce système de mémoire transcriptionnelle. Après la disparition des facteurs établissant le statut d’expression de leurs gènes cibles, les protéines du PcG et du trxG sont capables de maintenir respectivement réprimés ou actifs ces gènes cibles au cours des générations cellulaires successives.
Certainement parce qu’ils ont été identifiés en premier chez la drosophile, les gènes cibles des facteurs du PcG et du trxG les mieux caractérisés sont les gènes homéotiques. Les profils d’expression de ces derniers varient le long de l’axe antéro-postérieur et déterminent le plan de développement de l’organisme. Ainsi, au cours de l’embryogenèse, ces profils sont établis précocement par une cascade de facteurs de transcription (de types maternel, gap, pair-rule et polarité segmentaire) dont l’action n’est que transitoire [1]. Ces facteurs disparaissent en effet avant la gastrulation. Pourtant, le profil d’expression des gènes homéotiques est maintenu en l’absence de ces facteurs tout au long du développement et de la vie adulte. Cette homéostasie de l’expression des gènes homéotiques est le fait de l’action des protéines du PcG et du trxG. Chez la drosophile, ces protéines agissent en s’associant à des segments d’ADN chevauchants appelés Polycomb- et Trithorax-response elements (PRE/TRE). Autrement dit, il ne suffit pas qu’un gène soit réprimé ou activé pour que ce statut transcriptionnel soit reconnu par les facteurs du PcG ou du trxG. Cette mémoire requiert aussi la présence d’un PRE/TRE, ce qui indique que ces séquences permettent une association stable de ces facteurs sur leurs cibles. Ces éléments ont ainsi fait l’objet d’intenses efforts de caractérisation depuis environ une dizaine d’années. Pour définir une séquence comme étant un PRE, celle-ci doit répondre à deux critères majeurs : elle doit être fixée par les membres du PcG in vivo et, lorsqu’elle est placée à proximité d’un gène rapporteur, celle-ci doit entraîner une répression de ce gène dépendante de l’action du PcG (Figure 1). Jusqu’à présent, peu de séquences présentant ces propriétés ont été isolées. Et une conclusion que l’on peut tirer de l’ensemble de ces études est qu’il n’y a pas, ou très peu, de ressemblance entre ces séquences, qui pourtant présentent les mêmes propriétés in vivo. En effet, la taille d’un PRE peut varier d’une centaine à plusieurs milliers de paires de bases ; sa position par rapport au gène régulé est aussi très variable : proches ou chevauchant le promoteur pour certains PRE, ou bien situés jusqu’à des dizaines de kilobases de celui-ci, en amont ou en aval. Hormis leurs capacités communes à réprimer l’expression d’un gène rapporteur de façon dépendante du PcG, les PRE ont en commun le fait de contenir des sites de fixation pour les protéines Pleiohomeotic et Pleiohomeotic-like (PHO et PHO-like, seules protéines du PcG capables de fixer l’ADN de façon séquence-spécifique) et des sites de fixation pour le facteur GAGA (GAF, une protéine du trxG qui joue aussi un rôle dans le recrutement des facteurs du PcG aux PRE). Une récente étude bio-informatique a utilisé ces critères pour la prédiction de PRE à l’échelle du génome entier, et parmi les séquences identifiées par ce crible in silico et testées in vivo, seule une forte densité de ces sites semble être la caractéristique principale [2]. Pourtant, il ne semble pas que cela soit suffisant à la fonction du PRE puisqu’une multimérisation de ces sites ne permet pas le recrutement des facteurs du PcG in vivo [3, 4].
Reconstitution d’un PRE artificiel in vivo
Nous avons identifié récemment une petite séquence d’environ 200 paires de bases, baptisée Ab-Fab, qui se comporte comme un PRE minimal, et qui peut aussi être transformée en TRE et permettre le maintien d’un état actif dépendant de trxG in vivo [5]. Cette séquence réduite ayant des propriétés de maintien de mémoire des états transcriptionnels fut le point de départ de l’étude décrite dans cet article [6]. Comme tous les PRE/TRE identifiés jusqu’ à présent, Ab-Fab contient des sites de fixation pour les protéines PHO, PHO-like et GAF. Nous avons donc créé et testé, pour la fonction de PRE in vivo, une séquence artificielle contenant ces sites de fixation, en respectant leurs orientations et leurs espacements mutuels. Cette séquence artificielle, bien qu’ayant la même géométrie de sites que la séquence naturelle, s’est révélée incapable de se comporter comme un PRE. Il devait donc y avoir des séquences indéterminées présentes dans Ab-Fab, et absentes de la séquence artificielle, qui devaient jouer un rôle critique dans la fonction de PRE. Il nous a suffit d’aligner ces petits fragments d’ADN d’Ab-Fab avec les autres PRE caractérisés, pour identifier un motif 5’-GAAAA-3’. Ce motif G(A) est retrouvé dans tous les PRE identifiés chez la drosophile, à proximité de sites de fixation pour PHO et PHO-like.
L’ajout de ce petit motif G(A) dans la séquence artificielle confère à cette dernière les propriétés classiques d’un PRE : répression dépendante du PcG d’un gène rapporteur (Figure 1A) et recrutement des protéines du PcG in vivo. En mutant ce motif dans Ab-Fab afin de montrer son importance dans la répression, nous avons obtenu une perte des propriétés du PRE. Non seulement cette mutation détruit le PRE, mais elle entraîne une activation constitutive du gène rapporteur dépendante du trxG (Figure 1D). En d’autres termes, la séquence Ab-Fab mutée au motif G(A) se comporte comme un TRE constitutif. Nous avons ensuite identifié une protéine se liant au motif G(A) in vitro et in vivo : il s’agit du facteur Dorsal Switch Protein 1, Dsp1, qui est l’homologue de la protéine High Mobility Group B2 ou HMGB2. Cette protéine, comme toutes les protéines de la famille HMGB, possède la particularité de se fixer à l’ADN de manière non séquence-spécifique. Elle reconnaîtrait plutôt des structures topologiques de l’ADN plutôt qu’un enchaînement donné de nucléotides tel que le motif G(A). À l’échelle du génome entier, les protéines du PcG se fixent sur une centaine de locus distincts sur les chromosomes des glandes salivaires ; nous avons découvert que Dsp1 se fixe aussi sur la plupart de ces locus (Figure 2).
Les facteurs du PcG semblent jouer le même rôle de gardiens de l’homéostasie transcriptionnelle chez les mammifères, et un nombre croissant de cancers ont, pour cause identifiée, un défaut dans ce système de mémoire. Pourtant, aucun PRE mammifère n’a pu être caractérisé, du fait de la probable absence de similitude entre séquences de diptères et séquences mammifères. Par ailleurs, une maladie génétique, chez l’homme, la dystrophie facio-scapulo humérale, est due à un nombre insuffisant de séquences répétées, non codantes, nommées D4Z4. Le trop faible nombre de ces unités entraîne une dépression des gènes flanquants [7], et un complexe répresseur fixant ces séquences contient justement… les homologues de PHO (YY-1) et de Dsp1 (HMGB2). D4Z4 pourrait donc représenter un premier élément candidat à la fonction de PRE mammifère.
Épigénétique, spécificité de séquence et structure chromatinienne
Comment réconcilier alors l’identification d’un motif donné avec une protéine n’ayant pas d’affinité particulière pour une séquence spécifique ? Notre découverte illustre l’absence apparente de spécificité de séquence dans un grand nombre de phénomènes épigénétiques, qui ont justement pour caractéristique, en simplifiant à l’extrême, la transmission de phénotypes, non prédictible par la seule connaissance de la séquence d’ADN. À l’exception d’un cas récent [8], l’idée générale à la base de tout phénomène d’héritabilité non mendélienne serait la transmission d’une structure chromatinienne, essentiellement sous la forme de modifications post-traductionnelles des histones organisant la chromatine. Un code a même été proposé pour l’interprétation des modifications post-traductionnelles des histones [9]. Comme l’éternelle question de l’oeuf et de ce qui peut en être l’origine, on ne sait pas encore quel type d’événement moléculaire est à l’origine du recrutement de ces facteurs et du maintien de ces structures chromatiniennes. La topologie de l’ADN et l’association de facteurs pouvant lire cet autre code pourrait constituer un début de réponse et ouvrir de nouveaux champs de recherche dans l’étude des phénomènes épigénétiques.
Parties annexes
Références
- 1. Ingham PW, Martinez Arias A. Boundaries and fields in early embryos. Cell 1992 ; 68 : 221-35.
- 2. Ringrose L, Rehmsmeier M, Dura JM, Paro R. Genome wide prediction of Polycomb/Trithorax response elements in Drosophila melanogaster. Dev Cell 2003 ; 5 : 759-71.
- 3. Americo J, Whiteley M, Brown JL, et al. A complex array of DNA-binding proteins required for pairing-sensitive silencing by a Polycomb group response element from the Drosophila engrailed gene. Genetics 2002 ; 160 : 1561-71.
- 4. Horard B, Tatout C, Poux S, Pirrotta V. Structure of a Polycomb response element and in vitro binding of Polycomb group complexes containing GAGA factor. Mol Cell Biol 2000 ; 20 : 3187-97.
- 5. Déjardin J, Cavalli G. Chromatin inheritance upon Zeste-mediated Brahma recruitment at a minimal cellular memory module. EMBO J 2004 ; 23 : 857-68.
- 6. Déjardin J, Rappailles A, Cuvier O, et al. Recruitment of Drosophila Polycomb group proteins to chromatin by DSP1. Nature 2005 ; 434 : 533-8.
- 7. Gabellini D, Green MR, Tupler R. Inappropriate gene activation in FSHD: a repressor complex binds a chromosomal repeat deleted in dystrophic muscle. Cell 2002 ; 110 : 339-48.
- 8. Lolle SJ, Victor JL, Young JM, Pruitt RE. Genome-wide non-mendelian inheritance of extra-genomic information in Arabidopsis. Nature 2005 ; 434 : 505-9.
- 9. Strahl BD, Allis CD. The language of covalent histone modifications. Nature 2000 ; 403 : 41-5.