Article body

Une cellule transmet à sa descendance, outre la séquence de ses gènes, les niveaux d’activité de beaucoup d’entre eux. De même que la séquence peut varier par mutation, le niveau d’activité génique peut changer par « épimutation », ou modification épigénétique, c’est-à-dire héritable et sans altération génétique concomitante. Une épimutation peut avoir des conséquences phénotypiques considérables, qui résistent éventuellement à la disparition des conditions externes qui l’ont provoquée. Par exemple, des épimutations sont responsables de la divergence entre un neurone et une cellule épithéliale provenant du même oeuf et contenant le même génome. Cette différence phénotypique est considérable au regard de celle qui sépare les neurones de deux espèces animales aux génotypes dissemblables, soulignant en cela l’importance des épimutations.

Une vision graduelle, du génome à l’épigénome

La tradition oppose les visions génétique et épigénétique. Cette opposition ne cède pas dans l’histoire récente, où l’épigénétique s’identifie surtout en tant qu’opposition à l’approche réductionniste de la génétique [1]. Dans sa dimension factuelle, cette opposition (Figure 1A) cesserait pourtant d’être absolue si l’on adaptait notre référentiel aux connaissances actuelles. Ce référentiel pourrait comprendre, selon une échelle chimique qui part de la séquence génétique stricto sensu(Figure 1B) :

  1. des nucléotides A, T, G, C ;

  2. des segments d’ADN où les cytosines sont méthylées ou non ;

  3. des segments d’ADN associés ou non à des histones,

  4. celles-ci étant méthylées, acétylées, phosphorylées, ADP-ribosylées, ubiquitinylées, ou non ;

  5. des portions de chromosome subissant des réarrangements à longue portée de leur structure tridimensionnelle ;

  6. des états régulatoires stables et héritables. Dans ce dernier cas, les acteurs moléculaires peuvent se trouver spatialement éloignés du chromosome. Par exemple, la régulation peut s’appuyer sur un « interrupteur » bistable fondé sur des interactions entre protéines cytoplasmiques, avec pour conséquence l’activation ou l’inactivation d’une protéine régulatrice.

Figure 1

Génome et épigénome.

Génome et épigénome.

A. Vision traditionnelle opposant le génétique à l’épigénétique. Les mutations génétiques affectent la séquence nucléotidique de l’ADN. Les autres modifications, ou épimutations, sont dites épigénétiques. B. Vision nouvelle et graduelle allant du génétique aux différentes facettes de l’épigénétique. Les découvertes récentes concernant la dynamique des phénomènes épigénétiques suggèrent un référentiel commun aux mutations et aux épimutations : ce référentiel met en oeuvre des échelles corrélées d’ordres chimique, spatial et temporel. À l’extrême gauche se trouve les mutations génétiques. À l’extrême droite se situent les états régulatoires de la cellule, par exemple un état de différenciation, implémentés par des composants distribués dans tout ou partie de la cellule. Entre ces deux extrêmes se trouvent les méthylations de l’ADN, le recrutement au niveau de l’ADN des histones ou de protéines histone-like, ainsi que leurs éventuelles modifications post-traductionnelles, et les réarrangements structuraux à longue portée du chromosome. Du génome à l’épigénome, les excursions à partir du chromosome sont de plus en plus lointaines (échelle spatiale), les temps caractéristiques pour qu’une (épi-)mutation se produise de plus en plus longs et, à l’inverse, le temps moyen pour que, à la suite d’(épi-)mutations, un changement phénotypique soit fixé est de plus en plus court.

-> See the list of figures

En partant de la séquence stricto sensu, on s’élève donc, de (a) vers (f), au-dessus du génome, dans les niveaux d’organisation du vivant : du génome, on est graduellement passés à l’« épigénome » en investissant des composants répartis dans l’ensemble de la cellule. Cela signifie que l’échelle chimique décrite ci-dessus a une contrepartie spatiale :

  1. les modifications affectent un nucléotide ;

  2. les cytosines d’une courte région chromosomique sont concernées ;

  3. une région chromosomique s’associe aux histones ;

  4. qui pourraient se trouver modifiées dans une sous-région ;

  5. les réarrangements concernent un chromosome entier, peut-être l’ensemble des chromosomes ;

  6. les états cytoplasmiques entrent en jeu.

Cette échelle chimique et spatiale est corrélée à l’échelle du temps que requiert la modification. Mais, de manière plus intéressante, elle est approximativement anticorrélée à l’échelle des temps nécessaires pour que les modifications accumulées engendrent un changement observable (Figure 1B). Ainsi, l’échelle de temps la plus longue est associée au niveau le plus stable, celui des nucléotides et de leurs mutations (a) : la vaste majorité de ces mutations reste en effet sans conséquence phénotypique, et l’échelle de temps de fixation de mutations engendrant une conséquence phénotypique, évolutionnaire, se chiffre en milliers de générations. À l’autre extrémité, les états différenciés, obtenus structuralement (e) ou non (f), peuvent faire l’objet de bascules liées à un stimulus (réponse à un stress par exemple), à une échelle assez proche ou en dessous du temps de génération cellulaire : la différenciation tissulaire provient d’événements étalés sur un petit nombre de divisions cellulaires successives, les états différenciés occupant ainsi des échelles de l’ordre du temps de génération cellulaire. Entre ces deux extrêmes s’étagent les échelles de temps ontogéniques des modifications chimiques des cytosines de l’ADN et des histones formant le coeur des nucléosomes. Par exemple, la teneur globale en résidus cytosine méthylés diminue avec l’âge des cellules mammifères, en même temps qu’augmente la méthylation localisée au niveau des promoteurs géniques [2, 3]. La lignée germinale peut également être altérée par ce type de modifications, entraînant des conséquences sur plusieurs générations organismiques.

En somme, nos connaissances suggèrent désormais de remplacer l’opposition traditionnelle génétique/épigénétique (Figure 1A) par une vision graduelle reposant sur quatre échelles corrélées de changements, chimique, spatiale et temporelles (Figure 1B). Cette vision graduelle est alimentée par les liens multiples qu’entretiennent les effets épigénétiques d’une extrémité à l’autre de l’échelle. Les cytosines méthylées entraînent des mutations lors de la réplication, au point de façonner certaines séquences d’ADN ; réciproquement, une mutation impliquant l’arrivée ou le départ d’une cytosine change évidemment la capacité du site à être méthylé. Une méthylation de l’histone H3 sur sa lysine 9 (H3-K9) déclenche ou cible la méthylation de l’ADN [4-6], et réciproquement [7, 8]. Chez l’arabette et la levure de fission, un lien a été établi entre les effets épigénétiques de certains petits ARN sur les états régulatoires de la cellule et les méthylations sur H3-K9 et l’ADN [9, 10]. Enfin, durant la carcinogenèse, se produisent de manière corrélée des mutations génétiques, des changements de méthylation ou de structure de l’ADN et des dérèglements transcriptionnels [11].

Après avoir plaidé pour une vision nuancée allant du génétique aux différentes facettes de l’épigénétique, l’objectif principal de cet article est de détailler plus avant les points (e) et (f), les autres modes épigénétiques étant largement traités dans d’autres articles de ce numéro. Pour (e) et (f), nos connaissances résident principalement dans le monde des micro-organismes, qui fournira donc la plupart des illustrations.

Réarrangements structuraux tridimensionnels du chromosome (e)

Dans cette section sont traités les réarrangements à longue portée de la structure tridimensionnelle du chromosome, susceptibles d’influencer l’expression génique de manière héritable : il ne s’agit donc pas des remaniements monodimensionnels de la séquence apportés par les recombinaisons. Deux types de structures seront considérés, en quasi-équilibre et en non-équilibre. Cette dernière catégorie est définie par le fait que les structures chromosomiques dépendent totalement de la continuité des activités ayant l’ADN pour substrat, telles que la transcription. Les structures en quasi-équilibre ne dépendent en revanche pas du fonctionnement continu d’une activité liée à l’ADN et de la consommation continue d’énergie. Voici un exemple pour chacun de ces types de structure.

L’archétype d’une structure chromosomique en quasi-équilibre est l’anneau extrêmement compact et latéralement ordonné. Les morphologies annulaires sont en général l’apanage de chromosomes situés dans des formes dormantes de vie telles que les spores, où elles représentent des états de quasi-équilibre du chromosome et peuvent subsister longtemps sans consommer d’énergie [12]. Cependant, la bactérie Deinococcus radiodurans montre ce chromosome annulaire également durant sa croissance (Figure 2A), et cet arrangement particulier est responsable de son exceptionnelle radiorésistance [13].

Figure 2

Structures chromosomiques stables.

Structures chromosomiques stables.

A. Micrographie électronique par transmission d’une cellule de bactérie D. radiodurans, mettant en évidence l’arrangement annulaire de son chromosome (en bleu). Cette organisation extrêmement compacte permet aux fragments d’ADN produits par un traitement comme l’irradiation de maintenir leur ordre séquentiel et de rester proches l’un de l’autre, ce qui favorise la ligature de leurs extrémités libres. Cela représente le cas d’une structure chromosomique en quasi-équilibre (don généreux du Dr A. Minsky, The Weizmann Institute of Science, Israël). B. Arrangement solénoïdal de la fibre d’ADN. Les rectangles rouges représentent les gènes cibles d’un facteur de transcription, les rectangles jaunes ceux d’un autre facteur de transcription. Un tour de solénoïde représente un intervalle entre cibles du même facteur. Ainsi, chaque jeu de cibles est majoritairement regroupé dans l’espace cellulaire, mais séparé des autres jeux. Cet arrangement ne perdure que tant que la transcription est active : il s’agit d’une structure chromosomique en non-équilibre.

-> See the list of figures

L’héritabilité d’une structure chromosomique en non-équilibre est une hypothèse récente étayée par diverses observations. Pour satisfaire le critère d’héritabilité, il est nécessaire que l’activité structurante se poursuive durant la mitose ou la méïose eucaryote, ou la division bactérienne. C’est le cas notamment de l’activité transcriptionnelle, qui se poursuit durant tout le cycle cellulaire chez de nombreux micro-organismes. Cependant, cette héritabilité concerne aussi les cellules mammifères, où l’on a démontré que les chromosomes préservent leur position nucléaire globale de génération en génération, même si les mécanismes de cette préservation sont mal compris [14].

L’importance structurante de la transcription a été mise en évidence par un faisceau d’observations morphologiques et de données d’analyse des transcriptomes. D’une part, la morphologie indique que, chez la bactérie comme chez les mammifères, l’activité transcriptionnelle n’opère pas de manière diffuse, mais se regroupe en points focaux [15, 16]. Chez la bactérie, l’activité redevient diffuse lorsque l’intensité transcriptionnelle baisse, suggérant l’origine dynamique du phénomène [15]. D’autre part, des données récemment obtenues par l’étude des transcriptomes suggèrent qu’un tel point focal correspondrait à des gènes régulés par le même facteur de transcription : en effet, ces gènes cibles « co-régulés » tendent à être régulièrement espacés le long des chromosomes chez l’entérobactérie Escherichia coli comme chez la levure de bière Saccharomyces cerevisiae [17-19]. Si l’on observe les cibles de tout autre facteur de transcription, la même période est observée pour un chromosome donné. L’origine dynamique de ces surprenantes régularités transparaît dans le fait que cette période, constante pour un chromosome donné, diffère d’un chromosome à l’autre, fût-ce au sein d’un même organisme. Ce fait et quelques autres suggèrent donc que ces régularités reflètent la dynamique transcriptionnelle collective. À défaut, il faudrait admettre l’existence de molécules structurant le chromosome de manière périodique et figée mais, bizarrement, selon une période qui dépendrait du chromosome considéré. En somme, les périodicités observées sont compatibles avec une épi-organisation solénoïdale du chromosome, qui regrouperait dynamiquement en des points focaux les deux partenaires transcriptionnels, les facteurs de transcription et leurs sites de liaison sur l’ADN (Figure 2B). Ce regroupement optimiserait les régulations transcriptionnelles en augmentant les concentrations locales des deux partenaires, selon un processus bien démontré dans le cas intragénique (où les sites se trouvent dans la région régulatrice du même gène) [20, 21], qui serait maintenant extrapolé à la situation intergénique. Ici, la dynamique transcriptionnelle est à la fois structurante et fonction de la structure.

États régulatoires nucléo-cytoplasmiques stables (f)

Il est ici question d’effets régulatoires qui verrouillent les cellules dans un schéma transcriptionnel relativement stable, héritable dans les cellules filles après division cellulaire. Les effecteurs sont des facteurs de transcription au sens large, soit des protéines, comme il a été discuté ci-dessus, soit de petits ARN régulatoires dits antisens, non codants, ou interférants ; en effet, certains petits ARN peuvent par exemple entraîner la formation d’hétérochromatine silencieuse sur le plan transcriptionnel. Les propriétés variées de ces états régulatoires peuvent être illustrés par trois exemples, avec comme fil directeur l’analyse logique généralisée [22].

La première démonstration de l’existence de verrouillages épigénétiques date des années 1950 [23, 24]. L’opéron lactose d’E. coli est exprimé en présence d’un inducteur apparenté au lactose : on dit alors que les cellules sont induites. L’un des cistrons de l’opéron code pour la perméase à lactose, protéine membranaire qui pompe l’inducteur externe dans la cellule. Les expériences consistent, à partir d’une culture bactérienne non induite, à lui ajouter une forte dose d’inducteur, puis la fractionner en deux aliquotes, NI et I. Les deux cultures sont ensuite diluées du même facteur, de sorte que la concentration externe en inducteur suffirait à maintenir un état pré-induit, mais ne suffirait plus à induire des cellules non préalablement induites. NI est diluée immédiatement, tandis que I est diluée après 10 minutes : NI n’étant pas induite au moment de la dilution, elle reste non induite, tandis que I, ayant eu le temps d’être induite, le reste. Alors que NI et I partagent une histoire identique à un « détail » près, NI restera non induite et I induite pour au moins 150 générations. Ce phénomène s’explique aisément (Figure 3A, à gauche). L’inducteur est requis dans la cellule pour synthétiser la perméase, et l’inducteur, à cette concentration finale, nécessite la perméase pour entrer dans la cellule. Une cellule sans perméase ne pourra pomper d’inducteur et, en conséquence, ne produira pas de perméase (NI). Mais une cellule contenant au moins une perméase pompera de l’inducteur et produira donc plus de perméase (I). L’expérience a ainsi mis en évidence un interrupteur bistable fondé sur un circuit positif au sens de R. Thomas [22] - dans lequel tout composant s’autoactive via le circuit (Figure 3A, à droite). Cet exemple montre que l’information transmissible sur un mode épigénétique met en jeu des composants qui peuvent être situés aux confins de la cellule.

Figure 3

États régulatoires cellulaires.

États régulatoires cellulaires.

A. Le système bistable du lactose. L’opéron lactose d’E. coli code pour une perméase membranaire capable de pomper l’inducteur dans la cellule. Cet inducteur, apparenté au lactose, induit la production de perméase. À gauche, le graphe d’interactions est formalisé comme un circuit positif : la perméase accroît l’inducteur intracellulaire, qui augmente la perméase. À droite, cette stimulation réciproque résulte en une dynamique bistable, avec des trajectoires divergentes : si l’inducteur est en basse concentration, il va tendre à diminuer, et s’il est élevé, il va augmenter. B. Le répressilateur. À gauche, le graphe formalisé indique que trois gènes X, Y et Z s’inhibent l’un l’autre selon une permutation circulaire. C’est un circuit négatif susceptible de stabilisation, ou d’oscillation plus ou moins amortie. À droite, si l’un des gènes, par exemple Z, code pour un rapporteur fluorescent, il sera possible d’observer la trajectoire, ici une oscillation amortie. C. Réseau réglant la production de mucus chez P. aeruginosa. À gauche, le graphe formalisé comprend un activateur A et un inhibiteur B de la production de mucus, agissant dans deux circuits imbriqués, positif (autoactivation de A) et négatif (entre A et B). Ce graphe est l’un de ceux qui sont compatibles avec les connaissances disponibles sur la production de mucus. L’activateur A, ayant deux cibles (lui-même et B), connaît deux seuils et peut adopter au maximum trois valeurs significativement différentes parmi {0, 1, 2} : à valeur 0, A n’active aucune de ses cibles ; à 1, il en active une seule ; à 2, il active les deux. De son côté, l’inhibiteur B, ayant une seule cible, connaît un seuil unique et peut adopter au maximum deux valeurs parmi {0, 1}. Chaque flèche dans le graphe est marquée du numéro d’ordre de son seuil (1 ou 2) et du signe de son influence (-, inhibition ; +, activation). En connaissant les valeurs des paramètres (non indiqués ici), on peut en déduire une dynamique. Le graphe d’état asynchrone est représenté à droite. Les seuils entre les valeurs que prennent A et B sont indiqués par des pointillés, et les transitions par des flèches. Ce graphe montre deux états stables, soit A = 0, soit un cycle 11 → 10 → 20 → 21 → 11…

-> See the list of figures

Le cas du répressilateur [25] est intéressant pour deux raisons. D’abord, c’est un circuit artificiel fonctionnant dans la cellule vivante, une forme de simulation in vivo. Ensuite, la stabilité transgénérationnelle réside ici dans la répétition quasi identique d’un cycle d’états, et non dans la perpétuation d’un état unique. Les auteurs ont implanté dans une souche bactérienne un circuit de régulation transcriptionnelle constitué de trois gènes s’inhibant l’un l’autre en permutation circulaire (Figure 3B, à gauche). Il s’agit donc d’un circuit négatif au sens de R. Thomas [22] - dans lequel tout composant s’auto-inhibe via le circuit - qui peut entraîner, selon le câblage et le paramétrage, soit une stabilisation, soit une oscillation (Figure 3B, à droite). Dans une grande proportion de cellules, les auteurs ont observé au microscope une oscillation stable, dont la période est supérieure au temps de génération, ce qui implique que les cellules filles héritent de l’état de l’oscillateur parental.

La bactérie opportuniste Pseudomonas aeruginosa envahit les poumons des patients atteints de mucoviscidose. Plus tard, la bactérie devient capable de produire un mucus qui augmente sa résistance aux antibiotiques et la déficience respiratoire du patient. La question est de savoir si ce changement est le fruit d’une mutation ou d’une épimutation : la réponse à cette question conditionne en effet l’approche thérapeutique à privilégier. La Figure 3C (à gauche) illustre un des réseaux compatibles avec les données disponibles sur la production de mucus. L’activateur « A » s’autoactive (circuit positif) et active l’inhibiteur « B » qui inhibe « A » (circuit négatif) [26] : les circuits positif et négatif sont donc imbriqués. Le graphe d’état associé à ce réseau (Figure 3C, à droite) indique les trajectoires définies en considérant tous les états possibles de A et B. Les méthodes formelles issues de l’informatique permettent de certifier les modèles (réseaux et graphes d’état associés) qui sont compatibles avec les interactions et les dynamiques observées, et de rejeter les autres [27]. Cette approche facilite en outre la formulation des expériences à la paillasse ou en clinique qui seront les plus discriminatrices pour confirmer ou infirmer les modèles restant en lice, ici pour distinguer entre l’hypothèse de la mutation ou de l’épimutation [28]. Ainsi s’institue une véritable boucle alliant les expérimentations par simulation et celles réalisées à la paillasse.

Conclusions

Les riches modalités de l’épigénome, que cet article a rapidement parcourues, suggèrent de ne pas céder à la tentation d’attribuer a priori au génome une part majeure de l’information cellulaire, tentation visiblement alimentée par la relative facilité d’accès à sa séquence. Elles nous incitent à abandonner la naïveté du déterminisme purement génétique sans sombrer dans un indéterminisme démenti par les faits. Elles suggèrent de relever au contraire le défi d’un déterminisme épigénétique, plus difficile à appréhender, qui connecte en un réseau complexe les constituants de l’objet biologique étudié [29]. Il est important que cette approche scientifique intègre les connaissances issues de l’analyse des niveaux plus élevés du vivant. C’est pourquoi ce projet pourrait être qualifié d’« épigénomique », un terme qui, par analogie avec l’« épigénétique », renvoie à la construction d’objets biologiques par niveaux croissants d’intégration, tout en se référant au génome et à l’épigénome plutôt qu’au gène et à l’épigène [30, 31].