Article body

Une partie importante du génome des eucaryotes est constituée de séquences répétées. Celles-ci résultent, en majorité, de l’invasion du génome par des éléments transposables et des rétrovirus endogènes, séquences ayant la capacité de se multiplier. L’expression de ces séquences peut provoquer leur transposition qui est souvent délétère pour l’hôte. Ainsi, des cancers et des maladies génétiques peuvent être associés à l’insertion de ces éléments à proximité ou dans certains gènes. La transposition de ces séquences doit donc être maintenue à un taux compatible avec la survie des espèces. L’expression des éléments transposables est étroitement contrôlée aussi bien au niveau transcriptionnel que post-transcriptionnel.

Ce n’est que très récemment que les mécanismes de ce contrôle ont commencé à être découverts. Conservés au cours de l’évolution, ils ont été mis en évidence chez les plantes, le champignon Neurospora crassa, le nématode Caenorhabditis elegans (C. elegans), la mouche du vinaigre Drosophila melanogaster (D. melanogaster), et dans des systèmes cellulaires dérivés des mammifères. Nous limiterons cette synthèse à C. elegans et D. melanogaster, organismes de référence chez lesquels de nombreuses études ont été réalisées ces dernières années.

Régulation de l’expression des séquences répétées au niveau transcriptionnel

Extinction transcriptionnelle des séquences multiples chez D. melanogaster

La répression de transgènes multiples chez D.melanogaster a été étudiée, entre autres, grâce à miniwhite [1], un transgène dont l’expression peut être détectée en observant directement la couleur de l’oeil. Les individus porteurs d’un allèle white sauvage ont les yeux rouges, alors que ceux qui en sont dépourvus ont les yeux blancs. L’insertion d’une copie unique du transgène miniwhite dans le génome de mouches mutantes pour le gène white produit des mouches aux yeux rouges, ce qui indique que miniwhite est normalement exprimé. Mais lorsque plusieurs copies du transgène sont présentes, les mouches ont les yeux blancs. Le transgène n’est donc plus exprimé dans ces conditions. Au moins deux gènes de D.melanogaster sont impliqués dans l’extinction des copies multiples de miniwhite. Le premier code pour la protéine Enhancer of zeste (E[z]) qui appartient au groupe Polycomb regroupant des répresseurs qui agissent en complexes multimoléculaires maintenant la chromatine dans un état transcriptionnellement inactif [2]. Récemment, trois études indépendantes (pour revue, voir [2]) ont montré que E(z) a une activité méthylase. De telles activités enzymatiques sont essentielles au cours de la mise en place des états réprimés ou déréprimés de la chromatine. Elles agissent en modifiant l’extrémité aminoterminale des histones [3], protéines associées à la chromatine. Le second gène requis pour l’extinction des copies multiples de miniwhite code pour la protéine HP1, dont on observe, sur des chromosomes polytènes de glandes salivaires de larves, qu’elle se fixe sur les transgènes miniwhite éteints. HP1 est un composant de la chromatine. Chez les mammifères, on a démontré que HP1 est nécessaire à la méthylation de la lysine 9 de l’histone H3, une modification chimique associée à un état chromatinien transcriptionnellement inactif.

L’identification de gènes impliqués dans la répression des copies multiples du transgène miniwhite suggère que le contrôle des séquences répétées a lieu, au moins en partie, au niveau transcriptionnel. Cette observation est supportée par d’autres études. Ainsi, lorsque des copies multiples du transgène w-Adh, contenant le gène Adh (alcohol dehydrogenase) sous le contrôle de séquences régulatrices du gène white, sont insérées dans le génome de la mouche, l’expression du gène endogène Adh (normalement non répété dans le génome) et du gène Adh transgénique est réprimée [4]. Cette extinction est d’autant plus forte que le nombre de copies du transgène w-Adh augmente. L’efficacité de cette régulation est affectée chez les individus portant à l’état hétérozygote des mutations dans les gènes Polycombou polycomblike, deux membres du groupe Polycomb. On observe, sur les chromosomes polytènes, que les protéines codées par ces deux gènes sont liées aux sites où sont insérés les transgènes éteints [4].

Chez C. elegans, l’extinction des transgènes a également une composante transcriptionnelle

L’injection d’ADN chez C. elegans conduit à la formation de molécules extrachromosomiques composées de plusieurs centaines de copies de la séquence injectée répétées en tandem [5]. L’expression des séquences portées par les molécules extrachromosomiques est, en général, éteinte dans la lignée germinale, alors qu’elle ne l’est que rarement dans le soma. Les modifications des histones au niveau de ces molécules extrachromosomiques éteintes ont été étudiées par des expériences d’immunochimie [6]. Ces molécules fixent des anticorps capables de reconnaître spécifiquement la forme de l’histone H3 méthylée en position lysine 9.

L’extinction des transgènes semble donc avoir une composante transcriptionnelle, comme le confirme l’identification d’un certain nombre de gènes impliqués dans ce mécanisme. Ainsi, par analogie avec ce qui est connu chez D. melanogaster, le rôle de HP1 dans l’extinction des transgènes a été étudié. Après inactivation du gène codant pour cette protéine, les séquences présentes dans les molécules extra-chromosomiques sont exprimées. HP1 est donc nécessaire à l’extinction des transgènes [7]. Cette répression est aussi dépendante de gènes appelés mes-2 et mes-6, qui appartiennent au groupe Polycomb [8].

Régulation de l’expression des séquences répétées au niveau post-transcriptionnel

Chez C. elegans, la régulation des éléments transposables et l’extinction des transgènes sont apparentées entre elles et à l’interférence par l’ARN

Chez C. elegans, les éléments transposables peuvent s’amplifier dans le soma, mais pas dans la lignée germinale [9, 10]. Cette observation suggère fortement qu’une régulation existe, maintenant le nombre de leurs copies à un niveau réduit dans la lignée germinale. Certains gènes impliqués dans cette régulation ont été identifiés par mutagenèse [11]. Ils peuvent être classés en deux catégories : ceux qui ne sont impliqués que dans la régulation des éléments transposables, et ceux qui sont également impliqués dans l’extinction des transgènes [12, 13] et dans un phénomène de régulation de l’expression des gènes connu sous le nom d’interférence par l’ARN (voir Encadré).

Figure 1

Mécanisme hypothétique de l’interférence par l’ARN chez C. elegans.

Mécanisme hypothétique de l’interférence par l’ARN chez C. elegans.

Après son incorporation dans l’animal, l’ARN double brin est découpé en molécules d’ARN de 21 nucléotides [45]. Ces molécules sont considérées comme l’agent interférant à proprement parler [25] et ont été appelées ARN guides (short interfering RNA (siRNA)). Elles sont incorporées au sein d’un complexe ribonucléoprotéique, appelé RISC (RNA-induced silencing complex). Cette incorporation permet la localisation du complexe RISC au niveau de l’ARNm cible qui va être dégradé par Tudor-SN, une nucléase présente au sein du complexe (voie RISC) [34]. D’autres études ont permis d’établir l’existence potentielle de la voie RdRP (RNA-dependant RNA polymerase), une seconde voie de dégradation de l’ARNm cible [16]. Après interaction des ARN guides avec l’ARNm cible, un second brin d’ARN complémentaire à l’ARN messager serait synthétisé. La molécule d’ARN double brin, ainsi formée, serait à son tour, clivée en ARN guides par l’enzyme Dicer, et les ARN guides néo-formés (ou secondaires, par opposition aux ARN guides primaires qui proviennent directement de la dégradation du signal) seraient utilisés pour entretenir l’inhibition. Les ARN polymérases dépendantes de l’ARN (EGO-1, RRF-1) nécessaires à la synthèse du brin d’ARN complémentaire ainsi que les ARN guides secondaires n’ont été mis en évidence que chez C. elegans, ce qui suggère que la voie RdRP est spécifique de cet organisme (d’après [16]).

-> See the list of figures

Chez C. elegans, la caractérisation du mécanisme de l’ARNi a permis de commencer à comprendre comment les éléments transposables sont contrôlés. Ainsi, des ARN double brin et des ARN guides correspondant aux séquences des éléments transposables ont été mis en évidence dans les souches de C. elegans chez lesquelles les éléments transposables sont régulés dans la lignée germinale [21].

Les ARN double brin caractérisés correspondent pour l’essentiel à des séquences longues d’une dizaine de paires de bases localisées aux extrémités des éléments transposables. Lorsque ces séquences sont insérées dans un transgène s’exprimant normalement dans la lignée germinale, l’expression de ce transgène est éteinte. Cette extinction est dépendante des gènes impliqués dans le contrôle des éléments transposables, ce qui suggère que les ARN double brin identifiés sont effectivement actifs dans le mécanisme de ce contrôle.

Contrôle post-transcriptionnel de l’expression des séquences répétées chez D. melanogaster

L’expression des séquences Stellate (Ste), naturellement répétées dans le génome de D.melanogaster, semble régulée par un mécanisme semblable à l’ARNi [22, 23]. Le locus Ste, localisé sur le chromosome X, est composé de la répétition en tandem d’un cadre ouvert de lecture dont le nombre de copies varie, selon les souches, de quelques unités à plus d’une centaine. L’expression de Ste est réprimée par Su(Ste), un locus indépendant localisé sur le chromosome Y et composé de répétitions en tandem très fortement apparentées à celles composant Ste. La délétion de ce locus se traduit par une stérilité des mâles associée à une surexpression de Ste. Des études successives ont permis de montrer que : (1) les gènes sting/aubergine, spindle-E/homeless et armitage(Tableau 1) impliqués dans l’ARNi sont également nécessaires au contrôle de Ste par Su(Ste) [22, 24] ; (2) les répétitions Su(Ste) produisent deux types de molécules d’ARN simple brin complémentaires, susceptibles de s’associer pour former une molécule double brin (Figure 2) ; (3) l’extinction de Ste s’accompagne, dans les testicules, de la production de molécules d’ARN dont la taille varie entre 25 et 27 nucléotides, et qui sont complémentaires de régions communes à Ste et Su(Ste). La relation entre production de molécules d’ARN double brin de Su(Ste) et extinction de Ste a été établie en utilisant un système cellulaire. Lorsque des cellules porteuses des répétitions Ste fusionnées avec un gène rapporteur sont transfectées avec une molécule d’ARN double brin du type de celle produite par Su(Ste), l’expression du gène rapporteur est supprimée.

Figure 2

Répression de Ste par Su(Ste) chez D. melanogaster.

Répression de Ste par Su(Ste) chez D. melanogaster.

L’existence de deux promoteurs en orientation inverse dans les unités de Su(Ste) conduit à la synthèse de molécules d’ARN complémentaires et à la formation d’ARN double brin permettant l’induction de la dégradation de l’ARNm de Ste par un mécanisme similaire à l’ARNi (voir texte). Les régions communes à Ste et Su(Ste) sont en rouge.

-> See the list of figures

Tableau I

Gènes impliqués dans le contrôle post-transcriptionnel des séquences répétées et l’interférence par l’ARN chez C. elegans et D. melanogaster.

Gènes impliqués dans le contrôle post-transcriptionnel des séquences répétées et l’interférence par l’ARN chez C. elegans et D. melanogaster.

« Oui » et « Non » indiquent que le gène est impliqué ou non dans le phénomène considéré (ARNi, extinction des transgènes (TG), contrôle des séquences répétées (R), contrôle des éléments transposables (ET)). « ? » signifie que l’implication du gène dans le phénomène considéré n’a pas été étudiée. Les protéines concernées respectivement dans le quelling (quel) chez Neurospora crassa (Nc) et la co-suppression (Co-sup) chez Arabidopsis thaliana (At), deux processus de contrôle de l’expression des séquences répétées, sont indiquées. Les protéines participant au complexe RISC (voir Figure 2) sont indiquées par une astérisque. Spindle-E est aussi connue sous le nom de Homeless, et Aubergine sous le nom de Sting. Plusieurs types de ribonucléase semblent intervenir dans les mécanismes d’extinction des gènes. Comme les membres de la famille Dicer (voir texte), les nucléases Tudor-SN ont été conservées au cours de l’évolution. Il s’agit de composants du complexe RISC. Elles pourraient intervenir dans la dégradation de l’ARNm ciblé [34]. MUT-7 est une ribonucléase potentielle, identifiée exclusivement chez C. elegans [11], qui pourrait intervenir dans la stabilisation des ARN guides primaires [35]. RDE-4 et R2D2 possèdent des motifs de fixation à l’ARN double brin et interagissent avec Dicer. Elles pourraient jouer un rôle dans le transfert des ARN guides primaires de l’enzyme Dicer au complexe RISC. Les membres de la famille Argonaute sont largement impliqués dans les mécanismes d’extinction des gènes. Leur(s) rôle(s) est (sont) encore mal défini(s) mais RDE-1 semble nécessaire à la stabilisation des ARN guides primaires chez C. elegans [35]. Cette protéine peut se fixer à RDE-4 [36]. Chez D. melanogaster, Argonaute-1 (AGO-1) agit en aval de Dicer [37] et Argonaute-2 (AGO-2) est associée aux ARN guides [38] au sein du complexe RISC. Des mutants du gène aubergine sont défectifs pour l’ARNi [39] et piwi est impliqué dans le contrôle des séquences répétées et des éléments transposables [40, 41]. Des hélicases ARN putatives sont également impliquées dans l’ARNi. Chez C. elegans, mut-14 code pour une hélicase ARN potentielle [35], qui pourrait être nécessaire à l’initiation de la transcription inverse à l’origine de la formation de l’ARN double brin. DHR-1 est une autre hélicase ARN putative de C. elegans interagissant avec RDE-4 [36]. L’hélicase ARN Dmp68 de D.melanogaster est requise dans le mécanisme de l’ARNi [42]. Enfin, chez D. melanogaster, Armitage, qui est impliquée dans l’ARNi et le contrôle des séquences répétées [43], semble nécessaire à la formation d’un complexe RISC actif [24]. Cette protéine est très proche de SDE-3 présente chez Arabidopsis thaliana où elle joue un rôle dans la co-suppression. Chez D. melanogaster, VIG (vasa intronic gene) et dFXR, semblable à une protéine humaine dont l’expression est affectée chez les patients souffrant du syndrome de l’X fragile [44], font partie du complexe RISC. Dicer, AGO-2 et Dmp68 interagissent in vivo avec dFXR. Chez C. elegans, seule VIG a été identifiée. EGO-1 et RRF-1 sont deux protéines ressemblant à des ARN polymérases dépendantes de l’ARN [16] reconnues chez C. elegans mais absentes chez D. melanogaster. On pense qu’elles utilisent l’ARNm comme matrice pour synthétiser une molécule d’ARN double brin qui sera dégradée en ARN guides secondaires. En accord avec cette hypothèse, aucun ARN guide secondaire n’a pu être détecté dans des mutants de RRF-1.

-> See the list of tables

Chez D. melanogaster, des mécanismes similaires à l’ARNi pourraient également intervenir dans le contrôle des éléments transposables. Ainsi, la recherche systématique d’ARN guides dans des embryons de D. melanogaster a montré qu’un grand nombre d’entre eux correspondent à des éléments transposables [25]. De plus, en contexte mutant pour spindle-E/homeless, l’expression d’un certain nombre d’éléments transposables est augmentée [23].

Des molécules de type ARN guide jouent un rôle essentiel dans le développement

Outre leur rôle dans le contrôle des éléments transposables et des séquences virales [26], les mécanismes que nous venons de décrire sont également impliqués dans la régulation du développement. De nombreux travaux ont ainsi permis de montrer que de très nombreux ARN d’une taille similaire à celle des ARN guides sont codés par le génome. Ils sont appelés microARN et leur conservation au cours de l’évolution permet d’envisager qu’ils jouent un rôle essentiel dans le développement [27]. Leurs modes de production et d’action sont intensivement étudiés. Ainsi, on a montré que le microARN let-7 (Figure 3), conservé chez C. elegans, D.melanogaster, et chez l’homme, subit un processus de maturation dans lequel la protéine Dicer est impliquée [17, 18]. Cette observation est en accord avec l’hypothèse selon laquelle les microARN sont des ARN guides naturels. let-7 interagit ensuite avec la région 3’ non traduite des ARNm des gènes cibles dont il bloque la traduction, régulant ainsi leur expression. Parmi les cibles potentielles de let-7, on trouve lin-41. Il a été montré in vivo que ce gène, qui contrôle le passage de l’état larvaire à l’état adulte chez le nématode, est effectivement une cible biologique de let-7 [28].

Figure 3

Structure de l’ARN let-7 et de son précurseur et mécanisme de régulation de l’expression de ses cibles.

Structure de l’ARN let-7 et de son précurseur et mécanisme de régulation de l’expression de ses cibles.

Avant maturation par la protéine Dicer, l’ARN let-7 a une longueur de 70 nucléotides et forme une structure en tige-boucle. La maturation produit une molécule de 22 nucléotides partiellement complémentaire à la région 3’ non traduite de certains ARN messagers, dont celui de lin-41. L’interaction entre les deux séquences bloque la traduction de l’ARN messager (voir texte).

-> See the list of figures

Les efforts se portent aujourd’hui vers l’identification des cibles potentielles des microARN présents dans les génomes et sur la validation biologique des interactions ARN messagers-microARN prédites par bio-informatique.

Conclusions

Deux études récentes montrent que chez C. elegans et D. melanogaster, les composantes transcriptionnelles et post-transcriptionnelles de la régulation de l’expression des séquences répétées sont probablement connectées, comme cela avait déjà été mis en évidence chez les plantes. Ainsi, les gènes mes de C. elegans interviendraient dans le contrôle de l’ARNi [29], et le gène piwi(Tableau I) de D. melanogaster, impliqué dans la régulation post-transcriptionnelle, jouerait également un rôle dans la régulation transcriptionnelle des séquences répétées [30]. L’étude plus approfondie de cette relation devrait mieux faire comprendre dans quelle mesure deux niveaux de régulation entrent en jeu pour, d’une part contrôler strictement la mise en place du plan d’organisation des organismes, d’autre part leur permettre de résister à l’envahissement de séquences parasites et de virus.

La conservation du mécanisme d’ARNi et la facilité de l’appliquer sur le plan expérimental font de ce phénomène un outil particulièrement utile et performant dans le cadre d’études génomiques. Ainsi, l’ARNi est largement utilisée aujourd’hui dans des cellules humaines en culture pour éteindre l’expression des gènes et en élucider la fonction (pour revue, voir [31]) ((→) m/s 2004, n° 8-9, p. 815). On a récemment montré que cette technique pouvait également être utilisée pour inhiber la prolifération virale dans des cellules de mammifères [32, 33]. Bien que préliminaires en termes d’applications médicales, ces données permettent d’envisager l’utilisation de l’ARNi à des fins thérapeutiques et d’entrevoir que ce mécanisme de régulation, apparemment universel et encore inconnu il y a quelques années, pourrait bientôt être largement utilisé dans le domaine de la santé.