Corps de l’article

Depuis 1998, il a été montré chez de nombreux eucaryotes[1] que l’ARN double brin pouvait induire une suppression de l’expression génique par des mécanismes spécifiques de séquence. L’inhibition de l’expression peut avoir lieu à différents niveaux (transcription, traduction, dégradation de l’ARNm). Initialement, l’appellation d’interférence par l’ARN désignait la dégradation ciblée des ARN messagers induite par l’ARN double brin [1]. Mais il est apparu ensuite que le blocage de la traduction constituait probablement un autre aspect du même mécanisme.

Mécanisme de l’interférence par l’ARN

C’est en 1998 que le groupe d’A. Fire a mis en évidence chez le nématode Caenorhabditis elegans la capacité de l’ARN double brin d’induire la dégradation des ARN simple brin contenant les mêmes séquences [1]. Grâce aux données obtenues chez les plantes, le champignon ascomycète Neurospora crassa, C. elegans, la drosophile et, plus récemment, chez les mammifères, les grandes lignes du mécanisme sous-jacent ont pu être établies (Figure 1). Les molécules d’ARN double brin sont d’abord découpées par une RNase double brin, l’éminceuse (Dicer) [2], produisant des fragments d’environ 21 nucléotides, les petits ARN interférants (short interfering RNA, siRNA). Ces petits ARN sont ensuite incorporés sous forme de simple brin dans un complexe ribonucléoprotéique où ils servent de guide pour la reconnaissance de la cible. Le complexe, dénommé RISC (RNA-induced silencing complex), peut avoir soit une activité de nucléase spécifique de séquence [3] (Figure 1), soit induire un blocage de l’élongation de la traduction (Figure 2A). Il semble que ce soit le même complexe RISC (ou des variantes très proches entre elles [4]) qui assure ces deux fonctions, la nature de l’appariement avec la cible déterminant le résultat : coupure endonucléolytique pour un appariement « parfait », blocage de la traduction dans certains cas d’appariement imparfait générant une boucle centrale (Figure 2B). Parmi les constituants de RISC, figurent une protéine de la famille argonaute (eIF2C2, un homologue du facteur d’initiation de la traduction eIF2 chez les mammifères) et le produit du gène de l’X fragile qui est un régulateur de la traduction [5]. En revanche, la nucléase responsable de la coupure endonucléolytique n’a pas encore été identifiée.

Figure 1

Interférence par l’ARN.

Interférence par l’ARN.

Les molécules d’ARN double brin sont d’abord découpées par une RNase double brin, l’éminceuse (Dicer), qui produit des fragments d’environ 21 nucléotides, les petits ARN interférants. Ceux-ci sont incorporés sous forme simple brin dans un complexe ribonucléoprotéique dénommé RISC (RNA-induced silencing complex) où ils servent de guide pour la reconnaissance de la cible. Un appariement « parfait » avec l’ARNm cible détermine une activité de nucléase spécifique de séquence du complexe avec la coupure endonucléolytique et la dégradation des fragments.

-> Voir la liste des figures

Figure 2

Inhibition de la traduction par le complexe RISC (RNA-induced silencing complex).

Inhibition de la traduction par le complexe RISC (RNA-induced silencing complex).

A. Le complexe RISC peut induire un blocage de l’élongation de la traduction. B. Séquence des sites de fixation des petits ARN lin-4 et let-7 sur leur cible commune lin-41; l’appariement imparfait de ces séquences produit une boucle centrale. Ces sites sont situés dans la région 3’ non codante de ces messagers.

-> Voir la liste des figures

Il est possible d’induire une interférence en introduisant directement dans les cellules les petits ARN interférants à la place des ARN double brin de grande taille. Le schéma d’un ARN interférant « consensus » est présenté dans la Figure 3A. Ces molécules étant produites par une RNase III, ont des extrémités 3’ qui comprennent en moyenne deux nucléotides non appariés. Il semble que la nature de ces deux nucléotides ne joue pas de rôle essentiel dans l’interférence ; ils peuvent donc ne pas être complémentaires de la séquence du gène cible et être modifiés (désoxynucléotides, nucléotides biotinylés). La phosphorylation préalable de l’extrémité 5’ des molécules n’étant pas indispensable en raison de l’existence d’une kinase cellulaire, il est possible d’utiliser des molécules synthétisées chimiquement (avec des extrémités 5’-OH). Dans des lysats cellulaire, le site de coupure a pu être déterminé : il est localisé en face de la liaison 10-11 de l’ARN guide (Figure 3B).

Figure 3

Les petits ARN interférants.

Les petits ARN interférants.

A. ARN interférant « consensus ». Produites par une RNase III, ces molécules ont des extrémités 3’ qui comprennent en moyenne deux nucléotides (nt) non appariés. B. Dans des expériences in vitro, le site de coupure a pu être déterminé et est localisé en face de la liaison 10-11 de l’ARN guide. C. Un vecteur d’expression pour un ARN en épingle à cheveux permet d’induire et de maintenir à long terme une interférence car des nucléases cellulaires transforment la molécule en épingle à cheveux en une molécule linéaire proche d’un petit ARN interférant capable d’induire l’interférence.

-> Voir la liste des figures

Utilisation de l’interférence chez les mammifères

Dans des cellules de mammifères, la présence d’ARN double brin induit généralement une réponse de type interféron qui comporte également une dégradation des ARNm et une inhibition de la traduction qui ne sont pas spécifiques de séquence. L’interférence par l’ARN existe pourtant bien chez les mammifères comme le montrent des travaux utilisant des ARN double brin de grande taille dans des contextes cellulaires où la réponse de type interféron est absente (développement précoce chez la souris [6], cellules souches embryonnaires [ES] et de tératocarcinome).

L’induction de la réponse de type interféron n’étant efficace que pour des ARN double brin de plus de 30 nucléotides, il était plausible que l’introduction de petits ARN interférants n’induise pas ou peu de réponse de type interféron. C’est ce que le groupe de T. Tuschl a montré en 2001 [7], qui a de plus rapidement établi la faisabilité de cette approche en l’appliquant à une vingtaine de gènes [8]. La petite taille des ARN interférants rend leur introduction dans des cellules de mammifère plus facile que celle de plasmides et il est possible d’induire une interférence dans plus de 90 % des cellules pour les lignées cellulaires facilement transfectables. Le niveau d’inhibition est souvent de l’ordre de 80 % en ARN ou en protéine.

Vecteurs d’expression et utilisation in vivo

Chez les mammifères, contrairement aux plantes, aux champignons et au nématode, il ne semble pas exister de mécanisme d’amplification ou de régénération de l’ARN double brin. En conséquence, l’introduction de petits ARN interférants n’induit qu’une suppression transitoire de l’expression, de quelques jours à deux semaines, en fonction de la quantité d’ARN transfectée et de la prolifération des cellules. Pour obtenir une suppression à long terme de l’expression, la stratégie la plus simple est d’utiliser un vecteur d’expression qui produit dans la cellule une molécule en épingle à cheveux dont la structure est proche de celle d’un petit ARN interférant (Figure 3C). De nombreux vecteurs ont été construits avec un promoteur polymérase III, car cette polymérase qui transcrit la plupart des petits ARN cellulaires, n’est pas couplée à une enzyme de coiffage de l’extrémité 5’ du transcrit, et s’arrête spécifiquement dans une séquence de terminaison de la transcription (TTTTT). Les promoteurs les plus utilisés sont ceux du petit ARN U6 impliqué dans l’épissage, et de l’ARN H1, un composant de la RNase P, ces promoteurs étant fonctionnels dans tous les types cellulaires [9, 10]. La séquence de la boucle ne semble pas jouer de rôle spécifique .

Ces cassettes d’expression pour des molécules en épingle à cheveux ont été introduites dans des vecteurs viraux et ne semblent pas interférer avec la production virale, même pour des rétrovirus [11]. Des vecteurs lentiviraux ont également été utilisés et permettent l’infection de cellules ES et de cellules quiescentes [12].

Plusieurs études ont montré que les petits ARN interférants ou des vecteurs d’expression pour des molécules en épingle à cheveux pouvaient être utilisés in vivo chez la souris, par exemple avec la méthode de transfection hydrodynamique [13]. Des vecteurs viraux ont aussi été utilisés in vivo chez la souris. Enfin, H. Hasuwa et al. ont utilisé un vecteur d’expression avec le promoteur H1 dans des souris transgéniques et obtenu une bonne efficacité d’inhibition dans tous les tissus étudiés, démontrant directement le large domaine d’action de l’interférence [14].

Choix de la séquence cible et spécificité

Il semble que la question de l’accessibilité soit moins critique pour les petits ARN interférants que pour les oligonucléotides antisens, puisque des séquences choisies de manière arbitraire ont une activité biologique dans près de la moitié des cas. La présence des protéines du complexe RISC contribue probablement à ce résultat. Cependant, pour certains gènes, il peut être nécessaire de tester beaucoup de séquences avant de trouver des petits ARN interférants qui soient actifs. La composition en bases G/C, qui détermine la structure secondaire, est un des éléments à prendre en compte pour choisir une cible (voir [15] pour une discussion des critères de choix). Une meilleure compréhension de l’insertion des petits ARN interférants dans le complexe RISC permet d’expliquer une partie des échecs. En effet, c’est le brin du petit ARN interférant dont l’extrémité 5’ peut se désapparier le plus facilement qui est introduit dans le complexe tandis que l’autre brin est dégradé. Ce biais d’incorporation peut conduire au ciblage presque exclusif d’un ARNm ou de sa séquence complémentaire [16, 17].

Tout indique que le complexe RISC agit via un appariement de l’ARN guide avec l’ARN cible. Les petits ARN interférants ont une taille suffisante pour être spécifiques d’un gène (16 nucléotides sont en principe suffisants). Cependant, la spécificité nécessite que l’énergie d’hybridation soit sensible à la présence de mésappariements et donc que la séquence ne soit pas trop longue. De fait, un ARN guide dont la séquence ne serait complémentaire qu’avec 18 ou 17 nucléotides de l’ARN cible pourrait former un hybride stable et induire une coupure efficace de celui-ci [18]. Tant que le seuil à partir duquel une interférence peut exister n’a pas été clairement établi, les recherches in silico ne peuvent constituer qu’un guide vis-à-vis des cibles potentielles. De plus, une complémentarité imparfaite peut conduire à une inhibition de la traduction [19]. Dans des études expérimentales via le transcriptome, l’existence de cibles collatérales a été observée, mais avec des efficacités limitées [20]. Pour confirmer un phénotype, il est donc indispensable d’utiliser deux ARN interférants qui ciblent des séquences différentes sur le même gène [21].

Au-delà des cibles collatérales, la question de l’innocuité pour la cellule d’un traitement par des petits ARN interférants ou des vecteurs d’expression reste ouverte. En particulier, l’induction de gènes de la réponse de type interféron, dont celui de l’oligoA synthétase, a été observée en réponse à certains petits ARN interférants [22, 23]. Une autre source de difficultés repose sur l’idée même de réorienter une machinerie cellulaire vers des cibles choisies par l’expérimentateur. Il est donc souhaitable de n’utiliser que la dose minimale efficace d’ARN interférants.

Amplitude de l’inhibition

Un autre aspect de l’interférence par l’ARN qui a fait l’objet de réserves est celui de l’inhibition incomplète de l’expression. En fait, ce caractère partiel de l’inhibition peut aussi constituer un des points forts de cette approche en permettant d’analyser la fonction de gènes essentiels et, de manière plus générale, d’étudier la relation entre le niveau d’expression et la physiologie cellulaire. Ainsi, dans le cas du gène suppresseur de tumeur p53, trois vecteurs d’expression pour des ARN en épingle à cheveux ont permis d’obtenir trois niveaux d’inhibition différents et d’analyser le lien entre le niveau d’expression de p53 et l’agressivité des cellules tumorales [24]. L’interférence par l’ARN permet donc d’aborder la physiopathologie des régulations génétiques.

Cribles à grande échelle

Chez C. elegans, il est possible d’induire l’interférence par l’ARN à l’aide de plusieurs stratégies expérimentales, généralement mises en oeuvre chez la larve. Cette flexibilité reflète l’existence d’un transport de l’ARN double brin dans les cellules, ce qui permet d’observer une inhibition systémique chez l’adulte [25]. Cette propagation, et surtout la transmission à la descendance de l’inhibition sur une génération, reflètent également l’implication d’une polymérase ARN dépendante de l’ARN (pAdA) qui peut amplifier le signal inducteur de l’interférence. Chez les mammifères, il existe un homologue du transporteur de l’ARN double brin mais sa fonctionnalité n’a pas encore été établie.

L’administration par voie alimentaire offre une approche particulièrement simple pour la mise en oeuvre de cribles géniques à grande échelle chez C. elegans. J. Ahringer et al. ont réalisé une collection de 16 757 souches d’E. coli dont chacune exprime de l’ARN double brin correspondant à un gène de C. elegans, ce qui permet d’inactiver individuellement 86 % des gènes identifiés chez cet organisme [26]. Cette collection a déjà servi à réaliser plusieurs cribles pour rechercher les gènes impliqués dans le développement embryonnaire, le stockage des lipides, la réparation de l’ADN et la longévité. Du fait de la possibilité d’analyser le phénotype à la génération suivante et de l’efficacité de l’interférence chez C. elegans, cette approche épigénétique est pratiquement aussi puissante qu’une approche génétique réelle et plus simple à mettre en oeuvre.

La transposition d’une telle approche chez des mammifères doit tenir compte des contraintes expérimentales : utilisation de petits ARN, effets transitoires et inhibition partielle de l’expression. L’utilisation de vecteurs d’expression permet de s’affranchir de l’effet transitoire et, via la conservation de souches bactériennes, de disposer d’une ressource renouvelable. à moins d’utiliser un vecteur viral, la mise en oeuvre de cet outil nécessite une transfection et l’interférence ne touchera donc qu’une partie des cellules. Plusieurs collections de plasmides sont en cours de construction [27, 28] et des criblages sur des familles enzymatiques ont déjà donné des résultats importants [29].

à terme, cette stratégie devrait pouvoir être utilisée pour l’ensemble des gènes humains ou murins[2]. Elle restera quand même plus lourde à mettre en oeuvre que chez C. elegans, même s’il est possible d’inactiver simultanément plusieurs gènes ou d’utiliser une sélection positive pour les cellules ayant acquis le phénotype recherché.

Cibles endogènes des petits ARN

Chez les plantes, l’interférence par l’ARN joue un rôle central dans la défense contre les infections virales, la plupart des virus ayant un génome ARN et produisant de l’ARN double brin au cours du cycle viral. D’ailleurs, de nombreux virus contiennent un gène qui code pour un inhibiteur de l’interférence par l’ARN [30]. Outre des virus, les séquences répétées dans le génome sont des cibles probables de l’interférence par l’ARN pour peu qu’elles soient transcrites sur les deux brins à partir de copies réarrangées ou intégrées tête-bêche dans le génome. Selon R. Plasterk, l’interférence par l’ARN constituerait pour le génome des plantes un analogue du système immunitaire en limitant la prolifération d’éléments génétiques « parasites ». La mutation de certains des gènes nécessaires à l’interférence par l’ARN conduit d’ailleurs à une activation des éléments transposables chez C. elegans [31] ((→) m/s 2004, n° 8-9, p. 767).

Les expériences de clonage systématique des petits ARN cellulaires chez différentes espèces ont révélé la présence de nombreux petits ARN simple brin d’environ 21 nucléotides, les microARN [32]. Ces molécules sont issues de la maturation par l’éminceuse d’un transcrit fortement structuré d’environ 70 nucléotides. Chez les mammifères, on estime qu’il existe plus de deux cents microARN et qu’ils sont majoritairement impliqués dans une régulation de la traduction. Une prédiction des cibles possibles chez les mammifères vient d’ailleurs d’être effectuée, il s’agit de gènes impliqués dans le développement et le cycle cellulaire, mais aussi dans le métabolisme [33]. C’est probablement ce rôle dans la maturation des microARN qui fait de l’éminceuse un gène essentiel chez la souris.

Conclusions

En quelques années, l’interférence par l’ARN s’est imposée comme la meilleure technique pour inhiber l’expression d’un gène dans des cellules de mammifères en culture, de manière transitoire ou à long terme, et peut-être même in vivo. Si la spécificité de l’inhibition reste une difficulté majeure, la facilité de mise en oeuvre de cette approche représente un atout important. Il est déjà évident que l’interférence par l’ARN sera l’outil de choix de la génomique fonctionnelle à travers des criblages systématiques, mais aussi des expériences de colétalité ou de complémentation. Enfin, la possibilité de disposer d’ARN interférants ayant des efficacités d’inhibition différentes permet d’explorer quantitativement les réseaux de régulation.