Corps de l’article

Un vent nouveau souffle sur la génomique virale, en particulier celle des grands virus à ADN. Depuis l’exploit de l’équipe de Barrell [1], déterminant la séquence complète du cytomégalovirus humain dès 1990, la séquence de nombreux génomes viraux de taille supérieure à 200 kb a été publiée sans provoquer d’émotion particulière, ni remettre en cause la notion de virus dans notre inconscient collectif. À l’exception de quelques spécialistes éclairés, nous voyons toujours les virus comme de très petits sacs de gènes à l’origine douteuse, seulement porteurs de fonctions liées à l’infection et à la réplication de leur génome, et ne méritant pas d’être considéré comme véritablement « vivants ». Les plus grands de ces virus (Tableau I) contenaient pourtant plus de 300 gènes propagés par une particule virale à la structure complexe.

Les choses vont peut-être changer avec la publication [2], par notre laboratoire et celui de D. Raoult, de la séquence complète du génome du Mimivirus dont la taille (1,2 million de nucléotides) et la complexité (plus de 1 000 gènes) dépassent largement celles d’une vingtaine d’organismes cellulaires (bactéries et archébactéries) (Tableau I).

Découvert par Rowbotham il y a plus de 10 ans au sein d’amibes colonisant le système de climatisation de l’hôpital de Bradford (Angleterre), la nature virale de Bradfordcoccus, maintenant rebaptisé Mimivirus (microbe mimicking virus), avait été révélée par les deux mêmes équipes marseillaises en 2002, au terme d’une analyse préliminaire qui laissait déjà présager un génome d’une taille record [3]. Cette fois, la surprise ne tient plus seulement à la taille exceptionnelle du génome de Mimivirus, mais à la nature même des gènes qu’il contient.

Les résultats apportés par l’analyse du génome de Mimivirus sont de trois types. Tout d’abord, la présence de gènes formant l’ossature conservée du génome de toutes les familles de grands virus nucléocytoplasmiques (NCLDV, nucleocytoplasmic large DNA virus) a été vérifiée. Par ce critère, Mimivirus apparaît donc comme un virus « normal », membre du groupe des NCLDV. Nous avons ensuite étudié d’une manière détaillée la similarité des gènes de Mimivirus avec leurs homologues dans les différentes familles de NCLDV : pox-, irido-, asfar- et phycodnaviridae. Cette étude a montré que Mimivirus, s’il est bien ancré au sein des NCLDV, n’a pas d’affinité particulière avec aucune de ces familles préétablies. Mimivirus est donc le prototype d’une nouvelle famille, les Mimiviridae. Mais la plus grande surprise que nous réservait le génome de Mimivirus était la présence d’une trentaine de gènes dont les fonctions n’avaient encore jamais été rencontrées chez un virus. En particulier, nous avons pu formellement identifier huit gènes codant pour des composants essentiels de l’appareil de traduction protéique : quatre aminoacyl tRNA synthetases, à côté de quatre facteurs contrôlant l’initiation, l’élongation et la terminaison de la traduction. Mimivirus possédant par ailleurs six gènes d’ARNt, il apparaît donc comme très significativement impliqué dans la synthèse protéique. L’activité biologique de la tyrosyl tRNA synthetase de Mimivirus a été vérifiée expérimentalement. Rappelons-le, cette intrusion de la synthèse des protéines dans le monde viral viole un dogme bien établi : ne possédant pas de ribosomes, les virus n’ont pas vocation à intervenir dans la synthèse de leurs protéines, fabrication qu’ils délèguent à l’organisme cellulaire qu’ils infectent. Déjà écorné par la présence de nombreux ARNt dans des phycodnavirus [4], ce principe est définitivement battu en brèche par la présence d’enzymes-clés de la traduction chez Mimivirus. Les aminoacyl tRNA synthetases sont en effet un maillon essentiel dans le respect du code génétique : ce sont elles qui assurent le chargement du bon acide aminé en face des bons codons.

La découverte, dans Mimivirus, des premiers homologues viraux de ces enzymes a également une conséquence pratique importante. En effet, à côté des polymérases de l’ADN et de l’ARN, ces enzymes sont parmi les rares protéines communes à tous les organismes vivants. Elles ont des homologues dans les trois domaines du vivant : archébactéries, bactéries et eucaryotes. Leur analyse phylogénétique permet donc de brancher l’organisme dont elles proviennent au sein d’un arbre fondamental dont la racine est le dernier ancêtre commun, LUCA (last univeral common ancestor) pour les initiés. Cette méthode a été utilisée pour y connecter Mimivirus et, par extension, le reste des NCLDV. Et là, la surprise est de taille, car la branche qui mène à ces virus géants diverge très vite des trois grands domaines du vivant déjà définis (Figure 1). Cette position phylogénétique remarquable indique que les organismes qui ont fourni le noyau dur des gènes de Mimivirus existaient déjà à une époque précédant l’émergence des premières cellules eucaryotes. Cet hypothétique quatrième domaine de la vie n’a peut-être survécu qu’à travers le groupe des virus à ADN géants, comme parasite des organismes cellulaires actuels. Même si personne ne croit plus vraiment qu’une simple structure en arbre soit le meilleur modèle pour représenter l’origine de la vie, l’ancrage de Mimivirus à une position très ancestrale (3 milliards d’années) est compatible avec plusieurs hypothèses élégantes (mais jusqu’ici sans fondement expérimental) qui établissent un lien direct entre les virus à ADN et l’émergence du noyau cellulaire [5] des eucaryotes. D’objets inanimés, les virus - du moins les grands virus à ADN - pourraient donc passer au statut beaucoup plus respectable d’ancêtre de nos cellules ! Il est clair, en tous les cas, que ces virus géants, dont la taille et la complexité génétique approchent ou dépassent celles d’organismes cellulaires, n’ont plus rien à voir avec le concept de virus « petit sac d’acides nucléiques » sans généalogie propre, enseigné dans les écoles. Une nouvelle appellation (Archevirus, Girus ?) serait la meilleure façon de nous préparer aux futures découverte de NCLDV encore plus complexes (à suivre dans www.giantvirus.org), qui semblent établir une continuité entre le monde des virus proprement dit et les organismes cellulaires parasites aux génomes les plus réduits.

Figure 1

Mimivirus dans l’arbre de la vie.

Mimivirus dans l’arbre de la vie.

La position phylogénétique de Mimivirus est calculée sur la base d’une concaténation des gènes universels identifiés dans son génome. Aucun de ces gènes ne montre des signes d’acquisition par transfert latéral.

-> Voir la liste des figures

Tableau I

Les plus grands génomes viraux comparés aux plus petits génomes procaryotes.

Les plus grands génomes viraux comparés aux plus petits génomes procaryotes.

La liste (non exhaustive) des organismes cellulaires dont la complexité génomique est plus faible que celle de Mimivirus est en rouge. Polydnavirus n’est pas indiqué car son génome (0,56 Mb), atypique, ne code que pour 156 gènes [6]. Pour les autres organismes, compter un gène pour 1 000 pb. Une séquence partielle (498 kb) du génome du bactériophage G (estimé à 670 kb) est disponible sur le site du Pittsburgh Bacteriophage Institute (http://pbi.bio.pitt.edu/). Consulter www.giantvirus.org pour suivre l’actualité des virus géants.

-> Voir la liste des tableaux