Résumés
Résumé
Les champignons ophiostomatoïdes regroupent plus d’une centaine d’espèces saprophytes du xylème des arbres, ainsi que quelques espèces phytopathogènes dont Ophiostoma novo-ulmi, principal agent de la maladie hollandaise de l’orme. Dans le cadre d’un projet de recherche pan-canadien lancé en 2001, nous étudions l’organisation du génome nucléaire des champignons ophiostomatoïdes, en plus d’identifier les gènes qui modulent la valeur adaptative et la pathogénicité chez O. novo-ulmi. Pour ce faire, un éventail d’approches expérimentales relevant de la génomique structurale et de la génomique fonctionnelle est mis à contribution. D’une part, nous avons cartographié à ce jour près de 200 marqueurs nucléaires chez O. novo-ulmi. Certains de ces marqueurs sont utilisés aux fins d’études comparatives du génome nucléaire chez les espèces du genre Ophiostoma. En second lieu, le séquençage à grande échelle de clones d’ADN complémentaire obtenus à partir d’ARN messagers exprimés à diverses phases du développement d’O. novo-ulmi (par exemple, lors de la croissance végétative en conditions axéniques, lors de la fructification ou encore lors de la colonisation de tissus d’orme) permet d’obtenir la séquence, non plus de gènes individuels, mais des populations entières de gènes. Suite à l’analyse bioinformatique des banques de données publiques, la fonction présumée de plusieurs de ces gènes peut être déterminée in silico. Les approches susmentionnées, qui peuvent être mises à profit pour l’étude d’un grand nombre d’agents pathogènes dont des espèces récalcitrantes aux approches classi-ques, nous ont permis de faire passer rapidement le nombre de gènes identifiés chez O. novo-ulmi de 20 à plus de 2,000. Cette imposante banque de données permet désormais d’envisager des expériences complexes qui permettront de mieux comprendre la biologie des champignons ophiostomatoïdes.
Abstract
Ophiostomatoid fungi include over one hundred species of saprophytes that colonize the xylem of trees, as well as a few pathogens such as Ophiostoma novo-ulmi, the causal agent of Dutch elm disease. Following the launch of the Canadian Ophiostoma Genome Project in 2001, we have been studying the organization of the nuclear genome of ophiostomatoid fungi and identifying genes that modulate fitness and pathogenicity in O. novo-ulmi. To this end, we are using both structural and functional genomics. Close to 200 nuclear markers were genetically mapped in O. novo-ulmi and some of these markers are now being used for comparative analyses of the nuclear genome among various Ophiostoma species. We constructed complementary DNA expression libraries for various growth phases of O. novo-ulmi (e.g. axenic cultures, fruiting bodies, or cultures that are actively colonizing elm calli). Following large-scale sequencing of these libraries and bioinformatic searches in public databases, we have so far identified over 2000 different expressed sequence tags (ESTs) for putative coding sequences in O. novo-ulmi, a “quantum leap” from the 20 or so genes that had been described previously in this species. This considerable data bank now paves the way for the design and conduct of large-scale experiments that will help us better understand the complex biology of ophiostomatoid fungi.
Corps de l’article
Introduction
On regroupe sous le vocable « ophiostomatoïdes » plus d’une centaine de champignons ascomycètes et deutéromycètes caractérisés par la production de structures reproductrices sexuées (périthèces) ou asexuées (conidiophores) fortement mélanisées (Jacobs et Wingfield 2001; Wingfield et al. 1993). Les champignons ophiostomatoïdes sont pour la plupart des saprophytes du xylème des arbres, chez lesquels ils provoquent une coloration appelée bleuissement. Bien qu’il n’altère en rien les propriétés mécaniques du bois, le bleuissement cause des pertes écono-miques importantes puisque les bois atteints sont déclassés et vendus à moindre prix. Par ailleurs, certains champignons ophiostomatoïdes sont des agents phytopathogènes très agressifs associés à des maladies telles le flétrissement vasculaire et le déve-loppement de chancres. Une de ces espèces patho-gènes est Ophiostoma novo-ulmi, agent responsable d’une pandémie de maladie hollandaise de l’orme (MHO) ayant causé la mort de millions d’arbres adultes en Europe et en Amérique du Nord depuis environ 1960. Malgré les nombreuses recherches menées sur cet organisme, on ignore encore les mécanismes par lesquels il arrive à tuer ses hôtes. Plusieurs laboratoires, tant gouvernementaux qu’universitaires, s’intéressent à différents aspects de l’interaction Ophiostoma-Ulmus. Notre équipe de recherche poursuit des travaux visant à identifier les bases génétiques de la pathogénécité chez O. novo-ulmi (Bernier 1993; Et-Touil et al. 1999).
Nous estimons que le génome nucléaire d’O. novo-ulmi contient un nombre de gènes semblable à celui d’autres champignons ascomycètes filamenteux tels Neurospora crassa, c’est-à-dire environ 10 000 gènes (Galagan et al. 2003). Comment retrouver, parmi tous ces gènes, ceux qui modulent le pouvoir pathogène d’O. novo-ulmi, et ceux qui, de façon plus large, contribuent à la valeur adaptative (fitness) chez cette espèce ? Historiquement, les recherches en génétique et en biologie moléculaire se sont appuyées sur une approche ponctuelle où l’on identifiait un à un les gènes responsables d’un phénotype particulier. Cette approche est relativement lente, compte tenu que les traits d’intérêt tels la pathogénicité sont généralement contrôlés par un grand nombre de gènes. Suite à la mise au point de méthodes d’analyse moléculaire à haut débit, ainsi qu’au développement spectaculaire de la bioinformatique, on peut désormais envi-sager d’étudier et d’identifier non plus des gènes isolés mais bien des populations entières de gènes. C’est donc dans cet esprit que quatre laboratoires de recherche canadiens localisés respectivement à l’Université Laval (L. Bernier), à l’Université de Toronto (P.A. Horgen), à l’Université de la Colombie- Britannique (C. Breuil) et à l’Université de Victoria (W.E. Hintz) ont entrepris, en février 2001, la première étude génomique des champignons ophiostomatoïdes. Cette étude comporte trois objectifs : 1) explorer l’organisation du génome nucléaire des champignons ophiostomatoïdes; 2) identifier des gènes contribuant à la valeur adaptative; et 3) étudier l’expression de ces gènes. Deux espèces y sont ciblées : l’espèce pathogène O. novo-ulmi, ainsi qu’une espèce saprophyte, O. piceae, phylogénétiquement appa-rentée à O. novo-ulmi (Harrington et al. 2001). Nous présentons ici brièvement les résultats de travaux sur O. novo-ulmi liés aux objectifs 1 et 2 du projet.
Étude de l’organisation du génome nucléaire chez les agents de la MHO
Les populations naturelles d’O. novo-ulmi sont relativement homogènes du point de vue génétique et présentent donc peu de polymorphismes utiles pour la cartographie du génome. Par contre, les espèces O. novo-ulmi et O. ulmi (agent responsable de la première pandémie de MHO entre 1920 et 1970) sont génétiquement très différentes et peuvent parfois s’hybrider sexuellement (Brasier et al. 1998; Et-Touil et al. 1999). Nous avons donc établi, en laboratoire, un croisement dirigé O. ulmi x O. novo-ulmi dont nous avons isolé 90 descendants de première génération (F1). Comme les champignons ophiostomatoïdes sont haploïdes pendant la presque totalité de leur cycle biologique, la ségrégation et la recombinaison de marqueurs génétiques peuvent être étudiées au sein de la F1. Dans le cas présent, les marqueurs utilisés incluent près de 150 loci anonymes identifiés à l’aide de polymorphismes RAPD (Random Amplified Polymorphic DNAs) et 17 loci codants représentés par 13 clones d’ADN complémentaire, 3 mutations induites, ainsi que le locus d’incompatibilité sexuelle (MAT). Selon les analyses statistiques, ces marqueurs se distribuent en 11 groupes de liaison qui ne représentent vraisemblablement pas tous des chromosomes, puisque l’électrophorèse en champs alternés (PFGE) ne révèle, pour sa part, la présence que de 7 à 8 bandes chromosomiques. Cette disparité entre le nombre de groupes de liaison inféré à partir des analyses statistiques et le nombre de chromosomes séparés physiquement par la technique PFGE n’est pas surprenante. Elle reflète les lacunes propres à chaque approche : nombre de marqueurs encore insuffisant dans le cas de l’analyse de liaison; contrain-tes physiques propres à la technique PFGE, notamment dans le cas d’une espèce telle O. novo-ulmi dont certains chromosomes ont une taille élevée (plus de 5,7 millions de nucléotides) et sont, par conséquent, difficiles à séparer par électrophorèse (Dewar et al. 1997).
Malgré les lacunes énoncées plus haut, la carto-graphie effectuée à ce jour fournit toutefois une ima-ge déjà assez nette de l’organisation générale du génome chez les champignons responsables de la MHO. Les travaux en cours et ceux à venir viseront, quant à eux, à cartographier un nombre croissant de loci codants, ce qui permettra d’étudier de façon plus détaillée l’organisation de gènes impliqués dans des sentiers métaboliques particuliers. Ces loci codants serviront en outre de marqueurs d’ancrage pour des études comparatives de l’organisation du génome nucléaire au sein des champignons ophiostomatoïdes.
Identification de gènes contribuant à la valeur adaptative chez les agents de la MHO
Un aspect important du travail effectué dans le cadre de ce projet est le séquençage à grande échelle du génome chez O. novo-ulmi. Cependant, contrairement à d’autres projets ayant mené au séquençage total du génome nucléaire chez Saccharomyces cerevisiae (Goffeau et al. 1997) et Neurospora crassa (Galagan et al. 2003), l’approche que nous avons choisie ne retient que les gènes exprimés lors de certaines phases de la croissance chez O. novo-ulmi. Comme nous avons déjà décrit plus en détail notre approche expérimentale (Bernier et al. 2004), nous n’en exposerons ici que les grandes lignes. Nous avons, en premier lieu, construit une banque d’expression à partir de cultures axéniques de la souche O. novo-ulmi H327 en phase levuriforme (comme plusieurs autres champignons ophiostomatoïdes, O. novo-ulmi présente un dimorphisme levure-mycélium). Cette banque de référence, construite par l’équipe de W.E. Hintz à l’U. de Victoria, est issue d’une population de molécules d’ARN messager (ARNm) qui, suite à leur purification, sont transformées en molécules d’ADN complémentaire (ADNc), beaucoup plus stables. Par la suite, les clones d’ADNc sont soumis en vrac à un séquençage simple brin, lequel génère des données pour des portions de 300 à 800 nucléotides. Ces séquences partielles, appelées étiquettes (ou EST pour Expressed Sequence Tag), sont ensuite analysées in silico à l’aide d’algorithmes mathématiques tels BLAST (Altschul et al. 1997) et FASTA (Pearson et Lipman 1988) afin d’identifier des séquences homologues et bien caractérisées au sein des banques de données publiques dont GenBank et la Phytopathogenic Fungi and Oomycete EST Database.
Le désavantage évident d’une telle approche tient de ce que seule une portion du génome est séquencée lors de l’analyse de chaque banque d’expression. Malgré cette lacune, l’approche EST s’avère malgré tout intéressante puisqu’elle permet théoriquement d’identifier des milliers de gènes, et ce, à un coût de loin inférieur à celui associé aux grands projets de séquençage visant à identifier le code génétique au complet. Qu’en est-il d’une espèce peu caractérisée génétiquement telle O. novo-ulmi, chez qui on ne connaissait jusqu’à récemment qu’une vingtaine de gènes ? Le séquençage de près de 6000 clones d’ADNc de la banque de référence nous a permis d’obtenir plus de 4000 étiquettes lisibles au sein desquelles les analyses bioinformatiques ont permis d’identifier 2000 séquences différentes incluant quelque 880 gènes dont la fonction est connue. Une analyse des résultats indique par ailleurs qu’alors que le pourcentage de nouveaux gènes était de 100 % en début de séquençage, il n’était plus que de 30 % au terme de l’exercice. En d’autres mots, la part d’information redondante va en s’accentuant avec le nombre de clones d’ADNc provenant de la banque de référence. De façon intuitive, une solution à ce problème est l’analyse de clones d’ADNc provenant d’une autre banque d’expression, construite à partir d’une culture exposée à des conditions environnementales différentes, dans laquelle on s’attend à retrouver plusieurs gènes inédits, exprimés de façon différentielle. Cependant, on y retrouvera également des gènes exprimés de façon constitutive qui seront donc vraisemblablement séquencés à nouveau, entraînant par le fait même une baisse d’efficacité et des coûts additionnels. Comment maximiser la découverte de nouvelles séquences au moindre coût?
L’application d’approches soustractives permet de répondre à la question précédente. En bref, il s’agit d’éliminer (ou, à tout le moins, de restreindre), chez les nouvelles banques, les séquences non spécifiques qui se retrouvent également dans la banque de référence. Il en résulte donc un enrichissement en séquences inédites au sein de la population de clones d’ADNc recueillie au terme de la procédure. Pour ce faire, diverses méthodes ont été mises au point et, dans le cadre de notre projet, nous avons choisi d’utiliser l’hybridation suppressive soustractive (Suppression Subtractive Hybridization; SSH) décrite par Diatchenko et collaborateurs (1999). Dans cette mé-thode faisant appel à la polymérisation en chaîne de l’ADN (Polymerase Chain Reaction; PCR), la population d’ADNc qu’on désire enrichir en séquences exprimées de façon différentielle (tester) est d’abord liée à des adaptateurs, avant d’être mise en présence d’une forte concentration de la population d’ADNc issue de la banque de référence (driver) et dépourvue d’adaptateurs. Suite à deux rondes d’hybridation entre ces populations, les produits sont soumis à une réaction PCR où les clones d’ADNc propres à la population tester sont amplifiés de façon exponentielle.
L’équipe de l’U. Laval a donc utilisé la SSH pour tenter d’identifier des gènes exprimés de façon différentielle chez O. novo-ulmi H327. Dans un premier temps, nous avons préparé des banques d’ADNc à partir de cultures mycéliennes exposées à des températures non-optimales (15 et 31 °C), de même que des banques d’expression à partir de périthèces. Chacune de ces banques a ensuite été hybridée à une banque issue d’une culture mycélienne s’étant déve-loppée à 25 °C. Au terme des manipulations, les po-pulations d’ADNc résiduelles ont été soumises au séquençage. Dans le cas des banques de cultures à 15 et à 31 °C, nous avons obtenu respectivement 85 et 65 % de séquences nouvelles, non identifiées parmi les 6000 clones de la banque de référence séquencés à ce jour. La banque issue de périthèces contenait, pour sa part, 75 % de nouvelles séquences. Par ailleurs, très peu de séquences (moins de 8 %) sont communes aux trois banques soustractives qu’on peut donc qualifier de banques enrichies. L’approche SSH ayant rempli ses promesses, nous travaillons présentement à deux nouvelles banques, l’une à partir de synnémas (conidiophores) et l’autre, à partir de cals d’orme auxquels nous avons inoculé la souche H327. Dans ce dernier cas, nous appliquons une soustraction double, de façon à éliminer les gènes exprimés de façon constitutive chez la plante ainsi que chez le champignon. Par ailleurs, des travaux réalisés par l’équipe de C. Breuil à l’U. de Colombie-Britannique confirment l’utilité de l’enrichissement par la technique SSH pour l’identification de nouveaux gènes chez l’espèce O. piceae.
Utilisation des données de séquençage
Au terme de l’analyse bioinformatique des clones d’ADNc issus de la banque de référence et des banques enrichies par SSH, nous estimons que nous aurons généré plus de 2500 étiquettes représentant autant de gènes différents chez O. novo-ulmi. À la lueur des résultats obtenus à ce jour, environ 47 % de ces étiquettes correspondent à des gènes dont la fonction est déjà connue. Par contre, 45 % des étiquettes sont orphelines, c’est-à-dire qu’elles représentent des gènes potentiels ne possédant pas d’homologues dans les banques de données publiques. À ce chiffre, il faut ajouter 8 % d’étiquettes possédant des homologues décrits chez d’autres organismes mais dont la fonction demeure toutefois inconnue. Le fait qu’un peu plus de 50 % des étiquettes analysées à ce jour ne puissent être définies avec précision, bien que frustrant, n’a toutefois rien d’alarmant puisque ce résultat reflète l’état des connaissances sur la génomique des eucaryotes en général et celle des champignons en particulier. Comme de nouvelles séquences de gènes sont déposées quotidiennement dans les banques de données publiques, on peut donc s’attendre à ce que la proportion d’étiquettes orphelines ou non définies chez O. novo-ulmi diminue au fil du temps.
Les avancées décrites précédemment, quoique fort intéressantes, ne constituent toutefois que la phase exploratoire de l’analyse du génome chez O. novo-ulmi. Il reste encore à découvrir, chez cette espèce, plusieurs milliers de gènes potentiels. D’ici-là, cependant, les quelque 2500 étiquettes que nous aurons générées à partir de diverses banques d’expression permettent désormais de planifier des expériences où nous pourrons étudier en détail la fonction de certains gènes d’intérêt. De fait, des travaux faisant appel à la PCR en temps réel sont déjà en cours chez l’équipe de P.A. Horgen à l’U. de Toronto (Tadesse et al. 2003). Par ailleurs, l’obtention d’une grande quantité d’étiquettes ouvre également la voie à l’utilisation de la technologie des puces d’ADN (microarrays) pour l’étude à grande échelle de l’expression de milliers de gènes à la fois.
Conclusion
Au cours des trois dernières années, le projet canadien de génomique des champignons ophiostomatoïdes a permis d’effectuer un « saut quantique » quant à la connaissance du génome chez l’espèce O. novo-ulmi, principal agent de la MHO. Cette avancée a été rendue possible par l’adoption d’une approche expérimentale qui tranche de façon radicale avec les méthodes qu’utilisaient jusque là les équipes parti-cipant au projet. Ainsi, l’analyse ponctuelle de gènes et de loci nucléaires a fait place à une analyse à grande échelle qui aura permis, en relativement peu de temps, d’identifier quelque 2500 séquences codantes. Cette étape coïncide avec la fin de la phase I du projet. Une éventuelle phase II (en attente de financement) permettra de faire augmenter encore le nombre de gènes identifiés chez O. novo-ulmi mais visera surtout à mettre au point des expériences tablant sur les données obtenues précédemment pour étudier de façon exhaustive les gènes contribuant à la valeur adaptative chez O. novo-ulmi, ainsi que les mécanismes liés à l’évolution du génome et à la spéciation.
À court terme, un des défis à relever est la gestion efficace des données obtenues afin d’en soutirer le plus grand bénéfice. C’est dans cette optique que nous envisageons de déposer sous peu nos données dans une banque électronique publique car nous croyons que l’accessibilité universelle à cette banque suscitera un intérêt bien au-delà du groupe restreint de chercheurs étudiant les champignons ophiostomatoïdes. De cette façon, d’autres membres de la communauté scientifique seront possiblement incités à étudier ces champignons puisqu’ils pourront ainsi exploiter les données que nous avons récoltées chez O. novo-ulmi. Par ailleurs, ces mêmes données seront utiles pour l’étude d’autres champignons phytopathogènes, notamment les espèces peu étudiées à ce jour.
En raison de leur génome relativement compact, les champignons représentent des organismes de choix pour les travaux en génomique. Dans le cas des champignons phytopathogènes, les travaux menés depuis quelques années chez des espèces vedettes telles Magnaporthe grisea et Ustilago maydis ont déjà conduit à l’identification de plusieurs gènes importants pour l’expression de la valeur adaptative. Par ailleurs, comme ces organismes entretiennent des interactions dynamiques avec des plantes hôtes, il importe de mener également des études génomiques chez ces dernières. Bien que de telles études soient avancées chez des espèces telles le riz et le maïs chez les plantes agricoles, ou encore chez les peupliers en ce qui concerne les essences forestières, ce n’est pas le cas pour les ormes. Il s’agit là d’une lacune à combler pour mieux comprendre l’interaction sous-tendant le développement de la MHO, en vue du développement éventuel de nouvelles stratégies de lutte contre cette maladie.
Parties annexes
Remerciements
Nos travaux ont été rendus possibles grâce à une subvention « Projets de la génomique » du Conseil de recherche en sciences naturelles et en génie du Ca-nada (CRSNG), accordée à L. Bernier, C. Breuil, W.E. Hintz et P.A. Horgen. Outre ces trois collaborateurs, l’auteur tient à remercier tout particulièrement M. Aoun, G. Bouvet, P. De la Bastide, S. DiGuistini, J. Dufour, J. Eades, V. Jacobi, B. Koop, M. Pinchback et P. Tanguay.
Références
- Altschul, S.F., T.L. Madden, A.A. Schäffer, J. Zhang, Z. Zhang, W. Miller et D.J. Lipman. 1997. Gapped BLAST and PSI-BLAST: a new generation of protein database search programs. Nucl. Acids Res. 25 : 3389-3402.
- Bernier, L. 1993. Conventional and molecular genetic approaches to the study of pathogenicity in Ophiostoma ulmi sensu lato. Pages 293-307 in M. Sticklen and J. Sherald (eds.), Dutch Elm Disease Research: Cellular and Molecular Approaches. Springer-Verlag, New York.
- Bernier, L., C. Breuil, W.E. Hintz, P.A. Horgen, V. Jacobi, J. Dufour, M. Aoun, G. Bouvet, S.H. Kim, S. Diguistini, P. Tanguay, J. Eades, S. Burgess, P. de la Bastide, M. Pinchback et Y. Tadesse. 2004. The Canadian Ophiostoma Genome Project. Invest. Agrar.: Sist. Recur. For. 13 : 105-117.
- Brasier, C.M., S.A. Kirk, N.D. Pipe et K.W. Buck. 1998. Rare interspecific hybrids in natural populations of the Dutch elm disease pathogens Ophiostoma ulmi and O. novo-ulmi. Mycol. Res. 102 : 45-57.
- Dewar, K., J. Bousquet, J. Dufour et L. Bernier. 1997. A meiotically reproducible chromosome length polymorphism in the ascomycete fungus Ophiostoma ulmi (sensu lato). Mol. Gen. Genet. 255 : 38-44.
- Diatchenko, L., S. Lukyanov, Y.F.C. Lau et P.D. Siebert. 1999. Suppression subtractive hybridization: A versatile method for identifying differentially expressed genes. Pages 349-380 in S.M. Weissman (ed.), Methods in Enzymology 303: cDNA Preparation and Characterization. Academic Press, San Diego.
- Et-Touil, A., C.M. Brasier et L. Bernier. 1999. Localization of a pathogenicity gene in Ophiostoma novo-ulmi and evidence that it may be introgressed from O. ulmi. Mol. Plant-Microbe Interac. 12 : 6-15.
- Galagan, J.E. et 76 autres. 2003. The genome sequence of the filamentous fungus Neurosporacrassa. Nature 422 : 859-868.
- Goffeau, A. et 632 autres. 1997. The yeast genome directory. Nature 387 (Suppl.) : 1-105.
- Harrington, T.C., D. McNew, J. Steimel, D. Hofstra et R. Farrell. 2001. Phylogeny and taxonomy of the Ophiostoma piceae complex and the Dutch elm disease fungi. Mycologia 93 : 111-136.
- Jacobs, K. et M.J. Wingfield. 2001.Leptographium species: tree pathogens, insect associates, and agents of blue-stain. American Phytopathological Society Press, St. Paul, MN, 207 pp.
- Pearson, W.R. et D.J. Lipman. 1988. Improved tools for biological sequence comparison. Proc. Natl. Acad. Sci. USA 85 : 2444-2448.
- Tadesse, Y., L. Bernier, W.E. Hintz et P.A. Horgen. 2003. Real time RT-PCR quantification and Northern analysis of Cerato ulmin (CU) gene transcription in different strains of the phytopathogens Ophiostomaulmi and O. novoulmi. Mol. Genet. Genomics 269 : 789-796.
- Wingfield, M.J., K.A. Seifert et J.F. Webber (eds). 1993.Ceratocystis and Ophiostoma: taxonomy, ecology and pathogenicity. American Phytopathological Society Press, St. Paul, MN, 293 pp.