Corps de l’article

Introduction

En mai 1996, Françoise Paretti (née Michelet) se rend en Alberta pour régler la vente d’un terrain appartenant à son père, Charles-Alexandre Michelet, décédé 17 ans plus tôt dans la région d’Agen en France. Ce « pèlerinage » (Bouchard, 1996 : 13) se trouve relaté dans un article paru dans le journal Le Franco-Albertain du 17 mai 1996, qui revient sur le parcours de celui qui fut notamment rédacteur du journal francophone Le Courrier de l’Ouest entre 1906 et 1916. À l’occasion de ce voyage, Françoise Paretti confie un manuscrit intitulé « La grande épinettière » (LGE), qu’elle attribue à son père, au consul de France à Edmonton, qui le déposera aux Archives provinciales de l’Alberta.

Ce manuscrit avait suscité peu d’intérêt de la part des chercheurs jusqu’à ce que nous lui consacrions un article dans lequel nous en proposions une lecture « postcoloniale » (Lacroix et Rao, 2012). Or, la découverte récente d’une correspondance entre Marie-Louise Michelet (de son nom de plume Magali Michelet), femme de lettres et soeur de Charles-Alexandre, et l’abbé Lionel Groulx nous a conduits à nous questionner sur l’identité véritable de l’auteur(e) de ce roman. En fait, cette découverte a contribué à renforcer les doutes que nous entretenions déjà sur la paternité du manuscrit (Morcos et al., 1998 : 205; Rao, 2019 : 33). Pionnière des lettres francophones en Alberta et dans l’Ouest canadien, Marie-Louise Michelet est l’auteure d’une oeuvre hétéroclite (comptant notamment un roman épistolaire intitulé Comme jadis, publié en 1925, et plusieurs pièces de théâtre), qui lui a valu une certaine notoriété au Canada français au début du xxe siècle. Proche de Robertine Barry (Rao, 2019 : 34), Marie-Louise participe au développement des lettres canadiennes, prenant fait et cause pour les communautés francophones en Alberta, où elle a vécu et écrit pendant près d’une quinzaine d’années.

Dans cet article, nous défendrons l’hypothèse selon laquelle l’auteur principal de « La grande épinettière » est Marie-Louise et non son frère, Charles-Alexandre. Toutefois, nous n’excluons pas le fait que ce dernier ait pu intervenir dans la rédaction ou la révision du manuscrit. Afin d’étayer notre hypothèse, nous nous appuierons sur une méthode mixte combinant une approche qualitative basée sur l’analyse d’éléments à la fois biographiques et stylistiques et la stylométrie informatique, qui peut être définie comme « une étude quantitative du style littéraire à l’aide de méthodes informatiques de lecture distante » (Laramée, 2021). De plus en plus utilisée pour déterminer la paternité d’oeuvres littéraires, la stylométrie assistée par ordinateur a largement bénéficié des avancées récentes en matière d’intelligence artificielle et d’apprentissage machine, gagnant ainsi en fiabilité. Dans cette étude, nous utiliserons le logiciel à code source Stylo R afin d’effectuer un certain nombre d’analyses stylométriques à partir de deux corpus comprenant des nouvelles de Charles-Alexandre publiées dans plusieurs journaux français et canadiens et plusieurs oeuvres de Marie-Louise.

Une surprenante découverte

Lors d’un séjour de recherche en France en juin 2011, nous avons eu l’occasion de nous entretenir avec feue Françoise Paretti, fille unique de Charles-Alexandre Michelet et nièce de Marie-Louise. Cet entretien nous a permis de nous renseigner sur les circonstances ayant conduit à la découverte du manuscrit de « La grande épinettière » ainsi que sur la nature des interventions textuelles effectuées par Françoise Paretti.

D’après elle, son père aurait entamé la rédaction du roman « sans rien dire à personne » (Rao, 2011) dans les années 1970 alors qu’il était âgé de plus de 80 ans. Madame Paretti affirme avoir trouvé le manuscrit (qui se présentait alors sous la forme de trois cahiers), accompagné de la lettre d’un éditeur, dans le bureau de son père peu de temps après son décès. Elle précise que celui-ci ne l’avait jamais mise au courant de l’existence de ce manuscrit, ce qu’elle attribue à la fois à son caractère « austère » (Rao, 2011) et au fait que le manuscrit avait essuyé un refus de publication de la part d’un éditeur ayant pignon sur rue à Paris. À plusieurs reprises au cours de l’entretien, Françoise Paretti témoigne de son admiration pour la mémoire « phénoménale » de son père qui, bien qu’il eût quitté l’Alberta dans sa jeune trentaine (Lacroix et Rao, 2012 : 17), a su fidèlement rendre compte du parler canadien-français dans son roman.

Madame Paretti admet avoir effectué un certain nombre de modifications au texte original, la plus notable d’entre elles portant sur le titre de l’oeuvre, qui s’intitulait à l’origine « La paroisse de Grande-Coulée ». De plus, celle-ci dit avoir également supprimé une demi-page où il était question de religion au motif qu’elle en trouvait le contenu « indigeste » (Rao, 2011). Selon elle, cette section ne s’insérait pas bien dans le « déroulement du roman » et faisait « une grande parenthèse qui alourdissait le texte » (Rao, 2011). Quant aux autres interventions, elles portent principalement sur le choix des mots et le style :

Non, ce n’était en général pas des corrections de contenu du tout parce qu’il en savait beaucoup plus que moi sur le sujet. Non, l’orthographe non, il n’y avait pas non plus d’erreurs, mais c’était un mot pour un autre. Un mot qui me semblait mieux venu ou peut-être qu’il y avait une répétition un petit peu plus loin. Mais très, très peu

Rao, 2011

En définitive, notre entretien avec Françoise Paretti révèle que Charles-Alexandre n’avait jamais parlé du manuscrit à sa fille, qui a été fort surprise par sa découverte : « C’est extraordinaire de penser qu’il a écrit tout cela sans jamais en parler. Il voulait nous faire une surprise certainement » (Rao, 2011). En ce sens, on peut dire que les circonstances entourant la découverte du manuscrit contribuent à jeter un doute raisonnable sur l’identité de son auteur(e).

La date de rédaction du roman, que Françoise Paretti situe dans les années 1970, soit plus de cinquante ans après le départ de son père de l’Alberta, est un autre élément qui mérite que l’on s’y attarde. Cette date est difficile à établir étant donné qu’aucun élément diégétique ou même extradiégétique[1] dans le roman ne renvoie à cette période. En fait, les quelques références historiques dans le roman (mention du Courrier de l’Ouest, qui cesse ses activités en 1916; règlement scolaire de 1925, qui consolide l’enseignement du français (Mahé, 1992); participation du « parti des fermiers » ou « United Farmers of Alberta » à l’élection provinciale de 1921 et fin de la Première Guerre mondiale) situent la diégèse dans les trois premières décennies du xxe siècle, c’est-à-dire au cours d’une période qui s’étend de l’arrivée de la famille Michelet en Alberta jusqu’à leur retour en France (Rao, 2019 : 32).

Une émulation toute fraternelle

Originaires de l’est de la France, le couple Michelet et leurs trois enfants, Marie-Louise, Marie-Claudine et Charles-Alexandre, s’embarquent pour le Canada en 1906. À cette époque, l’Ouest canadien est une destination de prédilection pour de nombreux Français en quête d’une vie meilleure (Pénisson, 1986 : 115). C’est sur un homestead situé au lieu-dit La Calmette près de la colonie francophone de Legal que la famille s’établira. Quelques mois à peine après leur installation, Marie-Louise et Charles-Alexandre se joignent au Courrier de l’Ouest, seul journal francophone de l’Alberta. Charles-Alexandre en devient le rédacteur tandis que Marie-Louise prend la barre de la chronique féminine « Le coin féminin ». Ceux-ci resteront en poste jusqu’à la fermeture du journal en 1916, soit pendant près d’une dizaine d’années.

Les chroniques de Marie-Louise (qui adopte le nom de plume de Magali) lui valent une certaine notoriété en Alberta, mais également dans l’est du Canada où elle correspond avec plusieurs femmes journalistes de renom, dont Robertine Barry (Rao et Lacroix, 2012 : 183). En 1918, Marie-Louise remporte le concours de l’Alliance artistique de Montréal avec une pièce intitulée « Jean Audrain », dont il ne reste à notre connaissance aucune trace[2]. C’est la pièce Contre le flot, lauréate du concours de la revue L’Action française en 1922, qui apporte à Marie-Louise la consécration littéraire. La même année, la pièce est publiée dans la collection de l’Action française dirigée par l’abbé Lionel Groulx. Durant un séjour en 1922 à Washington où son frère travaille comme interprète pour l’Union panaméricaine, Marie-Louise publie la pièce Marraine de guerre dans la collection MacMillan « French Series ». De retour en France avec sa famille, Marie-Louise compose Comme jadis (1925), un roman épistolaire dont les protagonistes, Herminie de Lavernes et Gérard de Noulaine, entretiennent une correspondance de part et d’autre de l’Atlantique. En 1929, le roman est réédité en France dans la collection « Stella » du magazine catholique féminin Le Petit Écho de la mode. Comme jadis est, à ce jour, la dernière oeuvre attribuée à Marie-Louise.

Rédacteur du Courrier de l’Ouest et membre actif de la communauté franco-albertaine[3], Charles-Alexandre nourrit également une ambition littéraire qui s’épanouit dans l’ombre de celle de sa soeur. Sous le pseudonyme de Jean de Nobon, il signe plusieurs textes publiés dans le prestigieux Journal de Françoise et réédités dans Le Courrier de l’Ouest. Un de ses textes, intitulé « La caverne-qui-pleure », est primé à l’occasion d’un des nombreux concours organisés par le journal montréalais La Patrie. Entre 1905 et 1906, Charles-Alexandre publie plusieurs textes dans le journal français illustré Le Globe Trotter, dont « Les canots de feu : le “Globe Trotter” chez les Peaux-Rouges – Récit de l’Indien – Monstre terrible », « Ma visite à la réserve indienne : une photographie rare » et « Les pilleurs de train : Adam Kelly et Bill Miner », qui assouvissent la soif d’exotisme des lecteurs du journal. Charles-Alexandre est également l’auteur d’une pièce de théâtre intitulée « Au fond des bois », qui obtient, en 1918, la troisième place au concours de l’Alliance artistique de Montréal et dont la lauréate n’est nulle autre que Marie-Louise[4]. À l’évidence, le frère et la soeur partagent une ambition littéraire commune, qui a pu constituer une source d’émulation. À l’occasion, Marie-Louise, qui semble exercer un certain ascendant littéraire sur son frère cadet, n’hésite pas à lui prodiguer des conseils littéraires :

Son talent délicat fait de sensibilité, d’impressions, jeunes, gagnera encore lorsqu’il se sera dégagé de cette mièvrerie captivante, mais qui donne parfois à ses écrits une note amolissante [sic]. Mais, c’est là, plutôt un défaut de l’âge.

Il faut vieillir, Monsieur, vieillir, dissiper l’ambiance qui vous a fait l’âme trop pensible [sic], trop vibrante…

1908a : 3

Tandis que la production littéraire de Charles-Alexandre demeure assez limitée si l’on en juge par son volume et les genres explorés (fantastique, théâtre), celle de Marie-Louise est bien plus abondante et diversifiée. De surcroît, l’oeuvre de Marie-Louise s’étend sur au moins deux décennies alors que celle de son frère couvre une période d’à peine six ans, entre 1905 et 1910. En outre, contrairement à sa soeur, Charles-Alexandre ne s’est, à notre connaissance, jamais aventuré dans le genre romanesque, se contentant de textes courts (si l’on exclut sa pièce de théâtre non publiée). Comme semblent l’indiquer les conseils dispensés par Marie-Louise à l’endroit de son frère cadet de même que leur intérêt commun pour le théâtre, il n’est pas impossible que le frère et la soeur se soient mutuellement influencés et aient même, à l’occasion, collaboré.

Un roman en gestation

« La grande épinettière » met en scène une jeune institutrice franco-canadienne du nom de Jeanne Béliveau, qui fait le choix d’aller enseigner à Grande-Coulée, petite communauté francophone de l’Ouest canadien. Si l’arrivée de Jeanne redonne espoir à la majorité des habitants du village, qui souhaite renforcer la présence du français, elle est, en revanche, perçue comme une menace par la minorité irlandaise soutenue par une frange de la population francophone qui a pris le parti de l’assimilation. La trame sociohistorique du roman se double d’une intrigue psychologique se nouant autour du drame de la « double » identité de Jeanne, qui est née au Canada de parents français, originaires de Nantes :

Oui, je suis née ici et c’est bien de me sentir fille de deux pays que vient le drame que je vis… le drame de cette double vocation qui fait que j’éprouve une indécision poignante, une sorte d’angoisse à l’idée de fixer par des paroles irrévocables ma destinée dans l’un ou l’autre…

LGE : 191

Dans le roman, ce drame prend la forme du dilemme amoureux auquel Jeanne fait face alors qu’elle se trouve tiraillée entre ses deux prétendants : le Français, Jacques Blachère, et le Canadien français, Norbert Trudeau. 

Dès leur arrivée en Alberta, Charles-Alexandre et Marie-Louise prennent fait et cause pour la survie du fait français. Toutefois, cet engagement transparaît peu, voire pas du tout, dans les écrits littéraires de Charles-Alexandre, qui préfère cultiver la veine de l’exotisme et du fantastique. En effet, sur les quinze textes que nous avons compilés, aucun ne traite de près ou de loin de la réalité des francophones au Canada. Seule « L’aurore blonde, nouvelle de l’Ouest canadien » mentionne la France, mais de façon anecdotique. En revanche, cette réalité est abordée de front dans plusieurs chroniques[5] de Marie-Louise, constituant même la trame de fond de Contre le flot et de Comme jadis.

En outre, il est intéressant de souligner que chacun de ces deux textes met en scène une institutrice. Dans Contre le flot, Marie-Blanche Gauvreau, l’une des protagonistes principales de la pièce, est une institutrice qui a quitté le confort de son Montréal natal pour venir enseigner le français en Alberta (49) et se mettre au service de la communauté francophone locale. Ses altercations avec le commissaire scolaire, évoquées au détour d’une réplique (41), ne sont pas sans rappeler celles auxquelles Jeanne est mêlée dans « La grande épinettière ». De même, dans Comme jadis, Herminie évoque, dans une de ses lettres, la difficile condition des institutrices dans les colonies francophones de l’Ouest, par l’intermédiaire du personnage de Mlle Saint-Jean qui 

[...] mangera sans se plaindre le lard et les patates. Elle ne deviendra combative que si un commissaire d’école trouve qu’elle fait bien longue l’heure de français et de catéchisme que permet la loi. Alors, elle qui ne représente qu’une autorité morale devant la force toute-puissante des commissaires d’école, elle cherchera des alliés et — j’ai honte de l’écrire — il arrive quelquefois que le vide se fait autour d’elle, qu’on murmure : — « On sait bien, faut du français, mais l’anglais est bien utile par icite, dans l’Ouest! » La petite maîtresse d’école se défend, se débat, montre les cahiers de ses élèves, prouve que l’enseignement de l’anglais n’est pas négligé, que l’inspecteur lui-même s’est déclaré satisfait. Les esprits s’échauffent; on ne sait d’où part la mauvaise parole et l’on apprend, un jour, que la maîtresse a reçu son congé, telle une « engagée » quelconque. Rassurez-vous, ce ne sera pas là l’histoire de Mlle Saint-Jean

Comme jadis, 66

« L’histoire de Mlle Saint-Jean » présente des ressemblances troublantes avec celle de Jeanne, qui doit également composer avec les convictions du commissaire scolaire et les réticences d’une certaine partie des habitants de Grande-Coulée. Sous la plume de Marie-Louise, les histoires de Mlle Saint-Jean, de Marie-Blanche Gauvreau et de Jeanne Belliveau font écho au récit mythique des missionnaires fondateurs. Comme le déclare Mme Lamarche dans Contre le flot en parlant des institutrices, « [l]’Est ne les connaît pas assez ces petites missionnaires qui le quittent pour une vie souvent dépourvue d’agréments. Et cependant, grâce à elles, des générations pourront remplir leur rôle en se transmettant le verbe maternel » (Contre le flot, 57).

Une correspondance retrouvée entre l’abbé Lionel Groulx et Marie-Louise jette une lumière inédite sur ses projets littéraires après son retour en France. Dans une lettre en date du 4 juillet 1925[6], Marie-Louise, qui dit se tenir informée de l’actualité canadienne-française, évoque le remplacement des compagnes de Jésus par une communauté irlandaise ainsi que les tensions entre commissaires scolaires français et irlandais. Il faut dire que ces tensions bien connues (Huel, 1975; Rainey, 1999), font l’objet d’une couverture médiatique dans les années 1920. Ainsi, plusieurs journaux francophones, comme L’Union et Le Patriote de l’Ouest, dénoncent la mainmise des Irlandais sur l’Église catholique et les commissions scolaires séparées en Alberta (et ailleurs au Canada), qui mettent en péril la préservation de la langue et de la culture françaises[7]. Faisant valoir la responsabilité fondamentale des « maîtresses » dans la préservation du français, Marie-Louise fait part à l’abbé Groulx de son désir d’écrire

[…] le roman d’une de ces vaillantes institutrices qui s’acharnent à entretenir l’étincelle sacrée, malgré le vent qui souffle, insidieux ou violent, des commissions scolaires trop souvent hostiles et si rarement soucieuses de leurs droits… L’école serait perdue, telle que je l’ai connue dans un lointain district. On verrait graviter autour d’elle ces éléments qui font la vie d’une de ces paroisses nées de la volonté d’un prêtre, de la ténacité de quelques hommes, et tout cela tellement français, tellement « chez nous » qu’il est impossible que tout cela ne le demeure pas. -- Il y aurait un jeune Canadien, né dans l’Ouest, élevé dans l’Ouest -- je le vois membre fondateur du cercle Dollard -- optimiste et ambitieux -- un Canadien de l’Ouest. Il y aurait un Anglais sympathique et si incompréhensif! Il faudrait faire quelque chose de très bien, de si bien que je crains de n’oser jamais attaquer mon sujet! Cependant il me hante…[8].

Dans une autre lettre, datée du 29 janvier 1926, celle-ci revient sur son roman en préparation à la lumière de l’actualité récente à l’époque en Alberta :

Je me tiens au courant du mouvement passionnant en Alberta. Il semble que je l’avais prévu. Le roman que j’ai sur le métier en prend une actualité remarquable. Je connais personnellement tous les personnages qui évoluent autour de cette question des écoles (si l’on peut dire); les sincères et les ambitieux; j’aurai bien du mal à ne pas en faire un roman à clef! - Peut-être vous souvient-il, Monsieur l’Abbé, que je vous ai tracé les grandes lignes de ce nouveau travail il y a plus de six mois! Il faut que ce soit quelque chose de très bien afin d’être utile à notre cause[9].

Dans un courrier envoyé près de 30 ans plus tard, Marie-Louise, qui réside alors dans la banlieue de Nice, confie à son correspondant qu’elle « espère publier d’ici quelque temps un roman qui sera le fruit de mes années canadiennes[10] ».

On ne peut s’empêcher de noter les nombreuses similarités entre le projet de roman que Marie-Louise décrit au fil de sa correspondance avec l’abbé Groulx et « La grande épinettière » : les deux textes mettent en scène une institutrice[11] dont l’oeuvre de francisation se heurte aux velléités des commissaires scolaires et de la minorité irlandaise; l’action se déroule dans une paroisse francophone isolée de l’Ouest canadien dont le quotidien est dépeint avec réalisme; enfin, le sous-genre privilégié est celui du roman à clé. Comme nous l’avons montré par ailleurs (Lacroix et Rao, 2012), le patronyme de certains personnages de « La grande épinettière » n’est pas sans rappeler celui d’illustres homonymes ayant marqué l’histoire de la francophonie albertaine (l’abbé Normandin = l’abbé Normandeau; Adéodat Bourgeois = Adéodat Boileau; P.-E. Tremblay = P.-E. Lessard).

Quelques considérations onomastiques et stylistiques

Les textes de Marie-Louise comportent plusieurs différences notables avec ceux de son frère. Partant, nous nous emploierons à montrer que certaines caractéristiques des textes de Marie-Louise les rapprochent de « La grande épinettière ».

D’une oeuvre à l’autre, Marie-Louise reprend les noms de ces personnages. Le cas le plus emblématique est celui de la réapparition du Dr André Lamarche[12], protagoniste principal de Contre le flot, et de sa mère dans le roman Comme jadis. Bien que cette pratique intertextuelle ne soit pas systématique, elle est néanmoins présente dans « La grande épinettière ». En effet, pas moins de huit noms propres utilisés dans le roman se retrouvent dans Comme jadis : Alma, Barney, Darky, Jeanne, Labbé, Malvina, Trudel et Valiquette. Il est intéressant de noter que le prénom de l’héroïne de « La grande épinettière » (Jeanne) apparaît dans Comme jadis, en plus d’être utilisé dans plusieurs chroniques[13]. Quant à « Darky », ce n’est autre que le nom du terre-neuve noir de Marie-Louise auquel elle consacre d’ailleurs une chronique (Magali, 1907 : 3). En revanche, aucun des noms de personnages de « La grande épinettière » ne se retrouve dans les textes de Charles-Alexandre.

Une des particularités des textes de Marie-Louise est de recourir à des mots et à des expressions du français canadien vernaculaire, en particulier dans les séquences dialoguées. Loin d’être inédite, cette pratique que l’on peut qualifier d’« hétéroglossique[14] » s’inscrit dans la continuité des romans québécois du xixe siècle (Grutman, 1996) et se généralise à partir des années 1960 et 1970 chez un Michel Tremblay ou un Réjean Ducharme. Les exemples ci-dessous, tirés de « La grande épinettière » et de Comme jadis, illustrent bien cette tendance à employer des canadianismes (et des anglicismes).

Tableau 1

Exemple d'utilisation de canadianismes et d'anglicismes dans « La grande épinettière » et Comme jadis

Exemple d'utilisation de canadianismes et d'anglicismes dans « La grande épinettière » et Comme jadis

-> Voir la liste des tableaux

Cette hétéroglossie se retrouve dans la pièce Contre le flot, en particulier dans les répliques de Mme Cantin (12-13), une Canadienne française qui cherche coûte que coûte à faire sa place dans la bourgeoisie anglaise de Montréal. En général, l’insertion de ces canadianismes (et d’anglicismes) se fait au moyen de guillemets et de l’italique, ce qui confère au français standard le statut de norme par défaut. L’utilisation d’un français vernaculaire semble traduire une volonté d’authenticité de la part de l’auteur, qui s’efforce de restituer le profil sociolinguistique des personnages[15]. Il convient de noter que l’emploi des canadianismes (mots et collocations) est particulièrement fréquent dans « La grande épinettière ». Du point de vue narratif, cette situation peut s’expliquer par le fait que le roman met en scène un grand nombre de personnages canadiens-français et métis, dont le narrateur rapporte les propos en style direct. En revanche, dans Comme jadis, la narratrice est davantage soucieuse d’expliquer ces termes et ces expressions vernaculaires à son correspondant français, notamment au moyen de périphrases explicatives (33; 59). Du point du vue lexical, « La grande épinettière » se rapproche de Comme jadis et dans une moindre mesure des chroniques eu égard au nombre de canadianismes (et d’anglicismes) employés. À titre d’exemple, en voici un échantillon qui se retrouve dans Comme jadis : « épinettes », « badrer », « revirer », « catalogne », « mouver », « à soir », « habitant », « maringouins », « solage » et « godendard ». En ce qui concerne les textes de Charles-Alexandre, ils sont écrits en français standard et ne contiennent ni canadianismes ni anglicismes.

Enfin, grâce au logiciel d’analyse de corpus Antconc, nous avons été en mesure de déterminer les collocations les plus fréquentes dans les deux sous-corpus et dans « La grande épinettière ». Cette procédure a notamment révélé la présence d’un « n-gramme » (ou séquence de mots) de quinze mots[16] communs (n=15) à « La grande épinettière » et à Comme jadis :

Tableau 2

Exemple d'un n-gramme de quinze mots dans « La grande épinettière » et Comme jadis

Exemple d'un n-gramme de quinze mots dans « La grande épinettière » et Comme jadis

-> Voir la liste des tableaux

Comme on peut s’en rendre compte, la ressemblance ne porte pas uniquement sur le nombre de mots; elle concerne également le thème (les avoines, les champs, le gel) et les qualités poétiques (le chromatisme). Aussi est-il difficile de croire qu’il s’agit d’une coïncidence.

Présentation du corpus

Notre corpus comprend un premier sous-corpus de textes écrits par Charles-Alexandre (sous-corpus « Alex ») et un second sous-corpus plus substantiel de textes signés par Marie-Louise (sous-corpus « Magali »). Plus précisément, le sous-corpus « Alex » se compose de quinze articles[17] parus sous le pseudonyme de Jean de Nobon dans quatre journaux différents, à savoir Le Globe Trotter, Le Journal de Françoise, La Patrie et Le Courrier de l’Ouest, entre le 23 novembre 1905 et le 14 avril 1910. Il s’agit d’un corpus relativement homogène de textes brefs (entre 282 et 2119 mots), qui appartiennent à des genres variés : « nouvelle », « conte », « poème en prose »[18] et compte rendu. Quant au corpus « Magali », il comprend 286 chroniques publiées sous la rubrique « Le coin féminin », entre 1906 et 1916, dans Le Courrier de l’Ouest ainsi que le roman épistolaire Comme jadis (1925). Les chroniques prennent elles-mêmes plusieurs formes : saynètes, contes, lettres, éphémérides, poèmes, textes d’opinion, etc. Nous avons fait le choix de ne pas inclure les pièces Contre le flot (1922) et Marraine de guerre (1922) afin de limiter autant que possible les variations de genre. C’est également pour cette raison que nous avons exclu les saynètes de l’ensemble des chroniques. Toutefois, nous avons tenu compte de ces textes dans l’analyse qualitative précédente puisqu’ils ont un statut central dans l’oeuvre de Marie-Louise.

Notre corpus appelle un certain nombre de remarques, qui prendront leur importance dans l’analyse stylométrique que nous entreprendrons dans la suite de cet article. En premier lieu, les deux sous-corpus sont de tailles inégales : 16 405 mots pour le sous-corpus « Alex » et 253 956 mots pour le sous-corpus « Magali ». En ce qui concerne « La grande épinettière » (« anonyme »), il comporte 61 921 mots. Dans le cas de textes courts, la méthode de comptage des mots les plus fréquents peut se révéler problématique (Schöberlein, 2017 : 644). Toutefois, il est toujours possible de combiner les textes en sous-corpus d’au moins 5000 mots (Eder, 2015 : 180) pour éviter ce problème. En second lieu, les sous-corpus comptent des textes de genres et de formats différents (par ex. des articles de presse et un roman épistolaire), ce qui est susceptible d’avoir un effet sur certaines méthodes stylométriques, comme le comptage des mots les plus fréquents (Kestemont et al., 2012; Stamatatos, 2013; Eder, 2015). En troisième lieu, Charles-Alexandre et Marie-Louise partagent le même récit familial. De surcroît, celle-ci a probablement exercé un ascendant littéraire sur son frère cadet. Ainsi, il n’est pas impossible que cette proximité tant familiale qu’intellectuelle se traduise par des similitudes de contenu et de forme entre les textes des deux sous-corpus. Enfin, nous savons que Françoise Paretti a effectué un certain nombre de modifications sur le texte original. Toutefois, nous ne connaissons pas le détail exact de ces modifications (même si nous savons que leur ampleur demeure limitée). Dans le même ordre d’idées, il est possible que le texte de Comme jadis ait fait l’objet d’interventions éditoriales avant sa publication. En ce qui concerne les chroniques parues dans les journaux, elles comportent des erreurs qui peuvent être attribuées non pas tant à l’auteure elle-même qu’à la qualité de la transcription dans les journaux[19]. Tous les points qui viennent d’être évoqués peuvent influencer les résultats de l’analyse stylométrique. À cela s’ajoute le fait que nous n’excluons pas l’hypothèse que Charles-Alexandre ait pu intervenir a posteriori sur le texte composé par sa soeur, ce qui corroborerait dans une certaine mesure le témoignage de Françoise Paretti. Nous verrons que cette hypothèse se trouve confirmée par l’analyse stylométrique.

Analyse stylométrique

La stylométrie peut être définie simplement comme l’analyse statistique du style littéraire. Celle-ci peut se révéler particulièrement utile pour établir avec plus ou moins de certitude l’identité de l’auteur d’un texte à partir de l’analyse de ses caractéristiques (stylistiques, sémantiques, etc.) combinée à celles d’autres textes. Ces caractéristiques peuvent varier : il peut s’agir de la longueur des mots, de la taille des phrases et des paragraphes, de l’orthographe, des mots les plus fréquents, de la ponctuation, de la richesse sémantique, de l’indice de lisibilité, des mots rares (hapex logomenon), etc. Les progrès dans le domaine de l’intelligence artificielle, de l’apprentissage machine ainsi que l’application de techniques statistiques multivariées ont contribué à faire de la stylométrie un outil de plus en plus fiable et dont les champs d’application ne cessent de s’étendre : détection du plagiat (Alsallal, Amin, James et al., 2013), authentification de l’auteur de messages (lettres, courriels, textos) incriminants (Chaski, 2005) et lutte contre les logiciels malveillants (Dewan, Kashyap et Kumaraguru, 2014). Depuis une dizaine d’années, un nombre croissant d’études dans le domaine de la littérature et des humanités numériques (Rueda, 2016; Barber, 2019) tirent parti des possibilités de l’analyse stylométrique pour revisiter et, parfois même, trancher des questions de paternité littéraire.

Pour tenter de déterminer qui, entre Charles-Alexandre et Marie-Louise, est l’auteur(e) de « La grande épinettière », nous avons choisi le logiciel à code source en accès libre Stylo R. Créé par Maciej Eder, Jan Rybicki et Mike Kestemont, celui-ci offre le double avantage d’effectuer une variété de calculs stylométriques communs dans l’attribution de la paternité d’une oeuvre et de présenter les résultats à l’aide d’une interface utilisateur graphique particulièrement ergonomique. En outre, Stylo R a déjà fait ses preuves dans de nombreuses études stylométriques (Schöberlein, 2017; Ilsemann, 2018).

Les calculs stylométriques effectués par l’ensemble Stylo R se basent sur les mots les plus fréquents (Most Frequent Words ou MWF), ainsi que sur les « n-grammes » que le logiciel séquence automatiquement à partir de caractères ou de mots communs. Fondées sur une approche lexicale (« bag-of-words »), ces méthodes sont aujourd’hui largement employées dans le domaine de la stylométrie (Mladenic et Grobelnik, 1998; Burrows, 2002; Eder, 2018). Les oeuvres soumises à l’analyse par Stylo R ont été choisies parmi les corpus d’oeuvres de Marie-Louise et de Charles-Alexandre, puis elles ont été transcrites pour les besoins de l’analyse. Le manuscrit anonyme de « La grande épinettière » fait partie de tous les calculs effectués et apparaît en lettres vertes dans les graphiques produits par Stylo R. Les oeuvres de Marie-Louise apparaissent, quant à elles, en lettres bleues dans les graphiques et se divisent en chroniques, en contes et en diverses oeuvres de fiction tirées des articles publiés originellement dans Le Courrier de l’Ouest entre 1906 et 1916 et compilées en partie dans l’ouvrage L’Ouest raconté par Magali Michelet et le site Web « Histoire de la presse écrite francophone dans l’Ouest canadien ». Nous avons également ajouté le roman épistolaire Comme jadis, dont la taille et le genre s’apparentent à ceux de « La grande épinettière ». Les oeuvres de fiction de Marie-Louise ont été divisées en plus petites collections (soit les chroniques, les contes, les oeuvres de fiction), afin d’avoir des fichiers de textes de taille semblable à ceux de Charles-Alexandre, dont les oeuvres individuelles apparaissent en lettres rouges. Nous nous sommes servis de trois calculs statistiques différents proposés par Stylo R, à savoir l’analyse typologique (cluster analysis), l’analyse en composantes principales (PCA) et l’arbre de consensus (consensus tree). Dans un second temps, nous mettrons à profit la fonction « Rolling classify » pour évaluer le degré d’intervention de Marie-Louise et de Charles-Alexandre dans le manuscrit.

L’analyse typologique présente les résultats sous la forme d’un dendrogramme afin d’organiser hiérarchiquement les textes analysés dans le corpus. Il s’agit ici de fixer des minima et des maxima égaux de mots fréquents et de pourcentages d’élagage (en anglais, culling) des mots uniques. Ces derniers paramètres s’appliquent aussi à l’analyse en composantes principales ou Principal Components Analysis (PCA), qui se sert d’une matrice de covariance afin de comparer les textes et d’établir des corrélations entre certains éléments. Une autre représentation par arbre de consensus permet de faire ressortir les similitudes entre les textes. Les graphiques qui décrivent les résultats se basent sur une analyse statistique des distances entre textes, c’est-à-dire des similitudes et des différences entre textes à partir des mots les plus fréquents (MFW). En l’occurrence, nous nous sommes servis de la distance Classique Delta, qui est celle préconisée notamment par Eder et al. (2018 : 16) et par Laramée (2022), afin de « comparer un texte (ou un ensemble de textes) anonyme aux signatures stylistiques de plusieurs auteurs en même temps » tout en « évit[ant] que les mots très fréquents dominent complètement les calculs » (Laramée, 2022).

Figure 1

Arbre de consensus, 100 à 1000 mots les plus fréquents (MFW) avec 0% d’élagage avec utilisation d’une distance classique delta

Arbre de consensus, 100 à 1000 mots les plus fréquents (MFW) avec 0% d’élagage avec utilisation d’une distance classique delta

-> Voir la liste des figures

Le dendrogramme ci-dessus ainsi que l’analyse typologique (par cluster) associent clairement le manuscrit de « La grande épinettière » à l’arborescence des oeuvres de Marie-Louise. En revanche, les oeuvres d’Alex Michelet se répartissent selon les ressemblances stylistiques détectées par le logiciel, qui regroupe, à titre d’exemple, « Ma visite à la réserve indienne », « Aurore blonde », « La Caverne-qui-pleure » et « Le secret du chalet clos » en raison de traits communs. Stylo R s’est servi d’une échelle de 100 à 1000 mots les plus fréquents pour effectuer les calculs qui ont permis l’organisation des oeuvres que nous voyons dans le premier graphique. L’analyse par cluster à partir de 500 MFW présente les mêmes résultats dans le second graphique que dans l’arborescence ci-dessus. Il convient de noter qu’un élagage par pourcentage de mots uniques n’a aucune influence substantielle sur le regroupement des oeuvres.

Figure 2

Analyse par grappe (cluster) 500 MFW avec 0% d’élagage avec utilisation d’une distance classique delta

Analyse par grappe (cluster) 500 MFW avec 0% d’élagage avec utilisation d’une distance classique delta

-> Voir la liste des figures

Stylo R peut également effectuer une analyse PCA qui permet d’établir des corrélations entre textes de différents auteurs par rapport à un manuscrit dont l’auteur est incertain. Une matrice de corrélation a été choisie, comme le recommandent Eder, Rybicki et Kestemont (2018 : 15), qui considèrent cette méthode plus fiable que celle basée sur une matrice de covariance.

Dans les graphiques 3 et 4 présentant l’analyse PCA, l’axe horizontal correspond à l’auteur (“authorship”), tandis que l’axe vertical correspond au genre. Tous les textes de Charles-Alexandre sont en rouge alors que ceux de Marie-Louise sont en bleu. Le calcul PCA regroupe toutes les oeuvres de Marie-Louise horizontalement, indépendamment du nombre de mots communs choisis, soit 500, soit 1000. Toutes les oeuvres de Marie-Louise sont regroupées selon l’axe vertical avec 500 MFW, ce qui veut dire que leur genre est semblable et qu’il y a de grandes chances que l’auteur soit le même. Cependant, avec 1000 MFW, le manuscrit de « La grande épinettière » se trouve associé au genre de Comme jadis ainsi qu’à celui de certains textes de Charles-Alexandre, mais de manière plus distante. L’analyse stylométrique confirme que Marie-Louise est bel et bien l’auteure des oeuvres qui lui sont attribuées ainsi que de « La grande épinettière ». De plus, ce texte appartient au même genre littéraire que les autres oeuvres de Marie-Louise. Charles-Alexandre, quant à lui, se voit attribuer la paternité de ses publications. Toutefois, celles-ci sont plus variées aussi bien en ce qui concerne leur genre que leur paternité. En effet, quatre d’entre elles (« Aurore blonde », « Le secret du chalet clos », « Ma visite à la réserve indienne » et « La Caverne-qui-pleure ») possèdent des caractéristiques des textes de Marie-Louise.

Figure 3

Analyse PCA par matrice de corrélation, 500 MFW avec 0% d’élagage

Analyse PCA par matrice de corrélation, 500 MFW avec 0% d’élagage

-> Voir la liste des figures

Figure 4

Analyse PCA par matrice de corrélation, 1000 MFW avec 0% d’élagage

Analyse PCA par matrice de corrélation, 1000 MFW avec 0% d’élagage

-> Voir la liste des figures

Une possible contribution de Charles-Alexandre?

La fonction « Rolling classify » permet de détecter les contributions d’un ou de plusieurs coauteurs d’un texte. Cette méthode se sert de la classification par SVM-linéaire[20] afin de découper un manuscrit d’auteur inconnu en parties égales, puis de les comparer à d’autres textes d’auteurs connus. Il est ainsi possible de quantifier la contribution d’un ou de plusieurs auteurs à un manuscrit. La fonction « Rolling classify » nous permettra de déterminer les contributions respectives de Marie-Louise et de Charles-Alexandre à « La grande épinettière ». Comme nous l’avons dit précédemment, nous n’excluons pas que chacun d’entre eux ait pu contribuer à la rédaction du roman dans des proportions qui restent à déterminer. Nous avons d’abord regroupé les textes attribués avec certitude à Charles-Alexandre et à Marie-Louise dans un ensemble de référence pour ensuite les comparer au manuscrit dans l’ensemble test.

Les résultats de « Rolling classify » fluctuent selon le nombre de mots fréquents (MFW) choisis et la taille des tranches de texte à prélever du manuscrit. Si le nombre de MFW est restreint (par exemple, 100) et que les tranches sont petites (par exemple, 500 mots par tranche), alors le manuscrit est attribué à Marie-Louise (en vert), avec de courtes contributions régulières de la part de Charles-Alexandre (en rouge)[21].

Figure 5

Fonction RollingClassify() par tranches de 500 mots de LGE avec les contributions potentielles de Marie Louise en vert et celles de Charles Alexandre en rouge selon le développement de l’intrigue du manuscrit

Fonction RollingClassify() par tranches de 500 mots de LGE avec les contributions potentielles de Marie Louise en vert et celles de Charles Alexandre en rouge selon le développement de l’intrigue du manuscrit

-> Voir la liste des figures

Cependant, si l’on augmente les MFW à 1000 et les tranches de texte à 5000 mots, le manuscrit en entier est attribué à Marie-Louise, avec seulement deux contributions localisées de son frère[22].

Figure 6

Fonction RollingClassify() par tranches de 5000 mots de LGE avec les contributions potentielles de Marie Louise en vert et celles de Charles Alexandre en rouge selon le développement de l’intrigue du manuscrit

Fonction RollingClassify() par tranches de 5000 mots de LGE avec les contributions potentielles de Marie Louise en vert et celles de Charles Alexandre en rouge selon le développement de l’intrigue du manuscrit

-> Voir la liste des figures

D’après ce calcul, les deux sections du manuscrit qui semblent avoir reçu la contribution de Charles-Alexandre sont le chapitre VI (à partir de 16 108 mots) et les chapitres XV ou XVI (à partir de 41 556 mots), comme le montre le diagramme ci-dessus. En effectuant un calcul « Rolling classify » individuel pour le chapitre VI, il est possible d’identifier et de visualiser plus clairement les interventions de Charles-Alexandre.

Le chapitre VI est essentiellement descriptif et compte moins de séquences dialoguées que les autres (sans que cela suffise toutefois à en faire une exception). Toutefois, il comporte plusieurs canadianismes (par exemple, « homestead », « mouvé » et « virer son capot ») caractéristiques du style hétéroglossique de Marie-Louise. D’une manière générale, les interventions de Charles-Alexandre semblent assez légères au point de se diluer à mesure que l’on augmente le nombre de MWF, comme dans les graphiques ci-dessous où les contributions de Charles-Alexandre diminuent substantiellement, jusqu'à disparaître complètement, lorsque nous passons de 500 MFW à 1000 MFW[23].

Figure 7

Fonction RollingClassify() avec 500 mots fréquents analysés du chapitre 6 de LGE avec les contributions potentielles de Marie Louise en vert et celles de Charles Alexandre en rouge selon le développement de l’intrigue du chapitre

Fonction RollingClassify() avec 500 mots fréquents analysés du chapitre 6 de LGE avec les contributions potentielles de Marie Louise en vert et celles de Charles Alexandre en rouge selon le développement de l’intrigue du chapitre

-> Voir la liste des figures

Figure 8

Fonction RollingClassify() avec 1000 mots fréquents analysés du chapitre 6 de LGE avec les contributions potentielles de Marie Louise en vert et celles de Charles Alexandre en rouge selon le développement de l’intrigue du chapitre

Fonction RollingClassify() avec 1000 mots fréquents analysés du chapitre 6 de LGE avec les contributions potentielles de Marie Louise en vert et celles de Charles Alexandre en rouge selon le développement de l’intrigue du chapitre

-> Voir la liste des figures

Conclusion

L’examen des éléments biographiques et stylistiques de même que l’analyse stylométrique nous amènent à conclure que Marie-Louise est l’auteure de « La grande épinettière ». Le témoignage de Françoise Paretti et les interrogations qu’il soulève jettent un doute raisonnable sur l’identité de l’auteur(e) du texte. Auteure de chroniques, de pièces de théâtre et d’un roman, Marie-Louise, qui avait acquis au début des années 1920 une certaine notoriété au Canada français, avait déjà à son actif une oeuvre romanesque. En revanche, Charles-Alexandre, même s’il nourrissait également une ambition littéraire, s’est, pour sa part, contenté de signer des textes courts qui se démarquent par leur exotisme et leur tonalité fantastique. Or, aucun de ces aspects ne se retrouve dans « La grande épinettière » dont l’action, qui rappelle celle des romans du terroir, se déroule dans une paroisse francophone de l’ouest de l’Alberta durant la première moitié du xxe siècle. Le récit se concentre autour de Jeanne Béliveau, jeune institutrice franco-canadienne, qui fait face à la fois aux démons de l’assimilation (incarnés notamment par la communauté catholique irlandaise) et à une crise d’identité personnelle. Garant de la survie de la langue et de la culture françaises, l’archétype de l’institutrice occupe une place de choix dans plusieurs oeuvres de Marie-Louise. En ce qui concerne l’intrigue générale de l’oeuvre, elle ressemble tant par son contenu que par sa forme (celle d’un roman à clé) à celle du roman en gestation que Marie-Louise évoque dès 1925 dans sa correspondance avec l’abbé Groulx. Il n’est donc pas impossible que la rédaction du manuscrit ait commencé bien avant les années 1970, contrairement à ce qu’avance Françoise Paretti.

À y regarder de plus près, « La grande épinettière » comporte de nombreuses ressemblances avec les écrits de Marie-Louise : on y retrouve les noms de plusieurs personnages de Comme jadis ainsi qu’une écriture hétéroglossique qui fait coexister la langue vernaculaire de personnages canadiens-français et métis avec le français standard. L’analyse stylométrique conduite au moyen du logiciel en accès libre Stylo R confirme les résultats de l’étude qualitative. L’analyse typologique, l’analyse en composantes principales et l’arbre de consensus associent systématiquement ce roman aux oeuvres de Marie-Louise. Quant aux résultats obtenus grâce à la fonction « Rolling classify », ils confirment l’hypothèse de la contribution de Charles-Alexandre au manuscrit. Toutefois, cette contribution, dont la nature exacte reste difficile à déterminer, demeure superficielle.

« La grande épinettière » ou, plus exactement, « La paroisse de Grande-Coulée », selon son titre originel, vient enrichir l’oeuvre méconnue de celle qui fut l’une des pionnières des lettres francophones dans l’Ouest canadien. En plus d’apporter un témoignage historique inédit sur le combat pour la survie des francophones dans les petites communautés de l’Alberta, le roman interroge tant dans son fond que dans sa forme la diversité de cette identité francophone. Le drame identitaire que traverse Jeanne de même que l’hétéroglossie du roman constituent autant d’illustrations de cette diversité qui se retrouve aujourd’hui plus que jamais au coeur des communautés francophones en situation minoritaire.