Résumés
Résumé
En réponse à la remise en cause fréquente de la qualité de la traduction en anglais des lois du Québec dans la presse et chez les juristes, nous proposons, dans le cadre de la traductologie de corpus, une analyse outillée des décalages informationnels sur la totalité du corpus de près de 13 millions de mots contenus dans l’ensemble des lois codifiées du Québec (6,46 millions en français ; 6,45 millions en anglais). Nous nous intéressons plus particulièrement aux paires de segments hétéromorphes et hors normes criblées respectivement grâce au calcul du ratio de la précision de l’information traduite normalisé (PITN) et à celui de la distance euclidienne normalisée (DEN). Ces indicateurs sont fondés sur la valeur normalisée de trois attributs des segments source et cible, à savoir le nombre de caractères, le nombre de mots lexicaux et le nombre de mots grammaticaux et lexicaux (mots totaux). L’examen manuel d’un grand nombre de paires de segments hétéromorphes et hors normes (criblées de manière automatique avec ces deux indicateurs) met en évidence la variété et la complexité des techniques déployées par les professionnels de la traduction dans les décalages informationnels de traduction et fait état d’un nombre infime de 8 erreurs de traduction caractérisées par l’omission complète de l’un ou l’autre des segments source et cible. Nos données semblent indiquer que la traduction des textes de loi du Québec répond tout à fait aux normes professionnelles de traduction du champ de spécialisation de la traduction juridique. L’analyse des paires de segments criblées confirme aussi le rôle significatif de la redondance et de l’ellipse dans la traduction ; ainsi que les interférences qu’elles créent dans l’analyse de l’explicitation en traduction, à l’instar de toutes les contraintes de nature phraséologique qui interviennent dans l’activité de traduction et qui obligent les traducteurs à transgresser la norme de l’isomorphisme du contenu informationnel des traductions.
Mots-clés :
- corpus bilingue parallèle,
- hétéromorphisme de traduction,
- décalage informationnel,
- traduction juridique,
- explicitation
Abstract
Jurists and the press regularly question the quality of the English versions of Québec laws, which are translated from French. We propose, within the framework of corpus translatology, a tool-based analysis of the informational deviations on the entire corpus of nearly 13 million words found in all consolidated statutes of Québec (6.46 million in French; 6.45 million in English). We focus on heteromorphic and non-standard segment pairs screened with the help of two metrics: ratio of standardized translated information precision (STIP) and standardized Euclidean distance (SED), respectively. These metrics are based on the standardized value of three features of the source and target segments, namely the number of characters, the number of lexical words and the number of grammatical and lexical words (total words). Manual examination of a large number of heteromorphic and non-standard segment pairs (automatically screened with these two indicators) highlights the variety and complexity of the techniques used by translation professionals in informational translation deviations, and reports a tiny number of 8 translation errors characterized by the complete omission of either source or target segment. Our data suggest that the translation of Québec law texts fully meets the professional translation standards of the legal translation field of specialization. The analysis of the pairs of segments screened also confirms the significant role played by redundancy and ellipsis in translations as well as their interference in the analysis of explicitation in translation, just like all constraints of a phraseological nature that occur in translation operations and which compel translators to transgress the norm of isomorphism of the information content of translations.
Keywords:
- parallel bilingual corpus,
- translation heteromorphism,
- information deviation,
- legal translation,
- explicitation
Resumen
En respuesta al frecuente cuestionamiento, en la prensa y entre los juristas, de la calidad de la traducción al inglés de las leyes codificadas de la provincia canadiense de Québec, proponemos, en el marco de la traductología de corpus, un análisis basado en herramientas de las desviaciones informativas sobre el conjunto del corpus de casi 13 millones de palabras contenidas en todas las leyes codificadas de Québec (6,46 millones en francés; 6,45 millones en inglés). Nos interesan especialmente los pares de segmentos heteromórficos y fuera de norma cribados gracias respectivamente al cálculo de la relación entre la precisión de la información traducida estandardizada (PITE) y la de la distancia euclidiana estandardizada (DEE). Estos indicadores se basan en el valor normalizado de tres características de los segmentos de origen y destino, a saber, el número de caracteres, el número de palabras léxicas y el número de palabras gramaticales y léxicas (total de palabras). El examen manual de un gran número de pares de segmentos heteromórficos y no estándar (cribados automáticamente con estos dos indicadores) pone de manifiesto la variedad y la complejidad de las técnicas utilizadas por los profesionales de la traducción en las desviaciones informativas, y da cuenta de un número ínfimo de 8 errores de traducción caracterizados por la omisión completa del segmento de origen o de destino. Nuestros datos sugieren que la traducción de los textos jurídicos de Québec cumple plenamente las normas de traducción profesional del campo de especialización de la traducción jurídica. El análisis de los pares de segmentos examinados también confirma el importante papel de la redundancia y la elipsis en la traducción, así como la interferencia que crean en el análisis de la explicitación en la traducción, al igual que todas las restricciones fraseológicas que intervienen en la actividad traductora y que obligan a los traductores a transgredir la norma del isomorfismo del contenido informativo de las traducciones.
Palabras clave:
- corpus bilingüe paralelo,
- heteromorfismo de la traducción,
- desviación informativa,
- traducción jurídica,
- explicitación
Corps de l’article
On raidit les étais, et la drisse de cuir hissa les voiles blanches.
La brise alors s’en vint taper en pleine toile, et le vaisseau partit dans les bouillons du flot qui sifflait sous l’étrave, et le vaisseau, courant sur le flot, faisait route[1].
1. Introduction
C’est une petite bombe que les barreaux du Québec et de Montréal ont lâchée en avril 2018. Ils demandaient à la Cour supérieure d’invalider l’ensemble des lois et des règlements du Québec… parce qu’ils ont été traduits.
Vous avez bien lu. Le problème n’était pas une mauvaise traduction, mais l’existence même de cette traduction.
Pour comprendre, examinons l’argument des deux organismes. Dans une demande déposée à la Cour supérieure du Québec le 13 avril, l’ordre professionnel des avocats québécois et sa section de Montréal ont avancé que les lois du Québec seraient inconstitutionnelles parce que l’une d’elles (le Code de procédure civile) « n’est pas l’oeuvre du législateur, mais plutôt le fruit de l’interprétation qu’en ont fait les traducteurs de l’Assemblée nationale »[2].
C’est que les lois du Québec ne devraient pas être traduites, plaidaient-ils. Elles devraient être conçues, débattues, amendées et adoptées simultanément en français et en anglais. Selon eux, un arrêt de la Cour suprême[3] stipule que l’article 133 de la Loi constitutionnelle de 1867 requiert « l’usage simultané de l’anglais et du français […] pendant tout le processus d’adoption des lois »[4]. Mais ce n’est pas ce qui se passe à l’Assemblée nationale. Le processus législatif québécois est « pratiquement unilingue suivi à la toute fin d’une traduction », déploraient les deux organismes[5]. Le fait de traduire ainsi les lois en anglais plutôt que de les rédiger simultanément en français et en anglais invaliderait l’ensemble des lois et règlements de la province, selon eux.
L’année suivante, les deux organismes abandonnaient finalement leur recours, satisfaits parce que « plusieurs gestes concrets ont été posés par l’Assemblée nationale et le gouvernement du Québec […] dont la mise sur pied d’une équipe de juristes dédiée uniquement à la version anglaise des projets de loi et l’embauche de personnel spécialisé (traducteur et réviseur) additionnel »[6].
Même si le dossier est clos et que ce n’était pas la question de fond, une autre question demeure. Elle est d’intérêt pour les traductrices et les traducteurs, comme pour le public : qu’en est-il de la qualité de la traduction des lois du Québec ? Justifie-t-elle la mise en oeuvre de mesures correctives visant à l’améliorer ?
Dans leur requête, les barreaux du Québec et de Montréal ne mentionnaient qu’une seule loi, le nouveau Code de procédure civile sur lequel les parlementaires ont travaillé au cours des premières années de la décennie 2010. Dès 2011, les barreaux ont écrit au ministre de la Justice « afin de lui faire part de leur déception quant à la qualité de la version anglaise de l’avant-projet du Code de procédure civile »[7]. Quand il a été sanctionné par le lieutenant-gouverneur, le 21 février 2014, le Code n’avait toujours pas de version anglaise. Celle-ci n’a été disponible que trois semaines plus tard, le 14 mars 2014[8]. Cette version anglaise a dû faire l’objet d’amendements en 2014, 2015 et 2016, amendements qui n’ont pas été nécessaires dans la version française[9]. Le Code est finalement entré en vigueur le 1er janvier 2016. Quelques corrections ont dû être effectuées par la suite.
Nulle part les barreaux du Québec et de Montréal n’ont-ils fourni d’exemples de problèmes de traduction dans le Code qui était en vigueur au moment de leur demande ni dans aucune autre loi ou règlement du Québec.
C’est dans les médias que d’autres exemples ont été donnés. L’article qui revenait le plus souvent est le 439.1 du Code de la sécurité routière qui interdit le téléphone intelligent au volant. Le problème résidait dans la définition de l’appareil (en gras dans les exemples ci-dessous).
Le premier paragraphe de sa version française disait : « Une personne ne peut, pendant qu’elle conduit un véhicule routier, faire usage d’un appareil tenu en main muni d’une fonction téléphonique ». Dans sa version anglaise, le même article disait : « No person may, while driving a road vehicle, use a hand-held device that includes a telephone function ».
Un Montréalais qui avait reçu un constat d’infraction en 2009 avait tenté de se défendre en disant qu’il tenait son appareil coincé entre l’épaule et l’oreille. Son appareil n’était pas « tenu en main », et donc il ne contrevenait pas à la loi. Mais le juge s’est servi du texte anglais pour le condamner. Ce qui est interdit, ce n’est pas de tenir un appareil en main, c’est d’utiliser un hand-held device. « L’expression “appareil tenu en main” est tout simplement une traduction malheureuse (ou mot à mot) de l’expression “hand-held device” », avait conclu le juge[10], une mauvaise traduction dont il ne fallait pas abuser pour échapper à l’intention du législateur.
En juin 2018, cette ambiguïté a été abrogée. Un nouvel article précise qu’il est désormais interdit : « […] de faire usage d’un téléphone cellulaire ou de tout autre appareil portatif conçu pour transmettre ou recevoir des informations ou pour être utilisé à des fins de divertissement, ou de faire usage d’un écran d’affichage ». En anglais, cela a été traduit par : « […] using a cellular telephone or any other portable device designed to transmit or receive information or to be used for entertainment purposes, or from using a display screen ».
L’exemple du Code de la sécurité routière est intéressant parce qu’il a été présenté comme un cas de mauvaise traduction… alors qu’il n’en est pas un. Le terme mal rédigé ne se trouve pas dans la traduction (la version anglaise), mais dans l’original (la version française). Bien au contraire, cet exemple illustre une fonction normative très utile de la traduction qui permet aux rédacteurs de revenir sur leur texte et de corriger ou de préciser le message maladroitement formulé dans le texte de départ, comme c’est le cas ici. Parce qu’elle s’appuie sur une compréhension globale du texte, des termes utilisés et de leurs relations établies par le ou les rédacteurs, cette fonction corrective de la traduction est probablement plus efficace une fois le texte de départ terminé. En effet, dans le feu de la rédaction, les choix terminologiques ne sont pas définitifs et ils n’ont pas été validés par la prise en compte des relations entre les termes concurrents ou quasi synonymiques, qu’ils soient présents ou non dans le texte (pour les termes non retenus, la décision de les exclure est à tout le moins en partie réfléchie).
René Lemieux a relaté un autre cas en avril 2018. Il s’agit de l’article 167 de la Loi sur les accidents de travail et les maladies professionnelles. À son sixième alinéa, cet article dit, en français, qu’un programme de réadaptation professionnelle peut comprendre, notamment, « l’adaptation d’un poste de travail ». En anglais, le texte dit plutôt qu’il peut comprendre « the adaptation of a position ».
Il ne s’agit pas du tout de la même chose. Le texte français parle d’un « poste de travail ». Le texte anglais désigne un emploi. La différence entre les deux versions a fait l’objet d’une discussion en Cour suprême et c’est la version française qui a été retenue comme celle reflétant le mieux l’intention du législateur (Lemieux 2018). Mais dans la dernière mise à jour de cette loi, au 1er avril 2021, la différence subsistait.
Le « problème ne date pas d’hier », écrivait le Barreau du Québec dans un mémoire déposé au Comité permanent des langues officielles de la Chambre des communes[11]. Cela s’est également produit « lors de l’adoption du Code civil du Québec en 1991. Il aura alors fallu plusieurs années pour régler les différents problèmes soulevés par les rédactions grandement différentes [du Code] en français et en anglais »[12]. Il y avait tant de traductions problématiques qu’il a fallu adopter une autre loi uniquement pour les corriger. La Loi visant à assurer une meilleure concordance entre les textes français et anglaisduCode civil compte plus de 300 articles, autant qu’il y avait de corrections à effectuer !
Bref, « nos lois sont mal traduites », estime le chroniqueur de La Presse Yves Boisvert[13]. Mais le sont-elles vraiment toutes ? En faisant la somme des exemples fournis par les barreaux et de ceux qui ont été mentionnés dans la presse et la littérature, on a un échantillon de quatre lois. Cela ne représente que 0,78 % des 515 lois qui étaient en vigueur au milieu de l’année 2018. L’affirmation selon laquelle les lois sont mal traduites demande donc un examen plus exhaustif.
Et jusqu’à quel point sont-elles mal traduites, en supposant qu’elles le soient ? La question mérite d’être posée puisqu’au Québec le texte français et le texte anglais des lois ont la même valeur sur le plan juridique (Côté 1982/2009 : par. 1215). La version française ne prévaut pas. À notre connaissance, une analyse systématique de la qualité de la traduction des lois du Québec n’a jamais été publiée. C’est l’objectif de cet article.
2. Situation unique de la traduction juridique au Québec
La situation de la traduction des lois du Québec en anglais est indissociable de la situation globale de la traduction des lois au Canada, un pays bilingue et bijuridique où s’épanouissent les langues-cultures anglo-canadienne et franco-canadienne ainsi que la common law et le droit civil canadiens et québécois. Au Canada, comme le fait remarquer McLaren (2016), les textes de loi sont destinés à quatre publics cibles différents : les citoyens anglophones vivant sous le régime de la common law ; les citoyens francophones vivant sous le régime de la common law, les citoyens francophones vivant sous le régime du droit civil et les citoyens anglophones vivant sous le régime du droit civil. Dans le cas du Québec, cette province semble être la seule au pays où on trouve, comme le fait remarquer à juste titre Gémar (2019 : 21), un droit hybride puisque s’y appliquent le droit civil en droit privé, et la common law en droit public. C’est très certainement une des raisons qui explique que les lois du Québec sont encore aujourd’hui les seules au Canada à être traduites selon la méthode de la traduction en vase clos, par opposition à la technique de la traduction législative interactive ou à la corédaction (McLaren 2016), c’est-à-dire sans les avantages d’échanges et d’interrévisions provenant de juristes des langues-cultures bilingues et bijuridiques qu’autorisent, en théorie et assez souvent en pratique, ces deux autres méthodes.
Les pressions sont fortes au Canada comme au Québec pour privilégier des méthodes de traduction juridique qui intègrent pleinement des spécialistes du droit des deux traditions britannique et civiliste au Canada, même si cela a pour effet aussi, comme l’explique Lavoie (2002 : 198), que « la traduction est souvent perçue comme un processus déformateur, entraînant du même coup une perception négative tant du résultat final (le texte traduit) que de la profession de traducteur ». Même si des anglophones du Québec jettent le discrédit sur la traduction en anglais des lois du Québec, un auteur comme Coates (2011 : 57), qui a étudié la traduction du Code civil du Québec en anglais, adopte une démarche plus posée et insiste dans son plaidoyer sur la contribution des deux langues anglaise et française dans une formulation plus claire de la loi et dans une compréhension plus juste de l’intention du législateur.
3. Objectif
Dans le but de vérifier la qualité brute des traductions en anglais des textes de loi du Québec rédigés en français, nous avons conçu un algorithme écrit en langage Python et un dispositif empirique inspiré de la science des données ainsi que de la linguistique et de la traductologie de corpus[14]. Notre dispositif s’appuie sur la constitution et l’analyse automatique de corpus parallèles de traduction en vertu desquelles les textes sources et leur traduction sont alignés phrase par phrase ou paragraphe par paragraphe, selon le cas. Le résultat de l’alignement de chacune des phrases du texte source avec chacune des phrases du texte cible (la traduction) qui lui correspond est appelé une paire de segments. La paire de segments représente l’unité minimale de l’analyse des corpus parallèles de traduction. La nature de son contenu, tout comme celle du paragraphe, varie en fonction de la mise en forme du texte : une paire de segments peut réunir deux syntagmes source et cible (qui sont chacun suivis d’un retour de chariot, comme dans les énumérations), deux phrases source et cible, simples ou complexes, voire plusieurs phrases source et cible réunies dans un paragraphe (voir plus loin les règles de sous-segmentation que nous avons appliquées).
Par ce travail d’analyse des lois, nous espérons aussi proposer aux juristes, aux jurilinguistes et aux traducteurs et réviseurs juridiques ou légistiques une description générale des particularités textuelles et traductologiques de la traduction des lois du Québec du français à l’anglais. Le dispositif empirique mis en oeuvre vise à offrir une description objective des traductions que l’on retrouve dans le corpus de textes spécialisés que représentent les lois. Les méthodes et les outils déployés dans le dispositif présenté ci-après ont été déjà décrits ailleurs en partie sur de plus petits corpus (Poirier 2019 ; 2021), aussi le présent article se propose de décrire de quelle manière ils ont été adaptés pour analyser automatiquement le nombre considérable de données textuelles tirées du corpus des lois du Québec, et les résultats que ces adaptations ont permis d’obtenir.
3.1 Un algorithme qui analyse les paires de segments
Notre dispositif empirique repose sur un algorithme dont le principe directeur consiste à mesurer le volume d’information des segments source et cible grâce au décompte des mots lexicaux qui se trouvent dans l’un et l’autre segment dans le but de trouver de façon automatique les paires de segments qui présentent des décalages informationnels de traduction significatifs. L’information désigne dans notre dispositif empirique des mots lexicaux, à savoir les noms, les verbes, les adjectifs et les adverbes, pour le français et l’anglais. En ce sens, l’information est envisagée de manière formelle, comme c’est le cas dans la théorie de l’information (élément qui est transmis)[15].
Notre hypothèse de travail est que plus les décalages informationnels seront prononcés dans une paire de segments, plus celle-ci sera susceptible de contenir des erreurs de dénombrement des éléments de sens en traduction. L’importance accordée au traitement automatique dans notre dispositif d’évaluation des traductions découle de la nécessité de traiter la totalité des données volumineuses de notre corpus, mais elle ne doit pas occulter le fait essentiel que la validation de ces méthodes et leur paramétrage doivent être assujettis à l’appréciation des résultats par un spécialiste de la langue ou un professionnel de la traduction (ce que l’un des deux auteurs du présent article est). Comme la traduction professionnelle des lois du Québec a pour objectif de rendre dans une deuxième langue tout le contenu informationnel et toute la portée juridique de celles-ci, l’analyse des contenus informationnels des lois et de leur traduction pourra nous indiquer, le cas échéant, quels types d’information sont jugés essentiels ou secondaires dans l’exercice de la traduction spécialisée du domaine juridique.
Si les erreurs de dénombrement du sens (du volume informationnel) mises au jour grâce aux décalages informationnels ne représentent qu’une partie des erreurs de traduction possibles, la détection et la reconnaissance dans les textes traduits des autres erreurs de traduction qui comportent la déformation du sens (du contenu informationnel) en traduction (comme les glissements de sens, les contresens, les faux sens ou les interférences) dépendent en revanche étroitement de l’équivalence des volumes d’information des autres éléments textuels du segment dans lequel ces erreurs se trouvent. Le repérage des erreurs de déformation ne pourra pas faire l’économie du repérage des erreurs de dénombrement du sens car pour bien analyser les erreurs de déformation, il faudra pouvoir compter sur le même volume d’information entre les segments source et cible.
3.2 Définition et constitution du corpus
Le criblage de paires de segments hors normes susceptibles de contenir des décalages de traduction a porté sur la totalité des lois du Québec en vigueur dans leurs versions française et anglaise publiées dans la section « Lois codifiées » de LégisQuébec. Le site web LégisQuébec en est la source officielle[16].
Nous avons choisi d’analyser la traduction des lois qui étaient en vigueur le 4 juillet 2018. Cette date a été sélectionnée au hasard, uniquement en raison de nos disponibilités respectives pour effectuer l’extraction du texte des lois. Les lois abrogées ou qui n’étaient pas encore officiellement en vigueur ce jour-là ont été exclues de notre corpus.
Le texte de chaque loi a été consigné dans un fichier de valeurs séparées par des virgules (.csv). Dans ces fichiers, chaque ligne contenait un paragraphe de la loi. Pour chaque paragraphe, nous avons recueilli le texte en français, le texte en anglais et certaines métadonnées pour chacun (numéro d’article, nombre de mots dans chaque langue, etc.). Notre corpus final de 515 fichiers ou textes de loi contient les éléments suivants :
176 633 paragraphes (qui peuvent contenir une ou plusieurs phrases en français ou en anglais) ;
198 040 phrases françaises (après segmentation de certains paragraphes en phrases) ;
197 662 phrases anglaises (après segmentation de certains paragraphes en phrases) ;
196 544 unités d’analyse ou paires de segments (par défaut, un paragraphe ou, sinon, à l’intérieur d’un même paragraphe, une ou plusieurs phrases françaises associées à une ou plusieurs phrases anglaises) ;
Un total de 12 916 497 mots, soit 6 463 597 en français (50,04 %) et 6 452 900 en anglais (49,96 %) ;
Un total de 6 719 055 mots lexicaux, soit 3 409 092 en français (50,7 %) et 3 309 963 en anglais (49,3 %) ; ce qui donne un ratio PIT (précision de l’information traduite) brut du nombre de mots lexicaux anglais, divisé par le nombre de mots lexicaux français de 0,9709 ;
Un total de 78 551 785 caractères, soit 40 148 895 en français (51,11 %) et 38 402 890 en anglais (48,89 %).
Pour une paire de segments donnée, le calcul du ratio PIT brut est calculé par la division du nombre de mots lexicaux du segment cible par le nombre de mots lexicaux du segment source. Le ratio PIT brut donne ainsi une appréciation du volume d’information de la traduction par comparaison avec le segment source. Lorsqu’il se situe très près de 1,0, le ratio PIT brut traduit le principe selon lequel le volume d’information d’une traduction devrait être semblable au volume d’information de son segment source. Ce principe de concordance est à rapprocher du principe de la traduction littérale qui peut être utilisé comme technique de traduction et, dans une certaine mesure, comme critère d’appréciation de la traduction. La concordance de l’information en traduction a été documentée notamment par Gile (2005), qui s’est intéressé aux paramètres de la fidélité informationnelle des traductions, et qui en arrive à ce constat s’appliquant à tous les types d’informations :
[…] hormis les cas spéciaux, la norme sociale prédominante qui définit la traduction veut que le traducteur reproduise « précisément » le texte de celui-ci [l’auteur]. Dans ces conditions, les traducteurs professionnels de textes à vocation informative choisissent en général de respecter dans la mesure du possible le contenu informationnel total du texte de départ sans tenir compte du fait qu’il contient des informations secondaires tant qu’ils estiment que cela ne pose pas de problèmes au regard de l’effet escompté de l’énoncé sur leur destinataire.
Gile 2005 : 98
Dans le calcul du volume informationnel, la prise en compte des mots grammaticaux intervient de manière subsidiaire car leur utilisation se rapporte davantage aux usages conventionnels de chaque langue plutôt qu’aux contenus informationnels communiqués. Ce sont rarement les mots grammaticaux que l’on traduit mais plutôt l’information communiquée dans chaque segment par les mots lexicaux, ou sinon la relation que les mots grammaticaux établissent entre les mots lexicaux. L’intérêt des mots lexicaux pour la traduction tient aussi au fait que les omissions et les ajouts en traduction sont définis par des différences de mots lexicaux entre l’énoncé source et l’énoncé cible ; et c’est l’écart en mots lexicaux qui fournit des indications sur la précision de la traduction (indépendamment de la proportion de mots totaux et grammaticaux dans les deux langues).
Dans la prise en compte des volumes d’information, notre unité de mesure est la phrase ou le segment et non pas leurs syntagmes constitutifs car certains syntagmes de la langue générale[17] représentent des contre-exemples au principe de la concordance du volume d’information (en mots lexicaux) de la traduction avec son segment source. C’est le cas de certains mots composés et de certaines unités phraséologiques lexicalisées dont la traduction est non littérale et présente de ce fait des décalages d’un ou deux mots lexicaux qui n’ont pas d’incidence sur la qualité de leur traduction. Ces cas particuliers s’ajoutent aux contraintes linguistiques qui s’exercent sur la traduction sans toutefois la conditionner. Dans les phrases, et sur le plan du discours, la quantité d’information n’est pas arbitraire ; c’est elle qui conditionne l’opération de traduction, comme l’explique Gile (2005 : 98), et comme l’a montré aussi notre analyse (Poirier 2017) qui fait état, dans les textes, des très fortes corrélations (supérieures à 0,95 en moyenne) du nombre de caractères, du nombre de mots lexicaux et du nombre de mots totaux entre les segments source et cible d’un corpus parallèle de traduction. Ces corrélations ont également été vérifiées dans le corpus LégisQuébec des 515 textes de loi du Québec. Les écarts informationnels (d’un ou deux mots lexicaux) induits par les mots composés et les unités phraséologiques lexicalisées sont neutralisés dans nos méthodes d’évaluation des traductions grâce à la normalisation de la mesure des décalages informationnels dans les paires de segments qui s’appuie sur les valeurs moyennes des caractéristiques linguistiques des paires de segments et leurs écarts-types, comme nous l’expliquons dans la prochaine section.
3.3 Méthodologie
Le traitement du corpus parallèle et l’analyse de ses données textuelles se sont déroulés en trois grandes étapes, dont les différentes opérations ont été regroupées dans trois modules programmés en langage Python.
Un premier module a traité tous les paragraphes des textes de loi de manière à sous-segmenter, dans certaines conditions bien définies, les paragraphes en phrases grâce à la méthode proposée par Greenberg[18], et optimisée par nous pour les textes législatifs québécois en français et en anglais. Lorsque les paragraphes source et cible sont symétriques pour ce qui est du nombre de phrases (même nombre de phrases sources que le nombre de phrases cible), leur sous-segmentation automatique est aisée (chaque phrase source correspond, ou devrait correspondre, séquentiellement, à chaque phrase cible). Lorsque les paragraphes sont asymétriques pour ce qui est du nombre de phrases, deux stratégies de sous-segmentation ont été mises en oeuvre. Dans le cas d’une asymétrie simple (un écart d’une seule phrase sépare les paragraphes source et cible), la sous-segmentation consiste à repérer les phrases symétriques et à « localiser » les deux phrases d’un segment (source ou cible) qui doivent être réunies pour correspondre au contenu informationnel d’une seule phrase dans l’autre langue. Pour ce faire, notre module a cherché les deux phrases source ou cible qui correspondent, en longueur de caractères, à une seule phrase dans l’autre langue, puis a apparié, de manière résiduelle, les autres phrases simples de manière symétrique. En raison de l’application « aveugle » (non supervisée) de l’algorithme, l’opération n’est pas à l’abri d’erreurs pour certains paragraphes. Nous renvoyons les lecteurs à une publication ultérieure qui décrira de façon détaillée les règles de sous-segmentation utilisées et les mesures correctives à envisager pour leur optimisation. Lorsque l’asymétrie est multiple (un écart de plus d’une phrase sépare les deux paragraphes source et cible), les risques d’erreur de la sous-segmentation automatique sont décuplés. Pour éviter tout risque d’ajout de paires de segments mal alignées à notre corpus, nous avons décidé de ne proposer pour ces paires de segments aucune sous-segmentation et c’est le paragraphe en entier qui a été traité comme une paire de segments, même s’il contient plusieurs phrases graphiques.
La sous-segmentation des paragraphes a permis de réduire et d’uniformiser la longueur des unités d’analyse (176 633 paragraphes) et d’en augmenter leur nombre pour les porter à 196 544 paires de segments, elles-mêmes constituées de 198 040 phrases françaises et de 197 662 phrases anglaises alignées.
Un deuxième module de notre algorithme a calculé le nombre de caractères, le nombre de mots totaux et le nombre de mots lexicaux de chaque segment source et cible des paires de segments. Pour le calcul du volume d’information ou du nombre de mots lexicaux, l’algorithme fait appel à l’environnement de traitement automatique des langues naturelles (TALN) spaCy[19] v2.1.3 pour la tokénisation des phrases en mots-formes, et l’analyse morphosyntaxique des mots-formes en vue de catégoriser leur lemme et de sélectionner parmi eux les mots lexicaux (noms, adjectifs, verbes et adverbes) qui sont utilisés pour calculer le ratio PIT brut.
Dans le troisième module de l’algorithme, les trois données brutes calculées dans les deux langues pour chaque paire de segments ont été normalisées en fonction des données moyennes des mêmes caractéristiques pour chaque texte de loi. Pour objectiver et raffiner nos critères de criblage qui s’appliquent à des phrases aux dimensions très variables[20], et pour exclure les bruits occasionnés par les mots composés et les unités phraséologiques, nous avons jugé utile de normaliser les données des paires de segments de notre corpus pour cibler les paires de segments hors normes par rapport à des valeurs moyennes. La méthode de normalisation retenue consiste à extrapoler la valeur des caractéristiques de chaque paire de segments en fonction de leur valeur moyennes dans le texte où elles figurent et de leur proportion dans la paire de segments à laquelle elles appartiennent. Concrètement, pour chaque segment d’une paire donnée, la valeur attendue (potentielle) de ses caractéristiques est multipliée par leurs valeurs moyennes dans le texte puis divisée par leurs valeurs totales (pour les segments source et cible) dans la paire de segments alignés. Autrement dit, la valeur de chaque caractéristique est calculée en fonction de sa contribution normalisée à l’ensemble de la paire de segments. Elle comporte les opérations mathématiques suivantes, pour les segments des langues A et B :
DonnéeANormalisée = (DonnéeAbrute*DonnéeAmoyenne)/(DonnéeAbrute+ DonnéeBbrute)
DonnéeBNormalisée = (DonnéeBbrute*DonnéeBmoyenne)/(DonnéeAbrute+ DonnéeBbrute)
Cette méthode de calcul diffère a priori d’une autre méthode que nous n’avons pas choisie et qui comporte les opérations mathématiques suivantes, pour les segments des langues A et B :
DonnéeANormalisée = (DonnéeAbrute/DonnéeBbrute)*DonnéeAmoyenne)
DonnéeBNormalisée = (DonnéeBbrute/DonnéeAbrute)*DonnéeBmoyenne)
L’application systématique de cette deuxième méthode sur les données de notre corpus a permis de cribler un nombre légèrement inférieur de paires de segments que celles que nous avons criblées à l’aide de la première méthode. Une évaluation préliminaire de ces deux méthodes montre qu’elles permettent d’obtenir des résultats comparables, étant donné le nombre quasi identique de paires de segments que nous avons relevées parmi les paires hors normes criblées au sixième palier de la DEN (voir plus loin) avec les deux méthodes. D’autres travaux seront nécessaires pour mieux caractériser les résultats obtenus avec l’une et l’autre méthode.
3.4 Paramètres de criblage des paires de segments
Le criblage des 196 544 paires de segments du corpus s’est appuyé sur deux indicateurs définis à l’aide des valeurs normalisées des attributs segmentaux.
Le premier indicateur est le ratio PIT normalisé ou PITN. Le criblage des paires de segments hors normes a été paramétré pour repérer et isoler celles dont le ratio PITN ne fait pas partie de l’intervalle inférieur ou supérieur de trois écarts-types du ratio PIT moyen des paires de segments du texte de loi. Le ratio PIT moyen est la valeur de référence par loi qui a servi au calcul du ratio PITN des paires de segments de chaque texte de loi du corpus.
La traduction d’une paire de segments parallèles est considérée comme isomorphe lorsque son ratio PITN se situe dans l’intervalle de la valeur moyenne du ratio PITN de toutes les paires de segments du texte auquel elle appartient. Comme pour ce qui est du ratio PIT brut, cet intervalle a été défini pour le ratio PITN par un écart-type en plus ou moins de la valeur moyenne du ratio PIT brut des paires de segments du texte de loi. Le paramétrage du ratio PITN a été choisi pour cribler les paires de segments « fortement hétéromorphes » que nous avons définies comme celles dont le ratio PITN se situe en dehors de l’intervalle de trois écarts-types du ratio PITN moyen.
Notre second indicateur est la distance euclidienne normalisée (DEN). Outre le fait qu’elle repose sur des valeurs normalisées, la DEN recourt à la même formule de calcul que la distance euclidienne (DE) décrite dans Poirier (2021). La DE mesure la distance numérique entre deux ou plusieurs variables représentées par un point sur un plan cartésien. Selon le nombre n de variables prises en compte, la distance euclidienne est calculée sur n dimensions. Par exemple, lorsque la distance euclidienne est mesurée entre deux variables, la distance euclidienne est calculée sur deux dimensions. La distance euclidienne mesurée sur les paires de segments de notre corpus est une distance euclidienne à trois dimensions et la formule utilisée est celle-ci :
où x est la longueur normalisée en caractères, y est le nombre normalisé de mots lexicaux ou le volume d’information et z le nombre normalisé de mots totaux (mots lexicaux et mots grammaticaux) de chaque segment des paires de segments source et cible. La méthode de criblage de la DEN a été paramétrée pour exclure automatiquement les paires de segments isomorphes, c’est-à-dire celles dont le ratio PITN ne fait pas partie de l’intervalle inférieur ou supérieur d’un écart-type de la valeur moyenne du ratio PIT brut des paires de segments du même texte de loi. La DEN vise donc toutes les paires de segments hétéromorphes tandis que le ratio PITN ne s’applique qu’aux paires de segments « fortement » hétéromorphes. La méthode de la DEN a permis de cribler des paires de segments que nous qualifions de hors normes. À titre d’exemple de calcul du ratio PITN, la Loi sur les villages nordiques et l’Administration régionale Kativik (V-6.1) présente dans son ensemble un volume d’information moyen de 14,9597 mots lexicaux en français et de 14,6206 mots lexicaux en anglais, ce qui donne un ratio PIT brut moyen de 0,9773 qui a servi à calculer les rations PITN, comme indiqué dans le tableau 1 ci-dessous. Les mots qui ont été reconnus automatiquement comme mot lexical par le module de langue que nous avons utilisé sont soulignés en caractères gras dans les deux prochains tableaux.
Avec des volumes d’information moyens très semblables en français et en anglais (14,9597 et 14,6206) nous obtenons un ratio PIT moyen de 0,9773. L’écart-type du PIT moyen pour le texte de loi est de 0,12[21] et a été calculé en prenant en compte la valeur du ratio PIT brut des 1 389 paires de segments du document.
Pour la loi V-6.1, les paires de segments hétéromorphes sont celles dont le ratio PIT est inférieur à 0,6173 (0,9773 – (3 x 0,12)) ou supérieur à 1,3373 (0,9773 + (3 x 0,12)). Le ratio PITN de la première paire de segments s’établit ainsi à 7,0179 / 7,7790 = 0,9022. Comme cette valeur se trouve entre 0,6173 et 1,3373, la première paire de segments du texte V-6.1 ne fait pas partie des paires de segments hétéromorphes criblées par ratio PITN.
Pour cette même loi, nous n’avons trouvé qu’une seule paire de segments qui soit hétéromorphe (positive). Le calcul des valeurs normalisées utilisées pour le criblage par ratio PITN de cette paire de segments de la loi V-6.1 est présenté dans le tableau 2.
Le calcul du ratio PITN pour la paire du tableau 2 donne 1,3962, ce qui est supérieur à la borne supérieure (1,3373) de l’intervalle calculé précédemment pour la même loi. La paire de segments est donc hétéromorphe positive (volume d’information du segment cible supérieur au volume d’information du segment source), ce qui peut s’expliquer par le traitement contrastif des mots-formes pronominal et prépositionnel en français et adverbiaux en anglais ainsi que par le nom scrutin qui est traduit par la proposition a poll is held.
L’exemple illustre aussi une réalité de l’analyse contrastive qui tient au fait que les mots-formes aux fonctions similaires ne sont pas associés aux mêmes catégories de mots lexicaux ou grammaticaux. Tandis qu’en français les mots-formes où (pronom relatif) et lors du (locution prépositionnelle avec de) font partie des mots grammaticaux, les mots-formes qui les traduisent fonctionnellement (where et when) sont considérés comme des mots lexicaux (adverbes selon l’algorithme ou au mieux des relative adverbs [« adverbes relatifs »] dans les dictionnaires de l’anglais. Cette équivalence fonctionnelle entre des mots de catégorie grammaticale différente fait apparaître sous un autre jour, encore jamais évoqué à notre connaissance, la prépondérance de la fonction des mots dans le texte (sur leur nature) lorsqu’ils participent à la technique de traduction bien connue de la transposition. Il s’agit de différences irréductibles entre les langues qui n’ont pas à être corrigées ni expliquées puisqu’il ne s’agit évidemment pas d’erreurs de traduction mais de techniques courantes et souvent obligatoires de traduction.
Par rapport à la méthode du ratio PITN, qui crible les paires de segments fortement hétéromorphes, la mesure de la DEN vise la totalité des paires hétéromorphes, soit celles dont le ratio PITN ne fait pas partie de l’intervalle inférieur ou supérieur de seulement un écart-type du ratio PIT moyen.
Comme la DE et la DEN sont des mesures numériques positives absolues, il n’y a pas, à notre connaissance, de valeur numérique de la distance à partir de laquelle la paire de segments est considérée hors norme. Comme pour le ratio PITN, la DEN fournit une indication statistique sur la probabilité qu’une paire de segments source et cible contienne une traduction hors norme qui nécessite l’intervention d’un professionnel. Pour faciliter l’interprétation de la distance entre les segments source et cible de chaque texte de loi, nous avons défini cinq paliers de DEN en fonction des multiples de la moyenne de celles-ci pour chaque texte de loi, en partant du principe que plus la DEN est élevée, plus la traduction présente un écart important avec le segment source relativement au décompte du nombre de caractères, de mots lexicaux et de mots totaux. Le premier palier est défini par les DEN supérieures à deux fois la DEN moyenne du texte de loi, mais inférieures à trois fois cette moyenne, et ainsi de suite jusqu’au dernier palier qui représente les DEN des paires de segments qui sont supérieures à six fois la moyenne des DEN des paires de segments du texte de loi. Le nombre de paires de segments criblées avec cette méthode est décrit, pour chaque palier, dans le tableau 3. Le critère pris en compte pour le nombre de paires positives et négatives criblées par la DEN correspond aux paires de segments dont le ratio PITN est inférieur à un écart-type du ratio PIT moyen (pour les paires négatives) et est supérieur à un écart-type du ratio PIT moyen (pour les paires positives). Cette façon de procéder permet d’exclure des paires de segments criblées par la DEN les paires de segments isomorphes (dont le ratio PITN se situe près du ratio PIT moyen du texte de loi).
Le criblage des paires de segments hors normes qui sont susceptibles de contenir des erreurs de traduction s’appuie sur le principe de l’équivalence informationnelle des traductions que nous avons évoqué avec Gile (2005 : 98). Ce principe et le rôle qu’y jouent les mots lexicaux sont renforcés par la très forte corrélation statistique que nous avons observée (Poirier 2021 : 173) dans différents textes et qui a été validée dans le corpus LégisQuébec avec des corrélations moyennes (pour les 515 lois) toujours très fortes (supérieures à 0,97).
4. Résultats
Sur un ensemble de 196 544 paires de segments ou unités d’analyse, 158 525 sont isomorphes, c’est-à-dire que leur ratio PITN se situe entre -1 et +1 écart-type par rapport au ratio PIT moyen (qui varie d’une loi à l’autre). La proportion de segments isomorphes est ainsi établie à 81 % de l’ensemble des segments parallèles, ce qui veut dire que c’est dans cette même proportion de paires de segments que la traduction en anglais contient le même volume d’information ou presque. Le respect d’un écart-type de moins permet de considérer des segments isomorphes même s’ils intègrent de légères différences de dénomination ou de style qui peuvent être attribuables aux servitudes ou aux contraintes de formulation propres à chaque langue et qui sont à l’origine de certains décalages négatifs et positifs tels que la concentration et l’implicitation ainsi que la dilution et l’explicitation (au sens précis de Delisle et Fiola 1993/2013).
Du point de vue de l’information communiquée, la proportion élevée de paires de segments isomorphes pourrait vouloir dire par exemple que près de 81 % des traductions sont vraisemblablement correctes ou adéquates. Nous utilisons l’adverbe vraisemblablement, car certaines autres erreurs de traduction que des ajouts et des omissions (qui se rapportent à une différence de contenu informatif), comme des erreurs de déformation du sens (faux sens, contresens et non-sens), peuvent se retrouver dans des paires de segments isomorphes. Notre algorithme n’est pas en mesure de détecter la présence ou non d’erreurs de déformation du sens qui jouent un rôle non négligeable dans la qualité des traductions. D’autres outils du traitement automatique des langues naturelles (TALN) pourraient être mis à contribution pour ce faire, mais ceux-ci feront alors l’objet d’autres travaux et publications. Malgré l’importance des erreurs de déformation du sens, on doit rappeler ici un important principe empirique dans l’évaluation des traductions qui impose que la mesure du volume d’information de la traduction précède logiquement et méthodologiquement la mesure de la déformation du sens puisque cette dernière ne peut se vérifier que si le contenu informatif est comparable, ce qui n’est pas le cas des paires de segments dont le ratio PITN dépasse d’un écart-type la valeur moyenne établie pour l’ensemble du texte duquel elles sont extraites. Pour cette raison, la vérification du volume d’information des traductions que nous décrivons dans le présent article constitue un préalable à l’évaluation des faux sens, contresens et non-sens, et des erreurs de déformation du sens.
4.1 Résultats du criblage par ratio PITN
Il reste ainsi 38 019 paires de segments (ou 19 % de notre corpus) que l’on peut considérer comme hétéromorphes. Vu leur très grand nombre, nous avons décidé de restreindre davantage le criblage aux paires de segments fortement hétéromorphes (dont le ratio PITN ne se situe pas dans l’intervalle borné par trois écarts-types en plus ou en moins du ratio PIT moyen). Notre hypothèse de travail est que plus le ratio de précision de la traduction des paires de segments est éloigné positivement ou négativement du ratio moyen du texte de loi, plus les paires de segments sont susceptibles de contenir des erreurs ou des écarts de traduction significatifs.
Notre calcul du ratio PITN a permis de sélectionner 2 699 paires de segments fortement hétéromorphes (sur les 38 019 paires hétéromorphes) qui se répartissent en deux groupes, soit 1 035 paires négatives (38 %) et 1 664 paires positives (62 %). Le tableau 4 qui suit décrit la répartition parmi les paires fortement hétéromorphes entre les paires négatives et les paires positives.
Les prochaines sections sont consacrées aux particularités des paires négatives fortement hétéromorphes et à la section 4.1.5, nous nous intéressons plus particulièrement à l’analyse des paires positives fortement hétéromorphes. Parmi les 1 035 paires négatives, nous en avons dénombré 394 dont le ratio PITN est égal à zéro, ce qui implique que le volume d’information ou le nombre de mots lexicaux est égal à zéro en langue source ou en langue cible, du fait que toute division dont le dividende (la langue source) ou le diviseur (la langue cible) est égal à zéro donne zéro. Ce résultat peut survenir pour différentes raisons, soit que le segment source ou cible ne contient aucun contenu (c’est le cas de six segments en langue source et de deux segments en langue cible – mais cette absence de contenu est elle-même attribuable à un mauvais alignement des paires de segments puisque la présence d’une traduction ou d’un segment source correspondant à la traduction a été vérifiée manuellement), ou lorsque les contenus en langue source, en langue cible ou des deux paires de langues ne contiennent que des mots grammaticaux, abréviations, chiffres, caractères d’énumération, pronoms comme quiconque – whoever (c’est le cas le plus fréquent) ou, dans certains autres cas, ne contiennent aucun mot lexical reconnu par le module d’étiquetage morphosyntaxique de spaCy en raison de la présence de certains caractères comme les points abréviatifs (par exemple, la paire de segments « Engagement signé à………….., » = « Signed at……..……, ») ou, ce qui est assez fréquent, de noms propres en français qui ont été reportés tels quels dans le texte anglais (« Chutes-de-la-Chaudière-Ouest » dans la loi C-11.2) et qui ne sont pas reconnus comme tels par le module d’analyse de la langue anglaise de spaCy.
Dans la partie qui suit, nous présentons quelques généralisations que nous pouvons dégager de l’application du calcul du ratio PITN aux paires de segments du corpus LégisQuébec.
4.1.1 Quelques trous dans les lois
Parmi les paires négatives fortement hétéromorphes, on trouve un petit nombre de huit paires de segments pour lesquels aucun contenu (aucune chaîne de caractères) n’est associé à la traduction ou au segment source. Ces anomalies représentent en somme huit trous dans les lois du Québec, c’est-à-dire des segments, voire des paragraphes entiers, qui sont présents dans une langue, mais pas dans l’autre. Ces huit trous ne représentent que 0,004 % de toutes les paires de segments dépouillées dans les lois du Québec. C’est une portion infime, mais qui demeure préoccupante pour des textes de cette importance.
Dans tous les cas, le paragraphe est absent des versions HTML et PDF des lois téléchargeables à partir du site LégisQuébec qui, faut-il le rappeler, contient les versions officielles des lois.
Dans deux cas, la partie manquante est en anglais. Le troisième paragraphe de l’article 234.1 de la Loi sur l’aménagement et l’urbanisme (A-19.1), par exemple, est complètement absent de la version anglaise de la loi (figures 1 et 2).
Dans l’autre cas, il s’agit du segment en français « modification intégrée au c. R -12.1, annexe II) » de l’article 45, alinéa no 2 de la Loi instituant l’Office Québec-Monde pour la jeunesse (O-5.2) qui n’avait pas été traduit dans le fichier de départ de notre corpus, une erreur qui a été corrigée puisque la loi ne contient plus ce trou.
Dans les six autres cas, c’est le paragraphe en français qui est manquant. Ceci est d’autant plus étonnant que les lois ont été rédigées d’abord en français, puis traduites en anglais. Comment la traduction vers l’anglais aurait-elle pu faire disparaître le texte source en français ? On peut supposer (hypothèse à vérifier) qu’une mise à jour de ces lois a abouti à des suppressions de contenus qui n’ont pas été appliquées consécutivement dans leur traduction en anglais.
L’omission qui nous paraît la plus importante se trouve dans la Loi sur la protection du consommateur. Et ce, dès l’article 1 qui définit les termes pertinents à cette loi. La version anglaise se termine par une définition du mot « merchant » (figure 3). Mais la définition de « commerçant » ne se trouve nulle part dans la version française (figure 4).
L’annexe 1 contient un tableau des huit paires de segments dont un segment (source ou cible) ne contient aucune chaîne de caractères et qui ont pu être criblées grâce au ratio PITN. Les erreurs dont il a été question jusqu’ici ne proviennent pas d’erreurs de traduction. Il s’agirait plutôt d’erreurs de traitement qui sont tout à fait normales compte tenu du nombre élevé de données, mais qui devraient néanmoins être corrigées le plus rapidement possible pour éviter qu’elles servent d’appui à d’éventuels recours devant les tribunaux.
4.1.2 Les autres paires négatives fortement hétéromorphes
Abstraction faite des paires de segments dont le ratio PITN est égal à zéro, on trouve 641 paires négatives fortement hétéromorphes dont le ratio PITN se situe entre 0,0511 et 0,8285. Les ratios PITN plus élevés (qui sont tout de même hors normes parce qu’inférieurs à trois écarts-types du ratio PIT moyen) peuvent s’expliquer par un écart-type très faible des paires de segments d’un texte de loi donné. L’examen des six dernières paires de segments du groupe (dont le ratio PITN est le plus élevé) révèle que ce sont des phrases assez longues qui ne semblent pas contenir d’erreur de traduction, comme le montre le tableau 5.
Incidemment, la faible DEN des cinq dernières phrases du groupe, qui s’étend de 1,79 à 5,26, vient étayer l’hypothèse que ces phrases, quoique longues, ne présentent pas de décalage informationnel de traduction significatif. Il serait peut-être avantageux pour mieux calibrer la mesure du ratio PITN de paramétrer le criblage en fonction de la longueur des segments.
4.1.3 Les énumérations interrompues
À l’autre extrémité du spectre, celle des plus petits ratios PITN dans le groupe des paires négatives fortement hétéromorphes, on trouve des énoncés caractéristiques des textes juridiques qui présentent une énumération assortie de conditions ou de modalités qui ne sont pas formulées au même endroit dans les deux langues. En français, ces conditions ou modalités se retrouvent au début de l’énumération tandis qu’elles se retrouvent systématiquement à la fin en anglais. Notre emploi de l’adverbe systématiquement décrit le fait que parmi le très grand nombre d’exemples d’énumérations analysées, nous n’avons pas trouvé un seul contre-exemple dans une langue ou dans une autre. Comme il y a un déplacement conséquent du contenu informationnel, on peut constater cette technique de traduction par le degré fortement hétéromorphe ou l’écart considérable du ratio PITN de ces paires de segments, en combinaison avec une DEN très élevée. C’est le cas de 21 paires parmi les 26 premières paires de segments dont le ratio PITN est le plus près de zéro et qui affichent une DEN qui s’étend de 131,28 à 251,99.
Le déplacement du contenu informationnel qui est constaté dans ces paires de segments criblées grâce au calcul du ratio PITN témoigne de « routines discursives » (Lecolle, Veniard et al. 2018) de la langue de spécialité juridique. Ce type de routines discursives représentant des patrons phraséologiques ou stylistiques différents en anglais et en français a été décrit par ailleurs dans ce que McLaren (2016 : 132) a appelé les enjambements dans les énumérations interrompues (ou « clauses sandwiches », vraisemblablement de l’anglais sandwich sentences). On trouve des exemples de ces paires de segments criblées par le calcul du ratio PITN dans le tableau 6.
Dans toutes ces occurrences, on constate que les deux langues intervertissent la présentation du contenu informationnel. Tandis que le français décrit d’abord les conséquences d’une infraction pour ensuite dire dans quelles conditions elles s’appliquent, la langue anglaise préfère procéder dans l’ordre inverse. L’exemple qui suit, tiré de la loi A-33.2.1 (Loi sur l’Autorité des marchés publics), donne une vue d’ensemble de ce phénomène de permutation dans une énumération interrompue (le contenu informationnel permuté est en caractères gras). L’exemple a été reconstitué à partir des données de la phrase 427 du tableau précédent.
L’application de notre méthode de criblage des paires de segments hétéromorphes négatives permet de repérer un très grand nombre de ces décalages informationnels, sinon la totalité d’entre eux. Ces décalages en très grand nombre et qui présentent un caractère systématique semblent valider la conclusion de Mark Van Hoecke (2018) selon laquelle chaque langue-culture recourrait à un même raisonnement juridique, mais en s’inspirant de règles du jeu différentes[23]. Il est très important de constater le rôle crucial que peuvent jouer ici la traduction et l’analyse traductologique dans la vérification et la validation de cette modélisation des différences culturelles dans un domaine de spécialisation comme le droit.
4.1.4 Les redondances en langue source et les ellipses en langue cible
Un autre groupe très important de ces paires de segments comprend des redondances énumératives en français qui sont passées sous silence en anglais du fait que le contexte le permet, comme le montrent les exemples se trouvant dans le tableau 8.
Le caractère récurrent de ces usages contrastifs dans les deux langues témoigne de la nature idiomatique ou phraséologique de ces contraintes stylistiques de rédaction, et plus précisément de rédaction juridique, qui sont souvent présentées, bien au contraire, comme des choix. Cette récurrence montre ainsi que ces faits de traduction pourraient relever de normes de traduction établies.
Dans d’autres cas, l’asymétrie entre les segments source et cible ne découle pas d’une redondance en langue source mais plutôt d’une forme d’ellipse propre à la langue cible, comme c’est le cas dans les exemples présentés dans le tableau 9.
Dans ces exemples, on observe qu’une partie de l’information « omise » dans la traduction est en fait fournie par le contexte, ce qui semble autoriser les traducteurs à ne pas préciser ce contenu informationnel par souci de simplification ou de clarté, un principe stylistique qui s’applique de manière opposée dans la langue source, ce qui rappelle encore une fois l’image du jeu d’échecs de Van Hoecke (2018), évoquée précédemment à propos des énumérations interrompues.
Les données analysées par le criblage des paires négatives de segments hétéromorphes montrent bien que certains décalages informationnels s’expliquent par la valeur qu’accorde chaque langue-culture à la nécessité de recourir à la redondance ou à l’ellipse de l’information. Des études plus poussées sur la redondance et l’ellipse en traduction pourraient permettre de préciser les phénomènes en cause dans certaines paires de segments pour lesquelles il n’est pas facile de déterminer s’il y a redondance ou ellipse dans l’une ou l’autre langue, comme c’est le cas de l’exemple présenté dans le tableau 10.
4.1.5 Les paires positives fortement hétéromorphes
Le criblage par ratio PITN a permis de recueillir un total de 1 664 paires positives fortement hétéromorphes, soit un nombre beaucoup plus élevé que le nombre de paires négatives fortement hétéromorphes, surtout si on soustrait des paires négatives les paires dont le ratio PITN est égal à zéro (au nombre de 394). Le plus grand nombre de paires positives peut s’expliquer par la propension très générale de la traduction à recourir à une explicitation de l’information dans le segment source, ce qui donne lieu le plus souvent à l’ajout de contenus informationnels ou à des redondances (voir la discussion sur l’explicitation plus loin).
Les ratios PITN des paires criblées s’étendent de 1,22 à 9,38. Comme pour les paires négatives fortement hétéromorphes dont le ratio PITN est très élevé (au plus près de 1,0), les paires positives fortement hétéromorphes dont le ratio PITN est peu élevé (au plus près de 1,0 elles aussi) réunissent des paires de segments qui ne contiennent pas de décalage informationnel lorsqu’elles sont courtes ou qui contiennent des décalages informationnels attribuables à des usages différents de dénomination lorsqu’elles sont longues, comme c’est le cas (à l’inverse des situations décrites pour les paires négatives fortement hétéromorphes) des exemples présentés dans le tableau 11.
L’ellipse en français de la locution adverbiale au moins est mise en évidence par la répétition de at least en anglais (qui est nécessaire en raison de l’emploi de deux constructions verbales différentes avec to have et to be). On constate aussi une autre redondance dans le décalage de 60 years of age avec 60 ans. Dans le deuxième exemple, il s’agit d’une formulation idiomatique qui recourt à un nombre arbitraire de mots lexicaux dans les deux langues. Ce type d’hétéromorphisme syntagmatique peut être considéré comme un hétéromorphisme figé, du fait que la formulation en anglais est obligatoire pour traduire l’élément idiomatique en français (Wecksteen-Quinio, Mariaule et al. 2015).
À l’autre extrémité du spectre des ratios PITN positifs fortement hétéromorphes, on trouve les paires de segments dont le ratio PITN est très élevé. Cinq des neuf dernières paires de segments sont caractéristiques des paires de segments mal alignées que l’on retrouve en grand nombre dans les définitions qui sont présentées au début des textes de loi et qui entraînent d’importants réaménagements dans l’autre langue en raison des contraintes de l’ordre alphabétique. Elles commencent ou contiennent à leur début un guillemet français. Leur ratio PITN varie de 5,6388 à 9,398, ce qui est considérable. De même, la DEN de ces paires de segments est elle aussi très élevée (de 125,6 à 234,75).
4.1.6 La dépronominalisation comme technique de traduction
Une part très importante des paires positives fortement hétéromorphes provient d’une technique de traduction fréquente qui est la dépronominalisation ou l’explicitation d’un déictique ou d’un pronom dans le passage du français à l’anglais (tableau 12). Cette technique est certainement liée à une stratégie d’explicitation puisqu’elle entraîne une augmentation du contenu informationnel intrinsèque (qui ne prend pas en compte les pronoms qui renvoient à une information externe).
Cette technique est intéressante dans la mesure où elle est bidirectionnelle en théorie (elle peut être inversée dans la même direction français-anglais ou s’appliquer de façon symétrique ou non dans la direction anglais-français). On trouve bien entendu un nombre important d’autres techniques de traduction. Nous n’avons pas encore pu relever leur variété et leur importance relative. C’est un travail qui est en soi laborieux et qui, compte tenu du nombre considérable de données, nécessite beaucoup de temps. C’est pourquoi nous reportons à une autre publication la recension plus fine des techniques de traduction utilisées dans les lois du Québec.
Une part moins importante qui revient dans les paires positives de segments hétéromorphes est attribuable au phénomène de redondance en langue cible, qui peut concurremment s’expliquer par une ellipse en langue source, comme le montrent les exemples du tableau 13 ci-dessous. Il importe toutefois d’observer que ces phénomènes ne sont pas présents en aussi grand nombre que pour les paires négatives de segments hétéromorphes. On remarque que le phénomène se produit le plus souvent dans le contexte d’une énumération.
Dans l’exemple de la paire no 1630, le décalage redondant n’est pas le résultat d’une dépronominalisation mais d’une redondance codée pour traduire le terme scrutateur. On pourrait voir dans l’exemple no 1631 une manifestation du phénomène d’ellipse qui caractériserait la formulation en langue source. Dans la paire no 1648, la redondance du sujet en anglais (The following) est également associée à une ellipse du sujet en français de façon indirecte (parce que le sujet en français est l’attribut ou le complément en anglais) : l’obligation de préciser le sujet omis en français impose la mention du sujet qui n’est habituellement pas précisé. L’adjectif suivant en français n’est généralement pas traduit en anglais, comme dans trois des quatre paires de segments du tableau 9. À notre connaissance, cette technique de traduction n’a jamais été décrite de cette façon en tenant compte de la comparaison entre information explicite et information implicite, dont la définition ou le champ d’application semble varier d’une langue-culture à une autre.
4.2 Résultats du criblage par distance euclidienne normalisée
Comme indiqué précédemment au tableau 3, la DEN a permis de cribler 9 772 paires de segments réparties en cinq paliers croissants d’écart de la DEN avec la DEN moyenne du texte de loi. L’hypothèse sous-jacente est que plus la DEN entre le segment cible et le segment source est élevée, plus la traduction est susceptible de contenir des erreurs ou des décalages informationnels par rapport au segment source (parce qu’elle contient un nombre élevé de caractères, de mots lexicaux et de mots totaux en plus ou en moins par rapport à la norme établie pour le texte dont elle fait partie).
Comme le montrent les tableaux 3 et 4, la répartition des paires (simplement et non pas fortement) négatives et positives est relativement uniforme dans les différents paliers de DEN, avec une proportion moyenne de 72,6 % de paires négatives et de 27,4 % seulement de paires positives. Cette proportion de paires négatives et positives est carrément inversée par rapport au nombre total de paires criblées par la méthode du ratio PITN qui réunit une forte majorité de paires de segments positives (dans une proportion de 62 %, et même beaucoup plus si on tient compte que dans le groupe des paires négatives de la méthode par ratio PITN, on trouve 394 paires (sur 1 035) dont le ratio PITN est de zéro en langue cible ou en langue source, et pour lesquelles on ne peut rien conclure sur le contenu informationnel de la traduction puisqu’elles contiennent soit des erreurs d’alignement, des mots grammaticaux ou des noms propres en français qui ont été retranscrits tels quels en anglais.
Grâce à la méthode de la DEN qui a permis de cribler 9 772 paires de segments hétéromorphes (dont le ratio PITN est supérieur ou inférieur à un écart-type du ratio PIT moyen du texte) et la méthode du ratio PITN qui a permis de cribler 2 699 paires de segments fortement hétéromorphes (dont le ratio PITN est supérieur ou inférieur à trois écarts-types du ratio PIT moyen du texte), une partie seulement (9 772 plus 2 699) de la totalité des 38 019 traductions hétéromorphes a pu être catégorisée en fonction de sa nature négative (moins de contenu informationnel) ou positive (plus de contenu informationnel). En outre, comme nous le montrons plus loin, une certaine partie des paires de segments ont été criblées par l’une et l’autre méthodes et se retrouvent dans les deux groupes de paires de segments criblées.
Pour cette raison, nous ne sommes pas en mesure de confirmer ou d’infirmer l’hypothèse du caractère universel de l’explicitation en traduction dans la version forte de Blum-Kulka (1986), ou dans la version faible de Becher (2010). Des essais et des tests spécifiques devraient être menés sur cette question.
Pour mieux comprendre les différences entre nos deux méthodes de criblage (le ratio PITN et la DEN), il nous a semblé utile de comparer parmi les paires criblées par la DEN celles qui se retrouvent aussi parmi les paires criblées par la méthode du ratio PITN. Le tableau 14 présente les données que nous avons compilées manuellement et pour lesquelles nous indiquons aussi la plage des ratios PITN des paires de segments criblés par la DEN.
Ces données indiquent que les paires positives de la DEN se retrouvent dans une proportion de 93,5 % (116 sur 124) criblées également par la méthode du ratio PITN, ce qui en fait des paires de segments fortement hétéromorphes (dont le ratio PITN dépasse le ratio PIT moyen de plus de trois fois l’écart-type). Seulement 8 paires positives hors normes criblées par la DEN ne se retrouvent pas parmi les paires criblées par le ratio PITN, ce qui indique que les paires positives de la DEN sont aussi dans une très forte proportion des paires fortement hétéromorphes. À l’inverse, les paires négatives hors normes criblées par la DEN comptent en proportion (162 sur 466, soit 34,8 %) un nombre beaucoup moins important de paires fortement hétéromorphes. Le croisement des résultats obtenus par les deux méthodes de criblage montre que les paires négatives qui affichent une forte DEN sont beaucoup moins nombreuses que les paires positives à avoir un ratio PITN fortement hétéromorphe. De façon exploratoire, on peut émettre l’hypothèse que si les paires négatives criblées par la DEN sont beaucoup plus nombreuses à être non fortement hétéromorphes, voire isomorphes, c’est parce que les traductions en anglais sont généralement plus courtes que le français pour ce qui est du nombre de caractères et de mots totaux, indépendamment de leur contenu informationnel. En d’autres termes, même si l’anglais est plus économe matériellement par rapport au français, on trouve parmi les paires de segments fortement hétéromorphes (criblées par la méthode du ratio PITN) une part plus grande de paires positives (62 %), c’est-à-dire dont le contenu informationnel est plus important en anglais qu’en français. Cette hypothèse tient au fait que les attributs segmentaux qui servent au calcul de la DEN affichent tous un écart négatif en faveur de l’anglais. Pour valider cette hypothèse, il faudrait toutefois mesurer la valeur positive ou négative des 38 019 paires hétéromorphes mesurée par le ratio PITN (dont la valeur dépasse l’intervalle d’un écart-type des paires de segments isomorphes), ce que nous n’avons pas pu examiner encore dans le traitement de nos données.
D’un point de vue traductionnel, les quatre groupes de paires de segments criblées avec la DEN qui ont été croisés avec la méthode du ratio PITN affichent des données intéressantes qu’il n’est pas possible de décrire de façon détaillée ici. De façon préliminaire (tableau 15), on peut observer que parmi les huit paires de segments positives qui ont été criblées uniquement par la DEN, on trouve majoritairement des formulations plus explicites en anglais (dans la paire no 468, il s’agit même d’ajouts), qui peuvent être obligatoires (paire no 469) ou facultatives (472), inscrites dans le code (520) ou discursives, c’est-à-dire déduites par inférence (470), s’expliquer par la redondance du segment cible (474, 475) ou l’ellipse du segment source (472), pour ne nommer que quelques catégories d’explicitation proposées par Klaudy (2008) et par Murtisari (2016).
Du côté des 304 paires négatives criblées par la DEN et qui n’ont pas été criblées par le ratio PITN, on trouve aussi des énumérations interrompues, comme celles qui ont été criblées avec la méthode du ratio PITN. Hormis ce type de décalage, on trouve principalement des paires qui contiennent des redondances en français, si on tient compte du contexte informationnel qui autorise des inférences qui sont verbalisées en français, mais passées sous silence en anglais. C’est le cas des paires de segments dans les exemples présentés au tableau 16 dont les constructions reviennent en grand nombre, à quelques variables près. On constate que ces paires apparaissent la plupart du temps dans une énumération, encore une fois.
L’aspect répétitif de ces constructions peut être mesuré grâce au ratio PITN à quatre décimales qui est identique lorsqu’elles se produisent dans un même texte de loi pour une même construction. C’est le cas des constructions du type de la paire no 116 qui compte 71 occurrences identiques dans les paires criblées par DEN dans le même texte de loi (I-3, Loi de l’impôt). De même, la construction de la paire 301 compte minimalement 16 occurrences identiques. Un des désavantages du recours à des attributs segmentaux normalisés tient au fait que même si des paires de segments sont identiques, elles peuvent afficher des valeurs du ratio PITN et de la DEN très différentes en raison des variations inhérentes au texte dans lequel elles se trouvent. Pour regrouper les paires de segments identiques ou très similaires utilisées dans différents textes de loi, il faudrait alors envisager de ne pas normaliser les attributs segmentaux par texte de loi, mais plutôt pour l’ensemble du corpus, un essai que nous n’avons pas pu effectuer compte tenu de la complexité de la hiérarchie à respecter dans l’algorithme pour calculer les deux indicateurs normalisés de la PITN et de la DEN.
5. Vue d’ensemble sur la qualité des traductions anglaises des textes de loi
Du point de vue des ratios PITN, l’ensemble du corpus affiche une proportion appréciable de 81 % de paires de segments isomorphes (158 525 sur 196 544). À défaut d’éléments de comparaison, il est difficile de statuer sur la situation. D’un point de vue pratique, ces proportions ne nous semblent pas anormales compte tenu des nombreux types de décalages généralement acceptables que nous avons relevés dans les paires de segments criblées, qu’ils soient figés, stylistiques, linguistiques, discursifs, qu’ils proviennent de contraintes de redondance ou d’ellipse, ou encore qu’ils proviennent très marginalement d’erreurs de traduction ou plus fréquemment d’erreurs d’alignement.
En ce qui a trait aux deux indicateurs que nous proposons, on constate que 2 699 paires de segments sur les 38 019, soit 7,1 % d’entre elles, présentent un décalage informationnel de traduction important (qui dépasse de trois écarts-types le ratio PIT moyen des paires de segments). Parce qu’elle analyse la totalité des paires de segments hétéromorphes, il n’est pas surprenant que la DEN permette de cribler un plus grand nombre de décalages avec 9 772 paires dont la DEN est supérieure au double de la moyenne des DEN de leur texte de loi, ce qui représente 25,7 % de l’ensemble des 38 019 paires de segments hétéromorphes.
Un élément intéressant qui doit être porté à l’attention du législateur québécois est le fait que les énumérations dans les textes de loi du Québec ont tendance à être redondantes du point de vue de l’information fournie qui peut être inférée du co-texte (voir les exemples fournis préalablement). L’autre question que soulève cette situation est le rôle de la traduction en anglais relativement à cette particularité rédactionnelle du français : doit-elle être oblitérée du texte traduit ou, au contraire, doit-elle être reproduite dans la mesure du possible ? Sur cette question sensible, il semble que deux points de vue s’opposent, comme l’a signalé Gémar (2001/2021 : par. 44), soit celui du traducteur et de l’équivalence des mots et celui du juriste et de l’équivalence des normes :
Le problème de l’équivalence des effets juridiques du texte qu’il traduit ne se pose pas dans les mêmes termes pour le traducteur et pour le juriste. En schématisant à l’extrême, disons que le premier visera l’équivalence linguistique, pensant être quitte de la partie juridique, la lettre – donc le sens – étant respectée. Le second cherchera à réaliser l’équivalence juridique, estimant que, le droit étant exprimé, la lettre suit ipso facto. Or, dans un cas comme dans l’autre, c’est la rencontre et la fusion harmonieuses des deux éléments constitutifs du texte – contenant et contenu – qui produiront l’équivalence souhaitable.
Gémar 2001/2021, par. 44
En contradiction avec ce principe, les résultats de notre travail montrent clairement que même si les textes de loi du Québec ont été traduits (par des traducteurs professionnels spécialistes du droit) et non pas corédigés par des juristes, c’est l’équivalence juridique (soit le point de vue du législateur) qui a eu gain de cause, du moins dans le traitement de la redondance dans les énumérations des lois du Québec. On peut expliquer cette « réussite » des traducteurs des lois du Québec par le fait que la « schématisation » de Gémar est, comme il le réalise lui-même, « extrême », puisqu’elle ne prend pas en compte la contribution des traducteurs professionnels qui sont des traducteurs spécialisés dans le champ du droit et de la traduction juridique, par opposition à des traducteurs généralistes qui n’ont pas les connaissances de ce champ de spécialisation.
6. Conclusion
À notre connaissance, jamais les lois du Québec dans leur totalité n’avaient encore fait l’objet d’une analyse comparative systématique de leurs versions française et anglaise. Celle que nous présentons dans cet article nous permet d’affirmer que les lois du Québec sont bien traduites et que même lorsque leur traduction est non littérale (ce qui arrive assez souvent, dans au moins 19 % des paires de segments), celle-ci est de qualité professionnelle. Même si, dans des textes aussi fondamentaux pour une société de droit comme le Québec, chaque erreur peut avoir des conséquences importantes, nous avons constaté qu’elles y sont extrêmement rares.
L’analyse empirique des traductions des textes de loi du Québec montre que les traductions anglaises favorisent globalement l’équivalence de normes juridiques (dans les énumérations interrompues, par exemple, mais aussi dans le respect des ellipses et des redondances imposées dans chaque langue-culture de rédaction). Une partie des critiques de la presse et du public sur la qualité des traductions pourrait, pour cette raison, s’expliquer par une méconnaissance des normes de rédaction propres à chaque langue-culture (notamment celle de « l’autre » langue-culture) et de la nécessité de respecter toutes les deux dans la production et la traduction d’un texte de loi de qualité. Cela montre bien que l’évaluation des traductions ne peut s’appuyer de manière satisfaisante sur la norme de rédaction d’une seule langue-culture, quand bien même celle-ci est minoritaire ou majoritaire, malmenée, menacée ou prestigieuse. Sur ce point, l’analyse des décalages de traduction que nous avons menée dans les textes de loi du Québec montre qu’ils sont issus de techniques de traduction spécialisées et du respect de contraintes linguistiques et juridiques complexes qui ont fort probablement été mises en oeuvre par des traducteurs spécialistes de la traduction juridique. En ce sens, nous voyons une concordance des objectifs dans la nécessité de recourir en traduction juridique à des traducteurs spécialisés dans le droit et les techniques de traduction juridique, et la préférence des juristes à l’égard des techniques de la traduction législative interactives ou de la corédaction.
En ce qui concerne le caractère universel de l’explicitation en traduction, notre étude a permis de montrer que même si la langue anglaise est généralement plus courte que le français, les paires positives (donc qui contiennent en partie des explicitations) de segments fortement hétéromorphes représentent la vaste majorité des paires de segments qui contiennent des décalages informationnels de traduction. Dans l’appréciation du rôle de l’explicitation dans les décalages positifs, notre étude a aussi révélé l’interférence des phénomènes de la redondance et de l’ellipse dans les décalages obligatoires et facultatifs des contenus informationnels de traduction. Cette interférence est même présente dans un passage de Blum-Kulka (1986 : 19, cité dans Séguinot 1988 : 106) qui associe sans doute trop présomptueusement la redondance à l’explicitation.
Notre analyse ne permet pas de répondre à la question principale que soulevait la démarche entamée en 2018 par le Barreau du Québec et le Barreau de Montréal, à savoir : une rédaction simultanée en français et en anglais des lois donnerait-elle des résultats supérieurs à la traduction du français vers l’anglais ? Pour le savoir avec plus de certitude, il faudrait comparer le corpus que nous avons utilisé dans le présent article avec un corpus de lois rédigées simultanément dans les deux langues, comme c’est le cas des lois fédérales. Ce sera une analyse que nous comptons effectuer dans un prochain article.
Pour tenter de répondre à la même question, il pourrait également être intéressant de faire une comparaison en utilisant les services infonuagiques de traduction proposés par DeepL[24], Google[25] et Microsoft[26]. Il s’agirait d’utiliser le français comme langue source autant pour les lois québécoises que pour les lois fédérales. Les trois services seraient en quelque sorte des points de référence. La distance entre le texte source en français et la traduction automatisée vers l’anglais serait ensuite comparée avec la distance entre le texte en français et le texte en anglais de chaque loi. Il serait ensuite possible de voir si la traduction humaine (au Québec) produit ou non des écarts significativement différents de la corédaction (au fédéral).
L’application de notre dispositif empirique d’analyse des décalages informationnels a montré la pertinence du concept d’information et de sa traduction en mots lexicaux dans l’évaluation et l’analyse supervisée des traductions.
Parties annexes
Annexe
Annexe 1
Remerciements
Les auteurs tiennent à remercier les étudiantes Isabelle Cloutier, Mélanie Desgent et Solaine Lagacé pour leur travail effectué au courant de l’été 2020 dans le cadre du projet d’analyse des décalages informationnels dans la traduction des lois du Québec en anglais qui a obtenu le soutien financier du Département de langues modernes et de traduction de l’Université du Québec à Trois-Rivières.
Notes
-
[1]
Homère (1931/1999) :Odyssée (traduit du grec par Victor Bérard ; édition présentée et annotée par Philippe Brunet). Sans ville : Librairie Armand Colin et Éditions Gallimard. Chant II, vers 407-431.
-
[2]
Barreau du Québec et Barreau de Montréal (2018) : Demande introductive d’instance pour jugement déclaratoire et avis à la procureure générale du Québec. Cour supérieure du Québec. 13 avril 2018. Consulté le 2. août 2021, <www.barreau.qc.ca/media/1442/180413-demande-introductive-d-instance.pdf>.
-
[3]
Cour suprême du Canada (1985) : Renvoi : Droits linguistiques au Manitoba [1985] 1 RCS 721 D.
-
[4]
Barreau du Québec et Barreau de Montréal (2018) : op. cit.
-
[5]
Barreau du Québec et Barreau de Montréal (2018) : op. cit.
-
[6]
Assemblée nationale du Québec (2019) : Le président de l’Assemblée nationale, le gouvernement du Québec et les barreaux concluent une entente. Dans Assemblée nationale - Communiqués de presse. Consulté le 26 août 2021, <www.assnat.qc.ca/fr/actualites-salle-presse/communiques/CommuniquePresse-5449.html>.
-
[7]
Barreau du Québec et Barreau de Montréal (2018) : op. cit.
-
[8]
Barreau du Québec et Barreau de Montréal (2018) : op. cit.
-
[9]
Barreau du Québec et Barreau de Montréal (2018) : op. cit.
-
[10]
QCCM 260 (2010). Montréal (Ville de) c. Perrette, Dossier 767-281-885. 12 octobre 2010. Consulté le 26 août 2021, <http://canlii.ca/t/2cxgd>.
-
[11]
Barreau du Québec (2017) : Mémoire. Commentaires et observations sur les langues officielles en matière judiciaire et législative. Consulté le 26 août 2021, <www.barreau.qc.ca/media/1449/memoire-langues-officielles.pdf>.
-
[12]
Barreau du Québec (2017) : op. cit.
-
[13]
Boisvert, Yves (2018) : Mieux traduire pour protéger le français. La Presse. 19 avril 2018.
-
[14]
On trouve beaucoup d’ouvrages portant sur la linguistique de corpus en traduction, comme celui de Loock (2016), qui consacre le terme « traductologie de corpus » dans son titre, mais peu d’entre eux abordent de manière approfondie les règles et les méthodes d’alignement des paires de segments dans les textes parallèles. Ce désintérêt peut s’expliquer du fait que, comme le signale Olohan (2004 : 26), les utilisateurs peuvent toujours afficher des sections plus grandes des textes, ce qui leur permet de corriger visuellement les erreurs d’alignement qui, pour notre dispositif empirique et pour l’évaluation des traductions, invalident logiquement toute généralisation sur la qualité de leur traduction que l’on puisse tirer des traitements formels s’appliquant à eux.
-
[15]
Il est bien évident que la traduction porte sur les objets de la connaissance auxquels renvoie l’information. Dans l’évaluation de la traduction, nous postulons que l’accès à ce contenu passe d’abord par la prise en compte des formes qui communiquent ces contenus, à savoir, principalement, les mots lexicaux.
-
[16]
Consulté le 4 juillet 2018, <http://legisquebec.gouv.qc.ca>.
-
[17]
Contrairement aux termes spécialisés pour lesquels le critère du volume informationnel en mots lexicaux est très pertinent dans l’évaluation de leur traduction.
-
[18]
Greenberg, D. (2015). How can I split a text into sentences ? [réponse mise en forme par Harsha Laxman à la question de Artyom du 1er janvier 2011 sur la plateforme Stack Overflow]. 19 juillet 2015. Consulté le 27 avril 2021, <https://stackoverflow.com/questions/4576077/python-split-text-on-sentences>.
-
[19]
Honnibal, Matthew et Montani, Ines (2017). spaCy 2 : Natural language understanding with Bloom embeddings, convolutional neural networks and incremental parsing. Consulté le 26 août 2021, <https://spacy.io>.
-
[20]
Une différence d’un seul mot lexical n’a pas le même poids numérique (significatif) sur le PIT d’une phrase de 5 mots (0,2), de 10 mots (0,1), de 20 mots (0,05) ou de 30 mots (0,03), d’où l’importance dans nos calculs de recourir à une précision décimale de deux à quatre chiffres (selon le cas).
-
[21]
L’écart-type a été arrondi à deux décimales. Ce degré de précision inférieur n’a pas d’incidence majeure puisque le critère de criblage du ratio PIT est un multiple correspondant à trois fois l’écart-type. Le moins grand nombre de paires de segments fortement hétéromorphes qui sont ainsi visés par le criblage contribue à atténuer l’imprécision de la valeur de l’écart-type utilisé.
-
[22]
L’omission a toutefois été corrigée en date de septembre 2021.
-
[23]
L’auteur donne l’exemple intéressant d’une variante du jeu d’échecs en vertu de laquelle la prise de pièces serait obligatoire et où chacun des adversaires cherche plutôt à se départir le premier de toutes ses pièces. Les règles du jeu d’échecs restent les mêmes, mais le terrain ou le cadre du jeu est très différent.
-
[24]
Offert gratuitement en ligne à <https://www.deepl.com/fr/translator>.
-
[25]
Offert gratuitement en ligne à <https://translate.google.ca/>.
-
[26]
Service infonuagique décrit en ligne à <https://www.microsoft.com/fr-fr/translator/>.
Bibliographie
- Becher, Viktor (2010) : Abandoning the notion of “translation-inherent” explicitation : Against a dogma of translation studies. Across languages and cultures. 11(1):1-28.
- Blum-Kulka, Shoshana (1986) : Shifts of Cohesion and Coherence in Translation. In : Juliane House et Shoshana Blum-Kulka, dir. Interlingual and Intercultural Communication. Tubingue : Narr, 17-35.
- Coates, Edmund (2011) : The English voice of the Civil Code of Québec : An unfinished history. Revue du Barreau. 70:43-62.
- Côté, Pierre-André (1982/2009) : Interprétation des lois. Montréal : Éditions Thémis.
- Delisle, Jean et Fiola, Marco A. (1993/2013) : La traduction raisonnée : Manuel d’initiation à la traduction professionnelle de l’anglais vers le français. Ottawa : Presses de l’Université d’Ottawa.
- Gémar, Jean-Claude (2001/2021) : Langage du droit et traduction : enjeux, difficultés et nuances de la traduction juridique. In : Elsa Matzner, dir. Droit et langues étrangères 2 : Traductions juridiques, domaine du juriste, du linguiste ou du jurilinguiste ? Perpignan : Presses universitaires de Perpignan/OpenEdition Books.
- Gémar, Jean-Claude (2019) : Jurilinguistic Analysis in Translation, Comparative Law Practice. Translate the Letter or “The Spirit of the Laws” ? The Case of the Code Napoléon. Comparative Legilinguistics. 37(1):9-61.
- Gile, Daniel (2005) : La traduction. La comprendre, l’apprendre. Paris : Presses universitaires de France.
- Klaudy, Kinga (2008) : Explicitation. In : Mona Baker et Gabriela Saldanha, dir. Routledge Encyclopedia of Translation Studies. Londres : Routledge, 80-85.
- Lavoie, Judith (2002) : Le discours sur la traduction juridique au Canada. Meta. 47(2):198-210.
- Lecolle, Michelle, Veniard, Marie et Guérin, Olivia (2018) : Pour une sémantique discursive ? : propositions et illustrations. Langages. 210(2):35-54.
- Lemieux, René (2018) : Thème et version dans la législation québécoise : la cause des Barreaux et la traduction des lois. Trahir. https://trahir.wordpress.com/2018/04/27/lemieux-barreaux/.
- Loock, Rudy (2016) : La traductologie de corpus. Villeneuve D’Ascq : Presses universitaires du Septentrion.
- McLaren, Karine (2016) : La production de textes législatifs bilingues authentiques au Canada ? : La corédaction et la traduction démystifiées. Mémoire de maîtrise. Moncton : Université de Moncton.
- Murtisari, Elisabet Titik (2016) : Explicitation in Translation Studies : The journey of an elusive concept. The International Journal for Translation & Interpreting Research. 8(2):64-81.
- Olohan, Maeve (2004) : Introducing Corpora in Translation Studies. Londres/New York : Routledge.
- Poirier, Éric (2017) : A comparison of three metrics for detecting crosslinguistic variations in information volume and multiword expressions between parallel bitexts. In : Ruslan Mitkov, dir. Computational and Corpus-based Phraseology : Recent Advances and Interdisciplinary Approaches. Proceedings of the Conference (Volume II), Londres, 13 et 14 novembre 2017. Genève : Éditions Tradulex, 1-10.
- Poirier, Éric André (2019) : Repérage des décalages informationnels de traduction au moyen du criblage automatique des segments hétéromorphes d’un corpus parallèle. TTR. 32(1):279-308.
- Poirier, Éric André (2021) : What can Euclidean distance do for translation evaluations ?. In : Mario Bisiada, dir. Empirical studies in translation and discourse (Translation and Multilingual Natural Language Processing) 14. Berlin : Language Science Press, 165-198.
- Séguinot, Candace (1988) : Pragmatics and the Explicitation Hypothesis. TTR. 1(2):106-113.
- Van Hoecke, Mark (2018) : Raisonnement juridique et droit comparé. In : Yves Cartuyvels, Antoine Bailleu, Diane Bernardet al., dir. Le droit malgré tout. Bruxelles : Presses de l’Université Saint-Louis, 53-75.
- Wecksteen-Quinio, Corinne, Mariaule, Mickaël et Lefebvre-Scodeller, Cindy (2015) : La traduction anglais-français : Manuel de traductologie pratique. Louvain-la-Neuve : De Boeck.