Corps de l’article
La traductologie de corpus est un ouvrage qui vise, d’une part, à faire prendre conscience de la vaste présence des corpus électroniques dans la boîte à outils du traducteur et à amener ce dernier à les maîtriser pour mieux traduire et, d’autre part, à rappeler la variété des questions de recherche en traductologie que les corpus sont en mesure d’éclairer. Bien que ces questions aient déjà été traitées ailleurs (par ex. par Beeby et al., 2009; Laviosa, 2002; Olohan, 2004; Zanettin, 2012 et 2013; Zanettin et al., 2014), on appréciera l’excellente synthèse qu’en fait Rudy Loock et à laquelle il ajoute sa volonté de voir l’appellation « outils d’aide à la traduction » (ou « outils de TAO ») s’étendre à l’ensemble des corpus électroniques. Il s’agit d’un ouvrage assez complet, rédigé dans un style clair et qui intègre des définitions, des recensions d’écrits, des présentations et des discussions de résultats d’études diverses, de même que maintes ressources utiles pour le lecteur, dont un guide pratique de compilation et d’exploitation de corpus. Il s’adresse donc à un large public qui s’intéresserait de près ou de loin à la traduction et, plus spécifiquement, aux traducteurs en exercice ou en formation et aux traductologues apprentis ou aguerris. Le livre est divisé en deux parties, l’une à visée définitoire et l’autre appliquée. Les trois premiers chapitres définissent la traductologie de corpus (chap. 3) comme « le fruit de la rencontre entre la linguistique de corpus [chap. 1] et la traductologie descriptive [chap. 2 et 3] » (p. 47) et le quatrième chapitre, riche d’exemples, recense les différents types de corpus électroniques. La seconde partie du livre présente les résultats d’exploitations de corpus pour valoriser leur rôle à la fois comme outils de TAO (chap. 5) et comme outils de recherche en traductologie (chap. 6). Chaque chapitre étant introduit et conclu par un résumé de ses points principaux, le lecteur peut rapidement prendre connaissance de ce qu’une lecture plus approfondie lui apportera et que nous récapitulons ci-dessous.
D’entrée de jeu, le corpus est défini comme un ensemble de données « attestées » (par opposition aux données « fabriquées »), qui ne sont qu’un échantillon représentatif de l’ensemble des données du même type. Ces données sont compilées et, au besoin, annotées sous format électronique, dans le but d’être consultées et exploitées par le biais d’un logiciel, car « le corpus ne se lit pas, mais il s’interroge » (p. 21). Les corpus électroniques ont gagné en visibilité avec l’émergence de la linguistique descriptive (ou « linguistique de corpus ») qui vise l’observation, l’analyse et la description de la langue authentique pour en extraire une théorie (corpus-driven analysis) ou pour (in)valider une théorie existante (corpus-based analysis). Les avancées technologiques ont permis leurs rapides développement et démocratisation et ils sont maintenant légion, variés, accessibles et larges, comme en témoignent les nombreux exemples fournis par l’auteur (p. 27-32). Les chapitres 2 et 3 définissent la traductologie « comme étant l’étude de la traduction à la fois en tant que processus et en tant que produit » (p. 41) et rappellent comment, sous l’impulsion de l’article de Mona Baker (1993), la discipline s’est emparée des corpus électroniques pour décrire la langue traduite indépendamment du texte source. Cette « révolution méthodologique » (p. 58) a animé divers enjeux interprétatifs, dont l’existence d’universaux de la traduction (ibid.), d’un « troisième code » (Frawley, 1984) ou d’un « translationese » (Gellerstam, 1986), la position du traducteur auteur ou invisible, ou encore la question de l’évaluation de la qualité des traductions. Parallèlement, les outils de TAO, généralement décrits comme « des logiciels informatiques à mémoire de traduction […], qui permettent au traducteur de consulter des traductions passées afin de l’assister dans la traduction d’un nouveau texte en recherchant des correspondances, totales ou partielles » (p. 59) ont pris leur place dans l’espace de travail du traducteur professionnel.
Derrière ces outils de TAO se « cachent » des corpus (dans leur définition la plus minimale donnée par Bowker et Pearson [2002, p. 9] : « a corpus is simply a body of text »), tout comme derrière diverses ressources en ligne largement exploitées par les traducteurs (p. ex. Linguee, Reverso, Tradooit) et les logiciels de traduction automatique reposant sur des analyses statistiques. Toutefois, le traducteur tend à ne pas avoir conscience d’utiliser fréquemment des corpus et il est souvent encore moins apte à les compiler et à les exploiter lui-même, en dehors des outils de TAO classiques. Pourtant, intégrés à la formation des traducteurs, les corpus électroniques se révèlent utiles pour traduire (p. ex. pour la recherche documentaire ou terminologique) et pour apprendre à traduire (p. ex. pour mettre en évidence certains phénomènes ou problèmes de traduction). Les corpus électroniques ont donc le potentiel d’assister le traducteur dans sa tâche, et c’est pourquoi Loock juge qu’ils devraient être considérés comme des « outils de TAO » au même titre que les logiciels de mémoire de traduction. Son ouvrage tente de briser certains préjugés tenaces à leur égard (p. ex., leur compilation exige nécessairement beaucoup de temps, d’efforts et de compétences techniques) et de mettre en lumière leur fonctionnement et leurs limites pour en permettre une utilisation optimale.
La variété des corpus existants est présentée au chapitre 4, dans lequel on trouve aussi une marche à suivre, qui se veut simple et rassurante, pour compiler ses propres corpus (appelés par l’auteur « corpus maison » ou « corpus DIY » [p. 31]) de façon manuelle ou (semi-)automatique. Loock y distingue, d’une part, les corpus bruts des corpus annotés (avec un étiquetage des catégories grammaticales, par exemple) et, d’autre part, les corpus monolingues (de référence, de spécialité ou de langue traduite) des corpus multilingues (parallèles ou comparables). Il est également question de mégacorpus en ligne (p. ex. Google Books Corpus), du Web utilisé comme corpus et de dictionnaires en ligne tels que Linguee ou Reverso, qui ne sont rien d’autre que des corpus parallèles inavoués (p. 92). Le corpus d’apprenants (learner corpus), souvent compilé à des fins de recherche et d’enseignement, est aussi mentionné. Indéniablement, le novice trouvera ce chapitre et les nombreux exemples fournis par l’auteur très utiles pour découvrir, comprendre et observer ce qui différencie les corpus disponibles ainsi que pour compiler des corpus sur mesure. Le lecteur plus averti, et notamment le formateur de traducteurs qui pourra s’y référer dans le cadre de son enseignement, profitera aussi de ce généreux tour d’horizon d’un domaine qui est en constante évolution. Finalement, la personne qui consulterait cet ouvrage essentiellement pour prendre connaissance des études de cas (chap. 5 et 6) aura également intérêt à ne pas faire l’impasse sur le chapitre 4, qui décrit les corpus exploités par Loock et qui éclaire nécessairement l’interprétation de ses résultats.
Un autre aspect à ne pas négliger pour pleinement tirer profit des résultats de la deuxième partie de l’ouvrage est que, pour l’auteur, « un bon traducteur [est] comme un bon criminel : la traduction n’est réussie que s’il ne se fait pas prendre, c’est-à-dire si le texte traduit peut passer pour un texte écrit directement en langue cible sans être le fruit d’une traduction » (p. 125). En somme, et tout en étant parfaitement conscient que ce point de vue ne fait pas consensus, Loock juge que l’objectif du traducteur est son « invisibilité » (Venuti, 1995) et que la qualité de la traduction réside dans sa fluidité et son homogénéité avec la langue cible originale. C’est, selon lui, ce qui différenciera toujours la machine de l’humain en matière de traduction.
Les études de cas du chapitre 5 valident l’utilité des corpus pour le traducteur à différentes étapes de son travail. Au-delà des corpus parallèles, dont les atouts sont bien connus puisqu’ils sont à la base des mémoires de traduction et des dictionnaires en ligne qu’utilisent fréquemment les traducteurs, les corpus monolingues de langue source peuvent aider à la compréhension du texte à traduire et à l’obtention de renseignements absents des ouvrages de référence classiques. L’exploitation de corpus monolingues de langue cible fournira quant à elle des informations qui contribueront à donner un caractère fluide et naturel à la traduction. Finalement, comparer des corpus de langues originales permet de mettre en évidence les différences interlangagières et d’éviter les « faux équivalents traductionnels » (p. 141-142). Le chapitre 6 revient sur diverses études menées sur des corpus comparables de langue originale et de langue traduite, qui ont alimenté de multiples débats théoriques en traductologie, à savoir l’existence ou non d’un troisième code, l’influence de l’interférence de la langue source et l’impact de l’interférence sur la qualité de la traduction. Les résultats, brièvement présentés, laisseront probablement sur sa faim le traductologue spécialiste de ces questions qui profitera plutôt de la bibliographie en fin d’ouvrage pour explorer ces études à leur source. Toutefois, ce dernier chapitre parvient à nous convaincre que l’approche par corpus « est loin d’être antinomique avec des approches qui seraient plus théoriques » (p. 181).
Nous l’avons dit, le propos de l’ouvrage La traductologie de corpus n’est pas en soi novateur, mais on applaudira sans doute la grande attention portée par l’auteur à la recension des écrits et à la définition des concepts, ainsi que l’inclusion de guides pratiques et de nombreux exemples et ressources. Tous ces éléments, ajoutés à la richesse des démonstrations et au ton décidément enjoué de Loock, réussissent à persuader le lecteur de l’utilité des corpus électroniques pour la traductologie et offrent un excellent ouvrage didactique et de synthèse, utile à la formation des traducteurs et des traductologues. À cet effet, on appréciera d’avoir enfin accès à un tel ouvrage en français, langue qui, comme sa riche bibliographie l’illustre, se raréfie dans la littérature universitaire!
Parties annexes
Bibliographie
- Baker, Mona (1993). « Corpus Linguistics and Translation Studies: Implications and Applications ». In M. Baker, G. Francis et E. Tognini-Bonelli, dir. Text and Technology. Amsterdam/Philadelphie, John Benjamins, p. 233-250.
- Beeby, Allison, Patricia Rodríguez Inés et Pilar Sánchez-Gijón, dir. (2009). Corpus Use and Translating. Amsterdam/Philadelphie, John Benjamins.
- Bowker, Lynne et Jennifer Pearson (2002). Working with Specialized Language: A Practical Guide to Using Corpora. Londres et New York, Routledge.
- Frawley, William (1984). « Prolegomenon to a Theory of Translation ». In W. Frawley, dir. Translation: Literary, Linguistic and Philosophical Perspectives. Newark, University of Delaware Press, p. 250-263.
- Gellerstam, Martin (1986). « Translationese in Swedish Novels Translated from English ». In L. Wollin et H. Lindquist, dir. Translation Studies in Scandinavia. Lund, CWK Gleerup, p. 88-95.
- Laviosa, Sara (2002). Corpus-Based Translation Studies: Theory, Findings, Applications. Amsterdam et New York, Rodopi.
- Olohan, Maeve (2004). Introducing Corpora in Translation Studies. Londres et New York, Routledge.
- Venuti, Lawrence (1995). The Translator’s Invisibility: A History of Translation. Londres et New York, Routledge.
- Zanettin, Federico (2012). Translation-Driven Corpora. Corpus Resources for Descriptive and Applied Translation Studies. Manchester, St Jerome.
- Zanettin, Federico (2013). « Corpus Methods for Descriptive Translation Studies ». Procedia: Social and Behavioral Sciences, 95, p. 20-32.
- Zanettin, Federico, Silvia Bernardini et Dominic Stewart, dir. (2014). Corpora in Translator Education. Oxon et New York, Routledge.