D’entrée de jeu, le corpus est défini comme un ensemble de données « attestées » (par opposition aux données « fabriquées »), qui ne sont qu’un échantillon représentatif de l’ensemble des données du même type. Ces données sont compilées et, au besoin, annotées sous format électronique, dans le but d’être consultées et exploitées par le biais d’un logiciel, car « le corpus ne se lit pas, mais il s’interroge » (p. 21). Les corpus électroniques ont gagné en visibilité avec l’émergence de la linguistique descriptive (ou « linguistique de corpus ») qui vise l’observation, l’analyse et la description de la langue authentique pour en extraire une théorie (corpus-driven analysis) ou pour (in)valider une théorie existante (corpus-based analysis). Les avancées technologiques ont permis leurs rapides développement et démocratisation et ils sont maintenant légion, variés, accessibles et larges, comme en témoignent les nombreux exemples fournis par l’auteur (p. 27-32). Les chapitres 2 et 3 définissent la traductologie « comme étant l’étude de la traduction à la fois en tant que processus et en tant que produit » (p. 41) et rappellent comment, sous l’impulsion de l’article de Mona Baker (1993), la discipline s’est emparée des corpus électroniques pour décrire la langue traduite indépendamment du texte source. Cette « révolution méthodologique » (p. 58) a animé divers enjeux interprétatifs, dont l’existence d’universaux de la traduction (ibid.), d’un « troisième code » (Frawley, 1984) ou d’un « translationese » (Gellerstam, 1986), la position du traducteur auteur ou invisible, ou encore la question de l’évaluation de la qualité des traductions. Parallèlement, les outils de TAO, généralement décrits comme « des logiciels informatiques à mémoire de traduction […], qui permettent au traducteur de consulter des traductions passées afin de l’assister dans la traduction d’un nouveau texte en recherchant des correspondances, totales ou partielles » (p. 59) ont pris leur place dans l’espace de travail du traducteur professionnel. Derrière ces outils de TAO se « cachent » des corpus (dans leur définition la plus minimale donnée par Bowker et Pearson [2002, p. 9] : « a corpus is simply a body of text »), tout comme derrière diverses ressources en ligne largement exploitées par les traducteurs (p. ex. Linguee, Reverso, Tradooit) et les logiciels de traduction automatique reposant sur des analyses statistiques. Toutefois, le traducteur tend à ne pas avoir conscience d’utiliser fréquemment des corpus et il est souvent encore moins apte à les compiler et à les exploiter lui-même, en dehors des outils de TAO classiques. Pourtant, intégrés à la formation des traducteurs, les corpus électroniques se révèlent utiles pour traduire (p. ex. pour la recherche documentaire ou terminologique) et pour apprendre à traduire (p. ex. pour mettre en évidence certains phénomènes ou problèmes de traduction). Les corpus électroniques ont donc le potentiel d’assister le traducteur dans sa tâche, et c’est pourquoi Loock juge qu’ils devraient être considérés comme des « outils de TAO » au même titre que les logiciels de mémoire de traduction. Son ouvrage tente de briser certains préjugés tenaces à leur égard (p. ex., leur compilation exige nécessairement beaucoup de temps, d’efforts et de compétences techniques) et de mettre en lumière leur fonctionnement et leurs limites pour en permettre une utilisation optimale. La variété des corpus existants est présentée au chapitre 4, dans lequel on trouve aussi une marche à suivre, qui se veut simple et rassurante, pour compiler ses propres corpus (appelés par l’auteur « corpus maison » ou « corpus DIY » [p. 31]) de façon manuelle ou (semi-)automatique. Loock y distingue, d’une part, les corpus bruts des corpus annotés (avec un étiquetage des …
Appendices
Bibliographie
- Baker, Mona (1993). « Corpus Linguistics and Translation Studies: Implications and Applications ». In M. Baker, G. Francis et E. Tognini-Bonelli, dir. Text and Technology. Amsterdam/Philadelphie, John Benjamins, p. 233-250.
- Beeby, Allison, Patricia Rodríguez Inés et Pilar Sánchez-Gijón, dir. (2009). Corpus Use and Translating. Amsterdam/Philadelphie, John Benjamins.
- Bowker, Lynne et Jennifer Pearson (2002). Working with Specialized Language: A Practical Guide to Using Corpora. Londres et New York, Routledge.
- Frawley, William (1984). « Prolegomenon to a Theory of Translation ». In W. Frawley, dir. Translation: Literary, Linguistic and Philosophical Perspectives. Newark, University of Delaware Press, p. 250-263.
- Gellerstam, Martin (1986). « Translationese in Swedish Novels Translated from English ». In L. Wollin et H. Lindquist, dir. Translation Studies in Scandinavia. Lund, CWK Gleerup, p. 88-95.
- Laviosa, Sara (2002). Corpus-Based Translation Studies: Theory, Findings, Applications. Amsterdam et New York, Rodopi.
- Olohan, Maeve (2004). Introducing Corpora in Translation Studies. Londres et New York, Routledge.
- Venuti, Lawrence (1995). The Translator’s Invisibility: A History of Translation. Londres et New York, Routledge.
- Zanettin, Federico (2012). Translation-Driven Corpora. Corpus Resources for Descriptive and Applied Translation Studies. Manchester, St Jerome.
- Zanettin, Federico (2013). « Corpus Methods for Descriptive Translation Studies ». Procedia: Social and Behavioral Sciences, 95, p. 20-32.
- Zanettin, Federico, Silvia Bernardini et Dominic Stewart, dir. (2014). Corpora in Translator Education. Oxon et New York, Routledge.