Abstracts
Résumé
Cet article propose une analyse linguistique d’un corpus de français traduit de façon automatique depuis l’anglais, en comparaison d’un corpus de français original. Deux outils de traduction automatique ont été retenus pour cette étude, l’un générique, grand public et neuronal tandis que l’autre est un outil spécifique, utilisé par une grande organisation internationale et à base de statistiques. Selon la méthodologie de la traductologie de corpus, à travers une analyse quantitative de phénomènes linguistiques (lexicaux et grammaticaux) connus pour poser problème aux traducteurs anglais-français, nous montrons que l’usage linguistique, au-delà des règles et dont le respect permet d’atteindre la fluidité et l’idiomaticité de la langue cible attendues sur le marché, n’est pas pris en compte par les outils de traduction automatique actuels. L’objectif est de mettre au jour la valeur ajoutée de la traduction humaine, tout particulièrement auprès des traducteurs en formation.
Mots-clés :
- traduction automatique,
- corpus,
- évaluation,
- usage linguistique,
- didactique de la traduction
Abstract
In this article we provide a linguistic analysis of a corpus of machine-translated texts from English into French, in comparison with a corpus of original French. Two machine translation tools have been selected: one of them is a generic, general public, neural system while the other is a specific, statistical-based tool developed by a major international organization. Following the corpus-based translation studies approach, we provide a quantitative analysis of a series of linguistic features (lexical and grammatical) which are known to be problematic for English-French translators. We aim to show that linguistic usage, which goes beyond grammatical correctness and needs to be taken into account to provide natural, idiomatic translations in order to meet the demands of today’s translation market, is not taken into account by current machine translation systems. Our aim is to show human translators’ added value over such systems, in particular for translation trainees.
Keywords:
- machine translation,
- corpus,
- evaluation,
- linguistic usage,
- translation didactics
Resumen
Este artículo propone un análisis lingüístico de un corpus en francés traducido de manera automática del inglés, comparado con un corpus en francés (lengua de origen). Para este estudio se seleccionaron dos herramientas de traducción automática: una genérica, disponible a todo tipo de público, y neuronal; mientras que la otra es una herramienta específica utilizada por una gran organización internacional y basada en estadísticas. Según la metodología de la traductología de corpus, por medio de un análisis cuantitativo de los fenómenos lingüísticos (léxicos y gramaticales) que se sabe de antemano que plantean problemas a los traductores inglés-francés, demostramos que el uso lingüístico, más allá de las reglas y cuya consideración permite alcanzar la fluidez e idiomaticidad de la lengua meta que se esperan en el mercado, no es tenido en cuenta por las actuales herramientas de traducción automática. El objetivo es destacar el valor añadido de la traducción humana, especialmente para los traductores en formación.
Palabras clave:
- traducción automática,
- corpus,
- evaluación,
- uso lingüístico,
- didáctica de la traducción
Appendices
Bibliographie
- Baker, Mona (1993) : Corpus linguistics and translation studies : Implications and applications. In : Mona Baker, Gill Francis et Elena Tognini-Bonelli, dir. Text and Technology. Amsterdam/Philadelphie : John Benjamins, 223-250.
- Bentivogli, Luisa, Bisazza, Arianna, Cettolo, Mauro, et al. (2016) : Neural versus phrase-based machine translation quality : a case study. In : Jian Su, Kevin Duh et Xavier Carreras, dir. Proceedings of the 2016 Conference on Empirical Methods in Natural Language Processing. (EMNLP 2016 : Conference on Empirical Methods in Natural Language Processing, Austin, Texas, 1-5 novembre 2016). Stroudsburg : Association for Computational Linguistics, 257-267. Consulté le 17 décembre 2018, http://www.aclweb.org/anthology/D16-1000.
- Bojar, Ondřej, Chatterjee, Rajen, Federmann, Chistian, et al. (2015) : Findings of the 2015 workshop on statistical machine translation. In : Ondřej Bojar, Rajan Chatterjee, Christian Federmann, et al., dir. Proceedings of the Tenth Workshop on Statistical Machine Translation. (EMNLP 2015 : Tenth Workshop on Statistical Machine Translation, Lisbonne, 17-18 septembre 2015). Stroudsburg : Association for Computational Linguistics, 1-46. Consulté le 17 décembre 2018, http://www.statmt.org/wmt15/pdf/WMT01.pdf.
- Cappelle, Bert et Loock, Rudy (2013) : Is there interference of usage constraints ? A frequency study of existential there is and its French equivalent il y a in translated vs. non-translated texts. Target. 25(2):252-275.
- Castilho, Sheila, Moorkens, Joss, Gaspari, Federico, et al. (2017) : A comparative quality evaluation of PBSMT and NMT using professional translators. In : Sadao Kurohashi et Pascale Fung, dir. Proceedings of MT Summit XVI. (Machine Translation Summit XVI, Nagoya, 18-22 septembre 2017). Vol. 1. Tokyo : Asia-Pacific Association for Machine Translation, 116-131.
- Chuquet, Hélène et Paillard, Michel (1987) : Approche linguistique des problèmes de traduction anglais-français. Paris : Ophrys.
- Federico, Marcello, Negri, Matteo, Bentivogli, Luisa, et al. (2014) : Assessing the impact of translation errors on machine translation quality with mixed-effects models. In : Alessandro Moschitti, Bo Pang et Walter Daelemans, dir. Proceedings of the 2014 Conference on Empirical Methods in Natural Language Processing(EMNLP). (EMNLP 2014 : Conference on Empirical Methods in Natural Language Processing, Doha, 25-29 octobre 2014). Stroudsburg : Association for Computational Linguistics, 1643-1653. Consulté le 17 décembre 2018, http://www.aclweb.org/anthology/D14-1172.
- Frawley, William (1984) : Prolegomenon to a theory of translation. In : William Frawley, dir. Translation : Literary, Linguistic and Philosophical Perspectives. Newark : University of Delaware Press, 250-263.
- Froeliger, Nicolas (2013) : Les Noces de l’analogique et du numérique – De la traduction pragmatique. Traductologiques. Paris : Les Belles Lettres.
- Guillemin-Flescher, Jacqueline (1986) : Syntaxe comparée du français et de l’anglais, Problèmes de traduction. Paris : Ophrys.
- Hartley, Anthony et Popescu-Belis, Andrei (2004) : Évaluation des systèmes de traduction automatique. In : Stéphane Chaudiron, dir. Évaluation des systèmes de traitement de l’information. Sciences et technologies de l’information. Paris : Hermès, 311-335.
- Isabelle, Pierre, Cherry, Colin et Foster, George (2017) : A challenge set approach to evaluating machine translation. In : Martha Palmer, Rebecca Hwa et Sebastian Riedel, dir. Proceedings of the 2017 Conference on Empirical Methods in Natural Language Processing. (EMNLP 2017 : Conference on Empirical Methods in Natural Language Processing, Copenhague, 7-11 septembre 2017). Stroudsburg : Association for Computational Linguistics, 2486-2496.
- Koehn, Philipp (2010) : Statistical Machine Translation. Cambridge : Cambridge University Press.
- Koehn, Philipp et Germann, Ulrich (2014) : The impact of machine translation quality on human post-editing. In : Ulrich Germann, Michael Carl, Philipp Koehn, et al., dir. Proceedings of the EACL 2014 Workshop on Humans and Computer-assisted Translation. (EACL 2014 : 14th Conference of the European Chapter of the Association for Computational Linguistics, Göteborg, 26-30 avril 2014). Stroudsburg : Association for Computational Linguistics, 38-46. Consulté le 17 décembre 2018, http://www.aclweb.org/anthology/W14-0300.
- Lapshinova-Koltunski, Ekaterina (2015) : Variation in translation : evidence from corpora. In : Claudio Fantinuoli et Federico Zanettin, dir. New Directions in Corpus-based Translation Studies. Berlin : Language Science Press, 93-114.
- Laviosa, Sara (2002) : Corpus-Based Translation Studies : Theory, Findings, Applications. Amsterdam/New York : Rodopi.
- Loock, Rudy (2016) : La traductologie de corpus. Villeneuve d’Ascq : Presses universitaires du Septentrion.
- Loock, Rudy (à paraître) : Parce que « grammaticalement correct » ne suffit pas : le respect de l’usage grammatical en langue cible. In : Michel Berré, Céline Letawe, Hedwig Reuter, et al., dir. La formation grammaticale du traducteur : enjeux didactiques et traductologiques (Quelle formation grammaticale pour de futurs traducteurs ? Mons, 9-10 mars 2017). Villeneuve d’Ascq : Presses universitaires du Septentrion.
- Macketanz Vivien, Avramidis, Eleftherios, Burchardt, Aljoscha, et al. (2017) : Machine translation : Phrase-Based, Rule-Based and Neural approaches with linguistic evaluation. Cybernetics and Information Technologies. 17(2):28-43.
- Massey, Gary et Ehrensberger-Dow, Maureen (2017) : Machine learning : Implications for translator education. Lebende Sprachen. 62(2):300-312.
- Moorkens, Joss (2018) : What to expect from Neural Machine Translation : a practical in-class translation evaluation exercise. The Interpreter and Translator Trainer. 12(4):375-387.
- Olohan, Maeve (2004) : Introducing Corpora in Translation Studies. Londres/New York : Routledge.
- Papineni, Kishore, Roukos, Salim, Ward, Todd, et al. (2002) : Bleu : a method for automatic evaluation of machine translation. In : Pierre Isabelle, Eugene Charniak et Dekang Lin, dir. Proceedings of 40th Annual Meeting of the Association for Computational Linguistics. (ACL-02 : 40th Annual Meeting of the ACL, Philadelphie, 7-12 juillet 2002). Stroudsburg : Association for Computational Linguistics, 311-318. Consulté le 17 décembre 2018, https://dl.acm.org/citation.cfm?doid=1073083.1073135.
- Popovic, Maja, Avramidis, Eleftherios, Burchardt, Aljoscha, et al. (2013) : Learning from human judgments of machine translation output. In : Khalil Sima’an, Mike L. Forcada, Daniel Grasmick, et al., dir. Machine Translation Summit XIV (Nice, France, 2-6 September 2013) : Proceedings. (Machine Translation Summit XIV, Nice, 2-6 septembre 2013). Allschwil : European Association for Machine Translation, 231-238.
- Rossi, Caroline (2017) : Introducing statistical machine translation in translator training : From uses and perceptions to course design and back again. Revista Tradumàtica. Tecnologies de la Traducció. 15 :48-62.
- Schmid, Helmut (1997/2003) : Probabilistic part-of-speech tagging using decision trees. In : Danny B. Jones et Harold Somers, dir. New Methods in Language Processing. (NeMLaP : International Conference on New Methods in Language Processing, Manchester, 14-16 septembre 1994). Londres/New York : Routledge, 154-164. Consulté le 17 décembre 2018, http://www.cis.uni-muenchen.de/~schmid/tools/TreeTagger/data/tree-tagger1.pdf.
- Vinay, Jean-Paul et Darbelnet, Jean (1958) : Stylistique comparée du français et de l’anglais. Paris : Didier.