Corps de l’article

1. Introduction

Traduire, c’est avant tout se mettre au service des futurs spectateurs ou lecteurs, c’est produire à leur intention un « équivalent » du texte ou du film original, c’est-à-dire un texte ou un film qui livre, comme l’écrit Claude Tatilon « avec le moins de distorsion possible toute l’information contenue dans celui de l’origine » (Tatilon 1986 : 150). Mais c’est aussi

produire un texte duquel il convient d’exiger trois autres qualités : qu’il soit rendu naturellement en langue d’arrivée, qu’il soit parfaitement intégré dans la culture d’arrivée et qu’il parvienne, par une adroite manipulation de l’écriture, à donner l’idée la plus juste de l’originalité et des intentions stylistiques de l’auteur traduit.

Tatillon 1986 : 150

En doublage cinématographique comme en toute traduction, le critère d’équivalence reste essentiellement pragmatique et subjectif : en effet, il dépend de l’appréciation du traducteur qui a produit le texte, du directeur de plateau qui organise l’enregistrement, de l’acteur qui le « met en bouche », et du spectateur qui en est le dernier juge. Cela ne signifie nullement que l’équivalence ou la non-équivalence d’un doublage par rapport à la version originale (VO) est une question d’appréciation individuelle et irréductible à tout critère objectif : le degré d’équivalence d’un doublage par rapport à la version originale est fonction des contraintes de synchronisme (linguistique, syntaxique, artistique), ainsi que de paramètres linguistiques et extralinguistiques, lesquels échappent largement à la conscience claire de celui (fût-il traducteur lui-même) qui évalue l’équivalence en question. La recherche de l’équivalence est par conséquent le résultat d’un travail dont les données échappent largement à l’observation et qui met en jeu des éléments linguistiques et extralinguistiques innombrables et complexes. Cette recherche de l’équivalence se réalise selon des conditions qui varient à chaque occasion. La notion d’équivalence apparaît dès lors éminemment relative, et le degré d’équivalence est déterminé par chaque situation d’énonciation et par chaque acte traduisant. Il serait vain de traduire toujours de la même manière en respectant les règles abstraites d’une équivalence ou d’une fidélité intemporelle. Le degré d’équivalence est fonction d’une série de variables qui sont du reste bien souvent le reflet des nombreuses facettes du contact linguistique et qui élargissent l’éventail des possibilités de traduction. En effet, la comparaison des deux énoncés, une fois l’équivalence de traduction produite, n’appréhende elle-même que le résultat global et non l’ensemble des interactions langue-sens et langue-langue qui la tissent. Cela veut dire que le texte équivalent est l’aboutissement d’un ensemble de compromis réfléchis entre la langue de départ, le sens du film, les exigences de la langue d’arrivée et le contexte d’énonciation et d’utilisation du texte final. En doublage cinématographique, l’équivalence se déploie sur un double plan, d’abord celui de la traduction des sonorités de la langue de la version originale (équivalence de son qui comprend par ailleurs le doublage des bruits – le bruit d’ambiance dans une rue de New York n’est pas le même que celui d’une rue de Paris – et le doublage de certaines musiques et de certains chants), ensuite la traduction du sens de la version originale dans la version doublée (VD).

Le présent article explore et analyse un certain nombre des paramètres en jeu. Du fait que le degré d’équivalence ne peut être établi qu’à postériori, à partir de la comparaison de deux films (la version originale et la version doublée), nous nous proposons d’examiner la notion d’équivalence de sens à partir du texte écrit sur la bande mère, et l’équivalence vocale et artistique à partir du même texte oralisé et enregistré sur le plateau de doublage.

1.1. L’équivalence comme héritage de la linguistique

Selon toute vraisemblance, le terme « équivalence » serait hérité de la linguistique, du moins si l’on se réfère aux écrits de Snell-Hornby (1988). De fait, les années 1950 à 1980 ont vu la naissance de nombreuses théories qui se sont penchées sur la notion d’équivalence. Vinay et Darbelnet (1958), qui ont proposé une taxinomie des variations en traduction, Catford (1965), qui a introduit le concept de « translation shift » (une autre manière d’envisager la variation), Nida (1964 ; 1969/1982), qui a proposé les concepts d’équivalence dynamique et d’équivalence formelle, Filipec, Garlant, Koller et bien d’autres qui se réclamaient du courant de la linguistique structurelle posaient l’équivalence comme principe de base de la traduction. Ces théoriciens se sont attachés à définir les contours de la notion en vue de l’appliquer à la traduction, ce qui a donné lieu à une inflation terminologique dont Snell-Hornby (1988 : 76) donne quelques exemples : Filipec (1973) parle de « fakultative äquivalenz » et « null-äquivalenz » ; Koller (1997), de « structural equivalence » ou de « equivalence of the entire text » ; Garlant (1978), de « denotative aquivalenz », « konnotative äquivalenz », « pragmatisch äquivalenz » « formal äquivalenz » ; Nida, de « dynamic equivalence ». Ce foisonnement terminologique n’allait pas faciliter la tâche des traductologues. Notons aussi les théories fonctionnalistes (Skopos de Vermeer [1989] et Reiss [2000], qui établissent une typologie des textes à traduire selon la notion de fonction en associant à chaque type de texte une méthode de traduction). Cette théorie stipule que le traducteur, médiateur de la communication interlinguistique et interculturelle, se doit de rechercher une équivalence qui rende le texte d’arrivée fonctionnel dans la culture réceptrice.

1.2 Correspondance et équivalence

Se basant sur une comparaison interlinguistique de divers faits de langue, Perennec (1993 : 24) a utilisé le terme « équivalence » pour désigner les « correspondances » ponctuelles qui sont parfois tout à fait exactes, par exemple la traduction des chiffres ou des expressions à correspondance directe (today = aujourd’hui, she is my daughter = c’est ma fille, etc.). La théorie interprétative de la traduction, quant à elle, se démarque clairement de cette approche. Elle établit une distinction terminologique entre « correspondance » et « équivalence », réservant ce dernier terme pour qualifier le discours. Alors que les correspondances, appelées « équivalences » dans les théories linguistiques, s’appliquent à la langue hors de tout contexte discursif, l’équivalence, selon la théorie interprétative de la traduction, prend en compte la créativité du traducteur et intègre le génie de la langue qui fait qu’il « fabrique » des phrases dans sa langue de façon intuitive et naturelle au fil des exigences de la communication, tout en en respectant les normes. Ce « maniement réflexe » (Lederer 1994 : 62), qui est occulté par les théories linguistiques, est pourtant crucial pour la réexpression du sens compris. Il donne au traducteur une marge de liberté créatrice pour choisir les mots et reconstituer le sens, et permet de trouver une équivalence autant de contenu que de forme. Comme le souligne Lederer :

Comme tout sujet parlant, l’auteur s’exprime en avançant les mots qui font comprendre ses idées. Il appartient au traducteur de faire de même, de formuler dans sa propre langue et selon son propre talent les idées qu’il doit faire comprendre et les sentiments qu’il doit faire ressentir. Un texte écrit dans une langue conforme à son « génie » appelle dans l’autre langue un texte écrit lui aussi dans son « génie ».

Lederer 1994 : 63

En effet, lorsqu’il fait siennes les idées du texte, les choix du traducteur qui sont purement subjectifs peuvent être basés sur des habitudes qui lui sont propres : il peut privilégier certains mots, styles, tournures de phrases pour produire un équivalent, en utilisant au maximum les ressources de la langue d’arrivée. Cette liberté créative conférée au traducteur lors de l’opération de réexpression n’est restreinte que par l’exigence de recherche de l’équivalence, cadre dans lequel doit se déployer sa créativité et le maniement intuitif de sa langue. Toujours selon Lederer : « S’agissant du génie de la langue, toutes les inventions individuelles restent possibles tant que l’autochtone reconnaît le texte comme étant dans sa langue » (Lederer 1994 : 63). Illustrons cela en prenant un exemple du film Gone with the Wind, et de la VD en français Autant en emporte le vent. La guerre entre les troupes nordistes et sudistes fait rage. Dans cette séquence, le docteur Mead a organisé une soirée dansante dont l’objet est de récolter des fonds pour soutenir l’armée confédérée. Pour ce faire, il annonce aux invités que tous ceux qui veulent ouvrir le bal avec la cavalière de leur choix doivent miser aux enchères en donnant le nom de la belle choisie et la somme proposée pour avoir la faveur d’ouvrir le bal avec elle. Cette situation est inattendue et les hommes font preuve de timidité. Aussi le docteur Mead les encourage-t-il :

Docteur Mead

Come on gentlemen, do I hear your bids ? Make your offers, don’t be bashful !

Allons messieurs, ai-je entendu vos offres ? Faites vos offres, ne soyez pas timides ! (correspondance)

Allons messieurs, un peu d’audace, faites-moi vos offres. Pas de fausse pudeur ! (version doublée, équivalence)

Gone with the Wind, séquence 384

On peut remarquer que le traducteur a évité de coller aux mots. Le terme bashful signifie timide, mais dans ce contexte précis, il s’agissait moins de timidité que de pudeur. En se libérant de l’emprise de la langue originale, le traducteur a retrouvé en français la spontanéité naturelle avec laquelle un locuteur natif du français s’exprimerait dans cette circonstance précise, ce qui rend le texte de doublage tout à fait naturel et spontané.

Cet exemple illustre le fait que si la traduction s’établissait sur le plan linguistique, le message serait flou et mal perçu par le spectateur destinataire. Dans ce cas-ci, le texte de doublage transmet l’information donnée (équivalence dénotative), respecte le style, le langage du docteur Mead est châtié, enjoué et correct (équivalence connotative). Enfin, le doublage est conforme au genre, c’est‑à‑dire une conversation cinématographique qui respecte la forme d’expression spécifique au dialogue de film. Cette démarche s’oppose à celle préconisée par la quasi-totalité des théories issues de la linguistique, lesquelles envisagent l’équivalence comme une donnée intrinsèque au texte à traduire, c’est‑à‑dire que ce dernier contiendrait en lui-même un potentiel d’équivalence à différents niveaux, indépendamment de la personne qui établit cette équivalence.

Pym (1992 : 39) relève trois constantes relatives à l’équivalence telle qu’elle apparaît dans les théories linguistiques de la traduction :

  1. l’équivalence s’applique uniquement au texte d’arrivée ;

  2. elle est unidirectionnelle (on traduit toujours dans un sens) ;

  3. elle est dépourvue de « sujet » (le sujet traduisant est absent et omis).

2. L’équivalence selon la théorie interprétative de la traduction

La différence entre la notion d’équivalence en linguistique et celle qui est mise de l’avant dans la théorie interprétative tient au fait que la seconde envisage la traduction du point de vue du mécanisme intellectuel qui la met en oeuvre et non de son résultat. Elle ajoute une phase intermédiaire à l’opération de substitution, la phase d’interprétation, et réintègre le sujet traduisant, d’où l’importance de la notion concomitante de « recréation ». Quelles que soient la nature et les modalités de l’équivalence, la substitution n’est plus directe, mais indirecte, et passe par la personne du sujet traduisant. La théorie interprétative de la traduction base sa définition de la notion d’équivalence sur deux critères fondamentaux : la conformité au sens et la conformité au style naturel et spontané de la langue de traduction. Le premier critère juge de l’exactitude de la traduction, le deuxième de son intelligibilité. La théorie interprétative se distingue par rapport au troisième critère de la caractérisation de l’équivalence par Pym. En établissant que l’interprétation est le fruit du perçu et du su, cette théorie vient ajouter aux éléments linguistiques des éléments cognitifs situés hors du texte, mais faisant partie de l’expérience du traducteur au moment où il traduit. Ainsi, l’équivalence n’est plus une donnée préétablie à un niveau quelconque du texte, elle se formule dans le hic et nunc de chaque situation donnée, selon le choix intelligent du traducteur. Cela explique pourquoi deux traductions faites par deux traducteurs différents peuvent ne pas être identiques sur le plan des mots, tout en étant équivalentes sur le plan du sens.

3. L’équivalence en doublage cinématographique

En doublage cinématographique, on ne se limite pas à la seule connaissance de certains paramètres relatifs au film et à l’environnement économique qui influence sa diffusion internationale. Le traducteur doit aussi comprendre le vouloir-dire du réalisateur, son projet de communication et les éventuelles implications de chaque réplique dans le milieu sociolinguistique où sera distribuée la version doublée du film. Alors que la démarche du traducteur qui traduit un texte écrit se limite à la seule compréhension du sens, le traducteur de film doit, de plus, comprendre les codes de l’image (par exemple, lorsqu’un personnage est en gros plan, il ne traduit pas de la même manière que si le personnage a le dos tourné à la caméra, les points de synchronisme n’étant plus les mêmes). En effet, la démarche du traducteur audiovisuel intègre le fait que le texte à traduire pour le doublage concerne à la fois l’audio et le visuel. Il doit reproduire le sens en tenant compte de l’image et du son, lequel sera produit en auditorium pour la version doublée.

C’est cette démarche d’ajustement constant qui amène le traducteur à traduire d’une certaine manière pour rechercher l’équivalence du film original, qui va produire sur le nouveau public le même effet que sur le public de départ. On ne peut par conséquent plus limiter le doublage à la reformulation classique qui se contente de produire un texte de substitution, c’est à une véritable opération de recréation que se livre le traducteur à la recherche de l’équivalence sous ses multiples facettes.

3.1. L’équivalence phonétique

Commençons par distinguer le transcodage au sens positif du terme. Il s’agit d’un procédé couramment utilisé qui vise à rétablir, par la similitude de forme, la recherche de l’équilibre entre le sens et le synchronisme en version doublée, et qui s’applique notamment aux vocables monosémiques (noms des personnages, noms des villes, grades dans l’armée, etc.). C’est une démarche volontaire et intelligente du traducteur. Elle est différente du transcodage au sens négatif du terme qui est une faute de traduction et un transfert abusif de la forme de la version originale sur la version doublée. Notons aussi que, par souci de synchronisme, et parfois au mépris du sens du film, certains traducteurs cinématographiques calquent la structure morphosyntaxique du texte doublé sur la version originale du film, ce qui donne des traductions aberrantes[1]. Ainsi, c’est ce souci de coller à la forme de la langue de départ, pour faciliter la synchronisation, qui aurait amené le traducteur de Gone with the Wind à traduire Union par union au lieu de confédération :

Gérald

T’was the sovereign right of the sovereign state of Georgia to secede from the Union.

L’État de la Géorgie avait formellement le droit de se séparer de l’union.

Gone with the Wind, séquence 97

La difficulté de l’équivalence en doublage vient non seulement du fait que les mots des deux langues n’ont pas la même surface phonique et conceptuelle, mais aussi du fait qu’il faut accorder entre elles, selon leurs propres règles, les unités lexicales de la langue d’arrivée.

En raison des différences structurales entre les langues, la recherche de l’équivalence phonétique est une opération assez complexe. Lorsqu’il inscrit son texte sur la bande de détection, le traducteur devrait, autant que possible, trouver des équivalents phonétiques français aux ouvertures et fermetures labiales de la version originale. À titre d’exemple, si nous prenons cette question du déserteur yankee dans Gone with the Wind : « Y’got anything besides these earbobs ? », serait-il possible de trouver en français des correspondants phonétiques conformes aux ouvertures et aux fermetures labiales tout en respectant le sens ? Bien qu’équivalente au plan du sens, la traduction proposée par Caillé : « Vous n’avez rien d’autre en dehors de ces babioles ? » n’est pas un modèle d’équivalence phonétique. L’absence d’équivalence phonétique peut aussi se révéler évidente dans la réexpression des exclamations et des onomatopées.

3.1.1 Les exclamations

L’une des difficultés les plus fréquentes dans la traduction d’un dialogue de film est de trouver des équivalences acceptables pour les exclamations, les interjections et les onomatopées. Ainsi, la signification des exclamations varie selon le contexte et l’intonation. Pour ce qui est plus précisément du doublage de l’anglais en français, on constate qu’il n’est pas toujours possible de transcrire les deux exclamations les plus fréquentes et qui s’écrivent de la même manière dans les deux langues : ah/ah et oh/oh. En général, dans les deux langues, oh/oh exprime le plaisir[2], l’étonnement[3] et la réprobation[4]. Alors qu’en anglais on pourrait employer oh pour marquer la surprise[5], l’admiration, l’impatience, le scandale[6], ou le regret, le français choisira plutôt ah : « Ah ! Ils ne peuvent donc pas marcher plus vite ! », « Ah, quel scandale ! ». Pour exprimer la douleur[7], le français choisira plutôt ah : « Ah, quel violent coup ! »

Pour l’expression de la douleur, l’anglais dispose de ouch ! ou de oh oh !, principalement pour les coups reçus, et le français de aïe ! et de ouille ! Comme on peut le constater, ces exclamations, bien qu’équivalentes, ne garantissent pas toujours le synchronisme. Il arrive que pour contourner ce problème, le traducteur inscrive sur la bande de détection la même exclamation qu’en anglais. Mais il faut avoir l’oreille particulièrement attentive et pouvoir lire sur les lèvres pour constater l’asynchronie culturelle entre une exclamation française superposée à un geste et une expression typiquement américaine.

3.1.2 Les onomatopées et les jurons

Les onomatopées sont aussi assez courantes dans les dialogues en anglais, mais n’ont pas toujours des équivalents évidents en français. À titre d’exemple, dans All Saints, les Heu ! Heu ! Heu ! sont de véritables chevilles du discours soutenues par l’image. Ho ! Ho ! Ho !, qui est le cri poussé par le charretier pour faire partir ou arrêter les bêtes, mais aussi par le cavalier pour arrêter son cheval ou pour le calmer lorsqu’il est nerveux, pose un réel problème de synchronisation en français. La plupart des traducteurs de doublage les reconduisent dans la langue d’arrivée, surtout lorsque la caméra ne fait pas un gros plan sur le visage de l’acteur qui émet ce son.

Le film américain en général est aussi particulièrement riche en jurons et exclamations que le traducteur français essaie de rendre à sa manière et selon le contexte. Par exemple, Dam the Yankees Maudits Yankees (Scarlett, Gone with the Wind, séquence 63). Ainsi, le juron son of a bitch peut-il être traduit selon le contexte par fils de pute, putain, diable, etc. Fuck peut être traduit par merde. Fuck est le juron ou l’injure passe-partout dans le dialogue cinématographique américain. Par exemple :

Don’t fuck up with me.

N’me fait pas chier.

Rambo II

Any time he fucks up, you will pay for him. 

Chaque fois qu’il fera des conneries, vous paierez à sa place.

Full Metal Jacket

Il y a aussi d’autres jurons qu’on retrouve très souvent dans les films d’action : bullshit / mon cul, hell / diable ou mon Dieu, you really look like an asshole / tu ressembles vraiment à un trou du cul (Full Metal Jacket).

Ces quelques exemples donnent une idée des difficultés auxquelles se heurte le traducteur cinématographique lorsqu’il doit traduire les onomatopées et les jurons. C’est pourquoi nous estimons que la volonté de respecter pied pour pied tous les sons anglais est illusoire. En effet, la quête de l’équivalence synchronique et phonétique est un exercice harassant d’approximation et de recherche de sons faisant illusion, c’est-à-dire les plus proches possible des sons anglais. L’art du doublage est en effet entièrement construit sur l’effet d’illusion. Il n’existe pas de « synchromètre » pour mesurer les « écarts de synchronisation », raison pour laquelle le traducteur essaie de se rapprocher autant que possible du son anglais pour éviter de laisser paraître un déphasage flagrant entre la bouche et le son qu’elle émet.

3.2 L’équivalence syntaxique

L’exigence de synchronisme impose au traducteur de trouver en français une réplique équivalente à celle du dialogue de départ, sur les plans tant sémantique que syntaxique. L’exigence de synchronisme veut que l’espace d’écriture sur la bande de détection soit le plus conforme possible à celui du texte en VO : on pourrait presque parler d’une sorte de correspondance d’homothétie (notion de géométrie dont le principe consiste à faire correspondre à tout point M un point M’) de deux figures syntaxiques équivalentes sur le plan des signifiants et du sens, calquées de part et d’autre de l’axe de la traduction. Cette correspondance syntaxique est d’autant plus importante qu’une réplique courte ou longue par rapport à la VO est vite perçue par le spectateur attentif aux mouvements labiaux. Dans l’idéal, cette loi devrait s’opérer de manière absolue : une réplique de cinq syllabes devrait être rendue par une réplique française de cinq syllabes avec des points de chute identiques. Une espace devrait être rendue par une espace blanche située entre les mêmes espaces d’écriture sur la bande de détection et dans le texte dit sur le plateau de doublage. L’axe vertical de chaque figure du texte en VO devrait comporter la même succession de formes : une réplique longue serait rendue par une réplique longue, un poème en prose par un poème en prose, un monologue par un monologue, tout en respectant rigoureusement les intervalles, bref une sorte de décalque grandeur nature sur le dialogue en VO. Ce type de correspondance syntaxique pied par pied, intervalle par intervalle, ne peut être possible que si les occurrences recouvrent dans les deux langues le même espace, si les mots sont d’égale longueur et recouvrent les mêmes espaces de signification. Or, très souvent, il n’en est rien. La difficulté d’équivalence vient non seulement du fait que les mots des deux langues n’ont pas la même surface conceptuelle, mais aussi de ce qu’il faut accorder point par point le son et le sens qui correspondent aux unités lexicales et phoniques de la VO et de la VD. Si déjà, en traduction, cette dynamique est gouvernée par la présence d’une forme de départ par rapport à laquelle il faut mesurer les limites que l’écart ne saurait dépasser, que dire du doublage dont l’équivalence doit s’établir non seulement sur le plan de la syntaxe et du sens brut, mais aussi sur le plan de l’équivalence dans la qualité des voix qui mettront en bouche le texte écrit sur la bande par le traducteur ?

Le zozotement des voix, l’intonation, le rythme, le débit sont autant d’éléments qui compliquent l’opération de production de l’équivalence syntaxique. Prenons cet exemple tiré de Autant en emporte le vent, dans lequel Scarlett s’adresse à Pork :

Scarlett

I’m starving, Pork, get me something to eat.

Je meurs de faim, Pork, prépare-moi quelque chose.

Gone with the Wind, séquence 273

Cette phrase ne pose aucun problème de compréhension, même hors contexte. Pourtant, la recherche de l’équivalence sur le plan du sens et de la syntaxe a sûrement amené le traducteur à retourner la phrase dans tous les sens à partir de l’idée de « donne-moi quelque chose à manger » pour aboutir à la formulation retenue. On peut constater que si la phrase anglaise exprime clairement et explicitement l’idée de faim intense (starving) et celle de manger (to eat), la réplique française se contente d’exprimer la première et de rendre la seconde par l’implicite.

Le respect de la surface syntaxique et le positionnement de l’équivalence syntaxique, perçue par l’oeil à l’écran et par l’oreille à l’audition, ne sont nullement absolus ni inviolables. On remarque aussi qu’entre I’m starving et Pork il y a un léger silence qui ajoute à l’ambiance un surcroît de morosité. Ainsi, la correspondance syntaxique stricte et absolue relèverait de l’idéal, chaque réplique traduite fondant son insertion dans la langue de doublage sur le délaissement ou la modification de l’espace syntaxique originel. Chaque réplique revit sur la base d’une autre démarche mentale et culturelle, d’une autre coupe, d’une autre respiration, et les compléments cognitifs permettent de créer un autre texte équivalent sur le plan du sens, mais pas forcément au plan de la surface syntaxique. La réexpression du texte de doublage n’étant pas préfigurée par les signes graphiques du texte en version originale, la perception graphique du nouveau texte sur la bande de détection impose aussi, synchronisme oblige, une sorte de statut poétique de l’espace, une sorte de décompte syllabique discret qui assure que le texte de doublage ne sera ni trop long ni trop court par rapport au texte de la version originale, ce qui crée une nouvelle architecture conceptuelle de la réplique en français. Cependant, la superficie des répliques ne réside pas seulement dans la succession de masses verticales inscrites sur la bande mère. Elle réside aussi dans le choix des coupures, des lieux de respiration, des raclements de gorge et des hésitations qui ne figurent pas dans le texte écrit, mais que le traducteur doit inscrire sur la bande pour servir de balise au directeur de plateau et à l’acteur qui vocalisera le texte sur le plateau de doublage.

3.3 L’équivalence artistique

Au-delà de l’équivalence phonétique et syntaxique, la justesse du doublage se mesure aussi à l’équivalence artistique, c’est-à-dire à la capacité des voix de doublage à rendre l’équivalent de l’effet véhiculé par la voix originale. Cette équivalence s’étend parfois aux mimiques, aux hésitations et aux expressions du visage communiquant des informations véhiculées en surimpression sur la voix. Il est impératif que la voix française produise une réplique qui rende compte, par le son, de toute la palette d’expressions exprimées par la voix originale, y compris les hésitations. L’équivalence artistique est d’autant plus importante que le dialogue filmique est écrit selon les règles conversationnelles de la langue du scénariste ou du réalisateur qui sont ainsi transférées dans le film, règles qui varient d’une société à l’autre, et qui varient aussi au sein d’une même société, selon l’âge, le sexe, l’origine sociale ou géographique des locuteurs ainsi que leur personnalité. Par exemple, dans Gone with the Wind, la différence de comportement et de diction est nettement marquée entre Mammy, qui est une domestique, et Madame O’Hara. Cette différence, liée à la classe sociale des personnages, se répercute dans différents aspects de l’expression conversationnelle : diction nette et claire chez Madame O’Hara, diction saccadée et marmonnée chez les « darkies » et les domestiques. Dans ce cas précis, les règles conversationnelles indiquent la place de chacun dans la hiérarchie sociale, et les voix de doublage ne sauraient par exemple coller une voix de « negro » sur un personnage « blanc », ou mettre une voix mâle sur un personnage féminin. L’équivalence artistique de sens s’étend au respect du genre, de la hiérarchie sociale et même des attitudes (manière de rire, d’exprimer la colère, etc.) liées au statut social du personnage à doubler, et qui impose que la voix équivalente respecte aussi les comportements paralinguistiques ou paraverbaux tels que la diction, ce qui inclut le débit, la prononciation, et l’intonation.

3.4 L’équivalence vocale

Lorsqu’il établit la distribution (casting), le directeur de plateau ne recherche pas forcément chez le comédien de doublage une voix identique, située sur la même gamme ou sur le même registre vocal que la voix originale. Multiple, complexe, recomposable, la voix est l’un des instruments les plus manipulables qui soient. Si, par exemple, l’acteur de la VO a une voix grave et gutturale comme celle du docteur Mead dans Gone with the Wind, ou une voix fluette et mélodieuse comme celle de Mélanie, il n’est pas indispensable que son équivalent vocal français soit aussi une voix grave et gutturale ou fluette et mélodieuse. L’équivalence artistique se mesure moins à la similitude articulatoire des voix qu’à la capacité de la voix de doublage à reconduire en français les mêmes effets, pourvu qu’elle ne soit pas trop éloignée de la gamme musicale de la voix originale. L’équivalence artistique se situe davantage sur le plan du jeu et de la concordance vocale, et on attend du doubleur français qu’il mette au service du texte une voix qui « tienne la route », comme disent les directeurs de plateau : elle doit être la plus vraisemblable possible par rapport à l’image originale, et le synchronisme acteur américain / voix française doit paraître juste à l’oeil et à l’oreille du spectateur français. La recherche de l’équivalence vocale résulte, jusqu’à un certain point, d’un tâtonnement : le directeur de plateau sait d’expérience quelle voix conviendra. Il sait d’instinct quelle voix il recherche, il ne peut la décrire avec précision, mais dès qu’elle résonne, il la reconnaît sur-le-champ.

C’est en fait un exercice similaire à celui de la recherche du « point de cri »[8] qui est l’un des classiques du film d’horreur et qu’on retrouve dans Psycho (Psychose pour la version française) de Hitchcock et dans Blow Out de De Palma. Dans Blow Out, la séquence de recherche du point de cri met en scène une femme qui prend une douche. Quelqu’un écarte les rideaux et brandit un couteau. La femme hésite, puis hurle à perdre haleine. Tout le film est basé sur la recherche du cri convaincant à synchroniser à l’image. Or, lorsque la caméra subjective filmant le tueur qui rode et que le rideau s’ouvre, il est évident, sur le plan purement artistique, que le cri mis en scène est ridicule. C’est un cri d’horreur hurlé, non artistique. Chargé de « recruter » le « cri », Jack (joué par John Travolta) trouve six jeunes filles et leur demande de crier. Tous les cris sont ridicules, inacceptables. Finalement, le bon cri, le cri artistique recherché, le cri équivalent ne sera « récolté » qu’à la fin du film, lorsque Sally se fait égorger par le tueur en série.

La recherche de la voix de doublage équivalente à la voix originale procède d’une démarche similaire : il s’agit de trouver la voix « V », non identique à la voix originale, mais équivalente sur le plan de l’expressivité, de la sensibilité émotive et de son aptitude à accrocher l’image, capable de coller au corps qui parle à l’écran sans laisser l’impression de « patchwork » et d’artificialité qui se dégage de certains films (certains films chinois, notamment, sont doublés à la hâte par deux ou trois acteurs et la même voix féminine fait la mère, la fille, la tante et la prostituée). Dans Gone with the Wind, on peut remarquer que la voix française de Scarlett est plus vivante, plus « bondissante » que la voix originale. En fonction du contexte d’énonciation, du rang social des acteurs et de la distribution vocale, l’équivalence vocale, dans ce film, s’établit sur deux grands plans : la diction, qui recouvre les notions d’articulation, de prononciation et de débit, et l’intonation vocale.

3.4.1 La diction

3.4.1.1 La prononciation

La prononciation est à l’image de la langue : elle peut être populaire, vulgaire, châtiée, pédante, etc. Elle peut ainsi révéler une facette de la personnalité de l’acteur, elle peut être familière (Prissy, Pork, Mammy) ou distinguée (le docteur Mead, Scarlett, Helen). La prononciation renseigne aussi sur l’appartenance régionale en ce sens qu’elle est à l’origine des accents. La question de l’équivalence de prononciation fait l’objet d’intenses débats dans les milieux du doublage. Les personnages de second plan (domestiques, gardiens) sont souvent d’origine modeste et leur prononciation reflète cette origine. Dans Gone with the Wind, on constate que cette différence de prononciation est nettement marquée entre Rhett et Prissy.

Prissy

Capt’n Butler !

Capt’n Butler !

Sophisticated lady

What’s all this about ?

Qu’est-ce que c’est que ce remue-ménage ?

Prissy

I got a message for Capt’n Butler. Capt’n Butler, you come on ya in the street to me !

C’est pour le Capitaine Butler. Capt’n Butler, il faut absolument que vous descendiez me parler.

Rhett

What is it Prissy ?

Qu’y a-t-il Prissy ?

Prissy

Miss Scarlett sent me to ya. Miss Melly don have her baby today ! A fine baby boy. And missi Scarlett and me, we brow it !

Ma’a Scarlett m’a envoyé vous chercher. Ma’am Melly, elle a eu un bébé tout à l’heure. Un gentil petit bonhomme…

Gone with the Wind, séquence 187

Du point de vue de l’esthétique cinématographique, la caméra en contre-plongée suggère la différence sociale entre Rhett et Prissy. On remarque que la voix de Prissy est marmonnée, les ouvertures et fermetures sont malmenées en comparaison de celle de Rhett qui est calme, posée, avec une diction claire et limpide. La question de l’équivalence de prononciation se pose lorsqu’en traduisant, le traducteur se représente mentalement la voix qui donnera vie aux répliques de Prissy et de Rhett. À l’évidence, la prononciation du vernaculaire noir américain est pratiquement incompréhensible, même pour certains Américains non habitués aux accents du sud des États-Unis, accents péjorativement baptisés « accent petit-nègre », et le texte de doublage serait pratiquement incompréhensible si la version française était aussi régionalement marquée. En français, par exemple, les accents consignés dans les dictionnaires sont marqués selon les régions : l’accent méridional est fortement articulé, mais prononcé de façon originale (pain/pèng, paume/pomme, forêt/foré), l’accent parisien est aussi marqué (une reube, la gâre, esprès), les gens du Midi ont tendance à produire des nasalisations anormales (an-nées, grammaire/grand-mère), etc. Une voix équivalente est une voix qui est aussi marquée, d’une manière ou d’une autre, que la voix originale (sautillante et nasalisée comme celle de Prissy, par exemple).

La recherche de l’équivalence vocale sur le plan de la prononciation n’implique pas la concordance exacte d’une prononciation située sur la même gamme vocale que la prononciation anglaise, mais bien plutôt une prononciation française donnant au texte français la juste réplique articulatoire qui soit synchrone à l’image sans laisser d’impression de déphasage ou d’artificialité entre l’image et le texte français. Pour produire une telle symbiose image/voix, il est souhaitable que le traducteur s’astreigne à lire à haute voix les répliques écrites sur la bande rythmographique (dite bande rythmo). Il doit bien détacher les syllabes, étudier les liaisons, vérifier la nature des « e » et « h » pour donner à son texte toutes les chances d’être vocalisé sans trop de modifications. C’est à un véritable exercice d’élocution que se livrent la plupart des traducteurs que nous avons rencontrés en France. À telle enseigne que parfois, en fin de journée, le traducteur affiche une fatigue similaire à celle d’un orateur qui aurait débité cinq à six heures de discours. Chaque mot inscrit sur la bande est d’abord vocalement simulé, expérimenté, et, selon la réaction de l’interlocuteur, l’image et le synchronisme, le traducteur s’ajuste, adapte son texte pour le rendre artistiquement équivalent.

3.4.1.2 Le débit

Le débit donne la mesure de la vitesse à laquelle les acteurs à l’écran parlent. Il est évalué en nombre de mots prononcés par minute. Selon Chion (1982 : 76), le débit moyen, en français, est de 120 à 160 mots par minute. La vitesse d’élocution varie considérablement d’une société à l’autre et même d’un sexe à l’autre. Cependant, selon Kerbrat Orecchioni (1994 : 16), l’existence de tendances moyennes est admise : ainsi, en moyenne, les Italiens parlent plus vite que les Français, lesquels parlent plus vite que les Suisses. Le débit est aussi fonction de l’état d’esprit de l’acteur. La question de l’équivalence vocale se pose d’autant plus que le débit est en grande partie responsable de la justesse du synchronisme syntaxique (selon que la VD s’achève avant ou après la VO). Rappelons aussi que le débit concrétise ou renforce la charge affective des paroles. S’il est lent et calme, il peut conférer autorité, solennité, ou gravité, comme dans le cas du docteur Mead lorsqu’il donne la liste des soldats tombés au front.

Dans l’exemple du dialogue entre Rhett et Prissy, le débit d’élocution de Prissy est rapide et saccadé. Pour le doublage de cette séquence, la voix française ne peut évidemment être ni claire, ni posée. Cependant, il n’est pas indispensable qu’elle comporte exactement le même nombre de mots que le texte anglais, d’autant que les pauses et les mouvements corporels jouent un rôle important en matière de recherche d’équivalence (sur le plan du synchronisme syntaxique). Une version française vivante, alerte et rapide, mais ponctuée de brèves pauses, facilite la compréhension. Le silence donne du relief et de la vigueur aux mots qu’il encadre. Prenons la réplique suivante d’Ashley :

Ashley

Most of the miseries of the world were caused by wars, and when the wars were over, no one ever knew what they were about.

La plupart des misères de ce monde sont causées par les guerres. Et quand les guerres sont finies, nul ne sait quels en furent les motifs.

Gone with the Wind, séquence 237

Cette phrase est proférée de manière sentencieuse. Chaque mot est pesé, les silences et la distribution des pauses donnent de l’épaisseur aux propos. Pour s’entraîner à bien distribuer les pauses et produire un texte français équivalent, sur le plan vocal, au texte anglais, le traducteur marque les pauses par des traits obliques (pauses brèves/pauses longues). Cela lui permet de mieux discerner les contours de la voix et de poser les balises à l’intention du directeur artistique. Voici deux exemples de « jeu » réalisable avec les pauses à partir de la réplique d’Ashley.

Ashely, S1

La plupart des misères de ce monde / sont toujours causées par les guerres / et quand les guerres sont finies / nul ne sait quels en furent les motifs.

Ashley, S2

La plupart des misères de ce monde sont toujours causées par les guerres / et quand les guerres sont finies nul ne sait quels en furent les motifs.

Les pauses de la phrase S1 (retenues par les traducteurs de Gone with the Wind) renseignent sur la bonne maîtrise du discours par l’acteur de doublage. Dans la phrase S2, par contre, l’harmonie est malencontreuse, une seule pause de respiration ne donne pas la mesure de l’importance de chaque groupe de mots et l’équilibre est rompu entre le gros plan sur le visage d’Ashley et la réplique. Dans cette séquence, Ashley a un débit lent et hésitant, et les répliques sont parfois à la limite d’une équivalence acceptable. Dans un article paru dans Le film français, Dumoulin explique que la raison de ce changement tient au fait que, lors du doublage, trois acteurs français ayant des traits vocaux différents avaient prêté leur voix à Ashley (Dumoulin 1978[9]). Or, toutes n’étaient pas à la mesure de la performance artistique requise, provoquant ainsi une sorte de déphasage entre la voix française et le corps de l’acteur américain. La synchronie entre la voix et le corps de l’acteur est d’autant plus importante en équivalence de doublage que le débit et la distribution des pauses forment la ponctuation du discours oral : ils soulignent le cours de la pensée, renseignent sur la vie intérieure de l’idée et le sens profond que véhiculent les variations du débit vocal.

3.4.1.3 L’intonation

L’intonation est la courbe mélodique obtenue par variation de la hauteur de la voix. Elle est affaire de sentiment, de compréhension et de conviction. Du fait que l’intonation joue un rôle décisif dans les relations entre les personnages, le doubleur doit pouvoir rendre en français une intonation qui produise le même effet que l’intonation anglaise. En effet, l’intonation porte une bonne partie du sens, autrement dit un même mot peut se charger d’un sens différent par le simple fait de l’intonation. Fille du caractère et des humeurs, l’intonation véhicule le dédain et le mépris (séquence 137 de Gone with the Wind, lorsque la prostituée s’approche de Mélanie pour lui remettre sa contribution à l’effort de guerre), la lassitude (Scarlett, dans la séquence 126 : « I don’t known Mammy, I don’t know »), l’agacement (Scarlett à Rhett dans leur appartement de campagne, séquence 406 : « Oh yes, yes, if you want it »). Une simple altération du ton peut donner un tour ironique ou moqueur à la pensée.

Par exemple, l’intonation de Rhett est généralement arrogante, cassante, ironique ou moqueuse, celle du docteur Mead est plus pondérée, courtoise et affectueuse, celle de Mélanie est aimante, accueillante, douce. La recherche de l’équivalence artistique est intimement liée à la production d’une intonation juste et appropriée, qui peut ne pas être située sur la même gamme, mais qui doit produire le même effet dans la VD. Par exemple, l’intonation de la voix française de Rhett est aussi cassante que la voix anglaise ; Mélanie est aussi aimante et affectueuse, etc. En revanche, les critiques ont été unanimes pour dire que l’intonation de la voix française de Scarlett est parfois un ton au-dessous de la voix anglaise (Jeancolas 1995). Elle s’apparente parfois plus à celle d’une jeune fille qu’à celle d’une dame.

Lorsqu’on assiste en direct à un doublage en auditorium, on constate la place primordiale qu’occupe la gestion des intonations dans la recherche de l’équivalence artistique. Conscients de l’importance de l’effet de l’intonation sur le sens, qui peut être faussé par une intonation mal placée ou ratée, les directeurs de plateau prennent le temps qu’il faut (dans les films à gros budget) pour trouver le ton juste, demandant aux acteurs de reprendre autant de fois qu’il est nécessaire. Prenons l’exemple d’une séquence de la série télévisée Scarlett, la suite de Gone with the Wind. Nous avons assisté à son doublage dans les studios de l’Européenne de doublage en banlieue parisienne. Lord Fenton et Scarlett sont dans la cuisine, Scarlett sert le champagne :

Fenton

You are a source of constant astonishment, Scarlett.

Hhum ! Vous êtes sans cesse une source d’étonnement, Scarlett.

Scarlett

Why’s that ?

Pourquoi donc ?

Fenton

Well, surely, you must realize that never, in all my experience, have I been served champagne by a beautiful woman – or anyone else, for that matter – whilst standing in a kitchen.

(Hhm) Vous devez sûrement vous rendre compte que jamais dans toute mon existence, une jolie femme ne m’a servi une coupe de champagne (hh), ni d’ailleurs quelqu’un d’autre, debout et qui plus est dans une cuisine.

Scarlett

Have a seat, then.

Eh bien, asseyez-vous.

Scarlett, séquence 243

Dans cette séquence, toutes les composantes de l’expression orale sont mises au service de l’intonation : le débit est ralenti, les pauses sont judicieusement distribuées, l’articulation est syllabante, la hauteur de la voix est montée et le timbre chargé. Pour bien cerner l’intonation équivalente au moment de la réexpression, il faut absolument éviter la monotonie vocale, il faut faire parler les acteurs comme un locuteur francophone parlerait en situation d’interaction verbale normale.

On remarque aussi que l’acteur américain parle avec un ton descendant sans soutenir la finale de la phrase. C’est une caractéristique du dialogue en anglais, et le spectateur américain trouve cela tout à fait normal. L’équivalent français remet le texte dans le système conversationnel français qui veut qu’on accentue modérément la finale. En effet, parler haut en terminant bas est un réflexe qui s’acquiert à l’école avec l’exercice de récitation ou celui de l’apprentissage par coeur (genre théorèmes ou tables de multiplication, style 2 x 3 = 6). Ici, on remarque aussi que l’équivalence d’intonation s’obtient en jouant sur la rapidité, la longueur, la brutalité, la lenteur et la souplesse des ouvrantes (a, i, é, è, etc.) et des fermantes (o, u, Ɔ, etc.). De manière générale, toute impression de monotonie entraîne l’arrêt immédiat de l’enregistrement vocal par le directeur de plateau, raison pour laquelle les traducteurs recherchent l’intonation équivalente en se représentant les intonations sur deux grands registres : l’insistance (cela revient à articuler nettement les consonnes et à ouvrir intensément les voyelles) et l’intonation affective qui recherche la fibre sensible des cordes vocales qui rendrait le mieux l’émotion, la sincérité, la passion, etc.

4. Équivalence de sens et fonctionnalité en doublage

Qu’il s’agisse de l’équivalence sur le plan phonétique, syntaxique ou artistique (débit, intonation, etc.), la recherche de l’équivalence en doublage a un but essentiellement fonctionnel et découle du contexte et du dynamisme qui, eux aussi, dépendent du type de film, des objectifs de la traduction et des contraintes de la langue et du destinataire. Tout cela aboutit à l’équivalence de sens qui englobe l’équivalence phonétique, syntaxique, artistique et fonctionnelle. Le sens regroupe dans son exigence toutes ces variantes et toutes les interactions sonores et verbales. Par rapport à ces éléments, on est en droit de se demander si, en fin de compte, l’équivalence est toujours la même, si elle se manifeste toujours de la même manière, ou si elle revêt des formes différentes selon les cas. Soit l’exemple suivant :

Rhett

I apologise again for my shortcomings.

J’exprime de nouveau mes regrets pour mes propos trop francs.

Gone with the Wind, séquence 146

Rappelons que Rhett s’excuse ainsi, après une passe d’armes verbale avec Charles Hamilton, qui a failli dégénérer parce qu’il a osé dire que l’armée du Nord est mieux équipée que celle du Sud. À première vue, cette traduction pourrait sembler inexacte ou infidèle. Dans la VO, l’accent est mis sur le mot shortcomings. Dans la VD, le traducteur a reporté l’accent sur l’expression propos trop francs qui, par rapport au contexte d’énonciation et aux protagonistes, exprime parfaitement l’équivalent du sens de la version originale. En effet, la tension est due au fait que Rhett a tenu à l’assistance des propos « trop francs » sur le potentiel militaire des forces du Sud et du Nord prêtes à s’affronter. L’original a été traduit en français avec des moyens différents, mais l’effet d’ensemble est équivalent pour le spectateur français.

Ainsi, le doublage cinématographique pose des problèmes particuliers au traducteur tout en offrant un cadre idéal de recherches d’équivalences contextuelles liées à l’image qui soutient et oriente le script, au type de langage employé (argot, jeux de mots, spontanéité de l’oral, etc.), au type de public visé (enfants, grand public), etc. Par ailleurs, le traducteur doit veiller à ce que son texte de doublage accompagne et soutienne l’image, même si c’est parfois en légère contradiction avec les mots de l’original.

5. Conclusion

En conclusion, la recherche de l’équivalence du sens et du son, indissociables, impose au traducteur audiovisuel de travailler en tenant compte de leurs interactions, en ayant recours à des négociations et à différents compromis. On ne pourrait traduire Gone with the Wind de la même manière qu’un film de guerre, un documentaire scientifique, un dessin animé pour enfants, un film mélodramatique, etc. Pour chaque type de traduction, et pour chaque réplique, par rapport aux protagonistes et à la fonctionnalité de la traduction, une stratégie est à définir, qui guidera le traducteur doubleur dans ses choix et l’aidera à demeurer fidèle au sens et au son du film. La complexité des variables explique non seulement les différentes stratégies appliquées par le traducteur, mais aussi les raisons de ses échecs. À l’instar du comédien, le traducteur s’efforce de concrétiser, sur la bande mère et sur le plateau de doublage, cette notion qui est parfois assez floue, surtout lorsque le dialogue original est mal rédigé ou parsemé d’erreurs. Appartient-il alors au traducteur de redresser le dialogue original ? Si la question reste ouverte, une chose est sûre : le traducteur qui a produit le texte et l’acteur qui le joue sont, aux yeux du spectateur, tous deux responsables de la qualité du doublage. En fait, en général, lorsque l’acteur dit mal un texte pourtant bien écrit et bien traduit, le spectateur a tendance à accuser le traducteur d’incompétence. Il est accusé d’avoir produit une « mauvaise » traduction, même si cette traduction est équivalente à un « mauvais » dialogue original. L’autre critère qui permet de juger de l’équivalence en doublage ne concerne plus l’adéquation entre l’original et la traduction, mais s’applique uniquement au « rendu », au texte français perçu à la voix de l’acteur de doublage. Cette tâche est d’autant plus ardue que l’évolution du dialogue cinématographique suit à la trace l’évolution de notre société qui utilise abondamment le jargon et la langue familière. L’équivalence de sens doit par conséquent se déployer sur plusieurs niveaux : celui du genre (fiction, western, fantastique, dessin animé, documentaire) et celui des contextes de production et de réception du film.