Article body

Introduction

De nombreux appels au service téléphonique d’urgence 9-1-1[3] constituent le point de départ d’une enquête policière. Recèlent-ils des informations intéressantes pour l’enquêteur chargé d’un dossier ? Pourraient-ils, en particulier, donner des indices de la sincérité de l’appelant ? Cette dernière question est à l’origine du parcours de recherche que nous tracerons ici.

Il faut dire que si la plupart des citoyens qui font appel au service 9-1-1 sont totalement sincères au moment de rapporter la situation qui motive leur demande d’assistance, un certain nombre d’entre eux[4], pour diverses raisons, travestissent peu ou prou les faits, de manière à orienter en un certain sens la compréhension qu’en aura le preneur d’appels. Un bon exemple serait celui d’un parent qui demande du secours pour son bébé inconscient mais sera peu enclin à avouer que c’est parce qu’il l’a secoué. Les appels dont il est question nécessitent donc une intervention, mais leurs auteurs, que nous dirons dissimulateurs ou manipulateurs, mentent ou à tout le moins passent sous silence certaines informations dont ils disposent à propos de la situation. La question de l’identification de ces appelants dissimulateurs en est une d’importance pour l’enquête. Dans cette étude, elle est abordée avec les outils de la linguistique et, plus spécifiquement, de l’analyse du discours et des interactions.

Les indices verbaux du mensonge

De nombreux travaux scientifiques[5] ont été consacrés au mensonge au cours des 30 dernières années (on trouvera une synthèse dans Vrij, 2019), presque tous réalisés par des psychologues. Ces travaux ont montré depuis longtemps que l’habileté des individus à détecter le mensonge est faible (Bond et DePaulo, 2006), n’allant guère au-delà des 50 % que prévoit déjà le hasard. On sait aussi que la performance des professionnels de l’interrogation n’est pas vraiment supérieure à celle de tout autre individu (voir le sixième chapitre de Vrij, 2008). À l’exception des méta-analyses (Bond et DePaulo, 2006 ; Sporer et Schwand, 2006 ; Vrij, 2008, 2019 ; Vrij et al., 2017), une très forte proportion des études consacrées à la mise en évidence d’indices verbaux de mensonge reposent sur une procédure expérimentale consistant à demander à un groupe de volontaires de produire des discours mensongers. On compare ensuite ces discours aux productions non mensongères des mêmes individus ou à celles d’un autre groupe de volontaires ; les études de Mann, Vrij et Bull (2002) et Wright Whelan, Wagstaff et Wheatcroft (2014) mises à part, toutes les autres mentionnées dans cette section utilisent une variante de cette procédure. Parmi les indices souvent associés au comportement verbal des menteurs, on retrouve notamment l’usage fréquent d’énoncés négatifs (Zhou, Burgoon, Zhang et Nunamaker, 2004) et d’expressions généralisantes telles que toujours, tout le monde (Knapp, Hart et Dennis, 1974), l’évitement de la référence à soi-même au moyen de pronoms et déterminants de 1re personne (Burgoon, Buller, Guerrero, Afifi et Feldman, 1996), des énoncés plus courts (Sporer et Schwand, 2006 ; Zhou et Zang (2006). Toutefois, une recension des écrits fait apparaître de nombreux résultats contradictoires, de sorte que la valeur de chacun de ces indices est d’une étude à l’autre remise en question. Ainsi, pour ne prendre qu’un exemple, les résultats obtenus par Anolli, Balconi et Ciceri (2003) et Caso, Vrij, Mann et DeLeo (2006) contredisent ceux de Zhou et Zang (2006) : les menteurs produiraient des énoncés plus longs que les individus sincères. Ce manque de robustesse des résultats pourrait en partie être attribué à la manière dont les indices sont définis, qui n’est pas constante d’une étude à l’autre. En outre, ces travaux ne tiennent jamais compte des dimensions pragmatique et sociolinguistique du discours (Shuy, 1998) ; la variation est inhérente à la pratique linguistique des individus, et tant la situation de communication que l’âge, le niveau d’études, la position sociale et l’origine géographique de locuteurs qui ont la même langue maternelle peuvent faire varier leur manière de s’exprimer.

Par ailleurs, l’expérimentation en laboratoire sur laquelle reposent presque toutes ces études offre certes un bon contrôle des facteurs de variation (du moins certains d’entre eux), mais elle présente néanmoins des faiblesses. En effet, les travaux sur le mensonge adoptent généralement une conception étroite du phénomène, lisible dans les instructions données aux participants à l’étude. Or, la tromperie à laquelle un enquêteur ou un avocat se heurte va au-delà de l’assertion qui contredit intentionnellement les faits ; les omissions, les exagérations, les cas où un locuteur ne donne que des informations qui ne permettent pas de se faire une idée juste des faits en relèvent également. Qui plus est, les situations expérimentales s’éloignent considérablement des situations réelles de mensonge. Wright Whelan et al. (2014) parlent à ce sujet d’un « manque de validité écologique », puisqu’elles négligent deux données essentielles du problème : l’interaction avec autrui – on ment à quelqu’un –, et l’enjeu du mensonge – la révélation de ce que cherche à dissimuler le menteur peut lui coûter cher. Mann et al. (2002), dans une des rares analyses de mensonges réels, montraient que les menteurs ne se comportent pas tous de la même façon. On peut faire l’hypothèse que le contexte dans lequel on ment et les réactions variables d’un interlocuteur (Anolli, Balconi et Ciceri, 2002), qui peut être plus ou moins suspicieux, expliquent en partie les différences observées.

Chose certaine, l’interaction fut longtemps la grande oubliée des travaux sur le mensonge, et comme le montre Vrij (2019), on observe un tournant dans les travaux sur la question à partir de 2009. On ne s’intéresse plus seulement au menteur, on accorde une attention plus grande à la manière dont on l’interroge. Plusieurs de ces travaux se fondent sur la prémisse que mentir exige du locuteur un effort cognitif plus important que dire vrai. On cherchera donc à accroître encore cet effort, par exemple en demandant au participant à l’étude de raconter une série d’événements à l’envers (Gilbert et Fisher, 2006), en lui posant des questions auxquelles il ne s’attend pas (Vrij et al., 2009) ou en adoptant un style non coercitif d’interrogatoire qui amène le participant à parler le plus possible (Vrij et al., 2017). Ces travaux montrent clairement que la manière dont l’interlocuteur se comporte avec le menteur joue un rôle qu’on ne peut ignorer. Les éventuels indices de mensonge sont contraints par la situation de communication dans laquelle un individu décide de mentir et, de ce fait, ne sont pas forcément « exportables », valables en toute situation.

But et objectifs de l’étude

Toutefois, même dans ces études plus récentes, c’est moins l’interaction elle-même qui est prise en compte que l’effet sur le menteur de l’adoption d’une stratégie quelconque d’interrogation par son interlocuteur, et le mensonge sur commande reste à la base de l’analyse. Nous voulions pour notre part aborder le problème d’une autre manière : 1) en donnant une acception plus large au mensonge (d’où notre choix de parler de dissimulation ou de tromperie), parce que c’est ce genre d’accommodement avec la « vérité » que doivent affronter les enquêteurs ; 2) en travaillant sur des données authentiques ; 3) en portant une attention particulière à la manière dont l’appelant interagit avec le preneur d’appels.

D’importants travaux ont été réalisés sur le genre de données qui nous intéressent, notamment par Zimmerman (1984, 1992), Whalen, Whalen et Zimmerman (1990), Tracy (1997), Drew et Walker (2010) ainsi que Garner et Johnson (2013), qui ont notamment fait apparaître la structure de l’appel d’urgence et ses particularités interactionnelles. Peu d’études ont été consacrées au mensonge dans ce contexte (Burns et Moffitt, 2014 ; Cromer, Brewster, Fogler et Stoloff, 2018 ; Harpster et Adams, 2017 ; Harpster, Adams et Jarvis, 2009 ; portant toutes sur des cas d’homicide). Cette rareté n’a rien d’étonnant puisque d’une part, tel qu’il est mentionné plus haut, c’est la méthode expérimentale qui est privilégiée par les chercheurs qui s’intéressent au mensonge et d’autre part, la constitution d’un corpus de données mensongères est ardue. L’appel d’urgence constitue pourtant une donnée précieuse : il contient la toute première version des faits portés à l’attention de la police, fournie en réponse à une question très ouverte : « Quelle est votre urgence ? », et l’appelant s’y trouve peut-être moins sur ses gardes que lors d’une entrevue d’enquête. L’appel d’urgence mérite donc qu’on l’examine dans la perspective de la mise au jour d’une éventuelle manipulation de la part de l’appelant. L’appelant manipulateur se comporte-t-il différemment de l’appelant sincère ? Cette question a peu d’importance pour le preneur d’appels, dont le travail consiste à dépêcher l’aide demandée, quels que soient l’appelant et la manière dont il se comporte. Elle présente toutefois un intérêt certain pour l’enquêteur responsable d’un dossier ouvert pour un appel d’urgence. Elle était la première à laquelle il fallait répondre au moment où nous avons commencé à travailler sur le sujet. Les résultats encourageants de nos premières analyses (Laforest, 2012 ; Laforest, Blais et St-Yves, 2009) permettaient de penser que c’est bien le cas et donnaient aussi une idée de la nature de cette différence. Le volume de données sur lequel reposaient ces résultats était cependant trop restreint pour permettre une validation statistique et la constitution d’un corpus plus étoffé s’est étalée sur plusieurs années. Les objectifs de la présente étude découlent de cette question initiale : 1) déterminer les traits du comportement verbal de l’appelant que l’on peut associer le plus nettement à la (non-)sincérité ; 2) déterminer lesquels de ces traits sont les plus faciles à repérer, caractéristique qui a son importance dans la perspective qui est la nôtre de construire un modèle d’évaluation de la sincérité de l’appelant qui soit relativement simple à utiliser.

La recherche est fondée sur l’hypothèse que la tromperie laisse des traces sur les plans interactionnel et discursif, car elle suppose une certaine anticipation des questions qui seront posées lors de l’appel et des réponses qui y seront apportées. Or l’appelant a généralement peu d’expérience de l’appel d’urgence ; la représentation qu’il s’en fait peut se trouver plus ou moins bousculée par la réalité et c’est cette relative déstabilisation de l’appelant qui laissera des traces observables.

Données

Les données de notre étude consistent en deux ensembles d’appels adressés au service d’urgence 9-1-1 et qui, pour une raison ou une autre, ont été à l’origine d’une enquête policière. Le premier ensemble est constitué de 45 appels dont l’auteur est un appelant dissimulateur. Le second ensemble – qui fait office de groupe de contrôle – est constitué de 40 appels émanant d’appelants sincères. La (non-)sincérité de l’appelant a pu être déterminée au vu du résultat de l’enquête, aujourd’hui terminée. Il est impossible d’évaluer le degré de représentativité des données considérées par rapport à l’ensemble des appels qui font l’objet d’une enquête, que ce soit du point de vue du type d’affaire en cause ou des caractéristiques de l’appelant. Nous avons simplement recueilli tous les appels disponibles pour lesquels nous disposions de l’information sur la sincérité de l’appelant.

Les appelants sont de langue maternelle française ou anglaise[6], mais seuls deux appels se déroulent en anglais du début à la fin. Tous (à l’exception de deux adolescentes) sont adultes[7]. Les situations rapportées sont variées, mais les événements concernant la personne (agressions diverses, mort – 79 % des appels) sont plus nombreux que ceux qui concernent la propriété (vol, vandalisme, incendie – 21 % des appels). Le Tableau 1 (partie supérieure) fait apparaître le détail de la composition de l’échantillon à cet égard. Il importe de préciser qu’une étude antérieure a déjà montré que le type d’événement rapporté (incendie, vol qualifié, agression sexuelle ou autre) n’est pas associé à une propension plus ou moins grande à la tromperie (Laforest, 2012).

Les appelants se situent toujours par rapport à l’événement qu’ils rapportent ; à cet égard, ils se répartissent ici en trois catégories : ils en sont soit la victime (58 % des appels), soit un témoin (11 % des appels), soit un témoin de son seul résultat (32 % des appels – voir Tableau 1, partie inférieure)[8]. Les appelants qui n’ont qu’un rapport lointain à l’événement ont été éliminés[9].

Ce corpus est encore de petite taille, mais il est le double de celui qui a été utilisé lors de notre étude précédente (Laforest, 2012). Comme il a déjà été mentionné, la constitution du corpus s’est étalée sur une période de plusieurs années. La raison en est simple : il est très difficile de se procurer un volume important de données permettant de savoir si l’appelant est sincère ou non. La sincérité de l’appelant est déterminée au vu du résultat d’une enquête. Un nombre important des premiers appels qui nous ont été fournis n’ont pu être intégrés à notre échantillon car il a été impossible de déterminer la sincérité de l’appelant, soit parce qu’il était impossible de retrouver l’enquêteur chargé d’un dossier trop ancien, soit parce que l’enquête n’était jamais arrivée à une conclusion satisfaisante, soit encore parce que la personne à l’origine de la plainte l’avait retirée, de sorte que l’enquête commencée prenait fin sans qu’on sache où elle aurait mené. Il serait intéressant de disposer d’un volume encore plus important de données, mais l’échantillon actuel est néanmoins adéquat : une analyse de la puissance des tests de Student par ré-échantillonnage montre que ces tailles d’échantillon permettent d’atteindre 80 % pour des différences de moyenne semblables à ce qui été observé pour la plupart des variables.

Tableau 1

Les appels analysés

Les appels analysés

-> See the list of tables

Cadre théorique

Notre travail est fondé sur l’observation systématique d’interactions authentiques et il est guidé par les principes suivants, communs à la plupart des chercheurs interactionnistes :

  1. le discours est une pratique située dans le temps, dans l’espace et dans une culture donnée ;

  2. le caractère situé de cette pratique fait partie des données de l’analyse ;

  3. la dimension actionnelle du langage (« dire, c’est faire » – Austin, 1962) est prépondérante ;

  4. les interactants manifestent et reconnaissent mutuellement le sens de leurs actions langagières ;

  5. le sens ne préexiste pas à l’interaction, il s’y construit peu à peu grâce à l’apport de tous les interactants ;

  6. la forme du discours est fortement contrainte par la nécessité, pour les interactants, de garder intacte l’image sociale qu’ils tentent de projeter (Goffman, 1973).

Ces principes, largement inspirés de l’analyse conversationnelle (Sacks, 1992), sont appliqués dans une analyse fine des tours de parole de chaque interactant qui fait apparaître l’étroite interdépendance des actions sociales et des stratégies discursives utilisées. Ils ont notamment été mis à l’épreuve dans de nombreux travaux portant sur les interactions dites « institutionnelles » (entre autres Drew et Heritage, 1992 ; Heritage et Clayman, 2010), catégorie dont relèvent les appels d’urgence. Sur le plan méthodologique, ils supposent une analyse inductive et donc un traitement qualitatif des données (une quantification pouvant intervenir dans un deuxième temps).

Méthodologie

Les appels sont d’abord transcrits, suivant un protocole qui impose de noter non seulement tous les mots prononcés, mais aussi les interruptions, les hésitations, les reformulations successives, les chevauchements de parole, les pauses et leur durée. Il s’agit donc d’une transcription qui vise à rendre compte non seulement du contenu, mais également de la manière dont il est livré. La transcription est vérifiée par deux transcripteurs avant le début de l’analyse proprement dite.

Les deux séries d’appels sont ensuite comparées, afin d’y rechercher d’éventuelles différences entre l’appelant dissimulateur et l’appelant sincère. Les éléments différenciateurs identifiés lors de nos études antérieures (Laforest, 2012 ; Laforest et al., 2009) font partie des éléments à repérer, afin de vérifier si, dans un plus vaste ensemble de données, ils sont toujours indicatifs d’une différence entre les deux séries ; mais des éléments nouveaux, qui n’avaient pas attiré notre attention précédemment ou qui ne pouvaient être visibles que sur un nombre plus élevé d’appels, peuvent également apparaître.

Une fois mis en évidence, les éléments différenciateurs identifiés sont codés et une procédure d’évaluation et de calcul d’un indice lié à cet élément est déterminée. Une analyse statistique détermine la valeur de chaque indice et permet d’identifier les indices les plus fortement associés à la sincérité et à la tromperie (objectif n° 1 de l’étude). Comme l’objectif ultime est de construire un outil d’analyse de la sincérité de l’appelant, il s’agit là d’une étape préalable à la détermination du « poids » de chaque variable corrélée avec la (non-)sincérité dans l’ensemble des variables significatives.

Quinze éléments potentiellement différenciateurs entre les deux séries d’appels ont été testés. Les traits les plus souvent mentionnés dans les études sur le mensonge (notamment la fréquence des énoncés négatifs et des expressions généralisantes, l’évitement de la référence à soi-même, les énoncés plus courts) ne se sont pas révélés utiles. La négation pouvait être testée facilement, en raison de sa fréquence dans tout échange – mais cette fréquence n’est pas plus élevée dans les appels non sincères. D’autres traits ne pouvaient pas être testés en raison de la dynamique interactionnelle qui prévaut dans un appel d’urgence. Ainsi, la longueur des énoncés produits par l’appelant est contrainte en partie par l’urgence et plus encore par la question posée, et le contexte se prête peu aux énoncés généralisants. Les 15 éléments suivants sont les traits qui ont émergé de la comparaison des deux séries d’appels :

  • C1 – Un délai d’occurrence du coeur de l’appel

    Le coeur de l’appel est la première intervention significative de l’appelant, au cours de laquelle il évoque pour la première fois la situation qui motive son recours au service 9-1-1. Il y a délai lorsque cette intervention ne suit pas immédiatement le tour d’ouverture de la part du preneur d’appels (« 9-1-1. Quelle est votre urgence ? » ou une formulation similaire).

  • C2 – La présence du motif de l’appel dans le coeur de l’appel

  • C3 – L’identification de l’appelant dans le coeur de l’appel

  • C4 – La présentation désordonnée des éléments du coeur de l’appel

    Chez un grand nombre d’appelants, les différents éléments du coeur (motif, requête explicite d’intervention, éléments de contexte, identification, mention du lieu, etc.) se présentent dans un ordre qui apparaît comme « canonique » ; le désordre est évalué par rapport à cet ordre.

  • C5 – La clarté du motif de l’appel

  • C6 – Les contradictions

  • C7 – Les réponses peu adéquates aux questions

    Les réponses peu adéquates de l’appelant aux questions du preneur d’appels ne permettent pas d’établir d’emblée un lien sémantique entre l’information fournie par l’appelant et la question posée, ce dont témoigne en général la reformulation par le preneur d’appels de la même question ou l’énonciation d’une nouvelle question sur le même sujet au tour de parole suivant.

  • C8 – Les surplus d’informations sans lien direct avec la question

    Les surplus d’informations sont des informations données en sus de celle demandée par le preneur d’appels. Ces informations non demandées n’ont aucun lien direct avec la question.

  • C9 – Les questions de l’appelant adressées au preneur d’appels

  • C10 – Les surplus d’informations apportant une précision à celle demandée

    Là encore, il s’agit d’informations données en sus de celle demandée par le preneur d’appels, mais ce surplus est dans ce cas directement lié à la question et ne fait que clarifier l’information qui répondait déjà bien à la question.

  • C11 – Les pauses d’au moins une seconde séparant la fin d’une question du preneur d’appels et le début d’une réponse de l’appelant ;

  • C12 – Les marqueurs explicites et positifs de perception du monde extérieur (tels que « j’ai vu/ entendu/ senti X »)

  • C13 – Les verbalisations d’émotion (telles que « j’ai peur », « je ne me sentais pas à l’aise »)

  • C14 – Les doubles manifestations d’émotion

    Les doubles manifestations (pas forcément simultanées, mais toutes deux présentes dans l’appel) d’émotion sont les manifestations prosodiques – par exemple des cris, une voix brisée – ET verbalisées d’émotion.

  • C15 – Les structures JE + verbe à l’imparfait.

Chaque appel est unique, tant par l’événement rapporté que par la dynamique propre à chaque duo d’interactants. Pour cette raison, seuls certains traits sont présents dans un même appel et par conséquent, les données présentent un grand nombre de valeurs « 0 » pour chaque variable. Cependant, en dépit de cette importante proportion de « 0 », une simulation par la méthode de ré-échantillonnage (« Bootstrap ») a permis de constater que les tailles d’échantillon et la distribution des observations permettent l’utilisation du test de Student classique (pour les variables quantitatives) ; le test d’indépendance du khi-deux a été utilisé pour les variables catégorielles.

Il importe par ailleurs de s’assurer que les indices significatifs de tromperie ou de sincérité soient relativement faciles à repérer, car un indice dont l’identification et le calcul exigent une grande expertise en analyse de discours ou laissent une trop grande place à l’interprétation de l’analyste peut plus difficilement être utilisé dans la construction d’un instrument robuste d’analyse de la sincérité. L’indice « facile » est celui qui permet d’atteindre un bon niveau de reproductibilité de l’analyse. Afin d’identifier ces indices – objectif n° 2 de l’étude –, le codage des appels a été effectué par une deuxième personne, qui a travaillé indépendamment de la première en suivant la procédure d’évaluation préalablement déterminée. Le degré de divergence entre les deux codages a ensuite été calculé (tests du K et corrélation de Pearson).

Résultats et discussion

1. Les traits du comportement verbal de l’appelant associés à la (non-)sincérité

Il ressort de l’analyse que des quinze traits identifiés, seuls les huit suivants sont corrélés avec la non-sincérité de l’appelant, parfois inversement (voir Tableaux 2 et 3) : la clarté du motif (C5) ; les contradictions (C6) ; les réponses peu adéquates aux questions (C7) ; les surplus d’informations sans lien direct avec la question (C8) ; les surplus d’informations apportant une précision à celle demandée (C10) ; les pauses (C11) ; les doubles manifestations d’émotion (C14) ; et les structures JE + verbe à l’imparfait (C15).

Deux de ces variables sont des variables catégorielles dichotomiques (C5 – le motif est clair ou non, C14 – les doubles manifestations d’émotion sont présentes ou non) – voir Tableau 3 ; les autres (voir Tableau 2) ont été calculées relativement au nombre de demandes d’informations formulées par le preneur d’appels (c’est le cas des réponses peu adéquates aux questions, des surplus d’informations sans lien direct avec la question, des surplus d’informations apportant une précision à l’information demandée et des pauses – variables C7, C8, C10 et C11), ou relativement au nombre de mots prononcés par l’appelant (c’est le cas des contradictions et des structures JE + verbe à l’imparfait – variables C6 et C15).

Presque tous les traits identifiés tiennent à la manière dont l’appelant manifeste sa compréhension du rôle qu’il a à jouer dans l’appel et par conséquent du cadre (au sens que Goffman [1974] donne à ce terme) de l’interaction. L’appel d’urgence est une interaction asymétrique : le droit à la parole y est inégalement réparti et les rôles, spécialisés. Le preneur d’appels s’y trouve en position de pouvoir, il est le meneur du jeu interactionnel ; c’est lui qui dirigera l’aide sollicitée vers le bon service, lui qui pose les questions. Le rôle de l’appelant est d’y répondre. En général, ce dernier ne connaît pas le cadre organisationnel dans lequel opère le preneur d’appels. Pour cette raison, l’information spontanément fournie par l’appelant n’est pas nécessairement celle dont le preneur d’appels a besoin pour accomplir sa tâche et un ajustement continu aux demandes du preneur d’appels est observable.

Les réponses peu adéquates aux questions (C7), les surplus d’informations sans lien direct avec la question (C8), les surplus d’informations apportant une précision à l’information demandée (C10) et les pauses (C11) sont des variables d’ordre interactionnel, c’est-à-dire qu’elles ont trait à l’articulation et à la gestion de l’échange de parole entre les deux interlocuteurs. Trois de ces quatre variables sont celles qui présentent les corrélations les plus fortes avec la non-sincérité de l’appelant. On peut raisonnablement penser que l’appelant dissimulateur imagine à l’avance les questions qui lui seront posées et les réponses qu’il y donnera. Mais il sera forcé de constater qu’on lui pose des questions qu’il n’attendait pas, ou qu’il lui sera difficile de donner l’information qu’il veut au moment où il le veut. Les quatre variables en question témoignent de la manière dont l’appelant répond aux questions qui lui sont posées et révèlent la mesure dans laquelle il « coopère » (Grice, 1975) et accepte d’entrer dans le cadre que lui impose en quelque sorte son interlocuteur. Ces éléments révèlent que l’appelant dissimulateur est un interlocuteur au comportement moins « approprié » que l’appelant sincère, moins coopératif (aux yeux du preneur d’appels, ce qu’on peut observer dans ses réactions aux prises de parole de l’appelant) : il est moins disposé à se soumettre à l’autorité interactionnelle du preneur d’appels (Laforest et al., 2009). Dans une perspective semblable, il est question dans certains travaux d’indicateurs de mensonge relatifs à l’attitude, définie comme « l’engagement et la coopération manifestés par l’appelant envers le répondant d’urgence » (Harpster et al., 2009, p. 72, notre traduction). Les appelants dissimulateurs semblent donc plus souvent que les appelants sincères désarçonnés par certaines questions (ce qui peut être marqué par une pause avant le début de la réponse – C11 – ou une réponse qui ne va pas dans le sens de la question posée, ce dont témoignent les réponses peu adéquates aux questions – C7 – et, dans une moindre mesure, les surplus d’informations sans lien direct avec la question – C8), peut-être parce qu’ils tiennent plus que l’appelant sincère au scénario qu’ils avaient préalablement élaboré. On rejoint là indirectement les résultats de Vrij et al. (2009), selon lesquels le recours d’un enquêteur à des questions non anticipées de la part de la personne interrogée constitue une stratégie intéressante pour détecter le mensonge. Les surplus d’informations apportant une précision à l’information demandée par le preneur d’appels (C10) sont au contraire des marques de coopération interactionnelle et on les retrouve davantage chez les appelants sincères ; cette variable est donc inversement corrélée avec la dissimulation.

Tableau 2

Les variables quantitatives corrélées avec la sincérité de l’appelant (test de Student)

Les variables quantitatives corrélées avec la sincérité de l’appelant (test de Student)

Séries d’appels : S = appels sincères (n = 40) ; NS = appels non sincères (n = 45).

-> See the list of tables

Tableau 3

Les variables catégorielles corrélées avec la sincérité de l’appelant (test d’indépendance du khi-deux)

Les variables catégorielles corrélées avec la sincérité de l’appelant (test d’indépendance du khi-deux)

Séries d’appels : S = appels sincères (n = 40) ; NS = appels non sincères (n = 45). C5 : valeur 0 = motif clair ; valeur 1 = motif peu clair. C14 : valeur 0 = aucune double manifestation d’émotion ; valeur 1 = au moins une double manifestation d’émotion.

-> See the list of tables

Les quatre autres traits sont plus discursifs que proprement interactionnels, en ce sens qu’ils relèvent de la structuration du contenu du discours et du positionnement du locuteur relativement à ce contenu. Mais comme les éléments différenciateurs d’ordre interactionnel, ils sont liés à la manière dont l’appelant à la fois perçoit son rôle et répond aux attentes implicites du preneur d’appels à cet égard. Il est ainsi attendu, dès le départ, que le motif de l’appel soit énoncé clairement – toute la suite de l’interaction en dépend. L’appelant dispose d’une grande liberté pour ce faire, car il construit comme il le veut sa première intervention, en réponse à la question qui ouvre l’appel et qui est la plus ouverte de toutes : « Quelle est votre urgence ? » Un motif peu clair (C5) constitue une anomalie et le cas échéant, le preneur d’appels revient sur ce point d’une manière ou d’une autre, comme il le fait dans l’Exemple 1 (ligne 30), où il résume en une phrase sa compréhension du récit long et confus de l’appelant. L’intonation interrogative montre qu’il attend de l’appelant une confirmation de son hypothèse que le motif de l’appel serait une tentative de vol de la part de deux individus.

On attend également de l’appelant un rapport cohérent de la situation qui motive l’appel, cohérence qui est évidemment mise à mal si l’appelant fournit des informations contradictoires (C6), cas relativement rare, mais toujours frappant. La fréquence d’emploi des structures Je + verbe à l’imparfait par les appelants dissimulateurs (C15) est pour sa part expliquée par les théories du récit. Ces théories distinguent nettement l’arrière-plan du récit, rendu en français au moyen de l’imparfait et du plus-que-parfait, des segments proprement narratifs constitués par l’énonciation de la succession des actions menant à la résolution d’une situation inattendue. En français, ces actions sont relatées (à l’oral) au passé composé. Les structures JE + verbe à l’imparfait ralentissent le récit, ce qui est contraire à la dynamique habituelle de l’appel d’urgence, dans lequel la plupart des appelants s’en tiennent aux informations essentielles. Le verbe à la première personne conjugué à l’imparfait fait en sorte que l’appelant insiste davantage sur ce qu’il fait avant l’événement qui motive l’appel ou sur son état d’esprit, que sur l’événement lui-même. C’est ce qu’on voit dans l’Exemple 2, dans lequel la description de l’arrière-plan occupe la moitié du récit de l’appelante et ne donne aucune information susceptible d’aider le preneur d’appels à traiter le problème rapporté.

Quelques mots enfin sur les manifestations d’émotion (C14). Bien que plusieurs auteurs, entre autres Olsson (2004) et Harpster et al. (2009) tiennent la voix dépourvue de marques d’affects pour un indice de mensonge, parce qu’elle serait « anormale » pour un locuteur stressé faisant appel au service d’urgence, la présence audible de marques prosodiques d’émotion telles que les cris, les sanglots, l’essoufflement, la voix brisée ou tremblante, le débit accéléré et les rires brefs est très semblable dans les deux séries d’appels. Désireux d’explorer à fond cette question, nous avons également relevé les verbalisations d’émotion, c’est-à-dire les énoncés ou portions d’énoncés qui témoignent d’une émotion éprouvée[11], mais comme les marques prosodiques, elles ne sont pas plus présentes dans un groupe d’appelants que dans l’autre. La variable C14 combine ces deux dimensions, prosodique et verbale, de l’expression de l’émotion. C’est cette combinaison qui est corrélée avec la sincérité de l’appelant. Les chercheurs qui mentionnent l’importance de l’expression de l’émotion parlent de la voix, mais il est très possible qu’ils confondent l’expression vocale et l’expression verbale. Il nous apparaît pourtant très important de distinguer les deux dimensions. En effet, l’appelant qui crie, pleure et que le stress fait bafouiller correspond si étroitement à la représentation la plus habituelle de l’appel d’urgence qu’il donne à penser qu’un appelant cherchant à tromper le preneur d’appels sera tenté de se comporter de cette façon. La dimension verbale de l’émotion est moins saillante dans l’ensemble du discours et par conséquent sera moins aisément feinte. Le degré de dépendance des deux dimensions mériterait pour cette raison un examen plus attentif.

2. Détermination des traits les plus faciles à repérer

Notre recherche sur les appels d’urgence avait pour objectif ultime de vérifier si un outil d’analyse de la sincérité de l’appelant pourrait être construit et, nous l’espérions, se révéler utile pour un enquêteur. L’examen, en 2011, d’un échantillon de 40 appels (20 dissimulateurs), avait démontré qu’une analyse par régression logistique permettait de mettre en évidence un ensemble de sept variables[12] susceptibles d’apparaître nettement plus fréquemment dans les appels non sincères (Laforest, 2012). Prises ensemble, ces variables permettaient d’évaluer correctement bon nombre d’appels. Dès lors, chaque nouvel appel nous étant envoyé a été analysé à l’aide de ces variables et une prédiction sur la sincérité a été faite avant la fin de l’enquête. Une fois celle-ci terminée, sa conclusion sur la sincérité de l’appelant nous est communiquée, de sorte qu’il est possible de tester la fiabilité des variables indépendamment des données qui ont servi à générer le modèle d’analyse. Le travail de 2011 a fait l’objet d’un réexamen en 2016, après l’introduction de modifications de la façon de calculer certains indices et l’extension de l’échantillon à 77 appels (40 dissimulateurs). Les résultats de cette réanalyse confirmaient le rôle central joué par les variables interactionnelles, notamment les réponses peu adéquates aux questions (C7) et la présence de surplus d’informations apportant une précision à celle demandée (C10). Le taux global de classement correct obtenu était de 84 %. Entre 2016 et 2019, les appels ajoutés à notre banque, analysés sans que l’on sache au préalable si l’appelant était sincère ou non, ont été correctement classés dans une proportion de 81,8 %, ce qui est assez conforme à ce que le modèle prévoyait.

Chaque fois, une seule analyste avait traité l’ensemble des données. Pour intéressants qu’ils soient, les résultats obtenus faisaient cependant apparaître une difficulté : ces variables sont difficiles à évaluer correctement. Les critères permettant d’identifier les réponses peu adéquates ou les surplus d’informations apportant une précision laissent à l’évaluateur une part de subjectivité dans l’évaluation qu’il est difficile d’éliminer. Nous avions entre les mains un modèle performant, mais que seuls des analystes de discours aguerris pourraient utiliser et, encore, sans garantie raisonnable que deux analystes calculeraient les indices les plus importants exactement de la même façon.

La résolution de ce problème passait par deux décisions. Celle, déjà énoncée dans la section « Méthodologie », de mesurer le degré de divergence d’évaluation entre deux analystes, c’est-à-dire leur désaccord lors du codage. Et celle d’orienter l’analyse statistique de manière à vérifier si un taux de classement satisfaisant des appels analysés pouvait être obtenu sans recourir aux variables dont l’évaluation présenterait le plus de difficulté, c’est-à-dire celles dont les deux évaluations seraient les plus différentes. L’échantillon de 85 appels utilisé cette fois-ci est un peu plus grand que celui de 2016 et trois nouvelles variables ont été testées pour la première fois, dont deux se sont révélées significatives, soit les doubles manifestations d’émotion (C14) et les structures JE + verbe à l’imparfait (C15). La deuxième analyste a travaillé avec un document détaillant les critères d’évaluation de chaque indice et la façon de calculer sa valeur.

Le Tableau 4 fait apparaître le pourcentage de codage différent de la valeur de chaque variable fournie par les deux analystes[13]. Pour chaque variable, plus ce pourcentage est élevé, plus le nombre d’appels sur lesquels les deux analystes n’arrivent pas au même résultat est important. Afin d’évaluer plus précisément l’accord entre les deux analystes, la mesure de dépendance entre leurs résultats a été calculée pour chaque variable. Le test du k (kappa) a été utilisé pour les deux variables catégorielles dichotomiques que sont la clarté du motif (C5) et les doubles manifestations d’émotion (C14) ; pour les autres variables, la corrélation de Pearson a été mesurée[14]. Plus le résultat s’approche de 1, plus l’accord entre les deux analystes est élevé. Toutes les mesures sont très significatives (< 0,001).

Sans surprise, l’analyse révèle que les réponses peu adéquates aux questions (C7), les surplus d’informations sans lien direct avec la question (C8), les surplus d’informations apportant une précision à l’information demandée (C10) sont les variables pour lesquelles le codage des deux analystes est le plus divergent.

Tableau 4

Pourcentage de codage différent des variables d’une analyste à l’autre et mesure de dépendance entre les deux codages

Pourcentage de codage différent des variables d’une analyste à l’autre et mesure de dépendance entre les deux codages

-> See the list of tables

Il importe de dire que cette divergence n’entraîne toutefois pas systématiquement un classement différent de l’appel : la prédiction de sincérité ou de non-sincérité faite par chaque analyste est la même dans 88 % des cas en dépit de la variation observée sur le codage d’indices particuliers. En effet, aucune des variables significatives n’est en soi déterminante, car tout indice de non-sincérité peut se retrouver dans un appel sincère et inversement. C’est la conjonction de plusieurs traits qui rend un appel suspect (Bond et Lee, 2005 ; Harpster et al., 2009 ; Zhou et al., 2004) et par conséquent, qu’un ou deux traits soient codés différemment par les deux analystes ne fait pas nécessairement de différence sur l’ensemble. Il n’en reste pas moins que la divergence mise ainsi en évidence laissait présager de grandes difficultés lorsque viendrait le temps de former de futurs utilisateurs du modèle. On peut faire l’hypothèse qu’une formation plus serrée de l’analyste permettrait de réduire l’écart que les données consignées au Tableau 4 font apparaître[15], mais probablement pas de l’éliminer.

Une nouvelle analyse statistique, excluant les variables C7, C8 et C10, a donc été effectuée et elle a fait ressortir un même ensemble significatif de variables, tant des données analysées par l’analyste n° 1 que par l’analyste n° 2. Ces variables sont les suivantes, dans l’ordre :

  • C5 – clarté du motif

  • C11 – pauses séparant la fin d’une question du début de la réponse

  • C15 – présence de structures JE + verbe à l’imparfait

  • C6 – présence de contradictions

Cet ensemble de variables offre un taux de prédiction globale correcte de la sincérité ou de la non-sincérité de l’appelant de 82 %, soit un taux comparable à celui du modèle essentiellement fondé sur des variables interactionnelles, avec une facilité accrue dans l’évaluation des variables pertinentes et donc une assurance plus grande d’un repérage adéquat de ces variables dans les appels. Les critères de codage peuvent être plus facilement enseignés que ceux des variables éliminées, de sorte que nous avons bon espoir de pouvoir réduire significativement l’écart entre les analystes.

Conclusion

La recherche confirme que la présence concomitante de certains éléments du comportement verbal d’un l’appelant au service d’urgence 9-1-1 permet d’inférer une déstabilisation qu’on peut associer à sa (non-)sincérité. Les appelants dissimulateurs ont bel et bien un comportement différent des appelants sincères et la dissimulation laisse des traces observables, ce qui permet de donner une réponse positive à la question de recherche. Sur les quinze indices analysés, huit présentent une corrélation, parfois très forte, avec la sincérité ou la non-sincérité. La conjonction de quatre de ces indices permet d’évaluer avec confiance la (non-)sincérité de l’appelant dans plus de 80 % des cas.

L’étude fait par ailleurs apparaître l’enjeu de la sélection des traits différenciateurs qui sont les plus aisément repérables par un non-spécialiste. La compréhension de cet enjeu est essentielle à l’élaboration d’un outil d’analyse qui soit le plus convivial possible. Nos résultats montrent que les variables discursives qui, isolément, présentent pour la plupart une corrélation moins forte que les variables interactionnelles avec la sincérité lorsqu’elles sont prises isolément sont plus faciles à repérer dans l’appel, ce qu’indique le pourcentage de codage différent plus faible par les deux analystes. L’outil d’analyse peut maintenant être élaboré, en tenant compte de la valeur prédictive de l’ensemble des traits qui sont les plus pertinents. Il suffira d’entrer la valeur de chacune de ces variables – dont le repérage est relativement simple –, et l’outil calculera une valeur variant entre 0 et 1, où 0 équivaut à une probabilité extrêmement forte de non-sincérité et 1, une probabilité extrêmement forte de sincérité. Le défi à relever par la suite consiste à concevoir une formation pour les futurs utilisateurs de cet outil.

Il y a 10 ans, l’appel d’urgence à l’origine d’une enquête policière constituait une ressource inexploitée ; on en conservait l’enregistrement au cas où, mais dans les faits, l’appel était rarement écouté par l’enquêteur chargé d’un dossier. La situation est aujourd’hui différente, grâce aux quelques travaux de recherche qui tendent de plus en plus à montrer l’intérêt de l’appel, où l’on trouve la toute première version des faits offerte par la victime ou un témoin important de l’événement qui fait l’objet de l’enquête, et dans un contexte différent de celui d’une entrevue formelle avec un policier. À l’heure actuelle, il est difficile de savoir dans quelles proportions l’enquêteur demande à écouter l’appel, mais, du moins à la Sûreté du Québec (SQ), cette pratique tend à devenir systématique à l’Unité des crimes majeurs. Il importe de souligner que notre recherche sur la détection des appelants dissimulateurs a été entreprise en réponse à une demande d’un praticien oeuvrant sur le terrain, à la SQ, et cette démarche proactive témoigne d’une ouverture à l’exploration de nouvelles pratiques. Les résultats que cette collaboration avec la SQ a permis d’obtenir sont fructueux et montrent l’intérêt d’une définition commune du problème à résoudre et de l’apport potentiel de la linguistique en cette matière, une discipline largement méconnue.