Corps de l’article
1. Gillon
Gillon définit le contexte grammatical comme étant « l’ensemble des aspects de la situation de l’énonciation d’une phrase exigés par les mots qui forment celle-ci pour qu’elle acquière des conditions de vérité ». Il y a deux sortes de mots qui « exigent » ainsi quelque chose du contexte où ils sont prononcés. Les indexicaux ont leur valeur sémantique fixée par rapport à un aspect de la situation d’énonciation (aspect que, suivant Nunberg, j’appellerai « l’index ») et sont donc tels que, si l’index n’est pas déterminé, la phrase où ils figurent est inévaluable parce que l’indexical lui-même ne peut recevoir de valeur sémantique. Ainsi, le mot « demain » se définit par rapport au moment de l’énonciation (index) et a pour valeur sémantique le lendemain du jour où celle-ci a lieu. Si on ne fixe pas le moment de l’énonciation de la phrase, on ne peut déterminer la valeur sémantique de « demain » et la phrase, par conséquent, ne reçoit pas de conditions de vérité déterminées. Le moment de l’énonciation appartient donc au contexte grammatical, suivant la définition de Gillon. Il en va de même du lieu de l’énonciation, et de bien d’autres aspects de la situation d’énonciation par rapport auxquels sont déterminées les valeurs que prennent contextuellement les indexicaux. Ce que Gillon appelle le co-texte fait également partie du contexte grammatical. En effet, la valeur sémantique des expressions anaphoriques est fixée par rapport à un antécédent linguistique, de sorte que la phrase où elles figurent ne peut être évaluée comme vraie ou fausse (et ne reçoit donc pas de conditions de vérité) si un tel antécédent n’est pas donné dans le discours auquel appartient la phrase en question. Ces deux types de cas, que Gillon nomme respectivement « exophore » et « endophore », épuisent selon lui la dépendance des conditions de vérité des énoncés par rapport au contexte grammatical. Et Gillon me critique pour avoir soutenu le contraire.
J’ai peine à comprendre la critique de Gillon. Je n’ai aucune objection à l’idée que l’indexicalité et l’anaphore épuisent la dépendance des énoncés par rapport au contexte grammatical. Car Gillon définit le contexte grammatical de telle façon que la dépendance vis-à-vis de ce contexte ne peut être que « de bas en haut », au sens où ce sont les mots eux-mêmes qui, en vertu de leur signification linguistique conventionnelle, rendent nécessaire l’appel au contexte pour fixer la valeur sémantique. Il y a une autre forme de dépendance contextuelle à laquelle mon livre est, pour l’essentiel, consacré, mais elle est « de haut en bas », c’est-à-dire qu’elle prend sa source non dans la signification conventionnelle des expressions linguistiques, mais dans le contexte lui-même. Parfois, le contexte nous conduit à donner aux mots une interprétation qui n’est pas l’interprétation conventionnelle déterminée par les règles du langage. Le rôle que joue le contexte dans ces cas-là est fondamentalement différent de celui qu’il joue lorsqu’il s’agit d’assigner un référent à une expression indexicale ou anaphorique. Gillon lui-même, dans son compte rendu, insiste beaucoup sur cette différence. Dans le second type de cas — lorsque, pour parler comme Gillon, la circonstance visée par le locuteur n’est pas celle que détermine la phrase en vertu de son contenu sémantique strict — le sens communiqué par le locuteur dépend bien du contexte, mais il ne s’agit pas d’une dépendance par rapport au contexte grammatical tel que le définit Gillon.
Il semble qu’il y ait cependant un point de désaccord entre Gillon et moi, concernant la dépendance vis-à-vis du contexte grammatical. Gillon soutient que le contexte grammatical tel qu’il le définit inclut seulement la situation physique dans laquelle la phrase est énoncée (ce qu’il appelle la scène) et le co-texte. Cela me paraît faux et, dans mon livre, je signale la nécessité où l’on est (et que reconnaissent la plupart des théoriciens) d’aller au-delà d’une conception aussi étroite du contexte d’énonciation. Souvent, en effet, ce sont les intentions supposées du locuteur et les croyances d’arrière-plan des interlocuteurs qui permettent d’assigner une valeur sémantique aux expressions indexicales. Or ces intentions et ces croyances ne font partie à proprement parler ni du co-texte ni des circonstances physiques de l’énonciation. Les démonstratifs sont un bon exemple, car ils ne sont pas toujours accompagnés d’un geste de montrer du doigt, et même quand il y a un tel geste, celui-ci ne peut pas ne pas sous-spécifier la référence du démonstratif. Or, dans ce type de cas, la sous-spécification exclut que la phrase possède des conditions de vérité déterminées. Tant qu’on ne sait pas à quoi « ceci » fait référence, on ne peut évaluer comme vrai ou faux un énoncé où ce mot figure. Il y a de ce point de vue une grande différence entre les deux types d’exemples de sous-spécification donnés par Gillon : ceux qui (comme son exemple 28, « ceci est importé ») relèvent de la dépendance grammaticale et où la sous-spécification empêche d’assigner à la phrase des conditions de vérité déterminées, et d’autres où, ce qui est sous-spécifié, c’est seulement ce que veut dire le locuteur, la phrase elle-même possédant des conditions de vérité déterminées. À partir du moment où le sens conventionnel de la phrase non seulement sous-détermine ce que j’appelle les conditions de vérité intuitives de l’énoncé (et que Gillon appelle la circonstance visée par le locuteur) mais encore échoue à déterminer quelque condition de vérité que ce soit et oblige pour ce faire à recourir aux intentions supposées du locuteur, on est bien forcé de conclure que le contexte grammatical inclut plus que la situation physique. On a besoin non seulement du contexte étroit (la situation physique) mais encore du contexte large (incluant les croyances d’arrière-plan et les facteurs de ce genre). Ce point est assez trivial, et accepté par presque tous les théoriciens. Même des minimalistes forcenés comme Cappelen et Lepore soulignent qu’ils acceptent cela, et ils me reprochent d’attaquer une idée — l’idée que le contexte grammatical se réduit au contexte au sens étroit — que personne ne soutient effectivement (Cappelen et Lepore, 2005 : 149).
Pour résumer, il y a deux débats que Gillon ne distingue pas clairement dans son compte rendu. D’un côté il y a la question de savoir si le contexte grammatical se réduit à la scène physique (outre le co-texte) ou s’il fait intervenir des facteurs intentionnels d’un autre type. Dans ce débat, Gillon, pour autant que je le comprenne, semble défendre une position aujourd’hui à peu près unanimement abandonnée. D’autre part il y a le débat auquel mon livre est dans une large mesure consacré : les conditions de vérité intuitives des énoncés dépendent-elles seulement du contexte grammatical, ou bien y a-t-il, comme je le soutiens, une autre forme de dépendance contextuelle, en vertu de laquelle le sens des mots est modulé en contexte sans que rien dans la signification linguistique conventionnelle des mots eux-mêmes n’impose cette modulation ? Bien que Gillon n’aborde pas directement ce dernier débat, ses exemples et ses commentaires montrent qu’il accepte l’idée que le contenu intuitif de nos paroles va bien au-delà du contenu sémantique déterminé par les règles du langage et le contexte grammatical.
Il me semble que les deux débats que Gillon ne distingue pas clairement s’entremêlent chez lui de la façon suivante : c’est parce que, comme Kent Bach ou Herman Cappelen et Ernie Lepore, il radicalise et généralise (au-delà du raisonnable, comme on va le voir) l’opposition entre le contenu sémantique de la phrase et le contenu intuitif de l’acte de parole accompli qu’il se croit en mesure de défendre l’idée que le contexte grammatical se réduit à la scène physique et au co-texte. Le lien entre les deux idées apparaît dans son traitement de « ici ». Je soutiens qu’il faut recourir aux intentions du locuteur pour déterminer si « ici » fait référence à la pièce où se trouve le locuteur, au bâtiment tout entier, à la ville, au pays, etc. À cela, Gillon répond que « ici » a une valeur sémantique déterminée par le contexte au sens étroit sans qu’il soit nécessaire de faire appel aux intentions du locuteur, lesquelles déterminent seulement ce que celui-ci veut dire, et non le contenu sémantique de la phrase qu’il énonce. Selon Gillon, si, en visite à Montréal, je dis à la personne qui m’accompagne : « Davis habite ici », il se peut très bien que je lui communique la proposition que Davis habite à Montréal, mais la phrase que j’énonce est, elle, littéralement fausse dans ce cas, car elle exprime la proposition que Davis habite à l’endroit où mon énonciation est produite. Supposons que je prononce la phrase dans ma chambre d’hôtel : alors, selon Gillon (pour autant que je le comprenne), mon énoncé « Davis habite ici » exprime strictement et littéralement la proposition que Davis habite dans ma chambre d’hôtel, ce qui est faux. Gillon est donc conduit à soutenir que si l’on emploie le mot « ici » pour faire référence à la ville où l’on se trouve, on ne parle pas littéralement (ou en tout cas pas « strictement », mais de façon relâchée). Cette position me paraît très étrange. Quelle différence y a-t-il entre la pièce où l’on parle et la ville où l’on parle ? Si employer « ici » pour faire référence à la ville, c’est faire preuve de laxisme, comme le soutient Gillon, pourquoi n’en va-t-il pas de même lorsqu’on emploie « ici » pour faire référence à la pièce où l’on est ? Après tout, le mot « ici » n’est pas prononcé dans tous les coins de la pièce à la fois, mais seulement à l’endroit de la pièce où se trouve le locuteur. Donc, si le seul emploi strictement littéral de « ici » est celui qui sert à désigner le lieu minimal de l’énonciation, comme paraît le soutenir Gillon, on est conduit à conclure que « ici » fait littéralement référence au lieu exact où les pieds du locuteur sont posés, à moins qu’il ne s’agisse de l’espace laryngo-buccal au sein duquel le mot « ici » se trouve articulé. Tout cela me paraît absurde et constitue à mes yeux une reductio ad absurdum de la position de Gillon.
2. Seymour
Seymour résume mon argumentation de la façon suivante. Je défends, dit-il, une thèse contextualiste, selon laquelle le contenu sémantique d’un énoncé est affecté par des processus pragmatiques « libres », non commandés par la signification linguistique elle-même, et va donc au-delà de ce que déterminent les règles du langage (même relativement au contexte). En faveur de cette thèse, j’invoque la contrainte de disponibilité, selon laquelle le contenu sémantique doit être accessible aux utilisateurs du langage (à moins qu’ils ne soient déficients et ne perdent le statut d’« interprètes normaux » : voir à ce sujet ma réponse à Davis). Les conditions de vérité minimales déterminées par les seules règles du langage (relativement au contexte) ne sont, dans bien des cas, pas accessibles aux interlocuteurs, et donc elles ne satisfont pas à la contrainte de disponibilité. À cette argumentation Seymour objecte que les conditions de vérité minimales sont seulement éclipsées, dans un contexte donné, par les conditions de vérité enrichies ou modifiées que le contexte en question rend disponibles, mais qu’elles sont tout de même accessibles en un sens plus faible (dispositionnel) : s’ils font abstraction du contexte, les utilisateurs du langage peuvent assigner aux phrases des conditions de vérité minimales, celles-là même qui sont éclipsées en contexte. On aboutit ainsi au bifurcationnisme, qui est pour Seymour une solution de rechange crédible au contextualisme. Selon le bifurcationnisme (qui correspond à ce que, dans mon livre, j’appelle la « conception «syncrétique» »), il y a deux niveaux de contenu sémantique, le contenu minimal déterminé par les règles du langage, et le contenu modifié qui résulte de l’intervention massive de processus pragmatiques non commandés par la signification linguistique. Ce qui me conduit indûment, selon Seymour, à éliminer le bifurcationnisme des théories possibles, c’est l’idée que le principe de disponibilité doit s’appliquer en contexte, et non hors contexte. Or cette idée présuppose le contextualisme qu’il s’agit de prouver.
Face à cette critique, je plaide non coupable. Je concède à Seymour que le bifurcationnisme est une théorie non seulement possible, mais naturelle. Aussi bien ne cherché-je pas à la disqualifier a priori, au nom du principe de disponibilité. Ce principe me conduit seulement à isoler un type de contenu — les conditions de vérité intuitives — auquel je fais jouer un rôle privilégié, mais sans exclure qu’il y ait un autre niveau de contenu qui, lui, ne soit pas accessible aux interlocuteurs, ou en tout cas ne leur soit pas accessible dans le même sens. En d’autres termes, je n’utilise pas le principe de disponibilité dans ma critique du bifurcationnisme, et donc je ne suis pas sujet à l’objection de circularité que m’oppose Seymour. Il est vrai que je rejette le bifurcationnisme, mais mes arguments contre lui sont autres. D’une part il y a l’argument de la détermination, sur lequel Seymour fait porter sa critique après avoir soulevé son objection de circularité. Selon cet argument, on peut douter qu’il y ait véritablement un contenu sémantique minimal, déterminé par les règles du langage, et qui soit suffisamment riche pour permettre d’évaluer l’énoncé comme vrai ou faux. Je reviendrai sur cet argument dans un instant pour examiner la critique qu’en fait Seymour. L’autre argument que j’oppose au bifurcationnisme a trait à l’inutilité de la proposition minimale en question, à supposer qu’elle existe effectivement. Cette proposition n’a selon moi aucun rôle effectif à jouer ni dans la théorie ni dans le processus d’interprétation qui est l’objet de la théorie. Je rejette en effet l’idée gricéenne (apparemment acceptée par Seymour) selon laquelle on aurait besoin de ce contenu sémantique minimal pour aller au-delà de lui et procéder à la modulation pragmatique dont résulte le contenu intuitif. Certes, le contenu intuitif résulte d’opérations pragmatiques sur le contenu minimal, mais ces opérations sont selon moi locales, c’est-à-dire qu’elles affectent le contenu sémantique des constituants de la phrase. Le contenu sémantique intuitif (non minimal) de l’énoncé est obtenu non par une modification globale du contenu minimal de celui-ci, comme chez Grice, mais en «composant» les contenus intuitifs des constituants, lesquels résultent d’opérations pragmatiques sur le contenu minimal desdits constituants. À aucun moment il n’est nécessaire, dans le processus d’interprétation, de « composer » les contenus minimaux des constituants de façon à obtenir le contenu minimal de la phrase. On peut, certes, postuler l’existence du « contenu minimal de la phrase » que l’on obtient en composant directement les contenus minimaux des parties de la phrase, mais cette postulation est gratuite puisque l’explanandum reste le contenu intuitif des énoncés — ce qui se trouve effectivement communiqué dans l’échange de parole — et que la dérivation de ce contenu intuitif ne fait intervenir à aucun moment le contenu minimal du tout, mais seulement, comme point de départ du processus d’interprétation, le contenu minimal des parties[1].
Les deux arguments anti-bifurcationnistes que je viens de mentionner correspondent aux deux positions que je nomme, respectivement, le contextualisme proprement dit ou contextualisme radical, et le quasi-contextualisme ou contextualisme modéré. Le contextualisme modéré ne nie pas qu’on puisse définir un niveau de contenu correspondant à la proposition minimale chère aux bifurcationnistes mais met en doute l’utilité de cette notion. Le contextualisme radical va plus loin : il rejette la notion elle-même comme incohérente. L’idée, ici, est que la signification conventionnelle des mots et des constructions syntaxiques ne suffit (peut-être) pas pour renvoyer à un état de choses déterminé dans le monde, même une fois fixée la valeur contextuelle des expressions indexicales ou anaphoriques. Tout dépend de la façon dont on conçoit la signification conventionnelle des expressions linguistiques. Il n’est pas déraisonnable de penser que le sens conventionnel des mots est schématique et abstrait, trop pour que la phrase, indépendamment d’un contexte et d’hypothèses d’arrière-plan, puisse représenter un état de choses spécifique, tel qu’on puisse la juger vraie (si l’état de choses en question est réalisé) ou fausse (s’il ne l’est pas). Ou peut-être le sens des mots est-il, au contraire, trop riche, consistant en un vaste ensemble d’informations, de représentations et d’associations parmi lesquelles le contexte doit faire le tri pour ne retenir que ce qui est pertinent dans la situation de discours. Peut-être même le sens d’un mot pour un locuteur donné n’est-il rien d’autre que l’ensemble des situations dans lesquelles ce mot a été employé par le passé, situations telles que le locuteur est en droit d’employer ce mot dans toute situation qui leur est suffisamment semblable (les dimensions de similarité étant, bien entendu, susceptibles elles-mêmes de varier en fonction du contexte d’emploi). Chacun de ces points de vue conduit naturellement à conclure en faveur du contextualisme : les mots ne véhiculent un contenu vériconditionnel déterminé que relativement à un acte donateur de sens des utilisateurs du langage. Comme je le dis à la fin de mon « précis » : « les mots eux-mêmes sont inertes, et il faut un acte de parole pour leur donner vie. »
L’argument de la détermination soulève cependant une objection de Seymour. Je le cite :
Puisque les facteurs pragmatiques n’interviennent pas toujours, ne doit-on pas admettre que les conditions de vérité minimales sont parfois les seules à être pertinentes, et ce, même si le contenu exprimé est alors indéterminé ? Je soutiendrais alors qu’il existe une tension entre, d’une part, une éventuelle adhésion au caractère déterminé de la signification et, d’autre part, l’admission que les mots ont une signification autonome et que les facteurs pragmatiques sont optionnels. Ces deux dernières thèses semblent conduire à une approche qui admet l’indétermination dans certains cas. Je doute par conséquent que le philosophe contextualiste puisse se permettre d’avancer que la signification doit être déterminée dans tous les cas. Il peut difficilement se dispenser des conditions de vérité littérales, que j’ai appelées « conditions de vérité minimales », s’il est prêt à reconnaître à la fois que les mots ont des significations conventionnelles autonomes, et que les facteurs pragmatiques déterminants dont il est question sont réellement optionnels.
Cette tension notée par Seymour est bien réelle : dire que les processus pragmatiques « libres » sont optionnels, c’est dire qu’ils ne sont pas nécessaires à l’obtention d’un contenu sémantique authentique (c’est-à-dire évaluable comme correct ou incorrect) ; c’est donc dire que, indépendamment de ces processus, les mots énoncés expriment un contenu minimal que ceux-ci vont modifier. Comment peut-on alors réputer ces mêmes processus de modulation indispensables à l’obtention d’un contenu déterminé ?
Seymour a entièrement raison de souligner qu’il y a là une tension. Il n’est pas évident que, dans une optique contextualiste radicale, l’on puisse continuer à donner sens à la distinction entre les processus pragmatiques obligatoires, comme l’assignation de valeurs contextuelles aux expressions indexicales (ce que j’appelle le processus de « saturation »), et les processus pragmatiques optionnels, comme ceux que je regroupe sous le nom de « modulation » (enrichissement libre, transfert métonymique, emplois étendus ou relâchés). Mais il n’est pas non plus certain qu’on ne le puisse pas. Tout dépend sans doute du type de contextualisme radical que l’on défend. Dans mon livre, j’en dénombre trois sortes, à savoir les doctrines que je nomme respectivement PC (pour « Pragmatic Composition »), WF (pour « Wrong Format ») et ME (pour « Meaning Eliminativism »). En guise de réponse à Seymour, je voudrais indiquer ce que devient la distinction entre les processus obligatoires et les processus optionnels suivant qu’on adopte l’une ou l’autre de ces variantes du contextualisme radical.
La première forme de contextualisme radical, PC, soutient que les mots possèdent, individuellement pour ainsi dire, des contenus déterminés, mais que la composition sémantique requiert des processus de modulation en vertu desquels les sens des différents mots de la phrase subissent une sorte d’ajustement mutuel qui permet de donner un sens global au tout. Ainsi, pour reprendre un exemple que je discute dans mon livre, le verbe « désarmer » possède un sens déterminé, et l« la fricassée » aussi, mais l’injonction « désarmez la fricassée » que profère le héros dans un film de Borsage ne prend un sens déterminé (c’est-à-dire n’acquiert de « conditions d’obéissance » déterminées) que lorsque, en contexte, des processus de modulation du type de l’enrichissement libre ou du transfert métonymique ont lieu. Il faut comprendre que « la fricassée » fait référence au plat de fricassée, et que « désarmer » signifie, dans ce contexte, « enlever l’arme qui s’y trouve ». L’exemple de Searle, « couper le soleil », est du même ordre : hors d’un contexte spécifique, on ne voit pas trop ce que cette expression veut dire, même si l’on admet que chacun des constituants possède un contenu déterminé. Dans cette théorie, c’est la composition sémantique qui requiert la modulation, sans que la nécessité de celle-ci procède de la signification conventionnelle d’aucun lexème particulier (comme c’est le cas lorsqu’il y a saturation). Je signale dans mon livre que Benveniste soutenait une telle forme de contextualisme radical, à travers sa distinction entre l’ordre sémiotique et l’ordre sémantique. Quoi qu’il en soit, la distinction entre processus obligatoire (saturation) et optionnels (modulation) est maintenue sans problème dans cette théorie : la modulation est localement optionnelle, c’est-à-dire optionnelle sur le plan lexical, même si elle se révèle nécessaire sur le plan syntagmatique. La saturation est, elle, localement nécessaire.
La deuxième forme de contextualisme radical que je discute dans mon livre, WF, est un peu plus radicale en ce qu’elle refuse de considérer que les mots eux-mêmes possèdent un contenu déterminé. Certes, les mots possèdent une signification linguistique conventionnelle, mais celle-ci est jugée trop riche ou trop pauvre pour pouvoir être identifiée à la représentation correcte ou incorrecte d’un aspect de la réalité extralinguistique. C’est en ce sens, et en ce sens seulement, que WF refuse d’attribuer aux mots de la langue un contenu déterminé. Pour passer de la signification linguistique conventionnelle des mots aux contenus déterminés qu’ils véhiculent en contexte et en vertu desquels ils renvoient à la réalité extralinguistique, des processus d’élaboration, d’enrichissement ou de filtration doivent avoir lieu. Ici, on ne peut plus recourir à l’opposition du global et du local pour fonder la distinction entre la saturation obligatoire et la modulation optionnelle : la modulation intervient en effet obligatoirement dès le plan lexical. Il reste cependant un moyen de justifier la distinction entre modulation et saturation dans ce cadre théorique, comme je l’indique brièvement dans mon livre à partir de l’exemple suivant.
Le sens du mot « ouvrir » est constant : c’est, selon une des variantes possibles de WF que j’utilise ici pour les besoins de la démonstration, une signification abstraite qui se trouve élaborée diversement selon que l’on parle d’ouvrir une porte, d’ouvrir une bouteille ou d’ouvrir une blessure. L’élaboration en question n’est pas seulement rendue nécessaire par la composition sémantique (comme dans PC) : elle est, dans WF, lexicalement nécessaire, au sens où la signification abstraite de « ouvrir » peut être représentée comme un frame fillmorien, c’est-à-dire un schéma abstrait comportant un ensemble de rôles d’arguments qui sont autant de variables ou de paramètres pouvant recevoir en contexte diverses valeurs. Ainsi, dans le schéma de « ouvrir » il y a l’idée d’un passage entre un extérieur et un intérieur et celle d’un obstacle empêchant la circulation d’un mobile par ce passage : « ouvrir » consiste précisément à supprimer cet obstacle. Tout cela — l’extérieur, l’intérieur, l’obstacle, le mobile, le passage — ce sont des rôles d’argument constitutifs du schéma associé au lexème « ouvrir », et auxquels, selon les contextes, vont correspondre des entités différentes auxquelles seront assignés ces rôles. Ainsi, dans « ouvrir la porte », c’est typiquement la porte qui est l’obstacle, alors que dans « ouvrir la blessure », c’est la peau qui est l’obstacle (et le pus le mobile). Il s’agit là seulement d’interprétations naturelles, facilement accessibles, mais, comme je l’indique dans le livre, l’expression « ouvrir la porte » elle-même, hors contexte, suggère mais n’impose aucunement qu’on assigne à la porte le rôle d’obstacle : rien n’interdit d’ouvrir une porte comme on ouvre une blessure — en l’incisant. Ce type de sous-détermination est plus évident dans le cas de « couper une oreille » : on peut couper une oreille en la détachant du corps, ou plus minimalement en y faisant une incision — la différence entre les deux tient aux rôles que joue l’oreille dans le schéma de « couper », et cela varie selon le contexte. À chaque fois qu’une expression avec « ouvrir » (ou « couper ») est employée pour dire quelque chose à propos de la réalité, le schéma abstrait se trouve spécifié et les rôles d’argument distribués aux entités contextuellement pertinentes.
Comment, dans ce cadre, peut-on sauvegarder la distinction entre saturation (obligatoire) et modulation (optionnelle), étant donné que l’élaboration contextuelle du schéma se révèle obligatoire ? On peut la sauvegarder au moyen de l’observation suivante : lorsqu’il y a saturation, la signification linguistique impose d’assigner contextuellement une valeur à la variable indexicale. Lorsqu’il s’agit seulement, par modulation, de spécifier contextuellement le schéma véhiculé par un mot, le contexte détermine quels rôles d’argument du schéma reçoivent une valeur spécifique, et lesquels restent sous-spécifiés et font l’objet de « clôture existentielle ». Par exemple, dans le schéma de « couper », il y a un rôle d’instrument ; mais il n’est pas nécessaire dans tous les contextes d’assigner ce rôle à une entité particulière. La clôture existentielle du rôle suffit souvent. Si je dis « Jean a coupé la feuille en deux », dans bien des contextes il importera peu de savoir si Jean l’a fait avec des ciseaux, avec une hache ou avec les doigts en pliant la feuille de façon appropriée : seul le résultat compte, et il suffira de comprendre que Jean a coupé la feuille en deux d’une façon ou d’une autre. Dans d’autres contextes, l’instrument utilisé fera partie des conditions de vérité intuitives au sens où, pour être en mesure d’évaluer l’énoncé, il sera nécessaire à l’interprète d’identifier l’instrument auquel le locuteur fait implicitement référence. Mais le fait que l’assignation d’une valeur particulière à ce rôle d’argument ne soit pas nécessairement obligatoire, c’est-à-dire le fait que le caractère obligatoire ou non de cette assignation particulière dépende du contexte sans être imposé par la signification linguistique conventionnelle du lexème, suffit à justifier la différence entre modulation et saturation.
Il n’y a guère qu’avec la plus extrême des formes du contextualisme radical, à savoir ME, que paraît difficilement surmontable la tension dont parle Seymour entre le caractère optionnel de la modulation (par opposition à la saturation) et son caractère nécessaire pour obtenir un contenu suffisamment déterminé. ME nie en effet que les mots possèdent autre chose qu’un « potentiel sémantique », potentiel sémantique que, dans mon livre, j’identifie à un ensemble de situations-sources dans lesquelles ou à propos desquelles le mot a été légitimement employé. Ce potentiel sémantique étant fondamentalement différent d’un contenu déterminé, les processus pragmatiques qui conduisent à celui-ci à partir de celui-là sont obligatoires : il ne s’agit plus d’une opération facultative sur un sens primitif engendrant un nouveau sens « modulé », mais d’une opération qui constitue le sens. Dans ce cadre théorique, il n’est pas évident de sauvegarder l’idée que les indexicaux ont une signification linguistique hors contexte correspondant au character kaplanien ; ou, si l’on maintient cette idée, cela revient ipso facto à limiter le domaine d’application de ME. Paradoxe intéressant : dans la « déstabilisation du sens » qu’entreprend le contextualisme radical (Recanati 2001), les indexicaux, paradigme de la dépendance contextuelle, apparaissent néanmoins comme l’ultime pôle d’invariance et de stabilité.
3. Davis
Selon Steven Davis, je défends une position « interprétationniste », c’est-à-dire une position selon laquelle « la signification qu’un interprète attribue à l’utilisation d’une phrase fixe métaphysiquement la signification de celle-ci. » Davis soutient qu’une telle position est compatible avec l’idée, que je défends aussi, selon laquelle l’acte de dire quelque chose (au sens locutionnaire, impliquant la donnée d’un contenu propositionnel) relève d’une analyse gricéenne. Dire quelque chose, pour moi comme pour Grice, c’est manifester par une énonciation linguistique une intention communicative réflexive (incluant l’intention que l’auditeur reconnaisse cette intention). L’intention communicative qui constitue le contenu est donc bien, comme chez Grice, l’intention du locuteur, mais cette intention doit être manifestée pour constituer le contenu de l’énoncé : rien n’est dit si l’intention en question, bien que présente dans le for intérieur du locuteur, n’est pas rendue accessible publiquement à ceux à qui s’adresse l’acte de communication. Le point de vue de l’interprète entre ainsi crucialement en ligne de compte.
Davis qualifie ma position d’interprétationniste parce que je privilégie, dit-il, le point de vue de l’interprète : ce qui compte selon moi n’est pas l’intention effective du locuteur mais celle que l’interprète lui attribue. Cependant, ma position est plus subtile que cela. J’insiste sur le fait que ce n’est pas l’intention effective du locuteur qui confère un contenu, mais sa manifestation objective. Objective signifie ici : indépendante tant des états mentaux effectifs du locuteur que de ceux de l’interlocuteur. Le locuteur peut très bien ne pas se rendre compte de l’intention communicative qu’il manifeste lui-même objectivement (comme dans l’exemple de Kaplan désignant le portrait de Spiro Agnew en croyant que c’est celui de Carnap). Mais la même indépendance se manifeste vis-à-vis des états mentaux effectifs de l’interprète : tout comme le locuteur, l’auditeur peut se méprendre quant à l’intention objectivement manifestée, parce que certains aspects de la situation objective lui échappent. Ce qui compte, ce n’est donc ni l’intention effective du locuteur ni l’intention que lui prête l’interlocuteur, mais l’intention que l’énoncé, dans son contexte, manifeste objectivement. Cette intention objective, on peut (suivant une idée de C. Travis) la caractériser en disant que c’est l’intention communicative qu’un juge impartial en possession de toutes les données contextuelles pertinentes attribuerait au locuteur. Je suis donc bien « interprétationniste », si l’on veut, mais l’interprétation qui fournit à l’énoncé son contenu n’est pas ou pas nécessairement celle à laquelle aboutit l’auditeur empirique. Celui-ci peut se tromper. Létation constitutive du contenu est celle à laquelle aboutit un interprète idéal en possession des données contextuelles pertinentes. Un tel interprète est ce que je nomme, dans mon livre, « interprète normal », parce que je soutiens que les utilisateurs du langage — le locuteur et l’auditeur — sont dans une situation normale de discours au courant des faits contextuels pertinents et capables de déterminer l’intention objectivement manifestée. Les cas où il y a méprise sur le « common ground» (comme dans l’exemple de Kaplan) sont des cas déviants. Quoi qu’il en soit, lorsque je dis que ce qui confère un contenu à l’énoncé, c’est l’interprétation à laquelle parvient, ou parviendrait, un interprète normal, je n’entends pas privilégier le point de vue de l’auditeur par rapport à celui du locuteur. Aussi bien l’un que l’autre mérite d’être ainsi qualifié dans une situation ordinaire de communication où ce que dit le locuteur ne fait problème pour personne ; et aussi bien l’un que l’autre peut déchoir et perdre le statut d’interprète normal si un aspect pertinent de la situation de communication lui échappe.
À la lumière de ces distinctions, considérons le scénario qui, selon Steven Davis, soulève un problème quant à ma façon de voir :
Supposez que deux chiens gambadent sur la pelouse : un grand saint-bernard à l’avant-plan, et un petit épagneul cocker à l’arrière-plan, partiellement caché par le plus grand chien. J’observe les deux chiens, en compagnie de mon ami Sam, qui ne sait pas que j’ai un chien. Les deux chiens sont visibles par nous deux et, le plus important, ils sont dans mon champ de vision — ce qui est évident pour Sam —, et nous sommes tous les deux francophones de naissance. Sans pointer du doigt, je dis :
1. C’est mon chien.
En utilisant « c’est » dans 1, je veux faire allusion à l’épagneul cocker, mon chien, et je veux utiliser les mots que je prononce dans leur sens ordinaire. Il est évident que ce que je dis est vrai si et seulement si[2] l’épagneul cocker qui gambade sur la pelouse est mon chien. Comment Sam, à qui s’adresse la remarque, interpréterait-il la signification de 1 ? [...] Puisque le saint-bernard est à l’avant-plan de notre champ visuel commun et qu’il est plus proéminent que l’épagneul cocker, la valeur sémantique qui est activée pour « ce » dans l’interprétation que ferait Sam de mon énoncé en 1 serait une représentation du saint-bernard plutôt que de l’épagneul cocker. C’est-à-dire que le saint-bernard est plus saillant que l’épagneul cocker dans notre espace perceptuel commun et donc qu’il lui est plus accessible que ce dernier pour attribuer une valeur sémantique à « ce ». [...] Selon la théorie de l’accessibilité de Recanati, la condition de vérité que Sam attribuerait donc à mon énoncé serait que celui-ci est vrai si et seulement si le saint-bernard est mon chien. Ce faisant, il ferait une erreur et n’aurait pas compris ce que j’ai dit, puisque ce que j’ai dit est vrai si et seulement si l’épagneul cocker est mon chien.
Selon Davis, ce scénario est un contre-exemple à l’interprétationnisme « naïf », puisque l’interprétation que fournit l’auditeur se révèle erronée. Mais il est également un contre-exemple à ma version, qui fait appel à la notion d’« interprète normal », car on ne voit pas très bien en quoi un « interprète normal » dans cette situation ferait mieux que Sam, l’interprète empirique :
Puisque Sam a fait une erreur, il n’est pas un interprète normal, au sens étendu que Recanati donne à cette notion, et l’interprétation qu’il donne doit être rejetée et remplacée par ce qu’un interprète normal interpréterait comme étant la signification de mon énoncé. Pour Recanati, un interprète normal est un interprète qui ne fait pas d’erreurs [...] [Mais] Sam utilise de façon correcte l’information qui lui est accessible dans le contexte et, compte tenu de cette information, donne de ce que je dis l’interprétation la plus plausible, bien qu’erronée. La question est de savoir comment l’interprète normal de Recanati, s’il était dans la même situation que Sam, en viendrait à donner l’interprétation correcte de ce que je dis, ce que Recanati n’explique pas. Quelle information, non disponible pour Sam, pourrait-il utiliser pour atteindre l’interprétation correcte ?
Je n’ai aucune peine à répondre à cette objection, car je récuse plusieurs des prémisses qu’invoque Davis dans son raisonnement. Pour commencer, il dit : « Il est évident que ce que je dis est vrai si et seulement si l’épagneul cocker qui gambade sur la pelouse est mon chien. » Mais c’est loin d’être évident. Ces conditions de vérité correspondent certes à l’intention du locuteur, mais l’intention en question (et plus spécifiquement la sous-intention de faire référence au cocker plutôt qu’au saint-bernard) n’est pas manifestée objectivement, de sorte qu’elle ne compte pas. Il en aurait été autrement si le locuteur avait désigné le cocker d’un geste du doigt ou d’un regard, ou si l’auditeur avait été en possession d’informations concernant le type de chien possédé par le locuteur. Comme rien de tout cela n’est le cas, et comme le saint-bernard est le plus saillant des deux chiens, l’intention communicative qui est objectivement manifestée (si tant est quintention communicative déterminée soit objectivement manifestée dans ce contexte) est l’intention de faire référence au saint-bernard. Apparemment, le locuteur ne s’en rend pas compte, et c’est donc le locuteur qui fait une erreur et perd son statut d’interprète normal : l’interprétation que lui-même donne de ses propres paroles échoue à conférer à celles-ci le contenu qu’il entend leur donner. L’auditeur, en revanche, ne fait aucune faute : il voit bien que le seul indice accessible dans ce contexte pour déterminer l’intention référentielle du locuteur est la saillance du saint-bernard, et l’intention communicative qu’il attribue au locuteur a beau ne pas être l’intention effective du locuteur, c’est cependant bien l’intention que (sans le savoir) le locuteur manifeste objectivement. L’auditeur fait donc une « erreur » au sens où il attribue au locuteur une intention communicative que celui-ci n’a pas, mais cette erreur n’affecte en rien son statut d’interprète normal[3] : l’auditeur conserve ce statut car, contrairement au locuteur, il apprécie correctement les indices publiquement accessibles dans le contexte et parvient ainsi à une interprétation objectivement fondée. L’erreur de l’auditeur n’est pas de son fait : elle est une conséquence mécanique de l’erreur que fait, en amont, le locuteur dans son appréciation faussée des indices contextuels disponibles.
Davis soulève d’autres objections à l’encontre de ma théorie. L’une concerne l’emploi des mots dans la pensée, un thème que j’aborde très peu dans mon livre et qui n’est pas directement en rapport avec la théorie que j’y développe (laquelle concerne le langage public et la communication) : je laisse donc cette objection de côté de façon à ne pas dépasser les limites qui me sont imparties. Une seconde objection a trait à ma déclaration un peu paradoxale selon laquelle, pour comprendre ce qui est dit par un énoncé, il n’est pas nécessaire de se représenter explicitement les intentions du locuteur. Malgré l’apparence, cette déclaration est compatible avec l’idée que le contenu de l’énoncé correspond à l’intention communicative objectivement manifestée par le locuteur : on comprend l’énoncé si on saisit la proposition qui correspond effectivement à cette intention, même si l’on ne se représente pas le fait que la proposition en question correspond à l’intention en question. Le conflit apparent entre ma position générale et la déclaration mentionnée ci-dessus vient donc d’une ambiguïté de type de re/de dicto. Reste que la déclaration en question était sans doute un peu excessive dans sa formulation : comme le souligne Davis, il y a assurément des cas où il est nécessaire de se représenter les intentions du locuteur pour assigner une valeur sémantique « primaire » à une expression (par exemple, un indexical ou une expression ambiguë), et la seule chose que je voulais nier en faisant cette déclaration, c’est que la réflexion sur les intentions du locuteur soit une condition nécessaire de la compréhension primaire en général (alors qu’elle est, selon moi, une condition nécessaire de la compréhension secondaire). Comme j’ai déjà développé ce point ailleurs en réponse à une objection analogue à celle de Davis, je me permets de renvoyer le lecteur à cette réponse (Recanati, 2006), et je passe à l’objection dont Davis dit qu’elle est « la plus sérieuse ».
Davis soutient que ma théorie est infalsifiable, pour la raison suivante :
[...] Recanati invoque un interprète normal pour sauver sa théorie, et cela fait de son interprétationnisme une théorie non empirique, puisqu’elle rend son explication imperméable aux preuves contraires. Recanati expose une théorie de l’interprétation qui est censée fournir les valeurs sémantiques des utilisations de phrases en contexte. Si la théorie mène à ce que l’on croit être une attribution incorrecte des conditions de vérités pour l’utilisation d’une phrase, Recanati a beau jeu de dire que, dans un tel cas, l’interprète invoqué n’est pas un interprète normal, puisque, par définition, un interprète normal est quelqu’un qui ne fait pas d’erreurs d’interprétation. Sa théorie n’est donc pas une théorie empirique.
Ici encore je plaide non coupable. La notion d’interprète normal n’est pas une notion empiriquement vide que l’on manipule à souhait. Si Davis croit cela, c’est parce qu’il croit, à tort, que pour rendre compte de son exemple du chien je n’aurais pas d’autre ressource que de retirer arbitrairement à l’auditeur (Sam) son statut d’interprète normal. Cela serait effectivement arbitraire et justifierait une accusation de manipulation. Mais pour moi, l’idée d’un interprète normal, c’est l’idée d’une personne linguistiquement compétente en possession de toutes les informations contextuelles pertinentes. Sam est, à mon avis, un interprète normal dans le contexte décrit par Davis, alors que ce n’est pas le cas du locuteur qui commet de toute évidence une erreur d’appréciation. Quoi qu’il en soit du statut respectif des interlocuteurs dans la situation décrite par Davis, la notion d’interprète normal s’applique à des sujets qui ne font pas partie de la situation d’énonciation, pourvu qu’ils aient sur elle les informations requises et soient linguistiquement compétents. Ainsi, on peut se donner expérimentalement des interprètes normaux : il suffit de fournir à un groupe de sujets linguistiquement compétents, d’une part une description suffisamment détaillée de l’énoncé et de son contexte (le scénario de Davis), et d’autre part un choix entre plusieurs situations (une situation où Davis est le propriétaire du saint-bernard, et une situation où il est le propriétaire du cocker). Un tel dispositif permet de tester les jugements d’interprètes normaux sur les conditions de vérité de l’énoncé dans une tâche classique de pragmatique expérimentale consistant à apparier énoncé et situation. Il me semble donc qu’on a un accès direct aux interprétations « normales », indépendamment de la partie de la théorie qui concerne les mécanismes (saturation, modulation, etc.) permettant de passer de la signification linguistique au sens de l’énoncé déterminé selon moi par ces interprétations normales. Il n’est donc pas vrai que la théorie, en tant que théorie des mécanismes, est rendue infalsifiable par l’absence d’ancrage indépendant de la notion d’interprète normal dans la réalité empirique.
Parties annexes
Notes
-
[1]
Je devrais d’ailleurs parler de contenu littéral plutôt que de contenu minimal, car il n’y a pas de raison de penser que la saturation, c’est-à-dire le processus d’assignation de valeurs contextuelles aux expressions indexicales et apparentées, intervient elle-même « avant » la modulation.
-
[2]
Je modifie ici (et dans les deux dernières phrases du passage) la traduction du texte de Davis, car l’original anglais porte « just in case», de sorte que la traduction par « seulement dans le cas où » est trop faible.
-
[3]
Il n’est donc pas vrai que, selon moi, « un interprète normal est un interprète qui ne fait pas d’erreur ».
Références
- Cappelen, H. et E. Lepore. Insensitive Semantics, Oxford, Blackwell, 2005.
- Recanati, F. « Déstabiliser le sens », Revue Internationale de Philosophie, 2001, 216, p. 197-208.
- Recanati, F. (2006). « Reply to Carston ». Dans M.J. Frapolli (dir.), Saying, Meaning, and Referring: Essays on François Recanati’s Philosophy of Language, Londres, Palgrave-Macmillan, à paraître.