Résumés
Résumé
Ce texte discute certaines conclusions d’un article récent de F. Mülhölzer et vise à montrer que le logicisme russellien a les moyens de résister à la critique que Wittgenstein lui adresse dans la partie III des Remarques sur les fondements desmathématiques.
Abstract
This paper discusses some conclusions of a recent article from F.Mülhölzer. It aims at showing that Russell’s logicism has the means to overcome the criticisms Wittgenstein expounded in Remarks on the Foundations of Mathematics, part III.
Corps de l’article
La partie III des Bemerkungen über die Grundlagen derMathematik[1] a été écrite tardivement, d’octobre 1939 à avril 1940 si l’on en croit les éditeurs du volume[2], donc bien après les limites habituellement assignées à la période pendant laquelle Wittgenstein revient à la philosophie et se distancie du Tractatus. Il ne semble néanmoins pas déplacé, dans un volume portant sur le Wittgenstein intermédiaire, de consacrer une étude à ce texte, car la partie III des Remarques est une longue explication avec le projet logiciste russellien, projet dont on sait qu’il a hanté Wittgenstein depuis le début de sa carrière philosophique. On retrouve ainsi, on le verra, des traces de la sévère critique que Wittgenstein élabore en 1939 dans tous les écrits antérieurs, notamment ceux de la période intermédiaire, et l’intérêt de la troisième partie des Remarques est de condenser en un seul bloc des développements généreusement éparpillés ailleurs.
Il est étonnant de constater que peu d’études ont été spécifiquement consacrées, malgré son importance, à la troisième partie des Remarques[3]. Le récent article de F. Mülhölzer, « A mathematical proof must be surveyable : What Wittgenstein Meant By This And What It Implies », paru dans les Grazer Philosophische Studien en 2005[4], en est d’autant plus précieux. L’auteur fournit un commentaire historiquement contextualisé, philosophiquement riche et éclairant de ce texte difficile. Plus précisément, Mülhölzer défend trois thèses : la première est que le concept wittgensteinien de preuve synoptique est très certainement hérité de Hilbert ; la seconde que, à la différence de Hilbert, Wittgenstein fait un usage anti-fondationaliste de la notion ; la troisième, que l’argument qu’il déploie à l’encontre du projet logiciste de Russell est convaincant. C’est sur cette dernière affirmation que je souhaiterais revenir. La critique que Wittgenstein adresse à Russell, telle que la comprend Mülhölzer, est indubitablement forte ; elle possède en outre une forme d’actualité en philosophie des mathématiques[5]. Mais je voudrais montrer que, contrairement à ce qu’avance Mülhölzer, l’attaque manque sa cible. Cela ne veut pas dire pour autant que l’analyse de Mülhölzer soit sans pertinence. Je suggérerai en effet en conclusion que c’est parce que Wittgenstein assimile de façon forcée la perspective de Russell à celle, formaliste, de Hilbert qu’il est conduit à critiquer le premier.
Dans la première section, je résumerai très rapidement les grandes lignes de l’interprétation de Mülhölzer, en me concentrant sur l’analyse que le commentateur fait de la critique wittgensteinienne du logicisme russellien. Dans la seconde, je montrerai comment on peut développer, dans le cadre des Principia, une théorie de la notation décimale[6]. Dans la troisième section, je montrerai que l’hypothèse, faite par Wittgenstein, selon laquelle il faudrait distinguer deux mouvements dans les Principia, un mouvement horizontal de déduction du contenu logique, et un mouvement vertical de coordination des notations usuelles avec le langage logique ne correspond pas à l’organisation réelle de l’oeuvre. Dans un quatrième temps, je montrerai, en me concentrant sur la notion de symbole incomplet, que, pour Russell, la coordination des différents systèmes symboliques, loin d’être, comme le suggère Wittgenstein, une activité annexe et secondaire, est une tâche logique. Je reviendrai enfin, en conclusion, sur l’interprétation de Mülhölzer. Je suis séduit par l’idée que la philosophie des mathématiques de Wittgenstein conjugue les influences de Hilbert et de Russell. Mais, à la différence de Mülhölzer, je vois dans cette double référence l’origine d’une tension interne, non dépassée par Wittgenstein.
1.
La partie III des Remarques commence par cette affirmation : « Une preuve mathématique doit être synoptique [übersichtlich][7]. » Comment comprendre cette exigence ? Comment définir la notion de synopticité ? Mülhölzer remarque que le concept est lié chez Wittgenstein à l’idée qu’une preuve doit pouvoir être reproductible : aucun désaccord ne doit pouvoir s’élever sur le fait que deux occurrences d’une preuve soient des occurrences de la même preuve[8]. C’est cette connexion entre synopticité et reproducibilité qui justifie, selon Mülhölzer, d’établir un lien entre Wittgenstein et Hilbert. Le commentateur cite notamment plusieurs textes dans lesquels Hilbert mobilise une terminologie qui sera celle utilisée par Wittgenstein. Ainsi en va-t-il du paragraphe 25 de Neubegründung der Mathematik datant de 1922 (cité dans Mülhölzer 2005, p. 61) :
Les opérations abstraites faites sur et à l’aide de contenus conceptuels généraux [tels que Dedekind et Frege les pratiquent] se sont révélées inadéquates et incertaines. Quelque chose, présupposée dans l’application de l’inférence logique et de l’effectuation des opérations logiques, doit au contraire déjà être donnée dans la représentation : certains objets discrets extra-logiques, qui existent intuitivement comme expériences immédiates avant toute pensée. Pour que l’inférence logique puisse être certaine, il faut que l’on ait de ces objets une vision complètement synoptique dans toutes leurs parties, et que leurs présentations, leurs différences, leurs successions (comme les objets eux-mêmes) existent pour nous de façon immédiatement intuitive, comme quelque chose que l’on ne peut pas réduire à quelque chose d’autre. Parce que j’adopte ce point de vue, les objets de la théorie des nombres sont pour moi […] les signes eux-mêmes, dont la forme peut être de façon certaine et générale reconnue par nous — indépendamment des conditions spatiales ou temporelles, des conditions spéciales de leur production, et des différences insignifiantes dans le produit fini. L’attitude philosophiquement solide qui, je crois, est requise dans les fondements des mathématiques pures — comme dans toute pensée, compréhension, communication scientifique — est la suivante : au commencement, il y a le signe.
Le concept hilbertien de signe conjugue la synopticité (un signe doit être reconnaissable au premier coup d’oeil) et la reproductibilité. La thèse formaliste, c’est-à-dire, grossièrement dit, la conception selon laquelle les mathématiques sont d’abord et avant tout une affaire de manipulation de signes, est chez Hilbert, fondamentale, puisqu’elle est la source à la fois de la réponse hilbertienne au subjectivisme des intuitionnistes et du projet fondationnaliste visant à mettre les mathématiques à l’abri de toute contradiction possible — ce serait en dernière instance parce qu’aucun désaccord ne peut s’élever à propos de l’identité des signes que les mathématiques seraient communicables et qu’un consensus pourrait naître sur la question des fondements[9].
L’idée que Wittgenstein aurait emprunté à Hilbert son concept de preuve synoptique est originale et convaincante[10]. Le rapprochement a néanmoins ses limites que Mühlhölzer souligne lui-même fortement (2005, p. 65) :
Wittgenstein utilise [le terme « synoptique »] dans un but résolument anti-fondationaliste. Alors qu’en ce qui concerne Hilbert, c’est au contraire le programme fondationaliste qui le conduit à insister autant sur la synopticité […] des preuves !
C’est précisément à ce stade que le commentateur fait intervenir la référence aux Principia Mathematica de Russell : si l’exigence de synopticité se conjugue chez Hilbert à la volonté de fonder les mathématiques, elle est retournée, chez Wittgenstein, contre le projet fondationaliste de Russell. Les preuves synoptiques sont selon Wittgenstein les preuves ordinaires, celles que l’on trouve dans les mathématiques « à l’état naturel », non fondées. Au contraire, les preuves des Principia ne sont pas synoptiques et, pour cette raison, le logicisme russellien doit être abandonné.
Avant d’expliquer la façon dont Mühlhölzer interprète cette manoeuvre, je vais reprendre un exemple qui traverse les Remarques sur les fondements des mathématiques : celui de l’addition dans la notation décimale. Pour Russell, une équation arithmétique élémentaire du type
est un théorème logique (une « tautologie » dans la terminologie wittgensteinienne). Wittgenstein attribue à Russell l’idée qu’une proposition de type (a) se traduit sous la forme d’une implication entre une conjonction de deux propositions existentielles et une proposition existentielle :
Il y aurait a variables dans (Ǝxyz…), b variables dans (Ǝuvw…), c variables dans (Ǝpqr…) ; la conjonction coderait l’addition, et l’implication l’égalité. Ainsi “2+1 = 3” serait rendu par :
Wittgenstein ne conteste pas la possibilité de traduire (a) par (b), il ne conteste pas non plus la possibilité de prouver que (b) est une tautologie. Ce qu’il pointe, c’est la nécessité pour pouvoir identifier (c) comme une instance de (b), et donc comme la traduction d’une équation de type (a), d’un dispositif permettant de regrouper et de décompter les variables apparaissant à gauche et à droite du signe d’implication. Ainsi, voir (c) comme une traduction de 2+1 = 3 nous conduit à découper l’expression en elle-même déjà compliquée de la manière suivante :
Ici, parce que l’addition est relativement simple, souligner les variables est suffisant ; mais lorsque les nombres ajoutés sont plus grands, alors il n’est plus possible de reconnaître immédiatement le nombre de variables apparaissant après les quantificateurs. Ainsi, pour traduire l’équation « 2434+7566=10000 » (1956, p. 68), il devient absolument nécessaire d’introduire un dispositif d’indexation nous permettant d’identifier le nombre de variables après le premier quantificateur à 2434, et donc d’utiliser la notation décimale ou un symbolisme équivalent[11].
Il est important de bien comprendre la nature de l’objection. Wittgenstein ne conteste pas que (b), (c) et (d) puissent être prouvées dans le système russellien. Son attaque consiste à faire remarquer que les preuves de (b), (c) et (d) ne sont pas exactement des preuves de (a) : le passage de la tautologie russellienne à la proposition mathématique « réelle » exige la connaissance de règles, parfois complexes, comme celles qui nous permettent de comprendre le fonctionnement du calcul décimal. Or, la connaissance de ces règles qui coordonnent les expressions logicisées à leurs corrélats plus familiers constitue elle-même, affirme Wittgenstein (et c’est là le point décisif), une connaissance proprement mathématique (1956, § 46) :
Maintenant l’on pourrait dire simplement : si un homme avait découvert le calcul dans le système décimal — il aurait fait une découverte mathématique ! — Même s’il avait eu sous les yeux les « Principia Mathematica » de Russell. […] Celui qui a découvert le calcul décimal a fait une découverte mathématique. Mais n’aurait-il pas pu faire cette découverte en utilisant uniquement les symboles russelliens ? Il aurait en quelque sorte découvert un nouvel aspect.
Wittgenstein a, de fait, raison : l’invention du système décimal, et plus généralement des systèmes de numération à base par les mathématiciens arabes, a été une invention d’une importance fondamentale en arithmétique. Or, si l’on en croit Russell, tout le contenu de notre connaissance des nombres entiers est donné par les schémas de type (b), qui ne fait aucune place à la maîtrise de ces systèmes symboliques. Peut-on, dans ces conditions, dire que l’arithmétique a été réduite à la logique ?
La critique anti-fondationaliste de Wittgenstein n’est rien d’autre qu’une généralisation de cette analyse. Pour pouvoir corréler les théorèmes mathématiques usuels à leurs traductions russelliennes, il est nécessaire de faire appel à des règles de traduction. Or, la connaissance de ces règles constitue une connaissance authentiquement mathématique. Citons le § 46 dans son ensemble :
J’inclinerais à dire : les mathématiques sont une mixture BIGARRÉE de techniques de démonstration. […]
Et c’est comme si nous disions : celui qui posséderait un système semblable au système russellien et produirait à partir de lui, au moyen de systèmes adéquats de définition, des systèmes tels que le calcul différentiel, celui-là engendrerait un nouveau morceau de mathématique.
Maintenant l’on pourrait dire simplement : si un homme avait découvert le calcul dans le système décimal — il aurait fait une découverte mathématique ! — Même s’il avait eu sous les yeux les « Principia Mathematica » de Russell.
Qu’en est-il lorsqu’on coordonne un système de preuves à un autre ? Il existe alors une règle de traduction qui permet de traduire les propositions prouvées dans un système, en propositions prouvées dans l’autre.
Mais on peut imaginer que quelques — ou tous — les systèmes de preuves des mathématiques modernes seraient subordonnés de cette façon à un système — le système russellien par exemple. De telle sorte que toutes les preuves, même compliquées, pourraient être effectuées dans ce système. Ainsi, il n’y aurait que ce système — et non une multiplicité de systèmes ? Mais il faut que l’on puisse montrer que cet unique système peut se décomposer en cette multiplicité d’autres. — Une partie du système possédera la propriété de la trigonométrie, une autre celle de l’algèbre, et ainsi de suite. On peut donc dire que différentes techniques sont employées dans ces parties.
Je disais : celui qui a découvert le calcul décimal a fait une découverte mathématique. Mais n’aurait-il pas pu faire cette découverte en utilisant uniquement les symboles russelliens ? Il aurait en quelque sorte découvert un nouvel aspect.
La thèse logiciste est que l’ensemble des mathématiques « ordinaires » peut être développé à partir de quelques notions primitives et d’un certain nombre de principes premiers constitutif de la logique. Certes, Russell reconnaît que des définitions et des règles de coordination sont nécessaires pour garantir la possibilité de circuler entre le langage logique fondamental et les symbolismes utilisés couramment par les mathématiciens. Mais le logiciste maintient que ces dispositifs sont, en théorie, dispensables. Ainsi, Russell explique (1910, p. 11) « qu’une définition, à strictement parler, ne fait pas partie du sujet dans lequel elle apparaît » et que, « d’un point de vue théorique, il n’est jamais nécessaire de donner une définition [parce que] nous pouvons toujours utiliser le definiens à la place et ainsi nous passer du definiendum ». Les définitions et les règles de coordination doivent, selon Russell, être considérées comme des parties annexes du système, des accompagnements pragmatiques dont la nécessité provient de la limitation de nos esprits. Une preuve d’un théorème arithmétique élémentaire, comme celui qui affirme l’existence d’un nombre infini de nombres premiers, par exemple, écrite dans le langage des Principia, serait très longue et ne pourrait en pratique ni être écrite ni être lue, d’où le caractère indispensable des dispositifs permettant d’abréger les expressions du langage logique. Mais ces mécanismes ne sont nécessaires que « psychologiquement » ou « pragmatiquement » ; d’un point de vue théorique, les preuves russelliennes sont les seules légitimes et se suffisent à elles-mêmes.
C’est ce dernier point que refuse Wittgenstein. Les règles de coordination corrélant preuves logiques à preuves mathématiques ordinaires ne sont pas extérieures au « sujet », elles sont des parties intégrantes des mathématiques. La critique est dévastatrice. Russell affirme avoir réduit les mathématiques à la logique ; Wittgenstein lui répond que cette réduction met elle-même en jeu des mathématiques, donc que cette opération de réduction, loin d’aboutir à une absorption des mathématiques dans la logique, doit bien plutôt être considérée comme une extension des mathématiques. Les mathématiciens élaborent souvent ce qu’ils appellent des théorèmes de représentation. Ces théorèmes connectent deux disciplines mathématiques différentes, en montrant qu’on peut trouver une traduction des concepts de l’une dans le langage de l’autre qui est telle que si p est un théorème de la première théorie, alors sa traduction t(p) est un théorème de la seconde[12]. Selon Wittgenstein, le logicisme de Russell viserait à établir un théorème de représentation de ce genre pour toutes les mathématiques connues — il viserait à montrer que la théorie des ensembles, l’arithmétique, la théorie des réels, etc., peuvent être représentées dans la théorie des types ramifiées. Le résultat serait intéressant en soi — mais il ne constituerait pas une « réduction » des mathématiques, puisque l’élaboration d’un théorème de représentation est, par excellence, une tâche mathématique[13].
On peut résumer le propos de Wittgenstein par un schéma. Russell distinguerait entre un niveau logique fondamental dans lequel le contenu mathématique serait dérivé des premiers principes, d’une part, et un niveau des mathématiques ordinaires, mobilisant les diverses notations que les mathématiciens utilisent dans leur pratique habituelle, d’autre part. La coordination entre ces théories de niveau supérieur et la logique s’effectuerait par le biais d’un système de coordination, c’est-à-dire par les règles de traduction que sont les définitions. On aurait donc :
Selon Wittgenstein, Russell privilégierait le développement horizontal par rapport à la progression verticale. Les règles de coordination ne joueraient dans les Principia qu’un rôle accessoire, et rien dans la thèse logiciste ne serait affecté si on les éliminait. Or cette dimension verticale engage, selon Wittgenstein, des opérations proprement mathématiques, que laisse échapper, en quelque sorte par construction, le projet logiciste : les mathématiques nécessaires pour articuler les différents plans horizontaux (par exemple, la théorie des systèmes numériques à base à la logique) ne seraient tout simplement pas prises en considération en tant que telles dans le cadre conceptuel russellien.
Cette lecture est proche de celle défendue par Mülhölzer. Le commentateur utilise une terminologie différente, car, s’appuyant sur certains paragraphes des Remarques[14], il centre son analyse sur la question des critères d’identité des symboles. Ainsi (2005, p. 81) :
Le système de Russell ne peut pas être considéré comme un système dans lequel les niveaux les plus hauts sont constitués à partir du niveau fondamental, parce que les énoncés et preuves des niveaux les plus hauts doivent être pris avec leurs propres critères d’identité, qu’ils ne tirent pas du système russellien lui-même.
Mülhölzer insiste sur le fait que le problème pour Wittgenstein n’est pas celui, épistémologique ou pragmatique, de savoir quelle version d’une preuve ou d’un théorème (la version logique ou celle des mathématiques ordinaires) est la plus facile à comprendre et à accepter. À cette question, Russell aurait répondu que la version usuelle, non logicisée, est la plus accessible, voire la seule qui nous soit accessible. Mais il aurait immédiatement ajouté que, d’un point de vue théorique, ce problème de la commodité de l’accès n’est absolument pas pertinent. Si telle avait été l’objection de Wittgenstein, elle n’aurait donc pas été pertinente. Ce que conteste Wittgenstein, c’est bien plutôt la possibilité de distinguer entre un niveau épistémologique accessoire et un niveau logique substantiel : ce sont les preuves et les propositions mathématiques elles-mêmes (non la connaissance que nous en avons) qui sont modifiées lorsque l’on passe des niveaux supérieurs au niveau de base, ce sont les critères d’identité des symboles (et pas simplement les accès épistémiques) qui sont affectés par cette transition. Si la terminologie diffère, la présentation que nous avons faite de la critique de Wittgenstein est donc, en son essence, la même que celle de Mühlhölzer : l’objection porte sur la nature des règles de traduction, qui, loin d’être des éléments annexes et dispensables, extérieurs au sujet, font partie intégrante des mathématiques. Dans le reste de l’article, je vais dire pourquoi cette critique, malgré sa force et son intérêt, manque sa cible.
2.
Revenons d’abord sur l’exemple crucial de l’équation arithmétique (a) et de sa traduction. Wittgenstein reproche à Russell de passer sous silence les procédures d’indexation qui permettent de regrouper et de compter les variables dans la formule (b) — de ne pas fournir de cadre pour penser la notation décimale (ou un équivalent). À première vue, la critique frappe juste. La situation est même pire que ne le dit Wittgenstein, puisque, dans les Principia, Russell ne semble pas se préoccuper de traduire dans le langage logique les nombres finis. Les symboles « 0 », « 1 », « 2 », peut-être « 3 »[15], apparaissent bien, et on trouve également une définition de la relation « succession », que Russell utilise pour introduire une variable dont le domaine correspond aux entiers finis[16] — mais c’est tout. Russell ne se donne pas la peine d’expliquer comment noter « 5 », « 7 », ou « 2434 ». À strictement parler, s’il est donc possible de traduire (a) dans les Principia, il est difficile de voir comment « 5+7=12 » (sans parler de « 2434+7566=10000 »), peut être écrit.
Sous un autre aspect, toutefois, la pensée de Russell est bien plus complexe que ne le laisse entrevoir Wittgenstein. Prenons le cas du nombre 2. Comment Russell définit-il ce nombre ? Il n’y a pas de réponse univoque à cette question, car il n’y a pas une seule version logique de « 2 », mais plusieurs, liées entre elles par des relations parfois complexes. En laissant de côté tout ce qui a trait aux considérations typologiques, on peut distinguer au moins quatre notions :
La première apparaît tôt, en *34.02, avec l’introduction de R² et R3 pour symboliser le produit relatif R÷ R et R²÷ R. À ce stade, aucune addition n’est introduite entre les exposants des opérations (donc entre 1 et 2, ou 2 et 3). Beaucoup plus tard, en *301, Russell définit le symbole Rn avec ν entier quelconque.
C’est en *54.02 que Russell définit le cardinal 2, noté 2c. Une addition entre nombres cardinaux est définie en *110, et une distinction entre cardinaux inductifs et non inductifs est faite en *120.
Le troisième concept de 2, celui du nombre relationnel 2, noté 2r, est introduit en *56. Une arithmétique générale des nombres relationnels est développée en *180, et une sous-espèce de ces nombres relationnels, nos familiers nombres ordinaux, sont étudiés en *251 et *261 (section dédiée plus spécifiquement aux ordinaux finis).
Enfin, en *121, au cours du développement de la théorie des cardinaux inductifs, un symbole 2P (où P est une relation binaire quelconque) est introduit, dans le but d’expliquer le rôle des entiers dans le décompte d’un ensemble d’objets.
Cette multiplicité des formes logiques de ce qui correspond à un même concept usuel, celui de 2, pose une première difficulté : contrairement à ce que suggère Wittgenstein, il n’y a tout simplement pas de manière univoque de traduire les équations (a) dans le langage logique des Principia. Cela crée une difficulté, parce que tout le raisonnement de Wittgenstein se fonde sur l’existence d’un écart entre les manières usuelles de noter les équations arithmétiques et la version que Russell en donnerait[17]. Il reste néanmoins que, malgré cette variété de traductions possibles, on ne trouve chez Russell aucune réflexion explicite sur le système décimal ou sur un symbolisme équivalent, et que la critique wittgensteinienne reste sur ce point pertinente. Je voudrais maintenant montrer que l’on peut naturellement étendre certaines remarques faites dans la section *121 (le 4e item de la liste précédente) pour construire une théorie des systèmes à base numérique.
Dans la section *120, Russell définit les cardinaux inductifs comme la postérité de 0 par la relation (+c 1). Si on laisse la question des types de côté, la définition russellienne reprend celle de Frege : un cardinal est un ensemble d’ensembles équinumériques. Deux cardinaux M et N ont donc la relation (+c 1), lorsque M est le cardinal de l’union d’une classe ayant N éléments avec un singleton dont l’élément n’appartient pas à la classe à N éléments (voir *100 et *110). La notion de postérité d’un terme est introduite en *90 ; elle est définie, comme c’était le cas chez Frege, par référence aux classes héréditaires (y appartient à la R-postérité de x « lorsque x appartient au champ de R, et y appartient à chaque classe héréditaire à laquelle x appartient » [1910, p. 576]). Il suit que les cardinaux inductifs considérés en *120 « embrassent 0, 1, 2, … et généralement tous les cardinaux qui pourraient être communément appelés finis, tous ceux qui peuvent exprimés dans le système de numération arabe usuel, et pas d’autres » (1912, p. 206). Russell élabore en *120 une arithmétique des cardinaux finis (par exemple, il montre que si a et b sont deux cardinaux inductifs et que a≠0, alors a+b>b), mais il ne dit rien sur le système décimal ou des systèmes équivalents.
La section *121 porte apparemment sur un sujet complètement différent, puisqu’elle traite de « la classe des termes entre x et y eu égard à une certaine relation P, c.-à-d. des termes qui résident sur une route allant de x à y entre lesquels deux termes consécutifs ont la relation P » (1912, p. 233). La théorie des « P-routes » et des « P-successions » est compliquée parce que Russell ne pose aucune contrainte sur la relation P elle-même, ce qui fait que des considérations relatives à l’existence et à la multiplicité des « P-routes » sont requises. Je vais ici restreindre le propos aux relations P qui engendrent ce que Russell appelle des progressions (c.-à-d. des suites isomorphes à la suite des entiers finis ou des cardinaux inductifs finis — P étant alors la relation d’un terme à son successeur). Cette restriction étant faite, on peut, suivant Russell, définir l’intervalle xy (noté « P(x—y) »), comme l’ensemble des termes de l’unique P route qui va de x à y (x et y étant compris). On définit ensuite la notion de ν-intervalle (où ν est un entier fixé) de la manière suivante : un ν-intervalle est un P-intervalle qui est tel que sa cardinalité est égale à ν+c1. Lorsque deux termes a et b du champ de P sont les extrémités d’un ν-intervalle, on dit qu’ils ont entre eux la relation Rν. Intuitivement, si a et b ont la relation Rν, c’est qu’ils sont séparés par ν−c1 termes de la progression. Enfin Russell introduit le concept de νème dans la relation P (noté νP), caractérisé ainsi : y=νP si et seulement si y a la relation Rν avec le premier terme de la série P.
Pourquoi entrer dans tous ces détails ? Russell explique que cette théorie permet de comprendre comment les entiers sont utilisés pour décompter des objets : « la corrélation [entre intervalles et cardinaux inductifs] est l’essence logique du processus de décompte ; le dernier cardinal utilisé dans la corrélation est le nombre cardinal des termes comptés » (1912, p. 234). Russell a donc une conception plus raffinée qu’on ne le pense ordinairement de la façon dont les entiers sont utilisés dans la vie quotidienne. En particulier, à la différence de Frege et de son fameux principe de Hume, l’auteur des Principia ne pense pas que la définition des cardinaux par la relation d’équinuméricité entre classes suffise à rendre compte de l’application des entiers[18]. L’usage des entiers pour « mesurer » un ensemble fini exige qu’on décompte ces éléments, et ce décompte nécessite l’introduction d’une relation de succession entre les éléments et l’introduction de la notion d’intervalle[19]. Ce point est en soi important et devrait faire l’objet d’une élaboration plus poussée. Mais c’est pour une autre raison que je me suis penché sur la section *121. Si on n’y trouve en effet aucune considération explicite relative à la notation décimale, certains développements conduisent cependant immédiatement à cette question. Toujours dans l’hypothèse où P est une progression, Russell montre en *121.35 que le produit relatif de Pv et Pμ est égal à Pv+μ, soit Pv| Pμ = Pv+μ[20]. Il prouve également, en *121.36, que si les mêmes conditions sont satisfaites, alors (Pv)μ=Pv×μ. Intuitivement, ces deux résultats signifient ceci : si à partir d’un point x, on avance successivement de ν puis de μ pas, alors on aura avancé de ν+μ pas dans la P-série ; et si on répète μ fois des pas d’intervalle de « taille » ν, alors on effectue un pas dont la taille est un intervalle de « taille » ν×μ. Ce qui est ici fondamental, c’est la possibilité de considérer et de composer des « pas » de différentes tailles. Cette idée est en effet au coeur du système décimal, et plus généralement des notations numériques à base. Lorsque j’écris 2434, je répète deux fois un pas de taille 1000, quatre fois un pas de taille 100, trois fois un pas de taille 10, et quatre fois un pas de taille 1[21]. Pour pouvoir noter un entier dans le système décimal, il est nécessaire de pouvoir varier les tailles des unités de compte et de pouvoir ensuite additionner les « pas » effectués. Or les théorèmes *121.35 et *121.36 nous permettent d’effectuer ces deux opérations. Ainsi, pour écrire que y est le 2434e terme d’une progression P dont le premier terme est a, je n’ai pas besoin d’utiliser 2434 signes (ou 2434 variables) comme le suggère Wittgenstein. Je peux simplement écrire :
Et pour traduire et prouver, dans la terminologie des Principia, l’équation 2434+7566=10000, auquel Wittgenstein fait allusion, je peux démontrer que (toujours en faisant l’hypothèse que P est une progression) :
Ce qui manque à Russell pour véritablement retrouver les systèmes à base numérique, c’est de fixer l’échelle des « unités » — c’est-à-dire de poser que les différents « pas » qui nous servent à compter le nombre d’éléments devront tous être des puissances du plus petit d’entre eux (excepté le pas de taille un). L’importance de la fixation d’une échelle est certes grande dans la construction d’un système à base, puisqu’elle sous-tend la possibilité d’associer à chaque signe numérique un polynôme dans la base en question. Mais, même si cette idée est absente de la section *121, Russell présente suffisamment d’éléments pour imaginer comment étendre la théorie afin d’y inclure les systèmes à base[22]. L’essentiel du travail logique est fait par Russell, et on peut penser que si le philosophe n’a pas cru bon d’aller plus loin, c’est tout simplement parce qu’il n’était pas intéressé par le sujet[23].
Revenons à la critique de Wittgenstein. Le philosophe insiste sur deux choses : d’abord sur le fait qu’inventer un système d’abréviations comme la notation décimale consiste à engendrer « un nouveau morceau de mathématiques » ; sur le fait ensuite que cette extension échappe au « système » des Principia, qui ne considère pas l’étude de ces symbolismes comme faisant partie du sujet à traiter. L’analyse de la section *121 révèle que, contrairement à ce qu’affirme Wittgenstein, on trouve chez Russell les ressources permettant de rendre compte des systèmes à base numérique. Si Wittgenstein a raison d’affirmer que le système décimal est un objet mathématique, il a tort de croire que Russell ne peut en rendre compte : la traduction prétendument russellienne que Wittgenstein propose n’est tout simplement pas la bonne[24].
Et ce point n’est pas simplement anecdotique, car il montre que l’on ne peut tout simplement pas, comme Wittgenstein le fait, opposer aussi abruptement le développement du contenu logique (la dimension horizontale dans le schéma de la § 1) de l’introduction des systèmes chargés de coordonner les niveaux de notations (la dimension verticale du schéma). On peut lire *121.35 et *121.36 comme des propositions permettant d’abréger les notations (d’écrire (P1)104 au lieu d’écrire 10000 fois P), mais on peut également voir ces propositions comme des théorèmes logiques « substantiels », portant sur le contenu mathématique, et non sur son mode d’expression. Autrement dit, le soupçon qui naît de l’analyse précédente est que Wittgenstein exagère la portée de la distinction entre le niveau épistémologique ou pragmatique et le niveau logique substantiel dans la pensée de Russell — qu’il amplifie, à fin polémique, la distance entre ce qui appartient en propre au « système » et ce qui ne serait qu’accessoire et qui pourrait être éliminé. Les deux sections suivantes vont développer ce soupçon[25].
3.
Wittgenstein présuppose qu’il y a chez Russell un « système » fondamental que l’on pourrait opposer à la multiplicité des autres « systèmes » mathématiques ordinaires. À l’uniformité de la logique des Principia, il conviendrait d’opposer la bigarrure des mathématiques. Cette opposition entre unicité et multiplicité scande la troisième partie des Remarques sur les fondements des mathématiques[26]. Qu’on me permette de citer une nouvelle fois le § 46 en soulignant le jeu des contrastes :
Mais on peut imaginer que quelques — ou tous — les systèmes de preuves des mathématiques modernes seraient subordonnés de cette façon à un système — le système russellien par exemple. De telle sorte que toutes les preuves, même compliquées, pourraient être effectuées dans ce système. Ainsi, il n’y aurait que ce système — et non une multiplicité de systèmes ? — Mais il faut que l’on puisse montrer que cet unique système peut se décomposer en cette multiplicité d’autres.
Mais quel est exactement ce système des Principia dont parle Wittgenstein ? S’agit-il de la théorie des types ramifiée qui constitue le niveau logique fondamental chez Russell[27] ? Ou bien s’agit-il du système dans lequel les preuves des Principia sont effectivement conduites ? L’auteur des Remarques fait comme si cette alternative n’existait pas, c’est-à-dire comme si les théorèmes et les preuves des Principia étaient réellement développés dans le langage de la théorie ramifiée des types, et comme si Russell, seulement après coup, effectuait la transition entre le niveau logique de base et les systèmes mathématiques usuels.
Or ce n’est absolument pas de cette façon que l’auteur des Principia procède. Prenons l’exemple de la théorie des ensembles. Chez Russell, il n’y a pas d’ensembles, donc pas de symbole logique qui s’y rapporte et qui se rapporte aux relations entre ensembles. Pourtant, la théorie des ensembles, telle qu’elle est développée dans les Principia, est, sur le plan des symboles, proche des présentations modernes. Russell introduit des variables de classes et une relation d’appartenance ensembliste — ce, alors même que ces signes ne sont que des manières compactes de représenter des propositions dans lesquelles ils n’ont aucune occurrence. Si on suit la suggestion de Wittgenstein, Russell aurait dû développer la théorie des ensembles dans le langage fondamental (celui de la théorie des types ramifiés), puis introduire les dispositifs définitionnels qui nous permettent de reconnaître dans certaines propositions compliquées la forme familière des théorèmes ensemblistes. Russell ne respecte pas ce parcours. Il effectue en réalité simultanément les deux opérations distinguées par Wittgenstein : il introduit la notation pertinente pour parler des ensembles en même temps qu’il développe la théorie de ce qu’elle est censée exprimer. Et cette manière de procéder est un trait caractéristique des Principia : les notations s’ajustent toujours au contenu qu’elles sont censées véhiculer. Il n’y a donc pas, sur le plan notationnel, de système unique, mais plusieurs systèmes qui s’articulent entre eux de façon souple selon les parties et les sujets traités. L’idée qu’il y aurait dans les Principia un système uniforme fondamental coordonné après coup à une pluralité de systèmes censés correspondre aux notations utilisées par les mathématiciens relève du mythe. Il n’y a pas, chez Russell, de mouvement « horizontal » de déduction des théorèmes dans le langage de base, auquel succéderait une phase d’ascension « verticale », consistant à introduire de nouvelles notations. La progression dans les Principia n’est ni verticale ni horizontale — elle se fait toujours en oblique ; l’introduction de nouvelles notations est un moment du processus déductif.
L’importance « logique » que Russell attache à l’introduction des symbolismes est explicitement revendiquée dans un passage qui est, de façon surprenante, peu étudié par les commentateurs, alors qu’il se trouve pourtant dans la partie introductive des Principia. Il s’agit des points (3) et (4) des remarques que Russell consacre au symbolisme en logique (1910, p. 2) :
(3) L’adaptation des règles du symbolisme aux processus de déduction aide l’intuition dans des régions trop abstraites pour que l’imagination présente rapidement à l’esprit la véritable relation entre les idées employées. Car les diverses collocations de symboles deviennent familières en ce qu’elles représentent des collocations importantes d’idées ; et à leur tour, les relations possibles — selon les règles du symbolisme — entre ces collocations de symboles deviennent familières, et ces nouvelles collocations représentent encore plus de relations compliquées entre les idées abstraites. Et ainsi l’esprit est finalement conduit à construire des séries [trains] de raisonnements dans des régions de la pensée dans laquelle l’imagination serait entièrement incapable de se soutenir elle-même sans l’aide du symbolisme. Le langage ordinaire ne procure aucune aide de ce genre. Sa structure grammaticale ne représente pas de façon univoque les relations entre les idées impliquées. Ainsi, « la baleine est grosse » et « 1 est un nombre » se ressemblent tous les deux, de sorte que le regard n’aide pas l’imagination.
(4) Le laconisme [terseness] du symbolisme permet à une proposition d’être représentée au regard comme un tout, ou tout du moins, comme divisées en deux ou trois parties là où les articulations naturelles, représentées dans le symbolisme, apparaissent. C’est une propriété humble, mais qui est en réalité très importante eu égard aux avantages énumérés sous le numéro (3).
Le premier alinéa est construit autour d’un contraste très classique[28] entre l’imagination (ou l’intuition) et la pensée : il y a des idées dont la complexité est si grande qu’on ne peut se les représenter en imagination dans toutes leurs parties. Le symbolisme, en associant un signe à une « collocation » importante d’idées, c’est-à-dire en traitant le multiple comme s’il était un, permet de repousser les limites de l’imagination. Le point sur lequel insiste Russell est le caractère indéfiniment itérable de l’opération — une collocation de collocations d’idées peut à son tour être représentée par un signe, et ainsi de suite. Cela correspond au mouvement de progression oblique dont j’ai parlé : le logicien des Principia ressemble à un funambule qui, après s’être assuré de la solidité de la corde (d’un système d’abréviation), n’hésite pas à s’engager dessus pour se déplacer (pour raisonner) comme si cette corde était le sol (le niveau fondamental du langage de la théorie des types), et qui progresse ainsi, de corde en corde, de plus en plus loin de la terre ferme. Comme le précise le second paragraphe, l’aide que le symbolisme apporte en logique ne provient pas, comme on pourrait le croire, de sa capacité à tout expliciter[29], mais au contraire de l’humble « propriété » consistant à présenter au regard une multiplicité comme une unité (ce que Russell appelle joliment son « laconisme »). Par bien des façons, ce texte de Russell annonce et anticipe les développements de Wittgenstein dans la troisième partie des Remarques. L’importance attachée au laconisme fait écho à l’idée selon laquelle la construction d’un système d’abréviation pertinent doit être considérée comme une opération authentiquement mathématique.
Il semble pourtant que cette première parade ne suffise pas à désarmer la portée critique des remarques wittgensteiniennes. La valeur attribuée au laconisme dans le texte de Russell procède en effet de considérations qui sont, ultimement, de nature psychologique. C’est somme toute un défaut de l’imagination humaine qui rend l’usage des abréviations indispensable. On peut penser qu’un autre esprit, qui aurait le pouvoir d’embrasser l’ensemble du contenu mathématique directement, pourrait complètement se passer de l’aide des symboles. Ce raisonnement est ainsi tout à fait compatible avec ce que dit Russell plus loin dans les Principia et que nous avons rappelé dans la section 1 : « d’un point de vue théorique » (c’est-à-dire indépendamment de toute considération relative aux limites de notre imagination), « il n’est jamais nécessaire de donner une définition ». On n’échappe pas à la critique wittgensteinienne en pointant que les Principia forment un « mélange bigarrée », dans lequel Russell a recours à divers systèmes de notation pour développer différents pans du contenu logique. Car Wittgenstein aurait alors beau jeu de rétorquer que la question n’est pas de l’ordre du fait, mais de l’ordre du droit, et que Russell ne cesse de répéter qu’en droit il est possible de se dispenser de toute abréviation et d’en rester au langage fondamental. Le philosophe, dans la troisième partie des Remarques, simplifierait certes à outrance le projet logiciste, mais il ne le caricaturerait pas — il se situerait sur le plan du principe. À la limite, cette distance entre les Principia « réels » et les Principia tels que Wittgenstein les décrit ne ferait même, au final, que renforcer la position wittgensteinienne : même Russell n’a pas pu se tenir à la position de principe explicitement revendiquée. Il faut donc creuser plus profond pour neutraliser l’objection wittgensteinienne.
4.
La pointe de la critique de Wittgenstein consiste à maintenir que la construction des systèmes symboliques de niveau supérieur est un travail proprement mathématique — non pas un ajout secondaire dont le but serait de pallier une déficience de notre imagination théorique. Russell maintient que les dispositifs notationnels ne sont en théorie pas nécessaires. En découle-t-il pour autant que les règles de coordination entre les diverses couches notationnelles échappent à la juridiction de la logique ou des mathématiques ? Wittgenstein suggère que c’est le cas : le fait que les définitions des Principia soient considérées comme théoriquement superflues manifesterait le fait qu’elles sont exclues de la sphère mathématico-logique. C’est ici, me semble-t-il, que Wittgenstein pousse le bouchon trop loin : il pourrait se faire que, bien qu’étant considérées comme théoriquement dispensables, les définitions et les règles de coordination soient perçues par Russell comme faisant partie intégrante de la logique. C’est vers cette conclusion que nous avait orienté la discussion relative au système décimal dans la section 2 : des théorèmes particuliers, les théorèmes *121.35 et *121.36, permettaient d’élaborer une théorie, en droit superflue, des systèmes à base numérique. Je vais développer ici cette ligne argumentative, en me focalisant sur l’usage des symboles incomplets (notamment du symbole de description définie). L’idée, déjà développée dans Steiner 1975 (p. 58-69), est que les définitions ne se réduisent pas toutes à de simples « abréviations » : les « définitions dans l’usage » des Principia mettent en jeu des opérations authentiquement logiques, dont la complexité est sans commune mesure avec celles des règles gouvernant les simples « abréviations »[30].
La plupart des signes introduits par définition sont, dans les Principia, des symboles incomplets, c.-à-d. des expressions « qui [sont] censées n’avoir aucune signification prise isolément, mais qui [sont] seulement définies dans certains contextes » (1910, p. 69). Ainsi, en va-t-il du symbole de description définie « (ιx)(ϕx) » :
L’expression « le ϕ est ψ » signifie qu’il y a un unique objet dont la propriété est ϕ, et que cet objet a la propriété ψ. Ce n’est pas à proprement parler le signe « (ιx)(ϕx) » qui est défini, mais « ψ(ιx)(ϕx) », c’est-à-dire le symbole de description pris dans le contexte « ψ… », ou encore, dit Russell, « l’usage » de ce symbole. Russell ajoute un marqueur de portée pour éliminer l’ambiguïté dans l’énoncé « le ϕ n’est pas ψ » — qui peut vouloir dire soit « le ϕ existe et n’est pas ψ » ([(ιx)(ϕx)]~ψ(ιx)(ϕx)), soit « il est faux que le ϕ existe et soit ψ » (~[(ιx)(ϕx)]ψ(ιx)(ϕx)). Les symboles de description sont ubiquitaires dans les Principia. Ils apparaissent notamment dans la définition des fonctions descriptives, qui sont la version russellienne du concept mathématique de fonction[31]. Russell use également d’expressions incomplètes qui ne sont pas des descriptions définies. Ainsi en va-t-il des symboles de classe, que nous avons déjà rencontrés dans la section 3. La classe des entités satisfaisant y est définie de cette manière (1910, p. 199) :
où f est le contexte de la définition dans l’usage du symbole de classe « ẑ(ψz) ». Comme le schéma d’analyse qui prévaut pour les symboles de description est étendu par Russell à l’étude des propriétés des autres expressions incomplètes[32], je me concentrerai ici avant tout sur l’analyse des descriptions définies.
Dans la section *14, plusieurs théorèmes ont pour but d’expliciter les différences entre les règles qui gouvernent l’usage des symboles de description et celles qui dirigent l’usage des noms du langage fondamental. Ainsi (1910, p. 174-175)[33] :
Ces théorèmes prouvent que, si (ιx)(ϕx) existe, alors l’instantiation universelle et la réflexivité de l’identité s’appliquent aux symboles de description. Dans la même veine, à la fin de *14[34] Russell montre que, si E ! (ιx)(ϕx), la portée de (ιx)(ϕx) n’a aucune influence sur la valeur de vérité des propositions qui contiennent (ιx)(ϕx) — et donc que le marqueur de portée peut être effacé sans danger. Les preuves de ces théorèmes ne sont ni difficiles ni particulièrement remarquables. Ce qui les rend intéressants, c’est leur caractère ouvertement métathéorique. Russell souligne ainsi que *14.18 montre que « chaque fois que nous avons E ! (ιx)(ϕx), (ιx)(ϕx) se comporte, d’un point de vue formel, comme n’importe quel argument ordinaire de n’importe quelle fonction dans laquelle elle peut apparaître » (1910, p. 174) — et il ajoute même (1910, p. 180)[35] :
[*14.18] montre que, à partir du moment où (ιx)(ϕx) existe, il a (formellement parlant) toutes les propriétés logiques des symboles qui représentent directement des objets. Il s’ensuit que lorsque (ιx)(ϕx) existe, le fait qu’il soit un symbole incomplet n’a aucune conséquence sur les valeurs de vérité des propositions logiques dans lesquelles il apparaît.
Le point commun de tous ces théorèmes est de traiter des faits notationnels, qui sont donc extérieurs au « sujet ». Chacune de ces propositions stipule que, quand certaines conditions sont réunies, les symboles de description, qui n’appartiennent pas au langage logique fondamental, peuvent être utilisés dans les démonstrations exactement comme s’ils étaient des noms propres. Russell ne prouve pas quelque chose qui concerne directement le contenu logique, mais quelque chose qui concerne les relations que le langage logique fondamental entretient avec les dispositifs symboliques, théoriquement superflus, de niveaux supérieurs. Ce genre de développements métalinguistiques ne sont pas rares dans les Principia. On en retrouve par exemple la trace dans la section *30, consacrée aux fonctions descriptives[36], et dans la section *20, consacrée aux ensembles[37].
L’importance accordée aux symboles incomplets et à l’étude de leur « comportement formel », distingue l’approche de Russell de celle de Frege. Comme on le sait, Frege voulait non seulement bannir de la science et de la logique tous les signes qui sont dépourvus de référence, mais mieux encore : il concevait le symbolisme logique comme le seul instrument permettant d’accomplir une telle épuration. Ainsi, présentant les signes primitifs de son idéographie, Frege affirmait (1891, p. 93) : « Veiller à ce qu’aucune expression ne puisse être dépourvue de référence [Bedeutung], à ce qu’on ne puisse jamais calculer sans y prendre garde sur des signes vides tout en croyant opérer sur des objets, c’est là ce qu’exige la rigueur scientifique. » Et dans les Grundgesetze, Frege consacre un paragraphe (voir Frege 1891, § 31) à prouver que tous les signes qui peuvent être formés dans le langage qu’il définit sont des noms (c’est-à-dire ont une référence). Dans les Principia, ces règles d’hygiène ne sont pas suivies. Pire même, le but de Russell dans les théorèmes logiques mentionnés plus haut consiste à établir comment il est possible d’opérer sur des signes vides comme si on opérait sur des objets. Dans les Principia, le fait qu’un signe possède une référence, une signification, n’est pas un pré-requis pour apparaître dans les preuves logiques[38].
Revenons à Wittgenstein. Le coeur de sa critique était que la coordination entre notations de niveau supérieur et langage fondamental devait être considérée comme une tâche authentiquement mathématique. Wittgenstein aurait atteint sa cible s’il avait visé les Grundgesetze de Frege, car chez Frege la différence entre les mathématiques « substantielles » et les jeux entre les symbolismes est fondamentale. Toutefois, Wittgenstein ne cible pas Frege, mais Russell. Or, chez Russell, certains théorèmes (*14.18, *14.28, *14.30 sq., *30.18 et *30.22, *121.35 et *121.36) n’ont pour seul contenu que l’explicitation des règles de certains dispositifs symboliques et leurs articulations avec le niveau fondamental de la théorie ramifiée des types. Cela montre que, pour Russell, la sphère logique ne se limite pas au traitement du « contenu » logique tel qu’il s’exprime dans le langage fondamental ; la logique a également la charge du contrôle des relations entre les différents systèmes symboliques, en droit dispensable, dans lequel ce contenu logique se projette. Ce n’est donc pas parce que Russell affirme que l’on peut se passer des notations de niveau supérieur qu’il estime pour autant que la tâche consistant à définir et à étudier les propriétés de ces symbolismes échappe à la logique. C’est, dans les Principia, à la logique (aux mathématiques) que revient la charge de traiter des relations entre les différents niveaux de notation. Disons-le autrement. Pour Frege comme pour Russell, la logique est universelle ; elle s’applique à tout ; et la sortie hors de la logique est une sortie hors de la raison. Chez Frege, il y a cependant un dehors : le langage ordinaire et les relations entre ce langage et l’idéographie[39]. Chez Russell, rien n’échappe à la logique. La logique s’applique non seulement à tout ce que l’on peut dire, mais aussi à toutes les manières de dire ce que l’on peut dire. Lorsque Wittgenstein affirme que construire une nouvelle notation, c’est faire des mathématiques, il ne fait rien d’autre en réalité que reprendre une intuition russellienne. La logique n’est pas simplement un outil permettant d’effectuer des déductions dans le langage de base ; elle est également l’instrument qui nous permet d’articuler entre eux les différentes couches conceptuelles dont l’amoncellement forme les Principia[40].
Dernier point avant de conclure. Mülhölzer centre son interprétation, on l’a vu, sur la question des critères d’identité des symboles. Le projet russellien échouerait car on ne peut pas considérer que « les niveaux les plus hauts soient constitués à partir du niveau fondamental », cela « parce que les énoncés et preuves des niveaux les plus hauts doivent être pris avec leurs propres critères d’identité, qu’ils ne tirent pas [du système de base] » (2005, p. 81). Mais Mülhölzer fait ici l’impasse sur la doctrine de la définition dans l’usage, dont tout l’objet est d’expliquer comment la forme des propositions du niveau fondamental se modifie par l’introduction de signes dont les critères d’identités ne sont pas les mêmes que ceux des symboles du langage de base. Ce que ne cesse d’expliquer Russell, c’est qu’un symbole de description n’a pas les mêmes critères d’identité qu’un nom logique. Par exemple, il est faux qu’en général (ιx)(ϕx)=(ιx)(ϕx) (voir *14.28). Plus généralement, il est faux que le signe « (ιx)(ϕx) », indépendamment de son marqueur de portée, suffise pour identifier la proposition dans laquelle ce symbole apparaît (voir plus haut la discussion de l’ambiguïté de la négation d’une proposition contenant une description). La façon dont la forme fondamentale se restructure et se réorganise à mesure que l’on s’éloigne du langage de base est contrôlée, mesurée, donc constituée logiquement dans les Principia. Contrairement à ce qu’affirme Mülhölzer, c’est ainsi le « système » qui tire de lui-même les ressources nécessaires à sa projection sous diverses formes dans les diverses notations utilisées par les mathématiciens.
Conclusion
Résumons l’argument. J’ai, dans la section 3, affirmé que, contrairement à ce que suggère Wittgenstein, les Principia sont, comme les mathématiques, un « mélange bariolé de techniques de preuves ». En particulier, il est extrêmement difficile, dès que nous pénétrons assez profondément dans l’ouvrage, de distinguer ce qui, dans un théorème, relève du « sujet » (c’est-à-dire de ce que sa traduction dans le langage logique exprimerait) et ce qui relève du système notationnel dans lequel il est couché. Les ensembles, par exemple, ne sont pas des entités chez Russell, mais des façons d’« abréger » de façon systématique des propositions ne portant pas sur les ensembles. Le « contenu » d’une proposition de la théorie des ensembles (par exemple, le théorème de Cantor-Bernstein) est donc, dans les Principia, un mixte de faits « notationnels » et de faits « logiques ». Il est, bien entendu, en principe possible de séparer ces deux composantes — mais en pratique, Russell ne s’y risque à aucun moment. Ce premier moment ne suffit pas à répondre à la critique de Wittgenstein, mais il établit cependant que la description, faite par le philosophe, du travail de son ancien maître n’est pas conforme à la réalité. Le talon d’Achille de l’attaque wittgensteinienne n’est pointé que dans la section 4 : de ce que les définitions soient perçues comme théoriquement superflues, il ne s’ensuit pas, comme le suggère pourtant Wittgenstein, que la coordination métathéorique des différentes couches notationnelles relève de la psychologie et doive être exclue du champ logico-mathématique. Cette conséquence n’est tout simplement pas bonne, et en la maintenant on est conduit à passer complètement sous silence la théorie (théorie logique s’il en est) des symboles incomplets. D’une manière générale, Wittgenstein accuse et rigidifie la distinction entre le langage de base et les notations de niveau supérieur que Russell utilise de façon extrêmement souple et subtile.
Comment expliquer qu’un lecteur aussi sensible que l’était Wittgenstein ait pu passer à côté de cette dimension des Principia ? Il me semble que l’interprétation de Mülhölzer offre une piste de réponse. Le commentateur insiste sur l’influence du formalisme de Hilbert. La pratique axiomatique hilbertienne diffère grandement de celle de Russell, notamment sur le point qui nous intéresse. Chez Hilbert, les considérations métalinguistiques sont généralement nettement séparées du développement intrasystématique (par exemple, Hilbert distingue très clairement les preuves internes au système des preuves de consistance relative ou d’indépendance) ; d’autre part, même si Hilbert n’utilise que rarement un langage complètement formel, les systèmes qu’il construit sont linguistiquement uniformes (le vocabulaire utilisé est défini à l’avance, et les définitions contextuelles au sens russellien ne sont pas admises). Il est tout à fait possible que Wittgenstein ait vu le projet fondationnel hilbertien comme une extension et une continuation du projet russellien — ou plutôt, qu’il ait projeté rétrospectivement sur les Principia certains canons hilbertiens (l’idée de définir un langage formel de base et l’idée de toujours ensuite séparer les considérations métalinguistiques des considérations intrasystématiques). En tout cas, le portrait que Wittgenstein dresse d’un « système » russellien fondamental, qui serait lié après coup, par des règles de traduction, aux divers « systèmes » des mathématiciens, ressemble fortement — Mülhölzer a raison — à ce que l’on trouve chez Hilbert. Ce serait ainsi les « lunettes hilbertiennes » que porte Wittgenstein dans les années vingt qui l’auraient empêché de saisir à quel point les objections qu’il adresse à Russell, loin de heurter les Principia, prolongent en réalité certaines de ses lignes de force.
Parties annexes
Notes
-
[1]
Bemerkungen über die Grundlagen derMathematik, Anscombe & Rhees & von Wright eds, Basil Blackwell, 1956. Trad. anglaise de E. Anscombe, Remarks on the Foundations of Mathematics, 1956 (2e édition, MIT Press, 1964). Trad. française par M.-A. Lescourret, Remarques sur les fondements des mathématiques, Gallimard, 1983.
-
[2]
Wittgenstein 1956, p. vii.
-
[3]
À de très notables exceptions près : Kreisel 1958, Grosholz 1981, le chapitre VIII de Marion 1998, et le chapitre 1 de Steiner 1975.
-
[4]
F. Mülhölzer « A Mathematical Proof Must be Surveyable : What Wittgenstein Meant By This And What It Implies », Grazer Philosophische Studien, 71, p. 57-86, 2005.
-
[5]
Voir notamment (entre autres) Detlefsen 1993, et Avigad 2008.
-
[6]
Ce point est important, car l’idée que le logicisme russellien serait incapable de rendre compte du système décimal joue un rôle central dans la critique de Wittgenstein. Le développement de la section 2 peut être considéré comme un addendum à Steiner 1975 (p. 43-50), qui développe le même argument sans toutefois le relier aux développements des Principia.
-
[7]
La notion de synopticité et de représentation synoptique ne date pas de la fin des années trente. Bien au contraire, elle est centrale dans la philosophie du Wittgenstein « intermédiaire » — à la page 417 du Big Typescript, on trouve : « Le concept de représentation synoptique est d’une importance fondamentale pour nous. Il caractérise la forme de notre conception, la façon dont nous regardons les choses. » Comme le note Mühlhölzer, Wittgenstein ne semble cependant pas utiliser la notion pour décrire la preuve mathématique avant 1937.
-
[8]
Voir Mülholzer, op. cit., p. 59-62.
-
[9]
Je ne suis pas certain que la reproductibilité, telle que l’entend Wittgenstein, puisse être alignée sur cette recherche du consensus et d’une théorie de la communication scientifique. Contrairement à Hilbert, Wittgenstein me semble adopter une perspective « solipsiste » lorsqu’il parle de la synopticité. Autrement dit, la question n’est pas tant, pour lui, celle de la reproduction pour communiquer avec autrui, mais de la reproduction pour soi au cours du temps — c’est-à-dire celle de la reproduction mnémonique. Mais je n’insisterai pas ici sur ce point. Sur le rapport entre synopticité des preuves et mémoire, signalons cependant Gowers 2007.
-
[10]
Elle est en tout cas originale, dans la mesure où Wittgenstein est surtout connu pour avoir rejeté comme absurde la recherche hilbertienne d’une preuve de non-contradiction de l’arithmétique. Voir notamment le second appendice à Wittgenstein 1956.
-
[11]
Cette critique est faite dès le début des années trente. Voir par exemple Wittgenstein 1969, p. 339-342.
-
[12]
Par exemple, la géométrie « cartésienne » repose sur ce genre de manoeuvre : on peut « représenter » les relations entre points et droites dans le plan euclidien par des systèmes d’équations dans R². Pour une lecture wittgensteinienne des mathématiques cartésiennes, voir Grosholz 1981.
-
[13]
Comme l’explique Marion (1998, p. 230) : « Le coeur de l’argument de Wittgenstein est qu’il y a une circularité dans la tentative russellienne de fonder l’arithmétique sur la logique : afin de comprendre la vérité logique, on doit précisément introduire la connaissance arithmétique censée être prouvée vraie par la vérité logique. On peut exprimer la chose de façon légèrement différente en soutenant, avec Kreisel, que l’idée de Wittgenstein « concerne les méthodes métamathématiques utilisées pour étudier les relations entre deux systèmes ». […] L’argument de Wittgenstein […] revient en substance à faire la très bonne remarque suivante : « les métamathématiques requises pour la traduction de l’arithmétique dans la logique requiert des concepts arithmétiques » [Kreisel 1958, p. 150]. »
-
[14]
Comme par exemple cet extrait tiré du § 14 : « Toute ma difficulté n’est-elle pas de voir comment — sans sortir du calcul logique de Russell, on peut arriver au concept de l’ensemble des variables [Menge der Variablen] dans l’expression « (Ǝxyz…) », lorsqu’on ne peut avoir de vue d’ensemble de cette expression ?
Mais ne peut-on permettre cette vue d’ensemble en écrivant : (Ǝx1x2x3…). Et il y a encore cependant quelque chose que je ne comprends pas : le critère d’identité d’une telle expression a maintenant certainement changé : je vois maintenant d’une autre manière que l’ensemble des signes dans ces deux genres d’expressions est le même.
Je serais tenté de dire que la preuve russellienne peut bien en effet être effectuée pas à pas, mais à la fin on ne sait pas vraiment ce que l’on a prouvé — tout du moins pas selon les anciens critères. En rendant accessible une vision claire de la preuve russellienne, je prouve quelque chose au sujet de cette preuve. »
-
[15]
On trouve une définition de « 0 » en *54.01, de « 1 » en (*52.01), de « 2 » en (*54.02) et on trouve une définition de R3 (mais pas de « 3 ») en *34.02.
-
[16]
Voir 1912, sections *122, *123.
-
[17]
Par exemple, si un sens ordinal était donné aux entiers, alors la question du groupement et de l’indexation des variables dans le schéma (b) ne se poserait pas, car les variables en question devraient intégrer dans leur expression le fait qu’elles forment une séquence.
-
[18]
Sur la relation entre application des entiers et principe de Hume, voir Hale et Shapiro 2004. Si je suis d’accord avec M. Marion sur le fait que l’exigence de synopticité wittgensteinienne ne doit pas être rabattue sur un finitisme strict, je ne le suis pas complètement dans l’analyse qu’il fait de la théorie russellienne de l’application des entiers dans son 2007. Dans les Principia, la notion de décompte est relativisée à n’importe quelle progression P, non pas à la seule progression des cardinaux finis, comme le laisse supposer Marion 2007 (voir notamment p. 177-178).
-
[19]
Cette théorie de l’application des entiers est la reformulation de considérations éparses dans les Principles ; voir notamment 1903, p. 133, p. 243.
-
[20]
Sur le produit relatif de deux relations binaires, voir la section *34 de 1910. Le produit relatif est une généralisation de la notion de composition d’applications.
-
[21]
Voir Steiner 1975, p. 43 : « L’avantage du système décimal, et de tout système qui a une base, est que chaque signe numérique [numeral] a une double signification, prouvablement équivalente. D’une part, chaque signe numérique différent de 0 désigne le successeur d’un autre nombre, dont le signe numérique peut être obtenu d’une façon simple et mécanique. Ainsi le signe « 11 » dénote le successeur de 10 et correspond à « SSSSSSSSSS0 » dans la théorie des ensembles [où « S » désigne la fonction successeur]. Mais en revanche chaque signe numérique est aussi un polynôme en 10, où « 533 » est une version réduite de « 5×10² + 3×10 +3 ». »
-
[22]
Je partage donc la conclusion de Steiner 1975, p. 49 : « Je me risque à avancer que n’importe qui avec de l’entrainement et de l’intelligence pourrait faire du calcul décimal dans le système de Russell. »
-
[23]
Russell dit notamment très clairement que son but est de définir une arithmétique qui vaut pour les cardinaux (resp. les ordinaux) finis et infinis. Voir par exemple 1912, p. 67 : « Le traitement de l’addition, de la multiplication et de l’exponentiation donné dans ce qui suit est guidé par le désir d’atteindre la plus grande généralité possible. Et en premier lieu, tout ce qui est dit de façon générale à propos des opérations arithmétiques doit s’appliquer également aux classes finies comme aux classes infinies. » On peut dés lors comprendre pourquoi la théorie des notations à base n’était pas pour lui une priorité.
-
[24]
Comme le remarque Steiner (1975, p. 54), la logique mobilisée par Wittgenstein est du premier ordre. Or le cadre russellien est la théorie des relations, c’est-à-dire une logique du second ordre, apte, comme le montre *121, à saisir les « nouveaux aspects » requis pour élaborer les notations numériques à base.
-
[25]
Mühlhölzer, dans son 2005, ne discute de Steiner (1975) que dans une note de la page 78 : « [D]e façon surprenante, Mark Steiner, dans sa discussion de RFM III […] présume que Wittgenstein était ignorant de ce fait [c.-à-d. de la capacité qu’a un système fondationnel de simuler les mathématiques familières] et « réfute » Wittgenstein en montrant longuement que notre notation décimale peut être simulée dans un système comme celui de Russell. Si cela constituait une réponse adéquate à Wittgenstein, alors Wittgenstein ne mériterait certainement aucune attention en tant que philosophe sérieux. » Mühlhölzer est ici beaucoup trop rapide. En premier lieu, la discussion de Steiner ne se réduit pas au passage sur la notation décimale, puisque le philosophe élabore une intéressante distinction entre deux types de définitions (voir plus loin note 29, page 13) passée sous silence dans Mühlhölzer 2005. De plus, même si on en reste au développement pris en considération par Mühlhölzer, l’argument de Steiner est beaucoup plus élaboré que ne le suggère Mülhölzer. Steiner ne veut pas simplement montrer qu’il y a un moyen d’implémenter dans le système fondationnel un dispositif permettant de simuler les mathématiques ordinaires, mais défend l’idée que, contrairement à ce que Wittgenstein et Mühlhölzer disent, ces dispositifs ne sont pas « extérieurs au système ».
-
[26]
Une telle opposition est présente dès les années trente. Citons cet extrait de la Grammaire (1969, p. 340) : « Mon point de vue se distingue de celui des gens qui écrivent aujourd’hui sur les fondements des mathématiques, en ce qu’il ne m’est pas nécessaire de mépriser un calcul particulier, par exemple le système décimal. Pour moi ils se valent tous. »
-
[27]
Il y a là en réalité un débat majeur dans la littérature secondaire, que je laisse de côté. Certains commentateurs considèrent en effet, dans le sillage de Landini (1998), qu’il n’y a pas de fonctions propositionnelles non prédicatives ; d’autres (Linsky 1999) soutiennent le contraire. Si Landini avait raison, les fonctions propositionnelles non prédicatives seraient des constructions symboliques qui ne font pas partie du langage de base, et il faudrait distinguer différentes couches à l’intérieur de ce que je considère ici comme étant le langage fondamental.
-
[28]
Ce que dit Russell ici fait en effet beaucoup penser à la manière dont Leibniz caractérise la connaissance aveugle ou symbolique dans (Leibniz 1684).
-
[29]
Insistons sur ce point : ce n’est pas l’aptitude que le langage logique possède de décomposer ce qui se manifeste comme une unité (illustrée par la métaphore du télescope [Russell 1919, p. 2-3]) qui est utilisée ici pour manifester la supériorité de ce symbolisme, mais au contraire sa capacité à abréger une multiplicité importante d’idées ou de symboles.
-
[30]
Steiner avance une distinction entre définition abréviative et définition stipulative, en adossant, comme partout dans son texte, sa défense de Russell à la théorie des ensembles et à la philosophie de Quine. Si je partage le point de vue général de Steiner, je pense qu’il est plus efficace de revenir à la texture des Principia elle-même et de ne pas faire ce détour par Quine, inconnu de Wittgenstein.
-
[31]
En *30.01, Russell définit la fonction R(y), notée R‘y, de cette manière (1910, p. 245) : R‘y = (ιx)(xRy) Df. À propos de cette définition, Russell dit ceci (ibid., p. 245-246) : « Une définition comme [*30.01], où la signification donnée au terme défini est une description doit être comprise comme voulant dire que le terme défini (en l’occurrence R‘y) et la description considérée comme sa signification (en l’occurrence (ιx)(xRy)) sont interchangeables dans l’usage : la définition est en un sens plus purement symbolique que d’autres définitions, puisque la description considérée comme sa signification n’a en elle-même aucune signification si ce n’est dans l’usage. »
-
[32]
Ainsi, en *20, un parallèle est fait entre ce qui vaut pour les symboles de description et ce qui vaut pour les symboles de classes ; voir notamment 1910, p. 197-198.
-
[33]
E ! (ιx)(ϕx) signifie qu’il n’y a qu’un seul ϕ, ou, en symboles, que (Ǝb) : ϕx.≡x. x=b.
-
[34]
Voir *14.3-31-32-33-34. Ainsi, *14.32 dit que si E ! (ιx)(ϕx), alors [(ιx)(ϕx)]~ψ(ιx)(ϕx).⇔.~[(ιx)(ϕx)]ψ(ιx)(ϕx).
-
[35]
Russell fait le même genre de remarques à propos de *14.28 et de *14.3 sq. Quant à la *14.28, Russell écrit : « Nous devons prouver que des symboles comme ‘(ιx)(ϕx)’ obéissent aux mêmes règles concernant l’identité que les symboles qui représentent directement les objets. À cela, il y a cependant une exception partielle, car, au lieu d’avoir (ιx)(ϕx) = (ιx)(ϕx), nous avons seulement [*14.28] » (Ibid. p. 175). En ce qui a trait à *14.3 sq., il écrit : « Le but des propositions qui suivent est de montrer que, lorsque E ! (ιx)(ϕx), la portée de (ιx)(ϕx) n’a aucune incidence sur la valeur de vérité des propositions dans lesquelles (ιx)(ϕx) apparaît. Cette proposition ne peut pas être prouvée de façon générale, mais elle peut être prouvée dans chaque cas particulier. […] Si ψ(ιx)(ϕx) apparaît d’une façon qui peut être engendrée selon le processus *1--*11 [c’est-à-dire qui apparaît dans un contexte extensionel f], alors, si E ! (ιx)(ϕx), la valeur de vérité de f{[(ιx)(ϕx)]ψ(ιx)(ϕx)}est la même que celle de [(ιx)(ϕx)]f{ψ(ιx)(ϕx)} » (Ibid., p. 193).
-
[36]
Russell y montre que, quand E ! (ιx)(xRy), R‘y peut être utilisé comme un nom. Il démontre que, toujours selon la même hypothèse (*30.18), (z)ϕ(z) implique ϕ(R‘y) et (*30.22) R‘y=R‘y.
-
[37]
Russell y justifie sa décision de ne pas attacher de portée aux symboles de classe de cette manière (1910, p. 197) : « En ce qui concerne la portée de ẑ(ϕz) […] nous adopterons les mêmes conventions que celles expliquées en *14 pour (ιx)(ϕx). La condition correspondant à E! (ιx)(ϕx) est (Ǝϕ) : ϕ!x.⇔x. ψx, qui est toujours satisfait à cause de [l’axiome de réductibilité]. » Ce que Russell suggère ici, c’est une lecture métalinguistique de l’axiome de réductibilité. Comme la condition E! (ιx)(ϕx), cet axiome servirait (entre autres) à simplifier la notation (théoriquement superflue, répétons-le) des classes, en se débarrassant de toutes les questions relatives à la portée de ces symboles.
-
[38]
Je développe cette opposition entre Frege et Russell dans Gandon (2002).
-
[39]
Sur ce point, voir notamment la distinction entre définition stipulative et définition analytique faite dans Frege (1914).
-
[40]
C’est sur ce point que la lecture avancée ici s’écarte de l’interprétation de Marion/Kreisel, explicitée dans la note 13. Marion insiste sur le fait que la critique de Wittgenstein appelle une distinction entre langage et métalangage. Mais il n’est pas sûr que cette distinction puisse, sans préalable, être appliquée au logicisme russellien. La question de savoir si l’universalisme logique est compatible avec une perspective métathéorique est en effet fort discutée (voir sur ce point les articles de Goldfarb [1988] et Landini [1998]). Sans vouloir prendre position sur ce débat, ce que j’ai cherché ici à montrer est que la logique des Principia (par le biais de la théorie des symboles incomplets) est assez puissante pour développer certains résultats métathéoriques. Autrement dit, la théorie qui relie les systèmes mathématiques au système de base n’est pas extérieure au système de base.
Bibliographie
- Avigad, J. « Understanding Proofs », in The Philosophy of Mathematical Practice, Mancosu (ed.), Oxford University Press, 2008, p. 317-353.
- Detlefsen, M. « Poincaré vs. Russell on the Role of Logic in Mathematics », Philosophia Mathematica (3) 1, 1993, 24-49.
- Frege, G. 1891. « Fonction et Concept », in Écrits logiques et philosophiques, trad. française C. Imbert, Éditions du Seuil, 1971.
- Frege, G. 1893. Grundgesetze der Arithmetik, vol. 1, Jena, Pohle. Réédition Hildesheim, Olms, 1966.
- Frege, G. 1914. « La logique dans les mathématiques », trad. C. Tiercelin et F. Nef, in Frege, Écrits posthumes, Ph. de Rouilhan et C.Tiercelin (dir.), Nîmes, Éditions J. Chambon, 1999.
- Gandon, S. Logique et langage. Études sur le premier Wittgenstein, Vrin, 2002.
- Goldfarb, W. History and Philosophy of Modern Mathematics, Aspray and Kitcher (eds), University of Minnesota Press, 1988.
- Gowers, W. T. « Mathematics, Memory, and Mental Arithmetics », in Mathematical Knowledge, Leng M. & alii (eds), Oxford University Press, 2007, p. 33-58.
- Grosholz, E. « Wittgenstein and the Correlation of Logic and Arithmetic », Ratio, 1981, p. 31-42.
- Hale B. and C. Wright. « Logicism in the Twenty-first Century », in The Oxford Handbook of Philosophy of Mathematics and Logic, S. Shapiro (ed.), OUP, 2004, p. 166-202.
- Kreisel, G. 1958. « Wittgenstein’s Remarks on the Foundations of Mathematics », British Journal for Philosophy of Science, 9, 135-158.
- Landini, G. Russell’s Hidden Substitutionnal Theory, Oxford University Press, 1998.
- Leibniz G. W. 1684. « Méditations sur la connaissance, la vérité et les idées », in Opuscules philosophiques choisies, Vrin, 2001.
- Linski, B. Russell’s Metaphysical Logic, CSLI Publications, 1999.
- Marion, M. Wittgenstein, Finitism, and the Foundations of Mathematics, Oxford, Clarendon, 1998.
- Marion, M. « Interpreting Arithmetic : Russell on Applicability and Wittgenstein on Surveyability », in Contemporary Perspectives on Logicism and Constructivism, P. Joray (dir.). Neuchâtel, Travaux de logique, CdRS, 2007, p. 167-184.
- Mülhölzer, F. « “A Mathematical Proof Must be Surveyable” : What Wittgenstein Meant By This And What It Implies », Grazer Philosophische Studien, 71, 2005, p. 57-86.
- Russell, B. The Principles of Mathematics, Cambridge, Cambridge University Press, 1903.
- Russell, B. Introduction to Mathematical Philosophy, Londres, Allen and Unwin, 1919.
- Russell, B. and A. N. Whitehead. Principia Mathematica, vol. I, Cambridge, CUP, 1910.
- Russell, B. and A. N. Whitehead. Principia Mathematica, vol. II, Cambridge, CUP, 1912.
- Steiner, M. Mathematical Knowledge, Cornell University Press, 1975.
- Wittgenstein, L. 1971. Bemerkungen über die Grundlagen derMathematik, Anscombe, Rhees & von Wright (eds), Basil Blackwell, 1956. Trad. anglaise de E. Anscombe, Remarks on the Foundations of Mathematics, 1956 (2e édition, MIT Press, 1964). Les références se rapportent à la seconde édition, trad. française par M.-A. Lescourret, Remarques sur les fondements des mathématiques, Gallimard, 1983.
- Wittgenstein, L. 1964. Philosophische Bemerkungen, R. Rhees (ed.), Basil Blackwell, 1964. Trad. française J. Fauve, Gallimard, 1975.
- Wittgenstein, L. 1969. Philosophische Grammatik, R. Rhees (ed.), Basil Blackwell, 1969. Trad. française M. A. Lescourret, Gallimard,1980.
- Wittgenstein, L. 1967. Wittgenstein und der Wienerkreis, McGuinness (ed.), Basil Blackwell, 1967. Trad. française de G. Granel, Trans-Europ-Express, 1991.