L’économie de la preuve judiciaire

Fluet, Claude

doi:https://doi.org/10.7202/1005679ar

Introduction

Posner (1999) faisait remarquer que le droit de la preuve a été relativement peu exploré dans l’analyse économique du droit[1]. Il s’en étonnait vu l’importance des questions de preuve pour l’efficacité du droit, d’autant plus qu’il y a sur ce point des différences notables entre la tradition du common law et celle des droits codifiés d’origine romano-germanique. Dans cet article, je discuterai des systèmes probatoires à partir de la boîte à outils de la théorie économique.

C’est un lieu commun chez les juristes de souligner que la preuve judiciaire n’est pas la preuve scientifique[2]. La preuve judiciaire a pour but de convaincre le tribunal de l’existence ou de l’inexistence d’un fait. Elle désigne les moyens par lesquels le tribunal est amené à statuer sur le bien-fondé d’une allégation ou d’une prétention. « Prouver, c’est faire approuver », écrivait Lévy-Bruhl (1964), sachant que le tribunal doit rendre un jugement dans un sens ou dans l’autre.

Il y a une technique de la preuve. En matières contractuelles, la preuve est souvent préconstituée, par exemple un contrat de prêt ou un acte de vente notarié. Le statut de preuve légale conféré aux actes juridiques vise justement à inciter les parties à faciliter la preuve en cas de litige. La préconstitution d’éléments de preuve peut aussi se faire de manière informelle. Des chercheurs américains expliquent l’excès de diligence du médecin (tests superflus administrés au patient, etc.), ce qu’on appelle « médecine défensive » et qui peut être particulièrement coûteux, comme une précaution contre le risque de poursuite pour faute médicale[3].

La preuve judiciaire s’inscrit dans une procédure. Elle met en jeu divers dispositifs, notamment l’attribution de la charge de la preuve et le degré de preuve requis de celui qui a la charge. La partie avec la charge, normalement le plaignant dans un litige civil, assume le risque de preuve : c’est à elle de convaincre le tribunal, à défaut de quoi celui-ci décidera contre elle. La charge de la preuve peut néanmoins se déplacer au cours de la procédure en fonction du fait allégué. Par exemple, le plaignant a intenté une action pour dette impayée. Il doit donc prouver qu’une dette a été contractée. Si cette preuve est faite, mais que le défendeur allègue qu’il a effectivement remboursé la dette, c’est alors à lui qu’incombe de prouver le remboursement.

Dans des cas particuliers, la loi peut aussi prescrire le renversement de la charge de la preuve. Par exemple, dans les poursuites pour infections nosocomiales, la législation française stipule que c’est à l’établissement de santé (le défendeur) d’apporter la preuve de la « cause étrangère » et non au patient (le plaignant) de prouver qu’il a contracté l’infection dans l’établissement en question[4]. Plus généralement, certains faits n’ont pas à être démontrés car ils bénéficient de présomptions légales; il en va ainsi de la présomption de paternité pour l’enfant né pendant le mariage ou la présomption qu’un testateur était sain d’esprit lors de la rédaction du testament. C’est à celui qui prétend le contraire de réfuter ces présomptions. Pour prendre un exemple très différent, les règles de preuve de la Commission de l’immigration et du statut de réfugié (CISR), un tribunal administratif canadien qui se prononce sur les demandes d’asile, stipulent que « les États sont présumés être capables de protéger leurs ressortissants jusqu’à ce que qu’on prouve le contraire de façon claire et convaincante »[5]. Enfin, dans le cours d’une procédure, des présomptions « spontanées » surgiront, sur la base des indices ou éléments de preuve imparfaits présentés jusque-là. Ce sera alors à la partie défavorisée par ces présomptions de les renverser.

Le degré de preuve correspond à la force probante requise par le tribunal pour donner raison à la partie qui a la charge de la preuve. Ces notions ont connu un développement important en common law. Dans une procédure pénale, la norme est celle de la preuve hors de tout doute raisonnable, une exigence très forte. Dans un litige civil, la norme est la prépondérance de preuve ou balance des probabilités; il suffit alors de montrer que le fait allégué est plus vraisemblable que son contraire[6]. La citation ci-dessus empruntée aux règles de preuve de la CISR renvoie à une norme intermédiaire, soit la preuve claire et convaincante. Celle-ci est plus forte que la simple prépondérance et est utilisée dans certaines circonstances par les tribunaux nord-américains[7].

La notion de norme (ou standard) de preuve n’existe pas à proprement parler dans la tradition romano-germanique. En droit français, on se borne à énoncer que le juge doit décider selon son intime conviction. Les juristes de common law interprètent généralement cette expression comme signifiant une norme de preuve élevée, proche de la « certitude morale » ou du hors de tout doute raisonnable. Cependant, on peut également argumenter que l’intime conviction renvoie tout simplement à l’entière discrétion du juge dans l’appréciation de la preuve (Taruffo, 2003).

J’en viens maintenant à l’apport de l’analyse économique, puisque c’est ce qui nous intéresse ici. On voit facilement que la théorie de la décision, la théorie des jeux, l’économie de l’information ou la théorie des incitations, pour ne nommer que ces développements, fournissent des outils pour discuter de notions comme celles de charge de la preuve, de présomptions et de degrés de preuve. L’observation de Posner (1999) rapportée précédemment doit être nuancée. Il y a une littérature économique sur les questions de preuve et de procédure judiciaire : sur le procès comme tournoi de recherche de rentes (Tullock, 1975; Katz, 1988) ou l’efficacité relative des procédures inquisitoire et accusatoire (Shin, 1998; Dewatripont et Tirole, 1999; Palumbo, 2001; Froeb et Kobayashi, 2001; Parisi, 2002); sur les notions de charge de la preuve ou de norme de preuve (Sobel, 1985; Rubinfeld et Sappington, 1987; Miceli, 1990; Davis, 1994; Bernardo et al., 2000). En particulier, un procès peut être modélisé comme un « jeu de persuasion » où deux parties informées cherchent à convaincre une partie non informée (Shin, 1994; Milgrom et Roberts, 1986; Lipman et Seppi, 1995; Seidman et Winter, 1997). Ce tour d’horizon est bien sûr partiel. Pour néanmoins donner raison à Posner, il est vrai que cette littérature a peu discuté du détail de la pratique juridique[8].

Je m’en voudrais de ne pas citer aussi quelques travaux analytiques bien antérieurs. Dans son célèbre essai sur l’erreur judiciaire, Condorcet (1785) applique le calcul des probabilités pour déterminer le risque d’un jugement erroné en fonction du risque d’erreur de chaque juré, de la taille du jury et de la pluralité requise pour une condamnation. Pour une affaire criminelle où la sanction est la peine de mort, il en vient à recommander un jury de 30 personnes et une majorité de 23 contre 7, en supposant un risque d’erreur de 1/10 de la part de chaque juré. Il obtient ce résultat en posant comme valeur critique du risque d’une condamnation à tort le risque de mortalité d’un homme de 37 à 47 ans, obtenu à partir des tables de mortalité. Ces questions seront reprises par deux grands mathématiciens : d’abord par Laplace (1814) dans le contexte d’un code criminel adopté en 1808 autorisant une condamnation par 7 voix contre 5 et un peu plus tard par Poisson (1837). Ce dernier se demande notamment si l’introduction en 1830 du principe des circonstances atténuantes, lequel permet au juge de réduire la peine en cas de condamnation, ne facilitera pas une décision de culpabilité chez les jurés[9]. Cette interrogation fait écho aux analyses beaucoup plus récentes que l’on retrouve chez Andreoni (1991, 1995).

Dans ce qui suit, je développerai progressivement un modèle simple montrant la pertinence de l’analyse économique. Je le ferai essentiellement à partir de l’angle d’attaque utilisé dans certains de mes travaux sur la preuve dans les litiges civils. Ceux dont je m’inspire ici ont abordé les questions suivantes : les effets incitatifs de la norme de preuve relativement aux comportements ex ante; l’arbitrage entre incitations ex ante et erreur judiciaire; la norme de la balance des probabilités et les règles d’irrecevabilité de certaines informations en common law; les présomptions légales et le rôle que joue le degré d’initiative du juge dans l’obtention des « bonnes » présomptions au cours de la procédure.

1. La charge de la preuve

Dans cette partie, j’examine le rôle que joue l’attribution de la charge de la preuve du point de vue des coûts de preuve, du risque d’erreur judiciaire et de la fonction incitative du système juridique relativement à l’adoption de comportements socialement efficients.

Considérons un litige civil. Le plaignant ou demandeur est dénoté par P, le défendeur par D. Le litige porte sur l’existence ou la survenance d’un fait que je dénoterai par a; l’inexistence du fait est dénoté par a̅, ce qui se lit « non a » . La loi prévoit que, si le fait est avéré, un transfert de richesse doit s’effectuer du défendeur vers le plaignant. Par exemple, le plaignant prétend que le défendeur lui doit 10 000 $ en honoraires non versés; ou encore le litige porte sur la reconnaissance d’un droit de propriété au profit du plaignant et au détriment du défendeur ou à un préjudice subi par le plaignant du fait du comportement négligent du défendeur, auquel cas des dommages-intérêts doivent être versés à titre de réparation. Par définition, c’est le plaignant qui intente la procédure judiciaire. Dans ce cas, le plaignant allègue le fait a; évidemment, le défendeur voudrait que le jugement du tribunal soit a̅. Les litiges réels portent souvent sur plusieurs éléments. Par exemple, le plaignant a à démontrer la faute du défendeur et la gravité du dommage qu’il a subi. Pour faire simple, je me limiterai au cas de deux propositions contradictoires.

Je suppose une situation suffisamment complexe pour que l’analyse de l’attribution de la charge de la preuve permette de dégager des enseignements utiles. Comme c’est le plaignant qui prend l’initiative du recours en justice, il a l’obligation de démontrer qu’il a un motif valable. En ce sens, le plaignant a toujours la charge initiale de faire la preuve de quelque chose, sinon des poursuites pourraient être intentées à des fins de pure nuisance. Dans les cas les plus simples, comme une poursuite pour dette impayée, l’attribution de la charge de la preuve est celle de la charge initiale incombant au plaignant.

À titre d’illustration d’une situation complexe, considérons le cas d’une intervention chirurgicale. Si l’intervention est un succès, le patient ne peut démontrer aucun motif valable de poursuite à l’encontre du chirurgien ou de son équipe. Si par contre l’intervention s’est visiblement mal déroulée, l’action en justice pourrait être recevable. Je prends pour acquis que le patient n’a un droit à réparation pour les dommages subis que si les complications résultent d’une faute professionnelle ou technique (maladresse du chirurgien, faute d’inattention, négligence de l’anesthésiste, etc.). En effet, une intervention chirurgicale peut mal tourner pour toutes sortes de raisons, dont l’état général du patient avant l’intervention et l’aléa normal propre à ce genre d’intervention. La responsabilité médicale porte généralement sur une obligation de moyens et non de résultats. Dans une situation de ce genre, l’objet du litige est donc la commission ou non d’une faute. Je dirai que le plaignant a la charge de preuve lorsque c’est au patient de démontrer cette faute. Inversement, je dirai que le défendeur a la charge de la preuve lorsque c’est au chirurgien de démontrer qu’aucune faute n’a été commise. Ce cas correspond à une présomption de faute, ce qui s’observe souvent quand les conséquences dommageables d’une intervention sont sans commune mesure avec le caractère courant et normalement bénin de l’intervention. Dans les deux cas, néanmoins, le patient aura préalablement démontré qu’il a subi des dommages du fait d’une intervention chirurgicale qui a mal tourné.

1.1 Le coût de la preuve

La figure 1 représente un arbre d’événements décrivant les informations qui seront en possession du plaignant à différentes étapes. On dit qu’une information est vérifiable lorsqu’elle peut être communiquée au tribunal. En termes juridiques, il s’agit alors d’un élément de preuve[10].

Figure 1

**Une procédure avec preuves parfaites**

L’étape initiale est celle de la survenance ou non du fait pouvant donner lieu à une poursuite. Dans l’exemple de l’intervention chirurgicale, le fait a serait la commission d’une faute professionnelle. La décision d’intenter une poursuite se prend à l’étape 1. À cette étape, l’information dont dispose le plaignant est soit y₀ soit y₁. Le premier cas signifie que l’intervention chirurgicale est un succès, auquel cas le patient ne peut présenter aucun motif valable de poursuite. Le second cas signifie qu’il y a eu des complications ayant causé un dommage. Cette information est supposée vérifiable. Dans mon exemple, si une faute est commise, l’intervention chirurgicale se traduit à coup sûr par des complications et le patient dispose alors toujours d’un motif valable de poursuite. Dans la figure, cela s’exprime par le fait qu’il peut présenter l’information y₁. Cependant, il est possible que des complications surviennent même lorsqu’il n’y a pas de faute professionnelle. Dans l’exemple, cela se produit avec une probabilité q. À l’étape 1, lorsque des complications sont survenues, le patient ne sait pas s’il y a eu faute ou non, d’où les pointillés entourant les noeuds correspondants de l’arbre des événements.

À l’étape 2, si une poursuite a été intentée, la preuve des faits pertinents devient disponible aux plaideurs. Je suppose qu’il s’agit d’une preuve parfaite démontrant hors de tout doute s’il y a eu faute ou non. Ces preuves sont dénotées par x_a et x_a̅ respectivement. Ainsi, lorsqu’une faute a été commise, le plaignant et le défendeur ont entre les mains l’information vérifiable x_a et peuvent la présenter au tribunal. De même, si aucune faute n’a été commise, ils ont entre les mains l’information vérifiable x_a̅ et peuvent la présenter. Le fait qu’à l’étape 2 chaque partie a entre les mains une preuve parfaite est connaissance commune; autrement dit, chaque plaideur sait que l’autre peut démontrer la vérité (et seulement la vérité). Enfin, il y a des coûts à présenter une preuve au tribunal, frais d’avocats, d’expertise et autres. Le coût pour le demandeur est C_P, le coût pour le défendeur est C_D, les indices P et D désignant le plaignant et le défendeur respectivement. Comme les plaideurs ne sont pas dans une situation symétrique, il n’y a aucune raison que ces coûts soient les mêmes pour le plaignant et le défendeur. Par exemple, le défendeur pourrait être en mesure de produire à moindres coûts les expertises appropriées.

Dans la procédure que je viens de décrire, c’est la partie avec la charge de la preuve qui supportera le coût de la preuve, du moins lorsque les éléments de preuve dont elle dispose sont en sa faveur. En effet, le « jeu de la preuve » a un équilibre très simple. Si le demandeur a la charge de la preuve, il perd le procès s’il ne démontre pas qu’une faute a été commise. L’équilibre est donc alors comme suit :

Le plaignant présente la preuve à la seconde étape, mais seulement si la preuve qu’il a entre les mains est x_a. En effet, il n’a aucun intérêt à supporter un coût pour présenter x_a̅. Autrement dit, le plaignant se désistera à l’étape 2 si la preuve qu’il obtient est x_a̅.
Le défendeur reste passif. Si la preuve qu’il a entre les mains est x_a, il n’a pas intérêt à supporter un coût pour la présenter; il sait que le plaignant le fera à coup sûr et n’a rien à lui opposer. Si la preuve entre ses mains est x_a̅, le défendeur n’a pas non plus intérêt à supporter un coût pour la présenter puisqu’il sait que le plaignant se désistera. Comme le plaignant a la charge de la preuve, c’est alors le défendeur qui l’emporte par défaut.

Inversement, si le défendeur a la charge de la preuve, il perd le procès s’il ne démontre pas qu’aucune faute n’a été commise. L’équilibre est donc alors :

Le défendeur présente la preuve à la seconde étape si la preuve qu’il a entre les mains est x_a̅.
Le plaignant reste passif à la seconde étape puisque c’est lui qui gagne par défaut.

Pour obtenir ces équilibres, il faut évidemment que le coût de présentation de la preuve soit inférieur à l’enjeu monétaire du litige, ce que je suppose ici.

La question est de savoir qui, du plaignant ou du défendeur, devrait avoir la charge de la preuve lorsque le plaignant dispose d’un motif valable de poursuite. Plus formellement, la question est la suivante : étant donné l’information représentée par y₁, laquelle des deux parties devrait supporter le coût de démontrer les faits à l’étape 2? Lorsque c’est le plaignant qui a la charge de la preuve, on a vu que le défendeur reste passif et donc ne supporte aucun coût de preuve. En revanche, le plaignant présentera la preuve si elle lui est favorable; sinon, le plaignant se désistera. Lorsque le plaignant a la charge de la preuve, l’espérance mathématique des coûts de preuve est donc p(a | y₁)C_P, où p(a | y₁) est la probabilité a posteriori de a sachant y₁. De façon symétrique, lorsque c’est le défendeur qui a la charge de la preuve, il ne présente la preuve que si elle l’exonère. L’espérance mathématique des coûts de preuve est donc alors (1 – p(a | y₁))C_D. Par conséquent, l’attribution de la charge de la preuve au plaignant minimise en moyenne les coûts de preuve lorsque

Quand l’inégalité est inversée, les coûts sont minimisés en attribuant la charge au défendeur.

La probabilité a posteriori que l’on vient d’introduire dépend de deux facteurs : premièrement l’information que véhicule y₁, c’est-à-dire dans mon exemple la survenance de complications lors d’une intervention chirurgicale; deuxièmement la probabilité a priori du fait a, c’est-à-dire la fréquence des fautes techniques ou autres dans de telles interventions, ce que je dénote par p₀. Lorsqu’une poursuite a été intentée, en appliquant le théorème de Bayes, on obtient la probabilité a posteriori

On voit ici que le « début de preuve » représenté par y₁ est d’autant plus informatif des faits pertinents que la probabilité q est petite. Lorsque cette probabilité est proche de zéro, des complications ne surviennent à peu près jamais s’il n’y a pas eu de faute professionnelle. L’observation que des complications sont survenues est alors un indice très fort qu’une faute a dû être commise[11].

En utilisant (2), la condition (1) se réécrit

Cette condition indique les facteurs à prendre en compte pour une attribution de la charge de la preuve (ou l’utilisation de présomptions légales) visant à minimiser les coûts de preuve. Le plaignant devrait avoir la charge (i) si le fait allégué par le plaignant est a priori peu fréquent ou peu probable, c’est-à-dire si p₀ est petit; (ii) si les indices fournis par le début de preuve déposé par le plaignant ne sont par eux-mêmes pas trop probants, c’est-à-dire si q n’est pas trop petit; et (iii) si les coûts de présentation de la preuve pour le plaignant ne sont pas trop élevés comparativement à ceux que devrait supporter le défendeur.

Le point (iii) peut s’interpréter de différentes façons. Dans ce qui précède, j’ai défini C_P comme le coût pour le plaignant de présenter une preuve quelle qu’elle soit, c’est-à-dire aussi bien x_a que x_a̅ ; j’ai défini C_D de la même façon pour le cas du défendeur. La différence entre C_P et C_D était alors attribuable à l’asymétrie des situations dans lesquelles se trouvent le plaignant et le défendeur. Compte tenu de l’équilibre du jeu de la preuve, on pourrait cependant considérer que les plaideurs sont dans une situation symétrique eu égard aux coûts de preuve, mais en interprétant maintenant C_P comme le coût de présenter x_a et C_D comme le coût de présenter x_a̅. Par exemple, il pourrait être intrinsèquement moins compliqué et donc moins coûteux de démontrer l’existence d’un fait que son inexistence[12].

Dans ce modèle simple, le tribunal rend toujours le bon jugement quelle que soit l’attribution de la charge de la preuve et bien que la preuve des faits ne lui soit pas toujours présentée. Lorsque le plaignant a la charge de la preuve et qu’aucune preuve n’est présentée, c’est que le fait véritable doit être a̅. Comme la procédure prescrit que le plaignant doit être débouté s’il ne présente pas la preuve, la décision du tribunal est donc alors la bonne. On pourrait aussi dire que le tribunal est alors en mesure d’en déduire qu’aucune faute n’a été commise, un résultat classique dans les jeux de persuasion (voir par exemple Milgrom et Roberts, 1986). Le même raisonnement vaut pour le cas où le défendeur a la charge de la preuve.

L’argument développé ci-dessus s’inspire de Hay and Spier (1997). On peut noter que j’ai fait abstraction de la possibilité d’un arrangement amiable. Lorsqu’une poursuite est intentée, les parties se rendent nécessairement jusqu’au procès. Je maintiendrai cette hypothèse dans tout ce qui va suivre. En pratique, la majeure partie des poursuites se résolvent par un accord amiable, de façon justement à éviter les frais d’un procès. On peut donc interpréter ce qui précède comme ce qui se passerait si on ne réglait pas à l’amiable[13].

1.2 L’accès à la preuve

Dans ce qui précède, le tribunal rend toujours le bon jugement. J’examine maintenant une situation où l’erreur judiciaire est possible[14].

Supposons que, à la seconde étape, les plaideurs ne sont pas toujours en mesure de démontrer les faits. Par exemple, il leur est impossible de retracer un document ou un témoin important. Dans le cas de l’intervention chirurgicale, même si une faute a été commise, le patient pourrait ne pas être capable d’en faire la preuve. Pour l’instant, je suppose que c’est tout ou rien : soit une preuve parfaite est possible comme précédemment, soit le plaideur ne dispose d’aucun élément à présenter au tribunal. Le risque d’absence de preuve n’est pas nécessairement le même pour les deux plaideurs. Pour le plaignant, la preuve est accessible avec une probabilité Q_P ; pour le défendeur, elle est accessible avec une probabilité Q_D.

La possibilité qu’on ne puisse fournir la preuve des faits se traduit par le risque de décisions erronées de la part du tribunal. Il y a deux types d’erreur possible. J’appelle erreur de première espèce (type I) le fait de donner raison au plaignant alors que c’est le défendeur qui devrait en fait l’emporter; l’erreur de seconde espèce (type II) survient quand le plaignant est débouté alors qu’en fait il devrait avoir gain de cause. Je considère les propriétés de la procédure du point de vue de la minimisation du risque d’erreur judiciaire, en faisant abstraction des préoccupations reliées aux coûts de la preuve. Dans un litige civil, il est légitime d’accorder une importance égale aux deux types d’erreur, dans la mesure où l’enjeu n’est au final qu’un transfert monétaire entre les parties. Ce que l’un gagne, l’autre le perd. Il en irait autrement dans une procédure criminelle où la sanction associée à un jugement de culpabilité a un coût social, par exemple une peine de prison. On voudrait alors pondérer plus fortement le risque de condamner par erreur[15].

Dénotons par d la décision du tribunal avec d = 1 quand le jugement est en faveur du plaignant et d = 0 quand il est en faveur du défendeur, en incluant dans ce dernier cas la décision par défaut si aucune poursuite n’est intentée. Au total, p étant la probabilité a priori du fait a, la probabilité d’erreur judiciaire est

Dans cette expression, Pr(d = 1 | a̅) désigne la probabilité d’une erreur de première espèce, c’est-à-dire la probabilité de donner gain de cause au plaignant quand a̅ est vrai. De même, Pr(d = 0 | a) est la probabilité d’une erreur de seconde espèce, c’est-à-dire la probabilité de débouter le plaignant quand a est vrai.

Ces probabilités conditionnelles dépendent de l’équilibre du jeu et en particulier de l’attribution de la charge de la preuve[16]. Les équilibres sont de même nature que précédemment, sauf que le plaideur avec la charge ne présente la preuve en sa faveur que lorsqu’il y a accès. On a donc deux possibilités :

Quand le plaignant a la charge de la preuve et qu’une faute a été commise, il y a une probabilité 1 – Q_P qu’il ne puisse prouver le fait. Par conséquent, la probabilité d’une erreur de seconde espèce est Pr(d = 0 | a) = 1 – Q_P. Par ailleurs, si aucune faute n’a été commise, le plaignant ne peut jamais présenter de preuve en sa faveur, de sorte que la probabilité d’une erreur de première espèce est nulle, c’est-à-dire Pr(d = 1 | a̅) = 0. En substituant dans (4), il s’ensuit que la probabilité d’erreur judiciaire est égale à p₀(1 – Q_P).
Un raisonnement semblable s’applique lorsque le défendeur a la charge de la preuve. Dans ce cas Pr(d = 0 | a) = 0, c’est-à-dire que la probabilité d’une erreur de seconde espèce est toujours nulle. L’erreur de première espèce survient si une poursuite est intentée, ce qui a une probabilité q quand aucune faute n’a été commise, et si le défendeur n’est pas en mesure de fournir de preuve à sa décharge, ce qui se produit avec une probabilité 1 – Q_D. Par conséquent, l’erreur de première espèce est Pr(d = 1 | a̅) = q(1 – Q_D). En substituant dans (4), la probabilité d’erreur judiciaire est alors égale à (1 – p₀)q(1 – Q_D).

Une procédure visant la minimisation du risque d’erreur devrait attribuer la charge de la preuve au plaignant si

c’est-à-dire

Comme précédemment, le plaignant devrait avoir la charge de la preuve (i) si le fait qu’il allègue est a priori peu probable et (ii) si le motif valable de poursuite est peu informatif de l’existence du fait qui lui donnerait gain de cause; mais (iii) il faut maintenant que le plaignant ne soit pas trop désavantagé, comparativement au défendeur, relativement à la probabilité d’accès aux moyens de preuve. Par exemple, si le défendeur y a toujours accès (Q_D = 1) mais que ce n’est pas le cas pour le plaignant (Q_P < 1), c’est le défendeur qui devrait avoir la charge de la preuve.

Ces résultats appellent quelques commentaires. Premièrement, je n’ai considéré que la minimisation du risque d’erreur judiciaire. Cela pourrait se justifier par le fait que les coûts de présentation de la preuve sont négligeables ou du moins qu’ils le sont par rapport à l’importance qu’on accorde au risque d’erreur. Plus généralement, on pourrait considérer l’arbitrage entre risque d’erreur et coût de la preuve lorsque ces objectifs ne prescrivent pas la même attribution de la charge.

Deuxièmement, contrairement au cas précédent, il subsiste une incertitude lorsqu’aucune preuve n’a été présentée à l’issue de la procédure. Lorsque la preuve était toujours disponible, la non-présentation de preuve par la partie qui a la charge permettait d’inférer que les faits jouaient contre elle. Dans le cas présent, en revanche, on ne peut savoir si c’est parce que la partie avec la charge n’avait pas accès à la preuve ou si c’est parce que, bien qu’elle y ait eu accès, la preuve ne jouait pas en sa faveur. L’attribution optimale de la charge de la preuve prend en compte ces deux possibilités : elle dépend des capacités des parties à constituer la preuve et de leur intérêt stratégique à ne pas révéler une preuve défavorable. Elle tient compte aussi du fait qu’une partie qui n’a pas la charge ne présentera pas de preuve (même si celle-ci lui est favorable) parce que cela lui impose un coût inutile.

Troisièmement, et pour faire suite à la dernière remarque, je me suis borné à discuter des facteurs déterminant l’attribution optimale de la charge de la preuve. Ainsi, on pourrait considérer que la règle par défaut devrait être d’imposer la charge au plaignant, sauf certaines catégories de situations où la loi prescrirait le contraire sur la base des conditions générales que l’on vient d’analyser. Dans le même esprit, ces conditions permettent de rationaliser les présomptions légales pour la preuve de certains faits. Par contre, la question de savoir si un tribunal attribuera « spontanément » la charge de la preuve de manière optimale est d’une autre nature. Ce point est abordé dans un cadre plus riche par Demougin et Fluet (2008) et j’en discuterai ultérieurement[17].

1.3 Les incitations ex ante

Des faits de toutes sortes peuvent constituer l’objet d’un litige. Une distinction intéressante est celle que l’on peut faire entre des faits involontaires, par exemple la santé mentale du testateur dans le cas de la contestation d’un testament, et des faits volontaires ou qui du moins dépendent, peut-être de façon aléatoire, d’agissements délibérés.

Je considère maintenant le cas où le fait pertinent est une action choisie ex ante par le défendeur. Cette action cause au plaignant un préjudice ouvrant un droit à réparation[18], mais elle procure au défendeur un avantage, par exemple une économie de coûts, de temps ou d’effort. Dans une relation contractuelle, l’action en question pourrait signifier que le défendeur ne s’acquitte pas correctement de ses obligations : il ne livre pas la qualité de travaux convenue ou livre le bien avec des retards indus. En responsabilité civile à l’égard des tiers, ce pourrait être que le défendeur a eu un comportement imprudent qui a occasionné des dommages accidentels au plaignant. Dans l’intervention chirurgicale, a pourrait signifier que le chirurgien ou l’anesthésiste n’ont pas pris les précautions appropriées; par exemple, ils n’ont pas pris suffisamment connaissance du dossier du patient avant l’intervention, de sorte que certaines décisions médicales étaient contre-indiquées. Inversement, l’action a̅ signifie que le défendeur a eu le comportement socialement désirable.

L’une des raisons d’être des recours en justice est de réguler les comportements. Lorsque la preuve est toujours disponible, comme dans le premier cas de figure examiné ci-dessus, la dissuasion des comportements indésirables découle de la certitude d’être poursuivi et condamné aux dommages-intérêts si l’on fait a, le risque étant nul si on fait a̅. S’il y a possibilité d’erreur judiciaire comme dans le second cas de figure, la dissuasion dépend de la différence entre les risques d’être condamné aux dommages-intérêts selon le comportement que l’on adopte. S’il n’y avait aucune différence, le défendeur n’aurait aucune incitation à prendre les précautions appropriées puisque celles-ci lui imposent un coût.

La dissuasion dépend aussi des dommages-intérêts auxquels on s’expose. Le montant dépend de l’évaluation du préjudice subi par les plaignants dans les situations considérées. Dans mon analyse, ce montant est prévisible, de sorte que les effets incitatifs des recours en justice dépendront uniquement du risque de jugement défavorable. Cela étant, j’appellerai dissuasion l’augmentation de la probabilité d’une condamnation à des dommages-intérêts si on fait a plutôt que a̅, c’est-à-dire

Les probabilités conditionnelles ont la même signification que précédemment. On pourrait considérer que le coût (en temps, en effort, etc.) de faire l’action socialement désirable est variable sur l’ensemble des situations où une décision doit être prise. Par exemple, ce coût pourrait dépendre des circonstances dans lesquelles se trouvait le défendeur ou des caractéristiques des défendeurs. Par conséquent, plus la dissuasion telle que définie en (6) est grande, plus il y aura de situations où on choisira l’action désirable.

L’expression (6) peut se réécrire sous la forme

L’expression entre crochets est la somme des probabilités d’erreurs de première et seconde espèce. L’efficacité incitative des recours en justice est donc d’autant plus grande que ces probabilités sont petites (cf. Polinsky et Shavell, 1989). Si le risque d’erreur était nul, la dissuasion serait égale à l’unité, ce qui correspond à la certitude d’un jugement défavorable si on commet l’action socialement indésirable et à l’impossibilité d’un tel jugement sinon.

En reprenant les résultats du modèle d’accès incertain à la preuve, on a Pr(d = 0 | a) = 1 – Q_P lorsque le plaignant a la charge de la preuve, l’erreur de première espèce étant nulle dans ce cas. Le niveau de dissuasion est donc alors égal à Q_P, la probabilité que le demandeur ait accès à la preuve et que par conséquent le défendeur soit condamné aux dommages-intérêts s’il a commis l’action indésirable. Dans le cas opposé où le défendeur a la charge de la preuve, Pr (d = 1 | a̅) = q(1 – Q_D) et l’erreur de seconde espèce est nulle. Le niveau de dissuasion est alors égal à 1 – q(1 – Q_D).

Lorsque l’objectif du système judiciaire est la maximisation des incitations, le plaignant devrait avoir la charge de la preuve si

c’est-à-dire

Ces conditions ont d’autant plus de chance d’être satisfaites que (i) le motif valable de poursuite est peu informatif du fait donnant droit à réparation et (ii) que le plaignant n’est pas trop désavantagé, comparativement au défendeur, dans l’accès à la preuve. La probabilité a priori de l’action indésirable, par exemple sa fréquence dans ce genre d’interventions, ne joue plus aucun rôle. En fait, cette fréquence est maintenant endogène puisqu’elle dépend des incitations fournies par le système judiciaire.

Pour les faits volontaires, il y donc un conflit entre la minimisation des erreurs judiciaires ex post et la maximisation des incitations ex ante. Ce conflit a été noté par divers auteurs, notamment Schrag et Scotchmer (1994). Il jouera un rôle important dans la discussion de la norme de preuve à la prochaine section. Pour l’instant, il suffit de comparer les conditions (7) et (5). Lorsque l’objectif est la maximisation des incitations, tout se passe comme si on utilisait la condition (5) pour la minimisation du risque d’erreur judiciaire mais en remplaçant la probabilité a priori p̂₀, c’est-à-dire la fréquence de l’action a dans des cas semblables, par le pseudo-a priori p̂₀ = 1/2. Autrement dit, c’est comme si le tribunal partait du principe qu’il devait considérer comme équiprobables les allégations du plaignant et du défendeur.

À titre d’illustration, supposons que des études ont préalablement montré que la fréquence d’actions négligentes n’est pas la même chez les femmes chirurgiens que chez les hommes chirurgiens. Dénotons ces fréquences par p^F₀ et p^H₀ respectivement. En appliquant la condition (5), si p^F₀ est plus petit que p^H₀, il serait possible d’avoir simultanément

Lorsque l’objectif est la minimisation du risque d’erreur judiciaire, il faudrait alors attribuer la charge de la preuve au plaignant si le chirurgien est une femme et au défendeur s’il s’agit d’un homme, ce qu’on peut interpréter comme une forme de discrimination statistique. Par contre, lorsque l’objectif est d’influencer les comportements, le sexe du chirurgien ne constituerait pas un élément d’information pertinent pour l’attribution de la charge de la preuve. On devrait faire abstraction de cette information et attribuer la charge de la preuve en fonction de la condition (7). Les fréquences endogènes des comportements négligents seront alors inférieures à ce que l’on aurait obtenu avec une procédure visant la minimisation du risque d’erreur. Indépendamment de toute considération d’équité, le refus de la discrimination statistique peut donc s’expliquer par le souci de ne pas affaiblir les effets incitatifs des recours en justice[19].

Le modèle simple développé dans cette section fournit une explication plausible de l’évolution récente de certaines jurisprudences, notamment en matière de responsabilité médicale face à l’évolution des techniques thérapeutiques (voir Fluet, 2006). Considérons à nouveau la condition (7). On voit que cette condition ne sera pas satisfaite si la preuve parfaite est le plus souvent inaccessible (c’est-à-dire si Q_P et Q_D sont petits). Le défendeur devrait alors avoir la charge de la preuve, ce qu’on peut assimiler à une présomption de faute. L’évolution récente du droit de la responsabilité médicale montre un recours de plus en plus fréquent à ce genre de présomptions, voire un glissement vers des formes d’obligations de résultats par opposition à l’obligation traditionnelle de moyens[20]. On attribue souvent cette évolution au souci qu’auraient eu les juridictions de faciliter l’indemnisation financière des dommages. À y regarder de plus près, cependant, on constate que cette évolution ne s’est surtout manifestée que pour certaines catégories d’aléas thérapeutiques. Ceux-ci se caractérisent soit par le fait que la simple survenance de l’aléa est par elle-même un indice particulièrement probant de l’existence d’une faute, soit par le fait que les éléments de preuve additionnels sont difficiles à obtenir. Autrement dit, on peut faire l’argument que l’évolution de la jurisprudence s’explique par des considérations incitatives.

2. La norme de preuve

Je relâche maintenant l’hypothèse que les preuves sont toujours sans ambiguïté. Lorsqu’une preuve laisse subsister un doute, il y aura un risque d’erreur judiciaire quel que soit le jugement rendu, mais pour une raison différente de ce qu’on a vu précédemment. Pour bien marquer la différence, je suppose dans cette section que les deux parties ont toujours accès aux mêmes éléments de preuve. Cependant, les preuves peuvent dorénavant être imparfaites.

Cette possibilité peut être représentée de la façon suivante. Dénotons par x la totalité de la preuve que les plaideurs sont en mesure de présenter à l’étape 2. Par définition, x est la combinaison de plusieurs informations vérifiables : des témoignages oraux et des documents comme le dossier médical du patient, le rapport établi par l’équipe médicale à l’issue de l’intervention, des rapports d’expertise, etc. Je suppose que, conditionnellement aux faits pertinents, la preuve qui se matérialisera à l’étape 2 n’est pas parfaitement prévisible. Par exemple, elle pourrait être x' ou x'' où l’une diffère de l’autre seulement sur un point, à savoir que l’une contient en outre le témoignage d’un infirmier rapportant avoir cru remarquer un problème lors de l’anesthésie. Plus généralement, les preuves peuvent différer par le contenu de plusieurs témoignages, par le libellé du rapport de l’équipe médicale, par l’identité des experts sollicités, etc.

Figure 2

**Une procédure avec preuves imparfaites**

Je dirai qu’une preuve x est imparfaite si elle peut être obtenue quels qu’aient été les faits, en ce sens que les probabilités conditionnelles satisfont simultanément p(x | a) > 0 et p(x | a̅) > 0. Autrement dit, l’observation de cette preuve est compatible aussi bien avec le fait donnant raison au plaignant qu’avec le fait contraire; une telle preuve contient néanmoins de l’information utile dans la mesure où les probabilités conditionnelles sont différentes. Je dénoterai par X l’ensemble des réalisations possibles de la preuve à l’étape 2. Une preuve est donc un élément de X. Par exemple, x' et x'' sont des éléments de cet ensemble, parmi d’autres[21].

La figure 2 décrit la nouvelle situation. Les étapes 0 et 1 sont les mêmes que précédemment. Pour que la figure reste lisible, je ne représente explicitement que x' et x'' comme preuves susceptibles d’être présentées à l’étape 2, même si d’autres réalisations sont possibles. Notons que je n’exclus pas la possibilité que certaines réalisations soient des preuves parfaites. Par hypothèse, cependant, de telles preuves ne sont pas obtenues à coup sûr, sinon la situation serait essentiellement la même que dans la section précédente[22].

La possibilité de preuves imparfaites soulève la question du degré de preuve requis pour un jugement. La relation entre preuve et jugements est représentée par la fonction de décision d(x), où d(x) = 0 signifie qu’on donne raison au défendeur lorsque la preuve est x et d(x) = 1 qu’on donne raison au plaignant. Il s’agit donc de déterminer ce que devrait être cette fonction.

2.1 Le risque d’erreur judiciaire

La probabilité de jugements erronés est définie comme en (4). Pour une fonction de décision donnée, la probabilité de l’erreur de première espèce est

celle de seconde espèce est

La probabilité d’erreur judiciaire est donc

On cherche les propriétés de la fonction de décision d(x) qui minimise cette expression. Il est utile de réécrire (10) en fonction des probabilités a posteriori des faits pertinents, étant donné la preuve disponible. La probabilité a priori d’obtenir la preuve x est

En appliquant le théorème de Bayes, les probabilités a posteriori sont donc

En substituant dans (10), la probabilité d’erreur judiciaire peut se réécrire sous la forme

Le risque d’erreur est minimisé si la fonction de décision maximise le second terme de cette expression. La fonction optimale satisfait par conséquent

Le plaignant devrait avoir gain de cause si le fait qu’il allègue est a posteriori plus probable que son contraire. Lorsqu’il ya équiprobabilité, il est indifférent de donner raison au plaignant ou au défendeur. Ce résultat rappelle évidemment la norme de la balance des probabilités ou prépondérance de preuve en common law.

C’est cette interprétation qui s’est imposée chez les juristes de common law à partir des années soixante-dix, dans la foulée du renouveau bayésien des années cinquante et du développement de la théorie de la décision[23]. Pour Brook (1982) et plusieurs commentateurs par la suite, la justification première de la norme de la prépondérance de preuve est cette propriété de minimisation du risque d’erreur. Elle équivaut à la minimisation des coûts sociaux moyens d’erreur si on considère comme également indésirables les erreurs de première et seconde espèce dans les litiges civils. Clermont et Sherwin (2002) en concluent que le standard plus exigeant des régimes romano-germaniques se traduit par une plus grande fréquence d’erreur, ce qui les amène à s’interroger sur l’objectif que ces régimes poursuivraient.

Au début de cette section, j’ai réintroduit l’hypothèse d’égalité d’accès des parties aux éléments de preuve potentiels, afin de me concentrer sur la question de la norme de preuve. On vérifie facilement que, sous la règle de décision d^*(x), l’attribution de la charge de la preuve n’a aucune conséquence sur le jugement que rendra le tribunal. Si le plaignant a la charge de la preuve, il présente la preuve disponible x si celle-ci satisfait d^*(x) = 1, sinon il ne présente rien et donc perd sa cause. Inversement, si le défendeur a la charge de la preuve, il présente la preuve disponible si elle satisfait d^*(x) = 0, sinon il reste passif et le plaignant l’emporte. Autrement dit, la décision est essentiellement la même que si le tribunal observait directement les éléments de preuve[24].

2.2 Les incitations ex ante

Lorsque l’objet du litige est une action délibérée du défendeur et que l’objectif est d’influencer les comportements, la fonction de décision d(x) devrait maximiser la dissuasion telle que définie en (6). En substituant dans cette expression à partir de (8) et (9), la dissuasion est égale à

Cette expression est maximisée par la fonction

Encore une fois, les probabilités a priori des faits pertinents ne jouent aucun rôle lorsque l’objectif est la maximisation des incitations. Dans la terminologie statistique, p(x | a) et p(x | a̅) sont les vraisemblances de a et a̅ respectivement, lorsqu’on observe x. Avec la règle de décision (13), le défendeur est donc pénalisé en fonction des vraisemblances relatives plutôt que des probabilités a posteriori. En fait, les incitations ex ante sont maximisées lorsque le critère de décision ex post est celui du maximum de vraisemblance, comme dans la statistique classique des problèmes d’estimation[25].

Il est intéressant de comparer les fonctions de décision (12) et (13) pour le cas d’une relation contractuelle, lorsque l’exécution de l’obligation prévue au contrat est imparfaitement vérifiable ex post, d’où la possibilité que le débiteur tente d’échapper à son obligation (voir Fluet, 2003). La valeur du contrat pour les parties – le surplus de coopération – dépend de la qualité des informations qui seront disponibles ex post et de la règle de décision qu’applique le tribunal chargé d’arbitrer les litiges. On peut donc comparer les équilibres selon que le critère vise la minimisation des erreurs ou la maximisation des incitations du débiteur à respecter la lettre du contrat. C’est évidemment la fonction de décision (13) qui maximise le surplus espéré des parties et par conséquent la valeur ex ante du contrat. En d’autres termes, les parties préfèrent un tribunal qui ne cherche pas nécessairement à « dire le vrai » ex post[26]. L’inefficacité relative du critère de minimisation des erreurs dépend cependant de la qualité de l’information disponible ex post. La perte de surplus anticipé découlant de (12), comparativement à (13), est d’autant plus importante que les preuves sont en moyenne peu informatives.

2.3 La notion de balance des probabilités

J’ai présenté ci-dessus l’interprétation bayésienne de la norme de la prépondérance de preuve ou balance des probabilités. Il s’agit, comme on l’a vu, d’une rationalisation récente de la pratique en common law. Dans le langage juridique, le terme de « probabilité » renvoie cependant à des usages beaucoup plus anciens que le concept mathématique qu’il recouvre aujourd’hui.

Jusqu’au début du 18^e siècle, la probabilité est l’attribut d’une opinion ou d’une conjecture et désigne la crédibilité ou l’autorité qu’on doit leur accorder. Les premiers écrits sur la « géométrie du hasard » n’utilisent pas ce terme, mais parlent plutôt d’espérance, de sorts ou de chances. Au début du 19^e siècle, soit l’époque où la norme de preuve en common law finit de prendre forme, les juristes parlent encore des probabilités ou vraisemblances en faveur ou contre une conjecture, les deux termes étant pris dans le même sens et dans leur ancienne acceptation, sans aucune connotation mathématique[27]. Cette tradition s’est perpétuée, de sorte que la norme de preuve en common law peut donc tout aussi bien être décrite par la condition (13). La condition p(x | a) > p(x | a̅) signifie alors que les éléments de preuve disponibles donnent plus de poids à la conjecture a qu’à son contraire, ce qui correspond aussi à la notion juridique de prépondérance de preuve. Avec cette interprétation, la norme de preuve en common law ne minimise pas les erreurs, mais maximise plutôt les incitations.

En fait, lorsque l’objet du litige est une action délibérée du défendeur, la thèse de la minimisation des erreurs a ceci de paradoxal qu’elle est incompatible avec une autre particularité de la procédure de common law, à savoir des règles strictes d’irrecevabilité (evidentiary rules) de certaines informations. Selon ces règles, la fréquence de l’action a dans une population de référence serait considérée comme non pertinente, c’est-à-dire qu’on doit en faire abstraction pour juger du cas d’espèce soumis au tribunal. Il en irait de même de la propension qu’aurait pu avoir le défendeur à avoir le comportement fautif (par exemple, son intérêt à le faire) ou de sa réputation d’avoir eu un tel comportement dans des situations comparables par le passé[28].

Demougin et Fluet (2006) argumentent que les règles d’irrecevabilité en common law interdisent au juge d’utiliser des a priori informés pour réduire le risque d’erreur. En contrepartie, les règles d’irrecevabilité combinées à la norme de la prépondérance de preuve assurent la maximisation des incitations ex ante. Je développerai ces idées dans la prochaine section. À la lumière de ces résultats, Demougin et Fluet (2005) montrent qu’on peut prendre l’exact contrepied de la thèse de Clermont et Sherwin (2002), en soutenant que les systèmes romano-germaniques se rapprochent sans doute plus de l’objectif de minimisation des erreurs.

3. Règles de preuve et procédure

Dans la discussion de la charge de la preuve à la section 1, j’ai noté qu’il ne fallait pas en conclure qu’un tribunal jugeant d’un cas d’espèce attribuerait spontanément la charge de manière optimale. Il s’agissait plutôt d’identifier les facteurs que la loi ou la jurisprudence devraient considérer pour dicter l’attribution de la charge dans certaines catégories de situations. De même, dans la discussion de la preuve imparfaite à la section 2, j’ai analysé la détermination des fonctions de décision qui devraient être utilisées. J’ai fait un rapprochement entre ces fonctions et la notion de norme de preuve, mais c’était à des fins heuristiques de manière à donner une interprétation des fonctions.

J’examine maintenant comment on peut déléguer à des tribunaux la responsabilité de juger des cas d’espèce qui leur sont soumis. On conçoit qu’il est impossible de communiquer aux tribunaux des fonctions de décision contingente comme d(x), ce qui équivaudrait à des catalogues d’actions à prendre dans chacune des situations qui pourraient survenir. S’il est impossible de communiquer des fonctions de décision détaillées, existe-t-il des principes généraux ou règles qui, si les tribunaux s’y conformaient, les amèneraient à prendre les bonnes décisions dans les cas d’espèce? Les normes de preuve, tels qu’on les pratique en common law, sont des exemples de principes généraux permettant d’orienter les décisions.

3.1 Les règles de preuve

Examinons à nouveau la situation décrite à la section 2, mais cette fois en modélisant explicitement le tribunal ou le juge comme un joueur dans le jeu de la preuve. Par rapport au modèle analysé jusqu’à présent, il faut maintenant ajouter une étape finale où le juge rend sa décision sur la base de ses croyances et des objectifs qu’il poursuit. La question n’est donc plus de déterminer la meilleure fonction de décision, mais de savoir à partir de quels principes généraux un juge décidant ex post sera conduit à rendre les « bons » jugements.

Supposons pour l’instant que l’objectif social soit la minimisation des erreurs dans les décisions de justice. Considérons les règles de preuve suivantes : (i) le plaignant a la charge de la preuve; (ii) le juge doit donner gain de cause au plaignant si et seulement si, sur la base de la preuve présentée, le fait a lui apparaît ex post comme plus probable que le fait contraire. La règle (ii) correspond évidemment à la norme de la prépondérance de preuve dans l’interprétation bayésienne. Je suppose que le juge est un « agent parfait » qui respecte les règles de preuve. On peut dès lors interpréter (ii) comme définissant la fonction d’utilité du juge. Par exemple, en rendant sa décision, le juge obtient l’utilité u = 1 s’il ne fait pas d’erreur et u = 0 s’il fait une erreur de première ou seconde espèce. Un juge maximisant son espérance d’utilité, sur la base de ses croyances ex post, se conforme alors à (ii).

En effet, on voit facilement que l’équilibre bayésien parfait de ce jeu est unique et que la stratégie d’équilibre d(x) du juge correspond à la fonction de décision d^*(x) qui minimise la probabilité d’erreur judiciaire, telle que définie par la condition (12). On obtiendrait le même résultat si les règles étaient modifiées comme suit : le défendeur a la charge de la preuve et le juge doit lui donner gain de cause si et seulement si a̅ lui apparaît a posteriori comme le plus probable.

Supposons maintenant que l’objectif social est de maximiser les incitations lorsque l’objet du litige est une action délibérée. Comme on l’a vu à la section précédente, il faudrait alors que la décision ne repose que sur les vraisemblances. Considérons le ratio des probabilités a posteriori représentant les croyances du juge après présentation de la preuve x. En utilisant (11), ce ratio est égal à

À droite, le premier facteur est le ratio des probabilités a priori, le second est le ratio des vraisemblances étant donné la preuve qui a été soumise.

Si l’on veut que la décision du juge maximise les incitations, les règles de preuves formulées ci-dessus pourraient alors être complétées de la façon suivante : (iii) lorsque les faits pertinents sont des actions délibérées, le tribunal devrait « juger sans a priori » . Pour le formuler différemment, le juge devrait faire abstraction de l’information qu’il a sur p₀ et aborder la cause sur la base du pseudo-a priorip̂₀ = 1/2, comme dans la discussion de l’attribution optimale de la charge de la preuve à la section 2. Il s’agit alors d’une probabilité « normative » donnent un poids égal aux prétentions du plaignant et du défendeur[29]. En substituant cette probabilité dans (14) à la place du véritable a priori, on voit qu’un juge se conformant à (iii) rendra en fait une décision en fonction des vraisemblances relatives. Plus précisément, sa décision dépend alors des pseudo-probabilités a posteriori

On obtient à nouveau que l’équilibre bayésien parfait est unique, sauf que maintenant la stratégie d’équilibre d(x) du juge est la fonction d^*(x) qui maximise les incitations ex ante, telle que définie en (13). La règle de preuve (iii) capture l’esprit des règles d’irrecevabilité de certaines informations en common law. On obtiendrait un résultat analogue si le défendeur avait la charge de la preuve.

Cette interprétation permet de résoudre quelques casse-têtes qui ont fait couler beaucoup d’encre chez les juristes de common law. L’un de ces casse-têtes nous est fourni par ce qu’on a appelé le paradoxe de l’autobus. Un individu a été heurté par un autobus, mais le conducteur a continué sa route, peut-être sans se rendre compte de ce qui s’était passé. Dans la ville il n’y a que deux sociétés d’autobus, les Bus Rouges et les Bus Bleus. Les Bus Rouges effectuent 55 % des trajets et on peut donc estimer à 0,55 la probabilité que la victime se soit trouvée au passage d’un véhicule de la société de Bus Rouges. La victime décide donc de poursuivre cette société mais n’a aucune autre preuve à présenter. Devrait-on donner raison à la victime sur la base de la norme de prépondérance de preuve? Les juristes répondent par la négative, mais sont en peine d’expliquer pourquoi comme le montre l’explication confuse que donne Posner (1999). Cependant, si le droit de la responsabilité vise à réguler les comportements, la décision devrait dépendre du ratio défini en (15). Selon cette condition, une preuve x n’est pertinente que si p(x | a) ≠ p(x | a̅); autrement dit, la probabilité qu’on obtienne cette information vérifiable doit dépendre des faits pertinents. Dans le paradoxe de l’autobus, l’information que 55 % des trajets sont effectués par les Bus Rouges préexiste à la survenance de l’accident et ne dépend pas du fait que l’accident ait été causé par les Bus Rouges ou les Bus Bleus. Cette information ne représente donc pas un élément de preuve pertinent.

Lorsque les deux plaideurs ont toujours accès aux éléments de preuve, les résultats que je viens de présenter peuvent dès lors se résumer comme suit : sous les règles de preuve (i) et (ii), et sous réserve de la règle d’irrecevabilité (iii) lorsqu’elle s’applique, l’équilibre parfait du jeu est unique et la stratégie d’équilibre du juge est conforme à d^*(x)[30].

3.2 La manipulation de la preuve par les plaideurs

Ce qui précède fait abstraction d’un certain nombre de difficultés. Je considère maintenant une situation plus complexe où les règles de preuve que l’on vient de décrire ne garantissent pas l’optimalité des jugements (voir Demougin et Fluet, 2008). On a supposé ci-dessus qu’un plaideur pouvait soit présenter le x disponible soit ne rien présenter du tout. En pratique, s’il en a la possibilité, un plaideur pourrait ne pas révéler tous les éléments de preuve dont il dispose et ne soumettre que ceux qui jouent en sa faveur. Dans la mesure où ils n’ont pas accès aux mêmes éléments de preuve, les plaideurs pourront manipuler de façon stratégique ce qui sera présenté au tribunal.

Rappelons qu’une preuve est une combinaison de témoignages, de documents, etc. Un plaideur pourrait donc n’en présenter qu’une partie. Pour simplifier, je me limiterai à la possibilité d’une partition binaire de la preuve, de sorte qu’on peut écrire x = (s,z). Par exemple, s représente le contenu d’un premier dossier, z le contenu d’un second dossier[31]. Un dossier peut être présenté en totalité ou pas du tout. Je suppose que les plaideurs ont toujours accès au premier dossier; par contre, ils ont accès au second dossier avec les probabilités Q_P et Q_D respectivement. Le déroulement de la procédure est alors modifié comme suit : le plaignant intente une poursuite (ou non); si une poursuite est intentée, le plaignant a la charge de présenter le premier dossier; une fois que ce dossier est soumis, les plaideurs décident ensuite s’ils présentent le second dossier, lorsqu’ils le peuvent évidemment; enfin, le juge rend sa décision. Je suppose que la présentation du premier dossier ne comporte qu’un faible coût. Par contre, le coût de présenter le second est non négligeable (mais inférieur à l’enjeu du litige). Par conséquent, un plaideur ne présentera le second dossier que s’il en retire un avantage comparativement à ce qu’il obtiendrait si ce dossier n’était pas présenté. Ce jeu de la preuve est semblable à ceux que l’on a examinés jusqu’ici, sauf que l’étape de présentation de la preuve est décomposée en deux sous-étapes. Il y a une différence essentielle, toutefois, en ce que les parties sont maintenant en mesure de tronquer les éléments de preuve qui seront soumis au tribunal. Plus précisément, il se pourrait que le second dossier ne soit pas présenté, ce que je dénoterai par φ. Au terme de la procédure, c’est-à-dire à l’étape du jugement, le tribunal aura donc reçu une preuve qui aura soit la forme (s,z) soit la forme (s,φ). Dans le premier cas, le tribunal observe les contenus des deux dossiers; dans le second, il n’observe que le contenu du premier dossier.

Dans ce qui va suivre, je procéderai en deux étapes. Premièrement, je détermine la fonction de décision optimale décrivant ce que devrait faire le juge au terme de la procédure. Je me limiterai au cas où l’objectif social est de minimiser les erreurs (le raisonnement est le même quand l’objectif est de maximiser les incitations). Deuxièmement, j’examine si les principes généraux décrits précédemment conduiront le juge à adopter une stratégie compatible avec la fonction de décision optimale.

Considérons donc d’abord la fonction de décision optimale. On montre facilement que, lorsque les deux dossiers sont présentés, la fonction optimale satisfait la condition (12), de sorte que

Autrement dit, le demandeur a gain de cause si a est a posteriori plus probable sur la base du contenu des deux dossiers.

Le cas où la preuve soumise se limite au premier dossier est plus délicat. Dénotons par S_φ l’événement correspondant aux situations où soit aucun des plaideurs ne peut présenter le second dossier, soit seul l’un d’entre eux le peut mais la présentation de ce dossier ne lui procure aucun avantage (étant donné le contenu du premier dossier)[32]. On peut calculer la probabilité de S_φ. De même, on peut calculer les probabilités a posteriori p(a | s_φ) et p( a̅ | s_φ). On peut alors montrer que la fonction de décision optimale satisfait

Prises simultanément, les conditions (16) et (17) définissent la fonction de décision optimale. Voyons maintenant si les règles de preuve introduites à la sous-section précédente permettent de déléguer efficacement la décision à un juge, qui rend sa décision en fonction de ses croyances au terme de la procédure. On a le résultat suivant :

Sous les règles (i) et (ii), et sous réserve de (iii) lorsqu’elle est pertinente, il existe toujours un équilibre bayésien parfait où la stratégie d’équilibre du juge satisfait d^*(s,z) et d^*(s,φ).
De manière générique, toutefois, il y a aussi des équilibres dans lesquels la stratégie du juge est conforme à d^*(s,z) mais ne satisfait pas d^*(s,φ).

En d’autres termes, les règles de preuve ne garantissent pas que, à l’équilibre, la décision du juge satisfera la condition (17). L’existence d’une multiplicité d’équilibres nécessite que Q_P et Q_D ne soient pas trop petits. Évidemment, quand ces probabilités sont toutes deux égales à zéro, le problème de la manipulation stratégique de la preuve ne se pose pas.

L’intuition du résultat tient au fait que, à l’issue de la procédure, les croyances du juge sont endogènes (elles dépendent de l’équilibre) et qu’elles sont autoréalisatrices (elles ont confirmées à l’équilibre). Ainsi, pour une réalisation s, on pourrait avoir que les parties anticipent la décision d(s,φ) = 1 et agissent en conséquence. À la dernière étape du jeu, si le second dossier n’a pas été présenté, le juge décide effectivement d(s,φ) = 1 car ses croyances satisfont alors

Toutefois, on pourrait parfaitement avoir un autre équilibre tel que, pour la même réalisation s, les parties anticipent la décision d(s,φ) = 0 et jouent donc en conséquence. Ex post, le juge décide alors d(s,φ) = 0 car dans ce cas ses croyances satisfont

La possibilité d’avoir aussi bien (18) que (19) découle du fait que l’information (s,φ) n’a pas la même signification dans les deux équilibres. Les inférences du juge dépendent des stratégies des parties et ces stratégies dépendent elles-mêmes de l’appréciation que fera le juge lorsque la preuve se réduit au premier dossier[33].

Pour illustrer la possibilité d’équilibres multiples, je discuterai du cas simple où le second dossier constitue une preuve parfaite. Le contenu de ce dossier est alors soit z_a soit z_a̅, ce qui se rapproche de la situation examinée dans la section 1. Quel que soit s, on a alors p(a | s,z_a) = 1 et p(a | s,z_a̅) = 0. Dans cette situation, l’événement s_φ est l’union des événements suivants: {le contenu du premier dossier est s et aucun des plaideurs n’a accès au second dossier}, {le contenu du premier dossier est s, seul le plaignant a accès au second dossier et son contenu est z_a̅}, {le contenu du premier dossier est s, seul le défendeur a accès au second dossier et son contenu est z_a}. La probabilité a priori de s_φ est donc

En simplifiant, on obtient

Par le théorème de Bayes,

de sorte que

Si le ratio de probabilités (20) est supérieur à l’unité, la fonction de décision optimale satisfait d^*(s,φ) = 1; elle satisfait d^*(s,φ) = 0 si le ratio est inférieur à l’unité[34].

Considérons maintenant les équilibres possibles. Je me bornerai au cas où le ratio (20) est supérieur à l’unité, ce qui implique d^*(s,φ) = 1. Premièrement, il y a toujours un « bon équilibre » dans lequel la stratégie du juge est bien d(s,φ) = 1. Lorsque les parties anticipent cette décision, tout se passe comme si le défendeur avait la charge de présenter le second dossier quand le contenu du premier est s, à défaut de quoi il perd le procès. Dans cet équilibre, l’ensemble d’information (s,φ) signifie donc : {le contenu du premier dossier est s et soit le défendeur n’a pas accès au second dossier soit son contenu est z_a}. À l’équilibre du jeu, la probabilité de cet événement est

Les croyances a posteriori du juge sont donc

ce qui donne le ratio de probabilités a posteriori

Il s’agit ici des croyances a posteriori du juge à l’équilibre du jeu. Pour que d(s,φ) = 1 soit une stratégie d’équilibre, il faut que le ratio des probabilités a posteriori soit supérieur à l’unité. On voit que (21) diffère de (20). Cependant, si (20) est supérieur à l’unité, il en sera nécessairement de même de (21). En d’autres termes, un « bon équilibre » existe toujours.

Examinons maintenant la possibilité d’un « mauvais équilibre » où le juge adopterait la stratégie d(s,φ) = 0. Tout se passe alors comme si c’était le plaignant qui avait la charge de présenter le second dossier lorsque le premier dossier révèle s. Dans cet équilibre, l’ensemble d’information (s,φ) signifie maintenant : {le contenu du premier dossier est s et soit le plaignant n’a pas accès au second dossier soit son contenu est z_a̅}. La probabilité de cet événement est

Les croyances a posteriori du juge sont maintenant

ce qui donne le ratio

Le ratio (22) diffère de (21) et de (20). Si (22) est inférieur à l’unité, un juge recevant la preuve (s,φ) en déduit que a est moins probable que a̅. La stratégie d(y,φ) = 0 fait donc bien partie d’un équilibre. Si Q_P est suffisamment grand, (22) est inférieur à l’unité, ce qui signifie qu’un « mauvais équilibre » existe de manière générique[35]. La figure 3 illustre la possibilité d’équilibres multiples.

J’ai fait remarquer que, à l’équilibre, la stratégie d(y,φ) jouait un rôle analogue à celui de l’attribution de la charge de la preuve lorsque seul le premier dossier avait été présenté et que son contenu était s. C’était pour établir un rapprochement avec la discussion de la section 1. Il serait plus juste de décrire d(y,φ) comme résultant de présomptions qui surgissent dans le déroulement de la procédure. La multiplicité des équilibres peut donc s’interpréter comme le fait que les règles de preuves ne garantissent pas l’apparition des « bonnes » présomptions dans le cours de la présentation des preuves.

3.3 Présomptions légales et pouvoir d’initiative du juge

Des règles de preuve apparemment raisonnables ne garantissent donc pas un « bon équilibre » lorsque la responsabilité de rendre jugement est déléguée au tribunal, même si celui-ci respecte parfaitement les règles de preuve. Je discuterai ici de deux manières d’éliminer les « mauvais équilibres ».

La première consisterait à réduire le champ de la délégation en introduisant des présomptions légales auxquelles le juge devrait se conformer. Ainsi, la loi (ou la jurisprudence) pourrait dicter la décision d^*(s,φ) pour toutes les réalisations possibles de s, ce qui permettrait de se coordonner sur le « bon équilibre ». J’ai déjà souligné que des présomptions légales étaient couramment utilisées. On comprend bien cependant qu’il est impossible de communiquer un catalogue détaillé de présomptions légales, ce que serait la fonction d^*(s,φ), pour tous les cas de figures susceptibles de se présenter à l’échelon du tribunal. En d’autres termes, sauf pour certaines grandes catégories de situations, cette approche n’est pas réellement satisfaisante puisqu’elle ne peut utiliser efficacement l’information détaillée disponible seulement au niveau des tribunaux.

La seconde approche consiste à modifier la procédure en élargissant le rôle du juge. Jusqu’à maintenant, je me suis limité à une procédure dans laquelle le juge joue essentiellement le rôle d’un arbitre passif. Comme dans la procédure purement accusatoire (adversarial) du common law, ce sont les parties qui mènent le bal, le juge n’intervenant pas dans le cours de la procédure. Une fois que les parties en ont terminé avec la présentation de leur preuve, l’arbitre rend son jugement[36]. La séquence du jeu correspondant à cette procédure est représentée en abrégé à la figure 4.

Figure 4

**La procédure avec juge passif**

Dans la tradition romano-germanique, la procédure du procès civil est également accusatoire pour l’essentiel, puisqu’il incombe aux parties de présenter la preuve de leurs allégations; mais elle a aussi un aspect inquisitoire en ce sens que le juge y a un pouvoir d’initiative plus grand[37]. Le juge a la capacité d’encadrer la présentation de la preuve par les parties. Il peut les inviter à fournir des explications additionnelles ou les interroger sur des éléments de preuve qui n’ont pas été présentés mais qui auraient pu l’être. Demougin et Fluet (2008) modélisent le rôle d’un juge actif dans une procédure modifiée comme celle que décrit la figure 5. Après la présentation du premier dossier, le juge actif a la possibilité d’interroger l’une ou l’autre des parties. En « interrogeant » un plaideur, le juge suggère que la preuve disponible à cette étape des audiences n’est pas suffisante pour un jugement en sa faveur. Autrement dit, compte tenu de la preuve présentée jusque-là, le juge fait part de l’appréciation qu’il fait de cette preuve et annonce ainsi dans quel sens il entend rendre son jugement si aucun élément de preuve additionnel n’est présenté. Ces annonces sont purement rhétoriques (il s’agit de cheap talk dans la terminologie de la théorie des jeux), mais on peut montrer que les annonces d’équilibre d’un juge cherchant à minimiser l’erreur[38] sont crédibles, en ce sens que le juge voudra faire ce qu’il a annoncé s’il croit que ses annonces sont crues et qu’il n’a jamais intérêt à induire en erreur sur ses intentions[39].

On obtient alors que, dans la procédure avec juge actif, seul le « bon équilibre » subsiste. Plus précisément, le jeu comporte un équilibre unique et la décision rendue par le juge au terme de la procédure satisfait (16) et (17). L’intuition de ce résultat est la suivante. Premièrement, l’annonce du juge, lorsqu’il interroge les parties, est indépendante des actions passées des parties, en ce sens qu’elle ne repose pas sur des inférences de sa part qui sont propres à un équilibre. Deuxièmement, le juge peut anticiper les stratégies de réponse des parties. Par exemple, si le juge annonce qu’il donnera raison au plaignant si rien d’autre n’est dit, il anticipe rationnellement que c’est le défendeur qui voudra répliquer. Si ce dernier ne le fait pas, le juge pourra rationnellement en inférer que c’est soit parce que le défendeur n’avait pas accès au second dossier soit parce que la présentation du second dossier aurait conduit à une décision en faveur du plaignant. À l’étape du jugement, il n’y a plus alors de multiplicité de présomptions possibles si la preuve reste limitée au premier dossier. Le pouvoir d’intervention du juge permet ainsi de coordonner les parties sur une présentation efficace de la preuve du point de vue de la minimisation de l’erreur judiciaire.

Ces propriétés se démontrent facilement pour le cas où le second dossier constitue une preuve parfaite. Supposons que le contenu du premier dossier est s. À cette étape, le juge peut annoncer qu’il donnera raison au plaignant si rien d’autre n’est dit ou au contraire qu’il donnera raison au défendeur. Supposons pour l’instant que ces annonces sont crues et que le juge a l’obligation de se conformer à ses annonces. Si le juge dit qu’il donnera raison au plaignant, il sait que seul le défendeur a intérêt à présenter le second dossier. Si ce dossier n’est pas présenté et que le fait est véritablement a, il n’y aura pas d’erreur judiciaire. Si le fait est véritablement a̅, la probabilité d’erreur est p( a̅ | s)(1 – Q_D). Par un raisonnement analogue, si le juge annonce qu’il donnera raison au défendeur, la probabilité d’erreur judiciaire est p(a | s)(1 – Q_P). Comme il cherche à minimiser la probabilité d’erreur, le juge annonce qu’il donnera raison au plaignant si

c’est-à-dire si

ce qui correspond au cas où d^*(s,φ) = 1 parce que le ratio défini en (20) est supérieur à l’unité. Par le même argument que précédemment, si à l’issue de la procédure le second dossier n’est effectivement pas présenté, les croyances du juge seront données par le ratio de probabilités a posteriori

Donc le juge voudra ex post se conformer à son annonce; autrement dit, l’annonce est self-committing. Dans la situation représentée à la figure 3, l’annonce que le défendeur aurait gain de cause en l’absence du second dossier aurait également été self-committing. Cependant, ce n’est pas celle que choisit le juge car elle ne minimise pas le risque d’erreur judiciaire[40].

Conclusion et prolongements

Les modèles présentés ici sont limités à plusieurs égards. J’espère néanmoins avoir montré que l’analyse économique a beaucoup à apporter dans la réflexion sur la preuve et la procédure judiciaires. En guise de conclusion, je me contenterai de discuter brièvement de quelques développements additionnels.

J’ai pris pour acquis que l’objet du litige pouvait se traduire par ce que les statisticiens appellent un test d’hypothèse simple. En particulier, lorsque le litige portait sur une action du défendeur, j’ai supposé que cette action ne pouvait prendre que deux « valeurs ». Cette simplification n’est souvent pas satisfaisante. Dans une poursuite en responsabilité médicale, le patient pourrait chercher à établir que le médecin a été insuffisamment diligent. Le comportement de diligence du médecin est susceptible de degrés, de sorte que la faute signifie une insuffisance de diligence par rapport à une norme de comportement. Dans ce contexte, la maximisation des incitations ex ante n’est plus nécessairement un objectif approprié puisque cela peut induire des niveaux de diligence excessifs, ce qui se rapproche du problème de la « médecine défensive » auquel j’ai fait allusion dans l’introduction. Fluet (2010) montre que, lorsqu’il y a une possibilité de surincitation, la norme de la prépondérance de preuve est généralement trop peu exigeante car elle induit des comportements de précaution excessivement coûteux eu égard à leur efficacité dans la réduction du risque d’accident.

J’ai considéré trois préoccupations possibles pour le mécanisme de la preuve judiciaire : les coûts de la preuve, le risque d’erreur et les incitations ex ante. D’autres considérations sont également pertinentes. Fagart et Fluet (2009) analysent la relation entre la norme de la preuve et l’utilité, à des fins contractuelles, du signal que représente un jugement. L’analyse porte sur les contrats d’assurance responsabilité en aléa moral. Lorsque le comportement de précaution de l’assuré est imparfaitement observable, le contrat d’assurance doit faire un arbitrage entre le partage des risques (entre assureur et assuré) et les incitations à prendre des précautions. Une décision de justice établissant la faute de l’assuré (c’est-à-dire l’insuffisance de précautions) constitue alors une information pertinente pour les indemnités contingentes prévues au contrat d’assurance. Nous montrons que l’utilité de cette information, du point de vue de l’amélioration de l’arbitrage entre partage de risque et incitations, dépend de la norme de preuve appliquée par les tribunaux.

Enfin, je n’ai discuté que très sommairement de la question des coûts de preuve. De plus, les coûts considérés se limitaient à des coûts de présentation d’une preuve déjà constituée. Il y a une certaine littérature sur les coûts de recherche de preuve (par exemple, Froeb et Kobayashi, 1996, 2001). J’ai présumé aussi que les preuves ne pouvaient être manipulées que par omission de certaines informations, ce qui est une hypothèse standard dans la littérature. On ne pouvait « fabriquer » une preuve. Il y a cependant une littérature récente sur les jeux de persuasion avec falsification des messages (Kartik, Ottaviani et Squintani, 2007, et Kartik, 2009), ce qui semble pertinent pour étudier la question de la fabrication de preuves. Emons et Fluet (2009) adoptent cette approche pour comparer différentes procédures du point de vue des coûts de litige, lorsque ceux-ci découlent de dépenses d’exagération ou de fabrication de preuves dans le but d’influencer les croyances du tribunal.

L’économie de la preuve judiciaireThe economics of judicial proof

Résumé

Abstract

Introduction