Abstracts
Résumé
Cet article développe un modèle simple permettant d’analyser les dispositifs fondamentaux de la preuve judiciaire. Le survol est centré sur les notions de charge de la preuve, de présomptions légales, de norme de preuve, sur le rôle de la procédure et le pouvoir d’initiative du juge. Les règles de preuve sont analysées du point de vue des coûts de litige, du risque d’erreur judiciaire et des incitations à l’adoption de comportements socialement efficients.
Abstract
This article develops a simple model using the economist’s tool kit to analyze the mechanism of judicial proof. The survey focuses on the notions of burden of proof, legal presumptions, standard of proof, on legal procedure and on the judge’s role during the proceedings. The rules of proof are analyzed from the point of view of litigation costs, judicial error and incentives for socially efficient behavior.
Article body
Introduction
Posner (1999) faisait remarquer que le droit de la preuve a été relativement peu exploré dans l’analyse économique du droit[1]. Il s’en étonnait vu l’importance des questions de preuve pour l’efficacité du droit, d’autant plus qu’il y a sur ce point des différences notables entre la tradition du common law et celle des droits codifiés d’origine romano-germanique. Dans cet article, je discuterai des systèmes probatoires à partir de la boîte à outils de la théorie économique.
C’est un lieu commun chez les juristes de souligner que la preuve judiciaire n’est pas la preuve scientifique[2]. La preuve judiciaire a pour but de convaincre le tribunal de l’existence ou de l’inexistence d’un fait. Elle désigne les moyens par lesquels le tribunal est amené à statuer sur le bien-fondé d’une allégation ou d’une prétention. « Prouver, c’est faire approuver », écrivait Lévy-Bruhl (1964), sachant que le tribunal doit rendre un jugement dans un sens ou dans l’autre.
Il y a une technique de la preuve. En matières contractuelles, la preuve est souvent préconstituée, par exemple un contrat de prêt ou un acte de vente notarié. Le statut de preuve légale conféré aux actes juridiques vise justement à inciter les parties à faciliter la preuve en cas de litige. La préconstitution d’éléments de preuve peut aussi se faire de manière informelle. Des chercheurs américains expliquent l’excès de diligence du médecin (tests superflus administrés au patient, etc.), ce qu’on appelle « médecine défensive » et qui peut être particulièrement coûteux, comme une précaution contre le risque de poursuite pour faute médicale[3].
La preuve judiciaire s’inscrit dans une procédure. Elle met en jeu divers dispositifs, notamment l’attribution de la charge de la preuve et le degré de preuve requis de celui qui a la charge. La partie avec la charge, normalement le plaignant dans un litige civil, assume le risque de preuve : c’est à elle de convaincre le tribunal, à défaut de quoi celui-ci décidera contre elle. La charge de la preuve peut néanmoins se déplacer au cours de la procédure en fonction du fait allégué. Par exemple, le plaignant a intenté une action pour dette impayée. Il doit donc prouver qu’une dette a été contractée. Si cette preuve est faite, mais que le défendeur allègue qu’il a effectivement remboursé la dette, c’est alors à lui qu’incombe de prouver le remboursement.
Dans des cas particuliers, la loi peut aussi prescrire le renversement de la charge de la preuve. Par exemple, dans les poursuites pour infections nosocomiales, la législation française stipule que c’est à l’établissement de santé (le défendeur) d’apporter la preuve de la « cause étrangère » et non au patient (le plaignant) de prouver qu’il a contracté l’infection dans l’établissement en question[4]. Plus généralement, certains faits n’ont pas à être démontrés car ils bénéficient de présomptions légales; il en va ainsi de la présomption de paternité pour l’enfant né pendant le mariage ou la présomption qu’un testateur était sain d’esprit lors de la rédaction du testament. C’est à celui qui prétend le contraire de réfuter ces présomptions. Pour prendre un exemple très différent, les règles de preuve de la Commission de l’immigration et du statut de réfugié (CISR), un tribunal administratif canadien qui se prononce sur les demandes d’asile, stipulent que « les États sont présumés être capables de protéger leurs ressortissants jusqu’à ce que qu’on prouve le contraire de façon claire et convaincante »[5]. Enfin, dans le cours d’une procédure, des présomptions « spontanées » surgiront, sur la base des indices ou éléments de preuve imparfaits présentés jusque-là. Ce sera alors à la partie défavorisée par ces présomptions de les renverser.
Le degré de preuve correspond à la force probante requise par le tribunal pour donner raison à la partie qui a la charge de la preuve. Ces notions ont connu un développement important en common law. Dans une procédure pénale, la norme est celle de la preuve hors de tout doute raisonnable, une exigence très forte. Dans un litige civil, la norme est la prépondérance de preuve ou balance des probabilités; il suffit alors de montrer que le fait allégué est plus vraisemblable que son contraire[6]. La citation ci-dessus empruntée aux règles de preuve de la CISR renvoie à une norme intermédiaire, soit la preuve claire et convaincante. Celle-ci est plus forte que la simple prépondérance et est utilisée dans certaines circonstances par les tribunaux nord-américains[7].
La notion de norme (ou standard) de preuve n’existe pas à proprement parler dans la tradition romano-germanique. En droit français, on se borne à énoncer que le juge doit décider selon son intime conviction. Les juristes de common law interprètent généralement cette expression comme signifiant une norme de preuve élevée, proche de la « certitude morale » ou du hors de tout doute raisonnable. Cependant, on peut également argumenter que l’intime conviction renvoie tout simplement à l’entière discrétion du juge dans l’appréciation de la preuve (Taruffo, 2003).
J’en viens maintenant à l’apport de l’analyse économique, puisque c’est ce qui nous intéresse ici. On voit facilement que la théorie de la décision, la théorie des jeux, l’économie de l’information ou la théorie des incitations, pour ne nommer que ces développements, fournissent des outils pour discuter de notions comme celles de charge de la preuve, de présomptions et de degrés de preuve. L’observation de Posner (1999) rapportée précédemment doit être nuancée. Il y a une littérature économique sur les questions de preuve et de procédure judiciaire : sur le procès comme tournoi de recherche de rentes (Tullock, 1975; Katz, 1988) ou l’efficacité relative des procédures inquisitoire et accusatoire (Shin, 1998; Dewatripont et Tirole, 1999; Palumbo, 2001; Froeb et Kobayashi, 2001; Parisi, 2002); sur les notions de charge de la preuve ou de norme de preuve (Sobel, 1985; Rubinfeld et Sappington, 1987; Miceli, 1990; Davis, 1994; Bernardo et al., 2000). En particulier, un procès peut être modélisé comme un « jeu de persuasion » où deux parties informées cherchent à convaincre une partie non informée (Shin, 1994; Milgrom et Roberts, 1986; Lipman et Seppi, 1995; Seidman et Winter, 1997). Ce tour d’horizon est bien sûr partiel. Pour néanmoins donner raison à Posner, il est vrai que cette littérature a peu discuté du détail de la pratique juridique[8].
Je m’en voudrais de ne pas citer aussi quelques travaux analytiques bien antérieurs. Dans son célèbre essai sur l’erreur judiciaire, Condorcet (1785) applique le calcul des probabilités pour déterminer le risque d’un jugement erroné en fonction du risque d’erreur de chaque juré, de la taille du jury et de la pluralité requise pour une condamnation. Pour une affaire criminelle où la sanction est la peine de mort, il en vient à recommander un jury de 30 personnes et une majorité de 23 contre 7, en supposant un risque d’erreur de 1/10 de la part de chaque juré. Il obtient ce résultat en posant comme valeur critique du risque d’une condamnation à tort le risque de mortalité d’un homme de 37 à 47 ans, obtenu à partir des tables de mortalité. Ces questions seront reprises par deux grands mathématiciens : d’abord par Laplace (1814) dans le contexte d’un code criminel adopté en 1808 autorisant une condamnation par 7 voix contre 5 et un peu plus tard par Poisson (1837). Ce dernier se demande notamment si l’introduction en 1830 du principe des circonstances atténuantes, lequel permet au juge de réduire la peine en cas de condamnation, ne facilitera pas une décision de culpabilité chez les jurés[9]. Cette interrogation fait écho aux analyses beaucoup plus récentes que l’on retrouve chez Andreoni (1991, 1995).
Dans ce qui suit, je développerai progressivement un modèle simple montrant la pertinence de l’analyse économique. Je le ferai essentiellement à partir de l’angle d’attaque utilisé dans certains de mes travaux sur la preuve dans les litiges civils. Ceux dont je m’inspire ici ont abordé les questions suivantes : les effets incitatifs de la norme de preuve relativement aux comportements ex ante; l’arbitrage entre incitations ex ante et erreur judiciaire; la norme de la balance des probabilités et les règles d’irrecevabilité de certaines informations en common law; les présomptions légales et le rôle que joue le degré d’initiative du juge dans l’obtention des « bonnes » présomptions au cours de la procédure.
1. La charge de la preuve
Dans cette partie, j’examine le rôle que joue l’attribution de la charge de la preuve du point de vue des coûts de preuve, du risque d’erreur judiciaire et de la fonction incitative du système juridique relativement à l’adoption de comportements socialement efficients.
Considérons un litige civil. Le plaignant ou demandeur est dénoté par P, le défendeur par D. Le litige porte sur l’existence ou la survenance d’un fait que je dénoterai par a; l’inexistence du fait est dénoté par a̅, ce qui se lit « non a » . La loi prévoit que, si le fait est avéré, un transfert de richesse doit s’effectuer du défendeur vers le plaignant. Par exemple, le plaignant prétend que le défendeur lui doit 10 000 $ en honoraires non versés; ou encore le litige porte sur la reconnaissance d’un droit de propriété au profit du plaignant et au détriment du défendeur ou à un préjudice subi par le plaignant du fait du comportement négligent du défendeur, auquel cas des dommages-intérêts doivent être versés à titre de réparation. Par définition, c’est le plaignant qui intente la procédure judiciaire. Dans ce cas, le plaignant allègue le fait a; évidemment, le défendeur voudrait que le jugement du tribunal soit a̅. Les litiges réels portent souvent sur plusieurs éléments. Par exemple, le plaignant a à démontrer la faute du défendeur et la gravité du dommage qu’il a subi. Pour faire simple, je me limiterai au cas de deux propositions contradictoires.
Je suppose une situation suffisamment complexe pour que l’analyse de l’attribution de la charge de la preuve permette de dégager des enseignements utiles. Comme c’est le plaignant qui prend l’initiative du recours en justice, il a l’obligation de démontrer qu’il a un motif valable. En ce sens, le plaignant a toujours la charge initiale de faire la preuve de quelque chose, sinon des poursuites pourraient être intentées à des fins de pure nuisance. Dans les cas les plus simples, comme une poursuite pour dette impayée, l’attribution de la charge de la preuve est celle de la charge initiale incombant au plaignant.
À titre d’illustration d’une situation complexe, considérons le cas d’une intervention chirurgicale. Si l’intervention est un succès, le patient ne peut démontrer aucun motif valable de poursuite à l’encontre du chirurgien ou de son équipe. Si par contre l’intervention s’est visiblement mal déroulée, l’action en justice pourrait être recevable. Je prends pour acquis que le patient n’a un droit à réparation pour les dommages subis que si les complications résultent d’une faute professionnelle ou technique (maladresse du chirurgien, faute d’inattention, négligence de l’anesthésiste, etc.). En effet, une intervention chirurgicale peut mal tourner pour toutes sortes de raisons, dont l’état général du patient avant l’intervention et l’aléa normal propre à ce genre d’intervention. La responsabilité médicale porte généralement sur une obligation de moyens et non de résultats. Dans une situation de ce genre, l’objet du litige est donc la commission ou non d’une faute. Je dirai que le plaignant a la charge de preuve lorsque c’est au patient de démontrer cette faute. Inversement, je dirai que le défendeur a la charge de la preuve lorsque c’est au chirurgien de démontrer qu’aucune faute n’a été commise. Ce cas correspond à une présomption de faute, ce qui s’observe souvent quand les conséquences dommageables d’une intervention sont sans commune mesure avec le caractère courant et normalement bénin de l’intervention. Dans les deux cas, néanmoins, le patient aura préalablement démontré qu’il a subi des dommages du fait d’une intervention chirurgicale qui a mal tourné.
1.1 Le coût de la preuve
La figure 1 représente un arbre d’événements décrivant les informations qui seront en possession du plaignant à différentes étapes. On dit qu’une information est vérifiable lorsqu’elle peut être communiquée au tribunal. En termes juridiques, il s’agit alors d’un élément de preuve[10].
L’étape initiale est celle de la survenance ou non du fait pouvant donner lieu à une poursuite. Dans l’exemple de l’intervention chirurgicale, le fait a serait la commission d’une faute professionnelle. La décision d’intenter une poursuite se prend à l’étape 1. À cette étape, l’information dont dispose le plaignant est soit y0 soit y1. Le premier cas signifie que l’intervention chirurgicale est un succès, auquel cas le patient ne peut présenter aucun motif valable de poursuite. Le second cas signifie qu’il y a eu des complications ayant causé un dommage. Cette information est supposée vérifiable. Dans mon exemple, si une faute est commise, l’intervention chirurgicale se traduit à coup sûr par des complications et le patient dispose alors toujours d’un motif valable de poursuite. Dans la figure, cela s’exprime par le fait qu’il peut présenter l’information y1. Cependant, il est possible que des complications surviennent même lorsqu’il n’y a pas de faute professionnelle. Dans l’exemple, cela se produit avec une probabilité q. À l’étape 1, lorsque des complications sont survenues, le patient ne sait pas s’il y a eu faute ou non, d’où les pointillés entourant les noeuds correspondants de l’arbre des événements.
À l’étape 2, si une poursuite a été intentée, la preuve des faits pertinents devient disponible aux plaideurs. Je suppose qu’il s’agit d’une preuve parfaite démontrant hors de tout doute s’il y a eu faute ou non. Ces preuves sont dénotées par xa et xa̅ respectivement. Ainsi, lorsqu’une faute a été commise, le plaignant et le défendeur ont entre les mains l’information vérifiable xa et peuvent la présenter au tribunal. De même, si aucune faute n’a été commise, ils ont entre les mains l’information vérifiable xa̅ et peuvent la présenter. Le fait qu’à l’étape 2 chaque partie a entre les mains une preuve parfaite est connaissance commune; autrement dit, chaque plaideur sait que l’autre peut démontrer la vérité (et seulement la vérité). Enfin, il y a des coûts à présenter une preuve au tribunal, frais d’avocats, d’expertise et autres. Le coût pour le demandeur est CP, le coût pour le défendeur est CD, les indices P et D désignant le plaignant et le défendeur respectivement. Comme les plaideurs ne sont pas dans une situation symétrique, il n’y a aucune raison que ces coûts soient les mêmes pour le plaignant et le défendeur. Par exemple, le défendeur pourrait être en mesure de produire à moindres coûts les expertises appropriées.
Dans la procédure que je viens de décrire, c’est la partie avec la charge de la preuve qui supportera le coût de la preuve, du moins lorsque les éléments de preuve dont elle dispose sont en sa faveur. En effet, le « jeu de la preuve » a un équilibre très simple. Si le demandeur a la charge de la preuve, il perd le procès s’il ne démontre pas qu’une faute a été commise. L’équilibre est donc alors comme suit :
Le plaignant présente la preuve à la seconde étape, mais seulement si la preuve qu’il a entre les mains est xa. En effet, il n’a aucun intérêt à supporter un coût pour présenter xa̅. Autrement dit, le plaignant se désistera à l’étape 2 si la preuve qu’il obtient est xa̅.
Le défendeur reste passif. Si la preuve qu’il a entre les mains est xa, il n’a pas intérêt à supporter un coût pour la présenter; il sait que le plaignant le fera à coup sûr et n’a rien à lui opposer. Si la preuve entre ses mains est xa̅, le défendeur n’a pas non plus intérêt à supporter un coût pour la présenter puisqu’il sait que le plaignant se désistera. Comme le plaignant a la charge de la preuve, c’est alors le défendeur qui l’emporte par défaut.
Inversement, si le défendeur a la charge de la preuve, il perd le procès s’il ne démontre pas qu’aucune faute n’a été commise. L’équilibre est donc alors :
Le défendeur présente la preuve à la seconde étape si la preuve qu’il a entre les mains est xa̅.
Le plaignant reste passif à la seconde étape puisque c’est lui qui gagne par défaut.
Pour obtenir ces équilibres, il faut évidemment que le coût de présentation de la preuve soit inférieur à l’enjeu monétaire du litige, ce que je suppose ici.
La question est de savoir qui, du plaignant ou du défendeur, devrait avoir la charge de la preuve lorsque le plaignant dispose d’un motif valable de poursuite. Plus formellement, la question est la suivante : étant donné l’information représentée par y1, laquelle des deux parties devrait supporter le coût de démontrer les faits à l’étape 2? Lorsque c’est le plaignant qui a la charge de la preuve, on a vu que le défendeur reste passif et donc ne supporte aucun coût de preuve. En revanche, le plaignant présentera la preuve si elle lui est favorable; sinon, le plaignant se désistera. Lorsque le plaignant a la charge de la preuve, l’espérance mathématique des coûts de preuve est donc p(a | y1)CP, où p(a | y1) est la probabilité a posteriori de a sachant y1. De façon symétrique, lorsque c’est le défendeur qui a la charge de la preuve, il ne présente la preuve que si elle l’exonère. L’espérance mathématique des coûts de preuve est donc alors (1 – p(a | y1))CD. Par conséquent, l’attribution de la charge de la preuve au plaignant minimise en moyenne les coûts de preuve lorsque
Quand l’inégalité est inversée, les coûts sont minimisés en attribuant la charge au défendeur.
La probabilité a posteriori que l’on vient d’introduire dépend de deux facteurs : premièrement l’information que véhicule y1, c’est-à-dire dans mon exemple la survenance de complications lors d’une intervention chirurgicale; deuxièmement la probabilité a priori du fait a, c’est-à-dire la fréquence des fautes techniques ou autres dans de telles interventions, ce que je dénote par p0. Lorsqu’une poursuite a été intentée, en appliquant le théorème de Bayes, on obtient la probabilité a posteriori
On voit ici que le « début de preuve » représenté par y1 est d’autant plus informatif des faits pertinents que la probabilité q est petite. Lorsque cette probabilité est proche de zéro, des complications ne surviennent à peu près jamais s’il n’y a pas eu de faute professionnelle. L’observation que des complications sont survenues est alors un indice très fort qu’une faute a dû être commise[11].
En utilisant (2), la condition (1) se réécrit
Cette condition indique les facteurs à prendre en compte pour une attribution de la charge de la preuve (ou l’utilisation de présomptions légales) visant à minimiser les coûts de preuve. Le plaignant devrait avoir la charge (i) si le fait allégué par le plaignant est a priori peu fréquent ou peu probable, c’est-à-dire si p0 est petit; (ii) si les indices fournis par le début de preuve déposé par le plaignant ne sont par eux-mêmes pas trop probants, c’est-à-dire si q n’est pas trop petit; et (iii) si les coûts de présentation de la preuve pour le plaignant ne sont pas trop élevés comparativement à ceux que devrait supporter le défendeur.
Le point (iii) peut s’interpréter de différentes façons. Dans ce qui précède, j’ai défini CP comme le coût pour le plaignant de présenter une preuve quelle qu’elle soit, c’est-à-dire aussi bien xa que xa̅ ; j’ai défini CD de la même façon pour le cas du défendeur. La différence entre CP et CD était alors attribuable à l’asymétrie des situations dans lesquelles se trouvent le plaignant et le défendeur. Compte tenu de l’équilibre du jeu de la preuve, on pourrait cependant considérer que les plaideurs sont dans une situation symétrique eu égard aux coûts de preuve, mais en interprétant maintenant CP comme le coût de présenter xa et CD comme le coût de présenter xa̅. Par exemple, il pourrait être intrinsèquement moins compliqué et donc moins coûteux de démontrer l’existence d’un fait que son inexistence[12].
Dans ce modèle simple, le tribunal rend toujours le bon jugement quelle que soit l’attribution de la charge de la preuve et bien que la preuve des faits ne lui soit pas toujours présentée. Lorsque le plaignant a la charge de la preuve et qu’aucune preuve n’est présentée, c’est que le fait véritable doit être a̅. Comme la procédure prescrit que le plaignant doit être débouté s’il ne présente pas la preuve, la décision du tribunal est donc alors la bonne. On pourrait aussi dire que le tribunal est alors en mesure d’en déduire qu’aucune faute n’a été commise, un résultat classique dans les jeux de persuasion (voir par exemple Milgrom et Roberts, 1986). Le même raisonnement vaut pour le cas où le défendeur a la charge de la preuve.
L’argument développé ci-dessus s’inspire de Hay and Spier (1997). On peut noter que j’ai fait abstraction de la possibilité d’un arrangement amiable. Lorsqu’une poursuite est intentée, les parties se rendent nécessairement jusqu’au procès. Je maintiendrai cette hypothèse dans tout ce qui va suivre. En pratique, la majeure partie des poursuites se résolvent par un accord amiable, de façon justement à éviter les frais d’un procès. On peut donc interpréter ce qui précède comme ce qui se passerait si on ne réglait pas à l’amiable[13].
1.2 L’accès à la preuve
Dans ce qui précède, le tribunal rend toujours le bon jugement. J’examine maintenant une situation où l’erreur judiciaire est possible[14].
Supposons que, à la seconde étape, les plaideurs ne sont pas toujours en mesure de démontrer les faits. Par exemple, il leur est impossible de retracer un document ou un témoin important. Dans le cas de l’intervention chirurgicale, même si une faute a été commise, le patient pourrait ne pas être capable d’en faire la preuve. Pour l’instant, je suppose que c’est tout ou rien : soit une preuve parfaite est possible comme précédemment, soit le plaideur ne dispose d’aucun élément à présenter au tribunal. Le risque d’absence de preuve n’est pas nécessairement le même pour les deux plaideurs. Pour le plaignant, la preuve est accessible avec une probabilité QP ; pour le défendeur, elle est accessible avec une probabilité QD.
La possibilité qu’on ne puisse fournir la preuve des faits se traduit par le risque de décisions erronées de la part du tribunal. Il y a deux types d’erreur possible. J’appelle erreur de première espèce (type I) le fait de donner raison au plaignant alors que c’est le défendeur qui devrait en fait l’emporter; l’erreur de seconde espèce (type II) survient quand le plaignant est débouté alors qu’en fait il devrait avoir gain de cause. Je considère les propriétés de la procédure du point de vue de la minimisation du risque d’erreur judiciaire, en faisant abstraction des préoccupations reliées aux coûts de la preuve. Dans un litige civil, il est légitime d’accorder une importance égale aux deux types d’erreur, dans la mesure où l’enjeu n’est au final qu’un transfert monétaire entre les parties. Ce que l’un gagne, l’autre le perd. Il en irait autrement dans une procédure criminelle où la sanction associée à un jugement de culpabilité a un coût social, par exemple une peine de prison. On voudrait alors pondérer plus fortement le risque de condamner par erreur[15].
Dénotons par d la décision du tribunal avec d = 1 quand le jugement est en faveur du plaignant et d = 0 quand il est en faveur du défendeur, en incluant dans ce dernier cas la décision par défaut si aucune poursuite n’est intentée. Au total, p étant la probabilité a priori du fait a, la probabilité d’erreur judiciaire est
Dans cette expression, Pr(d = 1 | a̅) désigne la probabilité d’une erreur de première espèce, c’est-à-dire la probabilité de donner gain de cause au plaignant quand a̅ est vrai. De même, Pr(d = 0 | a) est la probabilité d’une erreur de seconde espèce, c’est-à-dire la probabilité de débouter le plaignant quand a est vrai.
Ces probabilités conditionnelles dépendent de l’équilibre du jeu et en particulier de l’attribution de la charge de la preuve[16]. Les équilibres sont de même nature que précédemment, sauf que le plaideur avec la charge ne présente la preuve en sa faveur que lorsqu’il y a accès. On a donc deux possibilités :
Quand le plaignant a la charge de la preuve et qu’une faute a été commise, il y a une probabilité 1 – QP qu’il ne puisse prouver le fait. Par conséquent, la probabilité d’une erreur de seconde espèce est Pr(d = 0 | a) = 1 – QP. Par ailleurs, si aucune faute n’a été commise, le plaignant ne peut jamais présenter de preuve en sa faveur, de sorte que la probabilité d’une erreur de première espèce est nulle, c’est-à-dire Pr(d = 1 | a̅) = 0. En substituant dans (4), il s’ensuit que la probabilité d’erreur judiciaire est égale à p0(1 – QP).
Un raisonnement semblable s’applique lorsque le défendeur a la charge de la preuve. Dans ce cas Pr(d = 0 | a) = 0, c’est-à-dire que la probabilité d’une erreur de seconde espèce est toujours nulle. L’erreur de première espèce survient si une poursuite est intentée, ce qui a une probabilité q quand aucune faute n’a été commise, et si le défendeur n’est pas en mesure de fournir de preuve à sa décharge, ce qui se produit avec une probabilité 1 – QD. Par conséquent, l’erreur de première espèce est Pr(d = 1 | a̅) = q(1 – QD). En substituant dans (4), la probabilité d’erreur judiciaire est alors égale à (1 – p0)q(1 – QD).
Une procédure visant la minimisation du risque d’erreur devrait attribuer la charge de la preuve au plaignant si
c’est-à-dire
Comme précédemment, le plaignant devrait avoir la charge de la preuve (i) si le fait qu’il allègue est a priori peu probable et (ii) si le motif valable de poursuite est peu informatif de l’existence du fait qui lui donnerait gain de cause; mais (iii) il faut maintenant que le plaignant ne soit pas trop désavantagé, comparativement au défendeur, relativement à la probabilité d’accès aux moyens de preuve. Par exemple, si le défendeur y a toujours accès (QD = 1) mais que ce n’est pas le cas pour le plaignant (QP < 1), c’est le défendeur qui devrait avoir la charge de la preuve.
Ces résultats appellent quelques commentaires. Premièrement, je n’ai considéré que la minimisation du risque d’erreur judiciaire. Cela pourrait se justifier par le fait que les coûts de présentation de la preuve sont négligeables ou du moins qu’ils le sont par rapport à l’importance qu’on accorde au risque d’erreur. Plus généralement, on pourrait considérer l’arbitrage entre risque d’erreur et coût de la preuve lorsque ces objectifs ne prescrivent pas la même attribution de la charge.
Deuxièmement, contrairement au cas précédent, il subsiste une incertitude lorsqu’aucune preuve n’a été présentée à l’issue de la procédure. Lorsque la preuve était toujours disponible, la non-présentation de preuve par la partie qui a la charge permettait d’inférer que les faits jouaient contre elle. Dans le cas présent, en revanche, on ne peut savoir si c’est parce que la partie avec la charge n’avait pas accès à la preuve ou si c’est parce que, bien qu’elle y ait eu accès, la preuve ne jouait pas en sa faveur. L’attribution optimale de la charge de la preuve prend en compte ces deux possibilités : elle dépend des capacités des parties à constituer la preuve et de leur intérêt stratégique à ne pas révéler une preuve défavorable. Elle tient compte aussi du fait qu’une partie qui n’a pas la charge ne présentera pas de preuve (même si celle-ci lui est favorable) parce que cela lui impose un coût inutile.
Troisièmement, et pour faire suite à la dernière remarque, je me suis borné à discuter des facteurs déterminant l’attribution optimale de la charge de la preuve. Ainsi, on pourrait considérer que la règle par défaut devrait être d’imposer la charge au plaignant, sauf certaines catégories de situations où la loi prescrirait le contraire sur la base des conditions générales que l’on vient d’analyser. Dans le même esprit, ces conditions permettent de rationaliser les présomptions légales pour la preuve de certains faits. Par contre, la question de savoir si un tribunal attribuera « spontanément » la charge de la preuve de manière optimale est d’une autre nature. Ce point est abordé dans un cadre plus riche par Demougin et Fluet (2008) et j’en discuterai ultérieurement[17].
1.3 Les incitations ex ante
Des faits de toutes sortes peuvent constituer l’objet d’un litige. Une distinction intéressante est celle que l’on peut faire entre des faits involontaires, par exemple la santé mentale du testateur dans le cas de la contestation d’un testament, et des faits volontaires ou qui du moins dépendent, peut-être de façon aléatoire, d’agissements délibérés.
Je considère maintenant le cas où le fait pertinent est une action choisie ex ante par le défendeur. Cette action cause au plaignant un préjudice ouvrant un droit à réparation[18], mais elle procure au défendeur un avantage, par exemple une économie de coûts, de temps ou d’effort. Dans une relation contractuelle, l’action en question pourrait signifier que le défendeur ne s’acquitte pas correctement de ses obligations : il ne livre pas la qualité de travaux convenue ou livre le bien avec des retards indus. En responsabilité civile à l’égard des tiers, ce pourrait être que le défendeur a eu un comportement imprudent qui a occasionné des dommages accidentels au plaignant. Dans l’intervention chirurgicale, a pourrait signifier que le chirurgien ou l’anesthésiste n’ont pas pris les précautions appropriées; par exemple, ils n’ont pas pris suffisamment connaissance du dossier du patient avant l’intervention, de sorte que certaines décisions médicales étaient contre-indiquées. Inversement, l’action a̅ signifie que le défendeur a eu le comportement socialement désirable.
L’une des raisons d’être des recours en justice est de réguler les comportements. Lorsque la preuve est toujours disponible, comme dans le premier cas de figure examiné ci-dessus, la dissuasion des comportements indésirables découle de la certitude d’être poursuivi et condamné aux dommages-intérêts si l’on fait a, le risque étant nul si on fait a̅. S’il y a possibilité d’erreur judiciaire comme dans le second cas de figure, la dissuasion dépend de la différence entre les risques d’être condamné aux dommages-intérêts selon le comportement que l’on adopte. S’il n’y avait aucune différence, le défendeur n’aurait aucune incitation à prendre les précautions appropriées puisque celles-ci lui imposent un coût.
La dissuasion dépend aussi des dommages-intérêts auxquels on s’expose. Le montant dépend de l’évaluation du préjudice subi par les plaignants dans les situations considérées. Dans mon analyse, ce montant est prévisible, de sorte que les effets incitatifs des recours en justice dépendront uniquement du risque de jugement défavorable. Cela étant, j’appellerai dissuasion l’augmentation de la probabilité d’une condamnation à des dommages-intérêts si on fait a plutôt que a̅, c’est-à-dire
Les probabilités conditionnelles ont la même signification que précédemment. On pourrait considérer que le coût (en temps, en effort, etc.) de faire l’action socialement désirable est variable sur l’ensemble des situations où une décision doit être prise. Par exemple, ce coût pourrait dépendre des circonstances dans lesquelles se trouvait le défendeur ou des caractéristiques des défendeurs. Par conséquent, plus la dissuasion telle que définie en (6) est grande, plus il y aura de situations où on choisira l’action désirable.
L’expression (6) peut se réécrire sous la forme
L’expression entre crochets est la somme des probabilités d’erreurs de première et seconde espèce. L’efficacité incitative des recours en justice est donc d’autant plus grande que ces probabilités sont petites (cf. Polinsky et Shavell, 1989). Si le risque d’erreur était nul, la dissuasion serait égale à l’unité, ce qui correspond à la certitude d’un jugement défavorable si on commet l’action socialement indésirable et à l’impossibilité d’un tel jugement sinon.
En reprenant les résultats du modèle d’accès incertain à la preuve, on a Pr(d = 0 | a) = 1 – QP lorsque le plaignant a la charge de la preuve, l’erreur de première espèce étant nulle dans ce cas. Le niveau de dissuasion est donc alors égal à QP, la probabilité que le demandeur ait accès à la preuve et que par conséquent le défendeur soit condamné aux dommages-intérêts s’il a commis l’action indésirable. Dans le cas opposé où le défendeur a la charge de la preuve, Pr (d = 1 | a̅) = q(1 – QD) et l’erreur de seconde espèce est nulle. Le niveau de dissuasion est alors égal à 1 – q(1 – QD).
Lorsque l’objectif du système judiciaire est la maximisation des incitations, le plaignant devrait avoir la charge de la preuve si
c’est-à-dire
Ces conditions ont d’autant plus de chance d’être satisfaites que (i) le motif valable de poursuite est peu informatif du fait donnant droit à réparation et (ii) que le plaignant n’est pas trop désavantagé, comparativement au défendeur, dans l’accès à la preuve. La probabilité a priori de l’action indésirable, par exemple sa fréquence dans ce genre d’interventions, ne joue plus aucun rôle. En fait, cette fréquence est maintenant endogène puisqu’elle dépend des incitations fournies par le système judiciaire.
Pour les faits volontaires, il y donc un conflit entre la minimisation des erreurs judiciaires ex post et la maximisation des incitations ex ante. Ce conflit a été noté par divers auteurs, notamment Schrag et Scotchmer (1994). Il jouera un rôle important dans la discussion de la norme de preuve à la prochaine section. Pour l’instant, il suffit de comparer les conditions (7) et (5). Lorsque l’objectif est la maximisation des incitations, tout se passe comme si on utilisait la condition (5) pour la minimisation du risque d’erreur judiciaire mais en remplaçant la probabilité a priori p̂0, c’est-à-dire la fréquence de l’action a dans des cas semblables, par le pseudo-a priori p̂0 = 1/2. Autrement dit, c’est comme si le tribunal partait du principe qu’il devait considérer comme équiprobables les allégations du plaignant et du défendeur.
À titre d’illustration, supposons que des études ont préalablement montré que la fréquence d’actions négligentes n’est pas la même chez les femmes chirurgiens que chez les hommes chirurgiens. Dénotons ces fréquences par pF0 et pH0 respectivement. En appliquant la condition (5), si pF0 est plus petit que pH0, il serait possible d’avoir simultanément
Lorsque l’objectif est la minimisation du risque d’erreur judiciaire, il faudrait alors attribuer la charge de la preuve au plaignant si le chirurgien est une femme et au défendeur s’il s’agit d’un homme, ce qu’on peut interpréter comme une forme de discrimination statistique. Par contre, lorsque l’objectif est d’influencer les comportements, le sexe du chirurgien ne constituerait pas un élément d’information pertinent pour l’attribution de la charge de la preuve. On devrait faire abstraction de cette information et attribuer la charge de la preuve en fonction de la condition (7). Les fréquences endogènes des comportements négligents seront alors inférieures à ce que l’on aurait obtenu avec une procédure visant la minimisation du risque d’erreur. Indépendamment de toute considération d’équité, le refus de la discrimination statistique peut donc s’expliquer par le souci de ne pas affaiblir les effets incitatifs des recours en justice[19].
Le modèle simple développé dans cette section fournit une explication plausible de l’évolution récente de certaines jurisprudences, notamment en matière de responsabilité médicale face à l’évolution des techniques thérapeutiques (voir Fluet, 2006). Considérons à nouveau la condition (7). On voit que cette condition ne sera pas satisfaite si la preuve parfaite est le plus souvent inaccessible (c’est-à-dire si QP et QD sont petits). Le défendeur devrait alors avoir la charge de la preuve, ce qu’on peut assimiler à une présomption de faute. L’évolution récente du droit de la responsabilité médicale montre un recours de plus en plus fréquent à ce genre de présomptions, voire un glissement vers des formes d’obligations de résultats par opposition à l’obligation traditionnelle de moyens[20]. On attribue souvent cette évolution au souci qu’auraient eu les juridictions de faciliter l’indemnisation financière des dommages. À y regarder de plus près, cependant, on constate que cette évolution ne s’est surtout manifestée que pour certaines catégories d’aléas thérapeutiques. Ceux-ci se caractérisent soit par le fait que la simple survenance de l’aléa est par elle-même un indice particulièrement probant de l’existence d’une faute, soit par le fait que les éléments de preuve additionnels sont difficiles à obtenir. Autrement dit, on peut faire l’argument que l’évolution de la jurisprudence s’explique par des considérations incitatives.
2. La norme de preuve
Je relâche maintenant l’hypothèse que les preuves sont toujours sans ambiguïté. Lorsqu’une preuve laisse subsister un doute, il y aura un risque d’erreur judiciaire quel que soit le jugement rendu, mais pour une raison différente de ce qu’on a vu précédemment. Pour bien marquer la différence, je suppose dans cette section que les deux parties ont toujours accès aux mêmes éléments de preuve. Cependant, les preuves peuvent dorénavant être imparfaites.
Cette possibilité peut être représentée de la façon suivante. Dénotons par x la totalité de la preuve que les plaideurs sont en mesure de présenter à l’étape 2. Par définition, x est la combinaison de plusieurs informations vérifiables : des témoignages oraux et des documents comme le dossier médical du patient, le rapport établi par l’équipe médicale à l’issue de l’intervention, des rapports d’expertise, etc. Je suppose que, conditionnellement aux faits pertinents, la preuve qui se matérialisera à l’étape 2 n’est pas parfaitement prévisible. Par exemple, elle pourrait être x' ou x'' où l’une diffère de l’autre seulement sur un point, à savoir que l’une contient en outre le témoignage d’un infirmier rapportant avoir cru remarquer un problème lors de l’anesthésie. Plus généralement, les preuves peuvent différer par le contenu de plusieurs témoignages, par le libellé du rapport de l’équipe médicale, par l’identité des experts sollicités, etc.
Je dirai qu’une preuve x est imparfaite si elle peut être obtenue quels qu’aient été les faits, en ce sens que les probabilités conditionnelles satisfont simultanément p(x | a) > 0 et p(x | a̅) > 0. Autrement dit, l’observation de cette preuve est compatible aussi bien avec le fait donnant raison au plaignant qu’avec le fait contraire; une telle preuve contient néanmoins de l’information utile dans la mesure où les probabilités conditionnelles sont différentes. Je dénoterai par X l’ensemble des réalisations possibles de la preuve à l’étape 2. Une preuve est donc un élément de X. Par exemple, x' et x'' sont des éléments de cet ensemble, parmi d’autres[21].
La figure 2 décrit la nouvelle situation. Les étapes 0 et 1 sont les mêmes que précédemment. Pour que la figure reste lisible, je ne représente explicitement que x' et x'' comme preuves susceptibles d’être présentées à l’étape 2, même si d’autres réalisations sont possibles. Notons que je n’exclus pas la possibilité que certaines réalisations soient des preuves parfaites. Par hypothèse, cependant, de telles preuves ne sont pas obtenues à coup sûr, sinon la situation serait essentiellement la même que dans la section précédente[22].
La possibilité de preuves imparfaites soulève la question du degré de preuve requis pour un jugement. La relation entre preuve et jugements est représentée par la fonction de décision d(x), où d(x) = 0 signifie qu’on donne raison au défendeur lorsque la preuve est x et d(x) = 1 qu’on donne raison au plaignant. Il s’agit donc de déterminer ce que devrait être cette fonction.
2.1 Le risque d’erreur judiciaire
La probabilité de jugements erronés est définie comme en (4). Pour une fonction de décision donnée, la probabilité de l’erreur de première espèce est
celle de seconde espèce est
La probabilité d’erreur judiciaire est donc
On cherche les propriétés de la fonction de décision d(x) qui minimise cette expression. Il est utile de réécrire (10) en fonction des probabilités a posteriori des faits pertinents, étant donné la preuve disponible. La probabilité a priori d’obtenir la preuve x est
En appliquant le théorème de Bayes, les probabilités a posteriori sont donc
En substituant dans (10), la probabilité d’erreur judiciaire peut se réécrire sous la forme
Le risque d’erreur est minimisé si la fonction de décision maximise le second terme de cette expression. La fonction optimale satisfait par conséquent
Le plaignant devrait avoir gain de cause si le fait qu’il allègue est a posteriori plus probable que son contraire. Lorsqu’il ya équiprobabilité, il est indifférent de donner raison au plaignant ou au défendeur. Ce résultat rappelle évidemment la norme de la balance des probabilités ou prépondérance de preuve en common law.
C’est cette interprétation qui s’est imposée chez les juristes de common law à partir des années soixante-dix, dans la foulée du renouveau bayésien des années cinquante et du développement de la théorie de la décision[23]. Pour Brook (1982) et plusieurs commentateurs par la suite, la justification première de la norme de la prépondérance de preuve est cette propriété de minimisation du risque d’erreur. Elle équivaut à la minimisation des coûts sociaux moyens d’erreur si on considère comme également indésirables les erreurs de première et seconde espèce dans les litiges civils. Clermont et Sherwin (2002) en concluent que le standard plus exigeant des régimes romano-germaniques se traduit par une plus grande fréquence d’erreur, ce qui les amène à s’interroger sur l’objectif que ces régimes poursuivraient.
Au début de cette section, j’ai réintroduit l’hypothèse d’égalité d’accès des parties aux éléments de preuve potentiels, afin de me concentrer sur la question de la norme de preuve. On vérifie facilement que, sous la règle de décision d*(x), l’attribution de la charge de la preuve n’a aucune conséquence sur le jugement que rendra le tribunal. Si le plaignant a la charge de la preuve, il présente la preuve disponible x si celle-ci satisfait d*(x) = 1, sinon il ne présente rien et donc perd sa cause. Inversement, si le défendeur a la charge de la preuve, il présente la preuve disponible si elle satisfait d*(x) = 0, sinon il reste passif et le plaignant l’emporte. Autrement dit, la décision est essentiellement la même que si le tribunal observait directement les éléments de preuve[24].
2.2 Les incitations ex ante
Lorsque l’objet du litige est une action délibérée du défendeur et que l’objectif est d’influencer les comportements, la fonction de décision d(x) devrait maximiser la dissuasion telle que définie en (6). En substituant dans cette expression à partir de (8) et (9), la dissuasion est égale à
Cette expression est maximisée par la fonction
Encore une fois, les probabilités a priori des faits pertinents ne jouent aucun rôle lorsque l’objectif est la maximisation des incitations. Dans la terminologie statistique, p(x | a) et p(x | a̅) sont les vraisemblances de a et a̅ respectivement, lorsqu’on observe x. Avec la règle de décision (13), le défendeur est donc pénalisé en fonction des vraisemblances relatives plutôt que des probabilités a posteriori. En fait, les incitations ex ante sont maximisées lorsque le critère de décision ex post est celui du maximum de vraisemblance, comme dans la statistique classique des problèmes d’estimation[25].
Il est intéressant de comparer les fonctions de décision (12) et (13) pour le cas d’une relation contractuelle, lorsque l’exécution de l’obligation prévue au contrat est imparfaitement vérifiable ex post, d’où la possibilité que le débiteur tente d’échapper à son obligation (voir Fluet, 2003). La valeur du contrat pour les parties – le surplus de coopération – dépend de la qualité des informations qui seront disponibles ex post et de la règle de décision qu’applique le tribunal chargé d’arbitrer les litiges. On peut donc comparer les équilibres selon que le critère vise la minimisation des erreurs ou la maximisation des incitations du débiteur à respecter la lettre du contrat. C’est évidemment la fonction de décision (13) qui maximise le surplus espéré des parties et par conséquent la valeur ex ante du contrat. En d’autres termes, les parties préfèrent un tribunal qui ne cherche pas nécessairement à « dire le vrai » ex post[26]. L’inefficacité relative du critère de minimisation des erreurs dépend cependant de la qualité de l’information disponible ex post. La perte de surplus anticipé découlant de (12), comparativement à (13), est d’autant plus importante que les preuves sont en moyenne peu informatives.
2.3 La notion de balance des probabilités
J’ai présenté ci-dessus l’interprétation bayésienne de la norme de la prépondérance de preuve ou balance des probabilités. Il s’agit, comme on l’a vu, d’une rationalisation récente de la pratique en common law. Dans le langage juridique, le terme de « probabilité » renvoie cependant à des usages beaucoup plus anciens que le concept mathématique qu’il recouvre aujourd’hui.
Jusqu’au début du 18e siècle, la probabilité est l’attribut d’une opinion ou d’une conjecture et désigne la crédibilité ou l’autorité qu’on doit leur accorder. Les premiers écrits sur la « géométrie du hasard » n’utilisent pas ce terme, mais parlent plutôt d’espérance, de sorts ou de chances. Au début du 19e siècle, soit l’époque où la norme de preuve en common law finit de prendre forme, les juristes parlent encore des probabilités ou vraisemblances en faveur ou contre une conjecture, les deux termes étant pris dans le même sens et dans leur ancienne acceptation, sans aucune connotation mathématique[27]. Cette tradition s’est perpétuée, de sorte que la norme de preuve en common law peut donc tout aussi bien être décrite par la condition (13). La condition p(x | a) > p(x | a̅) signifie alors que les éléments de preuve disponibles donnent plus de poids à la conjecture a qu’à son contraire, ce qui correspond aussi à la notion juridique de prépondérance de preuve. Avec cette interprétation, la norme de preuve en common law ne minimise pas les erreurs, mais maximise plutôt les incitations.
En fait, lorsque l’objet du litige est une action délibérée du défendeur, la thèse de la minimisation des erreurs a ceci de paradoxal qu’elle est incompatible avec une autre particularité de la procédure de common law, à savoir des règles strictes d’irrecevabilité (evidentiary rules) de certaines informations. Selon ces règles, la fréquence de l’action a dans une population de référence serait considérée comme non pertinente, c’est-à-dire qu’on doit en faire abstraction pour juger du cas d’espèce soumis au tribunal. Il en irait de même de la propension qu’aurait pu avoir le défendeur à avoir le comportement fautif (par exemple, son intérêt à le faire) ou de sa réputation d’avoir eu un tel comportement dans des situations comparables par le passé[28].
Demougin et Fluet (2006) argumentent que les règles d’irrecevabilité en common law interdisent au juge d’utiliser des a priori informés pour réduire le risque d’erreur. En contrepartie, les règles d’irrecevabilité combinées à la norme de la prépondérance de preuve assurent la maximisation des incitations ex ante. Je développerai ces idées dans la prochaine section. À la lumière de ces résultats, Demougin et Fluet (2005) montrent qu’on peut prendre l’exact contrepied de la thèse de Clermont et Sherwin (2002), en soutenant que les systèmes romano-germaniques se rapprochent sans doute plus de l’objectif de minimisation des erreurs.
3. Règles de preuve et procédure
Dans la discussion de la charge de la preuve à la section 1, j’ai noté qu’il ne fallait pas en conclure qu’un tribunal jugeant d’un cas d’espèce attribuerait spontanément la charge de manière optimale. Il s’agissait plutôt d’identifier les facteurs que la loi ou la jurisprudence devraient considérer pour dicter l’attribution de la charge dans certaines catégories de situations. De même, dans la discussion de la preuve imparfaite à la section 2, j’ai analysé la détermination des fonctions de décision qui devraient être utilisées. J’ai fait un rapprochement entre ces fonctions et la notion de norme de preuve, mais c’était à des fins heuristiques de manière à donner une interprétation des fonctions.
J’examine maintenant comment on peut déléguer à des tribunaux la responsabilité de juger des cas d’espèce qui leur sont soumis. On conçoit qu’il est impossible de communiquer aux tribunaux des fonctions de décision contingente comme d(x), ce qui équivaudrait à des catalogues d’actions à prendre dans chacune des situations qui pourraient survenir. S’il est impossible de communiquer des fonctions de décision détaillées, existe-t-il des principes généraux ou règles qui, si les tribunaux s’y conformaient, les amèneraient à prendre les bonnes décisions dans les cas d’espèce? Les normes de preuve, tels qu’on les pratique en common law, sont des exemples de principes généraux permettant d’orienter les décisions.
3.1 Les règles de preuve
Examinons à nouveau la situation décrite à la section 2, mais cette fois en modélisant explicitement le tribunal ou le juge comme un joueur dans le jeu de la preuve. Par rapport au modèle analysé jusqu’à présent, il faut maintenant ajouter une étape finale où le juge rend sa décision sur la base de ses croyances et des objectifs qu’il poursuit. La question n’est donc plus de déterminer la meilleure fonction de décision, mais de savoir à partir de quels principes généraux un juge décidant ex post sera conduit à rendre les « bons » jugements.
Supposons pour l’instant que l’objectif social soit la minimisation des erreurs dans les décisions de justice. Considérons les règles de preuve suivantes : (i) le plaignant a la charge de la preuve; (ii) le juge doit donner gain de cause au plaignant si et seulement si, sur la base de la preuve présentée, le fait a lui apparaît ex post comme plus probable que le fait contraire. La règle (ii) correspond évidemment à la norme de la prépondérance de preuve dans l’interprétation bayésienne. Je suppose que le juge est un « agent parfait » qui respecte les règles de preuve. On peut dès lors interpréter (ii) comme définissant la fonction d’utilité du juge. Par exemple, en rendant sa décision, le juge obtient l’utilité u = 1 s’il ne fait pas d’erreur et u = 0 s’il fait une erreur de première ou seconde espèce. Un juge maximisant son espérance d’utilité, sur la base de ses croyances ex post, se conforme alors à (ii).
En effet, on voit facilement que l’équilibre bayésien parfait de ce jeu est unique et que la stratégie d’équilibre d(x) du juge correspond à la fonction de décision d*(x) qui minimise la probabilité d’erreur judiciaire, telle que définie par la condition (12). On obtiendrait le même résultat si les règles étaient modifiées comme suit : le défendeur a la charge de la preuve et le juge doit lui donner gain de cause si et seulement si a̅ lui apparaît a posteriori comme le plus probable.
Supposons maintenant que l’objectif social est de maximiser les incitations lorsque l’objet du litige est une action délibérée. Comme on l’a vu à la section précédente, il faudrait alors que la décision ne repose que sur les vraisemblances. Considérons le ratio des probabilités a posteriori représentant les croyances du juge après présentation de la preuve x. En utilisant (11), ce ratio est égal à
À droite, le premier facteur est le ratio des probabilités a priori, le second est le ratio des vraisemblances étant donné la preuve qui a été soumise.
Si l’on veut que la décision du juge maximise les incitations, les règles de preuves formulées ci-dessus pourraient alors être complétées de la façon suivante : (iii) lorsque les faits pertinents sont des actions délibérées, le tribunal devrait « juger sans a priori » . Pour le formuler différemment, le juge devrait faire abstraction de l’information qu’il a sur p0 et aborder la cause sur la base du pseudo-a priorip̂0 = 1/2, comme dans la discussion de l’attribution optimale de la charge de la preuve à la section 2. Il s’agit alors d’une probabilité « normative » donnent un poids égal aux prétentions du plaignant et du défendeur[29]. En substituant cette probabilité dans (14) à la place du véritable a priori, on voit qu’un juge se conformant à (iii) rendra en fait une décision en fonction des vraisemblances relatives. Plus précisément, sa décision dépend alors des pseudo-probabilités a posteriori
On obtient à nouveau que l’équilibre bayésien parfait est unique, sauf que maintenant la stratégie d’équilibre d(x) du juge est la fonction d*(x) qui maximise les incitations ex ante, telle que définie en (13). La règle de preuve (iii) capture l’esprit des règles d’irrecevabilité de certaines informations en common law. On obtiendrait un résultat analogue si le défendeur avait la charge de la preuve.
Cette interprétation permet de résoudre quelques casse-têtes qui ont fait couler beaucoup d’encre chez les juristes de common law. L’un de ces casse-têtes nous est fourni par ce qu’on a appelé le paradoxe de l’autobus. Un individu a été heurté par un autobus, mais le conducteur a continué sa route, peut-être sans se rendre compte de ce qui s’était passé. Dans la ville il n’y a que deux sociétés d’autobus, les Bus Rouges et les Bus Bleus. Les Bus Rouges effectuent 55 % des trajets et on peut donc estimer à 0,55 la probabilité que la victime se soit trouvée au passage d’un véhicule de la société de Bus Rouges. La victime décide donc de poursuivre cette société mais n’a aucune autre preuve à présenter. Devrait-on donner raison à la victime sur la base de la norme de prépondérance de preuve? Les juristes répondent par la négative, mais sont en peine d’expliquer pourquoi comme le montre l’explication confuse que donne Posner (1999). Cependant, si le droit de la responsabilité vise à réguler les comportements, la décision devrait dépendre du ratio défini en (15). Selon cette condition, une preuve x n’est pertinente que si p(x | a) ≠ p(x | a̅); autrement dit, la probabilité qu’on obtienne cette information vérifiable doit dépendre des faits pertinents. Dans le paradoxe de l’autobus, l’information que 55 % des trajets sont effectués par les Bus Rouges préexiste à la survenance de l’accident et ne dépend pas du fait que l’accident ait été causé par les Bus Rouges ou les Bus Bleus. Cette information ne représente donc pas un élément de preuve pertinent.
Lorsque les deux plaideurs ont toujours accès aux éléments de preuve, les résultats que je viens de présenter peuvent dès lors se résumer comme suit : sous les règles de preuve (i) et (ii), et sous réserve de la règle d’irrecevabilité (iii) lorsqu’elle s’applique, l’équilibre parfait du jeu est unique et la stratégie d’équilibre du juge est conforme à d*(x)[30].
3.2 La manipulation de la preuve par les plaideurs
Ce qui précède fait abstraction d’un certain nombre de difficultés. Je considère maintenant une situation plus complexe où les règles de preuve que l’on vient de décrire ne garantissent pas l’optimalité des jugements (voir Demougin et Fluet, 2008). On a supposé ci-dessus qu’un plaideur pouvait soit présenter le x disponible soit ne rien présenter du tout. En pratique, s’il en a la possibilité, un plaideur pourrait ne pas révéler tous les éléments de preuve dont il dispose et ne soumettre que ceux qui jouent en sa faveur. Dans la mesure où ils n’ont pas accès aux mêmes éléments de preuve, les plaideurs pourront manipuler de façon stratégique ce qui sera présenté au tribunal.
Rappelons qu’une preuve est une combinaison de témoignages, de documents, etc. Un plaideur pourrait donc n’en présenter qu’une partie. Pour simplifier, je me limiterai à la possibilité d’une partition binaire de la preuve, de sorte qu’on peut écrire x = (s,z). Par exemple, s représente le contenu d’un premier dossier, z le contenu d’un second dossier[31]. Un dossier peut être présenté en totalité ou pas du tout. Je suppose que les plaideurs ont toujours accès au premier dossier; par contre, ils ont accès au second dossier avec les probabilités QP et QD respectivement. Le déroulement de la procédure est alors modifié comme suit : le plaignant intente une poursuite (ou non); si une poursuite est intentée, le plaignant a la charge de présenter le premier dossier; une fois que ce dossier est soumis, les plaideurs décident ensuite s’ils présentent le second dossier, lorsqu’ils le peuvent évidemment; enfin, le juge rend sa décision. Je suppose que la présentation du premier dossier ne comporte qu’un faible coût. Par contre, le coût de présenter le second est non négligeable (mais inférieur à l’enjeu du litige). Par conséquent, un plaideur ne présentera le second dossier que s’il en retire un avantage comparativement à ce qu’il obtiendrait si ce dossier n’était pas présenté. Ce jeu de la preuve est semblable à ceux que l’on a examinés jusqu’ici, sauf que l’étape de présentation de la preuve est décomposée en deux sous-étapes. Il y a une différence essentielle, toutefois, en ce que les parties sont maintenant en mesure de tronquer les éléments de preuve qui seront soumis au tribunal. Plus précisément, il se pourrait que le second dossier ne soit pas présenté, ce que je dénoterai par φ. Au terme de la procédure, c’est-à-dire à l’étape du jugement, le tribunal aura donc reçu une preuve qui aura soit la forme (s,z) soit la forme (s,φ). Dans le premier cas, le tribunal observe les contenus des deux dossiers; dans le second, il n’observe que le contenu du premier dossier.
Dans ce qui va suivre, je procéderai en deux étapes. Premièrement, je détermine la fonction de décision optimale décrivant ce que devrait faire le juge au terme de la procédure. Je me limiterai au cas où l’objectif social est de minimiser les erreurs (le raisonnement est le même quand l’objectif est de maximiser les incitations). Deuxièmement, j’examine si les principes généraux décrits précédemment conduiront le juge à adopter une stratégie compatible avec la fonction de décision optimale.
Considérons donc d’abord la fonction de décision optimale. On montre facilement que, lorsque les deux dossiers sont présentés, la fonction optimale satisfait la condition (12), de sorte que
Autrement dit, le demandeur a gain de cause si a est a posteriori plus probable sur la base du contenu des deux dossiers.
Le cas où la preuve soumise se limite au premier dossier est plus délicat. Dénotons par Sφ l’événement correspondant aux situations où soit aucun des plaideurs ne peut présenter le second dossier, soit seul l’un d’entre eux le peut mais la présentation de ce dossier ne lui procure aucun avantage (étant donné le contenu du premier dossier)[32]. On peut calculer la probabilité de Sφ. De même, on peut calculer les probabilités a posteriori p(a | sφ) et p( a̅ | sφ). On peut alors montrer que la fonction de décision optimale satisfait
Prises simultanément, les conditions (16) et (17) définissent la fonction de décision optimale. Voyons maintenant si les règles de preuve introduites à la sous-section précédente permettent de déléguer efficacement la décision à un juge, qui rend sa décision en fonction de ses croyances au terme de la procédure. On a le résultat suivant :
Sous les règles (i) et (ii), et sous réserve de (iii) lorsqu’elle est pertinente, il existe toujours un équilibre bayésien parfait où la stratégie d’équilibre du juge satisfait d*(s,z) et d*(s,φ).
De manière générique, toutefois, il y a aussi des équilibres dans lesquels la stratégie du juge est conforme à d*(s,z) mais ne satisfait pas d*(s,φ).
En d’autres termes, les règles de preuve ne garantissent pas que, à l’équilibre, la décision du juge satisfera la condition (17). L’existence d’une multiplicité d’équilibres nécessite que QP et QD ne soient pas trop petits. Évidemment, quand ces probabilités sont toutes deux égales à zéro, le problème de la manipulation stratégique de la preuve ne se pose pas.
L’intuition du résultat tient au fait que, à l’issue de la procédure, les croyances du juge sont endogènes (elles dépendent de l’équilibre) et qu’elles sont autoréalisatrices (elles ont confirmées à l’équilibre). Ainsi, pour une réalisation s, on pourrait avoir que les parties anticipent la décision d(s,φ) = 1 et agissent en conséquence. À la dernière étape du jeu, si le second dossier n’a pas été présenté, le juge décide effectivement d(s,φ) = 1 car ses croyances satisfont alors
Toutefois, on pourrait parfaitement avoir un autre équilibre tel que, pour la même réalisation s, les parties anticipent la décision d(s,φ) = 0 et jouent donc en conséquence. Ex post, le juge décide alors d(s,φ) = 0 car dans ce cas ses croyances satisfont
La possibilité d’avoir aussi bien (18) que (19) découle du fait que l’information (s,φ) n’a pas la même signification dans les deux équilibres. Les inférences du juge dépendent des stratégies des parties et ces stratégies dépendent elles-mêmes de l’appréciation que fera le juge lorsque la preuve se réduit au premier dossier[33].
Pour illustrer la possibilité d’équilibres multiples, je discuterai du cas simple où le second dossier constitue une preuve parfaite. Le contenu de ce dossier est alors soit za soit za̅ , ce qui se rapproche de la situation examinée dans la section 1. Quel que soit s, on a alors p(a | s,za) = 1 et p(a | s,za̅) = 0. Dans cette situation, l’événement sφ est l’union des événements suivants: {le contenu du premier dossier est s et aucun des plaideurs n’a accès au second dossier}, {le contenu du premier dossier est s, seul le plaignant a accès au second dossier et son contenu est za̅}, {le contenu du premier dossier est s, seul le défendeur a accès au second dossier et son contenu est za}. La probabilité a priori de sφ est donc
En simplifiant, on obtient
Par le théorème de Bayes,
de sorte que
Si le ratio de probabilités (20) est supérieur à l’unité, la fonction de décision optimale satisfait d*(s,φ) = 1; elle satisfait d*(s,φ) = 0 si le ratio est inférieur à l’unité[34].
Considérons maintenant les équilibres possibles. Je me bornerai au cas où le ratio (20) est supérieur à l’unité, ce qui implique d*(s,φ) = 1. Premièrement, il y a toujours un « bon équilibre » dans lequel la stratégie du juge est bien d(s,φ) = 1. Lorsque les parties anticipent cette décision, tout se passe comme si le défendeur avait la charge de présenter le second dossier quand le contenu du premier est s, à défaut de quoi il perd le procès. Dans cet équilibre, l’ensemble d’information (s,φ) signifie donc : {le contenu du premier dossier est s et soit le défendeur n’a pas accès au second dossier soit son contenu est za}. À l’équilibre du jeu, la probabilité de cet événement est
Les croyances a posteriori du juge sont donc
ce qui donne le ratio de probabilités a posteriori
Il s’agit ici des croyances a posteriori du juge à l’équilibre du jeu. Pour que d(s,φ) = 1 soit une stratégie d’équilibre, il faut que le ratio des probabilités a posteriori soit supérieur à l’unité. On voit que (21) diffère de (20). Cependant, si (20) est supérieur à l’unité, il en sera nécessairement de même de (21). En d’autres termes, un « bon équilibre » existe toujours.
Examinons maintenant la possibilité d’un « mauvais équilibre » où le juge adopterait la stratégie d(s,φ) = 0. Tout se passe alors comme si c’était le plaignant qui avait la charge de présenter le second dossier lorsque le premier dossier révèle s. Dans cet équilibre, l’ensemble d’information (s,φ) signifie maintenant : {le contenu du premier dossier est s et soit le plaignant n’a pas accès au second dossier soit son contenu est za̅}. La probabilité de cet événement est
Les croyances a posteriori du juge sont maintenant
ce qui donne le ratio
Le ratio (22) diffère de (21) et de (20). Si (22) est inférieur à l’unité, un juge recevant la preuve (s,φ) en déduit que a est moins probable que a̅. La stratégie d(y,φ) = 0 fait donc bien partie d’un équilibre. Si QP est suffisamment grand, (22) est inférieur à l’unité, ce qui signifie qu’un « mauvais équilibre » existe de manière générique[35]. La figure 3 illustre la possibilité d’équilibres multiples.
J’ai fait remarquer que, à l’équilibre, la stratégie d(y,φ) jouait un rôle analogue à celui de l’attribution de la charge de la preuve lorsque seul le premier dossier avait été présenté et que son contenu était s. C’était pour établir un rapprochement avec la discussion de la section 1. Il serait plus juste de décrire d(y,φ) comme résultant de présomptions qui surgissent dans le déroulement de la procédure. La multiplicité des équilibres peut donc s’interpréter comme le fait que les règles de preuves ne garantissent pas l’apparition des « bonnes » présomptions dans le cours de la présentation des preuves.
3.3 Présomptions légales et pouvoir d’initiative du juge
Des règles de preuve apparemment raisonnables ne garantissent donc pas un « bon équilibre » lorsque la responsabilité de rendre jugement est déléguée au tribunal, même si celui-ci respecte parfaitement les règles de preuve. Je discuterai ici de deux manières d’éliminer les « mauvais équilibres ».
La première consisterait à réduire le champ de la délégation en introduisant des présomptions légales auxquelles le juge devrait se conformer. Ainsi, la loi (ou la jurisprudence) pourrait dicter la décision d*(s,φ) pour toutes les réalisations possibles de s, ce qui permettrait de se coordonner sur le « bon équilibre ». J’ai déjà souligné que des présomptions légales étaient couramment utilisées. On comprend bien cependant qu’il est impossible de communiquer un catalogue détaillé de présomptions légales, ce que serait la fonction d*(s,φ), pour tous les cas de figures susceptibles de se présenter à l’échelon du tribunal. En d’autres termes, sauf pour certaines grandes catégories de situations, cette approche n’est pas réellement satisfaisante puisqu’elle ne peut utiliser efficacement l’information détaillée disponible seulement au niveau des tribunaux.
La seconde approche consiste à modifier la procédure en élargissant le rôle du juge. Jusqu’à maintenant, je me suis limité à une procédure dans laquelle le juge joue essentiellement le rôle d’un arbitre passif. Comme dans la procédure purement accusatoire (adversarial) du common law, ce sont les parties qui mènent le bal, le juge n’intervenant pas dans le cours de la procédure. Une fois que les parties en ont terminé avec la présentation de leur preuve, l’arbitre rend son jugement[36]. La séquence du jeu correspondant à cette procédure est représentée en abrégé à la figure 4.
Dans la tradition romano-germanique, la procédure du procès civil est également accusatoire pour l’essentiel, puisqu’il incombe aux parties de présenter la preuve de leurs allégations; mais elle a aussi un aspect inquisitoire en ce sens que le juge y a un pouvoir d’initiative plus grand[37]. Le juge a la capacité d’encadrer la présentation de la preuve par les parties. Il peut les inviter à fournir des explications additionnelles ou les interroger sur des éléments de preuve qui n’ont pas été présentés mais qui auraient pu l’être. Demougin et Fluet (2008) modélisent le rôle d’un juge actif dans une procédure modifiée comme celle que décrit la figure 5. Après la présentation du premier dossier, le juge actif a la possibilité d’interroger l’une ou l’autre des parties. En « interrogeant » un plaideur, le juge suggère que la preuve disponible à cette étape des audiences n’est pas suffisante pour un jugement en sa faveur. Autrement dit, compte tenu de la preuve présentée jusque-là, le juge fait part de l’appréciation qu’il fait de cette preuve et annonce ainsi dans quel sens il entend rendre son jugement si aucun élément de preuve additionnel n’est présenté. Ces annonces sont purement rhétoriques (il s’agit de cheap talk dans la terminologie de la théorie des jeux), mais on peut montrer que les annonces d’équilibre d’un juge cherchant à minimiser l’erreur[38] sont crédibles, en ce sens que le juge voudra faire ce qu’il a annoncé s’il croit que ses annonces sont crues et qu’il n’a jamais intérêt à induire en erreur sur ses intentions[39].
On obtient alors que, dans la procédure avec juge actif, seul le « bon équilibre » subsiste. Plus précisément, le jeu comporte un équilibre unique et la décision rendue par le juge au terme de la procédure satisfait (16) et (17). L’intuition de ce résultat est la suivante. Premièrement, l’annonce du juge, lorsqu’il interroge les parties, est indépendante des actions passées des parties, en ce sens qu’elle ne repose pas sur des inférences de sa part qui sont propres à un équilibre. Deuxièmement, le juge peut anticiper les stratégies de réponse des parties. Par exemple, si le juge annonce qu’il donnera raison au plaignant si rien d’autre n’est dit, il anticipe rationnellement que c’est le défendeur qui voudra répliquer. Si ce dernier ne le fait pas, le juge pourra rationnellement en inférer que c’est soit parce que le défendeur n’avait pas accès au second dossier soit parce que la présentation du second dossier aurait conduit à une décision en faveur du plaignant. À l’étape du jugement, il n’y a plus alors de multiplicité de présomptions possibles si la preuve reste limitée au premier dossier. Le pouvoir d’intervention du juge permet ainsi de coordonner les parties sur une présentation efficace de la preuve du point de vue de la minimisation de l’erreur judiciaire.
Ces propriétés se démontrent facilement pour le cas où le second dossier constitue une preuve parfaite. Supposons que le contenu du premier dossier est s. À cette étape, le juge peut annoncer qu’il donnera raison au plaignant si rien d’autre n’est dit ou au contraire qu’il donnera raison au défendeur. Supposons pour l’instant que ces annonces sont crues et que le juge a l’obligation de se conformer à ses annonces. Si le juge dit qu’il donnera raison au plaignant, il sait que seul le défendeur a intérêt à présenter le second dossier. Si ce dossier n’est pas présenté et que le fait est véritablement a, il n’y aura pas d’erreur judiciaire. Si le fait est véritablement a̅, la probabilité d’erreur est p( a̅ | s)(1 – QD). Par un raisonnement analogue, si le juge annonce qu’il donnera raison au défendeur, la probabilité d’erreur judiciaire est p(a | s)(1 – QP). Comme il cherche à minimiser la probabilité d’erreur, le juge annonce qu’il donnera raison au plaignant si
c’est-à-dire si
ce qui correspond au cas où d*(s,φ) = 1 parce que le ratio défini en (20) est supérieur à l’unité. Par le même argument que précédemment, si à l’issue de la procédure le second dossier n’est effectivement pas présenté, les croyances du juge seront données par le ratio de probabilités a posteriori
Donc le juge voudra ex post se conformer à son annonce; autrement dit, l’annonce est self-committing. Dans la situation représentée à la figure 3, l’annonce que le défendeur aurait gain de cause en l’absence du second dossier aurait également été self-committing. Cependant, ce n’est pas celle que choisit le juge car elle ne minimise pas le risque d’erreur judiciaire[40].
Conclusion et prolongements
Les modèles présentés ici sont limités à plusieurs égards. J’espère néanmoins avoir montré que l’analyse économique a beaucoup à apporter dans la réflexion sur la preuve et la procédure judiciaires. En guise de conclusion, je me contenterai de discuter brièvement de quelques développements additionnels.
J’ai pris pour acquis que l’objet du litige pouvait se traduire par ce que les statisticiens appellent un test d’hypothèse simple. En particulier, lorsque le litige portait sur une action du défendeur, j’ai supposé que cette action ne pouvait prendre que deux « valeurs ». Cette simplification n’est souvent pas satisfaisante. Dans une poursuite en responsabilité médicale, le patient pourrait chercher à établir que le médecin a été insuffisamment diligent. Le comportement de diligence du médecin est susceptible de degrés, de sorte que la faute signifie une insuffisance de diligence par rapport à une norme de comportement. Dans ce contexte, la maximisation des incitations ex ante n’est plus nécessairement un objectif approprié puisque cela peut induire des niveaux de diligence excessifs, ce qui se rapproche du problème de la « médecine défensive » auquel j’ai fait allusion dans l’introduction. Fluet (2010) montre que, lorsqu’il y a une possibilité de surincitation, la norme de la prépondérance de preuve est généralement trop peu exigeante car elle induit des comportements de précaution excessivement coûteux eu égard à leur efficacité dans la réduction du risque d’accident.
J’ai considéré trois préoccupations possibles pour le mécanisme de la preuve judiciaire : les coûts de la preuve, le risque d’erreur et les incitations ex ante. D’autres considérations sont également pertinentes. Fagart et Fluet (2009) analysent la relation entre la norme de la preuve et l’utilité, à des fins contractuelles, du signal que représente un jugement. L’analyse porte sur les contrats d’assurance responsabilité en aléa moral. Lorsque le comportement de précaution de l’assuré est imparfaitement observable, le contrat d’assurance doit faire un arbitrage entre le partage des risques (entre assureur et assuré) et les incitations à prendre des précautions. Une décision de justice établissant la faute de l’assuré (c’est-à-dire l’insuffisance de précautions) constitue alors une information pertinente pour les indemnités contingentes prévues au contrat d’assurance. Nous montrons que l’utilité de cette information, du point de vue de l’amélioration de l’arbitrage entre partage de risque et incitations, dépend de la norme de preuve appliquée par les tribunaux.
Enfin, je n’ai discuté que très sommairement de la question des coûts de preuve. De plus, les coûts considérés se limitaient à des coûts de présentation d’une preuve déjà constituée. Il y a une certaine littérature sur les coûts de recherche de preuve (par exemple, Froeb et Kobayashi, 1996, 2001). J’ai présumé aussi que les preuves ne pouvaient être manipulées que par omission de certaines informations, ce qui est une hypothèse standard dans la littérature. On ne pouvait « fabriquer » une preuve. Il y a cependant une littérature récente sur les jeux de persuasion avec falsification des messages (Kartik, Ottaviani et Squintani, 2007, et Kartik, 2009), ce qui semble pertinent pour étudier la question de la fabrication de preuves. Emons et Fluet (2009) adoptent cette approche pour comparer différentes procédures du point de vue des coûts de litige, lorsque ceux-ci découlent de dépenses d’exagération ou de fabrication de preuves dans le but d’influencer les croyances du tribunal.
Appendices
Remerciements
Je remercie pour leurs commentaires Steven Ambler, Bertrand Crettez, Bruno Deffains, Patrick González, Ejan Mackaay et Thierry Verdier.
Notes
-
[1]
Richard Posner a publié en 1972 le premier traité d’économie du droit, Economic Analysis of Law, maintenant en 7e édition. Pour des survols récents, voir les Handbooks de Polinsky et Shavell (2007), le manuel de Mackaay et Rousseau (2008) ou l’ouvrage collectif de Deffains et Langlais (2009).
-
[2]
Pour une appréciation nuancée de cette distinction, voir Shapiro (2002). Sur l’histoire de la preuve judiciaire, voir notamment Perelman et Foriers (1981).
-
[3]
Voir Kessler et McClellan (1996).
-
[4]
Loi du 4 mars 2002 relative aux droits des malades (« loi Kouchner » ). Cette loi entérinait la jusrisprudence récente et est représentative de développements similaires dans plusieurs pays.
-
[5]
CISR (2003), art. 3.3.6.1.
-
[6]
Cette norme est aussi celle du droit québécois : « La preuve qui rend l’existence d’un fait plus probable que son contraire est suffisante, à moins que la loi n’exige une preuve plus convaincante » (art. 2804, Code Civil du Québec). Pour une synthèse du droit de la preuve civile au Québec, voir Royer (2008).
-
[7]
Une norme plus faible que la simple prépondérance est également possible. Par exemple, la loi canadienne prévoit qu’un résident non permanent peut être expulsé s’il y a des possibilités sérieuses ou motifs raisonnables de croire qu’il se livre à des activités de grande criminalité. Ces notions s’interprètent comme une exigence plus faible que la balance des probabilités.
-
[8]
Voir aussi le chapitre 22 de Posner (2007), ainsi que la synthèse de Sanchirico (2010). Je remercie Ejan Mackaay de m’avoir signalé cette référence.
-
[9]
Sur les travaux de Poisson, voir Barbin et Marec (1987).
-
[10]
Notons que la figure 1 ne décrit pas un jeu puisque les actions des plaideurs et leurs gains ou pertes ne sont pas représentés.
-
[11]
Par exemple, à la suite d’une arthrographie du genou, le patient est atteint d’une arthrite septique provoquée par un streptocoque. Le tribunal pourrait en déduire la présomption d’une faute d’asepsie.
-
[12]
C’est généralement le cas pour les obligations contractuelles. On démontre l’existence d’une dette en présentant la reconnaissance de dette signée par le débiteur. Il pourrait être très difficile de démontrer l’inexistence d’une dette.
-
[13]
Les jeux de litige ont fait l’objet d’une abondante littérature, notamment pour expliquer pourquoi les parties ne règlent pas à l’amiable plutôt que d’aller jusqu’au procès. Pour des survols de cette littérature, voir Spier (2007) et Langlais et Chappe (2009).
-
[14]
D’autres sources de jugements erronés seront examinées à la section 2.
-
[15]
Ces préoccupations sont anciennes. Dans son analyse du risque d’erreur judiciaire, Condorcet (1785) examine deux applications de sa théorie : « 1. La constitution d’un Tribunal où le tort résultant de l’erreur est le même, quelle que soit celle des deux propositions contradictoires, qui, quoique fausse, a obtenu la pluralité des voix; comme par exemple dans le jugement d’une cause civile, où deux hommes qui se disputent une propriété, sont dans un cas également favorable; 2. la constitution d’un Tribunal où l’on ne doit admettre une des décisions que lorsque la vérité en est prouvée, comme, par exemple, dans un jugement criminel, où il faut une assurance suffisante qu’un accusé est coupable pour prononcer la condamnation » (p. 279).
-
[16]
J’utiliserai la notation p(⋅) ou p(⋅ | ⋅) pour des probabilités exogènes et la notation Pr(⋅) ou Pr(⋅ | ⋅) pour des probabilités associées à l’équilibre du jeu.
-
[17]
Le modèle présenté ci-dessus rappelle celui de Shin (1998); voir aussi Shavell (1989). Il y a toutefois une différence importante en ce que je suppose ici que la présentation d’une preuve impose un coût au plaideur, de sorte qu’il reste passif s’il n’a pas la charge. On verra que cela joue un rôle lorsque le tribunal est modélisé comme rendant un jugement en fonction de ses croyances à l’issue de la procédure, ce que je n’ai pas vraiment supposé ici.
-
[18]
Plus généralement, elle pourrait augmenter le risque de préjudice.
-
[19]
La question de la discrimination statistique a été principalement étudiée dans le contexte de la répression des activités criminelles. Voir par exemple Farmer et Terrell (2001) et Persico (2002).
-
[20]
Welsh (2003) présente un survol détaillé de cette évolution pour le droit français.
-
[21]
Les preuves ne deviennent disponibles que s’il y a poursuite, c’est-à-dire si on a eu y1 à l’étape 1. Comme p(y1 | a) = 1, on a . Comme p(y1 | a̅) = q, on a . Dans la section 1, X ne contenait que xa et xa̅ , où p(xa | a̅) = 0 et p(xa̅ | a) = 0.
-
[22]
Par exemple, x''' pourrait satisfaire p(x''' | a) > 0 et p(x''' | –a) = 0, auquel cas il s’agit d’une preuve parfaite du fait a. Cependant, l’obtention de cette preuve n’est pas certaine si p(x''' | a) < 1.
-
[23]
On peut citer les manuels de Luce et Raiffa (1957) ou Chernoff et Moses (1959). La minimisation du risque d’erreur est un problème élémentaire de théorie de la décision.
-
[24]
J’ai pris pour acquis ici que celui qui a la charge de la preuve assume « l’obligation de persuasion », en ce sens qu’il perd s’il y a équiprobabilité. Selon que le plaignant ou le défendeur a la charge, la décision rendue sera différente lorsque la preuve est telle que les faits pertinents sont a posteriori équiprobables. On a vu cependant que cela était sans conséquence pour la minimisation du risque d’erreur.
-
[25]
Voir Fluet (1999) pour un résultat analogue montrant que l’imposition de sanctions sur la base du maximum de vraisemblance permet de réduire les sanctions au minimum tout en préservant un niveau donné d’incitations.
-
[26]
Ce problème est de même nature que celui de l’incohérence intertemporelle des politiques macroéconomiques (Kydland et Prescott, 1977).
-
[27]
La première édition du Dictionnaire de l’Académie française (1694) donne du mot probabilité la définition suivante : « Vraisemblance. Apparence de vérité ». La connotation mathématique n’apparaît que dans la cinquième édition (1762). Sur l’évolution de la notion de probabilité avant le sens qu’on lui donne aujourd’hui, voir notamment Hacking (1975) et Spranzi Zuber (2001). On associe généralement la fusion du vieux concept et de l’acception moderne à l’Ars Conjectandi de Jacques Bernoulli, publié en 1713; voir Shafer (1978), Meusnier (1996) et Santos del Cerro (2006).
-
[28]
Voir Sanchirico (2001).
-
[29]
Posner (1999) souligne que c’est ce que devrait faire un juge « non biaisé » . Daughety et Reinganum (2000) font remarquer que les règles d’irrecevabilité excluent que le juge puisse se comporter de façon parfaitement bayésienne.
-
[30]
L’équilibre est unique étant donné l’attribution de la charge de la preuve. Cependant, quelle que soit l’attribution de la charge, la stratégie d’équilibre du juge est conforme à d*(x).
-
[31]
Si S dénote l’ensemble des réalisations possibles de s et Z l’ensemble des réalisations possibles de z, ce que j’ai dénoté précédemment par X est le produit cartésien S × Z.
-
[32]
L’évènement Sφ est l’union des événements suivants : {le contenu du premier dossier est S et aucun des plaideurs n’a accès au second dossier}, {le contenu du premier dossier est S, seul le plaignant a accès au second dossier, son contenu z satisfait d*(s,z) = 0}, {le contenu du premier dossier est S, seul le défendeur a accès au second dossier, son contenu z satisfait d*(s,z) = 1}.
-
[33]
D’où la notation Pr(⋅ | ⋅) plutôt que p(⋅ | ⋅); voir la note 2. Dans la condition (17), en revanche, j’ai utilisé la notation p(⋅ | ⋅) parce que l’événement sφ est défini indépendamment des stratégies des parties.
-
[34]
Dans ce dernier cas, la condition peut se réécrire
ce qu’on peut rapprocher de la condition obtenue dans la section 2 pour que le plaignant ait la charge de la preuve, en notant qu’on avait alors p(y1 | a̅) = q et p(y1 | a) = 1.
-
[35]
Deffains et al. (2007) développent un exemple où le « bon équilibre » est de mesure nulle dans un continuum d’équilibres possibles.
-
[36]
Dans la formule canonique du procès de common law, les interventions du juge visent principalement l’application des règles d’irrecevabilité (la règle (iii) décrite ci-dessus).
-
[37]
Pour une brève description des différences de procédure, voir Parisi (2002).
-
[38]
Ou la pseudo-erreur sur la base d’a priori normatifs. Je suppose que le juge actif se conforme également aux règles de preuve (i) et (ii), sous réserve de la règle d’irrecevabilité (iii).
-
[39]
Les annonces sont self-committing et self-signalling suivant la définition de Farrell et Rabin (1996).
-
[40]
Schrag (1999) présente une autre justification du pouvoir d’intervention du juge basée sur la minimisation du coût d’instruction d’une affaire.
Bibliographie
- Andreoni, J. (1991), « Reasonable Doubt and the Optimal Magnitude of Fines: Should the Penalty Fit the Crime? », RAND Journal of Economics, 22 : 385-395.
- Andreoni, J. (1995), « Criminal Deterrence in the Reduced Form: A New Perspective on Ehrlich’s Seminal Study », Economic Inquiry, 33 : 476-483.
- Barbin, E. et Y. Marec (1987), « Les recherches sur la probabilité des jugements de Simon-Denis Poisson », Histoire et Mesure, 2 : 39-50.
- Bernardo, A. E., E. Tally et I. Welch (2000), « A Theory of Legal Presumptions », Journal of Law, Economics and Organization, 16 : 1-49.
- Brook, J. (1982), « Inevitable Errors: The Preponderance of Evidence Standard in Civil Litigation », Tulsa Law Journal, 18 : 79-109.
- Chernoff, H. et L.E. Moses (1959), Elementary Decision Theory, Wiley, New York.
- Clermont, K.M. et E. Sherwin (2002), « A Comparative View of Standards of Proof », American Journal of Comparative Law, 50 : 243-275.
- Commissionde l’immigration et du statut de réfugié (2003), L’appréciation de la preuve, Gouvernement du Canada (http://www.irb-cisr.gc.ca/fra), Ottawa.
- Condorcet, M.J. (1785), Essai sur l’application de l’analyse à la probabilité des décisions rendues à la pluralité des voix, Imprimerie Royale, Paris.
- Daughety, A. F. et J. F. Reinganum (2000), « On the Economics of Trials: Adversarial Process, Evidence, an Equilibrium Bias », Journal of Law, Economics and Organization, 16 : 365-395.
- Davis, M. L. (1994), « The Value of Truth and Optimal Standard of Proof in Legal Disputes », Journal of Law, Economics and Organization, 10 : 343-359.
- Deffains, B. et E. Langlais, (dir.) (2009), Analyse économique du droit, De Boeck, Bruxelles.
- Deffains, B., D. Demougin et C. Fluet (2007), « Économie des procédures judiciaires », Revue Économique, 58 : 1265-1290.
- Demougin, D. et C. Fluet (2005), « Deterrence Versus Judicial Error: A Comparative View of Standards of Proof », Journal of Institutional and Theoretical Economics, 161 : 193-206.
- Demougin, D. et C. Fluet (2006), « Preponderance of Evidence », European Economic Review, 50 : 963-976.
- Demougin, D. et C. Fluet (2008), « Rules of Proof, Courts, and Incentives », RAND Journal of Economics, 39 : 20-40.
- Dewatripont, M. et J. Tirole (1999), « Advocates », Journal of Political Economy 107 : 1-39.
- Emons, W. et C. Fluet (2009), « Accuracy Versus Falsification Costs: The Optimal Amount of Evidence Under Different Procedures », Journal of Law, Economics, and Organization, 25 : 134-156.
- Fagart, M.-C. et C. Fluet (2009), « Liability Insurance Under the Negligence Rule », RAND Journal of Economics, 40 : 486-508.
- Farmer, A. et D. Terrell (2001), « Crime Versus Justice: Is There a Trade-off? », Journal of Law and Economics, 44 : 345-366.
- Farrell, J. et M. Rabin (1996), « Cheap Talk », Journal of Economic Perspectives, 10 : 103-118.
- Fluet, C. (1999), « Régulation des risques et insolvabilité: le rôle de la responsabilité pour faute en information imparfaite », L’Actualité économique: Revue d’analyse économique, 75(1-3), 379-400.
- Fluet, C. (2003), « Enforcing Contracts: Should Courts Seek the Truth? », Journal of Institutional and Theoretical Economics, 159 : 49-69.
- Fluet, C. (2006), « La responsabilité médicale entre obligation de moyens et de résultat : une interprétation », Risques, 68 : 73-79.
- Fluet, C. (2010), « Liability Rules Under Evidentiary Uncertainty », International Review of Law and Economics, 30 : 1-9.
- Froeb, L. et B. Kobayashi (1996), « Naive, Biased, yet Bayesian: Can Juries Interpret Selectively-produced Evidence? », Journal of Law, Economics and Organization, 12 : 257-276.
- Froeb, L. et B. Kobayashi (2001), « Evidence Production in Adversarial vs. Inquisitorial Regimes », Economics Letters, 70 : 267-272.
- Hacking, I. (1975), The Emergence of Probability, Cambridge University Press, Cambridge.
- Hay, B.L. et K.E. Spier (1997), « Burdens of Proof in Civil Litigation: An Economic Perspective », Journal of Legal Studies, 26 : 413-431.
- Kartik, N. (2009), « Strategic Communication with Lying Costs », Review of Economic Studies, 76 : 1359-1395.
- Kartik, N., M. Ottaviani et F. Squintani (2007), « Credulity, Lies, and Costly Talk », Journal of Economic Theory, 134 : 93-116.
- Katz, A. (1988), « Judicial Decision Making and Litigation Expenditure », International Review of Law and Economics, 8 : 127-143.
- Kessler, D. et M. McClellan (1996), « Do Doctors Practice Defensive Medicine? », Quarterly Journal of Economics, 111 : 353-390.
- Kydland, F.E. et E. Prescott (1977), « Rules Rather than Discretion : The Inconsistency of Optimal Plans », Journal of Political Economy, 85 : 473-492.
- Langlais, E. et N. Chappe (2009), « Analyse économique de la résolution des litiges », chapitre 4 dans Deffains B. et E. Langlais (dir.), Analyse économique du droit, De Boeck, Bruxelles.
- Laplace, P.S. (1814), Essai philosophique sur les probabilités, Réédition Bourgeois [1986], Paris
- Lévy-Bruhl, H. (1964), La preuve judiciaire : étude de sociologie juridique, Paris.
- Lipman, B.L. et D.J. Seppi (1995), « Robust Inference in Communications Games with Partial Provability », Journal of Economic Theory, 66 : 370-405.
- Luce, R.D. et H. Raiffa (1957), Games and Decisions, Wiley, New York.
- Mackaay, E. et S. Rousseau (2008), Analyse économique du droit, 2e édition, Dalloz, Paris.
- Meusnier, N. (1996), « L’émergence d’une mathématique du probable au XVIIe siècle », Revue d’histoire des mathématiques, 2 : 119-147.
- Miceli, T.J. (1990), « Optimal Prosecution of Defendants Whose Guilt is Uncertain », Journal of Law, Economics and Organization, 6 : 189-201.
- Milgrom, P. et J. Roberts (1986), « Relying on the Information of Interested Parties », RAND Journal of Economics, 17 : 18-32.
- Palumbo, G. (2001), « Trial Procedures and Optimal Limits on Proof-taking », International Review of Law and Economics, 21 : 309-327.
- Parisi, F. (2002), « Rent-seeking Through Litigation: Adversarial and Inquisitorial Systems Compared », International Review of Law and Economics, 22 : 193-216.
- Perelman, Ch. et P. Foriers, (dir.) (1981), La preuve en droit, Émile Bruyant, Bruxelles.
- Persico, N. (2002), « Racial Profiling, Fairness, and Effectiveness of Policing », American Economic Review, 92 : 1472-1497.
- Poisson, S.D. (1837), Recherche sur la probabilité des jugements en matière criminelle et en matière civile, Bachelier, Paris.
- Polinsky, M.A. et S. Shavell (1989), « Legal Error, Litigation, and the Incentive to Obey the Law », Journal of Law, Economics and Organization 5 : 99-108.
- Polinsky, M.A. et S. Shavell, (dir.) (2007), Handbook of Law and Economics, Vol. 1 et 2 : Elsevier, Amsterdam.
- Posner, R.A. (1999), « An Economic Approach to the Law of Evidence », Stanford Law Review, 51 : 1477-1521.
- Posner, R.A. (2007), Economic Analysis of Law, 7e éd., Wolters Kluwer.
- Royer, J.-C. (2008), La preuve civile, 4e éd. Y. Blais, Cowansville.
- Rubinfeld, D.L. et D.E. Sappington (1987), « Efficient Awards and Standards of Proof in Judicial Proceedings », RAND Journal of Economics, 18 : 308-318.
- Sanchirico, C.W. (1997), « The Burden of Proof in Civil Litigation: A Simple Model of Mechanism Design », International Review of Law and Economics, 17 : 431-447.
- Sanchirico, C.W. (2001), « Character Evidence and the Object of Trial », Columbia Law Review, 101 : 1227-1311.
- Sanchirico, C.W. (2010), « Models of Evidence : Survey and Assessment », University of Pennsylvania Institute for Law and Economic Research, no. 10-28.
- Santosdel Cerro, J. (2006), « L’Ars Conjectandi : la géométrie du hasard versus le probabilisme moral », Journal Électronique d’Histoire des Probabilités et de la Statistique, 2(1), 1-23.
- Schrag, J. (1999), « Managerial Judges: An Economic Analysis of the Judicial Management of Legal Discovery », RAND Journal of Economics, 30 : 305-323.
- Schrag, J. et S. Scotchmer (1994), « Crime and Prejudice: The Use of Character Evidence in Criminal Trials », Journal of Law, Economics, and Organization, 10 : 319-342.
- Seidman, D.J. et E. Winter (1997), « Strategic Information Transmission With Verifiable Messages », Econometrica, 55 : 163-169.
- Shafer, G. (1978), « Non-additive Probabilities in the Work of Bernoulli and Lambert », Archive for History of Exact Sciences, 19 : 309-370.
- Shapiro, B. (2002), « Testimony in Seventeen Century English Philosophy: Legal Origin and Early Development », Studies in the History and Philosophy of Science, 33 : 243-263.
- Shavell, S. (1989), « Optimal Sanctions and the Incentive to Provide Evidence to a Tribunal », International Review of Law and Economics, 9 : 3-11.
- Shin, H.S. (1994), « The Burden of Proof in a Game of Persuasion », Journal of Economic Theory, 64 : 253-264.
- Shin, H.S. (1998), « Adversarial and Inquisitorial Procedures in Arbitration », RAND Journal of Economics, 29 : 378-405.
- Sobel, J. (1985), « Disclosure of Evidence and Resolution of Disputes: Who Should Bear the Burden of Proof? » in A.E. Roth, (éd.), Game Theoretic Models of Bargaining, Cambridge University Press, Cambridge.
- Spier, K. (2007), « Litigation », chapitre 4 dans Polinsky M. et S. Shavell (dir.), Handbook of Law and Economics, Vol. 1 : Elsevier, Amsterdam.
- SpranziZuber, M. (2001), « Rhétorique, dialectique et probabilité au XVIe siècle », Revue de synthèse, 4 : 297-317.
- Taruffo, M. (2003), « Rethinking the Standards of Proof », American Journal of Comparative Law, 51 : 659-677.
- Tullock, G. (1975), « On the Efficient Organization of Trials », Kyklos, 28 : 745-762.
- Welsh, S. (2003), Responsabilité médicale, 2e éd., Litec, Paris.