Articles

Identification partielle : méthodes et conséquences pour les applications empiriques[Record]

  • Thierry Magnac

…more information

La démarche empirique (en économie et ailleurs) est une démarche interprétative puisque les données économiques observationnelles ou expérimentales ne sont pas interprétables de façon brute. On interprète ces données très couramment de façon implicite, ou plus rarement de façon explicite, en utilisant des modèles économiques. Ces modèles, qu’ils soient sous forme structurelle ou réduite, sont écrits en fonction de paramètres qui peuvent inclure de façon générale des paramètres fonctionnels comme des distributions de termes d’hétérogénéité inobservable des agents. Dans la plupart des cas, seul un sous-ensemble de ces paramètres est interprétable économiquement et constitue les paramètres dits d’intérêt. Au niveau abstrait d’une population de taille infinie dans laquelle sont tirés les échantillons de travail, les données sont décrites sous forme réduite par des fonctions de répartition des variables économiques, ces variables étant choisies par l’économétre appliqué. La démarche d’identification consiste alors en la mise en relation de ces fonctions de répartition avec celles qui sont construites à l’aide des modèles structurels pour en déduire les valeurs des paramètres d’intérêt. Si cette relation est univoque, on dit que les paramètres sont identifiés ponctuellement et c’est cette présentation qu’on trouve dans les manuels avancés d’économétrie (par exemple Greene, 2008). L’importance de cette notion d’identification s’est vue remise en cause dans les 20 dernières années par Manski et ses coauteurs (1989 et années subséquentes) dans des modèles de traitements, de sélection ou de censure et cette remise en cause a donné lieu à une littérature qui s’amplifie dans les années récentes. Des travaux précurseurs sur l’identification ensembliste ou partielle avaient été développés dès Gini (1921) et Frisch (1934) pour le modèle de régression simple à erreurs de mesure, Marschak et Andrews (1944) pour les modèles à équations simultanées, Hoeffding (1943) et Fréchet (1955) pour les bornes sur les distributions jointes de variables dont seules les distributions marginales sont observables (dans deux enquêtes différentes par exemple) et par Klepper et Leamer (1984) et Leamer (1987), par exemple pour le modèle de régression multiple à erreurs de mesure sur toutes les variables. Ces travaux étaient restés peu connus et peu utilisés jusqu’aux travaux menés par Manski et que lui-même a repris dans un livre (Manski, 2003) ou plus brièvement dans un article dont la citation en exergue de cette revue est extraite. De nombreux étudiants de Manski contribueront à développer cette littérature et parmi eux, Elie Tamer et Francesca Molinari pour ne citer qu’eux (par exemple la revue de Tamer, 2010, et l’article fondateur de Beresteanu, Molinari et Molchanov, 2011). Le raisonnement général qui mène à l’identification partielle part de la notion d’incomplétude des données ou des modèles. En premier lieu, les données peuvent être incomplètes à cause de mécanismes de censure, de l’utilisation de deux bases de données différentes ou de deux états exclusifs. Pour l’évaluation de politiques publiques, les données observationnelles sont incomplètes puisque les individus ne peuvent jamais être observés simultanément en traitement et hors du traitement. Les modèles structurels peuvent aussi être incomplets s’ils ne spécifient pas de solutions univoques. Un exemple classique de ce cas de figure est fourni par les équilibres multiples dans les jeux (Tamer, 2003, par exemple). Le modèle économique ne spécifie pas quel est le mécanisme de sélection (stochastique ou non) du seul équilibre observé dans les données. La façon de procéder la plus commune dans la littérature appliquée est de faire des hypothèses pour compléter les données ou pour rendre complets les modèles car par construction, leurs paramètres deviennent alors identifiables ponctuellement. Par exemple, on spécifiera des variables latentes complémentaires ou leurs distributions, pour compléter les données comme dans les modèles de …

Appendices