La démarche empirique (en économie et ailleurs) est une démarche interprétative puisque les données économiques observationnelles ou expérimentales ne sont pas interprétables de façon brute. On interprète ces données très couramment de façon implicite, ou plus rarement de façon explicite, en utilisant des modèles économiques. Ces modèles, qu’ils soient sous forme structurelle ou réduite, sont écrits en fonction de paramètres qui peuvent inclure de façon générale des paramètres fonctionnels comme des distributions de termes d’hétérogénéité inobservable des agents. Dans la plupart des cas, seul un sous-ensemble de ces paramètres est interprétable économiquement et constitue les paramètres dits d’intérêt. Au niveau abstrait d’une population de taille infinie dans laquelle sont tirés les échantillons de travail, les données sont décrites sous forme réduite par des fonctions de répartition des variables économiques, ces variables étant choisies par l’économétre appliqué. La démarche d’identification consiste alors en la mise en relation de ces fonctions de répartition avec celles qui sont construites à l’aide des modèles structurels pour en déduire les valeurs des paramètres d’intérêt. Si cette relation est univoque, on dit que les paramètres sont identifiés ponctuellement et c’est cette présentation qu’on trouve dans les manuels avancés d’économétrie (par exemple Greene, 2008). L’importance de cette notion d’identification s’est vue remise en cause dans les 20 dernières années par Manski et ses coauteurs (1989 et années subséquentes) dans des modèles de traitements, de sélection ou de censure et cette remise en cause a donné lieu à une littérature qui s’amplifie dans les années récentes. Des travaux précurseurs sur l’identification ensembliste ou partielle avaient été développés dès Gini (1921) et Frisch (1934) pour le modèle de régression simple à erreurs de mesure, Marschak et Andrews (1944) pour les modèles à équations simultanées, Hoeffding (1943) et Fréchet (1955) pour les bornes sur les distributions jointes de variables dont seules les distributions marginales sont observables (dans deux enquêtes différentes par exemple) et par Klepper et Leamer (1984) et Leamer (1987), par exemple pour le modèle de régression multiple à erreurs de mesure sur toutes les variables. Ces travaux étaient restés peu connus et peu utilisés jusqu’aux travaux menés par Manski et que lui-même a repris dans un livre (Manski, 2003) ou plus brièvement dans un article dont la citation en exergue de cette revue est extraite. De nombreux étudiants de Manski contribueront à développer cette littérature et parmi eux, Elie Tamer et Francesca Molinari pour ne citer qu’eux (par exemple la revue de Tamer, 2010, et l’article fondateur de Beresteanu, Molinari et Molchanov, 2011). Le raisonnement général qui mène à l’identification partielle part de la notion d’incomplétude des données ou des modèles. En premier lieu, les données peuvent être incomplètes à cause de mécanismes de censure, de l’utilisation de deux bases de données différentes ou de deux états exclusifs. Pour l’évaluation de politiques publiques, les données observationnelles sont incomplètes puisque les individus ne peuvent jamais être observés simultanément en traitement et hors du traitement. Les modèles structurels peuvent aussi être incomplets s’ils ne spécifient pas de solutions univoques. Un exemple classique de ce cas de figure est fourni par les équilibres multiples dans les jeux (Tamer, 2003, par exemple). Le modèle économique ne spécifie pas quel est le mécanisme de sélection (stochastique ou non) du seul équilibre observé dans les données. La façon de procéder la plus commune dans la littérature appliquée est de faire des hypothèses pour compléter les données ou pour rendre complets les modèles car par construction, leurs paramètres deviennent alors identifiables ponctuellement. Par exemple, on spécifiera des variables latentes complémentaires ou leurs distributions, pour compléter les données comme dans les modèles de …
Appendices
Bibliographie
- Andrews, D.W.K et P.J. Barwick (2012), « Inference for Parameters Defined by Moment Inequalities : A Recommended Moment Selection Procedure », Econometrica, 80(6) : 2805-2826.
- Andrews, D.W.K. et P. Guggenberger (2009), « Validity of Subsampling and Plug-in Asymptotic Inference for Parameters Defined by Moment Inequalities », Econometric Theory, 25(3) : 669-709.
- Andrews, D.W.K. et P. Guggenberger (2010), « Assymptotic Size and a Problem with Subsampling and with the m out of n Bootstrap », Econometric Theory, 26(02) : 426 – 468.
- Andrews, D.W.K et X. Shi (2013), « Inference Based on Conditional Moment Inequalities », Econometrica, 81(2) : 609-666.
- Andrews, D.W.K et G. Soares (2010), « Inference for Parameters Defined by Moment Inequalities Using Generalized Moment Selection », Econometrica, 78(1) : 119-157
- Armstrong, T.B. (2011), « Asymptotically Exact Inference in Conditional Moment Inequality Models », unpublished manuscript.
- Beresteanu, A. et F. Molinari (2008), « Asymptotic Properties for a Class of Partially Identified Models », Econometrica, 76(4) : 763-814.
- Beresteanu, A., I. Molchanov et F. Molinari (2011), « Sharp Identification Regions in Models with Convex Moment Predictions », Econometrica, 79(6) : 1785-1821.
- Beresteanu, A., I. Molchanov et F. Molinari (2012), « Partial Identification Using Random Set Theory », Journal of Econometrics, 166(1) : 17-32.
- Blundell, R.W., A. Gosling, H. Ichimura et C. Meghir (2007), « Changes in the Distribution of Male and Female Wages Accounting for Employment Composition Using Bounds », Econometrica, 75(2) : 323-363.
- Bollinger, C.R. (1996), « Bounding Mean Regressions when a Binary Regressor is Mismeasured », Journal of Econometrics, 73(2) : 387-399.
- Bontemps, C., T. Magnac et E. Maurin (2012), « Set Identified Linear Models », Econometrica, 80(3) : 1129-1155.
- Bugni, F. (2010), « Bootstrap Inference in Partially Identified Models Defined by Moment Inequalities », Econometrica, 78(2) : 735-754.
- Canay, I. (2010), « EL Inference for Partially Identified Models : Large Deviations Optimality and Bootstrap Validity », Journal of Econometrics, 156(2) : 408-425.
- Chernozhukov, V., H. Hong et E. Tamer (2007), « Inference on Parameter Sets in Econometric Models », Econometrica, 75(5) : 1243-1284.
- Chernozhukov, V., S. Lee et A.M. Rosen (2013), « Intersection Bounds : Estimation and Inference », Econometrica, 81(2) : 667-737.
- Chesher, A. (2005), « Non Parametric Identification under Discrete Variation », Econometrica, 73(5) : 1525-1550.
- Chesher, A. (2010), « Instrumental Variable Models for Discrete Outcomes », Econometrica, 78(2) : 575-601.
- Chesher, A. et A. Rosen (2013), « Generalized Instrumental Variable Models », unpublished.
- Chesher, A. et K. Smolinski (2012), « IV models of Ordered Choice », Journal of Econometrics, 166(1) : 33-48.
- Ciliberto, F. et E. Tamer (2009), « Market Structure and Multiple Equilibria in Airline Markets », Econometrica, 77(6) : 1791-1828.
- Conley T., C. Hansen. et P. Rossi (2012), « Plausibly Exogenous », The Review of Economic and Statistics, 94(1) : 260-272.
- Davezies, L. et X. d’Haultfoeuille (2012), « Partial Identification with Missing Outcomes », preprint.
- Erickson, T. (1993), « Restricting Regression Slopes in the Errors in Variables Model by Bounding the Error Correlation », Econometrica, 61 : 959-969.
- Fan, Y. et S. Park (2010), « Sharp Bounds on the Distribution of the Treatment Effects and Their Statistical Inference », Econometric Theory, 26(3) : 931-951.
- Fan, Y. et J. Wu (2010), « Partial Identification of the Distribution of Treatment Effects in Switching Regimes Models and its Confidence Sets », Review of Economic Studies, 77(3) : 1002-1041
- Fréchet, M. (1951), « Sur les tableaux de corrélation dont les marges sont données », Annales de l’Université de Lyon, III° Série Sci. A : 53-77.
- Frisch, R. (1934), Statistical Confluence Analysis by Means of Complete Regression Systems, Oslo, Norway : University Institute of Economics.
- Galichon, A., et M. Henry (2009), « A Test of Non-Identifying Restrictions and Confidence Regions for Partially Identified Parameters », Journal of Econometrics, 152(2) : 186-196.
- Galichon, A. et M. Henry (2011), « Set Identification in Models with Multiple Equilibria », Review of Economic Studies, 78(4) : 1264-1298.
- Galichon, A. et M. Henry (2013), « Dilatation Bootstrap : A Methodology for Constructing Confidence Regions with Partially Identified Models », Journal of Econometrics, forthcoming.
- Gini, C. (1921), « Sull’interpoliazone di una retta quando i valori della variabile indipendente sono affetti da errori accidentali », Metroeconomica, 1(1) : 63-82.
- Gomez, F. et D. Pacini (2013), « Measuring Inequality from Contaminated Data », preprint Bristol U.
- Gouriéroux, C., J.J. Laffont et A. Monfort (1980), « Coherency Conditions in Simultaneous Linear Equation Models with Endogenous Switching Regime’s », Econometrica, 48 : 675-95.
- Greene, W.H. (2008), Econometric Analysis, Prentice Hall, 7th Edition.
- Haile, P. et E. Tamer (2003), « Inference with an Incomplete Model of English Auctions », Journal of Political Economy, 111(1) : 1-51.
- Heckman, J.J (1978), « Dummy Endogenous Variables in a Simultaneous Equation System », Econometrica, 46 : 931-960.
- Henry, M., R. Meango et M. Queyranne (2013), « Combinatorial Bootstrap Inference in Partially Identified Incomplete Structural Models », unpublished manuscript.
- Henry, M. et I. Mourifié (2012), « Set Coverage and Robust Policy », Economics Letters, 115(2) : 256-257.
- Hoeffding, W. (1940), « Masstabinvariante Korrelationstheorie », Shriften des Mathematischen Instituts und des Instituts für Angewandte Mathematik der Universität Berlin, 5(3) : 179-233.
- Honoré, B. et A. Lleras-Muney (2006), « Bounds in Competing Risks Models and the War on Cancer », Econometrica, 74(6) : 1675-1698.
- Horowitz, J.L. et C.F. Manski (1995), « Identification and Robustness with Contaminated and Corrupted Data », Econometrica, 63(6) : 281-302.
- Hotz, V. J., C. H. Mullin, et S. G. Sanders (1997), « Bounding Causal Effects using Data from a Contaminated Natural Experiment : Analysing the Effects of Teenage Childbearing », The Review of Economic Studies, 64(4) : 575-603.
- Imbens, G. et C.F., Manski (2004), « Confidence Intervals for Partially Identified Parameters », Econometrica, 72(6) : 1845-1859.
- Kaido, H. et A. Santos (2011), « Asymptotically Efficient Estimation of Models Defined by Convex Moment Inequalities », preprint.
- Klepper S. et E. E. Leamer (1984), « Consistent Sets of Estimates for Regressions with Errors in all Variables », Econometrica, 52 : 163-183.
- Leamer, E.E. (1987), « Errors in Variables in Linear Systems », Econometrica, 55(4) : 893-909.
- Lee, D.S. (2009), « Training, Wages, and Sample Selection : Estimating Sharp Bounds on Treatment Effects », Review of Economic Studies, 76(3) : 1071-1102.
- Magnac, T. et E. Maurin (2008), « Partial Identification in Monotone Binary Models : Discrete Regressors and Interval Data », Review of Economic Studies, 75(3) : 835-864.
- Manski, C.F. (1989), « Anatomy of the Selection Problem », Journal of Human Resources, 24(3) : 343-360.
- Manski, C.F. (2003), Partial Identification of Probability Distributions, Springer-Verlag : Berlin.
- Manski, C.F. (2005), « Partial Identification in Econometrics »,New Palgrave Dictionary of Economics.
- Manski, C.F. et J.V. Pepper (2000), « Monotone Instrumental Variables : With an Application to the Returns to Schooling », Econometrica, 68(4) : 997-1010.
- Manski, C.F. et J.V. Pepper (2013), « Deterrence and the Death Penalty : Partial Identification Analysis Using Repeated Cross Sections », Journal of Quantitative Criminology, 29(1) : 123-141.
- Manski, C.F. et E. Tamer (2002), « Inference on Regressions with Interval Data on a Regressor or Outcome », Econometrica, 70(2) : 519-546.
- Marschak, J. et W.H. Andrews (1944), « Random Simultaneous Equations and the Theory of Production », Econometrica, 12 : 143-205.
- McFadden, D. (1994), « Contingent Valuation and Social Choice », American Journal of Agricultural Economics, 76(4) : 689-708.
- Menzel, K. (2008), « Estimation and Inference with many Moment Inequalities », Preprint, Massachussetts Institute of Technology.
- Nevo, A. et A. M. Rosen (2012), « Identification with Imperfect Instruments », Review of Economics and Statistics, 94(3) : 659-671.
- Pakes, A. (2010), « Alternative Models for Moment Inequalities », Econometrica, 78(6) : 1783-1822.
- Pakes, A., J. Porter, K. Ho et J. Ishii (2006), « Moment Inequalities and Their Applications », working paper.
- Ponomareva, M. (2010), « Inference in Models Defined by Conditional Moment Inequalities with Continuous Covariates », Unpublished manuscript, Department of Economics, University of Western Ontario.
- Ponomareva, M. et E. Tamer (2011), « Misspecification in Moment Inequality Models : Back to Moment Equalities », Econometrics Journal, 14(2) : 186-203.
- Popper, K. (2005), The Logic of Scientific Discovery, London and New York : Routledge/Taylor & Francis.
- Ridder, G. E. et R. Moffitt (2007), « The Econometrics of Data Combination », in Heckman, J.J. et E. E. Leamer (éds), Handbook of Econometrics, vol. 6, North-Holland, Amsterdam, chap. 75.
- Rockafellar, R.T. (1970), Convex Analysis, Princeton University Press : Princeton.
- Romano, J.P. et A.M. Shaikh (2008), « Inference for Identifiable Parameters in Partially Identified Econometric Models », Journal of Statistical Planning and Inference, 138(9) : 2786-2807.
- Romano, J.P. et A.M. Shaikh (2010), « Inference for the Identified Set in Partially Identified Econometric Models », Econometrica, 78(1), 169-211.
- Romano, J.P., A.M. Shaikh et M. Wolf (2012), « A Simple Two-step Method for Testing Moment Inequalities with an Application to Inference in Partially Identified Models », available at SSRN 2137550.
- Rosen, A.M. (2008), « Confidence Sets for Partially Identified Parameters that Satisfy a Finite Number of Moment Inequalities », Journal of Econometrics, 146(1) : 107-117.
- Rothenberg, T. J. (1971), « Identification in Parametric Models », Econometrica, 39 : 577-591.
- Stoye, J. (2007), « Bounds on Generalized Linear Predictors with Incomplete Outcome Data », Reliable Computing, 13(3) : 293-302.
- Stoye, J. (2009), « More on Confidence Intervals for Partially Identified Parameters », Econometrica, 77(4) : 1299-1315.
- Tamer, E. (2003), « Incomplete Simultaneous Discrete Response Model with Multiple Equilibria », The Review of Economic Studies, 70(1) : 147-165.
- Tamer, E. (2010), « Partial Identification in Econometrics », Annual Review of Economics, 2 : 167-195