Abstracts
Résumé
Cet article présente les estimations de la relation brevets-recherche et développement (R&D) au niveau des régions françaises sur la période 1991-1996, en utilisant un modèle à erreurs composées avec dépendance spatiale. L’approche analytique prend en compte les effets des externalités spatiales des activités de recherche causées par la proximité technologique ou géographique des régions. Le modèle est estimé par le maximum de vraisemblance. Les résultats empiriques montrent une influence significative des dépenses de R&D sur l’activité des dépôts de brevets affectés aux régions. Les externalités technologiques sont positives mais leur signification dépend du caractère fixe ou aléatoire des effets régionaux. Par contre, les externalités géographiques demeurent absentes.
Abstract
This paper presents estimates of the patents-R&D relationship across French regions over the period 1991-1996, using an error component model with spatial dependence. The theoretical framework examines the spatial spillovers effects which can be caused by the technological or geographical proximity of regions. The model is estimated by Maximum Likelihood. The empirical results indicate a significant impact of R&D expenditures upon the patenting activity at the regional level. The technological spillover is positive but its statistical significance depends on whether the regional effects are fixed or random. On the other hand, there is no evidence of geographical spillover.
Article body
Introduction
L’influence significative des dépenses en recherche et développement (R&D) sur les activités technologiques des firmes mesurées par les brevets a été largement mise en évidence dans la littérature (Hausman et alii, 1984; Crépon et Duguet, 1994, 1997; Licht et Zoz, 1998). Les différences entre ces travaux résident dans la nature des données utilisées, le type de modélisation mis en oeuvre ou les méthodes d’estimation. Dans cet article, nous considérons l’estimation de la relation brevets-R&D au niveau régional.
Dans la littérature, une extension de la modélisation de la relation brevets-R&D au niveau de la firme a consisté à incorporer dans les spécifications des variables captant les externalités ou les effets de débordement technologique. Plusieurs approches ont été proposées pour formaliser ces effets qu’on peut regrouper en deux catégories selon que les dépenses de R&D des autres firmes sont pondérées ou non (cf. Mohnen, 1991 ou Griliches, 1992, pour une revue de la littérature). Un résultat important que font ressortir ces travaux réside dans le rôle joué par la proximité technologique dans les capacités innovatrices des firmes (Jaffe, 1986; 1989). De la même manière, un autre concept a émergé mettant en évidence l’influence inégale de la proximité géographique, notamment entre universités et industries (Jaffe, 1989). Cependant, les travaux sur les effets de débordement spatiaux demeurent peu nombreux et on peut se référer aux travaux de Acs et alii, (1991; 1994), Jaffe et alii, (1993), Cincera, (1997). Il faut noter que dans la majorité de ces études, la notion de proximité géographique est prise dans le sens d’une concentration des activités technologiques des différents acteurs de l’innovation dans un même espace géographique (cf. Audretsch et Feldman, 1996)[1].
Nous considérons dans ce travail une approche des externalités qui repose sur les notions de proximité technologique et géographique entre unités spatiales. La proximité technologique est définie en fonction de la structure des dépôts de brevets affectés aux régions dans les différentes sections de la CIB (Classification Internationale des Brevets). La proximité géographique repose sur la notion de contiguïté : deux unités spatiales qui ont une frontière commune sont considérées comme contiguës. La structure spatiale peut ainsi être exprimée formellement dans une matrice utilisée pour définir les externalités spatiales des activités de recherche causées par les différents types de proximité entre régions (cf. Anselin, 1988 : 17). Les effets spatiaux peuvent être incorporés dans un modèle linéaire de régression de plusieurs manières (cf. Blommestein, 1983; Anselin, 1988 : 35-39; Florax et Folmer, 1992). Une première façon, couramment utilisée, consiste à considérer un modèle où les termes d’erreur sont spatialement corrélés. C’est l’approche adoptée par Baltagi et Li (1999) dans le cadre d’un modèle à erreurs composées. Une autre manière consiste à spécifier un modèle spatial autorégressif[2]. Enfin, on peut tenir compte explicitement des externalités en incorporant directement dans le modèle des variables explicatives spatiales.
Dans ce papier, nous analysons la relation brevets-R&D en tenant compte des trois formes précitées de dépendance spatiale des activités technologiques régionales. La spécification retenue est linéaire en logarithme. Un terme d’hétérogénéité régionale est pris en compte dans le modèle. Il capte les disparités non observées entre les régions qui peuvent affecter leur activité inventive. L’application empirique considère les caractéristiques technologiques de 21 régions françaises observées entre 1991 et 1996. Les données régionalisées de brevets européens (EPAT) et de dépenses de R&D (privées et publiques)[3] sont obtenues d’Eurostat. Les données sur les brevets sont relatives à la base de données de l’OEB (Office Européen des Brevets) et sont repérées selon l’adresse de l’inventeur. La démarche qui consiste à affecter les brevets aux régions qui ont inventé et non pas aux régions qui ont déposé le brevet permet ainsi mieux de décrire la capacité régionale d’innovation (cf. Le Bas et Pavitt, 2000).
Les résultats auxquels nous aboutissons indiquent un impact significatif des dépenses de R&D sur le nombre de brevets affectés aux régions : les élasticités estimées se situent entre 0,30 et 0,46 selon le modèle. Les tests de spécification concluent à l’existence d’effets régionaux et à leur caractère aléatoire. Les estimations des coefficients autorégressifs et d’autocorrélation spatiale sont positives. Cependant, elles ne sont significatives que dans le cadre des spécifications à effets fixes et sous l’hypothèse d’une proximité technologique des activités de recherche. La prise en compte directe des dépenses de R&D des autres régions indique des externalités positives et significatives quelle que soit la spécification considérée. Par contre, les externalités géographiques demeurent faibles et non significatives. Nos résultats suggèrent donc que les capacités inventives des régions ne sont pas indépendantes de celles des régions dont les structures technologiques sont proches. La proximité géographique semble ne pas jouer un rôle déterminant dans les capacités innovatrices régionales. Ainsi, nos résultats suggèrent que les externalités technologiques ne sont majoritairement liées à des externalités géographiques que dans certains types de systèmes régionaux d’innovation. La France est sans doute moins souvent caractérisée par la présence fréquente de tels milieux innovatifs que d’autres pays. Elle a par contre une longue tradition de système national d’innovation (cf. Nonn et Héraud, 1995).
L’article s’organise de la manière suivante. Dans la deuxième section, nous présenterons le modèle et discuterons la méthode d’estimation. Les développements techniques des différentes spécifications à estimer seront exposés en annexe. Nous examinerons les résultats empiriques dans la troisième section. Nous résumerons en conclusion les principaux résultats et formulerons des suggestions pour des travaux futurs.
1. Le modèle
Considérons le modèle à erreurs composées (EC) suivant :
où Yit est un vecteur de dimension NT × 1, i dénote la région et t la période, Xit est un vecteur k × 1 d’observations relatives aux k variables explicatives et β est un vecteur de paramètres de dimension k × 1. μi est un vecteur de dimension N × 1 d’effets spécifiques régionaux. Le vecteur NT × 1 des termes d’erreur εit, de moyenne nulle et de variance σ2ε, est supposé normal, εit ~ N(0, σ2ε). Les εit sont supposés indépendants des effets μi et des variables explicatives du modèle.
Une première formulation de la dépendance spatiale est la spécification d’un modèle spatial autorégressif d’ordre 1 (cf. Florax et Folmer, 1992). Si l’on considère un empilement des T observations relatives à chacune des régions, le modèle à erreurs composées avec dépendance spatiale (EC-DS-var_Y) peut s’écrire sous la forme matricielle suivante :
où Z = (IN ⊗ ιT) est une matrice de dimension NT × N de variables indicatrices régionales, ιT est un vecteur des 1 de dimension T × 1 et IN est la matrice identité d’ordre N. Le signe ⊗ désigne le produit kronecker. M = (CN ⊗ IT) où CN est la matrice de poids spatiaux de dimension N × N. Les coefficients de la diagonale sont égaux à 0 alors que ceux en dehors de la diagonale renseignent sur la manière dont deux régions sont connectées. En général, les lignes de la matrice sont normalisées de sorte que la somme des éléments de chaque ligne est égale à 1 (cf. Anselin et Hudak, 1992). ρ désigne le coefficient autorégressif spatial. Il capte les effets des externalités spatiales des activités technologiques.
Une seconde formulation de la dépendance spatiale suppose que les termes d’erreur dans (1) εit sont spatialement autocorrélés (EC-AS) (cf. Florax et Folmer, 1992; Baltagi et Li, 1999) :
où λ désigne le coefficient d’autocorrélation spatiale. Il capte les effets des variables spatiales omises dans le modèle. Le vecteur NT × 1 des termes d’erreur vit est supposé normal, vit ~ N(0, σ2v). Les vit sont supposés également indépendants des effets μi et des variables explicatives du modèle.
Enfin, une dernière formulation de la dépendance spatiale consiste à incorporer dans le modèle les variables exogènes spatiales (EC-DS-var_X) :
où ηit ~ N(0, σ2η). Suivant la structure de la matrice des poids spatiaux CN, nous retrouvons avec l’équation (4) les formulations classiques des externalités des activités technologiques au niveau de la firme. En particulier, Jaffe (1986) considère que les coefficients de la matrice CN représentent la corrélation non centrée entre les vecteurs fi et fj de la position technologique respectivement des firmes i et j (cf. l’annexe B).
L’application des méthodes des moindres carrés ordinaires (MCO) ou généralisés (MCG) dans l’estimation des modèles avec dépendance spatiale conduit à des estimateurs biaisés et non convergents (cf. Dubin, 1988; Florax et Folmer, 1992). Une procédure d’estimation appropriée est la méthode du maximum de vraisemblance (MV) (Anselin, 1988 : 57-59)[4]. Dans ce cadre, la structure de la matrice Ω de variance conditionnelle de Y sachant X (cf. l’annexe A pour les développements des différentes spécifications à estimer) dépend des hypothèses sur l’existence des effets spécifiques régionaux, H10 : σ2μ = 0, et la nature de ces effets qui peuvent être aléatoires (hypothèse d’indépendance), H20 : E(μi / Xit) = 0, ou fixes H2a : E(μi / Xit) ≠ 0[5].
L’estimation des modèles avec dépendance spatiale par la méthode du maximum de vraisemblance nécessite une optimisation non linéaire et implique des calculs numériques d’autant plus lourds et plus longs que le nombre d’observations est important. En particulier, une des difficultés d’application de la méthode MV réside dans le calcul du déterminant de la matrice des variances Ω. Une alternative proposée par Ord (1975) repose sur les valeurs propres de la matrice de connectivité. Ainsi,
où les ωi désignent les valeurs propres de la matrice CN et α = {ρ, λ}. L’identité (5) implique que les valeurs des coefficients de dépendance spatiale doivent satisfaire la condition ω-1min ≤ α ≤ ω-1max où ωmax = 1 dans le cas des matrices de connectivité normalisées. L’avantage de cette procédure est qu’on peut déterminer les valeurs propres de ces matrices avant l’optimisation (puisque CN est supposée connue). Ceci réduit considérablement le calcul numérique de la vraisemblance du modèle, au moins dans le cas des petits échantillons. En effet, la détermination des valeurs propres s’avère délicate dès que la taille de l’échantillon devient importante (cf. Kelejian et Prucha, 1998; 1999).
Les tests de dépendance spatiale ont fait l’objet de nombreux développements. La statistique de Moran est le test le plus utilisé dans la détection de l’autocorrélation spatiale (cf. Anselin et Florax, 1995). D’autres alternatives ont été proposées et sont basées en majorité sur le test LM (le test du multiplicateur de Lagrange). Cependant, il s’agit de tests asymptotiques et leurs propriétés ne sont pas connues dans le cas des petits échantillons (cf. Anselin et alii, 1996). Nous considérons dans cette étude pour les tests d’hypothèse de la dépendance spatiale (H30 : α = 0) la statistique LR (test du rapport de vraisemblance).
2. Application : estimation de la relation brevets-R&D au niveau régional
2.1 Cadre statistique
Les caractéristiques technologiques de 21 régions françaises sont analysées à travers les dépôts de brevets dans le système européen EPAT (European Patent) et les dépenses de R&D (publiques et privées) en euros à prix constants 1990 sur la période 1991-1996. Pour contrôler l’effet taille des régions, les dépôts de brevets et les dépenses de R&D sont rapportés au niveau de l’emploi dans les régions, mesuré en milliers d’effectifs.
Les régions Île-de-France, Rhône-Alpes et Alsace occupent respectivement les trois premières places en nombre de dépôts de brevets par millier d’effectifs employés (cf. le tableau 1). Le Limousin présente la densité la plus faible avec 0,08 brevets par millier d’effectifs. En matière de dépenses de R&D, Île-de-France, Midi-Pyrénées, Provence-Alpes-Côte d’Azur (PACA) et Rhône-Alpes arrivent respectivement en tête, alors que l’Alsace, troisième région en matière de dépôts, est reléguée à la 12e place avec 470 euros par employé.
La matrice de connectivité CN est définie à partir des indicateurs de distance technologique et de contiguïté. Dans le premier cas, les coefficients cij de la matrice sont calculés à partir de la structure des dépôts de brevets affectés aux différentes régions dans les huit sections de la CIB[6]. En particulier, les coefficients cij sont égaux à d-1ij pour i ≠ j et 0 sinon. dij représente la distance pondérée entre deux régions i et j définie par la formule suivante (cf. Archibugi et Pianta, 1992 : 132) :
où fih et fjh désignent respectivement les proportions en pourcentage de brevets classés dans le domaine h respectivement des régions i et j. fnh est la proportion des dépôts de l’ensemble des régions dans le domaine h. En pratique, comme nous avons constaté que les distances sont restées stables sur la période 1991-1996, nous avons considéré la distance moyenne sur cette période. Par comparaison, l’indicateur que nous utilisons donne quasiment les mêmes résultats que le coefficient de corrélation non centré suggéré par Jaffe (1986) (cf. l’annexe B).
L’indicateur de distance fait ressortir le Centre, la Bretagne et le Languedoc-Roussillon comme les régions présentant les activités technologiques les plus éloignées de celles des autres régions : somme des distances technologiques les plus élevées (cf. le tableau 1). À l’opposé, la structure des activités technologiques de la Bourgogne est la moins différenciée.
Dans le deuxième cas, les coefficients cij de la matrice CN sont égaux à 1 si les régions i et j sont contiguës et 0 sinon. Ainsi, la région Centre présente le nombre le plus élevé de connexions avec huit voisins immédiats alors que les régions Alsace, Bretagne, Nord-Pas-de-Calais et Provence-Alpes-Côte d’Azur (PACA) ne sont contiguës qu’à deux voisins au plus (cf. le tableau 1). Cet indicateur peut être redéfini en tenant compte de la proximité des activités technologiques en supposant que l’intensité des interactions ne peut être identique entre les régions dont les structures technologiques sont très différenciées. En particulier,
où gij = 1 si les régions i et j sont contiguës et 0 sinon.
2.2 Résultats d’estimation
Les résultats d’estimation du modèle à erreurs composées tenant compte des externalités technologiques et géographiques sont présentés respectivement dans les tableaux 2 et 3. Considérons dans un premier temps les résultats du tableau 2. Les colonnes 2 et 3 correspondent aux estimations sans prise en compte de la dépendance spatiale. Les résultats obtenus montrent que la relation brevets-R&D au niveau des régions françaises est significative. L’élasticité des dépôts par rapport aux dépenses de R&D est estimée à 0,43 dans le cadre du modèle à effets fixes et à 0,46 dans le cas du modèle à effets aléatoires. Le test LM amène à accepter l’hypothèse d’existence des effets spécifiques régionaux (rejet de H10 : σ2μ = 0). Le test de spécification d’Hausman indique une absence de corrélation entre les effets et la variable explicative du modèle (l’hypothèse H2a : E(μi / Xit) = 0 n’est pas rejetée). Dans ce cadre, les estimateurs du modèle à effets aléatoires sont convergents (Mundlak, 1978). Pour situer nos résultats par rapport à ceux obtenus au niveau de la firme[7], les coefficients estimés de R&D dans la dimension intra ou avec indicatrices individuelles sont de l’ordre de 0,27-0,28 (Crépon et Duguet, 1997), 0,29-0,31 (Cincera, 1997), 0,40 (Jaffe, 1986) et 0,35-0,45 (Hausman et alii, 1984). Les spécifications à effets aléatoires conduisent à des coefficients légèrement plus élevés, de l’ordre de 0,44 (Cincera, 1997) et 0,45-0,52 (Hausman et alii, 1984). Les résultats auxquels nous aboutissons au niveau régional demeurent donc comparables avec ceux obtenus au niveau de la firme.
Les résultats d’estimation du modèle avec autocorrélation spatiale des termes d’erreur[8] sont présentés dans les colonnes 4 et 5. L’estimation du modèle à effets fixes (colonne 4) conduit à une élasticité des dépôts de l’ordre de 0,33. Le coefficient d’autocorrélation spatiale estimé à 0,36 est significatif. Le test LR (colonne 4 contre colonne 2) conclut à l’acceptation de la spécification avec corrélation spatiale.
La recherche du maximum global dans le cadre du modèle à effets aléatoires est menée par balayage sur λ et θ2 = σ2v / (Tσ2μ + σ2v). L’élasticité des dépôts par rapport aux dépenses de R&D et le coefficient d’autocorrélation spatiale sont respectivement de l’ordre de 0,43 et 0,29. Cependant, le test LR (colonne 5 contre colonne 3) amène à accepter l’hypothèse d’absence d’autocorrélation spatiale. Enfin, le test d’Hausman montre que seuls les estimateurs du modèle à effets aléatoires sont à considérer. Ceci nous amène à conclure à l’absence de l’autocorrélation spatiale.
Les estimations du modèle autorégressif (cf. colonnes 6 et 7) conduisent aux mêmes conclusions que le modèle avec corrélation spatiale des termes d’erreur. Elles indiquent des externalités positives des activités technologiques régionales mais elles ne sont significatives que dans le cadre du modèle à effets fixes où le coefficient autorégressif est estimé à 0,37 (cf. colonne 6). La statistique du test de spécification d’Hausman est non significative au seuil d’erreur 5 %. En conséquence, l’hypothèse d’une dépendance spatiale des activités technologiques régionales est rejetée au seuil d’erreur de 5 % dans le cadre du modèle à effets aléatoires (l’estimation indique un seuil de signification de l’ordre de 13 %).
Enfin, les résultats d’estimation du modèle incorporant explicitement les externalités des dépenses de R&D (colonnes 8 et 9) conduisent à des coefficients positifs et significatifs : 0,73 et 0,55 respectivement dans le cadre du modèle à effets fixes et à effets aléatoires. Comme le test de spécification conduit à rejeter l’hypothèse de dépendance entre les effets régionaux et les variables explicatives du modèle, les estimateurs du modèle à effets aléatoires sont donc convergents. Par rapport au modèle autorégressif, ce résultat suggère que les externalités générées par les inputs de l’activité de recherche, en l’occurrence les investissements en R&D, sont plus importantes que celles générées par les outputs (mesurés par les brevets) de la recherche.
L’examen des résultats du tableau 3 indique une absence des externalités géographiques des activités technologiques dans quasiment toutes les spécifications considérées. Hormis les estimations du modèle à effets fixes incorporant les dépenses de R&D des régions contiguës (colonne 6), les coefficients d’autocorrélation et de dépendance spatiales sont très faibles et non significatifs (cf. colonnes 2 à 5). La proximité géographique entre deux espaces semble donc ne pas jouer un rôle déterminant dans leur capacité inventive. Par contre, la proximité technologique apparaît plus prédominante et contributive à accroître la productivité des régions.
Nos résultats reflètent ainsi les spécificités françaises en matière de l’innovation. Un territoire peut être un lieu de création d’éléments importants de savoir et de savoir-faire sans constituer pour autant un système en lui-même. Ainsi, les établissements locaux des grandes institutions de recherche ou d’enseignement supérieur ne sont pas nécessairement les partenaires privilégiés pour répondre à la demande de connaissance ou d’expertise des établissements industriels localisés dans le même territoire ou dans ceux contigus. Le système d’innovation peut « boucler » plus ou moins au niveau national et très peu au niveau d’une région – ce qui n’enlève rien à la pertinence de l’idée de « contexte » régional spécifique. Les externalités technologiques ne sont majoritairement liées à des externalités géographiques que dans certains types de systèmes locaux ou régionaux d’innovation. La France est sans doute moins souvent caractérisée par la présence fréquente de tels milieux innovatifs que d’autres pays. Elle a par contre une longue tradition de système national d’innovation. Diverses études réalisées sur le cas des régions françaises, comme celles analysées dans Nonn et Héraud (1995), ont montré que les réseaux d’innovation des firmes ne sont pas spécifiquement organisés sur une base régionale, mais présentent au contraire une très grande variété d’extensions géographiques différentes selon le type de partenaire ou d’interaction cognitive.
Conclusion
Nous avons présenté dans ce travail une estimation de la relation brevets-R&D au niveau des régions françaises sur la période 1991-1996. La principale contribution de ce papier est d’incorporer les développements méthodologiques en économétrie spatiale dans la spécification et l’estimation d’une telle relation sur données de panel. L’approche analytique considère un modèle à erreurs composées avec et sans dépendance spatiale. Nous avons ainsi examiné les effets des externalités spatiales causées respectivement par la proximité technologique et géographique des activités de recherche régionale.
Les résultats auxquels nous aboutissons montrent une influence significative des dépenses de R&D sur le nombre de brevets déposés par les régions. Les élasticités des dépôts dans le cadre du modèle sans dépendance spatiale sont de l’ordre de 0,43 (effets fixes) et de 0,46 (effets aléatoires). Les résultats des estimations du modèle spatial autorégressif et du modèle à erreurs spatiales autocorrélées indiquent des externalités spatiales positives qui ne sont significatives que dans le cadre du modèle à effets fixes et sous l’hypothèse d’une proximité technologique. Les externalités géographiques demeurent très faibles et non significatives dans les deux modèles. Enfin, l’estimation du modèle incorporant les dépenses de R&D des autres régions conduit à des externalités technologiques positives et significatives dans le cadre des deux spécifications à effets fixes et à effets aléatoires. Les externalités des dépenses de R&D des régions contiguës sont significatives dans le cadre du modèle à effets fixes. Cependant, comme seuls les estimateurs à effets aléatoires sont convergents, nous concluons à l’absence d’externalités géographiques pour les activités de recherche régionale.
Dans un environnement national et européen où le processus de concurrence et/ou de coopération entre régions est appelé à prendre de l’importance, une appréciation plus rigoureuse et approfondie des effets spatiaux s’avère très utile. De nombreux progrès restent à faire pour affiner les résultats obtenus.
Tout d’abord, il serait envisageable de distinguer dans la modélisation la R&D privée de la R&D publique dont l’importance relative peut varier considérablement d’une région à l’autre et suivant leur structure socio-économique. On pourrait envisager également la même procédure pour les brevets. Ensuite, s’agissant de la modélisation proprement dite, des prolongements pourraient être faits sur le sens de la causalité entre les dépenses de R&D et les brevets, et sur la nature de la relation entre ces deux grandeurs. En effet, notre démarche suppose que les brevets (les outputs) sont des indicateurs du résultat de la R&D (les inputs) (cf. Griliches, 1990) et que les deux variables sont dominées par une relation contemporaine (cf. Hall et alii, 1986). Or, Van Ophem et alii (2001) ont montré, sur un échantillon de 460 entreprises néerlandaises observées en 1988 et en 1992, que la causalité à la Granger va des brevets à la R&D. La causalité dans le sens opposé semble s’atténuer dès que les auteurs quittent le cadre d’une distribution de Poisson des données de brevets. Enfin, Il serait très constructif d’étudier la sensibilité des estimations aux différentes mesures de la proximité spatiale (structure du marché, structure industrielle, etc.) et de considérer une influence inégale des activités technologiques régionales (des externalités spatiales asymétriques).
Appendices
Annexes
Annexe A
Spécifications empiriques de la dépendance spatiale sur données de panel
A.1 Spécifications à effets fixes
Dans le cas où les effets spécifiques aux régions μi existent et sont traités comme des paramètres fixes à estimer, la log-vraisemblance du modèle avec dépendance spatiale s’écrit :
où Ω(α, σ2) = σ2(W′(α) W(α))-1 et W(α) = (INT – αM). c0 = –NT 1n(2π) / 2 et ln dénote le logarithme népérien. On déduit le modèle spatial autorégressif (EC-EF-DS-Var_Y) pour α = ρ, σ2 = σ2ε et u = W(ρ) Y – Xβ – Zμ. Si la matrice X contient un vecteur relatif à la constante du modèle β0, les N paramètres μi et β0 ne sont pas identifiables. Pour résoudre cette difficulté, on peut estimer le modèle avec N indicatrices régionales μi et sans constante. Ensuite, en imposant la contrainte , on déduit une estimation respectivement de la constante du modèle et des effets régionaux μi. La spécification à erreurs spatiales autocorrélées (EC-EF-AS) est obtenue en posant α∈=∈λ, σ2 = σ2v et u = W(λ)(Y – Xβ – Zμ). Enfin, pour α∈= 0, σ2 = σ2η et u = Y – Xβ – MXγ – Zμ, on retrouve le modèle avec variables explicatives spatiales (EC-EF-DS-Var_X).
A.2 Spécifications à effets aléatoires
Dans le cas où les effets régionaux μi sont traités comme aléatoires et supposés normaux, μi ~ N(0, σ2μ), la matrice des variances dans le cadre du modèle avec dépendance spatiale (EC-EA-DS-var_Y) présente la structure suivante :
où B = (IN ⊗ T-1ιTι′T) et Q = (INT – B) désignent respectivement les opérateurs between et within de dimension NT ∃ NT et . étant donné les propriétés des opérateurs B et Q (cf. Baltagi, 1995), le déterminant et l’inverse de Ω∈ont respectivement :
Si l’on considère le modèle EC-EA-DS-var_X , la matrice Ω, son déterminant et son inverse sont obtenus en posant σ2ε = σ2η et ρ = 0 (W = INT). Dans le cadre de la spécification à erreurs spatiales autocorrélées (EC-EA-AS), la matrice Ω présente la structure suivante :
où . En appliquant des résultats généraux sur les matrices (cf. Magnus, 1982), on peut montrer que le déterminant et l’inverse de la matrice Ω(.) peuvent s’écrire respectivement (cf. Anselin, 1988 : 153-154) :
où AN = IN – λCN. Comme on ne peut obtenir des expressions simples pour ∣Ω∣ et Ω-1 permettant d’estimer simultanément λ et θ22, la recherche du maximum de vraisemblance dans le cadre du modèle EC-EA-AS peut être menée par balayage sur ces deux paramètres (cf. Baltagi et Li, 1999). Ceci découle du fait que les deux paramètres sont bornés : ∣λ∣ < 1 et θ22 → 1 quand σ2μ → 0 et θ22 → 0 quand σ2μ augmente.
Annexe B
Coefficient de corrélation non centré de Jaffe
Suivant l’approche de Jaffe (1986), les coefficients cij de la matrice de connectivité représentent la corrélation non centrée entre les vecteurs fi = (fi1, ..., fih) et fj = (fj1, ..., fjh) de la position technologique respectivement des régions i et j :
où fih et fjh désignent respectivement les proportions en pourcentage de brevets classés dans le domaine h affectés respectivement aux régions i et j. Les tableaux 4 et 5 ci-dessous présentent respectivement la corrélation non centrée entre les positions technologiques des différentes régions et les estimations du modèle à erreurs composées avec une matrice spatiale captée par les coefficients de corrélation non centrés.
Remerciements
Je tiens à remercier Eurostat et Camire (Luxembourg) pour les données statistiques utilisées dans cette étude. Une première version de ce travail a été présentée au séminaire d’Économétrie, PEGE, Strasbourg. Je remercie François Laisney pour ses remarques et ses commentaires constructifs, Théophile Azomahou, Patrick Cohendet, Agénor Lahatte, Nguyen Van Phu et les deux rapporteurs anonymes de L’Actualité économique pour leurs critiques précieuses qu’ils ont formulées à la lecture du texte. Cependant, je reste seul responsable des erreurs éventuelles.
Notes
-
[1]
La mesure de la coïncidence géographique chez Jaffe (1989) repose justement sur cette notion : la recherche ne peut être innovatrice que si les laboratoires universitaires et les centres privés sont géographiquement concentrés.
-
[2]
On peut notamment considérer une spécification mixte incorporant les deux formes de dépendance spatiales (cf. Florax et Folmer, 1992; Kelejian et Prucha, 1998, 1999).
-
[3]
Il doit être souligné l’importance de la distinction entre les dépenses de R&D privées et publiques du fait que les décisions d’investissement pour ces deux variables sont différentes. Malheureusement, l’analyse de la robustesse de nos résultats quant à cette distinction n’a pas été possible en raison de manque de données régionalisées des dépenses de R&D (et notamment celles des brevets).
-
[4]
D’autres estimateurs convergents peuvent être mis en oeuvre comme la méthode des variables instrumentales (cf. Anselin, 1988 : 81) ou la méthode des moments généralisés (Kelejian et Prucha, 1999). Dans le cadre d’un modèle plus général incorporant les deux formes de dépendance (autocorrélation et hétérogénéité), Kelejian et Prucha (1998) proposent une procédure convergente qui repose sur la méthode des doubles moindres carrés généralisés.
-
[5]
Ces tests peuvent être menés sur la base respectivement du test de Breusch-Pagan (le test du multiplicateur de Lagrange, test LM) et du test de spécification d’Hausman (cf. Baltagi, 1995).
-
[6]
La CIB est un système de classement des inventions. Elle repose sur les critères « application » et « fonction ». Le premier critère est retenu pour une invention lorsque la fonction décrite par cette dernière est spécifique à une activité industrielle et celui de la fonction lorsque l’invention implique plusieurs industries. La CIB présente une structure hiérarchique en plusieurs niveaux : huit sections, cent-dix-huit classes, six cent vingt sous-classes, soixante-six mille groupes et sous-groupes. Les sections considérées sont « Nécessité courantes de la vie », « Techniques industrielles diverses et Transport », « Chimie et Métallurgie », « Textiles et Papier », « Constructions fixes », « Mécanique, éclairage, Chauffage, Armement et Sautage », « Physique » et « électricité ».
-
[7]
Il est très difficile de faire des comparaisons avec un certain degré de précision du fait des différences dans le type de modélisation considéré (les spécifications généralement utilisées reposent sur le modèle de Poisson), la méthode d’estimation ou la nature des données considérées (individuelles et/ou temporelles).
-
[8]
Les applications des méthodes économétriques spatiales se trouvent souvent confrontées au problème de manque de logiciels adaptés. Anselin et Hudak (1992) exposent quelques exemples d’estimation des modèles par la méthode du maximum de vraisemblance et la formulation des tests statistiques de dépendance spatiale dans le cadre de cinq logiciels (Gauss, Splus, Limdep, Shazam et Rats). Nos applications empiriques sont faites sous Rats.
Bibliographie
- Acs, Z.J., D.B. Audretsch et M.P. Feldman (1991), « Real Effects of Academic Research: Comment », The American Economic Review, 82(1) : 363-367.
- Acs, Z.J., D.B. Audretsch et M.P. Feldman (1994), « R&D Spillovers and Recipient Firm Size », The Review of Economics and Statistics, 76(2) : 336-340.
- Anselin, L. (1988), Spatial Econometrics Methods and Models, Dordrecht Kluwer Academic Publishers, West Virginia University.
- Anselin, L. et S. Hudak (1992), « Spatial Econometrics in Practice: A Review of Software Options », Regional Science and Urban Economics, 22 : 509-536.
- Anselin, L. et R. Florax (1995), New Directions in Spatial Econometrics, Springer, New York.
- Anselin, L., A.K. Bera, R. Florax et M.J. Yoon (1996), « Simple Diagnostic Tests for Spatial Dependence », Regional Science and Urban Economics, 26 : 77-104.
- Archibugi, D. et M. Pianta (1992), The Technological Specialization of Advanced Countries, Kluwer Academic Publishers.
- Audretsch, D.B. et M.P. Feldman (1996), « R&D Spillovers and the Geography of Innovation and Production », The American Economic Review, 86(3) : 630- 640.
- Baltagi, H.B. (1995), Econometric Analysis of Panel Data, John Wiley & Sons.
- Baltagi, B.H. et D. Li (1999), « Prediction in the Panel Data Model with Spatial Correlation », à paraître in L. Anselin et R. Florax (éds), Advances in Spatial Econometrics, Springer-Verlag.
- Blommestein, H.J. (1983), « Specification and Estimation of Spatial Econometric Models », Regional Science and Urban Economics, 13 : 251-270.
- Cincera, M. (1997), « Patents, R&D, and Technological Spillovers at the Firm Level: Some Evidence from Econometric Count Models for Panel Data », Journal of Applied Econometrics, 12 : 265-280.
- Crépon, B. et E. Duguet (1994), « Innovation: mesures, rendements et concurrence », Economie et Statistique, 275-276 : 121-134.
- Crépon, B. et E. Duguet (1997), « Estimating the Innovation Function from Patent Numbers: GMM on Count Panel Data », Journal of Applied Econometrics, 12 : 243-263.
- Dubin, R.A. (1988), « Estimation of Regression Coefficients in the Presence of Spatially Autocorrelated Error Terms », The Review of Economics and Statistics, 70 : 466-474.
- Florax, R. et H. Folmer (1992), « Specification and Estimation of Spatial Linear Regression Models: Monte Carlo Evaluation of Pre-Test Estimators », Regional Science and Urban Economics, 22 : 405-432.
- Griliches, Z. (1990), « Patent Statistics as Economic Indicators: A Survey », Journal of Economic Literature, 28(4) : 1 661-1 707.
- Griliches, Z. (1992), « The Search for R&D Spillovers », Scandinavian Journal of Economics, 94 : 29-47.
- Hall, B.H., Z. Griliches et J.A. Hausman (1986), « Patents and R and D: Is There a Lag? », International Economic Review, 27(2) : 265-283.
- Hausman, J.A. (1978), « Specification Tests in Econometrics », Econometrica, 46(1) : 1 251-1 271.
- Hausman, J., B. H. Hall et Z. Griliches (1984), « Econometric Models for Count Data with an Application to the Patents-R&D Relationship », Econometrica, 52(4) : 909-938.
- Jaffe, A.B. (1986), « Technological Opportunity and Spillovers of R&D: Evidence from Firms’ Patents, Profits, and Market Value », The American Economic Review, 76(5) : 984-1 001.
- Jaffe, A.B. (1989), « Real Effects of Academic Research », The American Economic Review, 79(5) : 957-970.
- Jaffe, A.B., M. Trajtenberg et R. Henderson (1993), « Geographic Localization of Knowledge Spillovers as Evidenced by Patent Citations », The Quarterly Journal of Economics, 63(3) : 577-598.
- Kelejian, H.H. et I.R. Prucha (1998), « A Generalized Spatial Two Stage Least Squares Procedure for Estimating a Spatial Autoregressive Model with Autoregressive Disturbances », Journal of Real Estate Finance and Economics, 17(1) : 99-121.
- Kelejian, H.H. et I.R. Prucha (1999), « A Generalized Moments Estimator for the Autoregressive Parameter in a Spatial Model », International Economic Review, 40 : 509-533.
- Le Bas, C. et K. Pavitt (2000), « What do Patents Tell Us about the Rate and Direction of Technical Change? », in S. Allegrezza et H. Serbat (éds), Appropriability and Patent Value. Econometrical Aspects, MacMillan.
- Licht, G. et K. Zoz (1998), « Patents and R&D: An Econometric Investigation Using Applications for German, European and US Patents by German Companies », Annales d’économie et de Statistique, 49/50 : 329-360.
- Magnus, Jan R. (1982), « Multivariate Error Components Analysis of Linear and Nonlinear Regression Models by Maximum Likelihood », Journal of Econometrics, 19 : 239-285.
- Mohnen, P. (1991), « Survol de la littérature sur les externalités technologiques », in J. De Bandt et D. Foray (éds), L’évaluation économique de la recherche et du changement, p. 97-115, CNRS, Paris.
- Mundlak, Y. (1978), « On the Pooling of Time Series and Cross Section Data », Econometrica, 46(1) : 69-85.
- Nonn, H. et J-A. Héraud (1995), Les économies industrielles en France de l’Est. Tissus et réseaux en évolution, Presses Universitaires de Strasbourg.
- Ord, J. (1975), « Estimation Methods for Models of Spatial Interaction », Journal of the American Statistical Association, 70 : 120-126.
- Van Ophem, H., E. Brouwer, A. Kleinknecht et P. Mohnen (2001), « R&D and Patents: Which Way Does the Causality Run? », Cahier CIRANO Série Scientifique, n° 2001s-31.