Article body

Introduction

L’influence significative des dépenses en recherche et développement (R&D) sur les activités technologiques des firmes mesurées par les brevets a été largement mise en évidence dans la littérature (Hausman et alii, 1984; Crépon et Duguet, 1994, 1997; Licht et Zoz, 1998). Les différences entre ces travaux résident dans la nature des données utilisées, le type de modélisation mis en oeuvre ou les méthodes d’estimation. Dans cet article, nous considérons l’estimation de la relation brevets-R&D au niveau régional.

Dans la littérature, une extension de la modélisation de la relation brevets-R&D au niveau de la firme a consisté à incorporer dans les spécifications des variables captant les externalités ou les effets de débordement technologique. Plusieurs approches ont été proposées pour formaliser ces effets qu’on peut regrouper en deux catégories selon que les dépenses de R&D des autres firmes sont pondérées ou non (cf. Mohnen, 1991 ou Griliches, 1992, pour une revue de la littérature). Un résultat important que font ressortir ces travaux réside dans le rôle joué par la proximité technologique dans les capacités innovatrices des firmes (Jaffe, 1986; 1989). De la même manière, un autre concept a émergé mettant en évidence l’influence inégale de la proximité géographique, notamment entre universités et industries (Jaffe, 1989). Cependant, les travaux sur les effets de débordement spatiaux demeurent peu nombreux et on peut se référer aux travaux de Acs et alii, (1991; 1994), Jaffe et alii, (1993), Cincera, (1997). Il faut noter que dans la majorité de ces études, la notion de proximité géographique est prise dans le sens d’une concentration des activités technologiques des différents acteurs de l’innovation dans un même espace géographique (cf. Audretsch et Feldman, 1996)[1].

Nous considérons dans ce travail une approche des externalités qui repose sur les notions de proximité technologique et géographique entre unités spatiales. La proximité technologique est définie en fonction de la structure des dépôts de brevets affectés aux régions dans les différentes sections de la CIB (Classification Internationale des Brevets). La proximité géographique repose sur la notion de contiguïté : deux unités spatiales qui ont une frontière commune sont considérées comme contiguës. La structure spatiale peut ainsi être exprimée formellement dans une matrice utilisée pour définir les externalités spatiales des activités de recherche causées par les différents types de proximité entre régions (cf. Anselin, 1988 : 17). Les effets spatiaux peuvent être incorporés dans un modèle linéaire de régression de plusieurs manières (cf. Blommestein, 1983; Anselin, 1988 : 35-39; Florax et Folmer, 1992). Une première façon, couramment utilisée, consiste à considérer un modèle où les termes d’erreur sont spatialement corrélés. C’est l’approche adoptée par Baltagi et Li (1999) dans le cadre d’un modèle à erreurs composées. Une autre manière consiste à spécifier un modèle spatial autorégressif[2]. Enfin, on peut tenir compte explicitement des externalités en incorporant directement dans le modèle des variables explicatives spatiales.

Dans ce papier, nous analysons la relation brevets-R&D en tenant compte des trois formes précitées de dépendance spatiale des activités technologiques régionales. La spécification retenue est linéaire en logarithme. Un terme d’hétérogénéité régionale est pris en compte dans le modèle. Il capte les disparités non observées entre les régions qui peuvent affecter leur activité inventive. L’application empirique considère les caractéristiques technologiques de 21 régions françaises observées entre 1991 et 1996. Les données régionalisées de brevets européens (EPAT) et de dépenses de R&D (privées et publiques)[3] sont obtenues d’Eurostat. Les données sur les brevets sont relatives à la base de données de l’OEB (Office Européen des Brevets) et sont repérées selon l’adresse de l’inventeur. La démarche qui consiste à affecter les brevets aux régions qui ont inventé et non pas aux régions qui ont déposé le brevet permet ainsi mieux de décrire la capacité régionale d’innovation (cf. Le Bas et Pavitt, 2000).

Les résultats auxquels nous aboutissons indiquent un impact significatif des dépenses de R&D sur le nombre de brevets affectés aux régions : les élasticités estimées se situent entre 0,30 et 0,46 selon le modèle. Les tests de spécification concluent à l’existence d’effets régionaux et à leur caractère aléatoire. Les estimations des coefficients autorégressifs et d’autocorrélation spatiale sont positives. Cependant, elles ne sont significatives que dans le cadre des spécifications à effets fixes et sous l’hypothèse d’une proximité technologique des activités de recherche. La prise en compte directe des dépenses de R&D des autres régions indique des externalités positives et significatives quelle que soit la spécification considérée. Par contre, les externalités géographiques demeurent faibles et non significatives. Nos résultats suggèrent donc que les capacités inventives des régions ne sont pas indépendantes de celles des régions dont les structures technologiques sont proches. La proximité géographique semble ne pas jouer un rôle déterminant dans les capacités innovatrices régionales. Ainsi, nos résultats suggèrent que les externalités technologiques ne sont majoritairement liées à des externalités géographiques que dans certains types de systèmes régionaux d’innovation. La France est sans doute moins souvent caractérisée par la présence fréquente de tels milieux innovatifs que d’autres pays. Elle a par contre une longue tradition de système national d’innovation (cf. Nonn et Héraud, 1995).

L’article s’organise de la manière suivante. Dans la deuxième section, nous présenterons le modèle et discuterons la méthode d’estimation. Les développements techniques des différentes spécifications à estimer seront exposés en annexe. Nous examinerons les résultats empiriques dans la troisième section. Nous résumerons en conclusion les principaux résultats et formulerons des suggestions pour des travaux futurs.

1. Le modèle

Considérons le modèle à erreurs composées (EC) suivant :

Yit est un vecteur de dimension NT × 1, i dénote la région et t la période, Xit est un vecteur k × 1 d’observations relatives aux k variables explicatives et β est un vecteur de paramètres de dimension k × 1. μi est un vecteur de dimension N × 1 d’effets spécifiques régionaux. Le vecteur NT × 1 des termes d’erreur εit, de moyenne nulle et de variance σ2ε, est supposé normal, εit ~ N(0, σ2ε). Les εit sont supposés indépendants des effets μi et des variables explicatives du modèle.

Une première formulation de la dépendance spatiale est la spécification d’un modèle spatial autorégressif d’ordre 1 (cf. Florax et Folmer, 1992). Si l’on considère un empilement des T observations relatives à chacune des régions, le modèle à erreurs composées avec dépendance spatiale (EC-DS-var_Y) peut s’écrire sous la forme matricielle suivante :

Z = (INιT) est une matrice de dimension NT × N de variables indicatrices régionales, ιT est un vecteur des 1 de dimension T × 1 et IN est la matrice identité d’ordre N. Le signe ⊗ désigne le produit kronecker. M = (CNIT) où CN est la matrice de poids spatiaux de dimension N × N. Les coefficients de la diagonale sont égaux à 0 alors que ceux en dehors de la diagonale renseignent sur la manière dont deux régions sont connectées. En général, les lignes de la matrice sont normalisées de sorte que la somme des éléments de chaque ligne est égale à 1 (cf. Anselin et Hudak, 1992). ρ désigne le coefficient autorégressif spatial. Il capte les effets des externalités spatiales des activités technologiques.

Une seconde formulation de la dépendance spatiale suppose que les termes d’erreur dans (1) εit sont spatialement autocorrélés (EC-AS) (cf. Florax et Folmer, 1992; Baltagi et Li, 1999) :

où λ désigne le coefficient d’autocorrélation spatiale. Il capte les effets des variables spatiales omises dans le modèle. Le vecteur NT × 1 des termes d’erreur vit est supposé normal, vit ~ N(0, σ2v). Les vit sont supposés également indépendants des effets μi et des variables explicatives du modèle.

Enfin, une dernière formulation de la dépendance spatiale consiste à incorporer dans le modèle les variables exogènes spatiales (EC-DS-var_X) :

où ηit ~ N(0, σ2η). Suivant la structure de la matrice des poids spatiaux CN, nous retrouvons avec l’équation (4) les formulations classiques des externalités des activités technologiques au niveau de la firme. En particulier, Jaffe (1986) considère que les coefficients de la matrice CN représentent la corrélation non centrée entre les vecteurs fi et fj de la position technologique respectivement des firmes i et j (cf. l’annexe B).

L’application des méthodes des moindres carrés ordinaires (MCO) ou généralisés (MCG) dans l’estimation des modèles avec dépendance spatiale conduit à des estimateurs biaisés et non convergents (cf. Dubin, 1988; Florax et Folmer, 1992). Une procédure d’estimation appropriée est la méthode du maximum de vraisemblance (MV) (Anselin, 1988 : 57-59)[4]. Dans ce cadre, la structure de la matrice Ω de variance conditionnelle de Y sachant X (cf. l’annexe A pour les développements des différentes spécifications à estimer) dépend des hypothèses sur l’existence des effets spécifiques régionaux, H10 : σ2μ = 0, et la nature de ces effets qui peuvent être aléatoires (hypothèse d’indépendance), H20 : E(μi / Xit) = 0, ou fixes H2a : E(μi / Xit) ≠ 0[5].

L’estimation des modèles avec dépendance spatiale par la méthode du maximum de vraisemblance nécessite une optimisation non linéaire et implique des calculs numériques d’autant plus lourds et plus longs que le nombre d’observations est important. En particulier, une des difficultés d’application de la méthode MV réside dans le calcul du déterminant de la matrice des variances Ω. Une alternative proposée par Ord (1975) repose sur les valeurs propres de la matrice de connectivité. Ainsi,

où les ωi désignent les valeurs propres de la matrice CN et α = {ρ, λ}. L’identité (5) implique que les valeurs des coefficients de dépendance spatiale doivent satisfaire la condition ω-1min ≤ α ≤ ω-1max où ωmax = 1 dans le cas des matrices de connectivité normalisées. L’avantage de cette procédure est qu’on peut déterminer les valeurs propres de ces matrices avant l’optimisation (puisque CN est supposée connue). Ceci réduit considérablement le calcul numérique de la vraisemblance du modèle, au moins dans le cas des petits échantillons. En effet, la détermination des valeurs propres s’avère délicate dès que la taille de l’échantillon devient importante (cf. Kelejian et Prucha, 1998; 1999).

Les tests de dépendance spatiale ont fait l’objet de nombreux développements. La statistique de Moran est le test le plus utilisé dans la détection de l’autocorrélation spatiale (cf. Anselin et Florax, 1995). D’autres alternatives ont été proposées et sont basées en majorité sur le test LM (le test du multiplicateur de Lagrange). Cependant, il s’agit de tests asymptotiques et leurs propriétés ne sont pas connues dans le cas des petits échantillons (cf. Anselin et alii, 1996). Nous considérons dans cette étude pour les tests d’hypothèse de la dépendance spatiale (H30 : α = 0) la statistique LR (test du rapport de vraisemblance).

2. Application : estimation de la relation brevets-R&D au niveau régional

2.1 Cadre statistique

Les caractéristiques technologiques de 21 régions françaises sont analysées à travers les dépôts de brevets dans le système européen EPAT (European Patent) et les dépenses de R&D (publiques et privées) en euros à prix constants 1990 sur la période 1991-1996. Pour contrôler l’effet taille des régions, les dépôts de brevets et les dépenses de R&D sont rapportés au niveau de l’emploi dans les régions, mesuré en milliers d’effectifs.

Les régions Île-de-France, Rhône-Alpes et Alsace occupent respectivement les trois premières places en nombre de dépôts de brevets par millier d’effectifs employés (cf. le tableau 1). Le Limousin présente la densité la plus faible avec 0,08 brevets par millier d’effectifs. En matière de dépenses de R&D, Île-de-France, Midi-Pyrénées, Provence-Alpes-Côte d’Azur (PACA) et Rhône-Alpes arrivent respectivement en tête, alors que l’Alsace, troisième région en matière de dépôts, est reléguée à la 12e place avec 470 euros par employé.

La matrice de connectivité CN est définie à partir des indicateurs de distance technologique et de contiguïté. Dans le premier cas, les coefficients cij de la matrice sont calculés à partir de la structure des dépôts de brevets affectés aux différentes régions dans les huit sections de la CIB[6]. En particulier, les coefficients cij sont égaux à d-1ij pour ij et 0 sinon. dij représente la distance pondérée entre deux régions i et j définie par la formule suivante (cf. Archibugi et Pianta, 1992 : 132) :

fih et fjh désignent respectivement les proportions en pourcentage de brevets classés dans le domaine h respectivement des régions i et j. fnh est la proportion des dépôts de l’ensemble des régions dans le domaine h. En pratique, comme nous avons constaté que les distances sont restées stables sur la période 1991-1996, nous avons considéré la distance moyenne sur cette période. Par comparaison, l’indicateur que nous utilisons donne quasiment les mêmes résultats que le coefficient de corrélation non centré suggéré par Jaffe (1986) (cf. l’annexe B).

Tableau 1

Statistiques descriptives (moyennes 1991-1996)

Statistiques descriptives (moyennes 1991-1996)

Note : (a) Nombre de dépôts par millier d’effectifs employés. (b) Dépenses de R&D en millions d’euros 1990 par millier d’effectifs employés. (c) Les nombres entre parenthèses font références au n° de région. Ainsi, la région la plus proche de l’Alsace est la région 21 (Rhône-Alpes), alors que la plus éloignée est la région 7 (Centre).

-> See the list of tables

L’indicateur de distance fait ressortir le Centre, la Bretagne et le Languedoc-Roussillon comme les régions présentant les activités technologiques les plus éloignées de celles des autres régions : somme des distances technologiques les plus élevées (cf. le tableau 1). À l’opposé, la structure des activités technologiques de la Bourgogne est la moins différenciée.

Dans le deuxième cas, les coefficients cij de la matrice CN sont égaux à 1 si les régions i et j sont contiguës et 0 sinon. Ainsi, la région Centre présente le nombre le plus élevé de connexions avec huit voisins immédiats alors que les régions Alsace, Bretagne, Nord-Pas-de-Calais et Provence-Alpes-Côte d’Azur (PACA) ne sont contiguës qu’à deux voisins au plus (cf. le tableau 1). Cet indicateur peut être redéfini en tenant compte de la proximité des activités technologiques en supposant que l’intensité des interactions ne peut être identique entre les régions dont les structures technologiques sont très différenciées. En particulier,

gij = 1 si les régions i et j sont contiguës et 0 sinon.

2.2 Résultats d’estimation

Les résultats d’estimation du modèle à erreurs composées tenant compte des externalités technologiques et géographiques sont présentés respectivement dans les tableaux 2 et 3. Considérons dans un premier temps les résultats du tableau 2. Les colonnes 2 et 3 correspondent aux estimations sans prise en compte de la dépendance spatiale. Les résultats obtenus montrent que la relation brevets-R&D au niveau des régions françaises est significative. L’élasticité des dépôts par rapport aux dépenses de R&D est estimée à 0,43 dans le cadre du modèle à effets fixes et à 0,46 dans le cas du modèle à effets aléatoires. Le test LM amène à accepter l’hypothèse d’existence des effets spécifiques régionaux (rejet de H10 : σ2μ = 0). Le test de spécification d’Hausman indique une absence de corrélation entre les effets et la variable explicative du modèle (l’hypothèse H2a : E(μi / Xit) = 0 n’est pas rejetée). Dans ce cadre, les estimateurs du modèle à effets aléatoires sont convergents (Mundlak, 1978). Pour situer nos résultats par rapport à ceux obtenus au niveau de la firme[7], les coefficients estimés de R&D dans la dimension intra ou avec indicatrices individuelles sont de l’ordre de 0,27-0,28 (Crépon et Duguet, 1997), 0,29-0,31 (Cincera, 1997), 0,40 (Jaffe, 1986) et 0,35-0,45 (Hausman et alii, 1984). Les spécifications à effets aléatoires conduisent à des coefficients légèrement plus élevés, de l’ordre de 0,44 (Cincera, 1997) et 0,45-0,52 (Hausman et alii, 1984). Les résultats auxquels nous aboutissons au niveau régional demeurent donc comparables avec ceux obtenus au niveau de la firme.

Tableau 2

Résultats d’estimation du modèle à erreurs composées

Résultats d’estimation du modèle à erreurs composées

Note : EF : effets fixes (21 indicatrices régionales sont considérées dans les spécifications), EA : effets aléatoires, DS : dépendance spatiale, AS : autocorrélation spatiale. λ désigne le coefficient d’autocorrélation spatiale. θ2 = σ2 / (Tσ2μ + σ2) où σ2μ désigne la variance des effets spécifiques régionaux et σ2 la variance des termes d’erreur de la régression considérée. Les estimations dans le cadre du modèle EA-AS sont obtenues par balayage sur λ et θ2. Les nombres entre parenthèses désignent les écarts-types des coefficients estimés. (**) Significatif au seuil d’erreur 1 %, (*) significatif au seuil d’erreur 5 %.

-> See the list of tables

Les résultats d’estimation du modèle avec autocorrélation spatiale des termes d’erreur[8] sont présentés dans les colonnes 4 et 5. L’estimation du modèle à effets fixes (colonne 4) conduit à une élasticité des dépôts de l’ordre de 0,33. Le coefficient d’autocorrélation spatiale estimé à 0,36 est significatif. Le test LR (colonne 4 contre colonne 2) conclut à l’acceptation de la spécification avec corrélation spatiale.

La recherche du maximum global dans le cadre du modèle à effets aléatoires est menée par balayage sur λ et θ2 = σ2v / (Tσ2μ + σ2v). L’élasticité des dépôts par rapport aux dépenses de R&D et le coefficient d’autocorrélation spatiale sont respectivement de l’ordre de 0,43 et 0,29. Cependant, le test LR (colonne 5 contre colonne 3) amène à accepter l’hypothèse d’absence d’autocorrélation spatiale. Enfin, le test d’Hausman montre que seuls les estimateurs du modèle à effets aléatoires sont à considérer. Ceci nous amène à conclure à l’absence de l’autocorrélation spatiale.

Les estimations du modèle autorégressif (cf. colonnes 6 et 7) conduisent aux mêmes conclusions que le modèle avec corrélation spatiale des termes d’erreur. Elles indiquent des externalités positives des activités technologiques régionales mais elles ne sont significatives que dans le cadre du modèle à effets fixes où le coefficient autorégressif est estimé à 0,37 (cf. colonne 6). La statistique du test de spécification d’Hausman est non significative au seuil d’erreur 5 %. En conséquence, l’hypothèse d’une dépendance spatiale des activités technologiques régionales est rejetée au seuil d’erreur de 5 % dans le cadre du modèle à effets aléatoires (l’estimation indique un seuil de signification de l’ordre de 13 %).

Enfin, les résultats d’estimation du modèle incorporant explicitement les externalités des dépenses de R&D (colonnes 8 et 9) conduisent à des coefficients positifs et significatifs : 0,73 et 0,55 respectivement dans le cadre du modèle à effets fixes et à effets aléatoires. Comme le test de spécification conduit à rejeter l’hypothèse de dépendance entre les effets régionaux et les variables explicatives du modèle, les estimateurs du modèle à effets aléatoires sont donc convergents. Par rapport au modèle autorégressif, ce résultat suggère que les externalités générées par les inputs de l’activité de recherche, en l’occurrence les investissements en R&D, sont plus importantes que celles générées par les outputs (mesurés par les brevets) de la recherche.

L’examen des résultats du tableau 3 indique une absence des externalités géographiques des activités technologiques dans quasiment toutes les spécifications considérées. Hormis les estimations du modèle à effets fixes incorporant les dépenses de R&D des régions contiguës (colonne 6), les coefficients d’autocorrélation et de dépendance spatiales sont très faibles et non significatifs (cf. colonnes 2 à 5). La proximité géographique entre deux espaces semble donc ne pas jouer un rôle déterminant dans leur capacité inventive. Par contre, la proximité technologique apparaît plus prédominante et contributive à accroître la productivité des régions.

Tableau 3

Résultats d’estimation du modèle à erreurs composées

Résultats d’estimation du modèle à erreurs composées

Note : EF : effets fixes (21 indicatrices régionales sont considérées dans les spécifications), EA : effets aléatoires, DS : dépendance spatiale, AS : autocorrélation spatiale. λ désigne le coefficient d’autocorrélation spatiale. θ2 = σ2 / (Tσ2μ + σ2) où σ2μ désigne la variance des effets spécifiques régionaux et σ2 la variance des termes d’erreur de la régression considérée. Les estimations dans le cadre du modèle EA-AS sont obtenues par balayage sur λ et θ2. Les nombres entre parenthèses désignent les écarts-types des coefficients estimés. (**) Significatif au seuil d’erreur 1 %, (*) significatif au seuil d’erreur 5 %.

-> See the list of tables

Nos résultats reflètent ainsi les spécificités françaises en matière de l’innovation. Un territoire peut être un lieu de création d’éléments importants de savoir et de savoir-faire sans constituer pour autant un système en lui-même. Ainsi, les établissements locaux des grandes institutions de recherche ou d’enseignement supérieur ne sont pas nécessairement les partenaires privilégiés pour répondre à la demande de connaissance ou d’expertise des établissements industriels localisés dans le même territoire ou dans ceux contigus. Le système d’innovation peut « boucler » plus ou moins au niveau national et très peu au niveau d’une région – ce qui n’enlève rien à la pertinence de l’idée de « contexte » régional spécifique. Les externalités technologiques ne sont majoritairement liées à des externalités géographiques que dans certains types de systèmes locaux ou régionaux d’innovation. La France est sans doute moins souvent caractérisée par la présence fréquente de tels milieux innovatifs que d’autres pays. Elle a par contre une longue tradition de système national d’innovation. Diverses études réalisées sur le cas des régions françaises, comme celles analysées dans Nonn et Héraud (1995), ont montré que les réseaux d’innovation des firmes ne sont pas spécifiquement organisés sur une base régionale, mais présentent au contraire une très grande variété d’extensions géographiques différentes selon le type de partenaire ou d’interaction cognitive.

Conclusion

Nous avons présenté dans ce travail une estimation de la relation brevets-R&D au niveau des régions françaises sur la période 1991-1996. La principale contribution de ce papier est d’incorporer les développements méthodologiques en économétrie spatiale dans la spécification et l’estimation d’une telle relation sur données de panel. L’approche analytique considère un modèle à erreurs composées avec et sans dépendance spatiale. Nous avons ainsi examiné les effets des externalités spatiales causées respectivement par la proximité technologique et géographique des activités de recherche régionale.

Les résultats auxquels nous aboutissons montrent une influence significative des dépenses de R&D sur le nombre de brevets déposés par les régions. Les élasticités des dépôts dans le cadre du modèle sans dépendance spatiale sont de l’ordre de 0,43 (effets fixes) et de 0,46 (effets aléatoires). Les résultats des estimations du modèle spatial autorégressif et du modèle à erreurs spatiales autocorrélées indiquent des externalités spatiales positives qui ne sont significatives que dans le cadre du modèle à effets fixes et sous l’hypothèse d’une proximité technologique. Les externalités géographiques demeurent très faibles et non significatives dans les deux modèles. Enfin, l’estimation du modèle incorporant les dépenses de R&D des autres régions conduit à des externalités technologiques positives et significatives dans le cadre des deux spécifications à effets fixes et à effets aléatoires. Les externalités des dépenses de R&D des régions contiguës sont significatives dans le cadre du modèle à effets fixes. Cependant, comme seuls les estimateurs à effets aléatoires sont convergents, nous concluons à l’absence d’externalités géographiques pour les activités de recherche régionale.

Dans un environnement national et européen où le processus de concurrence et/ou de coopération entre régions est appelé à prendre de l’importance, une appréciation plus rigoureuse et approfondie des effets spatiaux s’avère très utile. De nombreux progrès restent à faire pour affiner les résultats obtenus.

Tout d’abord, il serait envisageable de distinguer dans la modélisation la R&D privée de la R&D publique dont l’importance relative peut varier considérablement d’une région à l’autre et suivant leur structure socio-économique. On pourrait envisager également la même procédure pour les brevets. Ensuite, s’agissant de la modélisation proprement dite, des prolongements pourraient être faits sur le sens de la causalité entre les dépenses de R&D et les brevets, et sur la nature de la relation entre ces deux grandeurs. En effet, notre démarche suppose que les brevets (les outputs) sont des indicateurs du résultat de la R&D (les inputs) (cf. Griliches, 1990) et que les deux variables sont dominées par une relation contemporaine (cf. Hall et alii, 1986). Or, Van Ophem et alii (2001) ont montré, sur un échantillon de 460 entreprises néerlandaises observées en 1988 et en 1992, que la causalité à la Granger va des brevets à la R&D. La causalité dans le sens opposé semble s’atténuer dès que les auteurs quittent le cadre d’une distribution de Poisson des données de brevets. Enfin, Il serait très constructif d’étudier la sensibilité des estimations aux différentes mesures de la proximité spatiale (structure du marché, structure industrielle, etc.) et de considérer une influence inégale des activités technologiques régionales (des externalités spatiales asymétriques).