Abstracts
Résumé
Dans ce texte, nous considérons un modèle autorégressif d’ordre p (où p ≥ 1) gaussien, possiblement non stationnaire, avec un terme constant (tendance). Nous développons des méthodes d’inférence exactes pour les coefficients de ce modèle. Nous proposons une méthode qui permet de tester n’importe quelle hypothèse qui fixe le vecteur complet des coefficients autorégressifs du modèle puis, en « inversant » ces tests, de construire une région de confiance conjointe pour les coefficients du vecteur. Chaque hypothèse est testée en transformant d’abord les observations de façon à faire disparaître toute autocorrélation sous l’hypothèse nulle puis en testant si les observations transformées sont indépendantes. Pour ce faire, nous combinons plusieurs tests d’autocorrélation conçus pour détecter la dépendance aux délais 1, 2, ..., p. La méthode proposée permet de construire de façon simple les régions de confiance en résolvant 2p polynômes de second degré pour chaque coefficient (après un balayage des p – 1 coefficients restants du modèle et pour chaque configuration de ces p – 1 coefficients). Pour faire de l’inférence sur les coefficients individuels du modèle ou sur des transformations plus générales des coefficients autorégressifs, nous proposons d’utiliser une technique de projection. Nous appliquons la méthode développée à un modèle du P.I.B. réel tunisien.
Abstract
In this paper, we consider a gaussian autoregressive model of order p, which may be nonstationary and includes a drift term (where p ≥ 1). Exact inference methods are developed for the autoregressive coefficients. We consider first the problem of testing any hypothesis that fixes the vector of the autoregressive coefficients. This is done by first transforming the observations in a way that eliminates serial dependence under the null hypothesis, and then testing whether autocorrelation remains present in the transformed data. The latter task is accomplished by combining several independence tests against serial correlation at lags 1, 2, ..., p. A valid confidence region for the autoregressive coefficients may then be obtained by inverting the latter tests. We show that this confidence region can be built numerically on solving 2p polynomials of order 2, where in each case p – 1 autoregressive coefficients are fixed, and then using a grid search over the latter p – 1 coefficients. For inference on individual coefficients or more general transformations of the autoregressive coefficients, we propose the use of a projection approach. The proposed method is applied to a time series model of real G.D.P. in Tunisia.
Article body
Introduction
L’inférence statistique (tests et régions de confiance) sur des modèles autorégressifs constitue l’un des problèmes fondamentaux posé par l’analyse des séries chronologiques en économétrie et en statistique. Les méthodes utilisées pour ce faire sont habituellement basées sur des approximations asymptotiques dont la fiabilité est généralement douteuse, même sous des hypothèses paramétriques précises (p. ex., innovations gaussiennes). Ainsi les niveaux réels des tests peuvent différer de façon arbitrairement grande de ceux affichés par les approximations de grands échantillons (voir Blough, 1992; Cochrane, 1991; Dufour, 1997; Staiger et Stock 1997). C’est le cas en particulier, lorsque le processus considéré est d’un ordre plus grand que un; voir, par exemple, Diebold et Nerlove (1990), Gourieroux et Monfort (1990), Brockwell et Davis (1991), Stock (1991, 1994) et Hamilton (1994). Il n’y a aucune garantie que ces méthodes sont « valides en échantillon fini ».
Dans ce texte, nous développons des méthodes d’inférence exactes relativement simples qui permettent de réaliser des tests et de construire des régions de confiance sur les coefficients d’un processus autorégressif d’ordre p [AR(p)] gaussien contenant un paramètre constant inconnu. Il n’y a pas de contrainte sur la stationnarité du processus. Nous allons principalement nous intéresser au problème de la construction de régions de confiance pour les paramètres du modèle. La méthode générale développée est une extension de l’approche décrite dans Dufour (1990) pour des processus AR(1).
L’approche proposée comporte deux étapes principales. La première consiste à obtenir un test qui permet de vérifier n’importe quelle hypothèse fixant le vecteur complet des coefficients du processus autorégressif. La distribution de chaque statistique proposée ne comporte pas de paramètres de nuisance. Chaque hypothèse de ce type est testée en transformant les observations de façon à faire disparaître l’autocorrélation entre celles-ci sous l’hypothèse nulle – dépendance qui ne disparaît pas sous la contre-hypothèse – et en testant si les observations transformées sont indépendantes. En outre, pour traiter les cas où p ≥ 2, nous proposons un test induit qui combine plusieurs tests d’autocorrélation conçus pour détecter la dépendance aux délais 1, 2, ..., p[1].
Cette méthode a l’avantage de simplifier considérablement le calcul des distributions des statistiques sous l’hypothèse nulle et de permettre l’utilisation de tables, comme celles fournies par Vinod (1973, table IIa). Typiquement, les valeurs critiques appropriées peuvent être calculées au moyen de l’algorithme d’Imhof (1961) ou d’algorithmes semblables (p. ex., Ansley, Shively et Kohn, 1992). La seconde étape consiste à construire une région de confiance conjointe pour les coefficients du modèle. Cette dernière est obtenue en cherchant l’ensemble des vecteurs de coefficients autorégressifs qui ne sont pas rejetés par la procédure de test développée plus haut. En d’autres termes, on « inverse » la famille de tests considérée. On peut ainsi calculer de façon simple les régions de confiance. En effet, pour le cas AR(1), la région de confiance se calcule facilement en résolvant deux polynômes du second degré. Pour les processus d’ordre plus élevé (p ≥ 2), on peut avoir recours à un balayage sur p – 1 coefficients du modèle : pour chaque configuration de ces p – 1 coefficients, on obtient l’ensemble des valeurs acceptables du dernier paramètre (qui peut être vide) en résolvant 2p polynômes du second degré. La région de confiance conjointe est alors l’union des « régions conditionnelles » ainsi obtenues.
À partir de la région de confiance conjointe, on peut construire des intervalles de confiance pour les coefficients individuels du modèle par une méthode de projection et tester toute genre d’hypothèse, linéaire ou non linéaire, sur les coefficients du modèle. Ces intervalles de confiance et les tests ainsi obtenus possèdent aussi une propriété de simultanéité, telle que définie dans la littérature statistique sur l’inférence simultanée (voir Miller, 1981; Savin, 1984) : la probabilité que les vraies valeurs de tous les paramètres considérés soient simultanément couvertes par ces intervalles est au moins égale au niveau affiché (95 % par exemple). Cette propriété sera définie de façon plus formelle à la section 4. Dans le cas d’intervalles de confiance non simultanés, cette probabilité est typiquement inférieure au niveau. Les méthodes proposées sont appliquées à un modèle du produit intérieur brut (P.I.B.) réel tunisien.
Notre texte est divisé comme suit. Après avoir décrit le modèle et les principales notations utilisées dans la première section, nous montrons à la section 2 comment construire un test combiné des paramètres du modèle autorégressif. Dans la troisième section, nous discutons comment construire une région de confiance conjointe pour les coefficients du modèle, en considérant d’abord en détail les cas AR(1) et AR(2). Dans la quatrième section, nous étudions comment construire des régions de confiance pour les coefficients individuels du modèle et comment tester diverses hypothèses sur ces coefficients. Dans la cinquième section, nous appliquons les méthodes proposées à un modèle du P.I.B. réel tunisien. Finalement, nous concluons.
1. Modèle et notations
Nous étudions ici le modèle AR(p) :
où y0, y-1, ..., y-p+1 sont indépendants de u = (u1, ..., uT)′, T ≥ p + 1 et les paramètres φ1, φ2, ..., φp, β1 et σ2 sont inconnus. Afin de faciliter l’interprétation des résultats, il sera utile de reparamétrer le modèle de manière analogue à Dickey (1976), Fuller (1976) et Beveridge et Nelson (1981). On voit facilement que
ou encore
où θ1 = φ1 + φ2 + ... + φp, θj = – φi, Δyt-j = yt-j – yt-(j+1), j ≥ 2. Les paramètres inconnus du modèle transformé (1.3) sont donc θ = (θ1, θ2, ..., θp)′, β1 et σ, tandis que les variables explicatives sont yt-1, Δyt-1, ..., Δyt-p+1. Les équations (1.1) et (1.3) sont complètement équivalentes.
2. Test de l’hypothèse H0 (θ0) : θ = θ0
Nous allons maintenant étudier le problème qui consiste à tester une hypothèse de la forme
Nous dénotons par θ = (θ1, θ2, ..., θp)′ le vecteur des vraies valeurs de ces paramètres et par θ0 = (θ10, θ20, ..., θ p0)′ n’importe quel vecteur hypothétique de ces valeurs. Sous H0 (θ0),
Si on définit
on voit que, sous H0(θ0), la série {zt(θ0) : t = 1, ..., T} est un bruit blanc normal de moyenne β1. Sous la contre-hypothèse Ha(θ0), la même série sera autocorrélée et suivra un processus ARMA(p, p). On peut donc tester H0(θ0) en testant si les variables zt(θ0), t = 1, ..., T, sont mutuellement indépendantes contre la présence d’autocorrélation aux délais 1, 2, ..., p (voir Neifar, 1996). Comme la structure d’autocorrélation d’un processus ARMA (p, p) est complètement déterminée par les p premières autocorrélations, il sera suffisant de tester l’indépendance des zt(θ0), t = 1, ..., T, contre la présence d’autocorrélation aux délais 1, 2, ..., p. Pour ce faire, nous allons utiliser p statistiques de la forme suivante :
où Āj = MAjM, = MBjM, M = IT – ι′ ι, ι = (1, 1, ..., 1)′ et Bj est une matrice positive définie. L’expression Dj(θ0) dans (2.5) représente la forme générale de la plupart des statistiques d’autocorrélation usuelles, sauf que le test est ici appliqué au modèle transformé (de façon à éliminer la dépendance sérielle) en utilisant les valeurs des coefficients spécifiées par l’hypothèse nulle (θ = θ0). Sans perte de généralité, on peut supposer que Aj et Bj (et donc Āj et ) sont des matrices symétriques. L’intérêt de considérer de telles statistiques vient du fait que la distribution de chacune d’elles, sous H0(θ0), ne dépend d’aucun paramètre de nuisance et peut être calculée assez facilement (par exemple, par l’algorithme d’Imhof, 1961). En particulier, on peut considérer :
des statistiques de von Neumann généralisées
les coefficients d’autocorrélation
des statistiques de Durbin-Watson généralisées
Il est facile de voir que toutes ces statistiques s’écrivent sous la forme (2.5)[2].
Un test bilatéral de niveau αj pour l’hypothèse H0(θ0) contre la présence d’autocorrélation au délai j consiste alors à rejeter H0(θ0) au niveau αj (0 < αj < 1) lorsque
où d1j(α1j) et d2j(α2j) sont choisis de façon telle que, sous l’hypothèse nulle,
et α1j + α2j = αj, 0 ≤ α1j ≤ 1, 0 ≤ α2j ≤ 1.
En combinant les statistiques Dj(θ0), j = 1, ..., p, il est facile d’obtenir un test de H0(θ0) contre la présence d’autocorrélation aux délais j = 1, ..., p : il suffit de rejeter H0(θ0) lorsqu’au moins un des tests Dj(θ0), j = 1, ..., p, rejette H0(θ0). On appelle une telle procédure un test induit[3]. Pourvu que α1 + α2 + ... + αp ≤ α, le niveau global de la procédure n’excède pas α (par l’inégalité de Boole-Bonferroni). Le test induit ainsi construit a les particularités suivantes : d’une part, on teste le vecteur complet des valeurs de θ et, d’autre part, c’est un test exact de niveau qui n’excède pas α.
3. Région de confiance pour θ
Si on se sert du test induit décrit à la section précédente, l’hypothèse H0(θ0) : θ = θ0 n’est pas rejetée lorsque d1j(α1j) ≤ Dj(θ0) ≤ d2j(α2j) pour j = 1, ..., p. Par conséquent, l’ensemble des valeurs de θ0 qui ne sont pas rejetées par cette procédure,
est une région de confiance de niveau 1 – α pour θ = (θ1, θ2, ..., θp)′ :
Autrement dit, la région est obtenue en « inversant » la famille de tests proposée pour des hypothèses de type H0(θ0). Si, de plus, on restreint θ à un ensemble de valeurs admissibles , l’ensemble I ∩ constitue aussi une région de confiance de niveau 1 – α (quand les conditions imposées sont correctes). Bien que classique en statistique mathématique (voir Lehmann, 1986 : chapitre 3), l’approche qui consiste à inverser un test général pour obtenir une région de confiance a été rarement utilisée de façon explicite en économétrie; pour quelques exemples, le lecteur, pourra consulter Anderson et Rubin (1949), Dufour (1990, 1997), Staiger et Stock (1997), Dufour et Kiviet (1998), Dufour et Torrès (1998) et Dufour et Jasiak (2001).
Nous allons maintenant étudier de façon plus précise comment construire la région de confiance I. Pour ce faire, il sera utile d’examiner d’abord des cas spéciaux, les processus AR(1) et AR(2), pour ensuite traiter le cas général d’un processus AR(p).
3.1 Processus autorégressif d’ordre 1
Dans le cas d’un processus AR(1), les équations (1.1) et (1.3) s’écrivent :
où ut N[0, σ2], t = 1, ..., T, T ≥ 2, θ1 = φ et y0 est indépendant de u = (u1, ..., uT)′. Nous n’imposerons pas de conditions supplémentaires sur la distribution de y0. Afin de construire une région de confiance exacte pour θ1, on considère une famille de tests de la forme (2.9) pour les hypothèses H0(θ10). Alors l’ensemble des valeurs θ10 qui ne sont pas rejetées par cette méthode,
est une région de confiance de niveau 1 – α pour θ1, où α = α11 + α21. Il est clair que
ce qui équivaut à dire que θ1 ∈ I1 ∩ I2 où
et « ssi » signifie « si et seulement si ». En remplaçant D1(θ1) par la formule (2.5), on aura : θ1 ∈ I1 ∩ I2 ssi
ou, de façon équivalente,
En remplaçant z(θ1) par sa valeur en (3.9) et, après quelques manipulations, on peut voir que θ1 ∈ I1 ∩ I2 ssi
où
Une fois qu’on a les racines des deux polynômes du second degré en (3.10), il est facile de trouver les valeurs de θ1, pour lesquelles a11θ21 + b11θ1 + c11 ≥ 0 et a21θ21 + b21θ1 + c21 ≤ 0. Ces dernières constituent la région de confiance I = I1 ∩ I2. Si de plus, on impose la condition de stationnarité ∣θ1∣ < 1, l’ensemble = I1 ∩ I2 ∩ (–1, +1) constitue toujours une région de confiance de niveau α. De même, si on impose plutôt ∣θ1∣ ≤ 1, l’ensemble = I1 ∩ I2 ∩ [–1, +1] sera une région de confiance de niveau α.
3.2 Processus autorégressif d’ordre 2
Dans le cas d’un processus AR(2), l’équation (1.3) devient :
où ut N[0, σ2], t = 1, ..., T, T ≥ 3 et y-1, y0 sont indépendants de u = (u1, ..., uT)′. Afin de construire une région de confiance valide pour θ = (θ1, θ2)′, on considère une famille de tests du type (2.9) avec j = 1, 2, pour des hypothèses de la forme H0(θ0), où θ0 = (θ10, θ20)′ est le vecteur des valeurs hypothétiques. L’ensemble des valeurs de θ0 non rejetées par le test,
est une région de confiance conjointe pour θ de niveau supérieur ou égal à 1 – α. Nous avons :
où
En remplaçant de nouveau Dj(θ) par la formule (2.5), on voit que
où
et y-1 = (y0, ..., yT-1)′, Δy-1 = (y0 – y-1, y1 – y0, ..., yT-1 – yT-2)′.
Ici z(θ) dépend de deux paramètres inconnus θ1 et θ2. Si on fixe θ2 = θ20, la résolution de ces inéquations nécessite la recherche des racines de quatre polynômes du second degré comme dans le cas d’un processus AR(1). Pour θ20 donné, définissons :
et I (θ20) = {θ : θ ∈ I1(θ20) et θ ∈ I2(θ20)}.
I(θ20) représente le sous-ensemble conditionnel (possiblement vide) des éléments de I tels que θ2 = θ20. On voit facilement que I = I(θ20) où S2 est l’ensemble des valeurs admissibles de θ2. (θ1, θ20)′ ∈ I(θ20) ssi les inéquations (3.15) sont vérifiées pour
De plus,
et θ ∈ I2(θ20) ssi (a2jθ21 + b2jθ1 + c2j ≤ 0, j = 1, 2)
où
Notons que le choix de fixer θ2 plutôt que θ1 n’est pas arbitraire, car si on impose les conditions de stabilité, le domaine des valeurs admissibles de θ2 est plus restreint que celui de θ1. On peut alors effectuer un balayage des valeurs admissibles de θ20, en résolvant à chaque fois les inéquations (3.15) correspondantes. On trouve ainsi :
En particulier, si on impose les conditions de stabilité sur θ2 et θ1, la région de confiance
où = {(θ1, θ2)′ : –3 < θ1 < 1, ∣θ2∣ < 1, 2θ2 + θ1 > – 1}, est de niveau 1 – α pour θ[4].
3.3 Processus autorégressif général
Pour le cas d’un processus AR(p), où p ≥ 1, on peut procéder de façon analogue. On considère p tests de la forme (2.9) et l’ensemble des valeurs de θ0 qui ne sont rejetées par aucun de ces tests,
constitue une région de confiance conjointe de niveau 1 – α pour θ. Il est facile de voir que
où
En particulier,
où
et Δy-k = (Δy-k, ..., Δy0, ..., ΔyT-k+1)′, k ≥ 1.
Les inéquations (3.18) dépendent de p paramètres inconnus. = (θ20, ..., θp0)′, le problème se réduit à la résolution de polynômes du second degré en θ1. Plus précisément,
Il s’agit donc de trouver les valeurs de θ1 qui satisfont les inéquations
où De la même façon,
où Pour chaque fixe, on obtient une région de confiance pour θ1 (conditionnelle par rapport à ). En faisant ainsi un balayage de l’ensemble des valeurs possibles de et en résolvant les 2p polynômes du second degré en (3.20) et (3.21), on construit alors la région de confiance conjointe
où S2 est l’ensemble des valeurs de admissibles (par exemple, sous l’hypothèse de stationnarité).
4. Tests d’hypothèses générales
Supposons maintenant que l’on s’intéresse à p fonctions g1(θ), ..., gp(θ) de θ. Étant donné la région I, on peut construire par une méthode de projection des régions de confiance simultanées de niveau 1 – α pour g1(θ), ..., gp(θ). En effet,
et donc
Les régions de confiance gi(I), i = 1, ..., p ainsi définies sont dites simultanées, car la probabilité que les p événements gi(θ) ∈ gi(I), i = 1, ..., p, se produisent ensemble (simultanément) est au moins égale à 1 – α. Les intervalles de confiance usuels (comme les intervalles de niveau 1 – α habituellement rapportés pour les coefficients d’une régression) ne sont pas simultanés (voir Miller, 1981 et Savin, 1984), ce qui signifie que la fiabilité de l’analyse peut se détériorer de façon marquée si l’on considère des transformations qui font intervenir plusieurs paramètres du modèle. Comme cas spécial, on peut s’intéresser aux composantes individuelles θi du vecteur θ, ce qui permet d’obtenir des intervalles de confiance simultanés pour les différents coefficients θ1, θ2, ..., θp. Il est clair en outre que la condition (4.2) implique
c’est-à-dire les régions de confiance gi(I) sont aussi des régions de confiance marginales au sens usuel du terme. Comme autre cas spécial, on peut s’intéresser à la construction de régions de confiance pour les racines du polynôme autorégressif en (1.1) et, à partir de là, examiner si ces racines se trouvent à l’intérieur ou à l’extérieur du cercle unité.
Sur la base d’une région de confiance I pour θ, on peut aussi tester n’importe quelle restriction sur les paramètres du modèle. Considérons en effet une hypothèse générale de la forme
où Ω0 est un sous-ensemble non vide de ℝp. Une façon simple de tester H0 consiste à
où I est une région de confiance de niveau 1 – α pour θ, c’est-à-dire
Le test ainsi construit est de niveau α. Sous H0, l’événement θ ∈ I est équivalent à θ ∈ I ∩ Ω0, et donc
Par exemple, on peut tester des hypothèses portant sur les racines du polynôme autorégressif en (1.1) ou (1.3), lesquelles constituent en général des transformations non linéaires des coefficients de ces polynômes. Pour ce faire on peut associer à la région I les régions correspondantes Ri(I), i = 1, ..., p, pour les racines de ces polynômes (qu’on peut ordonner de façon naturelle par ordre croissant des modules). De là, on peut tester n’importe quelle hypothèse sur la position de ces racines, sur la plus grande racine en module, etc. Le lecteur trouvera une discussion plus approfondie de ce genre de méthodes dans Dufour (1997), Abdelkhalek et Dufour (1998), Dufour et Kiviet (1998) et Dufour et Jasiak (2001).
5. Application au P.I.B. réel tunisien
Afin d’illustrer les méthodes proposées plus haut, nous allons étudier la série du P.I.B. réel tunisien (PIBt) de 1961 à 1992 (annuel, en millions de dinars de 1990)[5]. Si on commence par examiner le graphe de la série PIBt, on voit que cette dernière croît de façon exponentielle. Il apparaît donc approprié de prendre le logarithme de la série, que nous noterons yt = ln (PIBt). Cette dernière croît de façon linéaire. Après avoir examiné (suivant la méthode de Box et Jenkins, 1976) les autocorrélations et les autocorrélations partielles de cette série (voir les graphiques 1 et 2), il nous est apparu qu’un modèle de type AR(2) serait approprié pour la série yt; pour plus de détails, le lecteur pourra consulter Neifar (1996). Si on estime un tel modèle par moindres carrés ordinaires (MCO), on trouve le résultat suivant :
où les chiffres entre parenthèses sont respectivement les écarts-types et les statistiques t de Student, DW est la statistique de Durbin-Watson et SSR la somme des carrés des erreurs. Si on suppose que les statistiques t de Student pour tester différentes valeurs de θ1 et θ2 dans ce modèle suivent approximativement une loi t(27), on peut calculer des intervalles de confiance pour θ1 et θ2. Ainsi aux niveaux 0,95 et 0,975 [t0,025(27) = 2,052 et t0,0125(27) = 2,3734], on obtient de cette manière les intervalles suivants : au niveau 0,95,
et, au niveau 0,975,
Bien entendu, la fiabilité d’une telle approximation peut être fort mauvaise ici (même asymptotiquement), notamment dans le voisinage du cercle unité. Nous rapportons ces intervalles seulement pour fin de référence.
Maintenant, nous allons utiliser l’approche développée dans les sections précédentes pour construire une région de confiance de niveau 0,95 pour θ = (θ1, θ2)′. Les points critiques d1j et d2j, utilisés pour les statistiques d1 et d2, calculés par l’algorithme d’Imhof (1961), sont les suivants : d11 = 1,222, d21 = 2,77797, d12 = 1,1597, d22 = 2,7135. Ces points correspondent à des probabilités de queue égales à α/4 = 0,0125, de façon à ce que la probabilité de rejet du test global ne soit pas supérieure à α = 0,05.
Comme en présence d’une constante, la statistique dj(θ) a une distribution symétrique par rapport à 2, il est naturel de choisir αij = αj/2. De plus, nous avons traité de façon symétrique les deux coefficients θ1 et θ2, d’où le choix de αij = α /4. Notons que les différents partages de α en αj, j = 1, ..., p conduisent à des procédures différentes dont les puissances ne sont pas en principe identiques. A priori il n’est pas évident qu’un certain partage domine uniformément les autres.
Si on considère d’abord un ensemble admissible de valeur de θ2 contraint sur [–2,0, 2,0], sans imposer les conditions de stationnarité, on obtient la région de confiance conjointe pour θ1 et θ2 qui apparaît sur le graphique 3. On remarque que celle-ci est très allongée autour de θ1 = 1, qu’elle est petite par rapport au triangle de stationnarité et que l’estimation de θ1 paraît beaucoup plus précise que celle de θ2[6]. Sur le graphique 4, nous montrons un agrandissement de la région pertinente.
Pour obtenir des intervalles de confiance pour θ1 et θ2, nous procédons par projection sur les axes θ1 et θ2, ce qui donne les intervalles de confiance (simultanés) suivants :
On remarque que l’intervalle pour θ1 est très précis, tandis que l’intervalle pour θ2 n’est pas informatif. Ces résultats illustrent le fait que c’est la paire de coefficient (θ1, θ2)′ qui est importante pour déterminer la distribution des données et non les coefficients individuels θ1 et θ2. Il est clair d’après ces résultats que l’hypothèse θ1 = 1 ne peut être rejetée au niveau 0,05.
Si on impose maintenant une condition de stationnarité sur θ1 et θ2, c’est-à-dire on restreint les coefficients à l’ensemble
on obtient la portion de la région de confiance originale située à l’intérieur du triangle du graphique 3. Cette région est aussi de niveau au moins égal à 0,95 (pourvu que la contrainte de stationnarité soit satisfaite). Les intervalles de confiance par projection correspondants sont alors :
Nous remarquons enfin que ces résultats sont compatibles avec ceux que suggèrent l’équation (3.1), car les paramètres trouvés par la première méthode appartiennent aux intervalles de confiance exacts. En outre, les intervalles de confiance pour θ1 sont très proches (notamment sous l’hypothèse de stationnarité), tandis que l’intervalle asymptotique pour θ2 (voir 5.2) est beaucoup plus petit que celui fondé sur la méthode exacte, ce qui jette un doute sur la fiabilité de l’approche asymptotique dans ce cas.
La région de confiance simultanée présentée sur le graphique 3 a été obtenue en fixant d’abord θ2 = θ20 puis, pour chaque valeur de θ2 dans l’intervalle [–2, 2], les valeurs de θ1 qui ne sont pas rejetées (par résolution des équations du second degré décrites à la section 3.2). On pourrait procéder à l’inverse en fixant d’abord θ1 = θ10 et en cherchant les différents valeurs acceptables pour θ2. Cette modification conduit au même résultat.
Conclusion
L’inférence statistique sur des modèles autorégressifs d’ordre p est un problème central de l’analyse économétrique. Les méthodes disponibles sont généralement fondées sur des approximations asymptotiques. Il n’y a aucune garantie que ces méthodes sont « valides en échantillon fini ».
Dans cet article, nous avons proposé des méthodes d’inférence valide en échantillon fini pour des processus possiblement non stationnaires. La particularité du calcul des régions de confiance réside dans sa simplicité. Dans le cas AR(1), la construction de régions de confiance se limite à la résolution de deux polynômes de second degré. L’application des méthodes proposées à un modèle du P.I.B. réel tunisien nous a permis d’obtenir des régions de confiance conjointes et individuelles qui sont assez précises. La recherche d’autres méthodes d’inférence exactes est souhaitable afin de faire une comparaison rigoureuse des résultats en terme de puissance et robustesse des différentes approches.
Appendices
Annexe
Annexe
Données et autocorrélations
Remerciements
Cette recherche a bénéficié du support financier du Conseil des Arts du Canada (Bourse Killam), du Conseil de recherche en sciences humaines du Canada, du Conseil de recherche en sciences naturelles et en génie du Canada, du Réseau canadien de centres d’excellence (projet MITACS), de la Fondation Alexander Von Humboldt (Allemagne) et du Fonds FCAR du Québec. Cette recherche a aussi été réalisée dans le cadre du programme d’analyse et de recherches économiques appliquées au développement international (PARADI), financé par l’Agence canadienne de développement international (ACDI) à titre de centre d’excellence et relevant du Centre de recherche et développement en économique (C.R.D.E) et l’Université de Montréal. Les auteurs remercient un arbitre anonyme ainsi que l’éditeur adjoint Denis Bolduc pour leurs commentaires.
Notes
-
[1]
Pour des survols de la théorie des tests induits et de l’inférence simultanée, le lecteur pourra consulter Miller (1981) et Savin (1984).
-
[2]
La théorie des tests de type Durbin-Watson contre l’autocorrélation à des délais plus grand que un a été discutée par de nombreux auteurs; voir par exemple, Wallis (1972), Schmidt (1972), Vinod (1973) et King (1987).
-
[3]
Pour plus de détails sur ce type de méthodes, le lecteur pourra consulter Dufour (1990), Dufour et Torres (1998) ainsi que les diverses références fournies dans ces articles.
-
[4]
S2 est la région de stationnarité pour un processus autorégressif d’ordre deux. Sur les conditions que doivent satisfaire les coefficients de processus autorégressifs d’ordre 2 à 5 pour être stationnaires, le lecteur pourra consulter Farebrother (1973, 1974a, 1974b, 1974c, 1976, 1987).
-
[5]
Les données utilisées proviennent de la « Banque de données macroéconomiques » de l’Institut d’économie quantitative de Tunis (1992).
-
[6]
Ceci suggère qu’une fois fixée la valeur de θ1 autour de 1, l’influence de la valeur de θ2 sur la loi des données est difficile à détecter, à tout le moins sur un échantillon aussi petit que celui considéré ici. Bien qu’analogue à un problème de non-identification ou de quasi-non-identification (voir Dufour, 1997), cette difficulté se rapproche plus de l’imprécision induite par la multicollinéarité dans les modèles de régression, car les valeurs retardées de séries intégrées ou quasi intégrées sont fortement corrélées entre elles.
Bibliographie
- Abdelkhalek, T. et J.-M. Dufour (1998), « Statistical Inference for Computable General Equilibrium Models, with Application to a Model of the Moroccan Economy », Review of Economics and Statistics, LXXX : 520-534.
- Anderson, T. W. et H. Rubin (1949), « Estimation of the Parameters of a Single Equation in a Complete System of Stochastic Equations », Annals of Mathematical Statistics, 20 : 46-63.
- Ansley, G. H., T. S. Shively et R. Kohn (1992), « Computing p-Value for the Generalised Durbin-Watson and Other Invariant Test Statistics », Journal of Econometrics, 54 : 277-300.
- Beveridge, S. et C. Nelson (1981), « A New Approach to Decomposition of Economic Time Series into Permanent and Transitory Components with Particular Attention to Measurement of the “Business Cycles” », Journal of Monetary Economics, 7 : 151-174.
- Blough, S. R. (1992), « The Relationship between Power and Level for Generic Unit Root Tests in Finite Samples », Journal of Applied Econometrics, 7 : 295-308.
- Box, G. E. P. et G. M. Jenkins (1976), Time Series Analysis: Forecasting and Control, 2e éd., Holden-Day, San Francisco.
- Brockwell, P. J. et R. A. Davis (1991), Time Series: Theory and Methods, 2e éd., Springer-Verlag, New York.
- Cochrane, J. H. (1991), « A Critique of the Application of Unit Root Tests », Journal of Economic Dynamics and Control, 15 : 275-284.
- Dickey, D. A. (1976), « Estimation and Testing of Non Stationary Time Series », thèse Ph.D., University of Iowa.
- Diebold, F. X. et M. Nerlove (1990), « Unit Root in Economic Time Series: A Selective Survey », in T. B. Fomby et J. Rhodes, G. F. (éds), Advances in Econometrics: A Research Annual. Volume 8: Cointegration, Spurious Regression, and Unit Roots, JAI Press, Greenwich, Connecticut.
- Dufour, J.-M. (1990), « Exact Tests and Confidence Sets in Linear Regressions with Autocorrelated Errors », Econometrica, 58 : 475-494.
- Dufour, J.-M. (1997), « Some Impossibility Theorems in Econometrics, with Applications to Structural and Dynamic Models », Econometrica, 65 : 1 365-1 389.
- Dufour, J.-M. et J. Jasiak (2001), « Finite Sample Limited Information Inference Methods for Structural Equations and Models with Generated Regressors », International Economic Review, 42 : 815-843.
- Dufour, J.-M. et J. F. Kiviet (1998), « Exact Inference Methods for First-Order Autoregressive Distributed Lag Models », Econometrica, 66 : 79-104.
- Dufour, J.-M. et O. Torrès (1998), « Union-Intersection and Sample-Split Methods in Econometrics with Applications to SURE and MA Models », in D. E. A. Giles et A. Ullah (éds), Handbook of Applied Economic Statistics, Marcel Dekker, New York, p. 465-505.
- Farebrother, R. W. (1973), « Simplified Samuelson Conditions for Cubic and Quartic Equations », The Manchester School of Economic and Social Studies, 41 : 396-400.
- Farebrother, R.W. (1974a), « Simplified Samuelson Conditions for Quintic Equations », The Manchester School of Economic and Social Studies, 42 : 279-282.
- Farebrother, R. W. (1974b), « The Stability of Laidler’s Simple Monetary Model », The Manchester School of Economic and Social Studies, 42 : 277-278.
- Farebrother, R. W. (1974c), « Recursive Relations for the Samuelson Transformation Coefficients », International Economic Review, 15(3) : 805-807.
- Farebrother, R. W. (1976), « A Note on the Local stability of the General First Order Difference Equation », The Manchester School of Economic and Social Studies, 44 : 182-184.
- Farebrother, R.W. (1987), « Independent Conditions for the Stability of a Dynamic Linear Model », The Manchester School of Economic and Social Studies, 55.
- Fuller, W. A. (1976), Introduction to Statistical Time Series, John Wiley & Sons, New York.
- Gouriéroux, C. et A. Monfort (1990), Séries temporelles et modèles dynamiques, Economica, Paris.
- Hamilton, J. D. (1994), Time Series Analysis, Princeton University Press, Princeton, New Jersey.
- Imhof, P. J. (1961), « Computing the Distribution of Quadratic Forms in Normal Variables », Biometrika, 48 : 419-426.
- King, M. L. (1987), « An Alternative Test for Regression Coefficient Stability », The Review of Economics and Statistics, 69 : 379-381.
- Lehmann, E. L. (1986), Testing Statistical Hypotheses, 2e édition, John Wiley & Sons, New York.
- Miller, Jr., R. G. (1981), Simultaneous Statistical Inference, 2e édition, Springer-Verlag, New York.
- Neifar, M. (1996), « Méthodes d’inférence exactes pour des modèles de régression avec erreurs autoregressives et applications macroéconomiques », thèse Ph.D., Université de Montréal.
- Savin, N. E. (1984), « Multiple Hypothesis Testing », in Z. Griliches et M. D. Intrilligator (éds) « Handbook of Econometrics, Volume 2 », North-Holland, Amsterdam, chapitre 14, p. 827-879.
- Schmidt, P. (1972), « A Generalisation of the Durbin-Watson Test », Australian Economic Paper : 203-209.
- Staiger, D. et J. H. Stock (1997), « Instrumental Variables Regression with Weak Instruments », Econometrica, 65 : 557-586.
- Stock, J. H. (1991), « Confidence Intervals for the Largest Autoregressive Root in U.S. Macroeconomic Time Series », Journal of Monetary Economics, 28 : 435-459.
- Stock, J. H. (1994), « Unit Root, Structural Breaks and Trends », in R. F. Engle et D. L. McFadden (éds), Handbook of Econometrics, Volume IV, North- Holland, Amsterdam, chapitre 46, p. 2 740-2 841.
- Vinod, H. D. (1973), « Generalisation of the Durbin-Watson Statistic for Higher Order Autoregressive Processes », Communication in Statistics, Theory and Methods, 2 : 115-144.
- Wallis, K. J. (1972), « Testing for Fourth Order Autocorrelation in Quarterly Regression Equation », Econometrica, 40 : 617-636.