Estimation et tests de cointégration
Plusieurs méthodes d'estimation d'un MCE ont été proposées à la suite des travaux d'Engle et Granger (1987). Dans cette section, nous allons présenter la méthode d'estimation en deux étapes d'Engle et Granger, la procédure de Banerjee et alii. (1993) et la méthode de Johansen.
La méthode en deux étapes d'Engle et Granger
La méthodologie d'estimation d'un modèle à correction d'erreurs proposée par Engle et Granger (1987) suit une procédure en deux étapes. Dans une première étape, on estime par la méthode des moindres carrés ordinaires l'équation de cointégration yt = α + βxt + et puis on teste dans une seconde étape la stationnarité du résidu estimé . Ce test fait office de test de cointégration. La régression qui sert de base à ce test est la suivante :

où on teste ![]()
Si les résidus sont stationnaires, on conclut que les séries sont cointégrées, et la relation de cointégration estimée est :
. Bien entendu, il convient de s'assurer au préalable que les variables en jeu sont intégrées d'ordre un. Néanmoins, étant donné que le test porte sur les résidus
calculés à partir de l'estimation de la relation de cointégration et non pas sur les vraies erreurs et qui, elles, ne sont pas observées, les valeurs critiques des tests DF ou DFA ne sont plus appropriées. Il convient d'utiliser les valeurs critiques tabulées par Engle et Granger (1987), Engle et Yoo (1987) et Davidson et MacKinnon (1993).
La deuxième étape de la procédure d'estimation consiste à estimer par la méthode des moindres carrés le modèle à correction d'erreurs, en remplaçant l'erreur d'équilibre par son estimation :
Il est clair que cette seconde étape ne pose aucun problème particulier car tous les régresseurs sont maintenant stationnaires. Les coefficients ont une distribution standard, ceux-ci peuvent alors être soumis aux techniques classiques d'inférence statistique (Engle et Granger, 1987). La cointégration implique non seulement que
est stationnaire, mais que le coefficient d'ajustement
est négatif et significatif. Ces restrictions sont nécessaires pour valider le modèle à correction d'erreurs.
La procédure en deux étapes d'Engle et Granger présente cependant un certain nombre de défauts qu'il convient de souligner. Tout d'abord, elle n'est applicable que dans le cas d'une seule relation de cointégration. Elle ne permet donc pas de différencier plusieurs vecteurs de cointégration. Or, dans un cadre multivarié, il pourrait exister plusieurs relations de cointégration. Ensuite, le choix de la variable endogène est arbitraire et influence l'issue du test. Lorsqu'il y a plusieurs variables, il se pose la question de savoir laquelle va occuper la place de l'endogène. Enfin, l'estimation de l'équation de long terme ne tient pas compte de l'information potentielle contenue dans la dynamique de court terme. Si la super convergence des estimateurs de première étape implique que ce biais s'estompe asymptotiquement, ce biais peut être non négligeable pour de petits échantillons (Stock, 1987 ; Davidson et MacKinnon, 1993 ; Banerjee, Dolado, Galbraith et Hendry, 1993). En outre, la distribution asymptotique des estimateurs de long terme n'est pas standard (Phillips et Durlauf, 1986). Par conséquent, il n'est pas possible de leur appliquer les règles d'inférence usuelles, notamment pour en étudier la significativité.
Néanmoins, il est possible d'améliorer les estimations en appliquant des procédures de correction robustes. La procédure suggérée par Stock et Watson (1993) consiste à ajouter des régresseurs supplémentaires constitués de retards et d'avances de pour conduire la régression cointégrante :
Cette façon de prendre en compte la dynamique de court terme corrige l'estimation des biais d'endogénéïté et permet ainsi d'interpréter le t-student associé au coefficient β . Si les résidus et sont autocorrélés, il suffit de corriger le t-student de β par la correction de Newey-West. Le ratio de Student ainsi corrigé suit asymptotiquement une loi normale standard.
La méthode en une étape de Banerjee et al.
Certains auteurs ont montré que l'on peut faire l'économie de calculs en estimant simultanément, en une seule étape, les paramètres de court et de long terme. Dans la méthode préconisée par Banerjee, Dolado, Galbraith et Hendry (1993), l'estimation se fait directement sur le modèle à correction d'erreurs, non pas en introduisant la relation de cointégration estimée préalablement au cours d'une première étape, mais en introduisant directement dans le modèle les niveaux retardés des variables. Le modèle estimé s'écrit sous la forme suivante:
On en déduit la relation de cointégration par division :
![]()
Cette procédure peut paraître douteuse dans la mesure où la variable expliquée est stationnaire tandis que les variables explicatives Yt-1 et Xt-1 sont non stationnaires. Cependant, dans la mesure où il existe une relation de cointégration entre les variables, l'estimation par MCO n'est pas biaisée. La cointégration est testée à partir de la statistique de Student du coefficient
. Pour accepter la cointégration, il faudrait que ce coefficient soit significativement différent de zéro et négatif.
L'approche multivariée de Johansen
Johansen (1988) a proposé une procédure de test de cointégration, qui sera répandue par la suite par Johansen et Juselius (1990), qui permet de s'affranchir du cadre restrictif d'Engle et Granger. La procédure de test est fondée sur la méthode du maximum de vraisemblance et offre la possibilité de prendre en compte plusieurs spécifications pour la relation de long terme (présence d'une constante/tendance ou non dans l'espace de cointégration). Cette méthode est décrite abondamment dans les ouvrages d'économétrie des séries temporelles. Nous nous contenterons ici d'exposer les éléments essentiels de cette approche.
La méthodologie du test de cointégration de Johansen repose sur l'estimation d'un modèle vectoriel autorégressif (VAR) par la méthode du maximum de vraisemblance. Considérons le modèle VAR(k) non structurel définit de la façon suivante:
où Xt est un vecteur de p variables, Dt un vecteur de variables exogènes incluant éventuellement une tendance et des variables indicatrices, et
un vecteur d'impulsions iid N(0,
). La plupart des variables économiques étant I(1), une différenciation est généralement appliquée. Toutefois, l'estimation du VAR en différence peut conduire à une perte importante d'information si les séries sont effectivement cointégrées. Pour tenir compte de cette dimension potentiellement cointégrée des variables économiques, Johansen (1988) et Johansen et Juselius (1990) réécrivent à partir de transformations algébriques l'équation (8.9) sous la forme Vectorielle à Correction d'Erreurs (VEC par la suite) suivante :
Cette équation peut aussi s'écrire :
L'équation (14.16) n'est en fait qu'une transformation de (14.14) de sorte à y permettre la mise en relation des variables en niveau et en différence. Cette représentation permet aux variables cointégrées d'être à l'écart de l'équilibre uniquement à court terme. Les matrices
et
renferment respectivement toutes les informations pertinentes sur la dynamique de long terme et de court terme.
La procédure du test de cointégration de Johansen repose précisément sur la détermination du rang de la matrice
, noté r , c'est-à-dire du nombre maximum de colonnes indépendantes de
ou, de façon équivalente, le nombre de ses racines caractéristiques propres différentes de zéro. Ce nombre est au plus égal à p, le nombre de variables du VAR.
Si
est de rang r, alors il existe deux matrices α et β de dimension (p x r) telles que
= αβ'. La stratégie de test repose ainsi sur le test de l'hypothèse nulle définie par :
![]()
Dans cette décomposition, β représente la matrice des vecteurs de cointégration qui rendent la combinaison linéaire β' Xt-1 stationnaire.
La procédure de test permet de spécifier trois modèles. (a) Si
est de plein rang colonne, c'est-à-dire , alors Xt est stationnaire. Dans ce cas, l'estimation sous la forme du VAR en niveau (8.9) est appropriée. (b) Si le rang de
est égal à zéro, alors
= 0 , et il n'existe aucune relation de cointégration entre les variables. Dans ce cas, la modélisation appropriée est celle d'un VAR en différence première d'ordre (k-1). Ce qui implique que la dynamique de court terme ne dépend pas des niveaux des variables. (c) Si est de rang r inférieur à , le modèle vectoriel à correction d'erreurs s'exprime sous la forme :
La matrice de poids α joue un rôle important dans cette spécification. Elle est constituée des coefficients d'ajustement de court terme, c'est-à-dire des « forces de rappel » vers l'équilibre dans la représentation vectorielle à correction d'erreurs. La ième ligne de cette matrice mesure la vitesse avec laquelle la ième variable s'ajuste aux r relations de cointégration, c'est-à-dire comment une des composantes donnée de Xt réagit à court terme à une déviation transitoire de ses déterminants de leur valeur d'équilibre de long terme. La matrice β' est la matrice qui contient les r vecteurs cointégrants linéairement indépendants. Chaque ligne de cette matrice est constituée d'une relation de long terme.
Johansen utilise la méthode du maximum de vraisemblance concentrée pour estimer les matrices α et β . Le test du rang de cointégration est déterminé par un test de nullité des p-r plus petites valeurs propres de
. Cette méthode conduit à deux statistiques de ratios de vraisemblance :
La première statistique teste l'hypothèse nulle de cointégration de rang r (H0(r) : rang(
)=r) contre l'alternative de la stationnarité (H1(r) : rang(
)=p). Cette statistique est appelée statistique de la trace. La seconde statistique teste (H0(r) : rang(
)=r) contre (H1(r) : rang(
)= r+1. Elle porte le nom de statistique de la valeur propre maximale.
De façon pratique, ces tests procèdent séquentiellement de r = 0, à r = p - 1 jusqu'à ce que l'hypothèse nulle ne puisse pas être rejetée. Les deux statistiques de test ne suivent pas une distribution du Chi-deux. Les valeurs critiques asymptotiques ont été simulées par Johansen et Juselius (1990) puis par Osterwald-Lenum (1992), et sont données directement par les logiciels d'économétrie. Elles dépendent de l'hypothèse sur les termes déterministes et du nombre de variables. On rejettera l'hypothèse nulle lorsque la statistique calculée est supérieure à la valeur critique pour une erreur de première espèce donnée. Le test de la trace est plus robuste au Skewness et au Kurtosis (donc à la normalité) dans les résidus que le test de la valeur propre maximale (Cheung et Lai, 1993 ; Gonzalo, 1994). Il arrive que les deux statistiques donnent des résultats différents. Dans ce cas, il est préférable de retenir le résultat qui peut recevoir une interprétation économique.
Il est possible d'inclure dans le modèle VEC des variables stationnaires. En effet, il est raisonnable de penser qu'une relation de long terme contient également des variables stationnaires. On augmente ainsi le nombre de valeurs propres significatives puisque le vecteur où le coefficient est égal à 1 devant la variable stationnaire et 0 devant les autres variables est aussi un vecteur cointégrant.
Le test de cointégration de Johansen comporte des avantages par rapport à la méthode en deux étapes d'Engle et Granger. Toutefois, l'issue de test dépend du choix d'un certain nombre de paramètres dont le nombre de retards et la présence de constante et de tendance dans la spécification. Ces questions sont traitées dans les paragraphes qui suivent.
Interprétation des termes déterministes
Les lois asymptotiques des statistiques de test de rang de cointégration de Johansen ne sont pas invariantes à la prise en compte des variables qui ne sont pas explicitement modélisées dans le système. En particulier, ces lois sont conditionnées par la présence éventuelle d'une constante ou d'un trend linéaire dans les relations de long terme. Plusieurs spécifications du modèle deviennent envisageables selon l'hypothèse faite sur la présence ou non de termes déterministes (constante et trend) dans les relations de cointégration et dans le modèle à correction d'erreurs. Les différentes interprétations inhérentes à ces spécifications prennent leur source dans le fait qu'un modèle VEC mélange des variables en différence et des variables en niveau modélisant un équilibre de long terme. Pour choisir entre les différentes spécifications il importe de bien cerner d'abord leur signification.
Le modèle à correction d'erreurs et l'espace de cointégration ne comportent aucun terme déterministe
:
Cette structure impose l'absence de toute composante déterministe, tant dans les séries en niveau que dans les séries en différences premières.
Le modèle à correction d'erreurs ne comporte aucun terme déterministe et la constante appartient uniquement à l'espace de cointégration:

Ce cas caractérise des séries sans tendance linéaire.
Le modèle à correction d'erreurs et l'équation de cointégration comportent une constante :

Le fait que comporte une dérive implique que les séries en niveau sont caractérisées par une tendance linéaire. Mais la relation d'équilibre de long terme est stationnaire de moyenne β0 .
Constante dans le modèle à correction d'erreurs et constante et trend dans l'équation de cointégration:
L'introduction d'une tendance linéaire dans la relation de cointégration se justifie si certaines variables de Xt présentent une tendance linéaire. La relation d'équilibre de long terme est stationnaire autour d'une tendance linéaire. Ce cas autorise la présence de variables TS.
Constante et trend dans le VAR et dans l'espace de cointégration :
Le fait que
admette une représentation avec dérive et tendance linéaire signifie que les séries en niveau Xt comportent une tendance quadratique.Il est important de distinguer clairement entre ces différents cas. Car, d'une part, ils impliquent des interprétations différentes sur le comportement des variables et, d'autre part, les tests de cointégration dépendent de la façon dont on spécifie les termes déterministes.
Test de cointégration de Pesaran et al. (2001)
Pesaran et al. (2001) ont proposé une approche du test de cointégration basée sur les modèles autorégressifs à retards échelonnés (ARDL). Cette méthodologie présente plusieurs avantages par rapport aux méthodes d'Engle et Granger (1987) et de Johansen (1988). Premièrement, ce test est applicable que les variables soient I(0) ou I(1). Cette caractéristique fondamentale atténue le problème lié à l'incertitude des résultats des tests de racine unitaire. Deuxièmement, la méthode tient compte des dynamiques de court et long termes lors du test de cointégration. Au contraire, la méthode d'Engle et Granger (1987) estime la relation de long terme sans prendre en compte explicitement les ajustements de court terme entre les variables. Troisièmement, le test de Pesaran et al. (2001) s'avère relativement performante dans le cas de petits échantillons contrairement au test de cointégration de Johansen dont la validité requiert de grands échantillons.
L'équation de base du test de cointégration s'écrit sous la forme suivante:
où Δ est l'opérateur de différence première. L'équation (14.26) pourrait inclure également une tendance et des variables indicatrices captant l'effet de certains chocs macroéconomiques dans les données. L'équation est estimée en utilisant tour à tour chacune des variables comme variable dépendante. C'est là aussi l'un des avantages de la méthode de Pesaran et al. (2001) d'indiquer explicitement laquelle des variables est dépendante et laquelle est indépendante dans la relation de cointégration. Les retards p et q sont déterminés en minimisant le critère d'Akaike (AIC).
Sous la condition à long terme Δy = Δx = 0, la forme réduite de la solution de l'équation (8.29) donne l'équation de long terme pour yt :
![]()
![]()
La procédure du test de cointégration repose sur le test de l'hypothèse
contre l'alternative que
. La statistique de test bien que classique (Fisher ou Wald) ne suit pas une loi standard. La distribution asymptotique dépend : (a) des propriétés de stationnarité des variables explicatives, (b) du nombre de variables explicatives, (c) de la taille de l'échantillon, et (d) de la présence de termes déterministes (constante et tendance) dans le modèle. Ainsi Pesaran et al (2001) ont simulé deux ensembles de valeurs critiques pour la statistique de test, avec plusieurs cas et différents seuils. Le premier ensemble correspond au cas où toutes les variables explicatives sont I(0) et représente la borne inférieure. Le second ensemble correspond au cas où toutes les explicatives sont I(1) et représente la borne supérieure . Si la F-stat. excède la borne supérieure alors il y a cointégration. Si elle est inférieure à la borne inférieure alors on rejette l'existence d'une relation de cointégration. Si la F-stat. est comprise entre les deux bornes, on ne peut pas conclure à moins de connaître l'ordre d'intégration exact des variables.






