Leçon 1 : Le Modèle Linéaire de Régression Multiple

Cours

Introduction
Spécification et hypothèses de base du modèle linéaire
Evaluation des modèles
Prévisions
Les modèles à décalages temporels
Travaux pratiques

Evaluation des modèles

Dans cette étape, on se pose les questions suivantes. La méthode d'estimation des coefficients est-elle appropriée ? Les coefficients sont-ils significatifs ? Ont-ils le signe attendu ? Le modèle théorique est-il validé ? Cette étape est très importante. Elle doit permettre d'évaluer la robustesse du modèle sur le plan statistique et la pertinence des théories économiques qui leur ont donné naissance. Lorsque la spécification retenue n'est pas satisfaisante, elle doit être modifiée puis re-estimer à nouveau avant de conclure quant à la validité ou non de la théorie.

On commence par vérifier les hypothèses sur les termes d'erreurs et ensuite les restrictions sur les coefficients. Avant de présenter ces tests, il nous faut préciser ce qu'est un test d'hypothèse. Un test d'hypothèse consiste à tester une hypothèse nulle notée le plus souvent H₀contre une hypothèse alternative notée H₁. Il ne s'agit pas d'une démonstration à proprement dite. Conformément à une démarche d'infirmation, ne pas rejeter H₀ ne signifie pas obligatoirement que celle-ci est vraie, mais seulement que les données disponibles ne sont pas en contradiction avec cette hypothèse et que l'on n'a pas de raison suffisante de lui préférer l'hypothèse alternative compte tenu des résultats obtenus sur l'échantillon. Rejeter H₀ n'entraîne nullement l'acceptation de H₁. En effet, l'issu du test d'une hypothèse dépend de l'hypothèse alternative à laquelle on la confronte.

Par nature, le jugement sur échantillon ne permet pas de décider avec certitude. Nous ne pouvons pas être sûr que l'hypothèse examinée est juste ou fausse. Il nous faudrait pour cela examiner la population dans sa totalité, ce qui est impossible, voire parfois sans intérêt. C'est pour cela, pour effectuer un test d'hypothèses, on se fixe une probabilité d'erreur a priori notée , appélée encore erreur de première espèce ou seuil de signification: c'est la probabilité de rejeter l'hypothèse nulle sachant qu'elle est vraie. On choisit, dans la pratique, un faible :1%, 5% ou 10%. Les logiciels statistiques calculent un niveau de probabilité qu'on appelle la p-value qui réprésente le seuil d'erreur minimal pour lequel la statistique de test rejette l'hypothèse nulle. La p-value a l'avantage d'être directement interprétable : on rejette l'hypothèse nulle lorsque la p-value est inférieure à α.

Tests de diagnostic sur les résidus

Test de normalité

Pour réaliser le test de normalité, sélectionnez View/Residual Tests/Histogram-Normality Test. On obtient le graphique suivant:

Figure 11.1 : Histogramme de la série des résidus de l'équation (11.3)

Ce graphique présente la distribution de fréquence de la série des résidus dans un histogramme. La distribution normale est caractérisée graphiquement par:

Une symétrie des observations autour de la moyenne: on observe autant d'observations en-deçà de la moyenne que d'observations au-délà de la moyenne;
Une forte concentration des observations autour de la moyenne;
Le nombre d'observations diminue rapidement lorsque l'on s'écarte de la moyenne. On dit que les queues de distribution sont peu épaisses ou que la distribution est mesokurtique.

Cependant, un certain nombre d'ambiguités compliquent l'interprétation « visuelle » de l'histogramme. Tout d'abord, l'histogramme ne donne une répresentation fidèle de la vraie densité que si le nombre d'observations est suffisamment important. Si le nombre d'observations est "faible", la forme de l'histogramme sera moins suggestive. Ensuite, des lois de probabilités différentes voient les réprésentations graphiques de leurs fonctions de densité être semblables de sorte qu'il n'est pas toujours possible que l'on puisse distinguer le processus générateur des séries issus de ces lois à partir de l'étude des seuls histogrammes. Par exemple les distributions de probabilités de la loi normale et de la loi de Student sont pratiquement indiscernables.

A droite de l'histogramme se trouvent un ensemble de statistiques descriptives portant sur la série des résidus : la moyenne, la médiane, le maximum, le minimum et l'écart-type. En plus de ces statistiques, EViews reporte des indicateurs de forme qui permettent d'apprécier la normalité de la série. Le Skewness mesure l'asymétrie de la distribution autour de sa moyenne. Le Skewness d'une distribution symétrique, comme la distribution normale, est nulle. Ainsi un Skewness positif signifie que la distribution est décalée vers la droite et une valeur négative signifie que la distribution a une longue queue vers la gauche. Dans notre cas, le Skewness n'est pas trop éloigné de zéro.

Le Kurtosis mesure le degré d'aplatissement de la distribution. Le Kurtosis d'une distribution normale est égal à 3. Si le Kurtosis reporte une valeur supérieure à 3 alors la distribution est plus pointue par rapport à la normale (elle est dite leptokurtique) ; si la valeur du Kurtosis est inférieure à 3, la distribution est plus aplatie que la normale (elle est dite platikurtique). Dans notre cas, le Kurtosis approche la valeur 3.

La statistique de Jarque-Bera propose un test de normalité qui tienne compte du Skewness et du Kurtosis. Elle est définie par:

Où k est le nombre de coefficients utilisés pour générer la série, K le Kurtosis et S le Skewness.

Sous l'hypothèse de normalité, la statistique de Jarque-Bera est distribuée suivant une loi du X² à 2 degrés de liberté. La probabilité reportée représente la probabilité que X² excède la valeur calculée. Une probabilité inférieure à 0,05 conduit à rejeter l'hypothèse nulle d'une distribution normale au seuil de 5%. Dans notre cas, la statistique de Jarque-Bera reporte une valeur de 2,99 et une probabilité de commettre une erreur de première espèce de 0,22. Autrement dit, si on rejette l'hypothèse de normalité des résidus, il y a 22% de chances de prendre une mauvaise décision. Cette probabilité étant bien supérieure à 5%, on ne peut donc rejeter l'hypothèse de normalité des résidus au seuil de 5%. Nous sommes donc amenés à accepter l'hypothèse que les termes d'erreur suivent une distribution normale.

Pour réaliser ces tests, double-cliquez sur la série des résidus RES, et sélectionnez View/Distribution/Empirical Distribution Tests.

La distribution théorique est la distribution normale. Cette distribution est caractérisée par sa moyenne et son écart-type. En ne renseignant pas ces paramètres, EViews les estime par la méthode du maximum de vraisemblance sous l'hypothèse de normalité. Cliquez alors sur OK pour obtenir les résultats.

Le tableau des résultats (cf. Tableau 11.2) comporte deux parties. La première partie (PARTIE I) présente les statistiques de tests et les probabilités critiques correspondantes. La colonne « Value » donne les valeurs asymptotiques des statistiques de tests et la colonne « Adj.Value » corrige ces valeurs pour tenir compte à la fois de la taille finie de l'échantillon et de l'incertitude sur les estimations des paramètres de la distribution théorique. La dernière colonne indique les probabilités des valeurs ajustées.

Les statistiques de Lilliefors, de Cramer-von Mises, de Watson et d'Anderson-Darling conduisent toutes à accepter l'hypothèse de normalité de la série des résidus.

Tableau 11.2 : Statistiques du test de normalité des résidus de l'équation (11.3)

La seconde partie du tableau (PARTIE II) indique les valeurs des paramètres utilisées pour calculer la fonction de densité théorique. La moyenne de la série résiduelle RES est estimée à 1.97x10^-15 avec une probabilité égale à 1, indiquant que les erreurs ont une moyenne qui n'est pas significativement différente de zéro. L'écart-type est estimé à 0.04282 avec une probabilité qui indique que ce paramètre est significativement différent de zéro. On remarquera que ces valeurs sont les mêmes que celles reportées dans l'histogramme des résidus. Dans la partie inférieure du tableau on peut lire la valeur de la fonction de vraisemblance ainsi que le nombre de paramètres estimés (moyenne et écart-type). Pour revenir au tableau des estimations, cliquez sur l'onglet Stats .

Test d'hétéroscédasticité

L'hétéroscédasticité qualifie des données qui n'ont pas une variance constante. Le problème de l'hétéroscédasticité se rencontre plus fréquemment sur des données en coupe instantanée ou bien sur des données groupées. Elle prend souvent une forme particulière sur des données temporelles. Néanmoins, il est important dans tous les cas de savoir la détecter et la corriger.

Plusieurs tests existent pour détecter l'hétéroscédasticité. Il s'agit en particulier des tests suivants :

Test de Goldfeld et Quandt (1965)
Test de Breusch et Pagan (1979)
Test de Glesjer (1969)
Test de White (1980)

L'idée générale de ces tests est de vérifier si le carré des résidus peut être expliqué par les variables du modèle. Si c'est le cas, il y a hétéroscédasticité. Dans le contexte du test d'hétéroscédasticité de White, l'hypothèse nulle est que tous les coefficients de la régression des carrés des résidus sont nuls, c'est-à-dire les variables du modèle n'expliquent pas la variance des termes d'erreurs. Dans les tests de Goldfeld et Quandt et de Breusch et Pagan, les variables responsables de l'hétéroscédasticité peuvent être des variables extérieures au modèle, c'est-à-dire des variables qui ne font pas partie des variables exogènes. Il est clair qu'en pratique trouver de telles variables n'est pas toujours une tâche aisée. Ces deux derniers tests ne sont pas encore disponibles en mode interactif sous EViews. Toutefois, ils peuvent être programmés sous grande difficulté.

Nous allons tester l'hypothèse d'hétéroscédacticité à l'aide du test de White. Nous l'appliquons ici dans sa forme complète, c'est-à-dire en introduisant dans l'équation non seulement les variables explicatives et leurs carrés mais également les doubles produits. Pour ce faire, sélectionnez View/Residual Tests/White Heteroskedasticity (cross terms). Le tableau qui s'affiche donne la régression de White. Les statistiques sur lesquelles est basé le test de White figurent dans le haut du tableau. Il s'agit des tests de Fisher (F-statistic) et du Chi-deux. La statistique du test de White est égale au produit du nombre d'observations et du coefficient de détermination de la régression de test (Obs*R-squared). Le résultat du test figure dans le tableau suivant:

Tableau 11.3 : Statistiques du test d'hétéroscédasticité de White

A chaque statistique de test est associée une probabilité. L'hypothèse d'homoscédasticité ne peut être rejetée au seuil de 5% car la probabilité de se tromper en rejetant cette hypothèse est de 69%.

Remarque :

Lorsque le test conclue à l'existence d'une hétéroscédasticité, on peut chercher à en détecter la source et proposer une méthode de correction. Le principe de la correction consiste à modifier l'écriture de l'équation afin de rendre les erreurs homoscédastiques. On peut par exemple représenter graphiquement le nuage de points entre la série des résidus et chacune des variables explicatives. La présence d'une hétéroscédasticité implique une variation systématique de la variance des résidus en fonction de la variable causale. Pour corrige ce problème, on applique la méthode des moindres carrés pondérés qui consiste à multiplier les variables initiales par l'inverse de la variable causale. On peut aussi utiliser les procédures de correction proposées par White (1980) et Newey et West (1978), disponibles en options dans la fenêtre de spécification. Ces procédures apportent une correction seulement au niveau de l'estimation des écart-types des coefficients. La procédure de White propose une correction sans préciser la forme de l'hétéroscédasticité. Elle utilise les estimateurs sans biais des coefficients obtenus par les moindres carrés ordinaires, et estime ensuite la matrice de variance-covariance de façon convergente. La procédure de Newey et West estime cette matrice sous l'hypothèse d'une hétéroscédasticité et d'une autocorrélation de formes inconnues.

Test d'autocorrélation

L'autocorrélation des erreurs signifie que le terme d'erreur correspondant à une période est corrélé avec le terme d'erreur d'une autre période. Si cette corrélation joue entre deux termes consécutifs (e_t et e_t-1),

on parle d'autocorrélation d'ordre un. La plupart des applications sur des données annuelles impliquent des autocorrélations d'ordre un. Dans les séries temporelles, l'autocorrélation des erreurs peut avoir plusieurs origines. Elle peut provenir de phénomènes de mémoire ou d'inertie dans la fonction de comportement des agents. Elle peut également être liée à une erreur de spécification de la forme fonctionnelle ou à une erreur de mesure ou encore à l'omission d'une variable explicative pertinente corrélée dans le temps. Dans le cas des données transversales, il est possible d'observer une autocorrélation spatiale si les observations ont été préalablement rangées selon un certain ordre, par exemple géographique.

Il existe plusieurs tests de l'autocorrélation des erreurs. Les plus couramment utilisés sont :

le test de Durbin et Watson (1950 et 1951)
le test de Ljung et Box (1979)
le test de Breusch et Godfrey (1978)

Test de Durbin et Watson

Les conditions d'application du test de Durbin et Watson supposent que les variables explicatives ne sont pas aléatoires, ce qui implique que la variable endogène retardée ne figure pas parmi les variables explicatives (sinon elle serait corrélée avec les termes erreurs en cas d'autocorreléation). De plus, le modèle doit être spécifié avec une constante parmi les explicatives et les erreurs doivent suivre une loi normale. Ce test ne s'applique que sur des données temporelles. Le modèle (11.3) remplit bien toutes ces conditions.

Le test de Durbin et Watson cherche à detecter seulement une autocorrélation d'ordre un de la forme .Il teste l'hypothèse contre . La statistique de Durbin-Watson se lit directement dans le tableau des estimations. Elle est liée au coefficient d'autocorrélation des erreurs par la formule

Cette formule s'avère utile en pratique car elle permet dans certains cas d'avoir très rapidement une idée sur l'autocorrélation des erreurs. La valeur calculée de DW est comprise entre 0 et 4. Une valeur proche de 2 indique une absence d'autocorrélation des erreurs tandis qu'une valeur proche de zéro ou de 4 est révélatrice d'une autocorrélation des erreurs (autocorrélation positive ou négative). Pour des valeurs qui s'éloignent de ces deux valeurs, il faut consulter les valeurs critiques tabulées par Durbin et Watson pour pouvoir décider en toute assurance.

Dans notre cas, la statistique de Durbin-Watson reporte une valeur de 1,302 qui n'est ni proche de zéro ni proche de 2. Le recours à la table de Durbin et Watson est donc nécessaire pour conclure. On lit dans la table de Durbin et Watson pour n = 38 et k = 3, d₁ = 1.32 et d₂ = 1.66. La valeur de la statistique DW se situe à droite de , nous pouvons conclure à une autocorrélation positive des résidus, donc à une présomption de dépendance des erreurs.

Analyse du corrélogramme et test de Ljung et Box

Le corrélogramme d'une série est la représentation graphique des coefficients de corrélation de la série avec elle-même décalée de k périodes. Le corrélogramme permet une interprétation instantanée de la significativité des coefficients d'autocorrélation. Pour obtenir le corrélogramme de la série des résidus, sélectionnez View/Residual Tests/ Correlogram- Q-statistics...

Figure 11.2 : Corrélogramme de la série des résidus de l'équation (11.3)

La colonne AC indique les autocorélations et la colonne PAC indique les autocorrélations partielles. La statistique du test de Ljung-Box est donnée par la Q-Stat avec sa probabilité critique dans les deux dernières colonnes. Cette statistique teste la significativité globale de plusieurs coefficients d'autocorrélation.

Le corrélogramme permet d'identifier rapidement les termes significatifs des fonctions d'autocorrélation simples et partielles. Les bornes de l'intervalle de confiance sont stylisées par les pointillés horizontaux ; chaque terme qui sort de cet intervalle est significativement différent de zéro au seuil de 5%. S'il n'y a pas d'autocorrélation, tous les coefficients AC et PAC devraient être proches de zéro, et toutes les Q-statistiques seraient non significatives avec des probabilités élevées. Si les coefficients AC sont décroissants géométriquement et les PAC non significatifs à partir d'un retard d'ordre p, alors la série obéit à un processus autorégressif d'ordre p (AR(p)). En revanche, si les AC sont non significatifs à partir d'un ordre q et les PAC décroissant géométriquement, alors la série suit un processus moyenne mobile d'ordre q (MA(q)).

On observe ici que seul le premier terme du corrélogramme sort de l'intervalle de confiance. En effet, la Q-stat de Ljung-Box reporte une valeur de 3.883 avec une probabilité de 0.049 inférieure à 0.05. Nous rejetons donc l'hypothèse de nullité du premier coefficient d'autocorrélation.

Test de Breusch et Godfrey

Contrairement au test de Durbin et Watson, le test de Breusch et Godfrey permet de tester une autocorrélation d'ordre supérieur à 1 et reste valable en présence de la variable endogène retardée parmi les variables explicatives. Pour réaliser ce test, sélectionnez View/Residual Tests/ Serial Correlation LM Test.... Précisez l'ordre de l'autocorrélation et cliquez sur OK. Pour un nombre de retards égal à un, on obtient le tableau suivant:

Tableau 11.4 : Statistiques du test d'autocorrélation de Breusch-Godfrey

La statistique de test de Breusch-Godfrey reporte une valeur de 4.141 et une probabilité de 0.041. Ces valeurs nous amènent à rejeter l'hypothèse nulle d'absence d'autocorrélation d'ordre un des erreurs.

On retient finalement l'hypothèse d'une autocorrélation des erreurs à l'ordre un. L'équation de consommation doit donc être re-spécifiée et re-estimée avant d'être utilisée pour la prévision ou la prise de décision. A cet égard, plusieurs techniques ont été proposées: la méthode itérative de Cochrane-Orcutt, la procédure de Prais-Winsten, la méthode du balayage de Hildreth-Lu, la méthode du maximum de vraisemblance et la méthode des variables instrumentales.

Nous allons re-estimer le modèle en retenant une autocorrélation d'ordre 1. Pour cela, cliquez sur Estimate dans le menu de l'équation pour retourner à la spécification de l'équation, et ajoutez un terme AR(1) à la fin de l'équation. Cliquez sur OK pour valider. Vous obtenez le tableau de résultats suivant:

Tableau 11.5 : Coefficients de régression en présence d'erreurs AR(1)

Les coefficients estimés, les écart-types et les statistiques s'interprètent de la façon habituelle. Le coefficient estimé du terme AR(1) est le coefficient de l'autocorrélation sérielle des résidus inconditionnels. On constate que ce coefficient est significatif au seuil de 10% et est inférieur à l'unité. Rappelez-vous que plusieurs raisons peuvent être à l'origine de l'autocorrélation des erreurs, dont l'omission de variables explicatives pertinentes. Aussi, est-il possible de corriger l'autocorrélation des erreurs en introduisant des retards de la variable endogène parmi les variables explicatives. Nous reviendrons sur ce point lorsque nous aborderons les modèles à décalages temporels.

Tests de restrictions linéaires sur les coefficients

Les tests de restrictions linéaires sur les coefficients sont de trois types : le test de significativité globale des coefficients, le test de significativité individuelle des coefficients et le test de stabilité.

Test de significativité globale des coefficients : le test de Fisher

Le test de significativité globale des coefficients cherche à savoir s'il existe au moins un coefficient parmi tous les coefficients, à l'exception de la constante, qui soit significativement différent de zéro, c'est-à-dire une variable explicative qui influence significativement la variable endogène. On teste donc l'hypothèse nulle selon laquelle tous les coefficients du modèle, à l'exception de la constante, sont égaux à zéro, contre l'hypothèse alternative selon laquelle il existe au moins un coefficient différent de zéro.

Ce test est réalisé à partir de la statistique de Fisher. Celle-ci figure directement dans le tableau des résultats. Si l'hypothèse nulle est acceptée, cela signifie qu'il n'existe aucune relation linéaire significative entre la variable endogène et les variables explicatives retenues. Il faudrait alors rechercher une spécification plus adéquate de la dynamique de la variable endogène.

La valeur de la statistique de Ficher reporte ici une valeur de 642,746 avec une probabilité presque nulle. Manifestement les coefficients sont globalement significatifs, ce qui signifie que, prises ensemble, les trois variables explicatives influencent de façon significative les variations de la consommation.

Le coefficient de détermination et le test de Fisher

Le coefficient de détermination est un indicateur statistique qui permet d'évaluer le pouvoir explicatif global du modèle puisqu'il fournit la part de la variance expliquée par le modèle. Il permet de juger de la qualité de l'ajustement. On s'aperçoit que la valeur du coefficient de détermination est très élevée: 98% des variations de la consommation (en log) est expliquée par le modèle, ce qui est très satisfaisant.

Il existe une relation entre la statistique de Fisher et le R²:

Où T est le nombre d'observations et k le nombre de variables explicatives véritables, c'est-à-dire sans la constante. La statistique de Fisher croît avec le R²: : à des valeurs élevées du correspondent des valeurs élevées de F. Ainsi, au lieu de tester, grâce à la statistique F, la significativité globale des variables explicatives, il est approximativement équivalent de tester la significativité de . Si l'hypothèse alternative est acceptée, on doit s'attendre à ce que R² et F prennent une valeur élevée.

Si le coefficient de détermination R² est une statistique très facile à comprendre, il faut cependant se garder d'y attacher trop d'importance, car il présente un défaut gênant. En effet, le R² augmente de façon mécanique avec le nombre de variables explicatives, même si celles-ci n'ont aucun rapport avec la variable endogène. A la limite, quand le nombre de variables explicatives est égal au nombre d'observations, on obtient un R² égal à 1 et la variable endogène est expliquée à 100%, quelle que soit la pertinence économique des variables explicatives retenues, pourvu que l'hypothèse d'indépendance linéaire soit respectée. On comprend alors pourquoi le R² n'est pas pertinent pour comparer le pouvoir explicatif de plusieurs modèles ne comportant pas le même nombre de degrés de liberté. Il convient de calculer une version pénalisée du R² par les degrés de liberté, appelée R² ajusté (Adjusted R-squared). Le coefficient de détermination ajusté se calcule à partir de l'expression suivante :

Il est important de noter que le coefficient de détermination n'est interprétable que si l'équation estimée comporte une constante. En effet, lorsque le modèle ne comporte pas de terme constant, l'équation de décomposition de la variance de la variable expliquée n'est plus vérifiée. Dans ce cas, le peut donner une valeur négative.

Test de significativité individuelle des coefficients : le test de Student

Dire qu'un coefficient est significatif signifie que la variable explicative correspondante contribue de façon significative à l'explication de la variable endogène. La significativité d'un coefficient est testée à partir du t de Student. On teste l'hypothèse d'un coefficient nul contre l'hypothèse alternative d'un coefficient différent de zéro (positif ou négatif, le test étant bilatéral).

Un coefficient sera significatif si la probabilité est inférieure au seuil de 5%. Cette probabilité apparaît dans la dernière colonne du tableau des estimations (cf. tableau 11.5). Rappelons que cette probabilité est calculée sur la base de l'hypothèse de normalité des termes d'erreurs. Pour la variable LPIBR, la probabilité est presque nulle. Par conséquent, quel que soit le seuil retenu, cette variable contribue significativement à expliquer le niveau de la consommation. L'élasticité-revenu de la consommation est égale à 0,92, ce qui signifie que, toutes choses égales par ailleurs, une augmentation du revenu de 10% entraîne un accroissement de la consommation de 9,2%. On constate également que le coefficient de la variable de prix est significatif au seuil de 5%. En revanche, l'utilisation des probabilités permet de rejeter, sans ambiguïté, le caractère significatif des dépenses publiques. En effet, le rejet de l'hypothèse nulle entraîne une probabilité d'erreur de 54%. On peut cependant continuer à interpréter les résultats de l'estimation dans la mesure où le maintien d'une variable explicative non significative ne biaise pas les estimations sous les hypothèses habituelles. Toutefois, si le modèle doit être utilisé à des fins de prévision, on peut être amené à éliminer cette variable conformément au principe de parcimonie.

La non significativité de la variable LGT peut apparaître surprenante dans la mesure où cette variable présente une très forte corrélation avec la consommation. En fait, il existe une très forte corrélation entre les trois variables explicatives, qui fait peser un risque de multicolinéarité. Or la multicolinéarité entre les variables explicatives d'un modèle linéaire conduit à des écarts-types des coefficients élevés, donc à des statistiques de Student faibles, conduisant à la non significativité des coefficients alors que le coefficient de détermination reporte une valeur élevée. En outre, en présence de multicolinéarité approchée, il est difficile, sinon impossible, d'isoler l'effet intrinsèque de chacune des variables explicatives sur l'endogène (il y a confusion des effets), car toute variation de l'une des variables explicatives implique une variation des autres variables. En supprimant tour à tour chacune des variables, on constate que les autres variables présentent des coefficients significatifs. Mais la forte colinéarité entre les variables génère un coefficient non significatif pour la dernière variable. On rencontre très souvent ce genre de problème d'adéquation entre la théorie économique et la pratique économétrique : en théorie on peut supposer que des variables sont orthogonales mais lors de la modélisation on se rend compte qu'elles sont liées entre elles. On peut obtenir des coefficients non significatifs ou affectés d'un signe erroné.

En réalité, le coefficient de corrélation simple n'est pas trop révélateur du degré de liaison réelle entre deux variables. Il est d'une utilité limitée lorsqu'on travaille avec plusieurs variables. On préfère dans ces conditions utiliser le coefficient de corrélation partielle qui mesure la liaison ou corrélation nette entre deux variables lorsque l'influence d'une tierce variable est retirée. Le coefficient de corrélation partielle permet de mieux juger de la pertinence d'inclure une variable explicative dans un modèle. Ainsi plus le coefficient de corrélation partielle d'une variable est élevé, plus sa contribution est importante à l'explication des variations de la variable endogène. Dans notre exemple, le coefficient de corrélation partielle entre la consommation et les dépenses publiques est égal à 0,124 avec une probabilité de 0.472. Ainsi, lorsqu'on contrôle par le revenu et les prix, l'influence des dépenses publiques sur la consommation devient non significative.

Il existe plusieurs techniques pour détecter la multicolinéarité entre les variables explicatives, dont le test de Klein et le test de Farrar-Glauber³ . La procédure du test de Klein (1962) consiste à comparer le coefficient de détermination R² du modèle et les coefficients de détermination entre les variables explicatives considérées deux à deux Il y a présomption de multicolinéarité lorsque la plupart des R² . On peut alors préférer régresser chaque variable explicative sur toutes les autres variables explicatives. Si les coefficients de détermination sont élevés, alors il y a présomption de multicolinéarité. Il existe différentes techniques pour surmonter ou du moins réduire l'inconvénient de la multicolinéarité. La parade la plus souvent utilisée consiste à éliminer certaines variables explicatives. La pertinence de cette méthode peut toutefois être questionnée. D'une part, l'élimination d'une variable peut entraîner une erreur de spécification si la théorie économique postule précisément que cette variable doit être inclue dans le modèle. D'autre part, l'élimination d'une variable explicative significative corrélée avec les autres variables explicatives peut entraîner le rejet de l'hypothèse d'exogénéïté de ces dernières et être à l'origine d'un biais d'estimation.

Il existe d'autres méthodes pour corriger les effets d'une forte multicolinéarité. On peut chercher à augmenter le nombre des observations ou bien transformer la relation fonctionnelle qui lie les variables explicatives à la variable endogène.

Test de stabilité des coefficients : les tests de Chow et de CUSUM

La prévision à partir d'un modèle économétrique repose sur l'hypothèse de constance dans le temps et dans l'espace des coefficients du modèle. Cette hypothèse signifie que sur la période d'estimation le comportement des agents n'a pas connu de changement structurel important. Cette constance des paramètres de comportement est à la base des simulations qui vont être faites pour évaluer l'impact de différentes politiques économiques. Des ruptures structurelles dans la valeur des coefficients peuvent évoquer un problème de spécification du modèle. On se souvient de la critique de Lucas selon laquelle l'utilisation des modèles économétriques traditionnelles, pour simuler les effets des changements de politique économique, est incorrecte dans la mesure où des agents dotés d'anticipations rationnelles vont modifier leur comportement en réaction à des changements dans les règles du jeu. Il en résulte une instabilité des paramètres du modèle.

Il est donc important de compléter la série des tests économétriques par des tests de stabilité. Ces tests s'intéressent plus généralement à des questions du genre : peut-on considérer qu'il y a eu un changement dans le comportement de consommation des ménages après une date donnée? La propension marginale à consommer est-elle restée constante sur toute la période d'estimation? Le comportement de consommation des hommes ou des ivoiriens est-il identique à celui des femmes ou des Maliens? Lorsqu'on travaille sur des données temporelles, les tests de stabilité prennent la forme de tests de stabilité temporelle ou structurelle. Sur des données en coupe instantanée, il s'agit de tests d'homogénéité de comportements (hommes/femmes ; riches/pauvres etc.).

Il existe plusieurs tests de stabilité dont les plus utilisés sont le test de Chow et les tests CUSUM et CUSUMQ de Brown, Durbin et Evans (1975).

Le test de Chow

Le test de Chow effectue un test de Fisher en comparant les estimations des coefficients sur deux ou plusieurs sous périodes. Il nécessite d'indiquer une ou plusieurs dates de rupture dans les séries, ce qui requiert une analyse exploratoire plus précise des séries.

Nous allons réaliser le test de Chow en considérant les deux sous périodes 1965-1993 et 1994-2002. A partir du menu de l'équation, sélectionnez View/Stability Tests/Chow Breakpoint Test... et entrez 1994 dans la boîte de dialogue qui apparaît. Cette date correspond à la date supposée de rupture. Cliquez sur OK pour obtenir le tableau suivant :

Tableau 11.6 : Résultat du test de stabilité de Chow

La statistique de Fisher reporte une probabilité supérieure à 5% : on ne peut donc pas rejeter au seuil de 5% l'hypothèse de stabilité des coefficients. En d'autres termes, l'année 1994 n'introduit pas un changement structurel significatif dans le comportement de consommation des ménages. Notons que le test de Chow n'est pas pertinent si la date choisie ne correspond pas à la véritable date de rupture.

Les tests CUSUM et CUSUMQ

Les tests CUSUM et CUSUMQ dispensent de la connaissance préalable de la date de rupture.

Ces tests sont basés sur les résidus récursifs. Le CUSUM utilise la somme cumulée des résidus récursifs tandis que le CUSUMSQ utilise le carré des résidus récursifs.

Pour mettre en œuvre ces tests, sélectionnez, à partir du menu de l'équation, View/Stability Tests/Recursive Estimates... Il suffit de cocher la case correspondante au test que l'on veut faire (CUSUM ou CUSUMQ). Les résultats pour les tests CUSUM et CUSUMQ sont représentés dans les graphiques suivants :

Si les courbes sortent du corridor stylisé par les droites en pointillés, on conclut qu'il y a instabilité du modèle. Sinon, le modèle peut être considéré comme stable sur toute la période. Ici, aucune des statistiques CUSUM et CUSUMQ ne franchit les droites: nous pouvons donc conclure que le comportement de consommation des ménages est resté stable sur toute la période d'étude.

Figure 11.5 : Evolution des séries CONS et CONSF

Les statistiques figurant à droite du graphique de CONSF (cf. figure 11.4) permettent de procéder à une évaluation statistique de la qualité prédictive du modèle. Root Mean Squared Error et Mean Absolute Error sont des statistiques qui dépendent de l'échelle de mesure de la variable endogène. Elles permettent de comparer les prévisions d'une même endogène pour différents modèles. Mean Absolute Percentage Error (MAPE) et Theil Inequality Coefficient sont indépendantes de l'échelle de mesure de la variable endogène. Le coefficient d'inégalité de Theil est compris en 0 et 1, une valeur proche de zéro indiquant une bonne adéquation. La moyenne des carrés des erreurs de prévision (Mean Squared Error) est décomposée suivant trois types de proportions. Bias Proportion indique combien la moyenne des prévisions s'écarte de la moyenne des valeurs actuelles de la série. Variance Proportion indique combien la variation des valeurs prévisionnelles s'écarte de celle des valeurs actuelles. Covariance Proportion mesure les erreurs de prévision non systématiques. Pour une bonne prévision, les deux premières proportions devraient fournir des valeurs faibles.

Notons que EViews n'affiche ces différentes statistiques que lorsque les valeurs de la variable endogène sont renseignées sur la période de simulation. Il s'agit en effet de comparer les valeurs prédites avec les valeurs réellement observées de la variable endogène. En pratique, on utilise ces statistiques pour évaluer l'adéquation des prévisions avec les réalisations. Si cette adéquation est bonne alors on peut procéder à la prévision proprement dite de la variable endogène. Dans notre exemple, MAPE= 3,378% et Theil=0,023. La performance prévisionnelle du modèle est donc bonne.

Cette méthode d'évaluation présente cependant un biais : elle fournit le plus souvent une mesure optimiste de la capacité prédictive du modèle car elle applique le modèle à des données qui ont servi à le construire. Une autre façon d'apprécier plus objectivement la capacité prédictive d'un modèle consiste à utiliser le modèle pour prédire les valeurs de la variable endogène pour une période non comprise dans l'échantillon d'estimation et à vérifier si les valeurs prédites sont suffisamment proches des valeurs effectivement observées durant cette période. Cette approche repose sur l'hypothèse de stabilité structurelle du modèle.

Prévision sur l'horizon 2003-2015

Nous allons maintenant procéder à la prévision de la consommation sur la période 2003-2015. Pour obtenir les prévisions nous devons d'abord étendre la taille du workfile (Range) et celle de l'échantillon (Sample). Ensuite, nous devons renseigner les valeurs futures du revenu et du prix. De façon pratique, voici les étapes à suivre:

Sélectionnez, à partir du menu du workfile, Procs/Change Workfile Range. Changez la date de fin en 2015. On peut aussi double-cliquer sur Range.
Augmentez le nombre d'observations de l'échantillon en sélectionnant Procs/Sample ou en double-cliquant sur l'onglet Sample de la barre de menu du workfile. Changez la date de fin en 2015 et cliquez sur OK. On peut constater visiblement ces changements dans le workfile ;
Ouvrez la série PIBR. Les valeurs pour 2003-2015 sont marquées par « NA ». Entrez les valeurs pour la période 2003-2015. Nous allons générer ces valeurs en supposant une augmentation des revenus de 10% par an de 2003 à 2015. Sous cette hypothèse, les valeurs du revenu réel et du prix sont données dans le tableau suivant:

Tableau 11.7 : Valeurs de PIBR et IPC de 2003 à 2010

Retournez à l'équation et cliquez sur Forecast. Précisez la période de prévision qui est 2003-2015.

Les prévisions de consommation sont données dans le tableau suivant:

Tableau 11.8: Consommation prévisionnelle de 2003 à 2015

Quatre types d'erreurs entachent la qualité des prévisions : l'incertitude sur l'évolution future des termes d'erreur; l'incertitude sur les coefficients structurels; l'incertitude sur les valeurs futures des variables explicatives et l'erreur sur la spécification du modèle. L'incertitude sur les termes d'erreur provient du fait que ces termes ne sont pas connus sur la période de prévision, ils sont remplacés par leur valeur moyenne (ici zéro). Or si cette moyenne est nulle sur une période, les valeurs individuelles peuvent cependant être non nulles. Plus l'erreur individuelle sera importante, plus l'erreur de la prévision sera grande. L'erreur-type fournit une mesure statistique de la variation des erreurs individuelles.

L'incertitude sur les coefficients structurels provient du fait que ces derniers sont estimés. Il se peut donc que ces estimations dévient des valeurs vraies des coefficients. Les écart-types des coefficients donnent une idée sur la précision avec laquelle ces coefficients sont estimés. L'effet de ces incertitudes sur la prévision dépend de la trajectoire prévisionnelle des variables exogènes. Plus ces variables dévieront fortement de leurs tendances moyennes, plus grande sera l'imprécision des prévisions. La connaissance imprécise des valeurs futures des variables exogènes introduit un élément supplémentaire d'incertitude dans la prévision de la variable endogène. La qualité des prévisions dépend également du choix de la spécification du modèle. Par exemple, si l'on adopte une spécification linéaire de façon « mécanique » alors qu'en réalité la relation véritable est non linéaire, les prévisions seront mauvaises. C'est pour ces diverses raisons que la prévision conditionnelle ne doit pas être utilisée sur un horizon temporel assez long. Les techniques de prévision utilisant la méthodologie de Box et Jenkins s'avèrent moins exigeantes en conjectures dans la mesure où elles utilisent seulement l'information contenue dans la mémoire des séries pour former les prévisions.

Accueil

Imprimer