Download ppt - Méthodes de prévision (STT-3220)

Méthodes de prévision (STT-3220)

Section 5

Modélisation de séries chronologiques avec la méthodologie de Box-Jenkins

Version: 11 décembre 2008

STT-3220; Méthodes de prévision2

Identification des modèles ARIMA

On désire ajuster un modèle ARMA(p,q):

Un autre type de modèles est le modèle ARIMA(p,d,q):

Un modèle ARIMA est simplement un modèle dont la dième différence est ARMA.

.,1 0 taBZBB ttd

.,0 taBZB tt


Méthode de Box et Jenkins

Box et Jenkins ont popularisé l’utilisation des modèles ARMA, en insistant sur les étapes nécessaires à la modélisation d’une série chronologique quelconque:

Les trois étapes sont:– Identification des modèles (choix des ordres p, d et q).– Estimation des paramètres; moindres carrés

conditionnels, inconditionnels, maximum de vraisemblance.

– Validation du modèle (statistiques portmanteau; prévisions).


Étape 1: Identification

1. Est-ce que la variance semble constante?– On veut s’assurer que le terme de variance dans le

modèle est constant, par exemple comme fonction du temps.

– Transformations populaires: Transformation racine, transformation inverse, transformation

logarithmique. Préférablement (mais de manière optionnelle dans le cours),

méthodologie de Box-Cox pour trouver la transformation.

– On veut stabiliser la variance, et en plus, se rapprocher de la normalité des erreurs.


Transformation de Box-Cox

La transformation a la forme:

Le choix de se fait souvent en effectuant un graphique de la vraisemblance en fonction de

.0,log

,0,1

y

yy


Identification (suite)

2. Choix du niveau de différentiation. Ici on veut une série stationnaire. En particulier la moyenne ne doit pas dépendre du temps.

Si la série est stationnaire: Si est ARMA(p,q), alors les autocorrélations (k) sont en nombre infini et décroissent vers 0 plutôt rapidement.

Un estimateur de (k) est donné par r(k).

tZ


Identification (suite)

De plus, on devrait avoir que:

Cependant, la série est non-stationnaire, que se passe-t-il? On sait que cov(Zt,Zt-k) va dépendre de k, mais aussi de t. Ainsi les autocorrélations (k) ne sont pas définies. Mais que sera la comportement des statistiques r(k)?

kkrP

tZ


Théorème

Soit une série chronologique générée d’un processus ARIMA(p,d,q), où ; on présume que le terme d’erreur est un bruit blanc Gaussien.

Alors pour chaque délai k fixé, on a que:

nZZZ ,,, 21 1d

ta

nKkkrP

1,1


Cas stationnaire versus cas non-stationnaire, comportement des r(k), k fixé, comme fonction de n.

Cas stationnaire:

Cas non-stationnaire:

kkrP

nKkkrP

1,1


Autres éléments d’information

Cas stationnaire: Les r(k) comme fonction de k décroissent à 0 de façon exponentielle (décroissance vers 0 très rapide).

Cas non-saisonnier: à partir de k = 20, toutes les autocorrélations devraient être très près de 0.

Cas non-stationnaire: Décroissance des r(k) de manière linéaire vers 0? Décroissante très lente? Les r(k) sont toutes de même signes? Ce sont tous des indices d’un problème de stationnarité.


Identification: choix de p et de q

Ayant identifié d, on a maintenant comme modèle .

Important éléments d’information:– Pour un autorégressif, toutes les autocorrélations

partielles s’annulent après un certain délai.– Pour un moyenne-mobile, toutes les

autocorrélations s’annulent après un certain délai. Que fait-on si les (k) et les kk semblent tous

les deux en nombre infini?

tdt ZW


Modélisation des résidus

Supposons que le processus est:

Cependant, le processus n’est pas un bruit blanc mais un ARMA . Donc:

.,1 tbBZBB ttd

tb

tt

tt

aBBb

taBbB

~~

.,~~

1

qp ~,~


Modélisation des résidus (suite)

Quelques manipulations donnent:

Ce modèle n’est rien d’autre qu’un ARIMA

,1

~1

~,

~~1

.,1

**

1

ttd

ttd

ttd

ttd

aBZBB

aBBZBBB

aBBBZBB

tbBZBB

** ,, qdp


Modélisation des résidus: exemple

Supposons que vos disposez d’une série. Vous la différenciez une fois pour la rendre stationnaire. Vous disposez à ce stade d’un ARIMA(p,1,q).

Vous trouvez que r(1) suggère une composante MA. Vous modéliser un ARIMA(0,1,1).

Un examen des résidus suggère une composante AR(1). Vous tentez finalement un ARIMA(1,1,1) qui devrait faire l’affaire.

En résumé: ce sont les résidus qui permettent de construire des modèles ARMA en pratique.


Étape 2: Estimation

Dans le modèle:

On doit procéder à l’estimation de:– Paramètres autorégressifs:– Paramètres moyenne-mobiles:– Paramètre– Paramètre

.,1 0 taBZBB ttd

p ,,1 q ,,1

02a


Estimation de

Dans

Donc: où

Or on a vu On rejette H0 si

0

tt

tt

ttd

aBBW

aBWB

taBZBB

10

1

0

0

1

,

.,1

0:0: '000 WHH

01 1 WtWE

1

1

222

W 1,,Nn

nu WW

WW un

u

nW

0.296.1ˆ

W

WT


Estimation des paramètres autorégressifs et moyenne-mobiles

Plusieurs techniques sont possibles:– Méthode du maximum de vraisemblance,– Méthode par moindres carrés conditionnels,– Méthode par moindres carrés inconditionels,

Ces techniques sont discutées dans Abraham & Ledolter (pp. 250-258).


Étape 3: Validation du modèle

Quand on cherche à valider un modèle de régression, une étape consiste habituellement à analyser les résidus.

La situation est similaire en séries chronologiques. Considérons le modèle: Les résidus sont: Les sont obtenus en estimant les divers

paramètres.

ttd aBZBB 01

ttt ZZa ˆˆ tZ


Test approximatif: test de bruit blanc sur les résidus

On se rappelle que si est un bruit blanc, alors les sont asymptotiquement indépendants, admettant pour un k donné une loi normale:

Un test de l’hypothèse H0 : (k) = 0 peut reposer sur le test: et la règle de décision consiste à rejeter la nulle si:

ta kra

n

Nkra1,0

krn 21

221 krn


Introduction aux tests de type portemanteau

Puisque les sont approximativement de lois N(0,1), et utilisant l’indépendance, lorsque est bruit blanc fort, on trouve que:

Pour l’hypothèse nulle d’adéquation, on rejette pour de grandes valeurs, i.e.

krn 21

ta

2

1

2K

LK

ka krnKQ

21, KKQ


Test de Box-Pierce et de Ljung-Box

En suivant un raisonnement similaire au test de bruit blanc, mais tenant compte du fait que l’on construit une statistique de test basée sur des résidus, Box et Pierce, ainsi que Ljung et Box ont montré que pour tester l’adéquation d’un modèle ARMA(p,q):

La logique des tests est la même: on rejette pour de grandes valeurs. Ex: avec Ljung-Box, on rejette l’adéquation si

2

1

2ˆ qpK

LK

kaBP krnKQ

2

1

2ˆ2 qpK

LK

kaLB kr

kn

nnKQ

21, qpKLB KQ