21
Méthodes de prévision (STT- 3220) Section 5 Modélisation de séries chronologiques avec la méthodologie de Box-Jenkins Version: 11 décembre 2008

Méthodes de prévision (STT-3220)

Embed Size (px)

DESCRIPTION

Méthodes de prévision (STT-3220). Section 5 Modélisation de séries chronologiques avec la méthodologie de Box-Jenkins Version: 11 décembre 2008. Identification des modèles ARIMA. On désire ajuster un modèle ARMA( p,q ) : Un autre type de modèles est le modèle ARIMA (p,d,q) : - PowerPoint PPT Presentation

Citation preview

Page 1: Méthodes de prévision (STT-3220)

Méthodes de prévision (STT-3220)

Section 5

Modélisation de séries chronologiques avec la méthodologie de Box-Jenkins

Version: 11 décembre 2008

Page 2: Méthodes de prévision (STT-3220)

STT-3220; Méthodes de prévision2

Identification des modèles ARIMA

On désire ajuster un modèle ARMA(p,q):

Un autre type de modèles est le modèle ARIMA(p,d,q):

Un modèle ARIMA est simplement un modèle dont la dième différence est ARMA.

.,1 0 taBZBB ttd

.,0 taBZB tt

Page 3: Méthodes de prévision (STT-3220)

STT-3220; Méthodes de prévision3

Méthode de Box et Jenkins

Box et Jenkins ont popularisé l’utilisation des modèles ARMA, en insistant sur les étapes nécessaires à la modélisation d’une série chronologique quelconque:

Les trois étapes sont:– Identification des modèles (choix des ordres p, d et q).– Estimation des paramètres; moindres carrés

conditionnels, inconditionnels, maximum de vraisemblance.

– Validation du modèle (statistiques portmanteau; prévisions).

Page 4: Méthodes de prévision (STT-3220)

STT-3220; Méthodes de prévision4

Étape 1: Identification

1. Est-ce que la variance semble constante?– On veut s’assurer que le terme de variance dans le

modèle est constant, par exemple comme fonction du temps.

– Transformations populaires: Transformation racine, transformation inverse, transformation

logarithmique. Préférablement (mais de manière optionnelle dans le cours),

méthodologie de Box-Cox pour trouver la transformation.

– On veut stabiliser la variance, et en plus, se rapprocher de la normalité des erreurs.

Page 5: Méthodes de prévision (STT-3220)

STT-3220; Méthodes de prévision5

Transformation de Box-Cox

La transformation a la forme:

Le choix de se fait souvent en effectuant un graphique de la vraisemblance en fonction de

.0,log

,0,1

y

yy

Page 6: Méthodes de prévision (STT-3220)

STT-3220; Méthodes de prévision6

Identification (suite)

2. Choix du niveau de différentiation. Ici on veut une série stationnaire. En particulier la moyenne ne doit pas dépendre du temps.

Si la série est stationnaire: Si est ARMA(p,q), alors les autocorrélations (k) sont en nombre infini et décroissent vers 0 plutôt rapidement.

Un estimateur de (k) est donné par r(k).

tZ

Page 7: Méthodes de prévision (STT-3220)

STT-3220; Méthodes de prévision7

Identification (suite)

De plus, on devrait avoir que:

Cependant, la série est non-stationnaire, que se passe-t-il? On sait que cov(Zt,Zt-k) va dépendre de k, mais aussi de t. Ainsi les autocorrélations (k) ne sont pas définies. Mais que sera la comportement des statistiques r(k)?

kkrP

tZ

Page 8: Méthodes de prévision (STT-3220)

STT-3220; Méthodes de prévision8

Théorème

Soit une série chronologique générée d’un processus ARIMA(p,d,q), où ; on présume que le terme d’erreur est un bruit blanc Gaussien.

Alors pour chaque délai k fixé, on a que:

nZZZ ,,, 21 1d

ta

nKkkrP

1,1

Page 9: Méthodes de prévision (STT-3220)

STT-3220; Méthodes de prévision9

Cas stationnaire versus cas non-stationnaire, comportement des r(k), k fixé, comme fonction de n.

Cas stationnaire:

Cas non-stationnaire:

kkrP

nKkkrP

1,1

Page 10: Méthodes de prévision (STT-3220)

STT-3220; Méthodes de prévision10

Autres éléments d’information

Cas stationnaire: Les r(k) comme fonction de k décroissent à 0 de façon exponentielle (décroissance vers 0 très rapide).

Cas non-saisonnier: à partir de k = 20, toutes les autocorrélations devraient être très près de 0.

Cas non-stationnaire: Décroissance des r(k) de manière linéaire vers 0? Décroissante très lente? Les r(k) sont toutes de même signes? Ce sont tous des indices d’un problème de stationnarité.

Page 11: Méthodes de prévision (STT-3220)

STT-3220; Méthodes de prévision11

Identification: choix de p et de q

Ayant identifié d, on a maintenant comme modèle .

Important éléments d’information:– Pour un autorégressif, toutes les autocorrélations

partielles s’annulent après un certain délai.– Pour un moyenne-mobile, toutes les

autocorrélations s’annulent après un certain délai. Que fait-on si les (k) et les kk semblent tous

les deux en nombre infini?

tdt ZW

Page 12: Méthodes de prévision (STT-3220)

STT-3220; Méthodes de prévision12

Modélisation des résidus

Supposons que le processus est:

Cependant, le processus n’est pas un bruit blanc mais un ARMA . Donc:

.,1 tbBZBB ttd

tb

tt

tt

aBBb

taBbB

~~

.,~~

1

qp ~,~

Page 13: Méthodes de prévision (STT-3220)

STT-3220; Méthodes de prévision13

Modélisation des résidus (suite)

Quelques manipulations donnent:

Ce modèle n’est rien d’autre qu’un ARIMA

,1

~1

~,

~~1

.,1

**

1

ttd

ttd

ttd

ttd

aBZBB

aBBZBBB

aBBBZBB

tbBZBB

** ,, qdp

Page 14: Méthodes de prévision (STT-3220)

STT-3220; Méthodes de prévision14

Modélisation des résidus: exemple

Supposons que vos disposez d’une série. Vous la différenciez une fois pour la rendre stationnaire. Vous disposez à ce stade d’un ARIMA(p,1,q).

Vous trouvez que r(1) suggère une composante MA. Vous modéliser un ARIMA(0,1,1).

Un examen des résidus suggère une composante AR(1). Vous tentez finalement un ARIMA(1,1,1) qui devrait faire l’affaire.

En résumé: ce sont les résidus qui permettent de construire des modèles ARMA en pratique.

Page 15: Méthodes de prévision (STT-3220)

STT-3220; Méthodes de prévision15

Étape 2: Estimation

Dans le modèle:

On doit procéder à l’estimation de:– Paramètres autorégressifs:– Paramètres moyenne-mobiles:– Paramètre– Paramètre

.,1 0 taBZBB ttd

p ,,1 q ,,1

02a

Page 16: Méthodes de prévision (STT-3220)

STT-3220; Méthodes de prévision16

Estimation de

Dans

Donc: où

Or on a vu On rejette H0 si

0

tt

tt

ttd

aBBW

aBWB

taBZBB

10

1

0

0

1

,

.,1

0:0: '000 WHH

01 1 WtWE

1

1

222

W 1,,Nn

nu WW

WW un

u

nW

0.296.1ˆ

W

WT

Page 17: Méthodes de prévision (STT-3220)

STT-3220; Méthodes de prévision17

Estimation des paramètres autorégressifs et moyenne-mobiles

Plusieurs techniques sont possibles:– Méthode du maximum de vraisemblance,– Méthode par moindres carrés conditionnels,– Méthode par moindres carrés inconditionels,

Ces techniques sont discutées dans Abraham & Ledolter (pp. 250-258).

Page 18: Méthodes de prévision (STT-3220)

STT-3220; Méthodes de prévision18

Étape 3: Validation du modèle

Quand on cherche à valider un modèle de régression, une étape consiste habituellement à analyser les résidus.

La situation est similaire en séries chronologiques. Considérons le modèle: Les résidus sont: Les sont obtenus en estimant les divers

paramètres.

ttd aBZBB 01

ttt ZZa ˆˆ tZ

Page 19: Méthodes de prévision (STT-3220)

STT-3220; Méthodes de prévision19

Test approximatif: test de bruit blanc sur les résidus

On se rappelle que si est un bruit blanc, alors les sont asymptotiquement indépendants, admettant pour un k donné une loi normale:

Un test de l’hypothèse H0 : (k) = 0 peut reposer sur le test: et la règle de décision consiste à rejeter la nulle si:

ta kra

n

Nkra1,0

krn 21

221 krn

Page 20: Méthodes de prévision (STT-3220)

STT-3220; Méthodes de prévision20

Introduction aux tests de type portemanteau

Puisque les sont approximativement de lois N(0,1), et utilisant l’indépendance, lorsque est bruit blanc fort, on trouve que:

Pour l’hypothèse nulle d’adéquation, on rejette pour de grandes valeurs, i.e.

krn 21

ta

2

1

2K

LK

ka krnKQ

21, KKQ

Page 21: Méthodes de prévision (STT-3220)

STT-3220; Méthodes de prévision21

Test de Box-Pierce et de Ljung-Box

En suivant un raisonnement similaire au test de bruit blanc, mais tenant compte du fait que l’on construit une statistique de test basée sur des résidus, Box et Pierce, ainsi que Ljung et Box ont montré que pour tester l’adéquation d’un modèle ARMA(p,q):

La logique des tests est la même: on rejette pour de grandes valeurs. Ex: avec Ljung-Box, on rejette l’adéquation si

2

1

2ˆ qpK

LK

kaBP krnKQ

2

1

2ˆ2 qpK

LK

kaLB kr

kn

nnKQ

21, qpKLB KQ