Méthodes de prévision (STT-3220)
Section 5
Modélisation de séries chronologiques avec la méthodologie de Box-Jenkins
Version: 11 décembre 2008
STT-3220; Méthodes de prévision2
Identification des modèles ARIMA
On désire ajuster un modèle ARMA(p,q):
Un autre type de modèles est le modèle ARIMA(p,d,q):
Un modèle ARIMA est simplement un modèle dont la dième différence est ARMA.
.,1 0 taBZBB ttd
.,0 taBZB tt
STT-3220; Méthodes de prévision3
Méthode de Box et Jenkins
Box et Jenkins ont popularisé l’utilisation des modèles ARMA, en insistant sur les étapes nécessaires à la modélisation d’une série chronologique quelconque:
Les trois étapes sont:– Identification des modèles (choix des ordres p, d et q).– Estimation des paramètres; moindres carrés
conditionnels, inconditionnels, maximum de vraisemblance.
– Validation du modèle (statistiques portmanteau; prévisions).
STT-3220; Méthodes de prévision4
Étape 1: Identification
1. Est-ce que la variance semble constante?– On veut s’assurer que le terme de variance dans le
modèle est constant, par exemple comme fonction du temps.
– Transformations populaires: Transformation racine, transformation inverse, transformation
logarithmique. Préférablement (mais de manière optionnelle dans le cours),
méthodologie de Box-Cox pour trouver la transformation.
– On veut stabiliser la variance, et en plus, se rapprocher de la normalité des erreurs.
STT-3220; Méthodes de prévision5
Transformation de Box-Cox
La transformation a la forme:
Le choix de se fait souvent en effectuant un graphique de la vraisemblance en fonction de
.0,log
,0,1
y
yy
STT-3220; Méthodes de prévision6
Identification (suite)
2. Choix du niveau de différentiation. Ici on veut une série stationnaire. En particulier la moyenne ne doit pas dépendre du temps.
Si la série est stationnaire: Si est ARMA(p,q), alors les autocorrélations (k) sont en nombre infini et décroissent vers 0 plutôt rapidement.
Un estimateur de (k) est donné par r(k).
tZ
STT-3220; Méthodes de prévision7
Identification (suite)
De plus, on devrait avoir que:
Cependant, la série est non-stationnaire, que se passe-t-il? On sait que cov(Zt,Zt-k) va dépendre de k, mais aussi de t. Ainsi les autocorrélations (k) ne sont pas définies. Mais que sera la comportement des statistiques r(k)?
kkrP
tZ
STT-3220; Méthodes de prévision8
Théorème
Soit une série chronologique générée d’un processus ARIMA(p,d,q), où ; on présume que le terme d’erreur est un bruit blanc Gaussien.
Alors pour chaque délai k fixé, on a que:
nZZZ ,,, 21 1d
ta
nKkkrP
1,1
STT-3220; Méthodes de prévision9
Cas stationnaire versus cas non-stationnaire, comportement des r(k), k fixé, comme fonction de n.
Cas stationnaire:
Cas non-stationnaire:
kkrP
nKkkrP
1,1
STT-3220; Méthodes de prévision10
Autres éléments d’information
Cas stationnaire: Les r(k) comme fonction de k décroissent à 0 de façon exponentielle (décroissance vers 0 très rapide).
Cas non-saisonnier: à partir de k = 20, toutes les autocorrélations devraient être très près de 0.
Cas non-stationnaire: Décroissance des r(k) de manière linéaire vers 0? Décroissante très lente? Les r(k) sont toutes de même signes? Ce sont tous des indices d’un problème de stationnarité.
STT-3220; Méthodes de prévision11
Identification: choix de p et de q
Ayant identifié d, on a maintenant comme modèle .
Important éléments d’information:– Pour un autorégressif, toutes les autocorrélations
partielles s’annulent après un certain délai.– Pour un moyenne-mobile, toutes les
autocorrélations s’annulent après un certain délai. Que fait-on si les (k) et les kk semblent tous
les deux en nombre infini?
tdt ZW
STT-3220; Méthodes de prévision12
Modélisation des résidus
Supposons que le processus est:
Cependant, le processus n’est pas un bruit blanc mais un ARMA . Donc:
.,1 tbBZBB ttd
tb
tt
tt
aBBb
taBbB
~~
.,~~
1
qp ~,~
STT-3220; Méthodes de prévision13
Modélisation des résidus (suite)
Quelques manipulations donnent:
Ce modèle n’est rien d’autre qu’un ARIMA
,1
~1
~,
~~1
.,1
**
1
ttd
ttd
ttd
ttd
aBZBB
aBBZBBB
aBBBZBB
tbBZBB
** ,, qdp
STT-3220; Méthodes de prévision14
Modélisation des résidus: exemple
Supposons que vos disposez d’une série. Vous la différenciez une fois pour la rendre stationnaire. Vous disposez à ce stade d’un ARIMA(p,1,q).
Vous trouvez que r(1) suggère une composante MA. Vous modéliser un ARIMA(0,1,1).
Un examen des résidus suggère une composante AR(1). Vous tentez finalement un ARIMA(1,1,1) qui devrait faire l’affaire.
En résumé: ce sont les résidus qui permettent de construire des modèles ARMA en pratique.
STT-3220; Méthodes de prévision15
Étape 2: Estimation
Dans le modèle:
On doit procéder à l’estimation de:– Paramètres autorégressifs:– Paramètres moyenne-mobiles:– Paramètre– Paramètre
.,1 0 taBZBB ttd
p ,,1 q ,,1
02a
STT-3220; Méthodes de prévision16
Estimation de
Dans
Donc: où
Or on a vu On rejette H0 si
0
tt
tt
ttd
aBBW
aBWB
taBZBB
10
1
0
0
1
,
.,1
0:0: '000 WHH
01 1 WtWE
1
1
222
W 1,,Nn
nu WW
WW un
u
nW
0.296.1ˆ
W
WT
STT-3220; Méthodes de prévision17
Estimation des paramètres autorégressifs et moyenne-mobiles
Plusieurs techniques sont possibles:– Méthode du maximum de vraisemblance,– Méthode par moindres carrés conditionnels,– Méthode par moindres carrés inconditionels,
Ces techniques sont discutées dans Abraham & Ledolter (pp. 250-258).
STT-3220; Méthodes de prévision18
Étape 3: Validation du modèle
Quand on cherche à valider un modèle de régression, une étape consiste habituellement à analyser les résidus.
La situation est similaire en séries chronologiques. Considérons le modèle: Les résidus sont: Les sont obtenus en estimant les divers
paramètres.
ttd aBZBB 01
ttt ZZa ˆˆ tZ
STT-3220; Méthodes de prévision19
Test approximatif: test de bruit blanc sur les résidus
On se rappelle que si est un bruit blanc, alors les sont asymptotiquement indépendants, admettant pour un k donné une loi normale:
Un test de l’hypothèse H0 : (k) = 0 peut reposer sur le test: et la règle de décision consiste à rejeter la nulle si:
ta kra
n
Nkra1,0
krn 21
221 krn
STT-3220; Méthodes de prévision20
Introduction aux tests de type portemanteau
Puisque les sont approximativement de lois N(0,1), et utilisant l’indépendance, lorsque est bruit blanc fort, on trouve que:
Pour l’hypothèse nulle d’adéquation, on rejette pour de grandes valeurs, i.e.
krn 21
ta
2
1
2K
LK
ka krnKQ
21, KKQ
STT-3220; Méthodes de prévision21
Test de Box-Pierce et de Ljung-Box
En suivant un raisonnement similaire au test de bruit blanc, mais tenant compte du fait que l’on construit une statistique de test basée sur des résidus, Box et Pierce, ainsi que Ljung et Box ont montré que pour tester l’adéquation d’un modèle ARMA(p,q):
La logique des tests est la même: on rejette pour de grandes valeurs. Ex: avec Ljung-Box, on rejette l’adéquation si
2
1
2ˆ qpK
LK
kaBP krnKQ
2
1
2ˆ2 qpK
LK
kaLB kr
kn
nnKQ
21, qpKLB KQ