Modelos ARIMA Rodrigo Gabriel de Miranda Robert Samohyl

Preview:

Citation preview

Modelos ARIMA Rodrigo Gabriel de Miranda

Robert Samohyl

Introdução

• Os modelos ARIMA fazem parte da classe de modelos univariados.

• Início 70’s

• Definição ARIMA (Auto-Regressivo Integrado de Auto-Regressivo Integrado de Médias Móveis)Médias Móveis)

Metodologia Box-Jenkins

• Fase 1 – IdentificaçãoPreparação dos dados• Transformar os dados para estabilizar a variância• Diferenciar os dados para estacionar a série

Seleção do modelo• Examinar os dados, FAC e FACP para identificar os modelos potenciais

Séries não estacionárias

Exemplos de séries não estacionárias

Função de Autocorrelação (FAC)

• Função

• Intervalo de confiança (aproximação)

1

2

1

n

t t kt k

k n

tt

Y Y Y Yr

Y Y

2n

Função de Autocorrelação Parcial (FACP)

• Mede o grau de associação de entre Yt e Yt-k, quando o efeito de outras defasagens no tempo – 1,2,3,...,k-1 – são removidos

• Ex. Se existir uma autocorrelação entre Yt e Yt-1, então existe uma correlação entre entre Yt-1 e Yt-2. Consequentemente existe uma correlaçao entre Yt e Yt-2, pois ambos estão relacionadas a Yt-1.

Exemplo – pib da industria

• Produção industrial (índice)

• Fonte: IBGE

• Série: 1991-1, 2006-12.

Time

ind

1995 2000 2005

6070

8090

100

110

120

FAC para uma série não estacionária

• O primeiro coeficiente de autocorrelação é grande

• As autocorrelações decaem lentamente

0.0 0.5 1.0 1.5

0.0

0.2

0.4

0.6

0.8

1.0

Lag

AC

F

ind

FACP para uma série não estacionária

• O FACP apresenta um prego perto do valor 1 para uma defasagem.

0.5 1.0 1.5

-0.4

-0.2

0.0

0.2

0.4

0.6

0.8

Lag

Par

tial A

CF

Series pib

Dicas para estacionar a série• Os dois exemplos são de

séries já estacionárias.

• A primeira é uma série não sazonal com média constante

• A segunda é uma série com sazonalidade aditiva e média constante

AA

Horizonte

Prev

isão

NA

HorizontePr

evis

ão

Dicas para estacionar a série

AN

Horizonte

Prev

isão

• As séries não são estacionárias na média (tendência linear e tendência linear com sazonalidade aditiva)

• Transformação: primeira diferença• Y’ = Yt – Yt-1

AA

Horizonte

Prev

isão

Dicas para estacionar a série

• Série não estacionária na média e na variância• Série com tendência linear e sazonalidade multiplicativa.• Transformação: primeira diferença do ln• Y’ = ln(Yt)-ln(Yt-1)

AM

HorizontePr

evis

ão

Dicas para estacionar a série

• As séries não são estacionárias na média• Série com tendência quadrática• Transformação: segunda diferença• Y’’ = Y’t – Y’t-1 = (Yt – Yt-1) – (Yt-1 – Yt-2) = Yt – 2Yt-1 + Yt-2

MN

Horizonte

Prev

isão

MA

Horizonte

Prev

isão

Dicas para estacionar a série

• Série não estacionária na média e na variância• Série com tendência quadrática e sazonalidade

multiplicativa.• Transformação: segunda diferença do ln

MM

HorizontePr

evis

ão

Exemplo – transformação: primeira diferença (série)

Time

ind

1995 2000 2005

-10

-50

510

15

Time

ind

1995 2000 2005

6070

8090

100

110

120

Transformado Original

Exemplo – transformação: primeira diferença (FAC)

0.0 0.5 1.0 1.5

-0.2

0.0

0.2

0.4

0.6

0.8

1.0

Lag

AC

F

ind

0.0 0.5 1.0 1.5

0.0

0.2

0.4

0.6

0.8

1.0

Lag

AC

F

ind

Transformado Original

Exemplo – transformação: primeira diferença (FACP)

0.5 1.0 1.5

-0.4

-0.2

0.0

0.2

0.4

Lag

Par

tial A

CF

Series diff(pib)

0.5 1.0 1.5

-0.4

-0.2

0.0

0.2

0.4

0.6

0.8

Lag

Par

tial A

CF

Series pib

Transformado Original

Modelo AR(1) ou ARIMA (1,0,0)

5 10 15 20

-0.2

-0.1

0.0

0.1

0.2

0.3

0.4

0.5

Lag

Par

tial A

CF

Series b

0 5 10 15 20

-0.2

0.0

0.2

0.4

0.6

0.8

1.0

Lag

AC

F

Series b

• Modelo auto regressivo de ordem 1

1 1t t tY a Y e

Modelo AR(2) ou ARIMA (2,0,0)

• Modelo auto regressivo de ordem 2

0 5 10 15 20

-0.2

0.0

0.2

0.4

0.6

0.8

1.0

Lag

AC

F

Series b

5 10 15 20

-0.3

-0.2

-0.1

0.0

0.1

0.2

0.3

0.4

Lag

Par

tial A

CF

Series b

1 1 2 2t t t tY a Y Y e

Modelo MA(1) ou ARIMA (0,0,1)

• Modelo de médias móveis de grau 1Modelo de médias móveis de grau 1

0 5 10 15 20

-0.5

0.0

0.5

1.0

Lag

AC

F

Series b

5 10 15 20

-0.5

-0.4

-0.3

-0.2

-0.1

0.0

0.1

0.2

Lag

Par

tial A

CF

Series b

0 1 1t t tY e e

Modelo MA(2) ou ARIMA (0,0,2)

• Modelo de médias móveis de grau 2Modelo de médias móveis de grau 2

0 5 10 15 20

-0.5

0.0

0.5

1.0

Lag

AC

F

Series b

5 10 15 20

-0.6

-0.4

-0.2

0.0

0.2

Lag

Par

tial A

CF

Series b

0 1 1 2 2t t t tY e e e

Modelo ARIMA (1,0,1)

1 1 1 1t t t tY a Y e e Time

b

0 20 40 60 80 100

-2-1

01

23

• Modelo misto AR(1), MA(1)Modelo misto AR(1), MA(1)• Genericamente os modelos ARIMA são definir por ARIMA(p,d,q)Genericamente os modelos ARIMA são definir por ARIMA(p,d,q)• p – número de termos auto regressivos(defasagens no lado direito p – número de termos auto regressivos(defasagens no lado direito

da equaçãoda equação• d – número de diferenças para estacionar a séried – número de diferenças para estacionar a série• q – número de médias móveis (erros defasados no lado direito da q – número de médias móveis (erros defasados no lado direito da

equação)equação)

Time

b

0 20 40 60 80 100

-3-2

-10

12

AR1 = -0.6, MA1 = 0.3AR1 = 0.9, MA1 = -0.7

FAC e FACP – ARIMA(1,0,1)

0 5 10 15 20

-0.2

0.0

0.2

0.4

0.6

0.8

1.0

Lag

AC

F

Series b

5 10 15 20

-0.2

-0.1

0.0

0.1

0.2

Lag

Par

tial A

CF

Series b

0 5 10 15 20

-0.2

0.0

0.2

0.4

0.6

0.8

1.0

Lag

AC

F

Series b

5 10 15 20

-0.2

-0.1

0.0

0.1

0.2

0.3

Lag

Par

tial A

CF

Series b

AR1 = -0.6, MA1 = 0.3

AR1 = 0.9, MA1 = -0.7

Identificação de modelos AR ou MA puros

Decai exponencialmente ou uma curva de sino amortecida. O padrão exato depende do valor e sinal de θ1 ....θp

Prego nas defasagens de 1 até q, depois corta para zero

MA(q)

Prego nas defasagens de 1 até p, depois corta para zero

Decai exponencialmente ou uma curva de sino amortecida. O padrão exato depende do valor e sinal de φ1 ....φp

AR(p)

FACPFACProcesso

Identificação ARIMA

• De acordo a tabela anterior verificar se o modelo é um AR ou MA puro

ARMA(p,q)• Queda gradual ou pregos bem definidos

em ambos os CORRELOGRAMAS

Modelo ARIMA sazonal• Notação: SARIMA (0,0,0) (1,0,0)Notação: SARIMA (0,0,0) (1,0,0)1212

• Notação: SARIMA (0,0,0) (0,0,1)Notação: SARIMA (0,0,0) (0,0,1)1212

• Generalizando: Sarima(p,d,q)(P,D,Q)Generalizando: Sarima(p,d,q)(P,D,Q)ss• P - número de termos auto regressivos sazonais P - número de termos auto regressivos sazonais

(defasagens no lado direito da equação)(defasagens no lado direito da equação)• d – número de diferenças sazonaisd – número de diferenças sazonais• q – número de médias móveis sazonais (erros q – número de médias móveis sazonais (erros

defasados no lado direito da equação)defasados no lado direito da equação)• s – ciclo sazonals – ciclo sazonal

12 12t t tY a Y e

12 12t t tY a e e

Exemplo: identificação

• Modelo possível

• ARIMA(1,1,0)(1,0,1)12

0.0 0.5 1.0 1.5

-0.2

0.0

0.2

0.4

0.6

0.8

1.0

Lag

AC

F

ind

0.5 1.0 1.5

-0.4

-0.2

0.0

0.2

0.4

Lag

Par

tial A

CF

Series diff(pib)

Primeira diferença do pib ind

Metodologia Box-Jenkins

• Fase 2 – Estimação e testeEstimação• Estimar parâmetros dos modelos potenciais• Selecionar o melhor modelo por algum critério

Diagnóstico• Checar a FAC e FACP dos resíduos•Verificar de os resíduos possuem distribuição normal, com média zero e variância constante

Estimação dos parâmetros

• Nos modelos ARIMA a estimação através de uma função de verossimilhança

• Para o exemplo anterior:• Y’t = φ1Y’t-1 + φ2Y’t-12 + θ1et-12 + et

• Y’t = Yt – Yt-1

• Y’t = -0.3689 Y’t-1 + 0.9976 Y’t-12 + -0.8844et-12

• s.e. 0.0677 0.0036 0.0831• sigma^2 estimated as 10.16: log likelihood = -

507.82, aic = 1023.64

Selecionar modelo

• AIC – critério de informação de AKaike• AIC = -2logL+2m• L – verossimilhança• m = p+q+P+Q• Este critério penaliza os modelos com

maior número de variáveis• Selecionar o modelos com menor AIC.

Checar o FAC e FACP dos resíduos(exemplo)

• Não deve existir nenhuma altocorrelação nos resíduos

• Se isto ocorrer outro modelo deve ser tentado.

0.0 0.5 1.0 1.5

-0.2

0.0

0.2

0.4

0.6

0.8

1.0

Lag

AC

F

Series b$residuals

0.5 1.0 1.5

-0.2

-0.1

0.0

0.1

0.2

Lag

Par

tial A

CF

Series b$residuals

Testar a normalidade dos resíduos (exemplo)

• O histograma deve apresentar uma forma de sino, com a maioria dos valores em torno de zero.

• Teste estatístico de normalidade - Shapiro-Wilk

• data: b$residuals • W = 0.9961, p-value =

0.9104• Obs: hipótese nula de

normalidade

Histogram of b$residuals

b$residuals

Freq

uenc

y

-10 -5 0 5 10

010

2030

40

Previsão• Jan 2007 109.1996• Feb 2007 106.2918• Mar 2007 117.7317• Apr 2007 114.5179• May 2007 120.2556• Jun 2007 118.9860• Jul 2007 122.7341• Aug 2007 125.6595• Sep 2007 123.2329• Oct 2007 126.7847• Nov 2007 123.4185• Dec 2007 113.3679

Previsão (exemplo)

Forecasts from ARIMA(1,1,0)(1,0,1)12

1995 2000 2005

6080

100

120