Upload
dinhphuc
View
224
Download
0
Embed Size (px)
Citation preview
Econometria das Séries de Tempo: Alguns Conceitos Básicos
Gujarati & Porter (2011), cap.21
Prof. C.D. Shikida
Conceitos: introdução
• Séries de Tempo
• Estacionariedade
• Regressão Espúria
• Passeio Aleatório
• Processo Estocástico • Processo Estacionário • Processo puramente aleatório • Processo Não-Estacionário • Variáveis Integradas • Modelos de Passeio Aleatório • Cointegração • Tendências Deterministas e Estocásticas • Testes de Raízes Unitárias
• Processos Estocásticos
– Estacionários
• Fraco (2ª ordem)
• Reversão à média
– Puramente aleatório
– Ruído branco (tipos)
• Processos Não-Estacionários
– Modelo do Passeio Aleatório
• Com drift (deslocamento)
• Sem drift
– Tendência Estocástica
– Raiz unitária
• Processos com Raiz Unitária
– Problema da Raiz Unitária
– Nelson & Plosser
• Tendência Determinista (TS) e Tendência Estocástica (DS)
– Modelo Geral (21.5.1) e seus casos particulares
0 100 200 300 400 500
05
01
00
15
02
00
25
0
Time
rw.n
d
-50
51
01
5
det. trend + noise (ls)
rw drift (ls)
rw (rs)
4000
6000
8000
10000
12000
14000
16000
18000
20000
0 5000 10000 15000 20000 25000 30000 35000
IBO
VESPA
• Processos Estocásticos Integrados
– Ordem de integração
– Propriedades das Séries Integradas
• O problema da Regressão Simples/Múltipla quando se desconsidera a característica de integração das séries
• O fenômeno da Regressão Espúria – Granger (1976)
• Testes de Estacionariedade – Análise Gráfica
– ACF, PACF: Correlograma
– Significância Estatística dos Coeficientes de Autocorrelação
– Box-Pierce, Ljung-Box • O problema da sobrediferenciação
Time
rw.n
d
0 100 200 300 400 500
-50
51
01
5
0 5 10 15 20 25 30
-0.5
0.0
0.5
1.0
Series: diff(diff(rw.nd))
LAG
AC
F
0 5 10 15 20 25 30
-0.5
0.0
0.5
1.0
LAG
PA
CF
0 5 10 15 20 25 30
0.0
0.2
0.4
0.6
0.8
1.0
Series: diff(rw.nd)
LAG
AC
F
0 5 10 15 20 25 30
0.0
0.2
0.4
0.6
0.8
1.0
LAG
PA
CF
• Mais sobre correlogramas:
– A correlação entre yt e yt-k será a razão da covariância entre elas relativamente ao produto dos respectivos desvios-padrões.
– Como a variância é a mesma, este produto do denominador será a variância.
– Logo, ver (21.8.1) e, amostral, (21.8.4).
– Exemplo: consumo anual, Brasil, logaritmo, a preços constantes de média de 1980.
-1
-0.5
0
0.5
1
0 2 4 6 8 10 12
lag
ACF for l_c
+- 1.96/T^0.5
-1
-0.5
0
0.5
1
0 2 4 6 8 10 12
lag
PACF for l_c
+- 1.96/T^0.5
• Teste de Ljung-Box (também conhecido como teste de portmanteau). Este teste, cuja estatística é conhecida como “Q”, é distribuído segundo uma χ2 com s graus de liberdade.
• •
• s = comprimento das defasagens • n = número de observações • k = total de defasagens incluídas (p + q, no caso de
modelos ARMA)
Regressões Espúrias
• Lembre-se do DW
• Os dl e du determinados a partir dos graus de liberdade (= no de regressores, exceto a constante)
http://userwww.sfsu.edu/~efc/classes/biol710/timeseries/TimeSeriesAnalysis.html
• Geramos dois passeios aleatórios
• library(lmtest) • set.seed(123456) • e1 <- rnorm(500) • e2 <- rnorm(500) • trd <- 1:500 • y1 <- 0.8*trd + cumsum(e1) • y2 <- 0.6*trd + cumsum(e2) • sr.reg <- lm(y1 ~ y2) • sr.dw <- dwtest(sr.reg)$statistic
• summary(sr.reg) • sr.dw
A solução do passeio aleatório com “drift” (lembra?) Substituições iterativas ...
Estima-se a regressão de y1 contra y2, com intercepto
dl e du aproximadamente: 1.758 e 1.778
• Veja, por exemplo, a regressão das variáveis em diferença
O novo durbin watson é aproximadamente 1.963.
• Agora imagine que consumo e renda possam ser representadas por passeios aleatórios.
• Exemplo ilustrativo (consumo e PIB em R$ milhões de 1980)
– Regressão log-log
0
1e-006
2e-006
3e-006
4e-006
5e-006
6e-006
7e-006
8e-006
9e-006
1e-005
1950 1960 1970 1980 1990 2000 2010
c
y
Viu só? (veja o DW e o coeficiente de l_y)
Duas séries não-estacionárias, a regressão em diferenças, neste caso, deu-nos que dlc parece ter uma relação de um para um com dly. (que função consumo lhe parece esta? Constante não significativa, PMgC = 1...)
Veja a tendência comum entre as variáveis. Veja também o Durbin-Watson.
• Exemplo
• O Teste de Raiz Unitária
– DF (entenda primeiro)
– ADF
• Teste F (irrestrito/restrito)
• Teste de Phillips-Perron (seguimos o livro)
• Teste(s) de Mudança Estrutural
• Crítica dos Testes de Raiz Unitária
– Extra: teste KPSS
• Exemplo:
– Distribuição de Dickey-Fuller
– Qual dos modelos abaixo é o irrestrito?
– Hipótese nula, portanto...
tktktt yyy 11
tktkttt yyTy 11
• Estatística de teste:
• m = número de restrições • RSS = soma dos resíduos quadráticos • UR = irrestrito • K = número de parâmetros do modelo irrestrito. • N = número de observações
• Hipótese nula: não se rejeita o modelo restrito. • Distribuição de Dickey-Fuller, (apêndice D, D.7).
)/(
/
knRSS
mRSSRSSF
UR
URR
• d
48.1
)561/(059887.0
2/059887.0063054.0
F
F(2,56) = 3.16 Dica: Gretl, Tools (não se aplica neste caso, pois a tabela correta é a D.7)
Olhando a tabela D.7, descobre-se que H0 se mantém, ou seja, o modelo restrito não é rejeitado.
• Usar o bom senso na implementação do teste.
• Bom senso = ler Gujarati
• Outra forma: usar o método de Enders (2004). Entretanto, o mesmo é mais complexo e sujeito a falhas. Ver Elder & Kennedy (2001). – Notas de aula sobre isto em pdf disponível aos
interessados. Solicitar via email: [email protected]
Quebras Estruturais
• Perron (data da quebra conhecida)
– Quebra: surge de uma mudança discreta nos coeficientes da regressão populacional e uma data precisa ou de uma evolução gradual (mudança nos valores) dos coeficientes ao longo de um período de tempo maior. [adaptado de Stock & Watson (2004), cap.12, p.318-324, a seguir citado para tabelas]
• No método de Perron, sabe-se a data de quebra e testa-se o tipo da mesma.
• Tabelas originais em Perron (1988).
• Zivot & Andrews (1992) ampliam o teste para endogeneizar a data de quebra.
• Outras formas de se detectar a data da quebra:
– Estatística da razão de verossimilhança de Quandt (RVQ), também chamada de estatística de sup-Wald (para regressões).
– Veremos apenas esta.
ttttttttt uxDyDDxyy 1211011110
Definir 0 = 0.15T e 1 = 0.85T . Testar para o intervalo entre 0 e 1.
• Mais tabelas para outros países europeus.
• Mas se você entendeu a técnica...
• Extra: veja sobre o método baseado nas M-fluctuations em Nogueira Jr., Shikida & Araujo Jr (2011): http://www.accessecon.com/Pubs/EB/2011/Volume31/EB-11-V31-I2-P159.pdf
Raiz unitária ou Não-estacionaridade?
• Teste KPSS
• Exercícios – fazer e entregar/apresentar na aula de laboratório.
• 21.16, 21.17 e 21.18
• Nesta aula, você poderá corrigir seu trabalho juntamente com todos os demais.
• Transformação de Séries Não-Estacionárias.
– DS
– TS
• Subdiferenciar/Sobrediferenciar (já falamos, não?)
• Cointegração
– Teste de Cointegração
– Teste AEG (Engle-Granger aumentado)
– Cointegração e Mecanismo de Correção de Erros
• Cointegração em séries econômicas – Geralmente se estudam casos em que as séries
possuem o mesmo número de raízes unitária (geralmente uma, ou I(1)).
– Há desenvolvimentos recentes para séries I(2).
– Há outros desenvolvimentos (multi-cointegração, ver Enders (2004)).
– Veremos casos em que existe (ao menos) uma combinação linear de duas séries I(1) que seja I(0).
• Cointegração e Mecanismo de Correção de Erros
• Considere o seguinte ADL(1, 1):
• Este modelo dá origem a vários casos particulares, conforme as restrições que se estabeleça sobre os parâmetros.
ttttt uzyzy 13121
• Veja este caso do ADL(1,1):
• Se existir um equilíbrio entre x e y:
**** 1010 xxyy
**)(
)1(
***)1(*
10
1
1001001
xKKyyE
xyxy
• Agora, com duas pequenas manipulações algébricas:
• Co-integração e o Teorema de Engle-Granger
• Notas de aula
Raízes Unitárias - complemento
• Vide Enders (2004) reproduzido a seguir.
Observações adicionais sobre o passeio aleatório
ttt uYY 1
1
00
123
12
1
:
)(
)(
t
sst
tttt
ttt
ttt
uY
uuuY
uuY
uYY
Se u é um ruído branco, E(Yt) = Y0. Mas, a variância...
21
0
21
0
)()( tuVarYVart
s
t
sstt
Modelos ARMA(p,d,q)
• 1. Todo processo ARMA(p,q) pode ser escrito como um AR puro ou como um MA puro.
– Vimos que um AR(1) se transforma em um MA() (sob uma condição especial...qual?)
– No caso de um MA(1) é fácil ver que ele pode ser escrito como um AR().
• De forma geral: todo processo ARMA(p,q) estacionário pode ser representado na forma:
...
1
11
2
2
111
0
1
1
1
tttt
t
i
t
i
tttt
YYuY
uYLuYL
uLY
tt uLYL )()(
• O modelo ainda pode ser representado por um AR() ou um MA().
• Entretanto, a representação não é sinônimo de comportamento igual.
q
q
p
p
LLLLL
LLLLL
...1)(
...1)(
3
3
2
21
3
3
2
21
• Não entraremos em detalhes sobre os processos neste curso (seguimos Gujarati e estas notas apenas).
• Detalhes adicionais, Enders (2004).
Estimação de modelos ARMA (p,q)
• Modelos AR(p) – MQO
• Modelos ARMA (p,q) – otimização não-linear (por conta da parte MA)
• Testes de especificação do modelo: – Sob a hipótese nula de que o modelo ARMA(p,q)
está corretamente especificado, Q é assintoticamente distribuída como uma qui-quadrado com K-p-q graus de liberdade.
• Problemas do teste LB:
– Para valores elevados de K, o teste pode apresentar baixa potência;
– O teste apenas indica se o modelo é inadequado, mas não sugere como o modelo deveria ser modificado.
• Outras opções: Multiplicador de Lagrange de Breusch-Godfrey
• Além disso,
• BIC (SBC) e AIC
– Já vimos, não?
Previsão
Previsão
Sazonalidade
• Como tratá-la?
– Para fins de previsão, Granger & Newbold: não a retire, modele-a.
– O tratamento adequado consiste em saber se a sazonalidade é determinista ou estocástica.
– Na metodologia Box-Jenkins, modela-se a sazonalidade.
• Outros métodos: dessazonalizar
– Dummies
– Médias móveis
– Census X-11
– Census X-12 ARIMA
• Exemplo:
– Modelo SARIMA(1,0,0)x(1,0,0)12:
– Modelo SARIMA(0,1,1)x(0,1,0)12:
ttttt
tt
uYYYY
uYBB
13121121211
12
121 11
113121
12 111
tttttt
tt
uuYYYY
uBYBB
• Correlograma
– Para processos puramente sazonais, os
correlogramas são similares aos dos processos puramente não-sazonais (AR e MA), só que a truncagem ocorre na defasagem sazonal.
– Ex: um SAR(1) mensal tem uma FACP que trunca após a 12ª defasagem. Sua FAC declina exponencialmente.
Função
Processo ACF PACF
MA(Q) trunca no lag “Q” Declina exponencialmente
AR(P) Declina exponencialmente trunca no lag “P”
ARMA(P,Q) Decai exponencialmente se j > Q Decai exponencialmente se j > P
Exemplo: índice da produção industrial (IBGE)
60
70
80
90
100
110
120
130
140
1995 2000 2005 2010
pro
din
d
-1
-0.5
0
0.5
1
0 5 10 15 20 25
lag
ACF for prodind
+- 1.96/T^0.5
-1
-0.5
0
0.5
1
0 5 10 15 20 25
lag
PACF for prodind
+- 1.96/T^0.5
Trabalhamos aqui já com o logaritmo da série!
• Que modelo estimar?
• Problema: teste de raiz unitária – Dessazonalizar a série?
– Ou fazer um teste de raiz unitária sazonal?
– No caso de uma raiz unitária sazonal, diferencia-se a série. • Sim, é possível ter uma raiz unitária e uma raiz unitária
sazonal. – Ex: SARIMA (0,1,1) x (0,1,1)
• Tente analisar a estacionariedade da série.
• Depois verifique se existem “não-estacionaridades” sazonais. Se existirem, diferencie sazonalmente.
• A partir daí, prossiga como anteriormente.
-1
-0.5
0
0.5
1
0 5 10 15 20 25
lag
ACF for d_l_prodind
+- 1.96/T^0.5
-1
-0.5
0
0.5
1
0 5 10 15 20 25
lag
PACF for d_l_prodind
+- 1.96/T^0.5
• Sobre testes de raízes unitárias sazonais, ver, por exemplo, o teste HEGY
• Entretanto, nem todos os programas de computador fazem o cálculo deste teste.
0.0 0.5 1.0 1.5 2.0
-0.4
0.0
0.4
0.8
Series: diff(log(prod))
LAG
AC
F
0.0 0.5 1.0 1.5 2.0
-0.4
0.0
0.4
0.8
LAG
PA
CF
Após o exame do correlograma foram estimados alguns modelos. O melhor foi este.
Standardized Residuals
Time
1995 2000 2005 2010
-4-2
02
0.5 1.0 1.5 2.0
-0.2
0.2
ACF of Residuals
LAG
AC
F
-3 -2 -1 0 1 2 3
-4-2
02
Normal Q-Q Plot of Std Residuals
Theoretical Quantiles
Sam
ple
Quantil
es
5 10 15 20 25 30 35
0.0
0.4
0.8
p values for Ljung-Box statistic
lag
p v
alu
e
A previsão gerada, convertida para índice, indica que a produção industrial deve ter um aumento modesto em fevereiro/2012: 0.396%. Será?
O mesmo resultado no Gretl
4
4.1
4.2
4.3
4.4
4.5
4.6
4.7
4.8
4.9
5
1995 2000 2005 2010
l_pro
din
d
Actual and fitted l_prodind
fitted
actual
4.5
4.55
4.6
4.65
4.7
4.75
4.8
4.85
4.9
4.95
5
2004 2005 2006 2007 2008 2009 2010 2011 2012
l_prodind
forecast
95 percent interval
4.2 4.4 4.6 4.8
4.2
4.6
log(prod)(t-1)
log(p
rod)(
t) 0.92
4.2 4.4 4.6 4.8
4.2
4.6
log(prod)(t-2)
log(p
rod)(
t) 0.86
4.2 4.4 4.6 4.8
4.2
4.6
log(prod)(t-3)
log(p
rod)(
t) 0.78
4.2 4.4 4.6 4.8
4.2
4.6
log(prod)(t-4)
log(p
rod)(
t) 0.73
4.2 4.4 4.6 4.8
4.2
4.6
log(prod)(t-5)
log(p
rod)(
t) 0.7
4.2 4.4 4.6 4.8
4.2
4.6
log(prod)(t-6)
log(p
rod)(
t) 0.67
4.2 4.4 4.6 4.8
4.2
4.6
log(prod)(t-7)
log(p
rod)(
t) 0.67
4.2 4.4 4.6 4.8
4.2
4.6
log(prod)(t-8)
log(p
rod)(
t) 0.69
4.2 4.4 4.6 4.84.2
4.6
log(prod)(t-9)
log(p
rod)(
t) 0.71
4.2 4.4 4.6 4.8
4.2
4.6
log(prod)(t-10)
log(p
rod)(
t) 0.76
4.2 4.4 4.6 4.8
4.2
4.6
log(prod)(t-11)
log(p
rod)(
t) 0.79
4.2 4.4 4.6 4.8
4.2
4.6
log(prod)(t-12)
log(p
rod)(
t) 0.82
• Laboratório
– Duas partes: Co-integração e modelos ARIMA
– Na parte dos modelos ARIMA: • Cada um terá que estimar um modelo diferente do meu
(pré-estabelecido) para esta mesma base.
• Fazer todas as etapas.
• Entregar na mesma aula.
• O exercício será feito individualmente.
– Na parte de co-integração, ver o exercício 21.19.
Exemplo
• Vamos seguir o exemplo do PNB dos EUA (1947.1 – 2002.3, trimestral).
• N= 233.
• Fonte dos dados (FRED – o banco de dados do FED de St. Louis).
Time
gn
p
1950 1960 1970 1980 1990 2000
20
00
40
00
60
00
80
00
• Os dados foram dessazonalizados e estão a preços de 1996.
• O correlograma indica que a diferenciação...
0 2 4 6 8 10 12
0.0
0.4
0.8
Series: gnp
LAG
AC
F
0 2 4 6 8 10 12
0.0
0.4
0.8
LAG
PA
CF
• Fazendo a taxa de variação do PNB (veja comando abaixo), obtemos o seguinte gráfico:
• gnpgr = diff(log(gnp)) # growth rate
Time
gn
pg
r
1950 1960 1970 1980 1990 2000
-0.0
2-0
.01
0.0
00
.01
0.0
20
.03
0.0
4
• Veja a ACF e a PACF da taxa de crescimento do PNB.
• Intuições: ACF trunca em k = 2 e a PACF está caindo (MA(2)). Ou será que a ACF está caindo a a PACF trunca em k = 1 (AR(1))?
1 2 3 4 5 6
-0.2
0.2
0.6
1.0
Series: gnpgr
LAG
AC
F
1 2 3 4 5 6
-0.2
0.2
0.6
1.0
LAG
PA
CF
• ARIMA (1,1,0)
• AIC = -8.2944
• BIC = -9.2637
Standardized Residuals
Time
1950 1960 1970 1980 1990 2000
-30
24
1 2 3 4 5 6
-0.2
0.2
ACF of Residuals
LAG
AC
F
-3 -2 -1 0 1 2 3
-30
24
Normal Q-Q Plot of Std Residuals
Theoretical Quantiles
Sam
ple
Quantil
es
5 10 15 20
0.0
0.4
0.8
p values for Ljung-Box statistic
lag
p v
alu
e
ttt uGNPGNP
1
005.0
3467.03467.010083.0
• ARIMA(0,1,2)
• AIC = -8.2976
• BIC = -9.2517
Standardized Residuals
Time
1950 1960 1970 1980 1990 2000
-30
24
1 2 3 4 5 6
-0.2
0.1
0.4
ACF of Residuals
LAG
AC
F
-3 -2 -1 0 1 2 3
-30
24
Normal Q-Q Plot of Std Residuals
Theoretical Quantiles
Sam
ple
Quantil
es
5 10 15 20
0.0
0.4
0.8
p values for Ljung-Box statistic
lag
p v
alu
e
tttt uuuGNP 21 2035.0303.00083.0
Atenção
• Reparou no que eu fiz na hora de escrever as equações?
• Os programas Eviews, Gretl e R estimaram os mesmos resultados.
• Entretanto, os autores do livro do qual usei o exemplo mostram que há um problema nestas saídas.
• A questão é simples e diz respeito a como os programas tratam a estimação em diferença. Investigando os resultados do R, esta foi a descoberta deles.
• Se o intercepto é estatisticamente igual a zero, isto não é um problema.
• Mas se não for, então haverá um problema nas previsões dos modelos.
• O que fazer?
• Como acabei de citar, todos os programas sofrem do mesmo problema.
• A única forma de não ter o problema, entre os três programas, é usar as rotinas criadas pelos autores.
• Veja o item 2 em: http://www.stat.pitt.edu/stoffer/tsa3/Rissues.htm . Note que a explicação vale para o Eviews e para o Gretl também.
• Não é um grande problema em termos das elasticidades estimadas porque diz respeito ao intercepto.
• Mas em termos de previsão, isto pode ser um problema.
Voltando ao exemplo...
SARIMA(3,1,0) x (1,0,1) sem intercepto SARIMA(3,1,0) x (1,0,1) com intercepto SARIMA(1,1,0) x (1,0,1) sem intercepto SARIMA(2,1,0) x (1,0,1) com intercepto SARIMA(2,1,0) x (1,0,1) sem intercepto SARIMA(3,1,0) x (0,0,0) sem intercepto - SARIMA(3,1,0) x (1,0,0) sem intercepto SARIMA(3,1,0) x (1,0,0) com intercepto SARIMA(3,1,0) x (1,0,2) sem interpecto SARIMA(3,1,0) x (1,0,2) com intercepto SARIMA(3,1,1) x (1,0,1) sem intercepto SARIMA(3,1,1) x (1,0,1) com intercepto SARIMA(1,1,0) x (1,0,1) com intercepto SARIMA(1,1,0) x (1,0,1) sem intercepto SARIMA(3,1,0) x (0,0,1) com intercepto SARIMA(3,1,0) x (0,0,1) sem intercepto SARIMA(0,1,0) x (1,0,1) sem intercepto SARIMA(0,1,0) x (1,0,1) com intercepto SARIMA(2,1,0) x (0,0,1) sem intercepto SARIMA(2,1,0) x (0,0,1) com intercepto SARIMA(1,1,0) x (0,0,1) sem intercepto SARIMA(1,1,0) x (0,0,1) com intercepto SARIMA(3,1,1) x (1,0,1) sem intercepto SARIMA(3,1,1) x (1,0,1) com intercepto
Nosso exercício do laboratório excluiu os modelos destacados. Seu próximo trabalho será escolher entre os restantes. Use o Eviews.
Modelos ARCH
• Leptocúrticas (caudas “pesadas”) – o problema da leptocurtose
• Dados financeiros: decisões no curto, não no longo prazo.
• Alavacangem (leverage effects) - Basicamente, dizem respeito à assimetria na volatilidade: a mesma aumenta mais após uma queda no preço do que após um aumento de mesma magnitude do mesmo.
• Com os resíduos da regressão...
• Fácil. Use o correlograma dos resíduos ao quadrado!
• A segunda observação diz respeito à ordem “q”. Mas acabei de falar: use o correlograma.
– Note que neste exemplo eu, inicialmente,
arbitrariamente, supus que q = 4 e fiz o teste.
• O problema do modelo ARCH: pode-se violar as condições de não-negatividade conforme o q escolhido. O que fazer?
• GARCH (1,1)
Para checar os resíduos, precisamos gerar a série normalizada. Isto é facilmente obtido através do cálculo da variância condicional. Para gerar esta variância, escreva o comando de linha “eq1.makegarch cvar”. Isto gerará a série “cvar” da variância condicional. Em seguida, crie a série dos resíduos padronizados, dividindo a série dos resíduos (esta você já sabe gerar, certo?) pela raiz da série cvar. No caso deste exemplo: genr resid_padron = resid1/(cvar)^(0.5). Sobre este resíduo aplica-se o teste de normalidade.
0
4
8
12
16
20
-1.5 -1.0 -0.5 0.0 0.5 1.0 1.5 2.0
Series: RESID_PADRON
Sample 1980M01 2008M04
Observations 340
Mean 0.000308
Median -0.007503
Maximum 1.974694
Minimum -1.856102
Std. Dev. 1.001256
Skewness -0.014773
Kurtosis 1.813285
Jarque-Bera 19.96318
Probability 0.000046
Ainda não é um bom modelo, certo?
• ARCH, GARCH, etc.
• Várias extensões.
• Mas vamos ficar por aqui, senão vamos nos perder.