NOTASDECLASEESTADISTICAIIIv.01

Notas de Clase Estadıstica III

3009137

Nelfi Gonzalez AlvarezProfesora Escuela de Estadıstica

Universidad Nacional de Colombia Sede Medellın

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ

Indice general

1. Introduccion al lenguaje R 1

1.1. Como descargar e instalar R . . . . . . . . . . . . . . . . . . . . . . 1

1.2. Como usar R . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4

1.2.1. Inicio de una sesion y edicion de programas . . . . . . . . . 4

1.2.2. Organizacion y uso de funciones disponibles en R . . . . . 5

1.3. Resumen de algunas funciones basicas de R . . . . . . . . . . . . 10

1.3.1. Funciones para entrada y lectura de datos y escritura yexportacion de resultados y objetos R . . . . . . . . . . . . . 10

1.3.2. Operadores . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10

1.3.3. Funciones relacionadas con distribuciones . . . . . . . . . 10

1.3.4. Funciones que producen escalares . . . . . . . . . . . . . . 10

1.3.5. Condicionales y loops . . . . . . . . . . . . . . . . . . . . . . 11

1.3.6. Algunos objetos R . . . . . . . . . . . . . . . . . . . . . . . . 11

1.3.7. Algunas operaciones con matrices . . . . . . . . . . . . . . . 11

1.3.8. Aplicando funciones a objetos R . . . . . . . . . . . . . . . . 11

1.3.9. Funciones que producen graficas . . . . . . . . . . . . . . . 11

1.3.10.Funciones varias . . . . . . . . . . . . . . . . . . . . . . . . . 12

1.4. Lectura e ingreso de datos de series de tiempo . . . . . . . . . . . 12

1.4.1. Lectura de series univariadas . . . . . . . . . . . . . . . . . 12

1.4.2. Exportacion de resultados numericos y graficos del R . . . 15

1.5. Graficando una serie de tiempo . . . . . . . . . . . . . . . . . . . . 16

1.6. Regresion lineal multiple con R . . . . . . . . . . . . . . . . . . . . 17

1.6.1. Funcion lm . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18

2. El analisis de series de tiempo 27

2.1. Introduccion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27

2.2. Clases de pronosticos - pronosticos cuantitativos . . . . . . . . . . 28

2.3. Ventajas y desventajas de los metodos cuantitativos . . . . . . . . 29

2.4. La precision de un pronostico vs. el horizonte de tiempo . . . . . . 30

2.5. Las tareas en la realizacion de un pronostico . . . . . . . . . . . . 30

2.6. La metodologıa de los datos de series de tiempo . . . . . . . . . . . 31

2.7. Estudio descriptivo de las series de tiempo . . . . . . . . . . . . . 34

III

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ

IV INDICE GENERAL

3. Modelos de regresion para tendencia 45

3.1. Tendencia determinıstica vs. estocastica . . . . . . . . . . . . . . . 45

3.2. Estimacion de modelos de tendencia . . . . . . . . . . . . . . . . . 49

3.2.1. Tendencia polinomial . . . . . . . . . . . . . . . . . . . . . . 49

3.2.2. Modelo general de la tendencia . . . . . . . . . . . . . . . . . 51

3.3. Pronostico de la tendencia . . . . . . . . . . . . . . . . . . . . . . . 62

3.3.1. Pronosticos puntuales . . . . . . . . . . . . . . . . . . . . . . 62

3.3.2. Intervalos de pronostico . . . . . . . . . . . . . . . . . . . . . 63

3.4. Diagnosticos y seleccion de modelos . . . . . . . . . . . . . . . . . 63

3.4.1. Criterios de Informacion . . . . . . . . . . . . . . . . . . . . 63

3.4.2. ¿Cual criterio usar? . . . . . . . . . . . . . . . . . . . . . . . 64

3.5. Ejemplo: Datos RSALES.DAT . . . . . . . . . . . . . . . . . . . . . . 65

3.6. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72

3.6.1. Problema 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72

3.6.2. Problema 2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72

3.7. datos STYLEKP . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75

4. Filtros lineales y suavizamientos 774.1. Regresion LOESS . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77

4.1.1. LOESS en R . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79

4.1.2. Otras funciones R relacionadas con LOESS: scatter.smooth()y loess.smooth() . . . . . . . . . . . . . . . . . . . . . . . . 80

4.1.3. Ejemplo: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81

4.2. Filtros lineales, medias moviles y suavizadores . . . . . . . . . . . 85

4.2.1. Filtro Lineal . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85

4.2.2. Medias moviles . . . . . . . . . . . . . . . . . . . . . . . . . . 86

4.2.3. Suavizamiento exponencial simple (EWMA) . . . . . . . . . 91

4.2.4. Suavizamiento Holt . . . . . . . . . . . . . . . . . . . . . . . 92

4.2.5. Suavizamientos exponenciales simples en R . . . . . . . . . 93

4.2.6. Suavizamiento de Holt en R . . . . . . . . . . . . . . . . . . 96

4.2.7. Filtros de Henderson . . . . . . . . . . . . . . . . . . . . . . 101

4.3. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 103

5. Modelacion de la componente estacional 1055.1. Estacionalidad aditiva y multiplicativa . . . . . . . . . . . . . . . . 105

5.2. Modelado de la estacionalidad por regresion . . . . . . . . . . . . . 106

5.2.1. Modelacion de la estacionalidad mediante variables indi-cadoras . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 106

5.2.2. Modelacion de la estacionalidad mediante funciones trigonometri-cas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 114

5.3. Evaluacion de la estabilidad de los modelos de pronostico . . . . . 120

5.3.1. Ejemplo 1: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 122

5.3.2. Ejemplo 2: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 126

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ

INDICE GENERAL V

5.3.3. Ejemplo: Ajuste de una serie estacional multiplicativa . . . 129

5.4. Precision de los modelos de pronostico . . . . . . . . . . . . . . . . 137

5.4.1. Comparacion con un modelo de referencia . . . . . . . . . . 139

5.5. Ajuste por suavizamiento Holt-Winters de series estacionales . . . 140

5.5.1. Holt-Winters aditivo . . . . . . . . . . . . . . . . . . . . . . . 140

5.5.2. Holt-Winters multiplicativo . . . . . . . . . . . . . . . . . . . 142

5.5.3. Suavizamiento Holt-Winters en R . . . . . . . . . . . . . . . 144

5.5.4. Ejemplo: Suavizamiento Holt Winters de la serie del ındicemensual de salario real . . . . . . . . . . . . . . . . . . . . . 145

5.5.5. Ejemplo: Suavizamiento Holt-Winters de la serie trimestralde produccion de cemento portland . . . . . . . . . . . . . . 149

5.6. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 155

6. Caracterizacion de los ciclos 157

6.1. Introduccion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 157

6.2. Procesos estacionarios en covarianza . . . . . . . . . . . . . . . . . 158

6.2.1. Procesos de ruido . . . . . . . . . . . . . . . . . . . . . . . . 161

6.2.2. Procesos de ruido blanco . . . . . . . . . . . . . . . . . . . . 161

6.3. Procesos estacionarios en sentido fuerte o estrictamente esta-cionarios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 162

6.4. Funcion de autocovarianza y autocorrelacion muestral . . . . . . 162

6.5. Uso de la FAC muestral para probar ruido blanco . . . . . . . . . 163

6.5.1. Ejemplos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 164

6.6. Test de Box-Pierce y Test Ljung-Box . . . . . . . . . . . . . . . . . 171

6.6.1. Test de Box-Pierce . . . . . . . . . . . . . . . . . . . . . . . . 171

6.6.2. Prueba de Ljung-Box . . . . . . . . . . . . . . . . . . . . . . 172

6.6.3. Pruebas Box-Pierce y Ljung-Box en R . . . . . . . . . . . . . 172

6.7. Procesos Autorregresivos de orden 1, AR(1) . . . . . . . . . . . . . 178

6.8. Test Durbin-Watson de incorrelacion de orden 1 . . . . . . . . . . 179

6.8.1. Formulacion del test . . . . . . . . . . . . . . . . . . . . . . . 179

6.8.2. El estadıstico de prueba . . . . . . . . . . . . . . . . . . . . . 180

6.8.3. La ejecucion de la prueba . . . . . . . . . . . . . . . . . . . . 181

6.8.4. Test Durbin-Watson en R . . . . . . . . . . . . . . . . . . . . 182

6.9. Ejercicio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 184

7. Introduccion a los modelos ARMA 1857.1. El operador Rezago Bj y polinomio de rezagos de orden j . . . . . 185

7.2. El Teorema de representacion de Wold . . . . . . . . . . . . . . . . 186

7.3. Funcion de autocorrelacion Parcial o PACF . . . . . . . . . . . . . 186

7.3.1. PACF para un proceso de ruido blanco . . . . . . . . . . . . 188

7.3.2. PACF muestral con R . . . . . . . . . . . . . . . . . . . . . . 189

7.3.3. Ejemplos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 190

7.4. Modelos de medias moviles o MA . . . . . . . . . . . . . . . . . . . 192

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ

VI INDICE GENERAL

7.4.1. El proceso de media movil de orden 1 o MA(1) . . . . . . . . 192

7.4.2. Procesos MA(q) . . . . . . . . . . . . . . . . . . . . . . . . . . 195

7.5. Modelos autorregresivos de orden p o AR(p) . . . . . . . . . . . . . 196

7.5.1. Funcion de autocorrelacion y autocorrelacion parcial deun AR(p) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 198

7.6. Modelos autorregresivos y de medias moviles o ARMA(p,q) . . . . 201

7.6.1. Funcion de autocorrelacion y autocorrelacion parcial deun ARMA(p,q) . . . . . . . . . . . . . . . . . . . . . . . . . . . 202

7.6.2. Casos especiales de procesos ARMA . . . . . . . . . . . . . . 202

7.7. Identificacion y ajuste del modelo para los ciclos . . . . . . . . . . 205

7.7.1. Metodos de identificacion basados en minimizacion de cri-terios de informacion . . . . . . . . . . . . . . . . . . . . . . 205

7.7.2. Metodo de identificacion basado en la funcion de autocor-relacion extendida . . . . . . . . . . . . . . . . . . . . . . . . 207

7.7.3. Estimacion de modelos ARMA . . . . . . . . . . . . . . . . . 208

7.8. Ejemplos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 210

7.9. Estimacion por maxima verosimilitud en modelos ARMA . . . . . 221

7.10.Pronosticos en modelos ARMA estacionarios e invertibles . . . . . 221

8. Modelacion de una serie con errores ARMA 225

8.1. Modelo inicial: Tendencia, estacionalidad y errores R.B . . . . . . 225

8.1.1. Ajuste y pronostico . . . . . . . . . . . . . . . . . . . . . . . . 225

8.1.2. Analisis e identificacion de ciclos en los errores estruc-turales Et . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 227

8.2. Modelos de tendencia, estacionalidad mas ciclos ARMA . . . . . . 235

8.2.1. Ciclos AR(6) . . . . . . . . . . . . . . . . . . . . . . . . . . . . 235

8.2.2. Ciclos ARMA(2,2) . . . . . . . . . . . . . . . . . . . . . . . . . 237

8.2.3. Ciclos ARMA(1,5) . . . . . . . . . . . . . . . . . . . . . . . . . 240

8.2.4. Ciclos ARMA(2,4) . . . . . . . . . . . . . . . . . . . . . . . . . 242

8.2.5. Ciclos ARMA(6,7) . . . . . . . . . . . . . . . . . . . . . . . . . 245

8.2.6. Ciclos ARMA(7,10) . . . . . . . . . . . . . . . . . . . . . . . . 248

8.2.7. Ciclos ARMA(1, 2) × (0, 1)[4] . . . . . . . . . . . . . . . . . . 251

8.3. Seleccion del mejor modelo . . . . . . . . . . . . . . . . . . . . . . . 254

8.4. Codigo R usado . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 255

8.5. Modelacion inicial: Estructura exponencial y errores R.B . . . . . 267

8.5.1. Ajuste y pronostico . . . . . . . . . . . . . . . . . . . . . . . . 267

8.5.2. Analisis de residuales e identificacion ciclos . . . . . . . . . 269

8.5.3. Ajuste de los ciclos . . . . . . . . . . . . . . . . . . . . . . . . 271

8.6. Ajuste y pronostico aproximado de Yt . . . . . . . . . . . . . . . . . 278

8.7. Codigo R usado . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 282

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ

INDICE GENERAL VII

9. Modelos ARIMA 2939.1. Introduccion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2939.2. Procesos homogeneos . . . . . . . . . . . . . . . . . . . . . . . . . . 2939.3. Raız unitaria autorregresiva . . . . . . . . . . . . . . . . . . . . . . 3039.4. Caminata aleatoria . . . . . . . . . . . . . . . . . . . . . . . . . . . 304

9.4.1. Caminata aleatoria sin tendencia . . . . . . . . . . . . . . . 3049.4.2. Caminata aleatoria con tendencia o deriva . . . . . . . . . . 305

9.5. Procesos integrados . . . . . . . . . . . . . . . . . . . . . . . . . . . 3069.5.1. Procesos autorregresivos integrados de medias moviles o

ARIMA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3069.6. Ajuste y pronostico de modelos ARIMA . . . . . . . . . . . . . . . . 3079.7. Pruebas para raıces unitarias . . . . . . . . . . . . . . . . . . . . . 310

9.7.1. Prueba de raız unitaria de Dickey-Fuller (DF) . . . . . . . . 3119.7.2. Prueba de raız unitaria Dickey-Fuller aumentada (ADF) . . 3129.7.3. Test DF y ADF en R . . . . . . . . . . . . . . . . . . . . . . . 315

9.8. Ejemplo: Modelacion de la serie tasa de cambio Yen/Dolar . . . . 3169.8.1. Analisis preliminar . . . . . . . . . . . . . . . . . . . . . . . . 3179.8.2. Identificacion de modelos . . . . . . . . . . . . . . . . . . . . 3179.8.3. Ajuste modelos identificados . . . . . . . . . . . . . . . . . . 3199.8.4. Pruebas de raız unitaria . . . . . . . . . . . . . . . . . . . . . 3319.8.5. Seleccion del mejor modelo para el ajuste y pronostico del

logaritmo de la tasa de cambio yen/dolar . . . . . . . . . . 3369.8.6. Codigo R usado . . . . . . . . . . . . . . . . . . . . . . . . . . 337

10.Modelos SARIMA 34510.1.Introduccion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34510.2.Modelos ARIMA estacionales . . . . . . . . . . . . . . . . . . . . . . 346

10.2.1.Algunos casos especiales de modelos SARIMA . . . . . . . . 34710.2.2.Series con tendencia y estacionalidad estocasticas . . . . . 355

10.3.ACF de procesos estacionales . . . . . . . . . . . . . . . . . . . . . 35510.4.PACF y EACF de procesos estacionales . . . . . . . . . . . . . . . . 35610.5.Construccion y pronosticos en modelos estacionales . . . . . . . . 35710.6.Raıces unitarias estacionales . . . . . . . . . . . . . . . . . . . . . . 359

10.6.1.Test HEGY de raız unitaria estacional . . . . . . . . . . . . . 36010.6.2.Test Canova-Hansen (CH) . . . . . . . . . . . . . . . . . . . . 364

10.7.Ejemplo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36610.7.1.Programacion R usada en Ejemplo . . . . . . . . . . . . . . 378

A. Funciones R 385A.1. Funcion decompose . . . . . . . . . . . . . . . . . . . . . . . . . . . 385A.2. Funcion nls : Mınimos cuadrados no lineales . . . . . . . . . . . . 388A.3. Funcion stl : Descomposicion usando LOESS . . . . . . . . . . . . 389

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ

VIII INDICE GENERAL

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ

Indice de figuras

1.1. Sitio de descarga del R . . . . . . . . . . . . . . . . . . . . . . . . . . . 2

1.2. Subdirectorios de descarga R para Windows . . . . . . . . . . . . . . . 3

1.3. Link ultima version del R para Windows . . . . . . . . . . . . . . . . . 3

1.4. Ventana R Console . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4

1.5. Ventana Editor R . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4

1.6. Pagina de busqueda y descarga de paquetes, segun nombre . . . . . . 7

1.7. Pagina de descarga paquete nlme . . . . . . . . . . . . . . . . . . . . . 7

1.8. Instalacion paquete R usando archivo .zip . . . . . . . . . . . . . . . . 8

1.9. Archivo .csv con coma en posicion decimal . . . . . . . . . . . . . . . . 13

1.10.Archivo .CSV con punto en posicion decimal . . . . . . . . . . . . . . . 14

1.11.Archivo .TXT con punto en posicion decimal . . . . . . . . . . . . . . . 15

1.12.Serie ındice mensual salario real sector manufacturero colombiano, sin

trilla de cafe, enero de 1990 a mayo de 2011. . . . . . . . . . . . . . . 16

2.1. Lınea de tiempo vs. ajuste y pronostico de una serie de tiempo (Gaynor

y Kirkpatrick [4]) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32

2.2. Descomposicion serie de tiempo aditiva con funcion R decompose . . . 35

2.3. Descomposicion serie de tiempo aditiva con funcion R stl . . . . . . . 37

2.4. Descomposicion serie de tiempo multiplicativa con funcion R decompose 37

2.5. Descomposicion de los logaritmos de las ventas de licor . . . . . . . . . 39

2.6. Componente de tendencia serie de salarios, obtenida con decompose . . 40

2.7. Componente estacional serie de salarios, obtenida con decompose . . . 40

2.8. Componente de error serie de salarios, obtenida con decompose . . . . 40

2.9. Componente de tendencia serie de salarios, obtenida con stl . . . . . . 41

2.10.Componente estacional serie de salarios, obtenida con stl . . . . . . . 42

2.11.Componente de error serie de salarios, obtenida con stl . . . . . . . . 42

2.12.Componente de tendencia serie de salarios, obtenida con aggregate . . 43

2.13.Componente estacional serie de salarios, obtenida con cycle . . . . . . 43

3.1. Componentes claves del PIB real de Estados Unidos, registradas por

ano de 1960 a 1989, en millones de dolares de 1982. Fuente: Diebold

[3], stylekp.dat . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46

3.2. Tasa de cambio de Hungrıa, 620 observaciones Fuente: Diebold [3],

exchrate.dat . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48

IX

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ

X INDICE DE FIGURAS

3.3. Dos realizaciones de una caminata aleatoria . . . . . . . . . . . . . . . 48

3.4. Lado izquierdo: volumen mensual de operaciones de acciones negoci-

adas en la bolsa de Nueva York; lado derecho: Logaritmo de la serie.

542 observaciones. Fuente: Diebold [3], nyse vol.dat. . . . . . . . . . . 49

3.5. Volumen mensual de operaciones de acciones negociadas en la bolsa

de Nueva York y ajustes usando transformacion logarıtmica y mınimos

cuadrados no lineales. Fuente: Diebold [3], nyse vol.dat. . . . . . . . . 55

3.6. Residuales del modelo Log- lineal (arriba) en escala logarıtmica de los

datos; residuales del modelo no lineal exponencial (abajo) en escala

original de los datos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56

3.7. Curva de tendencia tipo logıstica. . . . . . . . . . . . . . . . . . . . . . 57

3.8. Datos censo decadal de poblacion en Estados Unidos desde el ano 1790

a 2000, fuente: Data frame USPob en R. . . . . . . . . . . . . . . . . . 58

3.9. Datos censo decadal de poblacion en Estados Unidos desde el ano 1790

a 2000 y proyecciones con modelo cuadratico y logıstico. . . . . . . . . 61

3.10.Graficos de residuales modelos cuadratico (modelo0) y modelo logıstico

(modelo1) para datos del Censo Estados Unidos, 1790 a 2000. . . . . . 62

3.11.Serie mensual de ventas al menudeo en Estados Unidos, dolares nomi-

nales (ajustada estacionalmente), desde 01-1955 a 01-1996, fuente:Diebold

[3]. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65

3.12.Serie mensual de ventas al menudeo en Estados Unidos, dolares nom-

inales (ajustada estacionalmente), y curvas cuadratica y exponencial

ajustadas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70

3.13.Residuales modelos ajustados a datos de RSALES.DAT . . . . . . . . . 70

3.14.Graficos de normalidad para residuales, modelos ajustados a datos de

RSALES.DAT . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71

3.15.Serie Indice de productividad mensual en Canada: arriba Datos desde

1959, abajo: datos desde 1955. . . . . . . . . . . . . . . . . . . . . . . 74

4.1. Serie Tasa de cambio en Hungrıa y tres suavizamientos LOESS, (fecha

de inicio desconocida), fuente Diebold [3]. . . . . . . . . . . . . . . . . 84

4.2. Serie Tasa de cambio en Hungrıa y tres suavizamientos LOESS, (fecha

de inicio desconocida), fuente Diebold [3]. . . . . . . . . . . . . . . . . 84

4.3. Graficos de residuales, ajustes LOESS para datos de la tasa de cambio

en Hungrıa), fuente Diebold [3]. . . . . . . . . . . . . . . . . . . . . . . 85

4.4. Graficos series precios negociacion de acciones de Microsoft (MSFT) . . 88

4.5. Serie volumen de acciones diarias negociadas de Microsoft (MSFT), con

medias moviles unilaterales . . . . . . . . . . . . . . . . . . . . . . . . 90

4.6. Serie volumen de acciones diarias negociadas de Microsoft (MSFT), me-

dias moviles unilaterales con argumento circular=T . . . . . . . . . . 90

4.7. Serie volumen de acciones diarias negociadas de Microsoft (MSFT), me-

dias moviles bilaterales. . . . . . . . . . . . . . . . . . . . . . . . . . . 91

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ

INDICE DE FIGURAS XI

4.8. Serie volumen de acciones diarias negociadas de Microsoft (MSFT), suaviza-

mientos exponeciales simples. . . . . . . . . . . . . . . . . . . . . . . 95

4.9. Serie volumen de acciones diarias negociadas de Microsoft (MSFT), suaviza-

mientos exponenciales. . . . . . . . . . . . . . . . . . . . . . . . . . . 97

4.10.Residuales de los suavizamientos exponenciales para el volumen de

acciones diarias negociadas de Microsoft (MSFT). . . . . . . . . . . . . 101

4.11.Filtros de Henderson sobre el volumen de acciones diarias negociadas

de Microsoft (MSFT). . . . . . . . . . . . . . . . . . . . . . . . . . . . . 104

5.1. Graficos de residuales de los tres modelos ajustados a la serie de salario.113

5.2. Graficos de la serie real y ajustada segun los tres modelos considerados

para la serie de salario. . . . . . . . . . . . . . . . . . . . . . . . . . . 113

5.3. Graficos de residuales de los tres modelos ajustados a la serie de salario,

con funciones trigonometricas. . . . . . . . . . . . . . . . . . . . . . . 118

5.4. Graficos de la serie real y ajustada segun los tres modelos considerados

para la serie de salario, con funciones trigonometricas. . . . . . . . . . 119

5.5. Grafico de 300 observaciones de la serie simulada Yt = 3500 + 200t + Et,

Et ∼ N(0, (4000)2). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 122

5.6. Grafico de interceptos estimados recursivamente, para serie simulada

Yt = 3500 + 200t + Et, Et ∼ N(0, (4000)2). . . . . . . . . . . . . . . . . . . 124

5.7. Grafico de pendientes estimadas recursivamente, para serie simulada

Yt = 3500 + 200t + Et, Et ∼ N(0, (4000)2). . . . . . . . . . . . . . . . . . . 125

5.8. Grafico residuales recursivos y CUSUMt para la serie simulada Yt =

3500 + 200t + Et, Et ∼ N(0, (4000)2). . . . . . . . . . . . . . . . . . . . . 125

5.9. Grafico de 300 observaciones de la serie simulada Yt = 18500 + 50t + Et,

para 1 ≤ t ≤ 150, Yt = 18500+200t+Et, para 151 ≤ t ≤ 300, Et ∼ N(0, (4000)2).126

5.10.Grafico de interceptos estimados recursivamente, para serie simulada

Yt = 18500 + 50t + Et, para 1 ≤ t ≤ 150, Yt = 18500 + 200t + Et, para

151 ≤ t ≤ 300, Et ∼ N(0, (4000)2). . . . . . . . . . . . . . . . . . . . . . . 127

5.11.Grafico de pendientes estimadas recursivamente, para serie simulada

Yt = 18500 + 50t + Et, para 1 ≤ t ≤ 150, Yt = 18500 + 200t + Et, para

151 ≤ t ≤ 300, Et ∼ N(0, (4000)2). . . . . . . . . . . . . . . . . . . . . . . 127

5.12.Grafico residuales recursivos y CUSUMt para la serie simulada Yt =

18500+50t+Et, para 1 ≤ t ≤ 150, Yt = 18500+200t+Et, para 151 ≤ t ≤ 300,

Et ∼ N(0, (4000)2). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 128

5.13.Grafico serie de produccion trimestral de cemento portland y de su

logaritmo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 129

5.14.Descomposicion stl de la serie de logaritmos de la produccion trimestral

cemento portland. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 130

5.15.Residuales ajuste de la serie de logaritmos de la produccion trimestral

cemento portland. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 131

5.16.Estimacion recursiva de los parametros de la tendencia, ajuste de la

serie de logaritmos de la produccion trimestral cemento portland. . . . 132

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ

XII INDICE DE FIGURAS

5.17.Estimacion recursiva de los parametros de la estacionalidad, ajuste de

la serie de logaritmos de la produccion trimestral cemento portland. . . 133

5.18.Residuales recursivos y test CUSUM, ajuste de la serie de logaritmos

de la produccion trimestral cemento portland. . . . . . . . . . . . . . . 134

5.19.Componente de tendencia serie trimestral de produccion de cemento

portland, estimada por descomposicion. . . . . . . . . . . . . . . . . . 137

5.20.Serie trimestral de produccion de cemento portland y su ajuste por

regresion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 138

5.21.Suavizamientos Holt-Winters para serie ındice mensual de salario real. 150

5.22.Suavizamientos Holt-Winters para serie trimestral de produccion de ce-

mento portland. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 154

6.1. Realizaciones de un proceso estocastico. Fuente: Martınez [8]. . . . . . 157

6.2. Ejemplo γ(k) de un procesos estacionario . . . . . . . . . . . . . . . . 159

6.3. Dos procesos estacionarios en covarianza. Fuente: Martınez [8] . . . . 160

6.4. Dos procesos no estacionarios en covarianza. Fuente: Martınez [8] . . . 160

6.5. Funcion de autocovarianza γ(k) de un procesos de ruido . . . . . . . . 161

6.6. Serie at y su FAC muestral . . . . . . . . . . . . . . . . . . . . . . . . 165

6.7. Serie Z1,t y su FAC muestral . . . . . . . . . . . . . . . . . . . . . . . . 165



6.10.Serie Z4,t y su FAC muestral . . . . . . . . . . . . . . . . . . . . . . . . 166

6.11.FAC’s Serie ındice de salario y residuales de modelos ajustados . . . . 167

6.12.FAC’s Serie log produccion trimestral cemento portland y residuales de

modelo ajustado . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 168

6.13.Serie Yt simulada y su FAC muestral . . . . . . . . . . . . . . . . . . . 169

6.14.Serie residuales modelo lineal ajustado a serie simulada y su FAC

muestral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 169

6.15.Primera diferencia de la serie simulada y su FAC muestral . . . . . . . 170

6.16.Region crıtica de nivel α para el test Box-Pierce y Ljung-Box . . . . . . 172

6.17.Ejemplos ρ(k) de procesos AR(1) . . . . . . . . . . . . . . . . . . . . . 180

7.1. PACF de un proceso de ruido blanco . . . . . . . . . . . . . . . . . . . 189

7.2. PACF muestral de un ruido blanco . . . . . . . . . . . . . . . . . . . . 190

7.3. PACFs series simuladas en Seccion 6.5.1. . . . . . . . . . . . . . . . . 191

7.4. PACF residuales modelo log cuadratico estacional serie produccion trimes-

tral de cemento portland . . . . . . . . . . . . . . . . . . . . . . . . . 192

7.5. Ejemplos ρ(k) y φkk de procesos MA(1) . . . . . . . . . . . . . . . . . . 194

7.6. Ejemplos ρ(k) y φkk de procesos MA(2) . . . . . . . . . . . . . . . . . . 197

7.7. Ejemplos ρ(k) y φkk de procesos AR(1) . . . . . . . . . . . . . . . . . . 199

7.8. Ejemplos ρ(k) y φkk de procesos AR(2) . . . . . . . . . . . . . . . . . . 200

7.9. Ejemplos ρ(k) y φkk de procesos ARMA(1,1) . . . . . . . . . . . . . . . . 203

7.10.Mas ejemplos ρ(k) y φkk de procesos ARMA(1,1) . . . . . . . . . . . . . 204

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ

INDICE DE FIGURAS XIII

7.11.Representacion de la EACF teorica de procesos ARMA(1,1) . . . . . . . 209

7.12.Serie AR1.sim simulada de Zt = 0.67Zt−1 + at, at ∼ RBN(0, 1) y n = 100 . 211

7.13.Serie residuales despues de ajustar AR1.sim y ACF, PACF correspondi-

entes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 212

7.14.Serie AR1.sim simulada y pronosticos para h = 5 perıodos futuros . . . 213

7.15.Series Z1t, Z3t y MA1.sim, simuladas . . . . . . . . . . . . . . . . . . . 215

7.16.ACF’s y PACF’s muestrales de las Series Z1t, Z3t y MA1.sim, simuladas 215

7.17.Residuales del modelo ajustado para Z1t, y su ACF y PACF muestrales . 218

7.18.Residuales del modelo ajustado para Z3t, y su ACF y PACF muestrales . 218

7.19.Residuales del modelo ajustado para MA1.sim, y su ACF y PACF mues-

trales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 219

7.20.Series Z1t, Z3t y MA1.sim y sus pronosticos para h = 5 perıodos futuros 220

8.1. Izq.: Serie de produccion trimestral de cemento portland (miles de toneladas) y Der.: su logaritmo 226

8.2. Serie real, ajustada y pronosticos para la validacion cruzada, modelo Log-cubico estacional . . . 227

8.3. Residuales estructurales Et modelo log-cubico estacional y ACF y PACF muestrales . . . . . . 228

8.4. Resultado de la funcion armasubsets sobre Et en modelo log-cubico estacional . . . . . . . 230

8.5. ACF’s y PACF’s teoricas de modelos ARMA identificados para Et . . . . . . . . . . . . . 232



8.8. Serie real, ajustada y pronosticos Modelo 2 . . . . . . . . . . . . . . . . . . . . . . 236

8.9. Residuales at Modelo 2 y su ACF y PACF muestrales . . . . . . . . . . . . . . . . . . 236

8.10.Grafico Normalidad de at Modelo 2 . . . . . . . . . . . . . . . . . . . . . . . . . 237

8.11.Serie real, ajustada y pronosticos Modelo 3 . . . . . . . . . . . . . . . . . . . . . . 238

8.12.Residuales at Modelo 3 y su ACF y PACF muestrales . . . . . . . . . . . . . . . . . . 239








8.20.Residuales at del ajuste con errores ARMA(6,7), con φj , j = 1, 3, 4, 5, y θi, i = 1, 2, . . . , 6, fijos en

cero, y su ACF y PACF muestrales . . . . . . . . . . . . . . . . . . . . . . . . . 246


8.22.Residuales at Modelo 6 y su ACF y PAF muestrales . . . . . . . . . . . . . . . . . . . 247


8.24.Residuales at del ajuste con errores ARMA(7,10), con φj , j = 2, 3, 4, 5, 6, y θi, i = 1, 2, . . . , 7, 9, fijos

en cero, y su ACF y PACF muestrales . . . . . . . . . . . . . . . . . . . . . . . . 249





ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ

XIV INDICE DE FIGURAS



8.31.Valores reales y pronosticados con los ocho modelos (Miles de toneladas) . . . . . . . . . . 255

8.32.Serie real, ajustada y pronosticos para la validacion cruzada, modelo exponencial cubico estacional 268

8.33.Residuales en ajuste exponencial cubico estacional . . . . . . . . . . . . . . . . . . . 269

8.34.ACF y PACF para residuales estructurales . . . . . . . . . . . . . . . . . . . . . . 269

8.35.Resultado de la funcion armasubsets sobre Et en modelo exponencial cubico estacional . . . . 271

8.36.Residuales de ajuste del ARMA(2,2) ajustado a los residuos estructurales del modelo exponencial 272

8.37.Residuales de ajuste del AR(6) ajustado a los residuos estructurales del modelo exponencial . . 273



8.40.Residuales de ajuste del SARMA(1,2)(0,1)[4] ajustado a los residuos estructurales del modelo

exponencial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 275

8.41.Residuales de ajuste del ARMA(6,7): Et = φ2Et−2 + φ6Et−6 + at + θ7at−7, ajustado a los residuos

estructurales del modelo exponencial . . . . . . . . . . . . . . . . . . . . . . . . 276

8.42.Residuales de ajuste del ARMA(6,7)a ajustado a los residuos estructurales del modelo exponencial 276

8.43.Residuales de ajuste del ARMA(6,7): Et = φ2Et−2+φ6Et−6+at+θ6at−6+θ7at−7,at ∼ R.B N(0, σ2a),

ajustado a los residuos estructurales del modelo exponencial . . . . . . . . . . . . . . . 277

8.44.Residuales de ajuste del ARMA(6,7)b ajustado a los residuos estructurales del modelo exponencial 277

8.45.Comparacion de serie real y sus ajustes mediante los modelos que intengran la estimacion estruc-

tural exponencial mas los ciclos ARMA identificados para los residuales estructurales del modelo

exponencial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 279

8.46.Comparacion de serie real y sus ajustes mediante los modelos que intengran la estimacion estruc-

tural exponencial mas los ciclos ARMA identificados para los residuales estructurales del modelo

exponencial (Cont.) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 280

8.47.Comparacion de serie real y sus pronosticos, para el modelo exponencial sin y con los ciclos ARMA

identificados para los residuales estructurales del modelo exponencial inicial . . . . . . . . 281

9.1. Serie simulada como Yt = 3500+200t+Et, Et ∼ N(0, (4000)2) y su primera

diferencia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 294

9.2. Graficos para analisis de residuales Et del ajuste MA(1) sobre la serie ∇Yt296

9.3. Serie simulada Yt = 10000 + 1.8t + 15t2 + Et, Et ∼ R.BN(0, (5000)2) y su

ACF muestral. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 299

9.4. Diferencias de orden 1 y 2 de serie simulada Yt = 10000+1.8t+15t2 +Et,

Et ∼ R.BN(0, (5000)2). . . . . . . . . . . . . . . . . . . . . . . . . . . . 300

9.5. Graficos para analisis de residuales Et del ajuste MA(2) sobre la serie

∇2Yt . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 301

9.6. ACF y PACF de una serie proveniente de un proceso ARIMA(p,1,q) . . . 304

9.7. Serie original tasa mensual de cambio yen/US, su logaritmo y sus re-

spectivas diferencias de orden 1 . . . . . . . . . . . . . . . . . . . . . 316

9.8. Arriba: ACF y PACF log tasa mensual de cambio yen/US; Abajo: ACF y

PACF primera diferencia del logaritmo . . . . . . . . . . . . . . . . . . 317

9.9. Serie log tasa yen/Us y pronosticos modelos 1 a 4 . . . . . . . . . . . . 322

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ

INDICE DE FIGURAS XV

9.10.Graficas para analisis de residuales, modelos 1 y 2 . . . . . . . . . . . 3239.11.Graficas para analisis de residuales, modelos 3 y 4 . . . . . . . . . . . 3249.12.Graficos residuales modelo tendencia lineal y Et ∼ R.BN(0, σ2) . . . . . 3269.13.Serie log tasa yen/Us y pronosticos modelos 5b y 5c . . . . . . . . . . 3289.14.Graficas para analisis de residuales, modelos 5b y 5c . . . . . . . . . . 330

10.1.ACF’s y PACF’s modelos AR(1)s . . . . . . . . . . . . . . . . . . . . . . 34810.2.ACF’s y PACF’s modelos MA(1)s . . . . . . . . . . . . . . . . . . . . . . 34910.3.ACF’s y PACF’s modelos ARMA(1,1)s . . . . . . . . . . . . . . . . . . . 35010.4.ACF’s y PACF’s modelos MA(1)×MA(1)12 . . . . . . . . . . . . . . . . . 35110.5.ACF’s y PACF’s modelos MA(1)× AR(1)12 . . . . . . . . . . . . . . . . . 35210.6.ACF’s y PACF’s modelos AR(1) ×MA(1)12 . . . . . . . . . . . . . . . . . 35310.7.ACF’s y PACF’s modelos AR(1) × AR(1)4 . . . . . . . . . . . . . . . . . . 35410.8.Serie de produccion trimestral de cemento portland y su logaritmo . . . 36610.9.Diferencias ∇, ∇4, ∇∇4 y ∇4∇ para el logaritmo de la produccion trimes-

tral de cemento portland. . . . . . . . . . . . . . . . . . . . . . . . . . 36710.10.ACF’s para el logaritmo de la produccion de cemento portland y de sus

diferencias ∇, ∇4, ∇∇4. . . . . . . . . . . . . . . . . . . . . . . . . . . 36810.11.ACF, PACF y resultado de la funcion armasubsets() para ∇∇4 sobre

el logaritmo de la produccion de cemento portland. . . . . . . . . . . . 36910.12.Ajuste y pronosticos de la produccion de cemento portland con Modelo

SARIMA 1. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37210.13.Ajuste y pronosticos de la produccion de cemento portland con Modelo

SARIMA 2 a 5. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37310.14.Comparacion de los pronosticos en escala original, de los modelos SARI-

MA 1 a 5 ajustados al logaritmo de la produccion de cemento portland

con Modelo. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37410.15.Graficos de residuales de ajuste de los modelos SARIMA 1 a 4 ajustados

al logaritmo de la produccion de cemento portland con Modelo. . . . . . 37510.16.ACF’s y PACF’s para residuales de ajuste de los modelos SARIMA 1 a 4

ajustados al logaritmo de la produccion de cemento portland con Modelo.37610.17.Graficos de residuales de ajuste y su ACF y PACF, modelo SARIMA 5

para el logaritmo de la produccion de cemento portland con Modelo. . . 377

A.1. Descomposicion de una serie multiplicativa. Fuente:O.D. Anderson (1976)

and O’Donovan (1983). Ventas mensuales companıa X, ene 65 - may 71. 387ESTADÍS

TICA III

- 300

9137

NELFI G

ONZÁLEZ

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ

Capıtulo 1

Introduccion al lenguaje R

R mas que un paquete estadıstico de dominio publico, es un lenguaje y ambi-ente que ademas de ofrecer una amplia gama de metodos estadısticos tambienpuede ser considerado como un lenguage de alto nivel. Entre otras cosas, per-mite definir funciones que pasan a ser parte del sistema las cuales puedenser usadas en sesiones posteriores. Entre sus ventajas tenemos su capacidadpara operar con objetos, la programacion en lenguaje matricial, la disponi-bilidad de una amplia base de operadores y la versatilidad que ofrece en larealizacion de graficas.

El software esta disponible bajo los terminos de licencia GNU en forma decodigo fuente, para sistemas operativos Windows, Mac OS, UNIX, y similaresy puede ser descargado en el website del R, donde se encuentran disponiblesreferencias importantes para aprender su uso, tales como

1. An Introduction to R: Notes on R: A Programming Environment for Data

Analysis and Graphics, Version Version 2.13.1 (2011-07-08), by W. N. Ven-

ables, D. M. Smith and the R Development Core Team;

2. R: A Language and Environment for Statistical Computing. Reference In-

dex, Version 2.13.1 (2011-07-08), by The R Development Core Team.

1.1. Como descargar e instalar R

En la direccion http://cran.r-project.org ubicamos la pagina para descar-gar el R (ver Figura 1.1):

Download and Install RPrecompiled binary distributions of the base system and contributed pack-ages, Windows and Mac users most likely want one of these versions of R:

Download R for Linux

Download R for MacOS X

Download R for Windows

1

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ

2 CAPITULO 1. INTRODUCCION AL LENGUAJE R

Seleccionamos la opcion Download R for Windows.

Figura 1.1: Sitio de descarga del R

A continuacion visualizamos la pagina R for Windows, donde tenemos lassiguientes dos opciones (ver Figura 1.2):

Subdirectories:

base

contrib

Seleccionamos base. Llegamos a la pagina R-2.13.1 for Windows (32/64bit) (ver Figura 1.3), allı seleccionamos la opcion

Download R 2.13.1 for Windows (39 megabytes, 32/64 bit)

Aparece luego la ventana de descarga, hacer click en el boton Ejecutar y seguirpaso a paso las instrucciones o preguntas del instalador, respondiendo a todocon el boton ”siguiente”. Cuando llegue a la ventana de seleccion de com-ponentes a instalar, tenga cuidado de seleccionar primero los componentesreferentes a manuales antes de proseguir.

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ

1.1. COMO DESCARGAR E INSTALAR R 3

Figura 1.2: Subdirectorios de descarga R para Windows

Figura 1.3: Link ultima version del R para Windows

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


1.2. Como usar R

1.2.1. Inicio de una sesion y edicion de programas

Al iniciar una sesion en R el programa se abre en la ventana de comandosdenominada R-Console, ilustrada en la Figura 1.4, en la cual se pueden es-cribir lıneas de comandos que seran ejecutados una vez se presione la teclaenter.

Figura 1.4: Ventana R Console

Figura 1.5: Ventana Editor R

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ

1.2. COMO USAR R 5

En la ventana R-Console encontramos en la barra menu los siguientesmenus:

Archivo

Editar

Visualizar

Misc

Paquetes

Ventanas

Ayuda

Como alternativa para la edicion de programas en lenguaje R, se puederecurrir a la creacion de un archivo de edicion con el menu Archivo - NuevoScript, donde podemos editar nuestros programas especıficos que deseemosy ejecutarlos en forma completa o parcialmente mediante seleccion previa delas lıneas deseadas, usando las opciones disponibles en el menu Editar. En laFigura 1.5 se ilustra la ventana de edicion con parte de un programa R escritopor el usuario. Estos archivos de edicion pueden ser guardados con extension.R y ser utilizados en cualquiera otra sesion cargandolos por el menu Archivo- Abrir Script.

1.2.2. Organizacion y uso de funciones disponibles en R

En R las funciones estan organizadas en librerıas o paquetes. Por defecto Rinicializa en el paquete denominado base en el cual encontramos las funcionesgenerales para el manejo de datos y graficas. Existen otros paquetes en loscuales se encuentran herramientas de analisis mas especializadas, las cualespueden ser utilizadas cargando previamente la librerıa que las contiene. Unalibrerıa o paquete puede cargarse mediante la funcion library() o bien conrequire() o a traves del menu Paquetes - Cargar paquetes... Una lista de laslibrerıas disponibles puede obtenerse ejecutando:

> library()

lo que permite ver en una ventana denominada R packages available un lista-do como el siguiente,

Packages in library ’C:/Program Files/R/R-2.13.1/library’:

base The R Base Packageboot Bootstrap Functions (originally by Angelo Canty for S)class Functions for Classificationcluster Cluster Analysis Extended Rousseeuw et al.codetools Code Analysis Tools for Rcompiler The R Compiler Package

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


datasets The R Datasets Packageforeign Read Data Stored by Minitab, S, SAS, SPSS, Stata, Systat, dBase,

...graphics The R Graphics PackagegrDevices The R Graphics Devices and Support for Colours and Fontsgrid The Grid Graphics PackageKernSmooth Functions for kernel smoothing for Wand & Jones (1995)lattice Lattice GraphicsMASS Support Functions and Datasets for Venables and Ripley’s MASSMatrix Sparse and Dense Matrix Classes and Methodsmethods Formal Methods and Classesmgcv GAMs with GCV/AIC/REML smoothness estimation and GAMMs by PQLnlme Linear and Nonlinear Mixed Effects Modelsnnet Feed-forward Neural Networks and Multinomial Log-Linear Modelsrpart Recursive Partitioningspatial Functions for Kriging and Point Pattern Analysissplines Regression Spline Functions and Classesstats The R Stats Packagestats4 Statistical Functions using S4 Classessurvival Survival analysis, including penalised likelihood.tcltk Tcl/Tk Interfacetools Tools for Package Developmentutils The R Utils Package

Existe una gran cantidad de otros paquetes disponibles en el website del Rque el usuario puede descargar simplemente siguiendo los siguientes pasos.

1. Conectese a internet.

2. Inicialice una sesion R. Vaya al menu Paquetes-Seleccionar Espejo CRAN.

3. En la ventana CRAN mirror seleccione Colombia (Bogota) y presione OK.

4. Vuelva al menu Paquetes y esta vez seleccione Instalar paquete(s)... yen la ventana Packages resultante, seleccione el paquete que se deseadescargar, buscando por nombre en orden alfabetico y finalmente pre-sione OK.

Sin embargo, lo anterior a veces puede fallar bien sea por error de configu-racion del R o problemas con la conexion a Internet usando R. En este casopuede realizarse lo siguiente:

1. Ingrese a la pagina http://cran.r-project.org ilustrada en la Figura 1.1, yen el menu del lado izquierdo en Software seleccione la opcion Packages.

2. En la pagina Contributed Packages, seccion Available Packages en-cuentra las siguientes dos opciones o links:

Table of available packages, sorted by date of publication

Table of available packages, sorted by name

3. Seleccione Table of available packages, sorted by name, lo cual lo lleva ala pagina Available CRAN Packages By Name, ilustrada en la Figura 1.6.Busque por orden alfabetico, uno a uno los paquetes que desee descargar.

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ

1.2. COMO USAR R 7

4. Una vez seleccione el paquete en la lista alfabetica, aparece la paginade descarga, por ejemplo, para la librerıa nlme , la pagina aparece titula-da como nlme: Linear and Nonlinear Mixed Effects Models, ilustradaen la Figura1.7, donde se visualiza una breve descripcion de la librerıa,su numero de version y dependencia con otras librerıas o paquetes quedeberan descargarse caso que el usuario aun no las tenga disponiblesen su maquina. En la seccion Downloads se selecciona la opcion paraWindows binary: nlme-3.1-102.zip (este archivo cambiara de nombre deacuerdo a sus actualizaciones). Guarde el archivo en su maquina.

Figura 1.6: Pagina de busqueda y descarga de paquetes, segun nombre

Figura 1.7: Pagina de descarga paquete nlme

5. Para instalar en R la librerıa descargada mediante archivo .zip, inicie unasesion R, vaya al menu Paquetes - Instalar paquete(s) a partir de archivos

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


zip locales... Emerge una ventana para que ud. explore en su maquinahasta hallar la ruta donde guardo el archivo .zip del paquete R a instalar.

Figura 1.8: Instalacion paquete R usando archivo .zip

Para consultar la lista de funciones disponibles en una librerıa particular (yadisponible en su maquina) usamos el comando:

library(help="nombre de la libreria")

Por ejemplo, si se desea saber cuales funciones estan disponibles en la li-brerıa splines , ejecutamos el siguiente comando:

library(help="splines")

Para conocer sobre la sintaxis y uso de alguna funcion en particular pode-mos usar el menu Ayuda o el comando ?paquete::funci on, por ejemplo,

?car::boxCox .

Si la funcion se encuentra en la librerıa base , usamos simplemente el co-mando ?funci on, por ejemplo,

?lm

NOTA: R es sensible a mayusculas y minusculas por lo que es importanteescribir los nombres de funciones y librerıas conforme han sido definidos.

Algunas veces el usuario desconoce el nombre de la funcion deseada. Si ya

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ

1.2. COMO USAR R 9

existe en alguna librerıa previamente descargada, se puede recurrir a la busque-da con una palabra clave con

help.search("palabra-clave") o ??palabra-clave .

Por ejemplo,

??shapiro o help.search("shapiro") ,

da como resultado un listado de funciones R y su ubicacion (paquete::funcion ),como el siguiente,

Help files with alias or concept or title matching ’shapiro’ usingfuzzy matching:stats::shapiro.test Shapiro-Wilk Normality Test

Type ’?PKG::FOO’ to inspect entries ’PKG::FOO’, or ’TYPE?PKG::FOO’ forentries like ’PKG::FOO-TYPE’.

R ademas permite al usuario crear sus propias funciones con el comandofunction() , estas son almacenadas en una forma interna especial y puedenser usadas en expresiones subsiguientes. Esta caracterıstica proporciona unagran potencialidad y versatilidad al lenguaje permitiendo al usuario mayorproductividad en el uso del R. Una funcion es definida mediante una asig-nacion de la forma

nombre=function(arg.1, arg.2, ...){expresiones}

Las expresiones usadas son expresiones admisibles en R que usan los argu-mentos arg.i , para calcular un valor o producir un objeto determinado (vec-tor, matriz, lista, arreglo, etc.). Una invocacion o llamada de la funcion tomala forma nombre(expr.1,expr.2,...) donde expr.i es el valor particularpara el argumento arg.i de la funcion.

A continuacion, un listado de las funciones basicas utilizadas o que puedenser utiles para el lector. Para detalles consultar directamente la ayuda y man-uales del R.ESTADÍS

TICA III

- 300

9137

NELFI G

ONZÁLEZ


1.3. Resumen de algunas funciones basicas de R

1.3.1. Funciones para entrada y lectura de datos y escritura y exportacionde resultados y objetos R

Comando Funcion

scan() Lectura de datos. Especial para datos no estructuradosread.table() Lectura de archivos en formato de tablaread.fwf() Lectura de archivos en formato de tabla con ancho fijoread.csv() Lectura de archivos en formato de tabla con datos separados por comasread.ftable() Lectura de una tabla de contingencia guardada en archivo ASCIIsink() Env´ıo a archivo ASCII los resultados de una sesionwrite() Escribe una matriz en un archivo ASCIIwrite.ftable() Escribe una tabla de contingencia en un archivo ASCIIxtable() Escribe una matriz en formato Latex. Requiere la librer´ıa xtableftable() Permite presentar decentemente un arreglo multidimensional

1.3.2. Operadores

Aritmeticos De comparacion Logicos y de control

+ Suma < menor & y- Resta > mayor | o* Multiplicacion <= menor o igual ! no/ Division >= mayor o igual all(...) ¿Todos los valores logicos son ciertos?ˆ Exponenciacion == igual any(...) ¿Alguno de los valores logicos es cierto?

%/% Division entera != diferente && Si primer operando es cierto evalua% % Operador modulo segundo operandosqrt(x)

√x || Si primer operando es falso evalua

exp(x) ex segundo operando.

1.3.3. Funciones relacionadas con distribuciones

Distribucion Densidad Funcion Acumulada Cuantil p Numeros aleatorios

Uniforme dunif(x,...) punif(q,...) qunif(p,...) runif(n,...)Normal dnorm(x,...) pnorm(q,...) qnorm(p,...) rnorm(n,...)Binomial dbinom(x,...) pbinom(q,..) qbinom(p,...) rbinom(n,...)Lognormal dlnorm(x,...) plnorm(q,...) qlnorm(p,...) rlnorm(n,...)Beta dbeta(x,...) pbeta(q,...) qbeta(p,...) rbeta(n,...)Geometrica dgeom(x,...) pgeom(q,...) qgeom(p,...) rgeom(n,...)Gamma dgamma(x,...) pgamma(q,...) qgamma(p,...) rgamma(n,...)Ji cuadrado dchisq(x,...) pchisq(q,...) qchisq(p,...) rchisq(n,...)Exponencial dexp(x,...) pexp(q,...) qexp(p,...) rexp(n,...)F df(x,...) pf(q,...) qf(p,...) r(n,...)Hipergeom. dhyper(x,...) phyper(q,...) qhyper(p,...) rhyper(n,...)t dt(x,...) pt(q,...) qt(p,...) r(n,...)Poisson dpois(x,...) ppois(q,...) qpois(p,...) rpois(n,...)Weibull dweibull(x,...) pweibull(q,...) qweibull(p,...) rweibull(n,...)Binom. Neg. dnbinom(x,...) pnbinom(q, s...) qnbinom(p,...) rnbinom(n,...)

1.3.4. Funciones que producen escalares

Comando Funcion

max() Maximo del argumentomin() M´ınimo del argumentosum() Suma de todos los elementos del argumentomean() Promedio aritmetico de todos los elementos del argumentovar() Varianza de todos los elementos del argumento, cuando este es

un vector, o matriz de covarianzas si el argumento es una matrizmedian() Mediana del argumentoquantile(...,probs=c(...)) Cuantiles del argumento con las proporciones indicadas en ’probs’prod() Producto de todos los elementos del argumentolength() Numero de elementos del argumento si este es una lista o vectorncol() Numero de columnas si el argumento es una matriznrow() Numero de filas si el argumento es una matriz

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ

1.3. RESUMEN DE ALGUNAS FUNCIONES BASICAS DE R 11

1.3.5. Condicionales y loops

if(condici on) {expresiones } else expresi on

ifelse(condici on,1,0)

for(nombre in expresi on) {expresiones }

while(condici on) {expresiones }

1.3.6. Algunos objetos R

Vectores, matrices y arreglos

Comando Funcion

c() Crea vectoresappend() Combina vectores o adiciona elementos a un vectormatrix(), as.matrix(), data.matrix() Crea matricesarray(), as.array() Crea arreglos

Listas y tramas de datos

Comando Funcion

list(), as.list() Crea listas de objetosdata.frame(), as.data.frame() Crea colecciones de variables en estructura tabular

1.3.7. Algunas operaciones con matrices

Comando Funcion

%* % Producto matricialt() Transposicion de una matrizcrossprod(A) Producto AtAsvd() Descomposicion en valores singulares de una matrizqr() Descomposicion qrchol() Descomposicion de Choleskysolve() Inversa de una matrizcbind() Combina matrices por columnasrbind() Combina matrices por filaseigen() Calculo de valores y vectores propiosdiag() Crea una matriz diagonal si el argumento es un vector o

retorna la matriz diagonal de una matriz

1.3.8. Aplicando funciones a objetos R

Comando Funcion

apply() Aplica una funcion a filas o columnas de una matriztapply() Aplica una funcion a cada celda de un arreglolapply() Aplica una funcion a cada elemento de una lista y devuelve una listasapply() Como lapply pero devuelve un vector o matriz

1.3.9. Funciones que producen graficas

Comando Funcion

hist() Grafica histogramasboxplot() Grafica boxplotsplot() Funcion generica para graficos de dispersion,de series de tiempo, de

residuales, etc.qqplot() Grafico cuantil-cuantilqqnorm() Grafico de probabilidad normalpairs() Grafico de matrices de dispersion

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


1.3.10. Funciones varias

Comando Funcion

lm() Funcion para ajuste de un modelo lineal por m´ınimos cuadradossummary() Funcion generica para exhibir resumen de resultados de modelos ajustadosts() Crea objetos tipo series de tiempoacf() Estima y grafica la autocorrelaciones o autocovarianzas para un objeto

serie de tiempopacf() Estima y grafica las autocorrelaciones parciales para un objeto serie

de tiempoBox.test() Realiza test Box-Pierce o test Ljung-Box sobre un objeto serie de tiempolag.plot() grafica una serie vs. Versiones rezagadas de ella mismaresiduals() extrae residuales de modelos ajustados con alguna funcion como lm()fitted() extrae valores ajustados de modelos ajustados con alguna funcion de modelacionpredict() produce predicciones a partir de los resultados de varias funciones R que

ajustan modelos. los metodos que usa dependen de la clase de objeto Rproducido por una funcion de modelacion espec´ıfica.

durbin.watson() Funcion de la librer´ıa car que realiza el test Durbin-Watson

Nota: Existen muchas otras funciones para el analisis y modelacion deseries de tiempo que seran vistas posteriormente en el desarrollo del curso.

1.4. Lectura e ingreso de datos de series de tiempo

Para la lectura de bases de datos externas de series de tiempo usaremoslas funciones R scan() , read.table() , read.csv() , read.delim() .

1.4.1. Lectura de series univariadas

En R se usa el punto como delimitador de decimales. Podemos ingresar lasobservaciones de una serie univariada por teclado, usando la funcion scan() ,como se ilustra a continuacion

Codigo R 1.1.

salario<-scan()94.08 102.23 103.99 103.21 102.59 100.95101.67 101.71 99.93 100.11 99.65 89.8190.71 99.88 100.75 101.67 100.58 98.8298.21 98.96 99.30 98.40 99.17 91.1290.85 102.67 104.36 101.71 101.48 100.29100.33 102.24 101.24 102.02 103.79 95.9596.52 106.55 108.50 108.04 108.68 108.34108.14 109.75 108.28 108.76 109.36 101.03101.01 109.63 111.20 109.67 110.24 110.94110.38 111.50 111.73 112.94 113.87 107.39103.38 113.84 114.96 116.00 113.54 113.25113.35 114.88 113.81 116.03 117.50 109.50105.87 117.69 119.22 118.80 118.48 116.65116.54 117.03 116.04 116.87 118.60 108.91109.53 120.21 122.15 122.48 124.30 121.99122.20 121.41 120.69 122.72 124.70 115.65114.15 123.45 124.66 122.08 121.64 119.48120.02 122.33 121.50 122.45 123.63 115.43111.66 124.21 126.22 126.88 126.88 127.33127.27 128.88 128.54 130.28 132.15 124.65119.19 131.69 130.87 129.95 130.83 131.23132.64 133.50 132.98 134.38 135.12 130.16121.78 132.44 132.89 130.83 131.41 130.40131.79 132.46 131.00 132.46 133.61

salario=ts(salario,frequency=12,start=c(1990,1))

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ

1.4. LECTURA E INGRESO DE DATOS DE SERIES DE TIEMPO 13

con la lınea salario=ts(salario,frequency=12,start=c(1990,1)) esta-mos redefiniendo el objeto salario como una serie de valores recolectadoscon frecuencia mensual, y que inicia en enero de 1990. Para datos trimes-trales se especificarıa frequency=4 y para una serie anual, frequency=1 .

Para leer datos univariados editados en Excel en una columna, estos seguardan en formato .CSV (delimitado por comas). Si en este archivo se usacoma para la posicion decimal y los datos no estan encabezados por alguntıtulo, debemos leer los datos usando

read.csv2(file.choose(),header=F,dec=",")

Si el primer registro en el archivo es un tıtulo o cualquier texto, usamos

read.csv2(file.choose(),header=T,dec=",")

El argumento file.choose() se usa para habilitar la ventana de busque-da del archivo dentro de las carpetas en Windows. Por ejemplo, para leer elarchivo DATOSSALARIOREALENER1990-MAYO2011.CSV en la Figura 1.9 ycrear la serie de tiempo correspondiente, usamos el siguiente codigo:

Figura 1.9: Archivo .csv con coma en posicion decimal

Codigo R 1.2.

datos.salreal=read.csv2(file.choose(),header=F,dec=",")datos.salreal=ts(datos.salreal,frequency=12,start=c(1990,1))

Para leer datos univariados en formato .CSV donde se uso punto para laposicion decimal y los datos no estan encabezados por algun tıtulo, debemos

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


usar

read.csv(file.choose(),header=F,dec=".")

Si el primer registro en el archivo es un tıtulo o cualquier texto, usamos

read.csv(file.choose(),header=T,dec=".")

Por ejemplo, considere los datos en el archivo DATOSSALARIOREALENER1990-MAYO2011b.CSV en la Figura 1.10. Para su lectura usamos el siguiente codi-go:

Figura 1.10: Archivo .CSV con punto en posicion decimal

Codigo R 1.3.

datos.salreal2=read.csv(file.choose(),header=T,dec=".")datos.salreal2=ts(datos.salreal2,frequency=12,start=c(1990,1))

Finalmente, si los datos de la serie estan guardados en un archivo de texto.DAT o .TXT, donde la posicion decimal es indicada con coma, usamos

read.table(file.choose(),header=F,dec=",")read.table(file.choose(),header=T,dec=",")

Si la posicion decimal es indicada por punto basta usar el argumento dec="."o no especificarlo:

read.table(file.choose(),header=F,dec=".")read.table(file.choose(),header=T,dec=".")

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ

1.4. LECTURA E INGRESO DE DATOS DE SERIES DE TIEMPO 15

read.table(file.choose(),header=F)read.table(file.choose(),header=T)

Por ejemplo, considere los datos guardados sobre la serie del ındice de salarioreal, en el archivo de texto DATOSSALARIOREALENER1990-MAYO2011b.TXTy que se ilustra en la Figura 1.11.

Figura 1.11: Archivo .TXT con punto en posicion decimal

Para la lectura de este archivo usamos el siguiente codigo:

Codigo R 1.4.

datos.salreal3=read.table(file.choose(),header=T)datos.salreal3=ts(datos.salreal3,frequency=12,start=c(1990,1))

1.4.2. Exportacion de resultados numericos y graficos del R

Los resultados numericos de alguna funcion o comando pueden ser expor-tados con las opciones copiar - pegar o enviandolos a archivos externos con lasfunciones R sink() , write() , dump() , esta ultima guarda objetos en formatoR (matrices, vectores, arreglos, etc.). De igual manera las graficas producidaspueden ser guardadas en una variedad de formatos (metafile, postscript, png,pdf, bmp, tiff, jpeg), o copiadas y pegadas directamente en un editor de textocomo MS-Word. Datos y comandos guardados como objetos R (con funciondump() ) pueden ser cargados en cualquier sesion con la funcion source() .Para mas detalles sobre estas funciones consultar la ayuda del R usando elcomando de consulta ?nombre-funci on.

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


1.5. Graficando una serie de tiempo

Una vez leıdo el conjunto de datos de una serie y creado el objeto de tiposerie de tiempo con la funcion ts() , podemos hacer uso de la funcion plot() ,ası,

plot(objeto-serie)

Por ejemplo, para el objeto datos.salreal3 en codigo R 1.4, usamos

Codigo R 1.5.

win.graph(width=4,height=4,pointsize=8)plot(datos.salreal3)

con lo cual obtenemos la Figura 1.12. El comando

win.graph(width=4,height=4,pointsize=8)

permite abrir una ventana grafica del ancho y alto especificado en pulgadascon sus dos primeros argumentos, respectivamente, mientras que pointsize=8indica el tamano del texto graficado.

Time

sala

riore

al

1990 1995 2000 2005 2010

9010

011

012

013

014

015

0

Figura 1.12: Serie ındice mensual salario real sector manufacturero colombiano, sin trilla

de cafe, enero de 1990 a mayo de 2011.

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ

1.6. REGRESION LINEAL MULTIPLE CON R 17

1.6. Regresion lineal multiple con R

Recordemos el problema de regresion lineal multiple:

Y = β0 + β1X1 + β2X2 + · · ·+ βkXk + Ei

donde

Y : Respuesta o variable dependiente

X1, X2, · · · , Xk : k variables explicatorias o independientes (no estocasti-cas)

β0, β1, · · · , βk: k + 1 parametros (usualmente desconocidos)

E: Error aleatorio

1. E (E; ) = 0

2. Var (E; ) = σ2

3. Adicionalmente, se asume que su distribucion es normal, N(0, σ2)

Y ∼ N(β0 + β1X1 + · · ·+ βkXk, σ

2)

E [Y |X1, X2, · · · , Xk] = β0 + β1X1 + · · ·+ βkXk

La muestra aleatoria consta de n puntos. El i-esimo punto se denota como

(Xi1, Xi2, · · · , Xik, Yi) , para i = 1, 2, · · · , nCondicion

Cov (Yi, Yj) = 0 para todo i 6= j

Yi = β0 + β1Xi1 + β2Xi2 + · · ·+ βkXik + Ei para i = 1, 2, · · · , n (*),

modelo (*) es aplicado al i-esimo punto.Para las n observaciones tenemos

Y1 = β0 + β1X11 + β2X12 + · · ·+ βkX1k + E1

Y2 = β0 + β1X21 + β2X22 + · · ·+ βkX2k + E2

......

...

Yn = β0 + β1Xn1 + β2Xn2 + · · ·+ βkXnk + En

El objetivo es estimar los parametros β’s a partir de este sistema de ecua-ciones. En notacion matricial tenemos que el sistema de ecuaciones anteriorcorresponde a

Yn×1 = Xn×(k+1)β(k+1)×1 + En×1

Si β denota el estimador de β, se puede mostrar que β =(XTX

)−1XTY. Este

es el estimador de mınimos cuadrados y corresponde al estimador de maximaverosimilitud bajo el supuesto de normalidad.

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


1.6.1. Funcion lm

Esta funcion es usada para ajustar modelos lineales. Puede usarse pararealizar regresiones, analisis de varianza estratificada simple y analisis de co-varianza (aunque la funcion aov() puede dar una interface mas convenientepara estos dos ultimos modelos). Su sintaxis general es como sigue:

lm(formula, data, subset, weights, na.action,method = "qr", model = TRUE, x = FALSE, y = FALSE, qr = TRUE,singular.ok = TRUE, contrasts = NULL, offset = NULL, ...)

Argumentos:

formula: Una descripcion simbolica del modelo a ser especificado.

data: Marco de datos opcional que contiene las variables en el mode-lo. por defecto las variables son tomadas de ‘environment(formula)’ ,tıpicamente el ambiente del cual lm es llamada, es decir, son objetos R(vectores) de la misma dimension, previamente definidos.

subset: Un vector opcional para especificar un subconjunto de observa-ciones usadas en el proceso de ajuste.

weights: Un vecto opcional con pesos a ser usados en el proceso deajuste. Si es especificado, mınimo cuadrados ponderados es usado con

los pesos especificados, es decir, se minimizan∑

i=1

wiE2i ; de lo contrario se

usa mınimos cuadrados ordinarios.

na.action: Una funcion que indica lo que deberıa hacerse cuando haydatos faltantes o ‘NA’s. El valor por defecto es el ajustado por ‘na.action’.

method: El metodo a ser usado para el ajuste. Actualmente solo es so-portado el metodo ‘qr’ ; method =“model.frame ” devuelve el marco delmodelo.

model, x, y, qr: Argumentos logicos. Si son iguales a TRUE los compo-nentes correspondientes del ajuste (el marco del modelo, la matriz delmodelo, la respuesta, la descomposicion QR) son devueltos con esta op-cion.

singular.ok: Argumento logico, por defecto es TRUE. FALSE no esta im-plementado.

contrasts: Una lista opcional. Ver ‘contrasts.arg’ de

‘model.matrix.default’ .

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


offset: Puede usarse para especificar un parametro conocido en formaapriori y que ha de ser incluido en el predictor lineal durante el ajuste.Uno o mas terminos ‘offset’s pueden ser incluidos en la formula y sise especifica mas de uno entonces su suma es usada.

...: Argumentos adicionales.

Detalles:

Los modelos para lm se especifican simbolicamente. El modelo usual tienela forma respuesta∼ terminos donde respuesta es el vector de respuesta yterminos es una serie de predictores lineales. Estos terminos se especificande la forma ‘primero+segundo’ indicando todos los terminos en ‘primero’ jun-to con todos los terminos en ‘segundo’, con duplicaciones siendo removidas.Una especificacion de la forma ‘primero:segundo’ indica que debe incluirseel conjunto de terminos obtenidos al tomar las interacciones de todos losterminos en ‘primero’ con todos los terminos en ‘segundo’. La especificacion‘primero*segundo’ indica el cruce de ‘primero’ y ‘segundo’. Esto es lo mismoque primero + segundo + primero:segundo’. Una formula tiene implıcito el in-tercepto. Para removerlo se usa y ∼ x - 1 o y ∼ 0 + x . Ver formula paramas detalles sobre formulas permitidas.

Las funciones summary y anova son usadas para obtener e imprimir un re-sumen y una tabla de analisis de varianzas de los resultados. Las funcionesgenericas extractoras coefficients, effects, fitted.values y residualsextraen varias caracterısticas utiles de los valores retornados por lm .

Un objeto de clase ‘’lm” es una lista con los siguientes componentes, entreotros:

coefficients: Un vector con los coeficientes

residuals: Los residuales, es decir la respuesta menos valores ajustados.

fitted.values: Los valores ajustados.

rank: El grado del modelo lineal ajustado.

weights: Pesos si se hizo ajuste ponderado.

df.residual: Grados de libertad de los residuales.

formula: La formula dada.

terms: El objeto ‘terms’ usado.

contrasts: Solo donde sea relevante, los contrastes usados.

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


xlevels: Solo donde sea relevante, un registro de los niveles de los factoresusados en el ajuste.

y: Si es requerido o invocado, la respuesta usada.

x: Si es requerido o invocado, la matriz modelo usada.

model: El marco de modelo usado.

Ver tambien: summary.lm, anova.lm, coefficients, effects, residuals,fitted.values, predict.lm (para prediccion e intervalos de prediccion),lm.influence (para diagnosticos de regresion) y glm (para modelos linealesgeneralizados).

Formulacion de un modelo en R

Supongamos que y, x, x1, x2, · · · son variables numericas, X es una matriz yA,B,C, · · · son factores. La siguiente tabla presenta las formulas utilizadas enR para especificar los modelos descritos:

Formula

y ∼ x Ambas formulas definen una regresion linealy ∼ 1 + x simple. El segundo tiene explıcito el intercepto.

y ∼ -1 + x Regresion simple a traves del origen.y ∼ x -1log(y) ∼ x Regresion simple con la respuesta transformada.

y ∼ x1 + x2 Regresion multiple con dos variables explicativas.Se incluye el intercepto implıcitamente.

y ∼ poly(x,2) Regresion polinomial de grado 2. Utiliza polinomiosortogonales para la construccion de la matriz de diseno.

y ∼ x+ I(xˆ2) Regresion polinomial de grado 2. Utilizalas potencias explıcitas

y ∼ X + poly(x,2) Modelo de regresion multiple de y con lamatriz de diseno X y con un polinomioen x de grado 2.

y ∼ A Analisis de varianza con un factor

y ∼ A + x Analisis de covarianza con A como factor y xcomo covariable.

y ∼ A + B Analisis de varianza con dos factoresA y B sin interaccion

y ∼ A* B Analisis de varianza con interaccion.y ∼ A + B + A:By ∼ B %in %A Modelo encajado del factor B en A.y ∼ A/By ∼ (A + B + C)ˆ2 Modelo de tres factores que contiene los efectosy ∼ A* B* C -A:B:C principales las interacciones entre pares de factores.

y ∼ A * x Modelos de regresion simples separados dentro dey ∼ A/x los diferentes niveles de A.

y ∼ A/(1+x) - 1 Modelos de regresion simples que produceen forma explıcita diferentes pendientes einterceptos como niveles tenga A

y ∼ A* B + Error(C) Un experimento con dos tratamientos, A y B,y un error de estrato determinado por C.Por ejemplo, un experimento split-plot.

Ejemplo 1:

Cuatro pruebas (X1, X2, X3, X4) para seleccion de personal son aplicadas aun grupo de 20 aspirantes y se registran los respectivos puntajes. Despues de

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


2 anos de contratacion estos 20 empleados son clasificados de acuerdo a lapuntuacion de la aptitud (Y ) exhibida para el trabajo. Los datos se presentanel la siguiente tabla:

Y X1 X2 X3 X4

94 122 121 96 8971 108 115 98 7882 120 115 95 9076 118 117 93 95

111 113 112 109 10964 112 96 90 88

109 109 129 102 108104 112 119 106 10580 115 101 95 8873 111 95 95 84

127 119 118 107 11088 112 110 100 8799 120 89 105 9780 117 118 99 10099 109 125 108 95

116 116 122 116 102100 104 83 100 10296 110 101 103 103

126 117 120 113 10858 120 77 80 74

A continuacion un programa R para el analisis por regresion de estos datos

Codigo R 1.6.

###LECTURA DE LOS DATOS, ORDEN DE COLUMNAS: Y, X1, X2, X3, X4###datos=data.frame(matrix(scan(),ncol=5,byrow=T))94 122 121 96 8971 108 115 98 7882 120 115 95 9076 118 117 93 95111 113 112 109 10964 112 96 90 88109 109 129 102 108104 112 119 106 10580 115 101 95 8873 111 95 95 84127 119 118 107 11088 112 110 100 8799 120 89 105 9780 117 118 99 10099 109 125 108 95116 116 122 116 102100 104 83 100 10296 110 101 103 103126 117 120 113 108

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


58 120 77 80 74

#ASIGNANDO NOMBRES A COLUMNAS EN CONJUNTO DE DATOSnames(datos)=c("Y","X1","X2","X3","X4")

datos

#DIBUJANDO UNA MATRIZ DE GRAFICOS DE DISPERSIONpairs(datos)

#Anclando variables guardadas en datos para disponibilizarlasattach(datos)

###AJUSTE MRLM###

#Una maneramodelo=lm(Y˜X1+X2+X3+X4)

#o bien, la regresion de Y vs. todas las demas variables en dataframe datosmodelo=lm(Y˜.,datos)

#para ver el listado de objetos guardados en ’modelo’names(modelo)

##IMPRIMIENDO EN PANTALLA VARIOS RESULTADOS RELATIVOS AL MODELO AJUSTADO####Ver la tabla de parametros estimadossummary(modelo)

#Ver tabla de intervalos de confianza para parametros estimadosconfint(modelo)

#Ver tabla de pruebas secuenciales o con sumas de cuadrados SS1anova(modelo)

#Ver tabla de pruebas parciales o con sumas de cuadrados SS2library(car)Anova(modelo)

#Desanclando variables guardadas en ’datos’detach(datos)

##GRAFICOS RESIDUALES ESTUDENTIZADOS Y DE NORMALIDAD###Formando un data frame con los valores ajustados, los predictores y residuos#estudentizados

datos.modelo=data.frame(cbind(Yhat=fitted(modelo),datos[-1],res_estudent=rstudent(modelo)))

#Creando una ventana grafica de ancho 17 y alto 13 pulgadaswin.graph(width=17,height=13,pointsize=8)

#Dividiendo la ventana en una matriz de 2x3 para acomodar las seis graficas de#residuales incluyendo el grafico de normalidadnf=layout(rbind(c(1,1,2,2,3,3),c(4,4,5,5,6,6)))

attach(datos.modelo)plot(Yhat,res_estudent,ylab="Residuos estudentizados",xlab="Valores ajustados",cex.lab=2,cex=2)abline(h=0,lty=2,lwd=2)abline(h=-2,lty=2,col="red",lwd=2)abline(h=2,lty=2,col="red",lwd=2)

plot(X1,res_estudent,ylab="Residuos estudentizados",xlab="X1",cex.lab=2,cex=2)abline(h=0,lty=2,lwd=2)abline(h=-2,lty=2,col="red",lwd=2)abline(h=2,lty=2,col="red",lwd=2)

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ





#Grafico de probabilidad normal sobre residuales estudentizadosqqnorm(res_estudent,ylab="Residuales estudentizados",cex.lab=2,cex=2)qqline(res_estudent,lty=2,lwd=2)

detach(datos.modelo)

#o bien, creando cada grafico por separadowin.graph()plot(fitted(modelo),rstudent(modelo),ylab="Residuos estudentizados",xlab="Valores ajustados",cex.lab=2,cex=2)abline(h=0,lty=2,lwd=2)abline(h=-2,lty=2,col="red",lwd=2)abline(h=2,lty=2,col="red",lwd=2)

win.graph()plot(datos$X1,rstudent(modelo),ylab="Residuos estudentizados",xlab="X1",cex.lab=2,cex=2)abline(h=0,lty=2,lwd=2)abline(h=-2,lty=2,col="red",lwd=2)abline(h=2,lty=2,col="red",lwd=2)

win.graph()qqnorm(rstudent(modelo),ylab="Residuales estudentizados",cex.lab=2,cex=2)qqline(rstudent(modelo),lty=2,lwd=2)

##TEST DE NORMALIDAD ###sobre residuales comunesshapiro.test(residuals(modelo))

#o bien, sobre residuales estudentizadosshapiro.test(rstudent(modelo))

##INTERVALOS DE PREDICCION PARA RESPUESTA DENTRO DE LA MUESTRA##predict(modelo,interval="prediction")

#INTERVALOS DE CONFIANZA PARA RESPUESTA MEDIA DENTRO DE LA MUESTRA##temp4=predict(modelo,interval="confidence")

##PREDICCIONES Y SUS INTERVALOS EN DOS OBSERVACIONES NUEVAS##nuevo=data.frame(X1=c(100,101),X2=c(121,115),X3=c(97,101),X4=c(75,98))predict(modelo,newdata=nuevo,interval="prediction")

Nota: La librerıa car debe ser descargada del CRAN.

Ejemplo 2: (Regresion con variables indicadoras)

Un gran almacen realizo un experimento para investigar los efectos de losgastos por publicidad sobre las ventas semanales de sus secciones de ropapara caballeros (A), para ninos (B) y para damas (C). Se seleccionaron al azar 5

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


semanas para observacion en cada seccion, y un presupuesto para publicidad(X1, en cientos de dolares) se asigno a cada una de las secciones. Las ventassemanales (en miles de dolares), los gastos de publicidad en cada uno de lastres secciones en cada una de las cinco semanas del estudio se listan en lasiguiente tabla.

SEC X1 Y

A 5.2 9A 5.9 10A 7.7 12A 7.9 12A 9.4 14B 8.2 13B 9.0 13B 9.1 12B 10.5 13B 10.5 14C 10.0 18C 10.3 19C 12.1 20C 12.7 21C 13.6 22

A continuacion un programa R para la regresion, modelo con interaccionentre variable X1 y SEC, y modelo sin interaccion

Codigo R 1.7.

datos2=data.frame(scan(what=list("",0,0)))A 5.2 9A 5.9 10A 7.7 12A 7.9 12A 9.4 14B 8.2 13B 9.0 13B 9.1 12B 10.5 13B 10.5 14C 10.0 18C 10.3 19C 12.1 20C 12.7 21C 13.6 22

names(datos2)=c("SEC","X1","Y")

###GRAFICANDO Y VS. X1 SEGUN SECCION###attach(datos2)

plot(X1,Y,pch=as.numeric(SEC),col=as.numeric(SEC),xlab="X1",ylab="Y",cex=2,cex.lab=2)legend("topleft",legend=c("A","B","C"),pch=c(1:3),col=c(1:3),cex=2)

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


#o bien:

plot(datos2$X1,datos2$Y,pch=as.numeric(datos2$SEC),col=as.numeric(datos2$SEC),xlab="X1",ylab="Y",cex=2,cex.lab=2)legend("topleft",legend=c("A","B","C"),pch=c(1:3),col=c(1:3),cex=2)

###MODELO GENERAL: RECTAS DIFERENTES TANTO EN PENDIENTE COMO EN INTERCEPTO###modelo2=lm(Y˜X1 * SEC)summary(modelo2)confint(modelo2)

###MODELO CON RECTAS DIFERENTES SOLO EN EL INTERCEPTO###modelo3=lm(Y˜X1+SEC)summary(modelo3)confint(modelo3)

###CAMBIANDO NIVEL DE REFERENCIA DE LA VARIABLE CUALITATIVA######MODELO CON RECTAS DIFERENTES SOLO EN EL INTERCEPTO###SEC=relevel(SEC,ref="C")modelo4=lm(Y˜X1+SEC,datos2)summary(modelo4)confint(modelo4)

detach(datos2)

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ

Capıtulo 2

El analisis de series de tiempo

2.1. Introduccion

“El analisis de series de tiempo consiste en el desarrollo de modelos estadısti-

cos para explicar el comportamiento de una variable aleatoria que varıa en el

tiempo, con el fin de estimar pronosticos futuros de dicha variable con fines de

planeacion y toma de decisiones”.

El pronostico realizado se basa en la estructura o comportamiento pasa-do de la serie, suponiendo que este se conserva en el futuro. Los metodos depronostico son una rama particular de la estadıstica aplicada y por lo tan-to reunen sus propios conceptos y metodos especıficos. Los pronosticos sonademas una de las principales herramientas de tipo cuantitativo aplicadas enlos negocios en sus procesos de planeacion y toma de decisiones, y tambienhan sido utilizados en las ciencias sociales y el area militar.

Pronosticar puede definirse como “el esfuerzo de prever eventos futuros ex-aminando el pasado” (Gaynor y Kirkpatrick [4]), con en fin de controlar elriesgo y la incertidumbre. Sin embargo, las tecnicas de pronostico pueden es-tar basadas tambien en la experiencia o la opinion de “expertos”, o en modelosmatematicos (simulaciones dinamicas) que describen los patrones pasados.La mayorıa de los pronosticos se basan en el supuesto de que la variable oevento a pronosticar es afectada o por el tiempo o por un conjunto de vari-ables con las cuales puede tener ya sea una relacion de causa efecto o bien,una relacion de tendencia.

El estudio de las series de tiempo ademas de permitir formular modelosy pronosticos, tambien permite evaluar los efectos de acciones o decisionespasadas, conocidas como intervenciones hechas sobre la serie. Estas inter-venciones pueden tener un efecto momentaneo o bien un efecto permanenteque modifica la estructura de la serie de tiempo intervenida.

Es importante reconocer el papel del pronostico en la organizacion al igualque los metodos de pronosticos a aplicar. Una organizacion establece metas yobjetivos, trata de predecir los factores ambientales de su negocio, y seleccionalas acciones que espera le lleven a sus metas.

Las areas empresariales en las cuales los pronosticos juegan un papel im-

27

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ

28 CAPITULO 2. EL ANALISIS DE SERIES DE TIEMPO

portante son (Makridakis et.al [7]):

Programacion de los recursos existentes (Pronosticos de corto pla-zo): Para el uso eficiente de los recursos se requiere programar la pro-duccion, el transporte, el efectivo, el personal, etc. Para ello el pronosticodel nivel de la demanda de los productos, materiales, mano de obra, lafinanciacion requerida, etc., son esenciales para la buena programacionde los recursos existentes.

Adquisicion de recursos adicionales (pronosticos de mediano plazo):El lead time para la adquisicion de materia prima, la contratacion de per-sonal, la compra de maquinaria y equipo, etc. puede variar desde dıas avarios anos. Se requiere pues el pronostico para establecer los requerim-ientos futuros de recursos.

Determinacion de que recursos son deseados (pronosticos de largoplazo): Todas las empresas u organizaciones requieren determinar losrecursos que desean o necesitan a largo plazo. Decisiones como estasdependen de las oportunidades de mercado, de los factores ambientalesy de sus recursos internos.

Las empresas deben desarrollar multiples aproximaciones para pronosticareventos inciertos y construir un sistema para pronosticar. Esto a su vez exigeconocimiento y habilidad en al menos las siguientes areas:

Identificacion y definicion de problemas a pronosticar

Aplicacion de una variedad de metodos de pronostico

Procedimientos para seleccionar los metodos apropiados para una situacionespecıfica

Un soporte organizacional para aplicar y usar metodos de pronostico for-malizados

2.2. Clases de pronosticos - pronosticos cuantitativos

Basicamente, la gran clasificacion de los metodos de pronostico es segunsi es cualitativo (cuando practicamente no se cuentan con datos historicos)- tecnologico o cuantitativo (se disponen de datos historicos). En este cursosolo se abordaran algunos metodos cuantitativos. Los metodos cuantitativos

pueden aplicarse cuando se dan las siguientes tres condiciones:

1. Se dispone de informacion historica

2. La informacion disponible puede cuantificarse en forma de datos numeri-cos

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ

2.3. VENTAJAS Y DESVENTAJAS DE LOS METODOS CUANTITATIVOS 29

3. Puede asumirse que algunos aspectos de los patrones dados en el pasadocontinuaran en el futuro (supuesto de continuidad).

Los metodos cuantitativos varıan considerablemente, y han sido desarrolladospor diversas disciplinas para diferentes propositos, sus costos y precisionesvarıan y deben ser consideradas al momento de seleccionarlos.

El pronostico formal implica objetividad y emplea un metodo estadıstico para

obtener pronosticos usando una base regular con fechas especıficas de inicioy fin (Campos Santillan [1]). Involucran tambien la extrapolacion pero de unamanera sistematica buscando minimizar el error de pronostico.

Los metodos cuantitativos de pronostico se dividen en los metodos de Series

de tiempo (suavizamiento, descomposicion, metodos Box - Jenkins) y metodos

causales o econometricos (regresion y correlacion). Los metodos de series detiempo estan basados en el analisis de una secuencia cronologica de observa-ciones de la variable de interes y bajo el supuesto de continuidad antes men-cionado, realiza la prediccion del futuro basado en datos historicos. Por tanto,el objetivo de estos metodos es descubrir el patron subyacente en la serie dedatos historicos y extrapolar ese patron al futuro. Los datos pueden ser an-uales, trimestrales, mensuales, semanales, diarios, horarios, etc., la variablede interes puede ser de naturaleza macroeconomica, tal como una medida deagregacion de la economıa o la industria, o de naturaleza micro economicacomo aquellas medidas para una empresa.

Los modelos causales por su parte asumen que el factor o variable a ser

pronosticada (variable dependiente) mantiene una relacion de causa -efecto con

una o mas variables independientes o predictoras, por tanto, el comportamien-to de estas ultimas permite pronosticar el comportamiento de la variable de-pendiente. Por ejemplo, las ventas pueden ser explicadas por los gastos enpublicidad, el precio de ventas, el ingreso disponible de los consumidores, elnivel de competencia en el mercado, etc. Por tanto, el modelo causal tiene como

proposito descubrir la forma (funcion matematica) de esa relacion y usarla para

pronosticar los valores futuros de la variable dependiente.Puede verse entonces que la diferencia fundamental entre los metodos de

series de tiempo y los causales consiste en que los primeros tratan la informa-

cion como una caja negra sin intentar descubrir los factores que estan afectando

la variable que se analiza, el sistema es pues un proceso no identificado.

2.3. Ventajas y desventajas de los metodos cuantitativos de

pronostico

En general los metodos cuantitativos exhiben las siguientes ventajas:

1. Los pronosticos estan basados en valores predeterminados y pueden serpor tanto objetivos

2. Es posible medir la exactitud de los pronosticos.

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


3. Despues de construir los modelos, se puede ahorrar tiempo en la gen-eracion de los pronosticos y utilizar repetitivamente dichos modelos.

4. Se pueden obtener pronosticos puntuales (un valor especıfico para cadaperiodo) o por intervalos (rango de valores basados en un intervalo deconfianza).

Pero los metodos cuantitativos exhiben tambien desventajas, tales como:

1. Solo son apropiados para pronosticos de corto y mediano plazo con unaprecision razonable.

2. No hay un metodo para contabilizar las influencias externas o los cam-bios que pudieran afectar los resultados. Un pronostico cuantitativo puedeser muy bueno si las condiciones que han existido hasta el momento semantienen; sin embargo, un cambio inducido por fuerzas externas encierto punto del horizonte de pronostico puede hacer bastante malo alpronostico.

2.4. La precision de un pronostico vs. el horizonte de tiem-

po

Un aspecto fundamental a considerar en los pronosticos es la precision, lacual es una funcion inversa del horizonte de tiempo (Campos Santillan [1]):mientras mas cercano en el tiempo esta el futuro a pronosticar, mayor exacti-tud del pronostico. Los pronosticos de largo plazo suelen ser mas imprecisos,debido a variaciones inflacionarias y factores macroeconomicos imprevistosque introducen incertidumbre e inexactitud. Los metodos cuantitativos debenser acompanados de los cualitativos para un mejor pronostico del futuro le-jano.

En los pronosticos de mediano plazo los factores macroeconomicos may-ores tienden a ser menos influyentes pero su impredecibilidad hace que debanser tenidos en cuenta. A mediano plazo los factores que mas causan inexac-titud son las variaciones comerciales especıficas del producto (la moda) y laestacionalidad, que obligan a revisar periodicamente los pronosticos dentrodel ciclo de mediano plazo.

El corto plazo es afectado positivamente por la inercia de muchas de lasactividades economicas en las cuales los modelos de series de tiempo puedengenerar pronosticos mas o menos exactos.

2.5. Las tareas en la realizacion de un pronostico

De acuerdo a Gaynor y Kirkpatrick [4], se deben establecer las siguientesprioridades en la construccion de un modelo de pronostico:

Tarea 1: Determinar el objetivo primario del proyecto de pronostico y especificarclaramente la variable o variables a ser pronosticadas, la periodicidad del

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ

2.6. LA METODOLOGIA DE LOS DATOS DE SERIES DE TIEMPO 31

pronostico (semanales, mensuales, trimestrales, anuales, etc.), la longi-tud de los pronosticos (inmediatos, corto, mediano o largo plazo) y sirelaciones causales son importantes en el pronostico.

Tarea 2: Determinar la disponibilidad de datos chequeando todas las fuentes pri-marias apropiadas de datos, tanto publicas como privadas.

Tarea 3: Recoger los datos, y asegurarse que la tabulacion de estos es comparabley consistente sobre el tiempo.

Tarea 4: Establecer la lınea de tiempo mediante consideracion cuidadosa del tipode modelo de pronostico, incluyendo el numero de observaciones requeri-das para la estimacion del modelo y el numero de perıodos de tiempo enel periodo de pronostico ex ante (periodo futuro del cual no se tienenobservaciones)

Tarea 5: Graficar los datos y examinar sus patrones, para hacer una determi-nacion final de cual tipo de modelo es apropiado considerar.

Tarea 6: Estimar los modelos seleccionados.

Tarea 7: Evaluar el modelo sobre el periodo de estimacion y seleccionar el mejormodelo comparando tanto las medidas resumen de pronostico y los grafi-cos de los valores actuales versus los pronosticados y los errores. Exami-nar los graficos para la habilidad del modelo para capturar los puntos decambio.

Tarea 8: Evaluar el modelo usando el pronostico ex post (Periodo de tiempo deobservaciones conocidas despues del fin del periodo muestral usado enel ajuste). Si es posible, usar tanto medidas de resumen de pronostico ygraficos.

Tarea 9: Generar el pronostico ex ante con lımites de confianza apropiados ypreparar la presentacion del pronostico.

Tarea 10: Despues de establecer el modelo, hacer seguimiento periodico al modeloactualizandolo y revaluandolo.

2.6. La metodologıa de los datos de series de tiempo y pronosti-

cos

En la construccion de un modelo de pronostico, por un metodo cuantitati-vo, se toma una muestra de observaciones del conjunto de datos disponibles.El metodo de recoleccion de los datos y los pronosticos dependen de los fac-tores representados a continuacion:

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


tiempo−∞ +∞

Yt−m Y0

Y1 Yn

Yn+1 YN

YN+1 YN+k

Y1 Yn

Yinicio Yfinal

YN

Pronosticos dentro

de la muestra

Datos historicos

Yt

Muestra

Yt

Perıodo de

backasting

Perıodo de

pronostico

Pronostico ex post

Pronostico ex ante

Figura 2.1: Lınea de tiempo vs. ajuste y pronostico de una serie de tiempo (Gaynor y

Kirkpatrick [4])

Datos historicos: Corresponden desde el valor del periodo de tiempo deinicio Yinicio hasta el valor del periodo de tiempo final Yfinal. El tiempo de inicioes el periodo en el cual la recoleccion de datos sobre la variable comienza yel tiempo final, corresponde al tiempo de la observacion mas reciente de esavariable. Este ultimo periodo debe ser considerado como el “hoy”.

Periodo muestral para analisis: Cubre los valores Y1, · · · , Yn, es el periodosobre el cual sera construido y estimado el modelo de pronostico. Yinicio y Y1

no necesariamente corresponden. En la Figura 2.1 se ilustra un caso en el

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ

2.6. LA METODOLOGIA DE LOS DATOS DE SERIES DE TIEMPO 33

cual la muestra es un subconjunto de los datos historicos. La razon por lacual Yinicio y Y1 pueden diferir es que en algun punto del tiempo pueden haberocurrido cambios estructurales o en las relaciones subyacentes que modificanel patron de los datos. Los modelos de series son construidos bajo el supuestode continuidad, en tanto que los modelos causales son generados con base enpresunciones sobre relaciones de estructura y comportamiento permanentessobre un periodo de tiempo, entonces puede ser que el numero de periodos detiempo desde un cambio identificado sobre la estructura o comportamiento,no es suficiente para la estimacion de la serie y/o del modelo causal. En esecaso debe tenerse cuidado, y mantenerse en mente los cambios ocurridos.

El periodo muestral concluye con la observacion Yn, pero este periodo po-drıa extenderse hasta la observacion Yfinal, es decir Yn = Yfinal. Aunque po-drıa procederse de tal manera cuando hay muchas observaciones entre Yn yYfinal, en la practica no se procede ası, primero porque muchas de las vari-ables economicas son entregadas como estimaciones sujetas a una posteriorrevision, y estos datos revisados pueden ser muy diferentes de los estimadospreliminarmente, por esto no se incluyen las estimaciones en la muestra parael ajuste del modelo de pronostico. En segundo lugar, el proceso de reestimary probar continuamente un modelo de pronostico, consume tiempo y costos.Por tanto la exactitud de los modelos es monitoreada constantemente y solodespues que ciertos estandares de calidad subjetivos dejen de ser satisfechos,entonces el modelo es reestimado y probado.

Periodo de estimacion: En este perıodo se generan los valores de pronosti-co Y1, Y2 · · · , Yn, los cuales conforman el pronostico del modelo dentro de lamuestra. A partir de los valores actuales y pronosticados para Yt, es posiblecalcular los errores de ajuste e1, · · · , en del modelo, y por tanto la exactitud deeste (dentro del periodo de estimacion). Todos los valores mas alla de la obser-vacion Yn, deben ser pronosticados, lo que en la lınea de tiempo se denominaperiodo de pronostico. Todos los pronosticos generados dentro de este periodose conocen como pronosticos fuera de la muestra.

Partes o periodos dentro del periodo de pronostico: El periodo de pronosti-co es dividido en dos sub periodos:

Periodo de pronostico ex post: Periodo que va desde la primera obser-

vacion despues del final del periodo muestral (Yn+1) hasta la observacion masreciente (YN ). Se caracteriza porque el investigador dispone de valores actualesde la variable de la serie de tiempo. Con las observaciones de este periodo esposible determinar la exactitud del modelo fuera de la muestra usando sololos valores actuales y pronosticados de Yt dentro del periodo de pronosticos expost.

Si la exactitud del modelo fuera de la muestra es cuestionable, se tienendos caminos: buscar un modelo alternativo con mayor exactitud o reesti-mar el modelo actual extendiendo el periodo de estimacion hasta el periodoex post. En este ultimo caso se generarıan los pronosticos muestrales desde

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


Y1, Y2, · · · , YN y no se tendrıa un pronostico ex post.

Periodo de pronostico ex ante: Periodo de tiempo en el cual no se tienenobservaciones de la serie de tiempo de la variable de estudio o de cualquier otravariable importante. En ese caso se pronostica dentro del futuro. Los pronosti-cos de este periodo corresponden a YN+1, YN+2, · · · , YN+k, para las cuales no esposible determinar a priori la exactitud de los pronosticos ex ante.

Periodo anterior a Yinicio: Caracterizado por la ausencia de datos sobre lavariable. Es posible realizar backasting (estimacion de valores pasados y de-sconocidos) de valores de la serie, lo cual es hecho en ocasiones (segun elmodelo o metodologıa aplicada) cuando el periodo muestral no contiene sufi-cientes observaciones para el analisis o ajuste.

2.7. Estudio descriptivo de las series de tiempo - compo-

nentes en una serie de tiempo

Para la seleccion apropiada de los modelos para una serie de tiempo espreciso identificar los patrones basicos o componentes en esta. Estas compo-nentes son:

Componente horizontal, irregular o error (Et): Tambien es llamado rui-do blanco, caracterizado por fluctuaciones erraticas sin un patron definidoalrededor de una media constante. Muy a menudo estas fluctuaciones sondebidas a eventos externos que solo ocurren en un tiempo y de forma im-predecible. Se dice de una serie que solo exhibe tal comportamiento que esestacionaria en su media. Tal serie por ejemplo, aparece o es asumida en lassituaciones de control estadıstico de procesos.

Componente de tendencia (Tt): Patron de largo plazo caracterizado por lapersistencia a un crecimiento o a un decrecimiento de los valores de la serie,por tanto refleja el crecimiento o declinacion de la serie.

Componente estacional (St): Patron de cambio regular que se completadentro de un ano calendario y que se repite sobre una base anual. Este com-portamiento es debido a factores tales como los consumos o las estacionesclimaticas, es decir factores que ocurren con una periodicidad bien sea sem-anales, mensuales, trimestrales, o semestrales. Las ventas de productos comobebidas, helados, prendas de vestir, jugueterıa, etc. estan sujetos a este tipode patrones.

Componente cıclica (Ct): Cambios o movimientos hacia arriba y hacia aba-jo que ocurren sobre una duracion de 2 o mas anos, debido a la influencia defluctuaciones economicas de largo plazo como las asociadas con los ciclos denegocios. Por ejemplo las ventas de propiedad raız, el ciclo de negocios medidoen terminos del PIB. Un ciclo es medido desde un pico a otro o desde unadepresion a otra, de modo que un periodo de prosperidad es seguido por unperiodo de recesion, lo cual hace que cambie la tendencia de los datos haciaarriba (expansion) a una tendencia hacia abajo (contraccion); el movimien-to hacia abajo alcanza su punto mas mınimo luego de lo cual comienza el

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ

2.7. ESTUDIO DESCRIPTIVO DE LAS SERIES DE TIEMPO 35

movimiento hacia arriba hasta un punto maximo. Los ciclos son las compo-nentes mas difıciles de pronosticar debido a sus marcos de tiempo mas largos.La diferencia entre ciclos y patrones estacionales es que los segundos tienenuna longitud constante que se repite sobre una base regular periodica. Mien-tras que los ciclos varıan en longitud y magnitud. El proposito de los metodosde series de tiempo es eliminar las irregularidades e influencias estacionales yproyectar la serie de datos mas bien con base en sus patrones de tendencia/-ciclo (Campos Satillan [1]).

Una serie de tiempo puede ajustarse a uno de los cuatro patrones descritoso ser una combinacion de todos ellos, bien sea en forma aditiva (serie de com-ponentes aditivas),

Yt = Tt + St + Et (2.1)

o en forma multiplicativa (serie de componentes multiplicativas),

Yt = Tt × St × Et. (2.2)

De acuerdo a los modelos generales plantados en las ecuaciones (2.1) y(2.2), los ciclos y la componente de error quedan mezcladas en Et.

El analisis grafico de las series de tiempo es una buena manera de identi-ficar estas componentes. La Figura 2.2 presenta una serie estacional aditiva

9010

011

012

013

0

obse

rved

100

110

120

130

tren

d

−8

−6

−4

−2

02

seas

onal

−2

02

4

1990 1992 1994 1996 1998 2000 2002

rand

om

Time

Decomposition of additive time series

Serie original

Componente de tendencia

Componente estacional

Componente de error (incluye ciclos)

Figura 2.2: Descomposicion serie de tiempo aditiva con funcion R decompose

(Indice mensual de salario real sector industrial, enero de 1990 - noviembrede 2001) y sus componentes obtenidas por un metodo de descomposicion:

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


Tendencia

Estacionalidad

Error

En R podemos obtener la descomposicion de una serie a traves de las fun-ciones decompose y stl :

Codigo R 2.1.

salario<-scan()94.08 102.23 103.99 103.21 102.59 100.95101.67 101.71 99.93 100.11 99.65 89.8190.71 99.88 100.75 101.67 100.58 98.8298.21 98.96 99.30 98.40 99.17 91.1290.85 102.67 104.36 101.71 101.48 100.29100.33 102.24 101.24 102.02 103.79 95.9596.52 106.55 108.50 108.04 108.68 108.34108.14 109.75 108.28 108.76 109.36 101.03101.01 109.63 111.20 109.67 110.24 110.94110.38 111.50 111.73 112.94 113.87 107.39103.38 113.84 114.96 116.00 113.54 113.25113.35 114.88 113.81 116.03 117.50 109.50105.87 117.69 119.22 118.80 118.48 116.65116.54 117.03 116.04 116.87 118.60 108.91109.53 120.21 122.15 122.48 124.30 121.99122.20 121.41 120.69 122.72 124.70 115.65114.15 123.45 124.66 122.08 121.64 119.48120.02 122.33 121.50 122.45 123.63 115.43111.66 124.21 126.22 126.88 126.88 127.33127.27 128.88 128.54 130.28 132.15 124.65119.19 131.69 130.87 129.95 130.83 131.23132.64 133.50 132.98 134.38 135.12 130.16121.78 132.44 132.89 130.83 131.41 130.40131.79 132.46 131.00 132.46 133.61

salario<-ts(salario,frequency=12,start=c(1990,1))

#Descomposicion de la serie mediante la funcion decompose

descom<-decompose(salario,type="additive")plot(descom)

#Descomposicion de la serie mediante la funcion stl

descom2<-stl(salario,s.window="periodic")plot(descom2)

Las funciones decompose (ver Apendice A.1) y stl (ver Apendice A.3) estimanlos efectos de tendencia y estacionales usando metodos basados en promediosmoviles y polinomiales, respectivamente. Podemos valernos de estas funcionescomo metodos descriptivos utiles en la definicion de un modelo estadıstico.En la Figura 2.3 puede apreciarse la descomposicion de la serie de salarioreal presentada anteriormente en la Figura 2.2, esta vez, usando la funcion Rstl . Una serie de componentes multiplicativas es presentada en la Figura 2.4,esta serie corresponde a ventas de licor en Estados Unidos (miles de dolaresnominales), enero de 1967 - diciembre de 1994.

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


9010

011

012

013

0

data

−8

−6

−4

−2

02

seas

onal

100

110

120

130

tren

d

−2

02

4

1990 1992 1994 1996 1998 2000 2002

rem

aind

er

time

Serie original




Figura 2.3: Descomposicion serie de tiempo aditiva con funcion R stl

500

1500

2500

obse

rved

600

1000

1400

1800

tren

d

0.9

1.1

1.3

seas

onal

0.90

0.95

1.00

1.05

1970 1975 1980 1985 1990 1995

rand

om

Time

Decomposition of multiplicative time series

Serie original




Figura 2.4: Descomposicion serie de tiempo multiplicativa con funcion R decompose

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


Codigo R 2.2.

licor<-scan()480 467 514 505 534 546 539 541 551 537 584 854522 506 558 538 605 583 607 624 570 609 675 861605 537 575 588 656 623 661 668 603 639 669 915643 563 616 645 703 684 731 722 678 713 725 989687 629 687 706 754 774 825 755 751 783 804 1139711 693 790 754 799 824 854 810 798 807 832 1142740 713 791 768 846 884 886 878 813 840 884 1245796 750 834 838 902 895 962 990 882 936 997 1305866 805 905 873 1024 985 1049 1034 951 1010 10161378 915 854 922 965 1014 1040 1137 1026 992 10521056 1469 916 934 987 1018 1048 1086 1144 1077 10361076 1114 1595 949 930 1045 1015 1091 1142 1182 11611145 1119 1189 1662 1048 1019 1129 1092 1176 12971322 1330 1263 1250 1341 1927 1271 1238 1283 12831413 1371 1425 1453 1311 1387 1454 1993 1328 12501308 1350 1455 1442 1530 1505 1421 1485 1465 21631361 1284 1392 1442 1504 1488 1606 1488 1442 14951509 2135 1369 1320 1448 1495 1522 1575 1666 16171567 1551 1624 2367 1377 1294 1401 1362 1466 15591569 1575 1456 1487 1549 2178 1423 1312 1465 14881577 1591 1669 1697 1659 1597 1728 2326 1529 13951567 1536 1682 1675 1758 1708 1561 1643 1635 22401485 1376 1459 1526 1659 1623 1731 1662 1589 16831672 2361 1480 1385 1505 1576 1649 1684 1748 16421571 1567 1637 2397 1483 1390 1562 1573 1718 17521809 1759 1698 1643 1718 2399 1551 1497 1697 16721805 1903 1928 1963 1807 1843 1950 2736 1798 17001901 1820 1982 1957 2076 2107 1799 1854 1968 23641662 1681 1725 1796 1938 1871 2001 1934 1825 19301867 2553 1624 1533 1676 1706 1781 1772 1922 17431669 1713 1733 2369 1491 1445 1643 1683 1751 17741893 1776 1743 1728 1769 2431

licor<-ts(licor,frequency=12,start=c(1967,1))descom3<-decompose(licor,type="multiplicative")plot(descom3)

Si comparamos el comportamiento de las series presentadas en las Figuras2.2 y 2.4, en ambas series existe una tendencia creciente y un patron esta-cional, sin embargo en la ultima podemos apreciar como el efecto estacionaltiende a aumentar a medida que aumenta la tendencia, por esto, la ecuacion(2.2) es mas apropiada para describir la serie de ventas de licor. En general elmodelo multiplicativo es mas apropiado que el aditivo cuando la varianza dela serie original se incrementa (o disminuye) con el tiempo. La transformacionlogarıtmica resulta apropiada para transformar un modelo de componentesmultiplicativos en (2.2) a uno de componentes aditivas,

log(Yt) = log(Tt) + log(St) + log(Et) (2.3a)

Y ∗t = T ∗

t + S∗t + E∗

t (2.3b)

en (2.3) aparece la transformacion del modelo multiplicativo y observe queredefiniendo los logaritmos en (2.3a) por las correspondientes variables en(2.3b) la trasformacion nos lleva a un modelo aditivo sobre los logaritmos de

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


la serie original, como puede observarse en la Figura 2.5, que presenta ladescomposicion de la serie de los logaritmos de las ventas de licor.

Codigo R 2.3.loglicor<-log(licor)descom4<-decompose(loglicor,type="additive")plot(descom4)

6.5

7.0

7.5

obse

rved

6.4

6.8

7.2

7.6

tren

d

−0.

10.

10.

20.

3

seas

onal

−0.

100.

000.

05

1970 1975 1980 1985 1990 1995

rand

om

Time

Decomposition of additive time series

Log(serie original




Figura 2.5: Descomposicion de los logaritmos de las ventas de licor

Las funciones R decompose y stl generan los valores de las series de lascomponentes de tendencia, estacionalidad y error, las cuales pueden ser ma-nipuladas individualmente, en cada caso. Por ejemplo, con el siguiente codigoR obtenemos por separado cada componente de la serie de salarios, gener-adas con la funcion decompose , y podemos graficar cada una en ventanasindependientes para mejor visualizacion (ver Figuras 2.6, 2.7 y 2.8),

Codigo R 2.4.descom<-decompose(salario,type="additive")tendencia=descom$trendestacionalidad=descom$seasonalerror=descom$randomwin.graph(width=4,height=3,pointsize=8)plot(tendencia)win.graph(width=4,height=3,pointsize=8)plot(estacionalidad)win.graph(width=4,height=3,pointsize=8)plot(error)

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


Time

tend

enci

a

1990 1992 1994 1996 1998 2000 2002

100

110

120

130

Figura 2.6: Componente de tendencia serie de salarios, obtenida con decompose

Time

esta

cion

alid

ad

1990 1992 1994 1996 1998 2000

−8

−6

−4

−2

02

Figura 2.7: Componente estacional serie de salarios, obtenida con decompose

Time

erro

r

1990 1992 1994 1996 1998 2000

−2

02

4

Figura 2.8: Componente de error serie de salarios, obtenida con decompose

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


Con la funcion stl , podemos obtener las figuras anteriores usando el sigu-iente codigo R (ver Figuras 2.9, 2.10 y 2.11)

Codigo R 2.5.

descom2<-stl(salario,s.window="periodic")tendencia=descom2[[1]][,2]estacionalidad=descom2[[1]][,1]error=descom2[[1]][,3]win.graph(width=4,height=3,pointsize=8)plot(tendencia)win.graph(width=4,height=3,pointsize=8)plot(estacionalidad)win.graph(width=4,height=3,pointsize=8)plot(error)

Podemos ademas visualizar la tendencia removiendo el efecto estacionalde la serie original agregando los datos al nivel anual mediante la funcion Raggregate , en tanto que un resumen de los valores de cada estacion puedeobtenerse mediante la funcion cycle (ver Figuras 2.12 y 2.13)

Codigo R 2.6.

win.graph(width=5,height=4,pointsize=8)plot(aggregate(salario))

win.graph(width=5,height=4,pointsize=8)boxplot(salario˜cycle(salario),names=month.abb)

Time

tend

enci

a

1990 1992 1994 1996 1998 2000 2002

100

110

120

130

Figura 2.9: Componente de tendencia serie de salarios, obtenida con stl

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


Time

esta

cion

alid

ad

1990 1992 1994 1996 1998 2000 2002

−8

−6

−4

−2

02

Figura 2.10: Componente estacional serie de salarios, obtenida con stl

Time

erro

r

1990 1992 1994 1996 1998 2000 2002

−2

02

4

Figura 2.11: Componente de error serie de salarios, obtenida con stl

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


Time

aggr

egat

e(sa

lario

)

1990 1992 1994 1996 1998 2000

1200

1300

1400

1500

Figura 2.12: Componente de tendencia serie de salarios, obtenida con aggregate

Jan Feb Mar Apr May Jun Jul Aug Sep Oct Nov Dec

9010

011

012

013

0

Figura 2.13: Componente estacional serie de salarios, obtenida con cycleESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ

Capıtulo 3

Modelos de regresion para tendencia

3.1. Tendencia determinıstica vs. estocastica

Como definimos previamente, la tendencia de una serie es un patron delargo plazo caracterizado por la persistencia a un crecimiento o a un decrec-imiento de los valores de la serie, por tanto refleja el crecimiento o declinaciondebido a la evolucion lenta de factores tecnologicos, demograficos, sociales,entre otros. Cuando tal evolucion ocurre de forma perfectamente predecibledecimos que la tendencia es determinıstica, es decir, podemos identificar lapresencia de efectos permanentes sobre la serie temporal. Observe por ejemp-lo las series en la Figura 3.1 (los datos son leıdos del archivo STYLEKP.DAT yestan disponibles tambien al final de este capıtulo).

Codigo R 3.1.

#La siguiente linea permite leer los datos guardados en archivo#de texto en disco local. file.choose() abre ventana de windows para#explorar y ubicar el archivo. header=T para indicar que los datos#estan encabezados por nombre de la columna; si no hay encabezado, se toma header=F

datos.stylekp=read.table(file.choose(),header=T)datos.stylekp=ts(datos.stylekp,frequency=1,start=1960)datos.stylekpTime Series:Start = 1960End = 1989Frequency = 1

AGRICULTURE MANUFACTURING RETAIL SERVICES1960 68.3 338.7 153.8 190.21961 67.5 339.4 153.2 197.71962 67.1 368.3 163.3 207.71963 67.2 397.4 169.0 217.41964 65.2 425.4 179.4 230.71965 66.7 462.5 190.0 240.41966 62.4 497.9 199.2 253.91967 65.5 496.6 201.5 265.21968 63.6 522.0 211.6 274.71969 65.3 536.7 212.7 287.81970 68.8 506.8 215.6 295.71971 70.6 515.5 224.5 302.41972 70.9 561.2 239.8 320.01973 70.3 621.3 255.6 340.21974 69.7 591.6 245.2 347.51975 73.1 547.5 247.5 352.4

45

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ

46 CAPITULO 3. MODELOS DE REGRESION PARA TENDENCIA

1976 71.5 600.6 262.8 367.71977 73.3 664.8 270.5 399.61978 73.0 694.7 284.8 421.51979 77.0 712.2 291.3 436.91980 76.4 673.9 281.7 450.91981 87.4 678.6 286.4 463.01982 89.6 634.6 287.5 463.61983 76.7 674.2 307.8 480.41984 84.2 752.4 334.0 509.71985 95.8 779.2 354.4 538.61986 103.6 803.2 377.5 565.81987 105.1 852.2 371.6 592.61988 97.0 917.4 399.2 623.31989 100.5 929.0 412.0 652.3win.graph(width=4.5,height=7,pointsize=8)plot(datos.stylekp)

7080

9010

0

Tt = β0 + β1t + β2t2

t

AG

RIC

ULT

UR

E

1960 1965 1970 1975 1980 1985 1990

400

500

600

700

800

900

Tt = β0 + β1t + β2t2 + β3t

3

t

MA

NU

FAC

TU

RIN

G

1960 1965 1970 1975 1980 1985 1990

150

200

250

300

350

400

Tt = β0 + β1t + β2t2 + β3t

3

t

RE

TAIL

1960 1965 1970 1975 1980 1985 1990

200

300

400

500

600

Tt = β0 + β1t + β2t2 + β3t

3

t

SE

RV

ICE

S

1960 1965 1970 1975 1980 1985 1990

Figura 3.1: Componentes claves del PIB real de Estados Unidos, registradas por ano de

1960 a 1989, en millones de dolares de 1982. Fuente: Diebold [3], stylekp.dat

En estas tres series podemos modelar la tendencia Tt como un polinomioen t, es decir, de la forma Tt = β0 + β1t + β2t

2 + · · ·+ βptp. En contraste, existen

series en las cuales una funcion determinıstica para la tendencia no resultaintrınseca a todo el proceso de forma que ella pueda asumirse como un patronque persistira en el futuro. Por ejemplo, la serie de la Figura 3.2 presenta unatendencia estocastica (datos leıdos desde archivo EXCHRATE.DAT):

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ

3.1. TENDENCIA DETERMINISTICA VS. ESTOCASTICA 47

Codigo R 3.2.

datos.exchrate=read.table(file.choose(),header=T)datos.exchrate=ts(datos.exchrate,frequency=1)datos.exchrate

Time Series:Start = 1End = 620Frequency = 1

exchrate[1,] 1.0000000[2,] 1.6268391[3,] 1.6984192[4,] 2.0079907[5,] 1.4345695[6,] 2.7828483[7,] 2.8362358[8,] 4.3383264

.

.

.[615,] 12.8902860[616,] 11.9726690[617,] 13.4475750[618,] 15.7608530[619,] 17.2702810[620,] 15.3228160

win.graph(width=4.5,height=4.5,pointsize=8);plot(datos.exchrate)

En series de este tipo la tendencia es impulsada por choques estocasticosy no presentan un nivel particular hacia el cual tienda a regresar; la serie semueve hacia donde la obliguen los choques recibidos. Veremos mas adelanteque tales series pueden modelarse de acuerdo a lo que se conoce como unacaminata aleatoria, en la que el valor de la serie en t es el valor de la serie ent−1 mas un movimiento totalmente aleatorio determinado por un ruido blancoat. La Figura 3.3 ilustra dos realizaciones de una caminata aleatoria simuladaen R:

Codigo R 3.3.

#SIMULANDO UNA CAMINATA ALEATORIA#Una forma (se suma 400 para Y0=400)at=rnorm(550,0,5) #at es un RB N(0,25) y se generan 550 observaciones

x=filter(at,filter=1,method="recursive")x=ts(x[51:550]+400,frequency=1) #se toman las ultimas 500 observaciones

#Otra forma (se suma 400 para Y0=400)at2=rnorm(550,0,5)y=cumsum(at2)+400; y=ts(y[51:550],frequency=1)

#Graficando las dos series simuladas superpuestaswin.graph(width=4.5,height=4.5,pointsize=8)plot(x,ylab="",ylim=c(min(x,y),max(x,y)),main=expression(paste("Caminata aleatoria",sep=" ",Y[t]==Y[t-1]+a[t],sep=", ",Y[0]==400,sep=", ",a[t]==RBN(0,25))))par(new=T)plot.ts(y,ylab="",ylim=c(min(x,y),max(x,y)),col=2)

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


Time

exch

rate

0 100 200 300 400 500 600

05

1015

2025

Figura 3.2: Tasa de cambio de Hungrıa, 620 observaciones Fuente: Diebold [3], ex-

chrate.dat

Caminata aleatoria Yt = Yt−1 + at, Y0 = 400, at = RBN(0, 25)

Time

0 100 200 300 400 500

300

350

400

Time

0 100 200 300 400 500

300

350

400

Figura 3.3: Dos realizaciones de una caminata aleatoria

En general, consideramos un modelo determinıstico para la tendencia cuan-do esta sea uniforme o suave. Cuando recurrimos a funciones polinomialescasi siempre se usan polinomios de ordenes bajos para mantener suavidad enel comportamiento, por ejemplo hasta un polinomio de orden 3, pero existencasos donde la tendencia queda mejor modelada por una funcion no linealdiferente, por ejemplo una exponencial, es decir, Tt = β0e

β1t. Observe por ejem-plo en la Figura 3.4 la serie del volumen mensual de operaciones de accionesnegociadas en la bolsa de Nueva York (Diebold, [3], se desconoce fecha de ini-

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ

3.2. ESTIMACION DE MODELOS DE TENDENCIA 49

cio) y la serie de su logaritmo. Es claro que la tranformacion logarıtmica logralinealizar la tendencia (ademas de estabilizar en parte la varianza), es decirlog Tt = log(β0) + β1t, ası, podemos en este caso ajustar un modelo de regresionlineal simple para la serie transformada. Este ultimo modelo es conocido comomodelo de tendencia log lineal.

Codigo R 3.4.

#Leyendo datos de archivo de texto localnyse_vol=read.table(file.choose(),header=T)nyse_vol=ts(nyse_vol,frequency=1)

#Graficando la serie y su logaritmowin.graph(width=7,height=4,pointsize=8)nf=layout(cbind(c(1,1),c(2,2)))plot(nyse_vol)plot(log(nyse_vol),ylab="log(FSVOL)")

Time

FS

VO

L

0 100 200 300 400 500

010

0020

0030

0040

0050

0060

00

Time

log(

FS

VO

L)

0 100 200 300 400 500

34

56

78

Figura 3.4: Lado izquierdo: volumen mensual de operaciones de acciones negociadas en

la bolsa de Nueva York; lado derecho: Logaritmo de la serie. 542 observa-

ciones. Fuente: Diebold [3], nyse vol.dat.

3.2. Estimacion de modelos de tendencia

3.2.1. Tendencia polinomial

Para el caso de modelos polinomiales para la tendencia, Tt = β0 + β1t +β2t

2 + · · · ,+βptp y sin presencia de componente estacional, definimos el modelo

estadıstico para la serie como

Yt = Tt + Et = β0 + β1t+ β2t2 + · · · ,+βpt

p + Et, Etiid∼ N(0, σ2) (3.1)

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


que puede ser ajustado por regresion lineal multiple, usando como variablesexplicatorias a tj, j = 1, 2, · · · , p. Por ejemplo, para las cuatro series en la Figura3.1, para una serie de tamano n, procedemos al ajuste definiendo un sistemade n ecuaciones en p+ 1 variables (los parametros βj, j = 0, 1, · · · , p):

Y1 = β0 + β1 · 1 + β2 · 12 + · · · , βp · 1p + E1

Y2 = β0 + β1 · 2 + β2 · 22 + · · · , βp · 2p + E2

...

Yn = β0 + β1 · n+ β2 · n2 + · · · , βp · np + En

(3.2)

que matricialmente, tiene la representacion y = Xβ + e, donde

y =

Y1

Y2...Yn

n×1

X =

1 1 1 · · · 11 2 22 · · · 2p

......

... · · · ...1 n n2 · · · np

n×(p+1)

β =

β0

β1

β2...βp

(p+1)×1

e =

E1

E2...En

n×1

.

Para la estimacion por mınimos cuadrados se busca β que minimice lasuma de cuadrados del error

S(β) = (y−Xβ)t(y −Xβ) = ete =n∑

t=1

E2t (3.3)

esto es

β = argminβ

S(β) (3.4)

donde β es el vector de parametros estimados. Existiendo (XtX)−1, la solucionde mınimos cuadrados es

β = (XtX)−1Xty =

β0

β1...

βp

(3.5)

Sea H = X(XtX)−1Xt una matrix n×n e I la matriz identidad n×n. El vectorde valores estimados o ajustados para la serie corresponde a

y = Xβ = Hy =

Y1

Y2...

Yn

, (3.6)

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


en cuanto que el vector de los residuales corresponde a

e = y − y = (I−H)y =

E1

E2...

En

(3.7)

3.2.2. Modelo general de la tendencia

Sea Tt = T (t,β) una funcion del tiempo t que describe la tendencia de unaserie, y definida con vector de parametros β de dimension k. Esta definicionconsidera el caso de funciones lineales y no lineales en los parametros comoel caso Tt = β0e

β1t, donde β = (β0, β1)t. Para el ajuste por mınimos cuadrados

sin recurrir a alguna transformacion, el modelo para la serie, sin componenteestacional es dado por

Yt = T (t,β) + Et. (3.8)

Para una serie de tamano n, se desea resolver el sistema de n ecuaciones(posiblemente no lineales)

Y1 = T (1,β) + E1

Y2 = T (2,β) + E2

...

Yn = T (n,β) + En

(3.9)

Para la estimacion por mınimos cuadrados se busca β que minimice la sumade cuadrados del error

S(β) =

n∑

t=1

E2t =

n∑

t=1

(Yt − T (t,β))2 (3.10)

esto esβ = argmin

β

S(β). (3.11)

es decir, la solucion es hallada diferenciando a S(β) con respecto a β e igualan-do las derivadas parciales a cero, pero en general las ecuaciones resultantesson no lineales por lo que debe emplearse un metodo numerico para opti-mizacion, por ejemplo, utilizando metodos numericos para mınimos cuadra-dos no lineales. En R se cuenta con la funcion nls (ver Apendice A.2). Estemetodo de ajuste requiere especificar valores iniciales para los parametros de-sconocidos y el exito del algoritmo depende fuertemente de la cercanıa de talesvalores de inicio a los valores optimos. Hay muchos algoritmos para el ajustede mınimos cuadrados no lineales, nls utiliza por defecto una forma de iter-accion tipo Gauss-Newton, que usa derivadas aproximadas numericamente.El riesgo con estos metodos es que si la funcion S(β) tiene multiples mınimos,el algoritmo puede arrojar un mınimo local y no absoluto.

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


Tendencia exponencial

Considere la serie en la Figura 3.4. Como se comento previamente, la ten-dencia para esta serie es del tipo Tt = β0e

β1t. Luego, si aplicamos la transfor-macion logarıtmica y consideramos el modelo de regresion lineal simple para

los logaritmos de la serie, log(Yt) = log(β0)+β1t+Et, Etiid∼ N(0, σ2), y ajustamos

por mınimos cuadrados:

Codigo R 3.5.

#Leyendo datos de archivo de texto localnyse_vol=read.table(file.choose(),header=T)nyse_vol=ts(nyse_vol,frequency=1)

#ajustando modelo de tendencia log lineal mediante regresion linealt=1:length(nyse_vol) #Define variable t segun longitud de la seriemodelo1=lm(log(nyse_vol)˜t)

#Extrayendo coeficientes ajustados en modelo log-lineal y transformando al#modelo exponencialestim=coef(modelo1)beta00=exp(estim[[1]])beta10=estim[[2]]

Salida R 3.1.

summary(modelo1)

Call:lm(formula = log(nyse_vol) ˜ t)

Residuals:Min 1Q Median 3Q Max

-0.66075 -0.19657 -0.02112 0.18871 1.03309

Coefficients:Estimate Std. Error t value Pr(>|t|)

(Intercept) 2.709e+00 2.490e-02 108.8 <2e-16 ***t 1.033e-02 7.946e-05 130.0 <2e-16 ***---Signif. codes: 0 ’ *** ’ 0.001 ’ ** ’ 0.01 ’ * ’ 0.05 ’.’ 0.1 ’ ’ 1

Residual standard error: 0.2895 on 540 degrees of freedomMultiple R-squared: 0.969, Adjusted R-squared: 0.969F-statistic: 1.689e+04 on 1 and 540 DF, p-value: < 2.2e-16

beta00[1] 15.02031

beta10[1] 0.01032658

El modelo ajustado de acuerdo a lo exhibido en el cuadro anterior, se tieneque

log(Yt) = 2.709 + 0.01032658t

de donde, en terminos del modelo sin trasformar, se tendrıa

Yt ≈ 15.02031e0.01032658t

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


Lo anterior es una estimacion sesgada de E[Yt], desde que, bajo el modelolog-lineal, se esta asumiendo que

Yt = β0eβ1t × eEt , Et

iid∼ N(0, σ2),

es decir, eEtiid∼ lognormal con media E[eEt ] = e

12σ2

. Luego, los valores ajustadosen el tiempo t basados en el modelo log(Yt) = log(β0) + β1t + Et deberıan serobtenidos usando

Yt = elog(β0)+β1t × e0.5σ2

e12σ2

es el factor de correccion de sesgo, que sera valido de aplicar mientras lanormalidad de Et sea un supuesto razonable. En este caso, se toma σ2 = MSE,el error cuadratico medio del modelo log-lineal. Tambien se ha sugerido aplicar

un factor de correccion empırico, de la forma 1n

n∑t=1

eEt, es decir, los valores

ajustados en escala original serıan de la forma

Yt = elog(β0)+β1t × 1

n

n∑

t=1

eEt

donde Et son los residuos del modelo log-lineal. Continuando con el ejemplo,en R obtenemos los valores ajustados en escala original de la siguiente forma

Codigo R 3.6.

#extrayendo estimacion de sigma en modelo1sigma=summary(modelo1)$sigma

#Calculando factor de correcion segun distribucion lognormalcorrec.lognorm=exp(0.5 * sigmaˆ2)correc.lognorm[1] 1.042782

#Calculando factor de correccion emp´ıricacorrec.empir=mean(exp(residuals(modelo1)))correc.empir[1] 1.044208

#Obteniendo valores ajustado en escala original#con factor de correcion lognormalpred.mod1a=exp(fitted(modelo1)) * correc.lognorm

#Obteniendo valores ajustado en escala original#con factor de correcion emp´ıricapred.mod1b=exp(fitted(modelo1)) * correc.empir

Del anterior cuadro vemos que el factor de correccion lognormal es e12σ2

=

1.042782, mientras que el factor de correccion empırica es 1n

n∑t=1

eEt = 1.044208,

practicamente iguales, desde que el tamano de la serie n = 542 es grande.Luego, los valores ajustados por ambos metodos son practicamente los mis-mos:

Yt = elog(β0)+β1t × e0.5σ2

= 1.042782× 15.02031e0.01032658t

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


Yt = elog(β0)+β1t × 1

n

n∑

t=1

eEt = 1.044208× 15.02031e0.01032658t

Veamos ahora el uso del modelo de ajuste no lineal usando la funcion R nls :

Codigo R 3.7.

#ajustando modelo de tendencia exponencial mediante regresion no lineal#se utilizan parametros estimados del modelo 1 para inicializar rutina de#estimacion con modelo no lineal

modelo2=nls(nyse_vol˜beta0 * exp(beta1 * t),start=list(beta0=beta00,beta1=beta10))

Salida R 3.2.

summary(modelo2)

Formula: nyse_vol ˜ beta0 * exp(beta1 * t)

Parameters:Estimate Std. Error t value Pr(>|t|)

beta0 1.805e+01 1.886e+00 9.566 <2e-16 ***beta1 1.027e-02 2.107e-04 48.774 <2e-16 ***---Signif. codes: 0 ’ *** ’ 0.001 ’ ** ’ 0.01 ’ * ’ 0.05 ’.’ 0.1 ’ ’ 1

Residual standard error: 339.7 on 540 degrees of freedom

Number of iterations to convergence: 5Achieved convergence tolerance: 5.787e-06

La ecuacion del modelo ajustado corresponde a

Yt = 18.05e0.01027t

En la Figura 3.5 observamos la serie original y las curvas ajustadas con elmodelo log-lineal destransformado y el modelo no lineal exponencial. En laFigura 3.6 se presentan los residuales de los dos modelos ajustados a la seriede la Figura 3.4. Observe los problemas de varianza en el ajuste del modelono lineal.

A continuacion, el codigo R usado para las Figuras 3.5 y 3.6:

Codigo R 3.8.

#Uniendo en una matriz los valores de la serie, y los ajustados de#los modelos log-lineal y no lineal exponencialdatos_ajustes=cbind(nyse_vol,pred.mod1a,fitted(modelo2))

#Graficando las series superpuestasmatplot(t,datos_ajustes,type=’l’,col=c(1,2,4),lwd=c(1,2,2),lty=c(1,2,3),ylab="FSVOL")legend(locator(1),legend=c("original","ajuste modelo log-lineal correcc. lognorm","ajuste modelo no lineal exponencial"),col=c(1,2,4),lty=c(1,2,3),lwd=c(1,2,2))

#Preparando ventana grafica:dividiendo la ventana grafica en cuatro subventanasnf=layout(rbind(c(1,1,2,2),c(3,3,4,4)))

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


#Graficando los residuales del modelo log-linealplot(t,residuals(modelo1),type=’l’,main="Residuales vs. tiempo\nModelo Log-lineal")abline(h=0,lty=2)plot(fitted(modelo1),residuals(modelo1),main="Residuales vs. Ajustados\nModelo Log-lineal")abline(h=0,lty=2)

#Graficando los residuales del modelo no linealplot(t,residuals(modelo2),type=’l’,main="Residuales vs. tiempo\nModelo exponencial")abline(h=0,lty=2)plot(fitted(modelo2),residuals(modelo2),main="Residuales vs. Ajustados\nModelo exponencial")abline(h=0,lty=2)

0 100 200 300 400 500

010

0020

0030

0040

0050

0060

00

t

FS

VO

L

originalajuste modelo log−lineal correcc. lognormajuste modelo no lineal exponencial

Figura 3.5: Volumen mensual de operaciones de acciones negociadas en la bolsa de Nueva

York y ajustes usando transformacion logarıtmica y mınimos cuadrados no

lineales. Fuente: Diebold [3], nyse vol.dat.

Tendencia Logıstica

Es un modelo comun para describir el crecimiento de una poblacion y esconocido tambien como modelo de crecimiento logıstico. La ecuacion de estemodelo de tendencia es como sigue,

Tt =β2

1 + exp{− (β0 + β1t)},

donde el parametro β2 es el valor asintotico o de largo plazo para Tt. La curvaes simetrica alrededor de t = −β0/β1, para el cual Tt = β2/2, es decir, en taltiempo, la curva esta a mitad de camino entre su valor en cero y su valor

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


0 100 200 300 400 500

−0.

50.

00.

51.

0

Residuales vs. tiempoModelo Log−lineal

t

resi

dual

s(m

odel

o1)

3 4 5 6 7 8

−0.

50.

00.

51.

0

Residuales vs. AjustadosModelo Log−lineal

fitted(modelo1)

resi

dual

s(m

odel

o1)

0 100 200 300 400 500

−10

000

1000

2000

3000

Residuales vs. tiempoModelo exponencial

t

resi

dual

s(m

odel

o2)

0 1000 2000 3000 4000

−10

000

1000

2000

3000

Residuales vs. AjustadosModelo exponencial

fitted(modelo2)

resi

dual

s(m

odel

o2)

Figura 3.6: Residuales del modelo Log- lineal (arriba) en escala logarıtmica de los datos;

residuales del modelo no lineal exponencial (abajo) en escala original de los

datos.

asintotico β2. En la Figura 3.7 podemos apreciar la forma en “S” de esta curva,con β2 = 300, β0 = −40, β1 = 0.02.

Para una serie de tiempo con solo tendencia (de tipo logıstico) y compo-nente de error, podrıamos aplicar una transformacion conocida como trans-formacion logıstica, que opera de la siguiente forma:

Yt ≈β2

1 + exp{− (β0 + β1t)}, entonces

Y ∗t = log

(Yt/β2

1− Yt/β2

)≈ β0 + β1t,

Sin embargo, los datos transformados Y ∗t dependeran de un parametro de-

sconocido, por lo que se recurre a la regresion no lineal.En datos reales de crecimiento de poblaciones no siempre logramos visu-

alizar una logıstica en forma completa. Considere los datos disponibles en elmarco de datos USPop disponible en la librerıa car , sobre la serie decadal del

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


1700 1800 1900 2000 2100 2200 2300

050

100

150

200

250

300

Tt = 300 1 + e−(−40+0.02t)

t

Tt

t = − β0 β1

Tt = β2 2

Figura 3.7: Curva de tendencia tipo logıstica.

censo poblacional de Estados Unidos desde 1790 a 2000, datos en unidadesde millones de habitantes:

Codigo R 3.9.

library(car)data(USPop)USPop

year population1 1790 3.9292142 1800 5.3084833 1810 7.2398814 1820 9.6384535 1830 12.8607026 1840 17.0633537 1850 23.1918768 1860 31.4433219 1870 38.55837110 1880 50.18920911 1890 62.97976612 1900 76.21216813 1910 92.22849614 1920 106.02153715 1930 123.20262416 1940 132.16456917 1950 151.32579818 1960 179.32317519 1970 203.30203120 1980 226.54219921 1990 248.70987322 2000 281.421906

max(USPop$population)[1] 281.4219

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


with(USPop,plot(year,population,type=’b’))

En la Figura 3.8 podemos apreciar esta serie. De la grafica, podrıamos estarinclinados a considerar como modelo de la tendencia una curva de tendenciacuadratica, con t en unidades de decadas con origen en 1790, esto es,

t = (ano− 1790) /10 y Yt = β0 + β1t+ β2t2 + Et, Et

iid∼ N(0.σ2), Veamos el ajuste deeste modelo:

1800 1850 1900 1950 2000

050

100

150

200

250

year

popu

latio

n

Figura 3.8: Datos censo decadal de poblacion en Estados Unidos desde el ano 1790 a

2000, fuente: Data frame USPob en R.

Codigo R 3.10.

library(car)data(USPop)

#Calculando las fechas en decadas con punto#de origen en 1790

t=I((USPop$year-1790)/10)

#Ajustando modelo de tendencia cuadratica

modelo0=lm(population˜t+I(tˆ2),USPop)

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


Salida R 3.3.summary(modelo0)

Call:lm(formula = population ˜ t + I(tˆ2), data = USPop)


-7.5557 -0.4308 0.6051 1.4230 4.6486


(Intercept) 6.1128 1.7550 3.483 0.00249 **t -1.1417 0.3872 -2.948 0.00825 **I(tˆ2) 0.6681 0.0178 37.525 < 2e-16 ***---Signif. codes: 0 ’ *** ’ 0.001 ’ ** ’ 0.01 ’ * ’ 0.05 ’.’ 0.1 ’ ’ 1

Residual standard error: 2.997 on 19 degrees of freedomMultiple R-squared: 0.9989, Adjusted R-squared: 0.9988F-statistic: 8892 on 2 and 19 DF, p-value: < 2.2e-16

#Prediccion para el ano 2010predict(modelo0,list(t=(2010-1790)/10))

1304.3603

De los resultados vemos que la ecuacion del modelo ajustado es Yt = 6.1128−1.1417t + 0.6681t2 y para el ano 2010, la proyeccion de la poblacion serıa de304.36 millones.

Veamos ahora el ajuste del modelo logıstico con regresion no lineal. Primerodebemos incializar los valores de los parametros del modelo logıstico. Para β2 elvalor de la asıntota superior de la curva logıstica, basta usar un valor mayoral de los datos de la serie, por ejemplo, 300. Para inicializar los otros dosparametros, podemos realizar la regresion lineal de los datos de la serie con latransformacion logıstica:

Y ∗t = log

(Yt/300

1− Yt/300

)= β0 + β1t+Wt, Wt

iid∼ N(0, γ2)

Salida R 3.4.##Regresion no lineal con modelo log´ıstico#Identificando valores iniciales para beta0 y beta1#Se realiza regresion de datos con transformacion log´ıstica#con beta2=300

lm(logit(population/300) ˜ t, USPop)

Call:lm(formula = logit(population/300) ˜ t, data = USPop)

Coefficients:(Intercept) t

-4.3071 0.2918

Luego, para el ajuste del modelo logıstico mediante regresion no lineal usandola funcion nls() , tomarıamos como valores iniciales β2 = 300, β0 = −4.31, β1 =0.29, como se ve a continuacion:

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


Codigo R 3.11.

modelo1=nls(population ˜ beta2/(1 + exp(-(beta0 + beta1 * t))),start=list(beta2 = 300, beta0 = -4.31, beta1 = 0.29),data=USPop,trace=FALSE)

Salida R 3.5.

summary(modelo1)

Formula: population ˜ beta2/(1 + exp(-(beta0 + beta1 * t)))


beta2 440.83394 35.00031 12.60 1.14e-10 ***beta0 -4.03240 0.06818 -59.14 < 2e-16 ***beta1 0.21606 0.01007 21.45 8.87e-15 ***---Signif. codes: 0 ’ *** ’ 0.001 ’ ** ’ 0.01 ’ * ’ 0.05 ’.’ 0.1 ’ ’ 1

Residual standard error: 4.909 on 19 degrees of freedom


#Prediccion para el ano 2010

predict(modelo1,list(t=(2010-1790)/10))[1] 296.595

La ecuacion ajustada del modelo logıstico es (con t representando decadas conorigen en 1790)

Yt =440.83394

1 + exp{−(−4.03240 + 0.21606× t)} ,

con el cual se obtiene una prediccion para el ano 2010 de 296.595 millonesde habitantes.

Segun informe de la Oficina del Censo de Estados Unidos,http://2010.census.gov/news/releases/en-espaol/cb10-cn93sp.html,la poblacion al 1 de abril de 2010 era de 308,745,538 ¿con cual modelo fuemas acertado el pronostico? En la Figura 3.9 (ver Codigo R 3.12 usado enla construccion de esta figura) podemos observar la serie real junto con lascurvas ajustadas y el valor real en 2010.

Codigo R 3.12.

plot(t,USPop$population,type=’p’,xaxt=’n’,xlab="year",ylab="population",xlim=c(0,28),ylim=c(0,440))

#Creando etiquetas de marcas en eje X,#con anos desde 1850 a 2050, cada 50 anos,#y colocando estas etiquetas de marcas#en los valores de t=(ano-1790)/10 correspondientes

posi=(seq(1800,2050,by=50)-1790)/10

axis(1,at=posi,labels=seq(1800,2050,by=50))

#Dibujando la curva ajustada con modelo0, para t de 0 a 28 (anos 1790 a 2070)

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


lines(c(0:28),predict(modelo0,list(t=c(0:28))),lwd=2,xlim=c(0,28),ylim=c(0,440))

#Dibujando la curva ajustada con modelo1, para t de 0 a 28 (anos 1790 a 2070)lines(c(0:28),predict(modelo1,list(t=c(0:28))),lwd=2,col=2,xlim=c(0,28),ylim=c(0,440))

#Indicando observacion para ano 2010points((2010-1790)/10, 308.7, type = "p", pch=20,cex=2,col="blue")text((2010-1790)/10,308.7,labels="Poblacion 2010",pos=2)abline(v=(2010-1790)/10,lty=2)

#Colocando leyendalegend("topleft",legend=c("Ajuste Cuadratico","Ajuste log´ıstico"),lty=1,col=c("black","red"),lwd=2)

010

020

030

040

0

year

popu

latio

n

1800 1850 1900 1950 2000 2050

Población 2010

Ajuste CuadráticoAjuste logístico

Figura 3.9: Datos censo decadal de poblacion en Estados Unidos desde el ano 1790 a

2000 y proyecciones con modelo cuadratico y logıstico.

En la Figura 3.10 se presentan los graficos de residuales para los modelosde tendencia cuadratica y logıstica, obtenidos con el Codigo R 3.13

Codigo R 3.13.

#Dividiendo la ventana grafica en cuatro subventanas

nf=layout(rbind(c(1,1,2,2),c(3,3,4,4)))

#Graficando los residuales del modelo cuadratico

plot(t,residuals(modelo0),type=’l’,main="Residuales vs. tiempo\nModelo cuadratico",ylim=c(-8,8),lwd=2)abline(h=0,lty=2)

plot(fitted(modelo0),residuals(modelo0),main="Residuales vs. Ajustados\nModelo cuadratico",ylim=c(-8,8),cex=1.5)abline(h=0,lty=2)

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


#Graficando los residuales del modelo log´ıstico

plot(t,residuals(modelo1),type=’l’,main="Residuales vs. tiempo\nModelo log´ıstico",ylim=c(-8,8),lwd=2)abline(h=0,lty=2)

plot(fitted(modelo1),residuals(modelo1),main="Residuales vs. Ajustados\nModelo log´ıstico",ylim=c(-8,8),cex=1.5)abline(h=0,lty=2)

0 5 10 15 20

−5

05

Residuales vs. tiempoModelo cuadrático

t

resi

dual

s(m

odel

o0)

0 50 100 150 200 250

−5

05

Residuales vs. AjustadosModelo cuadrático

fitted(modelo0)

resi

dual

s(m

odel

o0)

0 5 10 15 20

−5

05

Residuales vs. tiempoModelo logístico

t

resi

dual

s(m

odel

o1)

0 50 100 150 200 250

−5

05

Residuales vs. AjustadosModelo logístico

fitted(modelo1)

resi

dual

s(m

odel

o1)

Figura 3.10: Graficos de residuales modelos cuadratico (modelo0) y modelo logıstico (mod-

elo1) para datos del Censo Estados Unidos, 1790 a 2000.

3.3. Pronostico de la tendencia

3.3.1. Pronosticos puntuales

Suponga que a partir del instante de tiempo t (tomado como el “hoy”) sedesea pronosticar para L perıodos adelante, es decir, para el tiempo t + L, elvalor de una serie que solo presenta componente de tendencia y error, es

Yt+L =

β0 + β1(t+ L) + Et+L si la tendencia es lineal

β0 + β1(t+ L) + β2(t + L)2 + Et+L si la tendencia es cuadratica

β0 + β1(t+ L) + β2(t + L)2 + β3(t+ L)3 + Et+L si la tendencia es cubica

etc.

(3.12)

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ

3.4. DIAGNOSTICOS Y SELECCION DE MODELOS 63

Entonces, el valor pronosticado para la serie en el tiempo t+L es simplemente,

Yt+L =

β0 + β1(t+ L) si la tendencia es lineal

β0 + β1(t+ L) + β2(t + L)2 si la tendencia es cuadratica

β0 + β1(t+ L) + β2(t + L)2 + β3(t+ L)3 si la tendencia es cubica

etc.

(3.13)Es decir, basta utilizar la ecuacion ajustada para producir los pronosticos delos perıodos futuros.

3.3.2. Intervalos de pronostico

Asuma el modelo de tendencia polinomica. Bajo el modelo de regresionlineal multiple se tiene que un intervalo de prediccion de (1 − α)100 % parauna observacion futura Yt+L en el vector de predictores xt

t+L = (1, (t + L), (t +L)2, · · · , (t+ L)p) es dado por:

Yt+L ± tα/2,n−p−1

√MSE [1 + xt

t+L(XtX)−1xt+L] (3.14)

donde X es la matriz de diseno para el sistema de ecuaciones en (3.2).

3.4. Diagnosticos y seleccion de modelos usando los crite-

rios de informacion de Akaike y de Schwarz

3.4.1. Criterios de Informacion

Los criterios de informacion son medidas de bondad de ajuste de un modeloestadıstico. Suponga que el modelo estadıstico considerado es

Yt = f(t,βp) + Et, Etiid∼ N(0, σ2) (3.15)

donde f(t,βp) es una funcion de t con un conjunto de p parametros represen-tados por el vector βp.

Usar cualquier modelo para aproximar un fenomeno real conlleva ciertogrado de error y es en relacion a este error sobre el cual se definen los crite-rios de ajuste. Sea βq el vector de parametros del verdadero modelo o modelogenerador de los datos, el cual es desconocido y suponga que para p > q elmodelo con p parametros esta anidado al modelo con q parametros. Entonces,el modelo considerado (el de p parametros) es un modelo correcto pero sobreparametrizado. Por el contrario, si p < q, entonces nuestro modelo es un mode-lo mal especificado. En general, Entre varios modelos candidatos se debe elegirel mas parsimonioso (con menos numero de parametros) tal que sea mınimala varianza y el sesgo del modelo estimado.

Sea

Ln(β) =

n∏

t=1

1√2πσ

exp

{−(Yt − f(t,β))2

2σ2

}

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


la funcion de verosimilitud de un modelo basado en una muestra de n obser-vaciones y su logaritmo o log-verosimilitud, ln(β) = log(Ln(β)), y Ln(β), ln(β)los maximos de estas funciones. Los criterios de informacion definidos paraseleccionar al modelo mas parsimonioso y correcto, toman en general la forma,

cn(p) = −2ln(β)/n+ p · κ(n)/n, (3.16)

donde,

κ(n) =

{2 Criterio de Akaike

log(n) Criterio de Informacion Bayesiana o de Schwarz(3.17)

En R estan implementadas en la funcion AIC() las versiones n · cn(p), es decir:

n·cn(p) =

{−2ln(β) + 2 · p, Criterio de Akaike

−2ln(β) + p · log(n), Criterio de Informacion Bayesiana o de Schwarz

(3.18)AIC(modelo,k=2)AIC(modelo,k=log(n))

Entre varios modelos candidatos, se selecciona aquel con el menor valor decn(p).

Nota: Los modelos a comparar deberıan ser modelos anidados, es decir, conestructura similar y que consideren los datos de la respuesta bajo la mismaescala.

3.4.2. ¿Cual criterio usar?

Para comparar criterios de seleccion es necesario considerar las siguientespropiedades (Diebold [3]):

Consistencia

Un criterio es consistente si

1. Cuando el modelo verdadero (modelo generador de los datos) se encuen-tra entre los modelos considerados, la probabilidad de seleccionarlo tiendea 1 a medida que aumenta el tamano de muestra, y

2. Cuando el modelo verdadero no se encuentra entre los considerados y esimposible seleccionarlo, la probabilidad de seleccionar la mejor aproxi-macion al modelo generador tiende a 1 cuando aumenta el tamano de lamuestra.

El criterio de Akaike no es consistente porque tiende a seleccionar modelossobre parametrizados. El criterio de Schwarz por el contrario sı es consistente,penaliza con maxima intensidad los grados de libertad.

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ

3.5. EJEMPLO: DATOS RSALES.DAT 65

Eficiencia asintotica

Un criterio de seleccion de modelos es asintoticamente eficiente, si a medi-da que aumenta el tamano de muestra tiende a elegir modelos con varianza delerror de pronostico a un paso adelante (Yt+1− Yt(1), con Yt(1) el pronostico paraYt+1, realizado en o con origen en t) que se aproximan a la varianza del modeloverdadero y con una rapidez por lo menos equivalente a la del cualquier otrocriterio de seleccion de modelos.

El criterio de Akaike aunque inconsistente es asintoticamente eficiente, peroel de Schwarz no es asintoticamente eficiente.

En la practica se calculan y evaluan modelos con ambos criterios y cuandono hay concordancia entre tales, a pesar de la eficiencia asintotica del criteriode Akaike, se recomienda tomar el modelo indicado por el criterio de Schwarzpor ser mas parsimonioso.

3.5. Ejemplo: Datos RSALES.DAT

Considere la serie de los datos mensuales de las ventas al menudeo enEstados Unidos, en dolares nominales, desde enero de 1955 a enero de 1996,ilustrada en la Figura 3.11.

Time

rsal

es

1960 1970 1980 1990

5000

010

0000

1500

0020

0000

Figura 3.11: Serie mensual de ventas al menudeo en Estados Unidos, dolares nominales

(ajustada estacionalmente), desde 01-1955 a 01-1996, fuente:Diebold [3].

Realice el ajuste de los siguientes modelos, considerando solo los datosdesde 01-1955 a 01-1995, compare resultados en cuanto ajuste, y compor-

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


tamiento de los residuales ¿Cual modelo pronostica mejor?

modelo1 (cuadratico): Yt = β0 + β1t+ β2t2 + Et

modelo2 (cubico): Yt = β0 + β1t+ β2t2 + β3t

3 + Et

modelo3 (exponencial): Yt = β0eβ1t + Et

La programacion R y resultados de estos ajustes son dados a continuacion:

Codigo R 3.14.

#Leyendo datos del archivo RSALES.DATRSALES=read.table(file.choose(),header=T)RSALES=ts(RSALES,freq=12,start=c(1955,1))

#Graficando la serie con todos los datosplot(RSALES,lwd=3)

#Definiendo ´ındice t sin considerar las ultimas 12 observaciones de la seriet=1:(length(RSALES)-12)

#Considerando serie solo hasta enero de 1995 inclusiveRSALESb=ts(RSALES[t],freq=12,start=c(1955,1))

Codigo R 3.15.

#Ajustando modelo de regresion cuadratica

modelo1=lm(RSALESb˜t+I(tˆ2))

Salida R 3.6.

summary(modelo1)Call:lm(formula = RSALESb ˜ t + I(tˆ2))


-7216.4 -2274.5 352.6 2179.2 8010.6


(Intercept) 1.889e+04 3.839e+02 49.19 <2e-16 ***t -1.117e+02 3.678e+00 -30.37 <2e-16 ***I(tˆ2) 9.387e-01 7.390e-03 127.02 <2e-16 ***---Signif. codes: 0 ’ *** ’ 0.001 ’ ** ’ 0.01 ’ * ’ 0.05 ’.’ 0.1 ’ ’ 1

Residual standard error: 2795 on 478 degrees of freedomMultiple R-squared: 0.9969, Adjusted R-squared: 0.9969F-statistic: 7.698e+04 on 2 and 478 DF, p-value: < 2.2e-16

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


Codigo R 3.16.

#Ajuste del modelo de tendencia cubicamodelo2=lm(RSALESb˜t+I(tˆ2)+I(tˆ3))

Salida R 3.7.

summary(modelo2)Call:lm(formula = RSALESb ˜ t + I(tˆ2) + I(tˆ3))


-6844.6 -2285.7 166.6 2280.0 7854.0


(Intercept) 1.939e+04 5.132e+02 37.779 <2e-16 ***t -1.241e+02 9.210e+00 -13.477 <2e-16 ***I(tˆ2) 1.003e+00 4.438e-02 22.600 <2e-16 ***I(tˆ3) -8.885e-05 6.053e-05 -1.468 0.143---Signif. codes: 0 ’ *** ’ 0.001 ’ ** ’ 0.01 ’ * ’ 0.05 ’.’ 0.1 ’ ’ 1

Residual standard error: 2792 on 477 degrees of freedomMultiple R-squared: 0.9969, Adjusted R-squared: 0.9969F-statistic: 5.144e+04 on 3 and 477 DF, p-value: < 2.2e-16

Codigo R 3.17.

#Parametros iniciales para modelo exponencial, hallados con modelo log-linealmodelolog=lm(log(RSALESb)˜t)

Salida R 3.8.

summary(modelolog)Call:lm(formula = log(RSALESb) ˜ t)


-0.193193 -0.072602 0.002657 0.070877 0.200578


(Intercept) 9.338e+00 8.714e-03 1071.7 <2e-16 ***t 5.869e-03 3.133e-05 187.3 <2e-16 ***---Signif. codes: 0 ’ *** ’ 0.001 ’ ** ’ 0.01 ’ * ’ 0.05 ’.’ 0.1 ’ ’ 1

Residual standard error: 0.0954 on 479 degrees of freedomMultiple R-squared: 0.9865, Adjusted R-squared: 0.9865F-statistic: 3.51e+04 on 1 and 479 DF, p-value: < 2.2e-16

Codigo R 3.18.

#Ajuste modelo exponencial usando valores iniciales obtenidos#en salida R anteriorb00=exp(coef(modelolog)[[1]]); b10=coef(modelolog)[[2]]

modelo3=nls(RSALESb˜beta0 * exp(beta1 * t),start=list(beta0=b00,beta1=b10))

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


Salida R 3.9.

summary(modelo3)

Formula: RSALESb ˜ beta0 * exp(beta1 * t)


beta0 1.197e+04 1.714e+02 69.84 <2e-16 ***beta1 5.769e-03 3.536e-05 163.13 <2e-16 ***---Signif. codes: 0 ’ *** ’ 0.001 ’ ** ’ 0.01 ’ * ’ 0.05 ’.’ 0.1 ’ ’ 1

Residual standard error: 5141 on 479 degrees of freedom


Codigo R 3.19.

#Calculo de AIC y BIC para los tres modelos

AICS=c(AIC(modelo1),AIC(modelo2),AIC(modelo3))

log.n=log(length(RSALESb))BICS=c(AIC(modelo1,k=log.n),AIC(modelo2,k=log.n),AIC(modelo3,k=log.n))

#o bienBICs=c(BIC(modelo1),BIC(modelo2),BIC(modelo3))

criterios = rbind(AICS, BICS)colnames(criterios) = c("cuadratico","cubico","exponencial")rownames(criterios) = c("AIC","BIC")

Salida R 3.10.

#Tabla de valores AIC y BIC(criterios)

cuadratico cubico exponencialAIC 9004.057 9003.889 9589.319BIC 9020.761 9024.769 9601.847

Codigo R 3.20.

#Calculando testes de normalidad

testes=rbind(shapiro.test(residuals(modelo1)),shapiro.test(residuals(modelo2)),shapiro.test(residuals(modelo3)))rownames(testes) = c("Cuadratico","Cubico","exponencial")

Salida R 3.11.

#Resultados pruebas de normalidad para los tres modelostestes

statistic p.value method data.nameCuadratico 0.9761218 4.418319e-07 "Shapiro-Wilk normality test" "residuals(modelo1)"Cubico 0.9739848 1.514746e-07 "Shapiro-Wilk normality test" "residuals(modelo2)"exponencial 0.9804841 4.672147e-06 "Shapiro-Wilk normality test" "residuals(modelo3)"

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


Codigo R 3.21.

#DEFINIENDO VALORES AJUSTADOS DE CADA MODELOS COMO SERIE DE TIEMPO#PARA FACILITAR GRAFICAS DE DATOS REALES Y AJUSTADOS EN MISMO GRAFICOYthat1=ts(fitted(modelo1),frequency=12,start=c(1955,1))Ythat2=ts(fitted(modelo2),frequency=12,start=c(1955,1))Ythat3=ts(fitted(modelo3),frequency=12,start=c(1955,1))

#Dibujando curvas ajustadas cuadratica y exponencial junto a serie realplot(RSALES,lwd=3)lines(Ythat1,col=2,lwd=2)lines(Ythat3,col=4,lwd=2)legend("topleft",legend=c("Ajuste Cuadratico","Ajuste exponencial"),lty=1,col=c("red","blue"),lwd=2)abline(v=time(RSALESb)[length(RSALESb)],lty=2) #L´ınea vertical de referencia del origen de pronosticos

#Figura residuales#Dividiendo la ventana grafica en seis subventanas organizadas en matriz 2x3nf=layout(rbind(c(1,1,2,2,3,3),c(4,4,5,5,6,6)))

#Graficando los residuales de los modelos vs. tiempoplot(t,residuals(modelo1),type=’l’,main="Residuales vs. tiempo\nModelo cuadratico",lwd=2,ylim=c(-14000,12500))abline(h=0,lty=2)

plot(t,residuals(modelo2),type=’l’,main="Residuales vs. tiempo\nModelo cubico",lwd=2,ylim=c(-14000,12500))abline(h=0,lty=2)

plot(t,residuals(modelo3),type=’l’,main="Residuales vs. tiempo\nModelo exponencial",lwd=2,ylim=c(-14000,12500))abline(h=0,lty=2)

#Graficando los residuales de los modelos vs.valores ajustadosplot(fitted(modelo1),residuals(modelo1),main="Residuales vs. Ajustados\nModelo cuadratico",ylim=c(-14000,12500),cex=1.5)abline(h=0,lty=2)

plot(fitted(modelo2),residuals(modelo2),main="Residuales vs. Ajustados\nModelo cubico",ylim=c(-14000,12500),cex=1.5)abline(h=0,lty=2)

plot(fitted(modelo3),residuals(modelo3),main="Residuales vs. Ajustados\nModelo exponencial",ylim=c(-14000,12500),cex=1.5)abline(h=0,lty=2)

#Graficos de probabilidad normal con residuales comunesnf=layout(rbind(c(1,1,2,2),c(0,3,3,0)))qqnorm(residuals(modelo1))qqline(residuals(modelo1),col=2,lwd=2)

qqnorm(residuals(modelo2),main="Normal QQ-Plot\nModelo cubico")qqline(residuals(modelo2),col=2,lwd=2)

qqnorm(residuals(modelo3),main="Normal QQ-Plot\nModelo exponencial")qqline(residuals(modelo3),col=2,lwd=2)

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


Time

rsal

es

1960 1970 1980 1990

5000

010

0000

1500

0020

0000

1960 1970 1980 1990

5000

010

0000

1500

0020

0000

1960 1970 1980 1990

5000

010

0000

1500

0020

0000

Ajuste CuadráticoAjuste exponencial

Figura 3.12: Serie mensual de ventas al menudeo en Estados Unidos, dolares nominales

(ajustada estacionalmente), y curvas cuadratica y exponencial ajustadas

0 100 200 300 400 500−15

000

−50

000

5000

1000

0

Residuales vs. tiempoModelo cuadrático

t

resi

dual

s(m

odel

o1)

0 100 200 300 400 500−15

000

−50

000

5000

1000

0

Residuales vs. tiempoModelo cúbico

t

resi

dual

s(m

odel

o2)

0 100 200 300 400 500−15

000

−50

000

5000

1000

0

Residuales vs. tiempoModelo exponencial

t

resi

dual

s(m

odel

o3)

50000 150000−15

000

−50

000

5000

1000

0

Residuales vs. AjustadosModelo cuadrático

fitted(modelo1)

resi

dual

s(m

odel

o1)

50000 150000−15

000

−50

000

5000

1000

0

Residuales vs. AjustadosModelo cúbico

fitted(modelo2)

resi

dual

s(m

odel

o2)

50000 150000−15

000

−50

000

5000

1000

0

Residuales vs. AjustadosModelo exponencial

fitted(modelo3)

resi

dual

s(m

odel

o3)

Figura 3.13: Residuales modelos ajustados a datos de RSALES.DAT

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


−3 −2 −1 0 1 2 3

−50

000

5000

Normal Q−Q Plot

Theoretical Quantiles

Sam

ple

Qua

ntile

s

−3 −2 −1 0 1 2 3

−50

000

5000

Normal QQ−PlotModelo cúbico


Sam

ple

Qua

ntile

s

−3 −2 −1 0 1 2 3

−10

000

050

0010

000

Normal QQ−PlotModelo exponencial


Sam

ple

Qua

ntile

s

Figura 3.14: Graficos de normalidad para residuales, modelos ajustados a datos de

RSALES.DAT

Codigo R 3.22.

#Predicciones para 02-1995 a 01-1996

t2=(length(RSALESb)+1):(length(RSALESb)+12)

predic1=cbind(RSALES[t2],predict(modelo1,newdata=list(t=t2),interval="prediction"))colnames(predic1)[1]="Real"

predic2=cbind(RSALES[t2],predict(modelo2,newdata=list(t=t2),interval="prediction"))colnames(predic2)[1]="Real"

#Para objetos nls, predict() Hasta el momento, solo da predicciones sin sus intervalos

predic3=cbind(RSALES[t2],predict(modelo3,newdata=list(t=t2),se.fit = TRUE,interval="prediction"))colnames(predic3)=c("Real","fit")

Salida R 3.12.

predic1Real fit lwr upr

1 181958 183122.1 177578.5 188665.72 185303 183916.2 178371.7 189460.83 183429 184712.3 179166.9 190257.64 183395 185510.2 179963.9 191056.45 185089 186309.9 180762.8 191857.16 185287 187111.6 181563.5 192659.77 187973 187915.1 182366.2 193464.18 189465 188720.5 183170.6 194270.59 191789 189527.8 183977.0 195078.710 192611 190337.0 184785.2 195888.811 192913 191148.0 185595.2 196700.8

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


12 193218 191961.0 186407.2 197514.8

predic2Real fit lwr upr

1 181958 182621.5 177044.2 188198.92 185303 183403.2 177823.0 188983.53 183429 184186.7 178603.4 189769.94 183395 184971.8 179385.6 190558.15 185089 185758.8 180169.4 191348.26 185287 186547.4 180954.8 192140.17 187973 187337.9 181741.9 192933.88 189465 188130.0 182530.7 193729.49 191789 188923.9 183321.1 194526.810 192611 189719.6 184113.2 195326.011 192913 190517.0 184906.9 196127.112 193218 191316.1 185702.3 196930.0

as.data.frame(predic3)Real fit

1 181958 193072.02 185303 194189.03 183429 195312.44 183395 196442.45 185089 197578.86 185287 198721.97 187973 199871.68 189465 201027.99 191789 202190.910 192611 203360.611 192913 204537.112 193218 205720.4

3.6. Ejercicios

3.6.1. Problema 1

Considere las series en SKYLEPT.DAT, usando R, para cada una de el-las ajuste un modelo de tendencia conveniente, realice ademas el analisis deresiduales.

3.6.2. Problema 2

Los siguientes datos pertenecen al ındice de productividad mensual enCanada, desde Enero de 1950, hasta Diciembre de 1973.

De la Figura 3.15 responda:

1. ¿Que tipo de tendencia tiene esta serie?

2. Proponga modelos para la serie completa y ajustelos Usando R. Concluyasi estos modelos son apropiados a partir de los graficos de residuales,y sus medidas de ajuste. En cada caso, escriba la ecuacion y el modeloajustado. Evalue tambien los graficos de residuales en terminos de lavalidez del supuesto de independencia.

3. Considere ahora la serie sin sus primeros cinco anos, es decir, desdeenero de 1955, y repita 2.

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ

3.6. EJERCICIOS 73

Ano ene feb mar abr may jun jul ago sep oct nov dic

1950 77.5 77.6 78.1 78.3 78.3 78.9 79.5 80.0 80.7 82.0 82.4 82.51951 83.4 84.4 85.8 86.5 86.8 88.0 88.7 89.4 90.2 90.6 91.3 91.41952 91.5 91.0 90.5 90.4 89.7 89.8 89.9 89.8 89.9 89.8 89.9 89.61953 89.6 89.4 88.9 88.7 88.5 88.9 89.3 89.6 89.9 90.3 89.9 89.61954 89.6 89.6 89.4 89.5 89.4 89.9 89.9 90.6 90.4 90.4 90.4 90.21955 90.1 90.0 89.8 89.9 90.1 89.7 89.8 90.1 90.4 90.5 90.5 90.51956 90.4 90.1 90.1 90.2 90.2 91.2 91.7 92.2 92.1 92.7 93.1 93.21957 93.1 93.3 93.3 93.6 93.7 94.1 94.3 94.9 95.4 95.5 95.4 95.31958 95.5 95.7 96.2 96.9 96.8 96.8 96.5 96.9 97.2 97.5 97.8 97.71959 97.6 97.3 97.1 97.1 97.2 96.7 97.4 97.8 98.4 99.1 99.3 99.01960 98.7 98.5 98.2 98.7 98.6 98.8 98.7 99.0 99.4 100.2 100.3 100.31961 100.0 99.8 99.9 99.9 99.8 99.8 99.8 99.9 99.9 100.0 100.4 100.51962 100.4 100.5 100.4 100.9 100.7 101.0 101.4 101.7 101.4 101.8 102.1 102.11963 102.2 102.2 102.2 102.4 102.4 102.8 103.3 103.6 103.3 103.4 103.7 103.91964 103.9 104.1 104.2 104.5 104.5 104.7 105.4 105.3 105.0 105.0 105.2 105.91965 106.0 106.2 106.3 106.6 106.8 107.6 108.0 107.9 107.7 107.8 108.5 109.01966 109.3 110.0 110.2 110.8 111.0 111.3 111.7 112.2 112.3 112.5 112.6 112.91967 113.0 113.1 113.4 114.4 114.6 115.2 116.3 116.8 116.6 116.5 116.9 117.51968 118.1 118.2 118.6 119.3 119.3 119.7 120.4 120.7 121.1 121.4 121.9 122.31969 122.6 122.6 123.2 124.6 124.9 125.9 126.4 126.9 126.6 126.8 127.4 127.91970 128.2 128.7 128.9 129.7 129.6 129.9 130.5 130.5 130.2 130.3 130.3 129.81971 130.3 130.9 131.3 132.2 132.7 133.0 134.1 135.0 134.7 134.9 135.4 136.31972 136.7 137.3 137.4 138.2 138.3 138.5 140.2 141.3 141.8 142.0 142.3 143.31973 144.5 145.3 145.7 147.3 148.4 149.7 151.0 153.0 153.9 154.3 155.5 156.4

4. ¿Que se concluye de 2) y 3) en terminos del ajuste de los modelos ycomportamiento de la serie?, ¿las observaciones de los primeros cincoanos afectan significativamente la modelacion de la serie? ¿por que?

Codigo R 3.23.

library(TSA)zt=scan()

77.5 77.6 78.1 78.3 78.3 78.9 79.5 80.0 80.7 82.0 82.4 82.583.4 84.4 85.8 86.5 86.8 88.0 88.7 89.4 90.2 90.6 91.3 91.491.5 91.0 90.5 90.4 89.7 89.8 89.9 89.8 89.9 89.8 89.9 89.689.6 89.4 88.9 88.7 88.5 88.9 89.3 89.6 89.9 90.3 89.9 89.689.6 89.6 89.4 89.5 89.4 89.9 89.9 90.6 90.4 90.4 90.4 90.290.1 90.0 89.8 89.9 90.1 89.7 89.8 90.1 90.4 90.5 90.5 90.590.4 90.1 90.1 90.2 90.2 91.2 91.7 92.2 92.1 92.7 93.1 93.293.1 93.3 93.3 93.6 93.7 94.1 94.3 94.9 95.4 95.5 95.4 95.395.5 95.7 96.2 96.9 96.8 96.8 96.5 96.9 97.2 97.5 97.8 97.797.6 97.3 97.1 97.1 97.2 96.7 97.4 97.8 98.4 99.1 99.3 99.098.7 98.5 98.2 98.7 98.6 98.8 98.7 99.0 99.4 100.2 100.3 100.3

100.0 99.8 99.9 99.9 99.8 99.8 99.8 99.9 99.9 100.0 100.4 100.5100.4 100.5 100.4 100.9 100.7 101.0 101.4 101.7 101.4 101.8 102.1 102.1102.2 102.2 102.2 102.4 102.4 102.8 103.3 103.6 103.3 103.4 103.7 103.9103.9 104.1 104.2 104.5 104.5 104.7 105.4 105.3 105.0 105.0 105.2 105.9106.0 106.2 106.3 106.6 106.8 107.6 108.0 107.9 107.7 107.8 108.5 109.0109.3 110.0 110.2 110.8 111.0 111.3 111.7 112.2 112.3 112.5 112.6 112.9113.0 113.1 113.4 114.4 114.6 115.2 116.3 116.8 116.6 116.5 116.9 117.5118.1 118.2 118.6 119.3 119.3 119.7 120.4 120.7 121.1 121.4 121.9 122.3122.6 122.6 123.2 124.6 124.9 125.9 126.4 126.9 126.6 126.8 127.4 127.9128.2 128.7 128.9 129.7 129.6 129.9 130.5 130.5 130.2 130.3 130.3 129.8130.3 130.9 131.3 132.2 132.7 133.0 134.1 135.0 134.7 134.9 135.4 136.3136.7 137.3 137.4 138.2 138.3 138.5 140.2 141.3 141.8 142.0 142.3 143.3144.5 145.3 145.7 147.3 148.4 149.7 151.0 153.0 153.9 154.3 155.5 156.4

zt=ts(zt,frequency=12, start=c(1950,1))

#Redefino los datos de la serie, eliminando los primeros 5 anosn2=length(zt)

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


zt2=ts(zt[61:n2], frequency=12, start=c(1955,1))

zt2=ts(zt2,frequency=12, start=c(1955,1))


plot(zt,main="Indice de productividad mensual en Canada\ndesde enero de 1950",lwd=2)plot(zt2, main="Indice de productividad mensual en Canada\ndesde enero desde 1955",lwd=2)

Indice de productividad mensual en Canadadesde enero de 1950

Time

zt

1950 1955 1960 1965 1970

8010

012

014

0

Indice de productividad mensual en Canadadesde enero desde 1955

Time

zt2

1955 1960 1965 1970

9010

011

012

013

014

015

0

Figura 3.15: Serie Indice de productividad mensual en Canada: arriba Datos desde 1959,

abajo: datos desde 1955.

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ

3.7. DATOS STYLEKP 75

3.7. datos STYLEKPAGRICULTURE MANUFACTURING RETAIL SERVICES68.3000030518 338.700012207 153.800003052 190.19999694867.5 339.399993896 153.199996948 197.69999694867.0999984741 368.299987793 163.300003052 207.69999694867.1999969482 397.399993896 169 217.39999389665.1999969482 425.399993896 179.399993896 230.69999694866.6999969482 462.5 190 240.39999389662.4000015259 497.899993896 199.199996948 253.89999389665.5 496.600006104 201.5 265.20001220763.5999984741 522 211.600006104 274.70001220765.3000030518 536.700012207 212.699996948 287.79998779368.8000030518 506.799987793 215.600006104 295.70001220770.5999984741 515.5 224.5 302.39999389670.9000015259 561.200012207 239.800003052 32070.3000030518 621.299987793 255.600006104 340.20001220769.6999969482 591.599975586 245.199996948 347.573.0999984741 547.5 247.5 352.39999389671.5 600.599975586 262.799987793 367.70001220773.3000030518 664.799987793 270.5 399.60000610473 694.700012207 284.799987793 421.577 712.200012207 291.299987793 436.89999389676.4000015259 673.900024414 281.700012207 450.89999389687.4000015259 678.599975586 286.399993896 46389.5999984741 634.599975586 287.5 463.60000610476.6999969482 674.200012207 307.799987793 480.39999389684.1999969482 752.400024414 334 509.70001220795.8000030518 779.200012207 354.399993896 538.599975586103.599998474 803.200012207 377.5 565.799987793105.099998474 852.200012207 371.600006104 592.59997558697 917.400024414 399.200012207 623.299987793100.5 929 412 652.299987793

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ

Capıtulo 4

Filtros lineales y suavizamientos

En este capıtulo se introducen algunas tecnicas utilizadas en la identi-ficacion y estimacion de las componentes de una serie de tiempo, con lascuales es posible modelar localmente. Esta estrategia admite cambios en losparametros que definen las componentes estructurales, tales como la pendi-ente de una recta de tendencia, a diferencia de los modelos de regresion hastaahora vistos en los cuales se asume y estima un unico modelo con parametrosconstantes para toda la serie.

4.1. Regresion LOESS

LOESS es un metodo de ajuste de polinomios locales propuesto por Cleve-land (1988) y que permite flexibilizar el metodo de mınimos cuadrados medi-ante el ajuste de modelos sencillos sobre subconjuntos locales de datos paracrear una funcion que describe la parte determinıstica de los datos.

El procedimiento asume que para i = 1, 2, · · · , n, la i-esima observacion yi

de una variable respuesta Y y la correspondiente observacion xi de un vectorde predictores x estan relacionadas segun el modelo

yi = g(xi) + ei

donde g es la funcion de regresion (para la cual no se asume una formaparametrica) y ei es un error aleatorio. La idea de la regresion local es que cer-ca de x = xi la funcion de regresion g(x) puede ser aproximada localmente porun polinomio de un orden dado. Tal aproximacion local es obtenida ajustan-do una superficie de regresion a los datos que estan dentro de una vecindadescogida alrededor del punto xi.

En el metodo LOESS, se usa mınimos cuadrados ponderados para ajustarfunciones lineales o cuadraticas de los predictores en el centro de las vecin-dades. El radio de cada vecindad se escoge de manera que esta contenga unporcentaje especificado de las observaciones. esta fraccion, llamada parametro

de suavizamiento, controla el grado de suavizamiento de la superficie estima-da. las observaciones en una vecindad local dada son ponderadas medianteuna funcion decreciente de su distancia al centro de la vecindad.

77

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ

78 CAPITULO 4. FILTROS LINEALES Y SUAVIZAMIENTOS

Para el caso de un predictor univariado (una sola variable explicatoria), laregresion localmente ponderada se puede definir en los siguientes pasos:

1. Para cada i, i = 1, 2, · · · , n, se calculan las estimaciones βj(xi), j = 0, · · · , dde los parametros de una regresion polinomial de yk en xk, cuyo ajuste sehace por mınimos cuadrados ponderados con ponderacion wk(xi) para laobservacion (xk, yk). Entonces, los βj(xi) son los valores βj que minimizana

n∑

k=1

wk(xi)(yk − β0 − β1xk − · · · − βdx

dk

)2

la observacion suavizada en xi, utilizando el polinomio local de grado d es(xi, yi), donde yi es el valor ajustado en el punto xi.

yi =

d∑

j=0

βj(xi)xji

La ponderacion wk(xi) se calcula a partir de la consideracion del conceptode vecindad:

wk(xi) = W

(xk − xi

hi

)

donde hi es la r-esima distancia mas pequena de los vecinos de xi. Estoes, hi es el r-esimo numero mas pequeno entre los |xi − xj |, para j =1, 2, · · · , n, j 6= i. W es una funcion de ponderacion que tiene las siguientespropiedades:

a) W (x) > 0 para |x| < 1;

b) W (−x) = W (x);

c) W (x) es una funcion no creciente de x ≥ 0;

d) W (x) = 0 para |x| ≥ 1.

Por ejemplo, la funcion de ponderacion bicuadrada es definida como

W (x) =

{(1− x2)

2, para |x| < 1

0, para |x| ≥ 1

Otra funcion de peso que se puede utilizar es la tricubica (esta es la usadapor la funcion loess() de R):

W (x) =

{(1− |x|3)3

, para |x| < 10, para |x| ≥ 1

2. Los yi son los valores ajustados por la regresion localmente ponderada,es decir, yi = g(xi).

Nota: Las observaciones deben estar en orden creciente de los valores xi.

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ

4.1. REGRESION LOESS 79

4.1.1. LOESS en R

loess(formula, data, weights, subset, na.action, model = FALSE,span = 0.75, enp.target, degree = 2,parametric = FALSE, drop.square = FALSE, normalize = TRUE,family = c("gaussian", "symmetric"),method = c("loess", "model.frame"),control = loess.control(...), ...)

Argumentos:

formula : Una formula que especifica lae respuesta y uno o mas predic-tores numericos.

data : Un marco de datos opcional dentro del cual se busca primero lasvariables del modelo.

weights : argumento opcional especificando los pesos o ponderaciones.

subset : Un subconjunto opcional de datos a usar.

na.action : La accion a realizar con datos faltantes en la respuesta o enlos predictores. La accion por defecto es parar el algoritmo.

model : Argumento logico para indicar si debe retornarse el marco delmodelo.

span: el parametro α que controla el grado de suavizamiento.

enp.target : una forma alternativa de especificar span , como el numeroaproximado equivalente al numero de parametros a utilizar.

degree : el grado q de los polinomios a utilizar, hasta 2.

parametric : Para indicar si cualquiera de los terminos debe ser ajustadoglobalmente en lugar de localmente. Los terminos pueden ser especifica-dos por nombre, numero o como un vector logico del mismo tamano queel numero de predictores.

drop.square : Para ajustes con mas de un predictor y degree=2 , paraindicar si debe excluirse el termino cuadratico (y los terminos cruzados)para ciertos predictores. Los terminos son especificados de igual maneraque en parametric .

normalize : Para indicar si los predictores deben ser normalizados a unaescala comun cuando hay mas de uno.

family : Si se usa “gaussian ” el ajuste se hace por mınimos cuadrados,y si se usa “symmetric ” se usa un estimador robusto.

method : Ajusta el modelo o solo extrae el marco del modelo.

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


control : Parametros de control: ver loess.control ..

... : otros parametros de control que pueden ser proporcionados direc-tamente.

Observaciones:

El tamano de la vecindad esta controlado por α (establecido por span oenp.target ). Para α < 1, la vecindad incluye la proporcion α de los puntos, yestos tiene una ponderacion tricubica. Para α > 1, todos los puntos son usa-dos, con la distancia maxima asumida igual a α1/p veces la distancia maximareal para p variables explicativas.

4.1.2. Otras funciones R relacionadas con LOESS: scatter.smooth() yloess.smooth()

Estas funciones son unas de las mas utiles cuando se realizan analisisiniciales de datos, ya que permiten realizar un grafico de dispersion y dibujala curva ajustada por LOESS.

scatter.smooth(x, y, span = 2/3, degree = 1,family = c("symmetric", "gaussian"),xlab = deparse(substitute(x)), ylab = deparse(substitute(y)),ylim = range(y, prediction$y), evaluation = 50, ...)

loess.smooth(x, y, span = 2/3, degree = 1,family = c("symmetric", "gaussian"), evaluation=50, ...)

Argumentos:

x : coordenadas x para el grafico de dispersion.

y : coordenadas y para el grafico de dispersion.

span : parametro de suavizacion para ‘loess’.

degree : grado del polinomio local utilizado.

family : si se usa la opcion “gaussian ” el ajuste se realiza por mınimoscuadrados, y si family =“symmetric ” un estimador robusto es usado.

xlab : marquilla para el eje x.

ylab : marquilla para el eje y.

ylim : establece los lımites de y en el grafico.

evaluation : numero de puntos en los cuales se evalua la curva suaviza-da.

... : parametros graficos.

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


4.1.3. Ejemplo:

Considere los datos de la tasa de cambio de Hungrıa, 620 observacionesFuente: Diebold [3], (exchrate.dat),

Codigo R 4.1.

#Lectura datosdatos.exchrate=read.table(file.choose(),header=T)datos.exchrate=ts(datos.exchrate,frequency=1)

#Aplicando LOESSt=time(datos.exchrate)suavizam.loess0.10=loess(datos.exchrate˜t,span=0.10) #alpha=0.1suavizam.loess0.30=loess(datos.exchrate˜t,span=0.30) #alpha=0.3suavizam.loess0.75=loess(datos.exchrate˜t,span=0.75) #alpha=0.75

Con la funcion summary() obtenemos un resumen del algoritmo indicando elmodelo considerado para la serie y los valores de ajuste de los argumentos dela funcion con los cuales fue aplicada, por ejemplo para el caso con α = 0.1:

Salida R 4.1.

summary(suavizam.loess0.10)

Call:loess(formula = datos.exchrate ˜ t, span = 0.1)

Number of Observations: 620Equivalent Number of Parameters: 28.62Residual Standard Error: 1.286Trace of smoother matrix: 31.65

Control settings:normalize: TRUEspan : 0.1degree : 2family : gaussiansurface : interpolate cell = 0.2

Con Loess tambien podemos calcular valores ajustados, evaluar los residualesy hacer pronosticos, veamos:

Codigo R 4.2.

#Prediccion para t=621 a 625#con alpha=0.1suavizam.loess0.10b=loess(datos.exchrate˜t,span=0.10,control=loess.control(surface="direct"))predict.loess0.10b=predict(suavizam.loess0.10b,data.frame(t=c(621:625)),se=TRUE)

#con alpha=0.3suavizam.loess0.30b=loess(datos.exchrate˜t,span=0.30,control=loess.control(surface="direct"))predict.loess0.30b=predict(suavizam.loess0.30b,data.frame(t=c(621:625)),se=TRUE)

En la siguiente salida R se observan los valores de predicciones, los erroresestandar de las predicciones, estimacion de la desviacion estandar del modeloy su grados de libertad correspondientes, para ajuste Loess con α = 0.1

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


Salida R 4.2.

predict.loess0.10b$fit

1 2 3 4 511.69602 11.45307 11.21345 10.97754 10.74570

$se.fit1 2 3 4 5

0.5652833 0.6122641 0.6620730 0.7146670 0.7700123

$residual.scale[1] 1.278659

$df[1] 585.9919

En el Cuadro 4.1, se resumen lo resultados de las predicciones para α =0.1, 0.3, 0.75.

Tabla 4.1: Pronosticos Loess, t=621 a 625, n = 620, datos exchrate.datα = 0.1

t = n+ L Yn+L s.e(L) σE df

621 11.70 0.57 1.28 585.99622 11.45 0.61 1.28 585.99623 11.21 0.66 1.28 585.99624 10.98 0.71 1.28 585.99625 10.75 0.77 1.28 585.99

α = 0.3


621 14.27 0.44 1.78 608.43622 14.21 0.45 1.78 608.43623 14.16 0.46 1.78 608.43624 14.10 0.48 1.78 608.43625 14.04 0.49 1.78 608.43

α = 0.75


621 12.77 0.45 2.87 615.21622 12.66 0.45 2.87 615.21623 12.55 0.46 2.87 615.21624 12.44 0.46 2.87 615.21625 12.32 0.46 2.87 615.21

Nota: Con los resultados anteriores es posible construir intervalos de predic-cion de nivel (1− γ)100 %, de la forma

Yn+L ± tγ/2,[df] × s.e(L)

En el siguiente codigo R se ilustran dos maneras de presentar graficamentelos ajustes LOESS:

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


Codigo R 4.3.

#Ajustar argumentos de scatter.smooth y de loess.smooth segun informacion observada con summary()


scatter.smooth(time(datos.exchrate),datos.exchrate,type=’l’,family="gaussian",span=0.10,degree=2)legend("topleft",legend=expression(alpha==0.1))



#Tambien podemos realizar el grafico de la siguiente manera#y superponer varias curvas Loessplot(datos.exchrate,lwd=2)lines(loess.smooth(t,datos.exchrate,family="gaussian",span=0.10,degree=2),lty=1,lwd=2,col="red")lines(loess.smooth(t,datos.exchrate,family="gaussian",span=0.30,degree=2),lty=1,lwd=2,col="blue")lines(loess.smooth(t,datos.exchrate,family="gaussian",span=0.75,degree=2),lty=1,lwd=2,col="black")legend("topleft",legend=c(expression(alpha==0.1),expression(alpha==0.3),expression(alpha==0.75)),col=c("red","blue","black"),lty=1,lwd=2)

Las Figuras 4.1 y 4.2 ilustran el resultado del anterior codigo.

Tambien es posible analizar los residuales de los ajustes LOESS, el sigu-iente codigo, ilustra la obtencion de las graficas de residuales:

Codigo R 4.4.

#Graficos de residualesnf=layout(rbind(c(1,1,2,2,3,3),c(4,4,5,5,6,6)))plot(t,residuals(suavizam.loess0.10),type=’l’,lwd=2)abline(h=0,lty=2)plot(t,residuals(suavizam.loess0.30),type=’l’,lwd=2)abline(h=0,lty=2)plot(t,residuals(suavizam.loess0.75),type=’l’,lwd=2)abline(h=0,lty=2)

plot(fitted(suavizam.loess0.10),residuals(suavizam.loess0.10))abline(h=0,lty=2)plot(fitted(suavizam.loess0.30),residuals(suavizam.loess0.30))abline(h=0,lty=2)plot(fitted(suavizam.loess0.75),residuals(suavizam.loess0.75))abline(h=0,lty=2)

La Figura 4.3 muestra el resultado grafico del anterior codigo.ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


0 100 200 300 400 500 600

05

1015

2025

time(datos.exchrate)

dato

s.ex

chra

teα = 0.1

0 100 200 300 400 500 600

05

1015

2025


dato

s.ex

chra

te

α = 0.3

0 100 200 300 400 500 600

05

1015

2025


dato

s.ex

chra

te

α = 0.75

Figura 4.1: Serie Tasa de cambio en Hungrıa y tres suavizamientos LOESS, (fecha de

inicio desconocida), fuente Diebold [3].

Time

exch

rate

0 100 200 300 400 500 600

05

1015

2025

α = 0.1α = 0.3α = 0.75

Figura 4.2: Serie Tasa de cambio en Hungrıa y tres suavizamientos LOESS, (fecha de

inicio desconocida), fuente Diebold [3].

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ

4.2. FILTROS LINEALES, MEDIAS MOVILES Y SUAVIZADORES 85

0 100 300 500

−4

−2

02

4

t

resi

dual

s(su

aviz

am.lo

ess0

.10)

0 100 300 500

−6

−4

−2

02

46

tre

sidu

als(

suav

izam

.loes

s0.3

0)

0 100 300 500

−5

05

t

resi

dual

s(su

aviz

am.lo

ess0

.75)

5 10 15 20

−4

−2

02

4

fitted(suavizam.loess0.10)

resi

dual

s(su

aviz

am.lo

ess0

.10)

5 10 15 20

−6

−4

−2

02

46


resi

dual

s(su

aviz

am.lo

ess0

.30)

5 10 15 20

−5

05


resi

dual

s(su

aviz

am.lo

ess0

.75)

Figura 4.3: Graficos de residuales, ajustes LOESS para datos de la tasa de cambio en

Hungrıa), fuente Diebold [3].

4.2. Filtros lineales, medias moviles y suavizadores

4.2.1. Filtro Lineal

En el analisis de series de tiempo mediante descomposicion suelen usarsefiltros lineales para obtener la componente de tendencia. Un filtro lineal sobreuna serie de tiempo es una transformacion de la siguiente forma

Yt =

∞∑

i=−∞wiYt−i (4.1)

donde los coeficientes wt son un conjunto de pesos tales que∞∑

t=−∞|wt| <∞. La

ecuacion (4.1) tambien es llamada convolucion. Los filtros ayudan a determinarla tendencia reduciendo las fluctuaciones locales y tambien se pueden usarcomo estimadores de la tendencia cuando no es posible describirla medianteecuaciones parametricas simples, es decir, en tales casos podemos tomar Tt =Yt.

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


4.2.2. Medias moviles

Un tipo de filtros lineales simples son las medias moviles. En este tipo, los

pesos wi son restringidos de tal forma quem∑

i=−m

wi = 1, y generalmente se toman

simetricos, esto es, w−i = wi. El entero m ≥ 1 es llamado el ancho de ventana dela media movil o parametro de suavizamiento, el cual, el usuario debe definirteniendo en cuenta que mientras mayor sea, mayor es el suavizamiento. Lasmedias moviles pueden clasificarse en los siguientes tipos (Diebold [3]):

Media movil unilateral

Una media movil unilateral utiliza pesos wi =1

m+ 1, i = 0, · · · , m, es decir,

Yt =1

m+ 1

m∑

i=0

Yt−i (4.2)

Media movil bilateral

En este tipo, los pesos usado son wi =1

2m+ 1, i = −m, · · · , m, es decir,

Yt =1

2m+ 1

m∑

i=−m

Yt−i (4.3)

Media movil unilateral general

Esta corresponde a

Yt =m∑

i=0

wiYt−i (4.4)

esta es una version mas general de la media movil unilateral.

Media movil bilateral general

Esta corresponde a

Yt =

m∑

i=−m

wiYt−i (4.5)

Es una version mas general de la media movil bilateral, con w−i = wi.En R podemos calcular filtros y medias moviles mediante la funcion filter() :

Funcion filter()

Esta funcion arroja un objeto R tipo serie de tiempo, que corresponde a laserie filtrada.

filter(x, filter, method = c("convolution", "recursive"),sides = 2, circular = FALSE, init)

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


Argumentos:

x: Una serie de tiempo.

filter: El vector de pesos wi del filtro en orden iverso del tiempo, esdecir, en el orden retrospectivo de la serie rezagada Yt−i, segun el metodode filtracion: filter = c(w0, w1, · · · , wm) si se trata de una convolucion, ofilter = c(w1, w2, · · · , wm) si se trata de un filtro recursivo (ver method ).

method: puede ser “convolution ” para filtro de convolucion Yt =m∑

i=0

wiYt−i

(caso unilateral) o Yt =m∑

i=−m

wiYt−i, w−i = wi (caso bilateral); “recursive ”

para un filtro recursivo, es decir, de la forma Yt = Yt +m∑

j=1

wjYt−j. Cuando

se usa method= “convolution ”, se calculan medias moviles de ancho deventana m; si se usa method= “recursive ”, se usa una autoregresion.

sides: Solo se usa este argumento para el caso de una convolucion.sides=1 calcula medias moviles unilaterales; sides=2 calcula mediasmoviles bilaterales. En este ultimo caso, la longitud del vector de pesosespecificado en filter debe ser de 2m+ 1.

circular: Este argumento solo se usa cuando el filtro es una convolu-cion. circular=F es el valor por defecto. Si se usa circular=T , para losterminos Yt−j con t− j ≤ 0 se utlizan los valores de la serie Yn−j+t, respec-tivamente, donde n es la longitud de la serie; si circular=F , los terminosfuera de la serie se asumen como NA (datos faltantes), y por tanto la seriefiltrada Yt no tendra valores para los primeros m y /o ultimos m perıodos(en las medias moviles bilaterales).

ini: Para el caso recursivo, un vector especificando los valores inicialesde la serie de tiempo antes del primer tiempo, especificados en ordeninverso del tiempo. Por defecto es ajustado a un vector de ceros.

Ejemplo:

Considere la serie MSFT disponible en R en la librerıa fTrading , sobre 249registros de precios y volumen negociados diariamente, de acciones de Mi-crosoft entre 2000-09-27 y 2001-09-27. MSFT es una matriz cuyas columnasson Open, High, Low, Close, Volume , que representan, respectivamente,precio de apertura, precio mas alto, precio mas bajo, precio de cierre, y volu-men negociado. la Figura 4.4 ilustra estas series. Considere la serie Volume .

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


Codigo R 4.5.

library(fTrading)#Base de datos MSFT de MIcrosift OHLC en librer´ıa fTrading: precios acciones#tiene estructura matricial. Las fechas son los nombres de las filas

head(MSFT) #al ejecutar esta l´ınea observa los primeros seis registros, como se ve a continuacionGMT

Open High Low Close Volume2000-09-27 63.4375 63.5625 59.8125 60.6250 530778002000-09-28 60.8125 61.8750 60.6250 61.3125 261802002000-09-29 61.0000 61.3125 58.6250 60.3125 370268002000-10-02 60.5000 60.8125 58.2500 59.1250 292812002000-10-03 59.5625 59.8125 56.5000 56.5625 426870002000-10-04 56.3750 56.5625 54.5000 55.4375 68226700

plot(MSFT,col=1)

#Volumen diario de acciones negociadasdatos=MSFT[,"Volume"]rownames(datos)=rownames(MSFT)t=1:length(datos)

4045

5055

6065

7075

Ope

n

4550

5560

6570

75

Hig

h

4045

5055

6065

70

2000−09−27 2001−02−20 2001−07−16

Low

Time

4550

5560

6570

Clo

se

2.0e

+07

6.0e

+07

1.0e

+08

2000−09−27 2001−02−20 2001−07−16

Vol

ume

Time

x

Figura 4.4: Graficos series precios negociacion de acciones de Microsoft (MSFT)

Vamos a calcular medias moviles unilaterales con m = 24, 48. Para ello,podemos usar la funcion filter() con el metodo de convolucion, y pesos wi =1/(m+ 1), o tambien la funcion SMA() de la librerıa fTrading con argumento

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


n=m+1. La siguiente programacion R produce los mismos resultados con estasdos funciones R:

Codigo R 4.6.

#Medias moviles unilaterales con m=24#con funcion SMA de la librer´ıa fTradingm=24medmovil.SMAm24=c(rep(NA,m),SMA(datos,n=(m+1)))

#Con funcion filtermedmovil.filterm24=filter(datos,rep(1/(m+1),m+1),sides=1,circular=F)

#Medias moviles unilaterales con m=48m=48medmovil.SMAm48=c(rep(NA,m),SMA(datos,n=(m+1)))medmovil.filterm48=filter(datos,rep(1/(m+1),m+1),sides=1,circular=F)

#Graficando la serie original con curvas de medias moviles superpuestasnf=layout(c(1,1,2,2))plot(t,datos,type=’l’,xaxt=’n’,xlab="Time",main="MA unilateral con funcion SMA")axis(1,at=seq(1,length(datos),by=50),labels=time(datos)[seq(1,length(datos),by=50)])lines(t,medmovil.SMAm24,col="red",lwd=2)lines(t,medmovil.SMAm48,col="blue",lwd=2)legend("topright",legend=c(expression(m==24),expression(m==48)),col=c("red","blue"),lty=1,lwd=2)

plot(datos,main="MA unilateral con funcion filter")lines(medmovil.filterm24,col="red",lwd=2)lines(medmovil.filterm48,col="blue",lwd=2)legend("topright",legend=c(expression(m==24),expression(m==48)),col=c("red","blue"),lty=1,lwd=2)

Las medias moviles calculadas con el anterior codigo se ilustran en la Figura4.5.

Observe que las series de las medias moviles no inician en el mismo puntoque la serie original, esto debido a que no existen valores para la serie antesdel primer perıodo (es decir, para t < 1). Sin embargo, en la funcion filter()se puede usar la opcion circular=T , que como ya se indico, reemplaza losterminos Yt−j con t − j ≤ 0 con los valores de la serie Tn−j+t, respectivamente,donde n es la longitud de la serie:

Codigo R 4.7.

#media movil unilateral usando funcion filter con argumento circular=Tm=24medmovil.filterm24b=filter(datos,rep(1/(m+1),m+1),sides=1,circular=T)m=48medmovil.filterm48b=filter(datos,rep(1/(m+1),m+1),sides=1,circular=T)

win.graph(width=9.5,height=4.5)plot(datos,main="MA unilateral usando funcion filter con argumento circular=T")lines(medmovil.filterm24b,col="red",lwd=2)lines(medmovil.filterm48b,col="blue",lwd=2)legend("topright",legend=c(expression(m==24),expression(m==48)),col=c("red","blue"),lty=1,lwd=2,cex=0.8)

Las medias moviles calculadas con el anterior codigo se ilustran en la Figura4.6.

Para el calculo de medias moviles bilaterales, con m = 12, 24, usamos lafuncion filter() :

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


2.0e

+07

6.0e

+07

1.0e

+08

MA unilateral con función SMA

Time

dato

s

2000−09−27 2000−12−07 2001−02−21 2001−05−03 2001−07−16

m = 24m = 48

MA unilateral con función filter

Time

Vol

ume

2000−09−27 2000−12−09 2001−02−20 2001−05−04 2001−07−16 2001−09−27

2.0e

+07

6.0e

+07

1.0e

+08

m = 24m = 48

Figura 4.5: Serie volumen de acciones diarias negociadas de Microsoft (MSFT), con me-

dias moviles unilaterales

MA unilateral usando función filter con argumento circular=T

Time

Vol

ume

2000−09−27 2000−12−09 2001−02−20 2001−05−04 2001−07−16 2001−09−27

2.0e

+07

6.0e

+07

1.0e

+08

m = 24m = 48

Figura 4.6: Serie volumen de acciones diarias negociadas de Microsoft (MSFT), medias

moviles unilaterales con argumento circular=T .

Codigo R 4.8.

#Medias moviles bilaterales con m=12, 24#Usando la opcion circular=Fm=12medmovil.bil.filterm12=filter(datos,rep(1/(2 * m+1),2 * m+1),sides=2,circular=F)m=24medmovil.bil.filterm24=filter(datos,rep(1/(2 * m+1),2 * m+1),sides=2,circular=F)

#Usando la opcion circular=Tm=12medmovil.bil.filterm12b=filter(datos,rep(1/(2 * m+1),2 * m+1),sides=2,circular=T)

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


m=24medmovil.bil.filterm24b=filter(datos,rep(1/(2 * m+1),2 * m+1),sides=2,circular=T)

#Graficando la serie y las medias movilesnf=layout(c(1,1,2,2))

plot(datos,main="MA bilateral con funcion filter, circular=F")lines(medmovil.bil.filterm12,col="red",lwd=2)lines(medmovil.bil.filterm24,col="blue",lwd=2)legend("topright",legend=c(expression(m==12),expression(m==24)),col=c("red","blue"),lty=1,lwd=2)

plot(datos,main="MA bilateral con funcion filter,circular=T")lines(medmovil.bil.filterm12b,col="red",lwd=2)lines(medmovil.bil.filterm24b,col="blue",lwd=2)legend("topright",legend=c(expression(m==12),expression(m==24)),col=c("red","blue"),lty=1,lwd=2)

MA bilateral con función filter, circular=F

Time

Vol

ume

2000−09−27 2000−12−09 2001−02−20 2001−05−04 2001−07−16 2001−09−27

2.0e

+07

6.0e

+07

1.0e

+08

m = 12m = 24

MA bilateral con función filter,circular=T

Time

Vol

ume

2000−09−27 2000−12−09 2001−02−20 2001−05−04 2001−07−16 2001−09−27

2.0e

+07

6.0e

+07

1.0e

+08

m = 12m = 24

Figura 4.7: Serie volumen de acciones diarias negociadas de Microsoft (MSFT), medias

moviles bilaterales.

4.2.3. Suavizamiento exponencial simple (EWMA)

Este filtro es una media movil ponderada exponencialmente, es decir, losfactores de ponderacion decaen exponencialmente, donde se tiene la siguienteecuacion recursiva de suavizamiento:

Yt = αYt + (1− α)Yt−1, α ∈ (0, 1). (4.6)

Puede mostrarse que

Yt = (1− α)tY0 +

t−1∑

i=0

wiYt−i ≈t−1∑

i=0

wiYt−i, con wi = α(1− α)i (4.7)

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


Este tipo de suavizamiento asume un modelo de tendencia local donde solohay evolucion lenta del nivel de la serie:

Yt = β0,t + ξt, donde β0,t = β0,t−1 + νt (4.8)

con νt ∼ N(0, σ2ν) y ξt ∼ N(0, σ2

ξ ) independientes. Para la implementacion sesiguen los siguientes pasos:

1. Inicializar en t = 1: Cuando la serie es muy larga, Y1 = Y1 y cuando la

serie es corta, Y1 = Y =1

n

n∑t=1

Yt.

2. Actualizar Yt = αYt + (1− α)Yt−1, t = 2, · · · , n

3. Hallar valores ajustados, Yt+1 = Yt,

4. Pronosticar Yn+L = Yn.

Note que los pronosticos para L = 1, 2, · · · todos corresponden a un valor con-stante dado por el ultimo valor suavizado en t = n, es decir, se asume que latendencia es de pendiente cero!!. Tambien observe que si α→ 0, el filtro reducela serie a un cosntante (el valor de Y0), mientras que si α→ 1, entonces Yt = Yt,es decir, no hay suavizamiento.

Un intervalo de prediccion aproximado de (1−γ)100 % puede ser construidocomo

Yn+L ± tγ/2,n−1 × σ√

1 + (L− 1)α2 con σ =

√√√√ 1

n− 1

n∑

t=1

(Yt − Yt)2 (4.9)

4.2.4. Suavizamiento Holt

Cuando la tendencia de la serie cambia no solo en su nivel local sino tam-bien en su pendiente, el metodo ewma no da buenos resultados. En su lugar,existe otra alternativa, adecuada cuando la tendencia local es lineal, veamos:

El modelo de tendencia con un nivel y pendiente locales de evolucion lentaes dado por

Yt = β0,t + β1,tt+ ξt (4.10)

dondeβ0,t = β0,t−1 + νt

β1,t = β1,t−1 + ηt

con las perturbaciones ξt ∼ N(0, σ2ξ ), νt ∼ N(0, σ2

ν), ηt ∼ N(0, σ2η) independientes

para todo t. En este caso, el metodo de suavizamiento optimo considera elsuavizamiento a traves de las dos siguientes ecuaciones de actualizacion:

nivel: β0,t = αYt + (1− α)(β0,t−1 + β1,t−1), α ∈ (0, 1) (4.11)

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


pendiente: β1,t = β(β0,t − β0,t−1) + (1− β)β1,t−1, β ∈ (0, 1) (4.12)

El algoritmo de suavizamiento comprende los siguientes pasos:

1. Inicializar en t=2: β0,2 = Y2, β1,2 = Y2 − Y1

2. Actualizar el nivel y la pendiente usando las ecuaciones de suavizamientocorrespondientes.

3. Hallar valores ajustadosYt+1 = β0,t + β1,t, (4.13)

4. Pronosticar fuera de la muestra:

Yn+L = β0,n + β1,n × L (4.14)

Un intervalo de prediccion aproximado de (1 − γ)100 % puede ser construidocomo

Yn+L ± tγ/2,n−2 × σ

√√√√1 +

L−1∑

i=1

α2(1 + iβ)2 con σ =

√√√√ 1

n− 2

n∑

t=1

(Yt − Yt)2 (4.15)

4.2.5. Suavizamientos exponenciales simples en R

En R disponemos de varias funciones que realizan EWMA, por ejemplo lafuncion ewmaSmooth() en la librerıa qcc y las funciones emaTA() , EWMA()enla librerıa fTrading :

ewmaSmooth(x, y, lambda = 0.2, start, ...)

Argumentos:

x: Un vector de valores x conteniendo el ındice de tiempo t.

y: Un vector conteniendo los valores de la serie a suavizar.

lambda: El parametro de suavizamiento α. Por defecto es 0.2.

start: Valor de inicio para el suavizamiento. Por defecto es Y1.

Esta funcion devuelve un objeto tipo lista con los siguientes elementos:

x los valores del vector x ,

y los valores suavizados

lambda el parametro de suavizamiento

start el valor de inicio

Las funciones emaTA() y EWMA() tienen la siguiente sintaxis:

emaTA(x, lambda, startup = 0)EWMA(x, lambda, startup = 0)

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


Argumentos:

x: Un vector numerico con los valores de la serie a suavizar.

lambda: El parametro de suavizamiento α.

startup: El valor de inicilalizacion, por defecto es cero.

Estas funciones devuelven un vector con los valores suavizados exponenciales.

Ejemplo:

De nuevo, considere la serie del volumen diario de acciones negociadas deMicrosoft, disponible en matriz MSFT de la librerıa R fTrading, vamos a aplicarun suavizamiento exponencial simple con α = 0.01, 0.1.

Codigo R 4.9.

#Suavizamiento exponencial simplelibrary(qcc); library(fTrading)

#Volumen diario de acciones negociadasdatos=MSFT[,"Volume"]rownames(datos)=rownames(MSFT)t=1:length(datos)#ewma con funcion ewmaSmooth librer´ıa qcc, con alpha=0.01suaviz.ewmaqcc0.01=ewmaSmooth(t,datos,lambda=0.01)suaviz.ewmaqcc0.01

#ewma con funcion ewmaSmooth librer´ıa qcc, con alpha=0.1suaviz.ewmaqcc0.1=ewmaSmooth(t,datos,lambda=0.1)suaviz.ewmaqcc0.1

#ewma con funcion emaTA librer´ıa fTrading, con alpha=0.01suaviz.ewmafTrading0.01=emaTA(datos,lambda=0.01)suaviz.ewmafTrading0.01

#ewma con funcion emaTA librer´ıa fTrading, con alpha=0.1suaviz.ewmafTrading0.1=emaTA(datos,lambda=0.1)suaviz.ewmafTrading0.1

#Resultados en forma graficanf=layout(c(1,1,2,2)) #preparando ventana grafica

#Graficando serie junto con l´ıneas EWMA obtenidas con funcion ewmaSmooth de la librer´ıa qccplot(t,datos,type=’l’,xaxt=’n’,xlab="Time",main="EWMA con funcion ewmaSmooth")axis(1,at=seq(1,length(datos),by=50),labels=time(datos)[seq(1,length(datos),by=50)])lines(suaviz.ewmaqcc0.1,col="red",lwd=2)lines(suaviz.ewmaqcc0.01,col="blue",lwd=2)legend("topright",legend=c(expression(alpha==0.1),expression(alpha==0.01)),col=c("red","blue"),lty=1,lwd=2)

#Graficando serie junto con l´ıneas EWMA obtenidas con funcion emaTA de la librer´ıa fTradingplot(datos,main="EWMA con funcion emaTA")lines(suaviz.ewmafTrading0.1,col="red",lwd=2)lines(suaviz.ewmafTrading0.01,col="blue",lwd=2)legend("topright",legend=c(expression(alpha==0.1),expression(alpha==0.01)),col=c("red","blue"),lty=1,lwd=2)

En la Tabla 4.2 se exhiben los seis valores iniciales y finales de los suaviza-mientos producidos por las funciones R ewmaSmooth() y emaTA() , con α =

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


0.01. Existen diferencias entre los resultados, sin embargo, en los ultimosperıdos, las dos funciones se aproximan, desde que el efecto de los valoresde inicializacion en cada caso, se disipa cuando la serie es larga.

Tabla 4.2: Comparacion de suavizamientos exponenciales, α = 0.01Primeros seis perıodos

t ewmaSmooth emaTA1 53077800.00 45234039.00

2 52808824.00 45043500.61

3 52651003.76 44963333.60

4 52417305.72 44806512.27

5 52320002.67 44785317.15

6 52479069.64 45019730.97

Ultimos seis perıodos

t ewmaSmooth emaTA244 40203989.16 39521844.26

245 40726832.27 40051508.82

246 40747464.95 40078894.73

247 40764693.30 40102808.78

248 40649668.37 39994402.69

249 40649127.68 40000414.67

La Figura 4.8 ilustra los suavizamientos ewmas.

2.0e

+07

6.0e

+07

1.0e

+08

EWMA con función ewmaSmooth

Time

dato

s

2000−09−27 2000−12−07 2001−02−21 2001−05−03 2001−07−16

α = 0.1α = 0.01

EWMA con función emaTA

Time

Vol

ume

2000−09−27 2000−12−09 2001−02−20 2001−05−04 2001−07−16 2001−09−27

2.0e

+07

6.0e

+07

1.0e

+08

α = 0.1α = 0.01

Figura 4.8: Serie volumen de acciones diarias negociadas de Microsoft (MSFT), suaviza-

mientos exponeciales simples.

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


4.2.6. Suavizamiento de Holt en R

En R se dispone de la funcion HoltWinters() .

HoltWinters(x, alpha = NULL, beta = NULL, gamma = NULL,...)

Para un suavizamiento de Holt la funcion se usa con el argumento gamma=FALSEy los otros dos argumentos ajustados en los valores de α y β deseados, o bi-en sin especificarlos. En este caso, la funcion busca valores optimos paraambos parametros, que minimicen el error cuadratico de prediccion un pasoadelante. Los valores iniciales para los suavizadores de nivel y tendencia sonrespectivamente, Y2 y Y2−Y1. Con los argumentos beta=FALSE y gamma=FALSE,la funcion tambien realiza un EWMA, con valor de inicio del suavizador iguala Y1.

La ventaja de esta funcion es que permite la obtencion de pronosticos y susintervalos de prediccion del 95 %:

predict(objeto, n.ahead=1, prediction.interval = TRUE, level = 0.95)

donde objeto es un objeto creado con la funcion HoltWinters , n.ahead=1indica la realizacion de una prediccion para el primer perıodo despues delultimo valor en la serie, por tanto, para mas predicciones basta ajustar elvalor de este argumento en el numero de predicciones deseadas.

Ejemplo:

De nuevo, considere la serie del volumen diario de acciones negociadas deMicrosoft. Vamos a realizar dos suavizamientos ewma con α = 0.01 y el otrocon el ajuste optimo de la funcion HoltWinters . Tambien se le aplicara dossuavizamientos de Holt, el primero con parametros α = 0.2, β = 0.1 y el segun-do con el ajuste automatico de la funcion. Observe en el siguiente codigo R laforma de especificar cada caso.

Codigo R 4.10.

##Suavizamiento exponencial simple con alfa=0.01ewma0.01=HoltWinters(datos,alpha=0.01,beta=FALSE,gamma=FALSE)

##Suavizamiento exponencial simple con alfa automaticoewma.optim=HoltWinters(datos,beta=FALSE,gamma=FALSE)

##Suavizamiento exponencial de Holt, alfa=0.2, beta=0.1Holt=HoltWinters(datos,alpha=0.2,beta=0.1,gamma=FALSE)

##Suavizamiento exponencial de Holt, alfa y beta automaticosHolt.optim=HoltWinters(datos,gamma=FALSE)

#Graficas de serie original con curvas suavizadasnf=layout(rbind(c(1,1,2,2),c(3,3,4,4)))plot(Holt,lwd=2,col.predicted="red",main=expression(paste("Holt",sep=" ",alpha==0.2,sep=" ",beta==0.1)))legend("topright",legend=c("Original","Suavizada"),col=c("black","red"),lty=1,lwd=2)

plot(Holt.optim,lwd=2,col.predicted="red",mai="Holt automatico")legend("topright",legend=c("Original","Suavizada"),col=c("black","red"),lty=1,lwd=2)

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


plot(ewma0.01,lwd=2,col.predicted="red",main=expression(paste("EWMA con Holt",SEP=" ",alpha==0.01)))legend("topright",legend=c("Original","Suavizada"),col=c("black","red"),lty=1,lwd=2)

plot(ewma.optim,lwd=2,col.predicted="red",main="EWMA con Holt automatico")legend("topright",legend=c("Original","Suavizada"),col=c("black","red"),lty=1,lwd=2)

En la Figura 4.9 observamos los resultados de estos suavizamientos.

Holt α = 0.2 β = 0.1

Time

Obs

erve

d / F

itted

0 50 100 150 200 250

−5e

+07

0e+

005e

+07

1e+

08

OriginalSuavizada

Holt automático

Time

Obs

erve

d / F

itted

0 50 100 150 200 250

0.0e

+00

4.0e

+07

8.0e

+07

1.2e

+08 Original

Suavizada

EWMA con Holt α = 0.01

Time

Obs

erve

d / F

itted

0 50 100 150 200 250

2.0e

+07

6.0e

+07

1.0e

+08

OriginalSuavizada

EWMA con Holt automático

Time

Obs

erve

d / F

itted

0 50 100 150 200 250

2.0e

+07

6.0e

+07

1.0e

+08

OriginalSuavizada

Figura 4.9: Serie volumen de acciones diarias negociadas de Microsoft (MSFT), suaviza-

mientos exponenciales.

Tambien es posible obtener graficos de residuales, si lo que se quiere eva-luar es el ajuste:

Codigo R 4.11.

#Graficas de residuales para suavizamientos con HolWinterswin.graph(width=14,height=17)nf=layout(rbind(c(1,1,2,2),c(3,3,4,4),c(5,5,6,6),c(7,7,8,8)))plot(residuals(Holt),lwd=2,main=expression(paste("Holt",sep=" ",alpha==0.2,sep=" ",beta==0.1)))abline(h=0,lty=2)

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


plot(fitted(Holt)[,"xhat"],residuals(Holt),lwd=2,main=expression(paste("Holt",sep=" ",alpha==0.2,sep=" ",beta==0.1)))abline(h=0,lty=2)

plot(residuals(Holt.optim),lwd=2,mai="Holt automatico")abline(h=0,lty=2)

plot(fitted(Holt.optim)[,"xhat"],residuals(Holt.optim),lwd=2,main="Holt automatico")abline(h=0,lty=2)

plot(residuals(ewma0.01),lwd=2,main=expression(paste("EWMA con Holt",SEP=" ",alpha==0.01)))abline(h=0,lty=2)

plot(fitted(ewma0.01)[,"xhat"],residuals(ewma0.01),lwd=2,main=expression(paste("EWMA con Holt",SEP=" ",alpha==0.01)))abline(h=0,lty=2)

plot(residuals(ewma.optim),lwd=2,main="EWMA con Holt automatico")abline(h=0,lty=2)

plot(fitted(ewma.optim)[,"xhat"],residuals(ewma.optim),lwd=2,main="EWMA con Holt automatico")abline(h=0,lty=2)

La grafica resultante de este codigo, corresponde a la Figura 4.10. Los coe-ficientes ajustados, con los cuales se construyen las ecuaciones de pronosticoen cada caso, se exhiben en la siguiente salida R. ¿En cuanto ajuste, cualsuavizamiento resulta mejor?

Salida R 4.3.

ewma0.01Holt-Winters exponential smoothing without trend and without seasonal component.

Call:HoltWinters(x = datos, alpha = 0.01, beta = FALSE, gamma = FALSE)

Smoothing parameters:alpha: 0.01beta : FALSEgamma: FALSE

Coefficients:[,1]

a 40649128

ewma.optimHolt-Winters exponential smoothing without trend and without seasonal component.

Call:HoltWinters(x = datos, beta = FALSE, gamma = FALSE)

Smoothing parameters:alpha: 0.2420161beta : FALSEgamma: FALSE

Coefficients:[,1]

a 46023427

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


HoltHolt-Winters exponential smoothing with trend and without seasonal component.

Call:HoltWinters(x = datos, alpha = 0.2, beta = 0.1, gamma = FALSE)

Smoothing parameters:alpha: 0.2beta : 0.1gamma: FALSE

Coefficients:[,1]

a 53067583.0b 773934.6

Holt.optimHolt-Winters exponential smoothing with trend and without seasonal component.

Call:HoltWinters(x = datos, gamma = FALSE)

Smoothing parameters:alpha: 0.6344256beta : 0.1368952gamma: FALSE

Coefficients:[,1]

a 38266887b -1488188

Los pronosticos para los siguientes cinco perıodos despues de t = 249 (el ultimoperıodo en la serie), pueden ser obtenidos en cada caso, usando la siguienteprogramacion R:

Codigo R 4.12.

#Cinco predicciones e intervalos de prediccion#con ewma de alfa=0.01predict1=predict(ewma0.01, n.ahead=5, prediction.interval = TRUE, level = 0.95)predict1

#con ewma automaticopredict2=predict(ewma.optim, n.ahead=5, prediction.interval = TRUE, level = 0.95)predict2

#con Holt, alfa=0.2, beta=0.1predict3=predict(Holt, n.ahead=5, prediction.interval = TRUE, level = 0.95)predict3

#con Holt automaticopredict4=predict(Holt.optim, n.ahead=5, prediction.interval = TRUE, level = 0.95)predict4

En las Tablas 4.3 y 4.4, se ilustran lso resultados obtenidos con la anteriorprogramacion. Se observa gran diferencia entre los pronosticos de los cua-tro suavizamientos. Tambien observe que para los suavizamientos EWMA elpronostico es un valor constante.

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


Tabla 4.3: Pronosticos para cinco perıodos adelante, metodos EWMA, funcion

HoltWintersPronosticos EWMA con α = 0.01

t fit upr lwr

250 40649127.68 71778309.81 9519945.56251 40649127.68 71779866.23 9518389.14252 40649127.68 71781422.57 9516832.80253 40649127.68 71782978.84 9515276.53254 40649127.68 71784535.02 9513720.35

Pronosticos EWMA con Holt automatico

t fit upr lwr

250 46023427.30 75798358.33 16248496.27251 46023427.30 76657936.51 15388918.09252 46023427.30 77494045.21 14552809.40253 46023427.30 78308507.88 13738346.73254 46023427.30 79102923.44 12943931.17

Tabla 4.4: Pronosticos para cinco perıodos adelante, metodos Holt, funcion HoltWinters

Pronosticos Holt con α = 0.2, β = 0.1t fit upr lwr

250 53841517.67 103089271.35 4593763.99251 54615452.31 105040919.67 4189984.94252 55389386.95 107181542.86 3597231.03253 56163321.58 109514802.19 2811840.98254 56937256.22 112041949.63 1832562.81

Pronosticos Holt automatico

t fit upr lwr

250 36778698.07 71039781.28 2517614.85251 35290509.61 77533719.06 -6952699.85252 33802321.14 84310461.34 -16705819.05253 32314132.68 91401189.46 -26772924.09254 30825944.22 98817273.92 -37165385.48

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


Holt α = 0.2 β = 0.1

Time

resi

dual

s(H

olt)

0 50 100 150 200 250

0e+

001e

+08

−4e+07 0e+00 2e+07 4e+07 6e+07

0e+

001e

+08

Holt α = 0.2 β = 0.1

fitted(Holt)[, "xhat"]

resi

dual

s(H

olt)

Holt automático

Time

resi

dual

s(H

olt.o

ptim

)

0 50 100 150 200 250

−4e

+07

4e+

07

0e+00 2e+07 4e+07 6e+07 8e+07 1e+08

−4e

+07

4e+

07

Holt automático

fitted(Holt.optim)[, "xhat"]re

sidu

als(

Hol

t.opt

im)


Time

resi

dual

s(ew

ma0

.01)

0 50 100 150 200 250

−2e

+07

4e+

07

4.0e+07 4.4e+07 4.8e+07 5.2e+07

−2e

+07

4e+

07


fitted(ewma0.01)[, "xhat"]

resi

dual

s(ew

ma0

.01)


Time

resi

dual

s(ew

ma.

optim

)

0 50 100 150 200 250

−2e

+07

4e+

07

2e+07 3e+07 4e+07 5e+07 6e+07 7e+07

−2e

+07

4e+

07


fitted(ewma.optim)[, "xhat"]

resi

dual

s(ew

ma.

optim

)

Figura 4.10: Residuales de los suavizamientos exponenciales para el volumen de acciones

diarias negociadas de Microsoft (MSFT).

4.2.7. Filtros de Henderson

Un tipo de filtros bastante usados en la estimacion de tendencias de se-ries de tiempo son los llamados filtros de Henderson, en los cuales los pesosson disenados intentando satisfacer dos caracterısticas esperadas en las ten-dencias: que la tendencia filtrada sea capaz de reproducir una variedad decurvaturas diferentes y que a la vez sean lo mas suave posible. la primeracondicion es satisfecha disenando el filtro de forma que la tendencia resul-tante siga un polinomio local cubico sin distorsion. la segunda condicion selogra a traves de la suavidez del patron de pesos usados. Estas dos condi-

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


ciones especifican un patron de ponderacion unico y por tanto, una unicamedia movil para cada longitud posible de filtro considerado. En la Tabla 4.5se observan los pesos de filtros Henderson simetricos para 2m+1 = 5, 7, 9, 13, 23.

Tabla 4.5: Vectores de pesos, Filtros simetricos de Henderson

w5 w7 w9 w13 w231 -0.07 -0.06 -0.04 -0.02 -0.002 0.29 0.06 -0.01 -0.03 -0.013 0.56 0.29 0.12 0.00 -0.024 0.29 0.41 0.27 0.07 -0.015 -0.07 0.29 0.33 0.15 -0.006 0.06 0.27 0.21 0.017 -0.06 0.12 0.24 0.048 -0.01 0.21 0.079 -0.04 0.15 0.10

10 0.07 0.1211 0.00 0.1412 -0.03 0.1513 -0.02 0.1414 0.1215 0.1016 0.0717 0.0418 0.0119 -0.0020 -0.0121 -0.0222 -0.0123 -0.00

En el siguiente codigo R, se aplican los filtros de Henderson a la serie delvolumen diario de acciones negociadas de Microsoft, usando los vectores depesos ilustrados en la Tabla 4.5:

Codigo R 4.13.

library(fTrading)datos=MSFT[,"Volume"]rownames(datos)=rownames(MSFT)t=1:length(datos)

#Definiendo los vectores de pesosw5=c(-0.073,0.294,0.558,0.294,-0.073)w7=c(-0.059,0.059,0.294,0.412,0.294,0.059,-0.059)

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ

4.3. EJERCICIOS 103

w9=c(-0.041,-0.010,0.119,0.267,0.330,0.267,0.119,-0.010,-0.041)w13=c(-0.019,-0.028,0.0,0.066,0.147,0.214,0.240,0.214,0.147,0.066,0.0,-0.028,-0.019)w23=c(-0.004,-0.011,-0.016,-0.015,-0.005,0.013,0.039,0.068,0.097,0.122,0.138,0.148,0.138,0.122,0.097,0.068,0.039,0.013,-0.005,-0.015,-0.016,-0.011,-0.004)

#Aplicando filtros y graficando resultados

nf=layout(rbind(c(1,1,2,2),c(3,3,4,4)))plot(t,datos,type=’l’,xaxt=’n’,xlab="Time",main="Henderson 5 terminos")axis(1,at=seq(1,length(datos),by=50),labels=time(datos)[seq(1,length(datos),by=50)])lines(t,filter(datos,w5,"convolution",2,F,NULL),col="red",lwd=2)

plot(t,datos,type=’l’,xaxt=’n’,xlab="Time",main="Henderson 9 terminos")axis(1,at=seq(1,length(datos),by=50),labels=time(datos)[seq(1,length(datos),by=50)])lines(t,filter(datos,w9,"convolution",2,F,NULL),col="darkgreen",lwd=2)

plot(t,datos,type=’l’,xaxt=’n’,xlab="Time",main="Henderson 13 terminos")axis(1,at=seq(1,length(datos),by=50),labels=time(datos)[seq(1,length(datos),by=50)])lines(t,filter(datos,w13,"convolution",2,F,NULL),col="blue",lwd=2)

plot(t,datos,type=’l’,xaxt=’n’,xlab="Time",main="Henderson 23 terminos")axis(1,at=seq(1,length(datos),by=50),labels=time(datos)[seq(1,length(datos),by=50)])lines(t,filter(datos,w23,"convolution",2,F,NULL),col="brown",lwd=2)

4.3. Ejercicios

Problema 1:

Usando la funcion HoltWinters() ajuste la tendencia para la serie EX-CHRATE.DAT y realice pronosticos para t = 621 a 625. Compare resultadosobtenidos con la regresion LOESS en este capıtulo.

Problema 2:

Considere de nuevo la serie EXCHRATE.DAT. Utilice filtros de Hendersonpara identificar la tendencia y posibles cambios estructurales.

Problema 3:

Para la serie del volumen diario de acciones negociadas de Microsoft, enobjeto MSFT de la librerıa R fTrading , ajuste la tendencia usando LOESS yrealice los pronosticos para t = 250 a 254. Compare con los resultados de lossuavizamientos exponenciales realizados en este capıtulo usando la funcionHoltWinters .ESTADÍS

TICA III

- 300

9137

NELFI G

ONZÁLEZ


2.0e

+07

6.0e

+07

1.0e

+08

Henderson 5 términos

Time

dato

s

2000−09−27 2001−02−21 2001−07−16

2.0e

+07

6.0e

+07

1.0e

+08


Time

dato

s

2000−09−27 2001−02−21 2001−07−16

2.0e

+07

6.0e

+07

1.0e

+08


Time

dato

s

2000−09−27 2001−02−21 2001−07−16

2.0e

+07

6.0e

+07

1.0e

+08


Time

dato

s

2000−09−27 2001−02−21 2001−07−16

Figura 4.11: Filtros de Henderson sobre el volumen de acciones diarias negociadas de

Microsoft (MSFT).ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ

Capıtulo 5

Modelacion de la componente estacional

En el Capıtulo 2 definimos la componente estacional St de una serie detiempo como aquel patron de cambio regular que se completa dentro de unano calendario y que se repite sobre una base anual. Diebold [3] establece quela estacionalidad surge cuando las tecnologıas, preferencias e instituciones seligan al calendario. Este patron es motivado a factores de consumo, climaticoso cualquier otro que ocurra con una periodicidad regular. Para observar estepatron es necesario una frecuencia de observacion inferior al ano, pues comovemos, es un patron de mediano plazo.

Al igual que con la tendencia, es posible clasificar la estacionalidad en de-terminıstica y estocastica. En este capıtulo consideraremos el primer caso.

5.1. Estacionalidad aditiva y multiplicativa

En la Seccion 2.7, vimos que una serie de componentes aditivas es de laforma dada en la ecuacion (2.1), donde las componentes de tendencia, esta-cionalidad y error se agregan aditivamente para conformar la serie. Por elcontrario, una serie de componentes multiplicativas es de la forma dada en laecuacion (2.2), lo cual implica que la variabilidad de la serie cambia (aumentao disminuye) con el tiempo.

Las funciones R decompose() y stl() permiten realizar la descomposi-cion de series aditivas y multiplicativas. Estas dos funciones se diferencian enque la primera usa medias moviles bilaterales para filtrar la tendencia, mien-tras que la segunda recurre a LOESS. Ver Apendice para mas detalles sobredecompose() y stl() y la Seccion 2.7 del Capıtulo 2 para aplicacion y otrasfunciones para el analisis de la tendencia y estacionalidad. Ambas descom-posiciones son utiles para una identificacion mas clara del tipo de modeloque puede ajustarse a la tendencia, al tiempo que se evalua la presencia depatrones perıodicos.

Nota: Es comun aplicar metodos de eliminacion o atenuacion de la compo-nente estacional de una serie con el fin de modelar las fluctuaciones no esta-cionales. Este procedimiento se denomina ajuste por estacionalidad de unaserie de tiempo y a la serie resultante se le llama serie ajustada estacional-

mente. Sin embargo, en el enfoque que se trabajara, el interes esta en modelar

105

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ

106 CAPITULO 5. MODELACION DE LA COMPONENTE ESTACIONAL

la serie con todas sus componentes.

5.2. Modelado de la estacionalidad por regresion

Para el ajuste por regresion lineal multiple, es necesario que el modelo sealineal en sus parametros, por tanto, solo se puede considerar un modelo deseries de tiempo de componentes aditivas, Yt = Tt + St + Et, ası, para ajus-tar series multiplicativas mediante regresion lineal, debemos trabajar sobre laserie transformada en aditiva usando la transformacion logarıtmica, es decir,consideraremos el ajuste por regresion de log(Yt) = T ∗

t + S∗t + E∗

t , y luego, me-diante la transformacion inversa se hallan los ajustes y pronosticos para laserie en la escala original, como ya fue visto en el caso de series de tendenciaexponencial.

5.2.1. Modelacion de la estacionalidad mediante variables indicadoras

Recuerde que una variable indicadora es una variable que toma valor de1 o 0 segun si cierto evento o caracterıstica se cumple en una observacionmuestral dada. Sea una componente estacional St de perıodo s, es decir, cadas perıodos se repite el patron estacional. Consideramos los siguientes casos

s = 6 Serie estacional bimestral;

s = 4 Serie estacional trimestral;

s = 12 Serie estacional mensual.

Sean las variables Ii,t, i = 1, 2, · · · , s, tales que

Ii,t =

{1 si en t la serie esta en la estacion i

0 si en t la serie no esta en la estacion i.(5.1)

Es decir, Ii,t es la variable indicadora de la estacion i. Por ejemplo, si n = 13 ys = 4, entonces

I1,t = {1, 0, 0, 0, 1, 0, 0, 0, 1, 0, 0, 0, 1}I2,t = {0, 1, 0, 0, 0, 1, 0, 0, 0, 1, 0, 0, 0}I3,t = {0, 0, 1, 0, 0, 0, 1, 0, 0, 0, 1, 0, 0}I4,t = {0, 0, 0, 1, 0, 0, 0, 1, 0, 0, 0, 1, 0}

Para determinar la estacion que corresponde a un tiempo t basta calcular lafuncion modulo de t en s, es decir MOD(t, s) que corresponde al residuo dela division de t entre s. Por ejemplo MOD(33, 12) = 9. En R esta operacion serealiza mediante el operador% %: 33 % %12. Entonces, podemos redefinir lasvariables indicadoras de la siguiente forma:

Ii,t =

{1 si MOD(t, s) = i

0 si MOD(t, s) 6= i,para i = 1, 2, · · · , s− 1 (5.2)

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ

5.2. MODELADO DE LA ESTACIONALIDAD POR REGRESION 107

Ii,t =

{1 si MOD(t, s) = 0

0 si MOD(t, s) 6= 0,para i = s (5.3)

Observe que St = St+ms, ∀ t ≥ 1, m ≥ 1, por la periodicidad del patron estacional,por lo tanto, solo se requiere definir s funciones del tiempo para representarel patron estacional. Tambien observe que para un tiempo t dado, solo una

de las s variables indicadoras puede tomar el valor de 1, de modo ques∑

i=1

Ii,t =

1, ∀ t ≥ 1.Sea δi, i = 1, 2, · · · , s el efecto de la estacion i, entonces podemos escribir

St = δ1I1,t + δ2I2,t + · · ·+ δsIs,t =s∑

i=1

δiIi,t. (5.4)

Para una serie con solo estacionalidad y componente aleatoria (componentesaditivas), el modelo a ajustar sera:

Yt = St + Et =

s∑

i=1

δiIi,t + Et, (5.5)

donde las variables explicatorias son dadas por las s variables indicadoras.Entonces, para una serie de longitud n = 20, y s = 4, tendrıamos, matricial-mente, el siguiente sistema de ecuaciones a resolver por mınimos cuadrados(los parametros a estimar corresponden a los δi):

Y1

Y2

Y3

Y4

Y5...Y15

Y16

Y17

Y18

Y19

Y20

=

1 0 0 00 1 0 00 0 1 00 0 0 11 0 0 0...

......

...0 0 1 00 0 0 11 0 0 00 1 0 00 0 1 00 0 0 1

δ1δ2δ3δ4

+

E1

E2

E3

E4

E5...E15

E16

E17

E18

E19

E20

= Yt = Xtβ + Et, (5.6)

donde el vector de parametros desconocidos es

β =

δ1δ2δ3δ4

,

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


y la solucion por mınimos cuadrados serıa β = (XTX)−1XTYt.

Ahora, suponga que ademas de la estacionalidad la serie presenta un pa-tron de tendencia (componentes aditivas). Por ejemplo, una tendencia lineal

(Tt = β0 + β1t) y estacionalidad trimestral (St =s∑

i=1

δiIi,t). En principio supodri-

amos que el modelo completo para la serie serıa:

Yt = Tt + St + Et = β0 + β1t+

s∑

i=1

δiIi,t + Et, (5.7)

entonces para una serie de longitud n = 20 tendrıamos como sistema de ecua-ciones, en forma matricial:

Y1

Y2

Y3

Y4

Y5...Y15

Y16

Y17

Y18

Y19

Y20

=

1 1 1 0 0 01 2 0 1 0 01 3 0 0 1 01 4 0 0 0 11 5 1 0 0 0...

......

......

...1 15 0 0 1 01 16 0 0 0 11 17 1 0 0 01 18 0 1 0 01 19 0 0 1 01 20 0 0 0 1

β0

β1

δ1δ2δ3δ4

+

E1

E2

E3

E4

E5...E15

E16

E17

E18

E19

E20

= Yt = Xtβ + Et, (5.8)

donde el vector de parametros desconocidos es

β =

β0

β1

δ1δ2δ3δ4

.

Pero, en el sistema de ecuaciones tendriamos una dependencia lineal perfectaentre la primera columna de la matriz X y las columnas 3 a 6, lo cual harıa que(XTX)−1 no exista y por tanto, no podriamos estimar el vector de coeficientes.Para solucionar este inconveniente, se tienen tres posibles alternativas:

1. Eliminar el intercepto β0 de la ecuacion del modelo:

Yt = β1t+

s∑

i=1

δiIi,t + Et (5.9)

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


En este caso, los δi representan el intercepto para la estacion i, respecti-vamente, obtenidos bajo el supuesto que la ecuacion en t de la tendenciaes la misma en todas las estaciones, ası la ecuacion de la serie representas curvas paralelas con diferentes interceptos. Para el ejemplo, tendrıamosque para la estacion i, Yt = δi + β1t+ Et, i = 1, 2, · · · , s.

2. Eliminar una de las variables indicadoras, por ejemplo, la de la ultimaestacion. en este caso el coeficiente δi i 6= s, representa el efecto o difer-encia promedio de la serie en la estacion i con relacion a la estacion s.Entonces, siguiendo el ejemplo, tendrıamos como modelo para la serie:

Yt = β0 + β1t+s−1∑

i=1

δiIi,t + Et (5.10)

3. Introducir la restriccions∑

i=1

δi = 0. Aqui, cada coeficiente δi representa el

efecto de la estacion i con respecto a la tendencia promedio de la serie:

Yt = β0 + β1t+

s∑

i=1

δiIi,t + Et con

s∑

i=1

δi = 0. (5.11)

De estas tres alternativas usaremos la segunda.

Ejemplo:

Considere la serie del ındice mensual de salario sector real industrial (sintrilla de cafe), de enero de 1990 a noviembre de 2001, previamente ilustrada enla Figura 2.2 del Capıtulo 2. Claramente la serie presenta un patron estacionalmensual y es de componentes aditivas. Para la tendencia vamos a suponer tresposibilidades: lineal, cuadratica, cubica:

Modelo 1: Yt = β0 + β1t+11∑i=1

δiIi,t + Et

Modelo 2: Yt = β0 + β1t+ β2t2 +

11∑i=1

δiIi,t + Et

Modelo 3: Yt = β0 + β1t+ β2t2 + β3t

3 +11∑i=1

δiIi,t + Et

En todos los casos, suponemos que los errores son normales de media cero yvarianza constante.

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


Codigo R 5.1.

salario<-scan()94.08 102.23 103.99 103.21 102.59 100.95101.67 101.71 99.93 100.11 99.65 89.8190.71 99.88 100.75 101.67 100.58 98.8298.21 98.96 99.30 98.40 99.17 91.1290.85 102.67 104.36 101.71 101.48 100.29100.33 102.24 101.24 102.02 103.79 95.9596.52 106.55 108.50 108.04 108.68 108.34108.14 109.75 108.28 108.76 109.36 101.03101.01 109.63 111.20 109.67 110.24 110.94110.38 111.50 111.73 112.94 113.87 107.39103.38 113.84 114.96 116.00 113.54 113.25113.35 114.88 113.81 116.03 117.50 109.50105.87 117.69 119.22 118.80 118.48 116.65116.54 117.03 116.04 116.87 118.60 108.91109.53 120.21 122.15 122.48 124.30 121.99122.20 121.41 120.69 122.72 124.70 115.65114.15 123.45 124.66 122.08 121.64 119.48120.02 122.33 121.50 122.45 123.63 115.43111.66 124.21 126.22 126.88 126.88 127.33127.27 128.88 128.54 130.28 132.15 124.65119.19 131.69 130.87 129.95 130.83 131.23132.64 133.50 132.98 134.38 135.12 130.16121.78 132.44 132.89 130.83 131.41 130.40131.79 132.46 131.00 132.46 133.61

salario<-ts(salario,frequency=12,start=c(1990,1))plot(salario)

t=1:length(salario)

#Definimos una variable categorica identificando los meses de enero a diciembre#al introducir esta variable en la funcion lm(), el programa internamente definira#las variables indicadoras de los meses

library(TSA)mes=season(salario)

#Designamos el mes de diciembre como el mes de referencia#esto eliminara la indicadora de diciembre en el ajuste

mes=relevel(mes,ref="December")

#Ajustamos los modelos

modelo1=lm(salario˜t+mes)modelo2=lm(salario˜t+I(tˆ2)+mes)modelo3=lm(salario˜t+I(tˆ2)+I(tˆ3)+mes)

Los resultados de los modelos ajustados son dados a continuacion

Salida R 5.1.

summary(modelo1)

Call:lm(formula = salario ˜ t + mes)


-4.4751 -1.6531 -0.1166 1.2784 6.8502

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ



(Intercept) 88.875205 0.766239 115.989 < 2e-16 ***t 0.267642 0.004645 57.624 < 2e-16 ***mesJanuary -1.913076 0.954731 -2.004 0.0472 *mesFebruary 8.299282 0.954629 8.694 1.31e-14 ***mesMarch 9.304973 0.954550 9.748 < 2e-16 ***mesApril 8.333163 0.954494 8.730 1.07e-14 ***mesMay 8.009688 0.954460 8.392 7.00e-14 ***mesJune 6.827045 0.954448 7.153 5.53e-11 ***mesJuly 6.798570 0.954460 7.123 6.46e-11 ***mesAugust 7.540094 0.954494 7.900 1.03e-12 ***mesSeptember 6.471618 0.954550 6.780 3.81e-10 ***mesOctober 7.235643 0.954629 7.580 5.79e-12 ***mesNovember 8.112167 0.954731 8.497 3.92e-14 ***---Signif. codes: 0 ’ *** ’ 0.001 ’ ** ’ 0.01 ’ * ’ 0.05 ’.’ 0.1 ’ ’ 1

Residual standard error: 2.287 on 130 degrees of freedomMultiple R-squared: 0.9659, Adjusted R-squared: 0.9627F-statistic: 306.7 on 12 and 130 DF, p-value: < 2.2e-16

summary(modelo2)

Call:lm(formula = salario ˜ t + I(tˆ2) + mes)


-4.4024 -1.8045 0.0749 1.4833 6.2052


(Intercept) 89.6070580 0.8941117 100.219 < 2e-16 ***t 0.2394942 0.0185735 12.894 < 2e-16 ***I(tˆ2) 0.0001955 0.0001249 1.565 0.1201mesJanuary -1.9719136 0.9502016 -2.075 0.0399 *mesFebruary 8.2422033 0.9500567 8.675 1.52e-14 ***mesMarch 9.2492626 0.9499449 9.737 < 2e-16 ***mesApril 8.2784309 0.9498655 8.715 1.22e-14 ***mesMay 7.9555416 0.9498181 8.376 7.97e-14 ***mesJune 6.7730948 0.9498023 7.131 6.35e-11 ***mesJuly 6.7444236 0.9498181 7.101 7.44e-11 ***mesAugust 7.4853615 0.9498655 7.880 1.19e-12 ***mesSeptember 6.4159084 0.9499449 6.754 4.44e-10 ***mesOctober 7.1785644 0.9500567 7.556 6.77e-12 ***mesNovember 8.0533295 0.9502016 8.475 4.61e-14 ***---Signif. codes: 0 ’ *** ’ 0.001 ’ ** ’ 0.01 ’ * ’ 0.05 ’.’ 0.1 ’ ’ 1


summary(modelo3)

Call:lm(formula = salario ˜ t + I(tˆ2) + I(tˆ3) + mes)


-5.2024 -1.4414 0.1069 1.4619 6.0381

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ



(Intercept) 9.197e+01 9.603e-01 95.775 < 2e-16 ***t 4.655e-02 4.351e-02 1.070 0.2867I(tˆ2) 3.530e-03 7.008e-04 5.038 1.57e-06 ***I(tˆ3) -1.544e-05 3.200e-06 -4.825 3.92e-06 ***mesJanuary -2.135e+00 8.781e-01 -2.432 0.0164 *mesFebruary 8.112e+00 8.777e-01 9.242 6.80e-16 ***mesMarch 9.152e+00 8.774e-01 10.430 < 2e-16 ***mesApril 8.214e+00 8.772e-01 9.363 3.45e-16 ***mesMay 7.923e+00 8.771e-01 9.033 2.19e-15 ***mesJune 6.773e+00 8.771e-01 7.722 2.88e-12 ***mesJuly 6.777e+00 8.771e-01 7.726 2.82e-12 ***mesAugust 7.550e+00 8.772e-01 8.607 2.34e-14 ***mesSeptember 6.513e+00 8.774e-01 7.423 1.41e-11 ***mesOctober 7.309e+00 8.777e-01 8.327 1.09e-13 ***mesNovember 8.217e+00 8.781e-01 9.357 3.56e-16 ***---Signif. codes: 0 ’ *** ’ 0.001 ’ ** ’ 0.01 ’ * ’ 0.05 ’.’ 0.1 ’ ’ 1


Los graficos de residuales de los tres modelos son obtenidos mediante el sigu-iente codigo R y en la Figura 5.1 se ilustra el resultado.

Codigo R 5.2.

nf=layout(rbind(c(1,1,2,2),c(3,3,4,4),c(5,5,6,6)))plot.ts(residuals(modelo1),lwd=2)abline(h=0,lty=2)plot(fitted(modelo1),residuals(modelo1))abline(h=0,lty=2)

plot.ts(residuals(modelo2),lwd=2)abline(h=0,lty=2)plot(fitted(modelo2),residuals(modelo2))abline(h=0,lty=2)

plot.ts(residuals(modelo3),lwd=2)abline(h=0,lty=2)plot(fitted(modelo3),residuals(modelo3))abline(h=0,lty=2)

La serie original y las series ajustadas son presentadas en la Figura 5.2,obtenida con el codigo R siguiente:

Codigo R 5.3.

nf=layout(rbind(c(1,1,2,2),c(0,3,3,0)))plot(t,salario,type=’l’,lwd=1.5)lines(t,fitted(modelo1),lwd=2,col="red")legend("topleft",legend=c("Original","modelo1"),col=c(1,2),lwd=2)

plot(t,salario,type=’l’,lwd=1.5)lines(t,fitted(modelo2),lwd=2,col="red")legend("topleft",legend=c("Original","modelo2"),col=c(1,2),lwd=2)

plot(t,salario,type=’l’,lwd=1.5)lines(t,fitted(modelo3),lwd=2,col="red")legend("topleft",legend=c("Original","modelo3"),col=c(1,2),lwd=2)

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


Time

resi

dual

s(m

odel

o1)

0 20 40 60 80 100 120 140−

40

24

690 100 110 120 130

−4

02

46

fitted(modelo1)

resi

dual

s(m

odel

o1)

Time

resi

dual

s(m

odel

o2)

0 20 40 60 80 100 120 140

−4

02

46

90 100 110 120 130

−4

02

46

fitted(modelo2)

resi

dual

s(m

odel

o2)

Time

resi

dual

s(m

odel

o3)

0 20 40 60 80 100 120 140

−4

02

46

90 100 110 120 130

−4

02

46

fitted(modelo3)

resi

dual

s(m

odel

o3)

Figura 5.1: Graficos de residuales de los tres modelos ajustados a la serie de salario.

0 20 40 60 80 100 120 140

9010

011

012

013

0

t

sala

rio

Originalmodelo1

0 20 40 60 80 100 120 140

9010

011

012

013

0

t

sala

rio

Originalmodelo2

0 20 40 60 80 100 120 140

9010

011

012

013

0

t

sala

rio

Originalmodelo3

Figura 5.2: Graficos de la serie real y ajustada segun los tres modelos considerados para

la serie de salario.

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


Compare el ajuste de los tres modelos mediante el AIC y BIC:

Codigo R 5.4.

#Calculo de AIC y BIC para los tres modelos

AICS=c(AIC(modelo1),AIC(modelo2),AIC(modelo3))log.n=log(length(salario))BICS=c(AIC(modelo1,k=log.n),AIC(modelo2,k=log.n),AIC(modelo3,k=log.n))

criterios = rbind(AICS, BICS)colnames(criterios) = c("lineal","cuadratico","cubico")rownames(criterios) = c("AIC","BIC")

Salida R 5.2.

(criterios)lineal cuadratico cubico

AIC 656.7182 656.0298 634.1352BIC 698.1981 700.4725 681.5407

Parece que el mejor ajuste es logrado por el modelo de tendencia cubica.

5.2.2. Modelacion de la estacionalidad mediante funciones trigonometri-cas

Con las variables indicadoras, un parametros es usado para representarcada estacion ano tras ano. Sin embargo, los efectos estacionales pueden vari-ar levemente de ano a ano, de modo que resulta mas conveniente usar unafucion suave en lugar de ındices separados para cada estacion. Las funcionesseno y coseno son utiles para representar las variaciones suaves en un modeloestacional.

Recordemos que una onda armonica sinusoidal de frecuencia F (o perıodoT = 1/F ), amplitud A y fase φ, describe un ciclo repetitivo de la forma

A sin(2πFt+ φ) = α sin(2πFt) + γ cos(2πFt) (5.12)

con α = A cosφ y γ = A sinφ. La expresion del lado derecho de la ecuacion an-terior es la que se utiliza en un modelo de regresion para representar la esta-cionalidad mediante funciones trigonometricas, con t variando en los enteros.En general, las funciones seno y coseno sirven para generar series estacionalespuras.

Sea Yt una serie con componente de tendencia Tt (incluyendo el terminoconstante β0) y componente estacional aditiva St de perıodo s. Entonces existenk = [s/2] ciclos posibles, donde [s/2] representa la parte entera de s/2. Unmodelo estacional para Yt es

Yt = Tt +k∑

j=1

[αj sin

(2πjt

s

)+ γj cos

(2πjt

s

)]+ Et (5.13)

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


Para s par, en el valor j = s/2 la funcion seno sera igual a cero para todo t ∈ Z,luego, podemo eliminar tal termino del modelo. Por ejemplo, considere unaserie de tendencia lineal y estacionalidad trimestral (s = 4) aditiva, entonces,k = s/2 = 2 y tenemos de la ecuacion (5.13):

Yt = β0 + β1t+ α1 sin

(πt

2

)+ γ1 cos

(πt

2

)+ γ2 cos (πt) + Et, (5.14)

desde que sin (πt) = 0 ∀ t ∈ Z. Si la estacionalidad es mensual, tendriamos que:

Yt = β0 + β1t+ α1 sin

(πt

6

)+ γ1 cos

(πt

6

)+ α2 sin

(πt

3

)+ γ2 cos

(πt

3

)

+ α3 sin

(πt

2

)+ γ3 cos

(πt

2

)+ α4 sin

(2πt

3

)+ γ4 cos

(2πt

3

)

+ α5 sin

(5πt

6

)+ γ5 cos

(5πt

6

)+ γ6 cos(πt) + Et. (5.15)

Observe que al igual al modelo con variables indicadoras, se usan aquı s − 1funciones para representar la componente estacional, cada una definiendouna variable explicatoria en el modelo de regresion.

Ejemplo:

Considere de nuevo la serie del ındice de salario real. Vamos a ajustarlos tres modelos (con tendencia lineal, cuadratica y cubica) antes considera-dos pero usando para la estacionalidad, funciones trigonometricas. El modelode tendencia lineal corresponde a la ecuacion en (5.15), los demas adicio-nan el termino cuadratico y cubico. Para las 11 funciones trigonometricasen (5.15), definimos respectivamente en R, las variables sen1, cos1, sen2,cos2, sen3, cos3, sen4, cos4, sen5, cos5, cos6 :

Codigo R 5.5.

#Definiendo variables trigonometricassen1=sin(pi * t/6)cos1=cos(pi * t/6)sen2=sin(pi * t/3)cos2=cos(pi * t/3)sen3=sin(pi * t/2)cos3=cos(pi * t/2)sen4=sin(2 * pi * t/3)cos4=cos(2 * pi * t/3)sen5=sin(5 * pi * t/6)cos5=cos(5 * pi * t/6)cos6=cos(pi * t)

#Ajuste con variables trigonometricasmodelo1b=lm(salario˜t+sen1+cos1+sen2+cos2+sen3+cos3+sen4+cos4+sen5+cos5+cos6)modelo2b=lm(salario˜t+I(tˆ2)+sen1+cos1+sen2+cos2+sen3+cos3+sen4+cos4+sen5+cos5+cos6)modelo3b=lm(salario˜t+I(tˆ2)+I(tˆ3)+sen1+cos1+sen2+cos2+sen3+cos3+sen4+cos4+sen5+cos5+cos6)

summary(modelo1b)

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


summary(modelo2b)summary(modelo3b)

#Graficos de residualesnf=layout(rbind(c(1,1,2,2),c(3,3,4,4),c(5,5,6,6)))plot.ts(residuals(modelo1b),lwd=2)abline(h=0,lty=2)plot(fitted(modelo1b),residuals(modelo1b))abline(h=0,lty=2)

plot.ts(residuals(modelo2b),lwd=2)abline(h=0,lty=2)plot(fitted(modelo2b),residuals(modelo2b))abline(h=0,lty=2)

plot.ts(residuals(modelo3b),lwd=2)abline(h=0,lty=2)plot(fitted(modelo3b),residuals(modelo3b))abline(h=0,lty=2)

#Graficos series ajustadasnf=layout(rbind(c(1,1,2,2),c(0,3,3,0)))plot(t,salario,type=’l’,lwd=1.5)lines(t,fitted(modelo1b),lwd=2,col="red")legend("topleft",legend=c("Original","modelo1b"),col=c(1,2),lwd=2)

plot(t,salario,type=’l’,lwd=1.5)lines(t,fitted(modelo2b),lwd=2,col="red")legend("topleft",legend=c("Original","modelo2b"),col=c(1,2),lwd=2)

plot(t,salario,type=’l’,lwd=1.5)lines(t,fitted(modelo3b),lwd=2,col="red")legend("topleft",legend=c("Original","modelo3b"),col=c(1,2),lwd=2)

#Calculo de AIC y BIC para los tres modelos con variables trigonometricas

AICSb=c(AIC(modelo1b),AIC(modelo2b),AIC(modelo3b))log.n=log(length(salario))BICSb=c(AIC(modelo1b,k=log.n),AIC(modelo2b,k=log.n),AIC(modelo3b,k=log.n))

criteriosb = rbind(AICSb, BICSb)colnames(criteriosb) = c("lineal","cuadratico","cubico")rownames(criteriosb) = c("AIC","BIC")

#Tabla de valores AIC y BIC(criteriosb)

Los resultados numericos y graficos se presentan a continuacion. Comparecon los obtenidos usando indicadoras para la estacionalidad. Basicamenteambas metodologıas dan los mismos resultados con cada modelo, excepto quelos coeficientes del intercepto y los asociados a la estacionalidad no tienen elmismo significado, pero al detallar la ecuacion de la serie en cada estacion,se llega al mismo resultado, en los modelos de tendencia lineal, cuadratica ycubica, respectivamente.

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


modelo1b: Tendencia lineal

Estimate Std. Error t value Pr(>|t|)(Intercept) 95.1268 0.3852 246.92 0.0000

t 0.2676 0.0046 57.62 0.0000

sen1 0.0057 0.2700 0.02 0.9832

cos1 -2.4087 0.2715 -8.87 0.0000

sen2 -1.5828 0.2696 -5.87 0.0000

cos2 -2.3583 0.2715 -8.69 0.0000

sen3 -1.9412 0.2695 -7.20 0.0000

cos3 -1.0815 0.2715 -3.98 0.0001

sen4 -1.6609 0.2695 -6.16 0.0000

cos4 -0.6007 0.2715 -2.21 0.0287

sen5 -0.5303 0.2695 -1.97 0.0512

cos5 0.0766 0.2715 0.28 0.7783

cos6 0.1209 0.1913 0.63 0.5283

modelo2b: Tendencia cuadratica


t 0.2395 0.0186 12.89 0.0000

I(tˆ 2) 0.0002 0.0001 1.56 0.1201

sen1 0.0057 0.2685 0.02 0.9831

cos1 -2.4014 0.2700 -8.89 0.0000

sen2 -1.5828 0.2681 -5.90 0.0000

cos2 -2.3489 0.2701 -8.70 0.0000

sen3 -1.9412 0.2680 -7.24 0.0000

cos3 -1.0717 0.2701 -3.97 0.0001

sen4 -1.6609 0.2680 -6.20 0.0000

cos4 -0.5908 0.2701 -2.19 0.0305

sen5 -0.5303 0.2680 -1.98 0.0500

cos5 0.0865 0.2701 0.32 0.7491

cos6 0.1259 0.1902 0.66 0.5092

modelo3b: Tendencia cubica


t 0.0466 0.0435 1.07 0.2867

I(tˆ 2) 0.0035 0.0007 5.04 0.0000

I(tˆ 3) -0.0000 0.0000 -4.82 0.0000

sen1 -0.1156 0.2492 -0.46 0.6435

cos1 -2.4014 0.2494 -9.63 0.0000

sen2 -1.6395 0.2479 -6.61 0.0000

cos2 -2.3489 0.2494 -9.42 0.0000

sen3 -1.9741 0.2476 -7.97 0.0000

cos3 -1.0717 0.2494 -4.30 0.0000

sen4 -1.6798 0.2475 -6.79 0.0000

cos4 -0.5908 0.2494 -2.37 0.0193

sen5 -0.5391 0.2475 -2.18 0.0312

cos5 0.0865 0.2494 0.35 0.7291

cos6 0.1259 0.1757 0.72 0.4748

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


AIC´s y BIC’s modelos con

funciones trigonometricas

lineal cuadratico cubico

AIC 656.72 656.03 634.14

BIC 698.20 700.47 681.54

Time

resi

dual

s(m

odel

o1b)

0 20 40 60 80 100 120 140

−4

02

46

90 100 110 120 130

−4

02

46

fitted(modelo1b)re

sidu

als(

mod

elo1

b)

Time

resi

dual

s(m

odel

o2b)

0 20 40 60 80 100 120 140

−4

02

46

90 100 110 120 130

−4

02

46

fitted(modelo2b)

resi

dual

s(m

odel

o2b)

Time

resi

dual

s(m

odel

o3b)

0 20 40 60 80 100 120 140

−4

02

46

90 100 110 120 130

−4

02

46

fitted(modelo3b)

resi

dual

s(m

odel

o3b)

Figura 5.3: Graficos de residuales de los tres modelos ajustados a la serie de salario, con

funciones trigonometricas.

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


0 20 40 60 80 100 120 140

9010

011

012

013

0

t

sala

rio

Originalmodelo1b

0 20 40 60 80 100 120 140

9010

011

012

013

0

t

sala

rio

Originalmodelo2b

0 20 40 60 80 100 120 140

9010

011

012

013

0

t

sala

rio

Originalmodelo3b

Figura 5.4: Graficos de la serie real y ajustada segun los tres modelos considerados para

la serie de salario, con funciones trigonometricas.ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


5.3. Evaluacion de la estabilidad de los modelos de pronosti-

co

Cuando utilizamos un modelo de regresion para el ajuste de una serie detiempo, asumimos que las relaciones establecidas por tal modelo son establesa lo largo del tiempo, esto es, que los parametros del modelo no cambian.Sin embargo, como lo establece Diebold [3], las relaciones comerciales, indus-triales y economicas pueden variar por lo que es necesario evaluar e identi-ficar los parametros del modelo que son variables en el tiempo, en particular,cuando este contiene una componente estacional, ya que esta puede no serconstante debido a que evoluciona con el paso del tiempo.

Para evaluar la estabilidad de un modelo, existe la metodologıa denomina-da estimacion recursiva y la evaluacion de residuales recursivos. Considere elsiguiente modelo de regresion

Yt = xttβt + Et, t = 1, · · · , n, (5.16)

donde, para el tiempo t, Yt es la observacion de la variable dependiente, xt

es el vector de observaciones en p + 1 regresores no aleatorios (p variablesexplicatorias y la columna de unos de la matriz de diseno), con x1t = 1 ∀ t (aso-ciado al termino constante o intercepto del modelo), y el vector de parametrosβt = {β0,t, β1,t, · · · , βp,t} escrito con el subındice t para indicar que puede variarcon el tiempo. Asumimos que los terminos de error Et son independientes,distribuıdos normales con media cero y varianza constante. Queremos probarque

H0 : βt = β, t = 1, · · · , n, (5.17)

esto es, que el vector de parametros no cambia con t (por lo menos dentro dela muestra de tamano n). Para probar esta hipotesis se procede a estimar enforma recursiva el modelo de regresion estandar: Yt = xt

tβ + Et, t = 1, · · · , m,con k ≤ m ≤ n, y k > p + 1, es decir, en lugar de usar toda la muestra, seutiliza un subconjunto menor de las observaciones, respetando la secuenciatemporal de los datos. Entonces,

1. iniciamos haciendo la regresion con las m = k primeras observaciones,k > p+ 1, de lo cual obtenemos el vector de parametros estimados βk.

2. A continuacion repetimos la estimacion con las m = k+1 primeras obser-vaciones, obteniendo el vector de parametros estimados βk+1.

3. Continuamos con la estimacion con los demas valores de m = k+2, · · · , n.

4. Con los anterior obtenemos para cada uno de los parametros del modelouna sucesion de valores estimados, {βi,k, βi,k+1, · · · , βi,n}, i = 0, · · · , p queconstituyen los estimadores recursivos de los parametros.

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ

5.3. EVALUACION DE LA ESTABILIDAD DE LOS MODELOS DE PRONOSTICO121

En cada m = k, k + 1, · · · , n − 1 podemos calcular un error de pronostico aun paso adelante, es decir, con los parametros ajustados con los m primerosdatos, construimos el pronostico para Ym+1, Ym+1 = xt

m+1βm, de donde el errorde pronostico es

em+1,m = Ym+1 − Ym+1 = Ym+1 − xtm+1βm, (5.18)

estos son denominados los residuales recursivos. Se prefiere trabajar con laversion estandarizada de estos residuales: Sea

βm = (XmtXm)−1Xt

mYm

el estimador de mınimos cuadrados del vector de parametros basado en lasprimeras m observaciones, con Yt

m = [Y1, · · · , Ym] (el vector respuesta con lasm primeras observaciones), Xt

m = [x1, · · · ,xm] (la matrix de diseno con las mprimeras observaciones); asumimos que (Xm

tXm)−1 existe y que la varianzadel modelo es constante. Entonces, la varianza de em+1,m es

VAR(em+1,m) = σ2[1 + xtm+1(Xm

tXm)−1xm+1] (5.19)

Entonces, los residuales recursivo estandarizados corresponden a

wm+1,m =em+1,m√

VAR(em+1,m). (5.20)

Se ha mostrado que bajo H0, y el supuesto de normalidad, wm+1,m son variablesaleatorias normales independientes e identicamente distribuidos, con mediacero y varianza unitaria.

Nota: Desde que σ2 es desconocido, se estima como la varianza del modelode regresion ajustado con todos los datos, entonces consideramos a

wm+1,m =em+1,m√

VAR(em+1,m)

. (5.21)

La suma acumulada de los residuales recursivos estandarizados tiene utilidadespecial para evaluar la estabilidad de los parametros del modelo de regresionusando el siguiente estadıstico:

CUSUMt =

t∑

m=k

wm+1,m, para t = k, · · · , n− 1 (5.22)

para este estadıstico se tiene que bajo los supuestos de normalidad, indepen-dencia y estabilidad del vector de parametros a lo largo del tiempo, E[CUSUMt] =0, VAR(CUSUMt) = t− p− 1.

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


Los valores crıticos para el estadıstico CUSUMt son

±a[√

n− p− 1 + 2t− p− 1√n− p− 1

](5.23)

donde a = 1.143 para un nivel de significancia α = 0.01; a = 0.948 para α = 0.05 ya = 0.850 para α = 0.1. En la practica, se grafica la serie del estadıstico CUSUMt

versus t, junto con las rectas definidas por los dos lımites crıticos en (5.23).Si βt es constante hasta un tiempo t = t0, entonces los estadısticos CUSUMt

tendran media cero hasta ese tiempo y en general tendran medias no nulasubsecuentemente, luego la hipotesis de estabilidad es rechazada cuando seobserve un corte de los lımites crıticos para la serie de CUSUMt.

Nota: Con el test CUSUM se prueba la hipotesis nula H0 : βt = β, t = 1, · · · , n,probando que E[CUSUMt] = 0, t = 1, · · · , n,.5.3.1. Ejemplo 1:

Considere la serie mensual representada en la Figura 5.5, la cual fue sim-ulada bajo el modelo Yt = 3500 + 200t + Et, Et ∼ N(0, (4000)2), con n = 300observaciones.

Serie simulada Yt = 3500 + 200t + Et

Time

yt

1980 1985 1990 1995 2000 2005

010

000

2000

030

000

4000

050

000

6000

070

000

Figura 5.5: Grafico de 300 observaciones de la serie simulada Yt = 3500 + 200t + Et, Et ∼N(0, (4000)2).

Es claro que el mejor modelo para esta serie es el de tendencia lineal sinestacionalidad, La siguiente tabla resume los resultados del ajuste:

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


Parametros estimados (con todos los datos)


t 201.6341 2.6525 76.02 0.0000

Para el analisis de la estabilidad de los parametros (intercepto y pendienteen este caso), aplicamos el siguiente codigo R:

Codigo R 5.6.

yt=scan(file.choose()) #leer archivo datossimuleje1recursivos.txtyt=ts(yt,freq=12,start=c(1980,1))

t=1:length(yt)

regresion=lm(yt˜t)

#Funcion para realizar las regresiones recursivas#esta funcion debe ser personalizada segun el modelo de la serie

estim=function(n){modelo=lm(yt[1:n]˜t[1:n])resul=cbind(coef(modelo),confint(modelo))resul}

#Definiendo los tamanos de muestras para las regresiones recursivas#desde n=p+1=3, hasta la longitud de la serie

n=matrix(3:length(yt),ncol=1)

#Realizando las regresiones recursivas;#el primer numero en el argumento dim=c(2,3,nrow(n)) corresponde a p+1=2

b=array(apply(n,1,estim),dim=c(2,3,nrow(n)))

#Extrayendo informacion de los interceptos: fila1: estimacion, fila2:LI, fila3:LSbetas0=b[1,,]

#Extrayendo informacion de la pendiente: fila1: estimacion, fila2:LI, fila3:LSbetas1=b[2,,]

#Graficando los beta0 y sus I.C del 95%matplot(n,t(betas0),type=’l’,lty=c(1,2,2),col=1,lwd=1.5,ylab=expression(hat(beta)[0]))abline(h=3500,lty=1,col=2,lwd=2)legend("topright",legend=expression(beta[0]==3500),lwd=2,col=2)

#Graficando los beta1 y sus I.C del 95%matplot(n,t(betas1),ylim=c(-500,500),type=’l’,lty=c(1,2,2),col=1,lwd=1.5,ylab=expression(hat(beta)[1]))abline(h=200,lty=1,col=2,lwd=2)legend("topright",legend=expression(beta[1]==200),lwd=2,col=2)

#Obtencion de residuales recursivos y graficos CUSUMtlibrary(strucchange)rr=recresid(regresion)

nf=layout(rbind(c(1,1),c(2,2)))plot(rr, type = "l",ylab="Residuales recursivos",xlab="t")abline(h=0,col=2,lwd=2)

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


plot(efp(yt˜t, type = "Rec-CUSUM"),lwd=2)

#Test CUSUM recursivo para cambio estructuralsctest(yt˜t)

La ultima lınea del codigo anterior produce un test para probar la estabili-dad del modelo, sus resultados son:

Test CUSUM recursivo

Estadıstico ValorP Metodo

S 0.35 0.92 Recursive CUSUM test

Esta prueba nos dice que no hay cambios estructurales en el modelo, locual tambien es visto a traves de las siguientes graficas, obtenidas con elcodigo R dado:

0 50 100 150 200 250 300

−10

000

010

000

2000

0

n

β 0

β0 = 3500

Figura 5.6: Grafico de interceptos estimados recursivamente, para serie simulada Yt =3500 + 200t + Et, Et ∼ N(0, (4000)2).

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


0 50 100 150 200 250 300

−40

0−

200

020

040

0

n

β 1

β1 = 200

Figura 5.7: Grafico de pendientes estimadas recursivamente, para serie simulada Yt =3500 + 200t + Et, Et ∼ N(0, (4000)2).

0 50 100 150 200 250 300

−10

000

050

00

t

Res

idua

les

recu

rsiv

os

Recursive CUSUM test

Time

Em

piric

al fl

uctu

atio

n pr

oces

s

1980 1985 1990 1995 2000 2005

−3

−2

−1

01

23

Figura 5.8: Grafico residuales recursivos y CUSUMt para la serie simulada Yt = 3500 +200t + Et, Et ∼ N(0, (4000)2).

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


5.3.2. Ejemplo 2:

Considere ahora la serie mensual representada en la Figura 5.9, la cualfue simulada bajo el modelo Yt = 18500 + 50t + Et, para 1 ≤ t ≤ 150, Yt =18500 + 200t+ Et, para 151 ≤ t ≤ 300, Et ∼ N(0, (4000)2).

Serie simulada Yt = 18500 + 50t + Et t ≤ 150, Yt = 18500 + 200t + Et t > 150

Time

yt2

1980 1985 1990 1995 2000 2005

2000

040

000

6000

080

000

Figura 5.9: Grafico de 300 observaciones de la serie simulada Yt = 18500 + 50t + Et, para

1 ≤ t ≤ 150, Yt = 18500 + 200t + Et, para 151 ≤ t ≤ 300, Et ∼ N(0, (4000)2).

Es claro que en este caso existe un punto de ruptura o cambio del modelo,en t = 150. Esta situacion se ve reflejada claramente tanto en el test CUSUM re-cursivo para estabilidad, como en las graficas del procedimiento de estimacionrecursiva (la programacion R usada es muy similar a la dada en el Codigo R5.6).



t 238.8314 5.1236 46.61 0.0000




ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


0 50 100 150 200 250 300

−20

000

020

000

4000

060

000

n

β 0 β0 = 18500

Figura 5.10: Grafico de interceptos estimados recursivamente, para serie simulada Yt =18500 + 50t + Et, para 1 ≤ t ≤ 150, Yt = 18500 + 200t + Et, para 151 ≤ t ≤ 300,

Et ∼ N(0, (4000)2).

0 50 100 150 200 250 300

−40

0−

200

020

0

n

β 1

β1 = 50

Figura 5.11: Grafico de pendientes estimadas recursivamente, para serie simulada Yt =18500 + 50t + Et, para 1 ≤ t ≤ 150, Yt = 18500 + 200t + Et, para 151 ≤ t ≤ 300,

Et ∼ N(0, (4000)2).

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


0 50 100 150 200 250 300

−10

000

010

000

2000

0

t

Res

idua

les

recu

rsiv

os


Time

Em

piric

al fl

uctu

atio

n pr

oces

s

1980 1985 1990 1995 2000 2005

−2

02

46

8

Figura 5.12: Grafico residuales recursivos y CUSUMt para la serie simulada Yt = 18500 +50t + Et, para 1 ≤ t ≤ 150, Yt = 18500 + 200t + Et, para 151 ≤ t ≤ 300, Et ∼N(0, (4000)2).

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


5.3.3. Ejemplo: Ajuste de una serie estacional multiplicativa

Considere la serie de la produccion trimestral de cemento portland, enmiles de toneladas, periodo: Q1:56-Q3:94 (los datos aparecen en la progr-macion R) que se ilustra en la Figura 5.13. Claramente, la serie es estacional(la frecuencia es s = 4) de componentes multiplicativas ya que su variabilidadincrementa con la tendencia creciente. Para la serie del logaritmo observa-mos una mejora en cuanto a la varianza, sin embargo parece que aun hayproblemas.

Producción trimestral cemento portland Miles de ton. Q11956−Q31994

Time

yt

1960 1970 1980 1990

500

1000

1500

2000

Log de producción trimestral cemento portlandQ11956−Q31994

Time

lnyt

1960 1970 1980 1990

6.5

7.0

7.5

Figura 5.13: Grafico serie de produccion trimestral de cemento portland y de su logaritmo

Modelaremos la serie de los logartimos. Para una mejor identificacion desu tendencia procedemos con la descomposicion stl, presentada en la Figura5.14. Aparentemente, la tendencia puede ser modelada por un polinomio degrado 2 en t. Ajustamos entonces un modelo de tendencia cuadratica y esta-cionalidad trimestral usando variables indicadoras: log(Yt) = β0 + β1t + β2t

2 +3∑

i=1

δiIi,t +Et, Et ∼ N(0, σ2). Los resultados de este ajuste se presentan a contin-

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


uacion:



t 0.0150 0.0005 28.14 0.0000I(tˆ 2) -0.0001 0.0000 -15.91 0.0000

trimestre1Q -0.1343 0.0168 -8.01 0.0000trimestre2Q -0.0191 0.0168 -1.14 0.2554trimestre3Q 0.0168 0.0168 1.00 0.3168

Log de Producción trimestral cemento portlandQ11956−Q31994

6.5

7.0

7.5

data

−0.

10−

0.05

0.00

0.05

seas

onal

6.2

6.6

7.0

7.4

tren

d

−0.

06−

0.02

0.02

1960 1970 1980 1990

rem

aind

er

time

Figura 5.14: Descomposicion stl de la serie de logaritmos de la produccion trimestral ce-

mento portland.

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


Los graficos de los residuales del modelo ajustado son presentados en laFigura 5.15 ¿Que podemos concluir de las dos graficas de residuales?

0 50 100 150

−0.

2−

0.1

0.0

0.1

0.2

t

resi

dual

s(m

odel

o1)

6.2 6.4 6.6 6.8 7.0 7.2 7.4

−0.

2−

0.1

0.0

0.1

0.2

fitted(modelo1)

resi

dual

s(m

odel

o1)

Figura 5.15: Residuales ajuste de la serie de logaritmos de la produccion trimestral ce-

mento portland.

Para el analisis de la estabilidad del modelo, considere las Figuras 5.16,5.17, y 5.18 y los resultados del test CUSUM recursivo:




¿Que conclusiones extraemos de estos resultados?

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


50 100 150

6.05

6.10

6.15

6.20

6.25

6.30

6.35

n

β 0

con todos los datos β0 = 6.318034

50 100 150

0.02

0.04

0.06

0.08

0.10

n

β 1con todos los datos, β1 = 0.01495135

50 100 150

−1e

−03

−5e

−04

0e+

005e

−04

n

β 2

con todos los datos, β2 = − 5.248589e−05

Figura 5.16: Estimacion recursiva de los parametros de la tendencia, ajuste de la serie de

logaritmos de la produccion trimestral cemento portland.

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


50 100 150

−0.

15−

0.10

−0.

05

n

δ 1

con todos los datos, δ1 = − 0.134269

50 100 150

−0.

040.

000.

040.

08

n

δ 2

con todos los datos, δ2 = − 0.01913897

50 100 150

−0.

040.

000.

020.

040.

060.

080.

10

n

δ 3

con todos los datos, δ3 = 0.01683978

Figura 5.17: Estimacion recursiva de los parametros de la estacionalidad, ajuste de la

serie de logaritmos de la produccion trimestral cemento portland.

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


0 50 100 150

−0.

2−

0.1

0.0

0.1

0.2

t

Res

idua

les

recu

rsiv

os


Time

Em

piric

al fl

uctu

atio

n pr

oces

s

1960 1970 1980 1990

−3

−2

−1

01

23

Figura 5.18: Residuales recursivos y test CUSUM, ajuste de la serie de logaritmos de la

produccion trimestral cemento portland.

A continuacion el codigo R usado para este ejemplo:

Codigo R 5.7.

#LECTURA Y GRAFICACION DE LA SERIEyt=scan()465 532 561 570 529 604 603 582 554 620 646637 573 673 690 681 621 698 753 728 688 737782 692 637 757 783 757 674 734 835 838 797904 949 975 902 974 969 967 849 961 966 922836 998 1025 971 892 973 1047 1017 948 10321190 1136 1049 1134 1229 1188 1058 1209 11991253 1070 1282 1303 1281 1148 1305 1342 14521184 1352 1316 1353 1121 1297 1318 1281 11091299 1341 1290 1101 1284 1321 1317 1122 12611312 1298 1202 1302 1377 1359 1232 1386 14401439 1282 1573 1533 1651 1347 1575 1475 13571086 1158 1279 1313 1166 1373 1456 1496 12511456 1631 1554 1347 1516 1546 1564 1333 14581499 1613 1416 1625 1770 1791 1622 1719 19721893 1575 1644 1658 1668 1343 1441 1444 14971267 1501 1538 1569 1450 1569 1648 1777 14681732 1962

yt=ts(yt,frequency=4,start=c(1956,1))

#TRANSFORMACION LOGARITMICA Y DESCOMPOSICION DE LA SERIE TRANSFORMADAlnyt=log(yt)

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


nf=layout(rbind(c(0,1,1,0),c(0,2,2,0)))plot(yt, lwd=2,main="Produccion trimestral cemento portland\n Miles de ton. Q11956-Q31994")plot(lnyt,lwd=2,main="Log de produccion trimestral cemento portland\nQ11956-Q31994")

#DESCOMPOSICION DE LA SERIE DE LOGARITMOScomponlnyt=stl(lnyt,s.window="periodic")plot(componlnyt,lwd=2,main="Log de Produccion trimestral cemento portland\nQ11956-Q31994")

#DEFINIENDO VARIABLE ASOCIADA A LA ESTACIONALIDAD Y#TOMANDO EL CUARTO TRIMESTRE COMO ESTACION DE REFERENCIA

library(TSA)trimestre=season(lnyt)trimestre=relevel(trimestre,ref="4Q")

#DEFINIENDO INDICE DE TIEMPOt=1:length(lnyt)

#AJUSTANDO MODELO AL LOG(Yt) CON TENDENCIA CUADRATICA Y ESTACIONALIDAD TRIMESTRALmodelo1=lm(lnyt˜t+I(tˆ2)+trimestre)summary(modelo1)

nf=layout(rbind(c(1,1),c(2,2)))plot(t,residuals(modelo1),type="o",lwd=2); abline(h=0,lty=2)plot(fitted(modelo1),residuals(modelo1),type="p",lwd=2); abline(h=0,lty=2)

#ESTIMACION RECURSIVA PARA ANALISIS DE ESTABILIDAD DEL MODELOestim=function(n){modelo=lm(lnyt[1:n]˜t[1:n]+I(tˆ2)[1:n]+trimestre[1:n])resul=cbind(coef(modelo),confint(modelo))resul}

#tomar m´ınimo n=max(2 * s,p+1), s=No. per´ıodos estacionales y p=No. de regresorasn=matrix(8:length(lnyt),ncol=1)

#En argumento dim=c(6,3,nrow(n)), laprimera cifra (6) es el numero de parametros del modelob=array(apply(n,1,estim),dim=c(6,3,nrow(n)))#informacion de los interceptos: fila1: estimacion, fila2:LI, fila3:LSbetas0=b[1,,]

#informacion de beta1: fila1: estimacion, fila2:LI, fila3:LSbetas1=b[2,,]

#informacion de beta2: fila1: estimacion, fila2:LI, fila3:LSbetas2=b[3,,]

#informacion de delta1: fila1: estimacion, fila2:LI, fila3:LSdeltas1=b[4,,]



nf=layout(rbind(c(1,1,2,2),c(0,3,3,0)))#Graficando los beta0 y sus I.C del 95%matplot(n,t(betas0),type=’l’,lty=c(1,2,2),col=1,lwd=1.5,ylab=expression(hat(beta)[0]))abline(h=coef(modelo1)[[1]],lty=1,col=2,lwd=2)text(80,coef(modelo1)[[1]],expression(paste("con todos los datos",sep=" ",hat(beta)[0]==6.318034)),pos=3)

#Graficando los beta1 y sus I.C del 95%matplot(n,t(betas1),type=’l’,lty=c(1,2,2),col=1,lwd=1.5,ylab=expression(hat(beta)[1]))

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


abline(h=coef(modelo1)[[2]],lty=1,col=2,lwd=2)text(80,0.0005,expression(paste("con todos los datos,",sep=" ",hat(beta)[1]==0.01495135)),pos=3)

#Graficando los beta2 y sus I.C del 95%matplot(n,t(betas2),type=’l’,lty=c(1,2,2),ylim=c(-0.001,max(betas2)),col=1,lwd=1.5,ylab=expression(hat(beta)[2]))abline(h=coef(modelo1)[[3]],lty=1,col=2,lwd=2)text(100,0.0000002,expression(paste("con todos los datos,",sep=" ",hat(beta)[2]==-5.248589e-05)),pos=3)


#Graficando los delta1 y sus I.C del 95%matplot(n,t(deltas1),type=’l’,lty=c(1,2,2),col=1,lwd=1.5,ylab=expression(hat(delta)[1]))abline(h=coef(modelo1)[[4]],lty=1,col=2,lwd=2)text(70,-0.13,expression(paste("con todos los datos,",sep=" ",hat(delta)[1]== -0.1342690)),pos=3)

#Graficando los delta2 y sus I.C del 95%matplot(n,t(deltas2),type=’l’,lty=c(1,2,2),col=1,lwd=1.5,ylab=expression(hat(delta)[2]))abline(h=coef(modelo1)[[5]],lty=1,col=2,lwd=2)text(70,-0.02,expression(paste("con todos los datos,",sep=" ",hat(delta)[2]==-0.01913897)),pos=3)

#Graficando los delta3 y sus I.C del 95%matplot(n,t(deltas3),type=’l’,lty=c(1,2,2),col=1,lwd=1.5,ylab=expression(hat(delta)[3]))abline(h=coef(modelo1)[[6]],lty=1,col=2,lwd=2)text(70,0.001,expression(paste("con todos los datos,",sep=" ",hat(delta)[3]==0.01683978)),pos=3)

#Obtencion de residuales recursivos y graficos CUSUMtlibrary(strucchange)rr=recresid(modelo1)

nf=layout(rbind(c(1,1),c(2,2)))plot(rr, type = "l",ylab="Residuales recursivos",xlab="t")abline(h=0,col=2,lwd=2)

plot(efp(lnyt˜t+I(tˆ2)+trimestre, type = "Rec-CUSUM"),lwd=2)

#Test CUSUM recursivo para cambio estructuraltest=sctest(lnyt˜1+t+I(tˆ2)+trimestre)test

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ

5.4. PRECISION DE LOS MODELOS DE PRONOSTICO 137

Observe mas en detalle la componente de tendencia de la serie de produc-cion trimestral de cemento, obtenida con la funcion R decompose() y exhibidaen la Figura 5.19, y la serie original y ajustada (valores ajustados destransfor-mados con exponenciacion, ver en codigo R siguiente) en la Figura 5.20. ¿Esclara la existencia de ciclos? ¿Cree ud. que hay un buen ajuste con el modelolog-lineal? ¿es apropiado un modelo global para esta serie?

Codigo R 5.8.

#GRAFICA DE LA COMPONENTE DE TENDENCIAplot(decompose(yt,type="multiplicative")$trend,main="Componente Tendencia serie trimestral de cemento portland",ylab=expression(hat(T)[t]),lwd=2)

#GRAFICA SERIE ORIGINAL Y AJUSTADA POR REGRESION CON TODAS LAS OBSERVACIONESplot(yt)lines(time(yt)[1:length(yt)],exp(fitted(modelo1)),col=2,lwd=2)legend("topleft",legend=c("Original","ajustado"),lty=c(1,1),lwd=c(1,2),col=c(1,2))

Componente Tendencia serie trimestral de cemento portland

Time

Tt

1960 1970 1980 1990

600

800

1000

1200

1400

1600

1800

Figura 5.19: Componente de tendencia serie trimestral de produccion de cemento port-

land, estimada por descomposicion.

5.4. Precision de los modelos de pronostico

Cuando pronosticamos incurrimos en un error de pronostico. La exactitudde un modelo depende de cuan cercano estan los pronosticos a los verdaderosvalores. Si pronosticamos un periodo adelante de t = n+j, el error de pronosti-co correspondiente sera:

en+j(1) = Yn+j+1 − Yn+j(1), j = 0, 1, · · · (5.24)

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


Time

yt

1960 1970 1980 1990

500

1000

1500

2000

Originalajustado

Figura 5.20: Serie trimestral de produccion de cemento portland y su ajuste por regresion

donde Yn+j(1) es el pronostico para Yn+j+1 con origen de pronostico en t = n+ j.Suponga que una serie de longitud N es ajustada con las primeras n obser-vaciones (n < N ) y que se pronostican las ultimas m = N − n observacionescon el modelo ajustado en la primera muestra. Definimos el error relativo depronostico para la observacion Yn+j+1, con origen de pronostico en t = n + j,j = 0, 1, 2, · · · , m− 1, como

ERj =en+j(1)

Yn+j+1(5.25)

A continuacion, se definen algunas medidas globales de la precision de lospronosticos para las ultimasm observaciones de la serie, con origen de pronosti-co en t = n

Se prefieren MAE, RMSE, y MAPE porque los errores positivos y negativosno se compensan. Como criterios para seleccionar entre dos o mas mode-los, se elige el de menor valor en la medida considerada. No son permitidascomparaciones entre metodos de pronostico alternativos que usen diferentestransformaciones de los datos. Tampoco es apropiado hacer comparacionespara variables expresadas en diferentes escalas. Sin embargo las medidas deprecision en terminos relativos son libres de unidades y pueden usarse paratales comparaciones.

En R podemos calcular las medidas de precision de los pronosticos medi-ante la funcion accuracy() de la librerıa forecast :

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ

5.4. PRECISION DE LOS MODELOS DE PRONOSTICO 139

Precision en los pronosticos de m = perıodos despues de t = n.Descripcion Formula

Error promedio de pronostico ME =1

m

m−1∑j=0

en+j(1)

Error promedio absoluto de pronostico MAE =1

m

m−1∑j=0

|en+j(1)|

Raız del error cuadratico medio (error estandar) RMSE =

√1

m

m−1∑j=0

e2n+j(1)

de pronostico

Porcentaje medio de error MPE = 100 %1

m

m−1∑j=0

ERj

Porcentaje medio absoluto de error MAPE = 100 %1

m

m−1∑j=0

|ERj |

accuracy(f, x, test=1:length(x))

Donde

f: Es el vector con los valores pronosticados

x: Es el vector con los valores reales correspondientes a los perıodospronosticados.

5.4.1. Comparacion con un modelo de referencia

La comparacion con un pronostico de referencia es hecha con el fin deevaluar el incremento en la precision de los pronosticos obtenidos con unmodelo dado. Por ejemplo, podemos considerar como referencia el pronosticosimple, en el cual cada valor es pronosticado con el valor anterior en la serie,es decir,

Pronostico simple: Yn+j(1) = Yn+j, j = 0, 1, · · · , m− 1 (5.26)

Luego, el error de pronostico es

Error pronostico simple: en+j(1) = Yn+j+1 − Yn+j, j = 0, 1, · · · , m− 1 (5.27)

Para este metodo el MAPE se denotara MSIMP.

MSIMP = 100 %1

m

m−1∑

j=0

∣∣∣∣Yn+j+1 − Yn+j

Yn+j+1

∣∣∣∣ (5.28)

Observe que para calcular MSIMP no se requiere ningun modelo para la serie.Para calcular esta medida algunos recomiendan considerar la serie sin la com-ponente estacional, por ejemplo, si la serie es de la forma Yt = Tt +St +Et, usar

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


en lugar de Yn+j+1 y Yn+j a las correspondientes versiones desestacionalizadas,

(Yn+j+1 − Sn+j+1) y (Yn+j − Sn+j).NOTA: Si el MAPE de un modelo ajustado para una serie con n observa-

ciones muestrales es menor que el MSIMP (MAPE < MSIMP) se justifica elmodelo ajustado; si no, no mejora la precision del metodo simple y no se jus-tifica el modelo que se ajusto.

Tenga en cuenta ademas para seleccion entre dos o mas modelos segunestadısticos de capacidad de pronostico lo siguiente:

1. Los modelos a considerar deben cumplir con sus respectivos supuestos(modelos validos).

2. Entre los modelos validos, considerar los que son utiles para pronosticar.Un modelo es util para pronostico si su MAPE < MSIMP.

3. Entre dos o mas modelos validos y utiles, se selecciona el de mayor pre-cision en el ajuste (mejores estadısticos de bondad de ajuste) y que asu vez tenga mayor precision de pronostico (mejores estadısticos de pre-cision de pronosticos).

5.5. Ajuste por suavizamiento Holt-Winters de series esta-

cionales

El suavizamiento Holt-Winters aplica a series con componente estacional,con tendencia lineal o cuadratica, aunque en R solo esta implementado contendencia lineal. Se distinguen dos casos:

Holt-Winters para series estacionales de componentes aditivas;

Holt-Winters para series estacionales de componentes multiplicativas.

5.5.1. Holt-Winters aditivo

Sea L ≥ 1. Considere el valor de la serie en t+ L,

Yt+L = β0 + β1(t+ L) + St+L + Et+L

= (β0 + β1t) + β1L+ St+L + Et+L

= β0,t + β1L+ St+L + Et+L

donde β0,t = (β0+β1t) es llamado el nivel de la serie en t. Adicionalmente asumaque hay una evolucion lenta en los parametros del modelo (es decir, puedenvariar con t), entonces escribimos:

Yt+L = β0,t + β1,tL+ St+L + Et+L (5.29)

tenemos,

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ

5.5. AJUSTE POR SUAVIZAMIENTO HOLT-WINTERS DE SERIES ESTACIONALES141

β0,t, nivel de la serie en t

β1,t, pendiente o tasa de crecimiento en t

St+L, valor de la estacionalidad en t+ L.

Suavizamiento

El metodo de suavizamiento actua sobre estas tres componentes suavizan-do exponencialmente, con parametro de suavizamiento α, β, γ, respectiva-mente. Estos tres parametros son escogidos en el intervalo (0, 1), de forma talque sea mınimo el MSE del ajuste en la muestra de datos de la serie. Lasecuaciones de suavizamiento son:

nivel en t : β0,t = α(Yt − St−s) + (1− α)(β0,t−1 + β1,t−1) (5.30)

pendiente en t : β0,t = β(β0,t − β0,t−1) + (1− β)β1,t−1 (5.31)

Estas dos componentes son actualizadas dentro de cada perıodo estacionalcompleto k, es decir, en t ∈ [(k − 1)s+ 1, k s], k = 1, 2, · · · , [n/s]. Para suavizar lacomponente estacional St, dentro de cada perıodo estacional completo, calcu-lamos

St = γ(Yt − β0,t) + (1− γ)St−s (5.32)

De modo que en cada t ∈ [(k − 1)s + 1, k s], k = 1, 2, · · · , [n/s] solo se actualizauna de las s estaciones, aquella que corresponda a dicho tiempo. Concluıdoun perıodo estacional completo, antes de continuar suavizando, es necesarioestandarizar los ultimos s valores calculados con la ecuacion anterior, esto es,reemplazar los resultados dados por (5.32), por

St ← St − Sk, donde Sk =1

s

ks∑

j=(k−1)s+1

Sj (5.33)

esto garantiza que en cada perıodo estacional completoks∑

j=(k−1)s+1

Sj = 0. Los

valores estandarizados de la estacionalidad son los que se deben usar en lasecuaciones de suavizamiento del nivel, la pendiente y de la misma estacional-idad.

Nota: En t = 1 es necesario determinar los valores iniciales β0,0, β1,0 y los svalores S0, S−1, · · · , S1−s+1, S1−s, que corresponden, respectivamente, al valor deinicio de la estacionalidad, en la estacion, s, (s−1), · · · , 2, 1. Para ello, con los 2sprimeros datos de la serie (los dos primeros perıodos estacionales completos,desde que t = 1 corresponda a la estacion 1), podemos:

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


Realizar una regresion lineal con variables indicadoras, para el ajuste delmodelo:

Yt = β0,0 + β1,0t+s−1∑

i=1

δi(Ii,t − Is,t) + Et

y obtenemos β0,0, β1,0, y Si−s = δi, i = 1, 2, · · · , s− 1, y S0 = −s−1∑i=1

δi. O bien,

Realizar una descomposicion usando por ejemplo la funcion decompose() .Adicionalmente, para la componente de tendencia obtenida se aplica re-gresion lineal simple para estimar los valores iniciales del nivel y de lapendiente: Tt = β0,0 + β1,0t+ at, at ∼ N(0, σ2

a).

Calculos de valores ajustados Yt

Para t = 0, 1, · · · , n− 1 se calcula

Yt(1) = Yt+1 = β0,t + β1,t × 1 + St+1−s (5.34)

Pronosticos L perıodos adelante de t = n

Los pronosticos fuera de la muestra se construyen como

Yn(L) = Yn+L = β0,n + β1,n × L+ Sn+L−s, (5.35)

es decir, usamos los ultimos valores suavizados del nivel, la pendiente y laestacionalidad para pronosticar despues de t = n. Un intervalo de pronosticode (1− δ)100 % puede construirse como

Yn(L)± tδ/2,n−3 × σ

√√√√1 +L−1∑

j=1

α2(1 + jβ)2, con σ2 =1

n− 3

n∑

t=1

(Yt − Yt)2. (5.36)

5.5.2. Holt-Winters multiplicativo

En este caso el modelo global de pronostico que se considera es:

Yt+L = [β0 + β1(t+ L)]× St+L + Et+L = [β0,t + β1 × L]× St+L + Et+L (5.37)

Con β0,t = β0 +β1t. Pero, asumiendo que en general hay una evolucion lenta delos parametros, tenemos

Yt+L = [β0,t + β1,t × L]× St+L + Et+L (5.38)

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


Suavizamiento

Igual al caso aditivo, se suaviza el nivel, la pendiente y la estacionalidad encada tiempo t = 1, · · · , n, con parametros de suavizamiento α, β, γ, respecti-vamente, escogidos en el intervalo (0, 1), de forma tal que sea mınimo el MSEdel ajuste en la muestra de datos de la serie. Las ecuaciones de suavizamientoson:

nivel en t : β0,t = α(Yt/St−s) + (1− α)(β0,t−1 + β1,t−1) (5.39)

pendiente en t : β0,t = β(β0,t − β0,t−1) + (1− β)β1,t−1 (5.40)

Estas dos componentes son actualizadas dentro de cada perıodo estacionalcompleto k, es decir, en t ∈ [(k − 1)s+ 1, k s], k = 1, 2, · · · , [n/s]. Para suavizar lacomponente estacional St, dentro de cada perıodo estacional completo, calcu-lamos

St = γ(Yt/β0,t) + (1− γ)St−s (5.41)

De modo que en cada t ∈ [(k−1)s+1, k s], k = 1, 2, · · · , [n/s] solo se actualiza unade las s estaciones (la que corresponda a dicho tiempo). Concluıdo un perıodoestacional completo, antes de continuar suavizando, es necesario normalizarlos ultimos s valores calculados con la ecuacion anterior, esto es, reemplazarlos resultados dados por (5.41), con

St ←St × sks∑

j=(k−1)s+1

Sj

(5.42)

esto garantiza que en cada perıodo estacional completo se cumpla la siguiente

igualdad:ks∑

j=(k−1)s+1

Sj = s. Los valores normalizados de la estacionalidad son los

que se deben usar en las ecuaciones de suavizamiento del nivel, la pendientey de la misma estacionalidad. Tambien se requiere inicializacion de β0,0, β1,0

y los s valores de la componente estacional, para ello se puede recurrir a ladescomposicion clasica usando los 2s primeros valores de la serie mediantemedias moviles (usando la funcion R decompose() con tipo multiplicativo).

Calculo de valores ajustados Yt

Dentro de la muesta tenemos que Para t = 0, 1, · · · , n se calcula

Yt(1) = Yt+1 = (β0,t + β1,t × 1)St+1−s (5.43)

Pronosticos L perıodos adelante de t = n

Los pronosticos fuera de la muestra se construyen como

Yn(L) = Yn+L = (β0,n + β1,n × L)Sn+L−s, (5.44)

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


es decir, usamos los ultimos valores suavizados del nivel, la pendiente y laestacionalidad para pronosticar despues de t = n. Un intervalo de pronosticode (1− δ)100 % puede construirse como

Yn(L)± tδ/2,n−3 × σ√CLS2

n+L−s, (5.45)

con σ2 =1

n− 3

n∑t=1

(Yt − Yt

Yt

)2

y CL = (β0,n+β1,nL)2+L−1∑j=1

α2[1+(L−j)β]2(β0,n+jβ1,n)2.

5.5.3. Suavizamiento Holt-Winters en R

Para el caso aditivo:

HoltWinters(serie,alpha,beta,gamma,seasonal= “additive ”)

Para el caso multiplicativo:

HoltWinters(serie,alpha,beta,gamma,seasonal= “multiplicative ”)

serie debe ser un objeto R tipo serie de tiempo, es decir, definido mediante lafuncion ts() , con la frecuencia correspondiente a la longitud de la estacional-idad. Si no se especifican los valores de los parametros de suavizamiento, lafuncion realiza internamente un proceso de optimizacion para obtener los val-ores de estos parametros que minimicen el MSE de ajuste.

Cuando se crea un objeto R con esta funcion, en este queda guardada lasiguiente informacion (con los nombres que el paquete da a cada elemento)

fitted: Una matriz (cada columna es una serie) con columnas parala serie filtrada, las componentes de nivel, tendencia y estacionalidad,estimadas contemporaneamente, es decir en el tiempo t y no al final dela serie

x: La serie original

alpha: El valor de α usado para filtrar el nivel

beta: El valor de β usado para filtrar la pendiente

gamma: El valor de γ usado para filtrar la estacionalidad

coefficients: Un vector con componentes denominadas a (nivel), b(pendiente), s1, s2,..., ss (valores de las componentes estacionalespara el pronostico de L = 1, 2, · · · , s perıodos siguientes a t = n, respecti-vamente).

seasonal: Tipo de modelo estacional especificado (aditivo o multiplicati-vo)

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


SSE: Suma de cuadrados del error alcanzada en la optimizacion usada.

Para la obtencion de pronosticos y sus intervalos de prediccion del 95 %:

predict(objeto, n.ahead=1, prediction.interval = TRUE, level = 0.95)

donde objeto es un objeto creado con la funcion HoltWinters , n.ahead=1indica la realizacion de una prediccion para el primer perıodo despues delultimo valor considerado en la serie, por tanto, para mas predicciones bastaajustar el valor de este argumento en el numero de predicciones deseadas.

5.5.4. Ejemplo: Suavizamiento Holt Winters de la serie del ındice men-sual de salario real

A continuacion se realizan dos suavizamientos Holt-Winters, solo con losprimeros n − 6 = 114 observaciones de la serie (de enero de 1990 a juniode 1999) . Se pronostican las seis ultimas observaciones (de julio de 1999a diciembre de 1999). El primer suavizamiento es realizado con parametrosα = 0.5, β = 0.06 y γ = 0.6. El segundo suavizamiento se deja que el R suavicecon valores optimos de estos parametros.

Codigo R 5.9.

#LECTURA DE LOS DATOSyt=scan()94.15 102.28 104.01 103.22 102.58 100.97 101.65 101.6799.89 100.08 99.63 89.82 90.76 99.86 100.71 101.66 100.5798.80 98.18 98.94 99.26 98.40 99.15 91.19 90.90 102.71 104.33101.68 101.48 100.30 100.32 102.23 101.24 102.01 103.78 96.0096.58 106.56 108.47 108.01 108.65 108.30 108.07 109.72 108.24108.74 109.33 101.13 101.00 109.65 111.21 109.67 110.23 110.92110.33 111.46 111.70 112.90 113.84 107.40 103.41 113.85 114.97116.01 113.56 113.22 113.28 114.86 113.78 116.01 117.49 109.63105.95 117.68 119.21 118.77 118.48 116.62 116.56 117.05 116.07116.91 118.65 109.12 109.66 120.26 122.14 122.52 124.35 122.03122.23 121.37 120.63 122.69 124.67 115.74 114.33 123.51 124.66122.10 121.70 119.52 120.05 122.31 121.47 122.46 123.64 115.47111.71 124.20 126.19 126.87 126.89 127.34 127.28 128.87 128.51130.24 132.14 124.66

#USAREMOS SOLO LAS PRIMERAS n-6 OBSERVACIONES DE LA SERIE: Enero de 1990 a junio de 1999

yt2=ts(yt[1:114],frequency=12,start=c(1990,1)) #INICIO EN ENERO DE 1990, DATOS MENSUALES

#REALIZANDO SUAVIZAMIENTO WINTERS ADITIVO CON alpha=0.5, beta=0.06 y gamma=0.6suaviza1=HoltWinters(yt2,alpha=0.5,beta=0.06,gamma=0.6,seasonal="additive")

#CALCULANDO PREDICCIONES PARA JULIO A DICIEMBRE DE 1999predicciones1=predict(suaviza1,n.ahead=6,prediction.interval=TRUE)

#SUAVIZAMIENTO CON VALORESOPTIMOS DE LAS PARAMETROSsuaviza2=HoltWinters(yt2,seasonal="additive")


#GRAFICAS DE LA SERIE ORIGINAL JUNTO CON LAS SUAVIZADAS,#LAS PREDICCIONES DE LOS SEIS PERIODOS SGTES Y SUS INTERVALOSnf=layout(rbind(c(0,1,1,0),c(0,2,2,0)))

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


plot(suaviza1,xlim=c(1990.0,2000.1),ylim=c(min(yt),max(yt)+10),main=expression(paste("Holt-Winters",sep=" ",alpha==0.5,sep=", ",beta==0.06,sep=", ",gamma==0.6)),lwd=2)lines(predicciones1[,1],lty=2)lines(predicciones1[,2],lty=2)lines(predicciones1[,3],lty=2)abline(v=(1999+6/12)) #l´ınea de referencia al final de junio de 1999legend("topleft",legend=c("Original","ajustado","pronosticado"),lty=c(1,1,2),lwd=c(1,2,1),col=c(1,2,1))

plot(suaviza2,xlim=c(1990.0,2000.1),ylim=c(min(yt),max(yt)+10),main="Holt-Winters parametros optimos",lwd=2)lines(predicciones2[,1],lty=2)lines(predicciones2[,2],lty=2)lines(predicciones2[,3],lty=2)abline(v=(1999+6/12)) #l´ınea de referencia al final de junio de 1999legend("topleft",legend=c("Original","ajustado","pronosticado"),lty=c(1,1,2),lwd=c(1,2,1),col=c(1,2,1))

Salida R 5.3.

#RESULTADOS FINALES DEL PRIMER SUAVIZAMIENTOsuaviza1

Holt-Winters exponential smoothing with trend and additive seasonal component.

Call:HoltWinters(x = yt2, alpha = 0.5, beta = 0.06, gamma = 0.6, seasonal = "additive")

Smoothing parameters:alpha: 0.5beta : 0.06gamma: 0.6

Coefficients:[,1]

a 125.8778975b 0.3583725s1 0.6832618s2 1.6890767s3 0.7883875s4 1.9602604s5 3.0464856s6 -5.9301495s7 -8.4949985s8 2.2765857s9 3.4087116s10 2.6079811s11 2.2751274s12 1.0116456

#VALORES SUAVIZADOS PRIMER SUAVIZAMIENTOfitted(suaviza1)

xhat level trend seasonJan 1991 91.89147 99.90377 -0.173865093 -7.8384375Feb 1991 100.47626 99.16417 -0.207809084 1.5198958Mar 1991 100.93183 98.64823 -0.226296806 2.5098958...Jan 1999 113.35984 121.21198 0.147910908 -8.0000453Feb 1999 122.35710 120.53497 0.098415585 1.7237151Mar 1999 124.65750 121.55483 0.153702644 2.9489609Apr 1999 124.60207 122.47479 0.199677721 1.9276012May 1999 126.12039 123.80843 0.267715719 2.0442454

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


Jun 1999 125.08772 124.46095 0.290803919 0.3359603

#SSE DEL PRIMER SUAVIZAMIENTOsuaviza1$SSE[1] 178.2478

#VALORES AJUSTADOS PRIMER SUAVIZAMIENTOpredicciones1

fit upr lwrJul 1999 126.9195 129.5006 124.3384Aug 1999 128.2837 131.2049 125.3625Sep 1999 127.7414 131.0007 124.4821Oct 1999 129.2716 132.8691 125.6742Nov 1999 130.7162 134.6536 126.7789Dec 1999 122.0980 126.3779 117.8181

#RESULTADOS FINALES SEGUNDO SUAVIZAMIENTOsuaviza2

Holt-Winters exponential smoothing with trend and additive seasonal component.

Call:HoltWinters(x = yt2, seasonal = "additive")

Smoothing parameters:alpha: 0.7256559beta : 0.03969379gamma: 1

Coefficients:[,1]

a 126.2661284b 0.3213943s1 1.0537426s2 2.0313071s3 1.1074885s4 2.2173567s5 3.0537184s6 -6.2580633s7 -8.9715922s8 1.8813412s9 3.0087498s10 2.3359601s11 2.1832192s12 1.0738716

#VALORES SUAVIZADOS SEGUNDO SUAVIZAMIENTOfitted(suaviza2)

xhat level trend seasonJan 1991 91.89147 99.90377 -0.17386509 -7.8384375Feb 1991 100.22229 98.90885 -0.20645589 1.5198958Mar 1991 100.73250 98.43950 -0.21689126 2.5098958...Jan 1999 113.41872 121.72806 0.19347414 -8.5028139Feb 1999 122.14281 120.68159 0.14425601 1.3169637Mar 1999 125.28175 122.31866 0.20351133 2.7595756Apr 1999 125.32227 123.18125 0.22967271 1.9113503May 1999 127.02989 124.53404 0.27425349 2.2215974Jun 1999 125.56351 124.70678 0.27022407 0.5865007

#SSE DEL SEGUNDO SUAVIZAMIENTO

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


suaviza2$SSE[1] 163.4065

#PREDICCIONES SEGUNDO SUAVIZAMIENTOpredicciones2

fit upr lwrJul 1999 127.6413 130.1121 125.1705Aug 1999 128.9402 132.0353 125.8451Sep 1999 128.3378 131.9881 124.6875Oct 1999 129.7691 133.9345 125.6036Nov 1999 130.9268 135.5816 126.2720Dec 1999 121.9364 127.0633 116.8096

De los resultados anteriores se tiene que las ecuaciones de pronosticos Holt-Winters aditivo pronostican para t = 114+L, L ≥ 1, con base en las ecuaciones(tenga en cuenta que en t = 115 el mes es julio), respectivamente:

suaviza1: 125.8778975 + 0.3583525L+ S114+L, con α = 0.5, β = 0.06 y γ = 0.6,

suaviza2: 126.2661284+0.3213943L+S114+L, con α = 0.7256559, β = 0.03969379 y γ = 1,

donde (ver valores s1,..., s12 de cada suavizamiento):

S114+L = s1, si MOD(114 + L, 12) = 7;

S114+L = s2, si MOD(114 + L, 12) = 8;

S114+L = s3, si MOD(114 + L, 12) = 9;

S114+L = s4, si MOD(114 + L, 12) = 10;

S114+L = s5, si MOD(114 + L, 12) = 11;

S114+L = s6, si MOD(114 + L, 12) = 0;

S114+L = s7, si MOD(114 + L, 12) = 1;

S114+L = s8, si MOD(114 + L, 12) = 2;

S114+L = s9, si MOD(114 + L, 12) = 3;

S114+L = s10, si MOD(114 + L, 12) = 4;

S114+L = s11, si MOD(114 + L, 12) = 5;

S114+L = s12, si MOD(114 + L, 12) = 6.

El segundo suavizamiento (suaviza2 ) es el que utilizo valores optimos de losparametros del suavizamiento. Los pronosticos correspondientes y sus inter-valos de prediccion del 95 % han sido guardados en los objetos R predicciones1y predicciones2 . Los SSE de ajuste obtenidos son, respectivamente,

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


suaviza1: SSE= 178.2478


En la Figura 5.21, puede observarse la serie original, la serie suavizada ylos pronosticos con sus intervalos de prediccion, con los dos suavizamientosrealizados, respectivamente. Para comparar la precision de los pronosticos secalculan las medidas correspondientes:

Codigo R 5.10.

library(forecast)accuracy(predicciones1[,1],yt[(length(yt2)+1):length(yt)])accuracy(predicciones2[,1],yt[(length(yt2)+1):length(yt)])

con lo cual se obtiene

Precision en los pronosticos con m = 6Holts-Winters serie ındice de salario

ME RMSE MAE MPE MAPE

suaviza1 1.11 1.33 1.11 0.87 0.87

suaviza2 0.69 1.24 0.84 0.54 0.66

¿Con cual suavizamiento se ajusto mejor la serie? ¿con cual se predicemejor los ultimos 6 meses de la serie?

5.5.5. Ejemplo: Suavizamiento Holt-Winters de la serie trimestral deproduccion de cemento portland

Esta serie, como vimos previamente es de componentes multiplicativas, conestacioalidad de longitud s = 4. Tambien tomaremos solo una parte de la seriepara el suavizamiento, los n − 4 = 151 primeros perıodos para luego pronos-ticar los ultimos cuatro. No necesitamos trabajar sobre la serie de los loga-ritmos sino aplicar a la serie original el modelo de suavizamiento estacionalmultiplicativo. Como en el ejemplo anterior, se haran dos suavizamientos, elprimero es realizado con parametros α = 0.5, β = 0.06 y γ = 0.6. El segundosuavizamiento se deja que el R suavice con valores optimos de estos paramet-ros. La programacion es presentada en el Codigo R 5.11.ESTADÍS

TICA III

- 300

9137

NELFI G

ONZÁLEZ


Holt−Winters α = 0.5, β = 0.06, γ = 0.6

Time

Obs

erve

d / F

itted

1990 1992 1994 1996 1998 2000

9010

011

012

013

014

0 Originalajustadopronosticado

Holt−Winters parámetros óptimos

Time

Obs

erve

d / F

itted

1990 1992 1994 1996 1998 2000

9010

011

012

013

014

0 Originalajustadopronosticado

Figura 5.21: Suavizamientos Holt-Winters para serie ındice mensual de salario real.

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


Codigo R 5.11.


#USAREMOS SOLO LOS n-4=151 PRIMERAS OBSERVACIONES DE LA SERIEyt2=ts(yt[1:151],frequency=4,start=c(1956,1))

#REALIZANDO SUAVIZAMIENTO WINTERS ADITIVOS CON alpha=0.5, beta=0.06 y gamma=0.6suaviza1=HoltWinters(yt2,alpha=0.5,beta=0.06,gamma=0.6,seasonal="multiplicative")

#CALCULANDO PREDICCIONES PARA TRIMESTRES 4 DE 1993 A TRIMESTRE 3 DE 1994predicciones1=predict(suaviza1,n.ahead=4,prediction.interval=TRUE)

#SUAVIZAMIENTO CON VALORESOPTIMOS DE LAS PARAMETROSsuaviza2=HoltWinters(yt2,seasonal="multiplicative")


#GRAFICAS DE LA SERIE ORIGINAL JUNTO CON LAS SUAVIZADAS, LAS PREDICCIONES DE#LOS CUATRO PERIODOS SGTES Y SUS INTERVALOSnf=layout(rbind(c(0,1,1,0),c(0,2,2,0)))plot(suaviza1,xlim=c(1956.0,1994.75),ylim=c(min(yt),max(yt)+10),main=expression(paste("Holt-Winters",sep=" ",alpha==0.5,sep=", ",beta==0.06,sep=", ",gamma==0.6)),lwd=2)lines(predicciones1[,1],lty=2)lines(predicciones1[,2],lty=2)lines(predicciones1[,3],lty=2)abline(v=(1993+3/4)) #l´ınea de referencia al final de trimestre 3 de 1993legend("topleft",legend=c("Original","ajustado","pronosticado"),lty=c(1,1,2),lwd=c(1,2,1),col=c(1,2,1))

plot(suaviza2,xlim=c(1956.0,1994.75),ylim=c(min(yt),max(yt)+10),main="Holt-Winters parametros optimos",lwd=2)lines(predicciones2[,1],lty=2)lines(predicciones2[,2],lty=2)lines(predicciones2[,3],lty=2)abline(v=(1993+3/4)) #l´ınea de referencia al final de trimestre 3 de 1993legend("topleft",legend=c("Original","ajustado","pronosticado"),lty=c(1,1,2),lwd=c(1,2,1),col=c(1,2,1))

Los resultados del R corresponden a los siguientes:

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


Salida R 5.4.

suaviza1Holt-Winters exponential smoothing with trend and multiplicative seasonal component.

Call:HoltWinters(x = yt2, alpha = 0.5, beta = 0.06, gamma = 0.6, seasonal = "multiplicative")


Coefficients:[,1]

a 1628.4889365b 3.9387709s1 1.0260078s2 0.8910341s3 0.9730372s4 1.0080182

#VALORES SUAVIZADOS CON PRIMER SUAVIZAMIENTOfitted(suaviza1)

xhat level trend season1957 Q1 498.0740 529.5000 12.8250000 0.91840511957 Q2 593.8356 559.1618 13.8352067 1.03636781957 Q3 609.9831 577.9008 14.1294372 1.0303242...1993 Q1 1324.8371 1528.9093 -1.8158606 0.86755471993 Q2 1554.1072 1599.2288 2.5122653 0.97026121993 Q3 1615.7323 1609.4157 2.9727439 1.0020738

#SSE DEL PRIMER SUAVIZAMIENTOsuaviza1$SSE[1] 572028.7

#PREDICCIONES DEL PRIMER SUAVIZAMIENTOpredicciones1

fit upr lwr1993 Q4 1674.884 1772.955 1576.8121994 Q1 1458.058 1571.203 1344.9131994 Q2 1596.078 1733.523 1458.6341994 Q3 1657.428 1784.870 1529.986

#RESULTADOS DEL SEGUNDO SUAVIZAMIENTOsuaviza2

Holt-Winters exponential smoothing with trend and multiplicative seasonal component.

Call:HoltWinters(x = yt2, seasonal = "multiplicative")


Coefficients:[,1]

a 1612.7974463b 8.9203870

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


s1 1.0334102s2 0.8811954s3 0.9736879s4 1.0227150

#VALORES SUAVIZADOS CON SEGUNDO SUAVIZAMIENTOfitted(suaviza2)

xhat level trend season1957 Q1 498.0740 529.5000 12.825000 0.91840511957 Q2 602.5112 568.3712 12.996850 1.03636781957 Q3 613.5410 582.4793 13.004181 1.0303242...1993 Q1 1330.7154 1517.8594 8.469702 0.87184041993 Q2 1602.4971 1632.1577 9.167946 0.97634321993 Q3 1662.5389 1614.7881 8.992855 1.0238689

#SSE DEL SEGUNDO SUAVIZAMIENTOsuaviza2$SSE[1] 473949.2

#PREDICCIONES CON SEGUNDO SUAVIZAMIENTOpredicciones2

fit upr lwr1993 Q4 1675.900 1776.161 1575.6391994 Q1 1436.911 1561.427 1312.3951994 Q2 1596.418 1757.513 1435.3241994 Q3 1685.924 1847.711 1524.137

De los resultados anteriores se tiene que las ecuaciones de pronosticosHolt-Winters multiplicativo pronostican para t = 151 + L, L ≥ 1, con base enlas ecuaciones (tenga en cuenta que en t = 152 el trimestres es el cuatro),respectivamente:

suaviza1: (1628.4889365 + 3.9387709L)S151+L, con α = 0.5, β = 0.06 y γ = 0.6,

suaviza2: (1612.7974463 + 8.9203870L)S151+L,

con α = 0.7734918, β = 0.006597877 y γ = 0.5651145, donde (ver valores s1, s2,s3, s4 de cada suavizamiento):

S151+L = s1, si MOD(151 + L, 4) = 0;

S151+L = s2, si MOD(151 + L, 4) = 1;

S151+L = s3, si MOD(151 + L, 4) = 2;

S151+L = s4, si MOD(151 + L, 4) = 3;

El segundo suavizamiento (suaviza2 ) es el que utilizo valores optimos de losparametros del suavizamiento. Los pronosticos correspondientes y sus inter-valos de prediccion del 95 % han sido guardados en los objetos R predicciones1y predicciones2 . Los SSE de ajuste obtenidos son, respectivamente,


ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ



En la Figura 5.22, puede observarse la serie, original, la serie suavizada ylos pronosticos con sus intervalos de prediccion, con los dos suavizamientosrealizados, respectivamente. Para comparar la precision de los pronosticos secalculan las medidas correspondientes, usando un codigo similar al Codigo R5.10.

Holt−Winters α = 0.5, β = 0.06, γ = 0.6

Time

Obs

erve

d / F

itted

1960 1970 1980 1990

500

1000

1500

2000

Originalajustadopronosticado

Holt−Winters parámetros óptimos

Time

Obs

erve

d / F

itted

1960 1970 1980 1990

500

1000

1500

2000


Figura 5.22: Suavizamientos Holt-Winters para serie trimestral de produccion de cemento

portland.

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ

5.6. EJERCICIOS 155

¿Con cual suavizamiento se ajusto mejor la serie? ¿con cual se predicemejor los ultimos 4 trimestres de la serie?

Precision en los pronosticos con m = 4Holts-Winters serie produccion de cemento

ME RMSE MAE MPE MAPE

suaviza1 138.14 174.47 138.14 7.45 7.45

suaviza2 135.96 162.63 135.96 7.43 7.43

5.6. Ejercicios

1. Para la serie de produccion trimestral de cemento, realice ajuste por re-gresion lineal usando variables indicadoras pero esta vez con las primeras151 observaciones y pronostique las ultimas m = 4. Calcule los respec-tivos intervalos de pronostico usando la funcion predict() . Para elloajuste primero la serie de los logaritmos, obtenga sus pronosticos e inter-valos de prediccion y luego destransforme exponenciado tales resultadospara obtener predicciones en la escala original, luego calcule las medidasde precision de pronosticos con la funcion accuracy() .

2. Calcule usando R el MSIMP para los pronosticos de los ultimos cuatrotrimestres de la serie. Para ello genere la serie de pronosticos simples yconsidere los ultimos cuatro valores.

3. Determine para los modelos ajustados a la serie de cemento con regresionmultiple (regresion y suavizamientos) cuales son utiles y cual pronosticamejor (la muestra final de m = 4 observaciones).

Codigo R sugerido



ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


#SE DEFINEN LOS PRIMEROS n=151 VALORES DE LA SERIE A USARm=4n=length(yt)-mn#AJUSTE DE LA SERIE DE LOS LOGARITMOS CON LAS PRIMERAS n=151 OBSERVACIONESyt2=ts(yt[1:n],frequency=4,start=c(1956,1))

lnyt2=log(yt2)

library(TSA)trimestre=season(lnyt2)trimestre=relevel(trimestre,ref="4Q")

#DEFINIENDO INDICE DE TIEMPO PARA LAS PRIMERAS n=151 OBSERVACIONESt=1:length(lnyt2)

#AJUSTANDO MODELO AL LOG(Yt2) CON TENDENCIA CUADRATICA Y ESTACIONALIDAD TRIMESTRALmodelo1=lm(lnyt2˜t+I(tˆ2)+trimestre)

#DEFINIENDO VALORES DE LAS VARIABLES t y trimestre PARA LOS PERIODOS A SER PRONOSTICADOSt.nuevo=(length(yt2)+1):length(yt)trimestre.nuevo=season(yt)[(length(yt2)+1):length(yt)]

#PRONOSTICANDO PERIODOS t=152 a 155 EN ESCALA ORIGINAL#OBSERVE QUE SE EXPONENCIA LAS PREDICCIONES DEL MODELO EN#ESCALA LOGARITMICApredicciones1=exp(predict(modelo1,data.frame(t=t.nuevo,trimestre=trimestre.nuevo),interval="prediction"))predicciones1

#OBTENIENDO LAS MEDIDAS DE PRECISION DE PRONOSTICO#CON LOS PERIODOS DE t=152 a 155library(forecast)accuracy(predicciones1,yt[t.nuevo])

#CALCULO DEL MSIMP (MAPE PRONOSTICOS SIMPLE)#PRONOSTICO SIMPLE PARA t=152 a 155pred.simple=yt[n:(length(yt)-1)]

#VALORES REALES DE LA SERIE PARA t=152 a 155reales=yt[(n+1):length(yt)]

MSIMP=accuracy(pred.simple,reales)[5]

#GRAFICANDO LA SERIE VALORES AJUSTADOS Y PRONOSTICADOSwin.graph(height=12,width=15,pointsize=12)plot(yt)lines(time(yt)[1:n],exp(fitted(modelo1)),col=2,lwd=2)lines(time(yt)[(n+1):length(yt)],predicciones1[,1],lty=2,col="blue",lwd=2)lines(time(yt)[(n+1):length(yt)],predicciones1[,2],lty=2,col="blue",lwd=2)lines(time(yt)[(n+1):length(yt)],predicciones1[,3],lty=2,col="blue",lwd=2)legend("topleft",legend=c("Original","ajustado","pronosticado"),lty=c(1,1,2),lwd=c(1,2,2),col=c(1,2,4))abline(v=(1993+3/4)) #l´ınea de referencia al final de trimestre 3 de 1993ESTADÍS

TICA III

- 300

9137

NELFI G

ONZÁLEZ

Capıtulo 6

Caracterizacion de los ciclos

6.1. Introduccion

El modelo probabilıstico para una serie temporal es el concepto de procesoestocastico el cual corresponde a una sucesion de variables aleatorias {Zt}t∈Z+,es decir, un conjunto de variables aleatorias indexadas por un ındice t ∈ Z+

(para el caso de las series de tiempo). Ası, el proceso estocastico asociado auna serie de tiempo es una sucesion de variables aleatorias que evolucionanen funcion del tiempo. Cada una de las variables aleatorias del proceso tienesu propia funcion de distribucion de probabilidad y puede existir entre ellascorrelacion.

Supondremos que el valor observado de la serie en el instante t es unaextraccion de una variable aleatoria definida en dicho instante. Una serie detiempo es una sucesion generada al tomar solo una observacion de cada unade las variables aleatorias Zt que definen el proceso estocastico indexado en eltiempo, por tanto, una serie de tiempo (una trayectoria) es una realizacion deun proceso estocastico.

Figura 6.1: Realizaciones de un proceso estocastico. Fuente: Martınez [8].

En la Figura 6.1 se ilustran cuatro realizaciones de un proceso estocasti-co, siendo que el conjunto de todas las trayectorias posibles es el proceso

157

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ

158 CAPITULO 6. CARACTERIZACION DE LOS CICLOS

estocastico, en tanto que la serie de tiempo de la cual se dispone (la suce-sion o conjunto de datos historicos), es solo una de todas estas trayectoriasaleatorias posibles.

Para realizar la modelacion estadıstica (hacer estimaciones y pronosticos)de una serie de tiempo es necesario conocer la estructura probabilıstica delproceso estocastico al que corresponde la serie. Esto es, es necesario conocerla distribucion conjunta de las n variables de la serie {Zt}1≤t≤n y por tanto ladistribucion de cada una de tales variables. Para poder estimar la distribucionconjunta se necesitarıa un gran numero de realizaciones del proceso estocasti-co, pero esto es imposible porque solo se cuenta con una unica realizacion delproceso, es decir solo se tiene la serie historica de valores!!!. Como solucion aeste problema se hacen los siguientes supuestos:

1. La distribucion conjunta de las n variables es normal multivariada. Enese sentido, basta entonces conocer las medias, varianzas y covarianzaspara determinar tal distribucion. En este punto se definen las siguientesfunciones:

a) Funcion de medias del proceso: µt = E[Zt], t = 1, 2, . . .

b) Funcion de varianzas del proceso: σ2t = Var[Zt], t = 1, 2, . . .

c) Funcion de autocovarianzas del proceso: medida de la dependencialineal entre variables aleatorias del mismo proceso estocastico, o co-varianza en dos instantes de tiempo, Cov[Zt, Zt+k], t = 1, 2, . . .

d) Funcion de autocorrelacion: Correlacion entre variables aleatoriasdel mismo proceso estocastico, Corr[Zt, Zt+k] =

Cov[Zt,Zt+k]√σ2

t σ2t+k

, t = 1, 2, . . .

2. Las caracterısticas o propiedades transversales del proceso (medias, va-rianzas y la funcion de distribucion) son estables en el tiempo, es decirel proceso estocastico es estacionario.

6.2. Procesos estacionarios en sentido debil, o estacionarie-

dad de segundo orden o estacionariedad en covarianza

Un proceso es estacionario en covarianza cuando cumple todas y cada unade las siguientes tres condiciones:

1. El proceso es estacionario en media (la media es constante): µt = µ,

2. El proceso es estacionario en varianza (la varianza es constante): σ2t = σ2,

3. La autocovarianza solo depende de la distancia en el tiempo de las va-riables del proceso: γ(k) = Cov[Zt, Zt+k] = Cov[Zt−k, Zt] = γ(−k), de dondepara k ∈ Z, γ(k) es una funcion simetrica alrededor de cero con γ(0) =Var[Zt].

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ

6.2. PROCESOS ESTACIONARIOS EN COVARIANZA 159

0 1 2 3 4−1−2−3−4

γ(k)

k

Figura 6.2: Ejemplo γ(k) de un procesos estacionario

En consecuencia, ρ(k) = Corr[Zt, Zt+k] = Corr[Zt−k, Zt] = ρ(−k) tambien esuna funcion simetrica alredededor de cero con ρ(0) = 1. La grafica de ρ(k)es llamada correlograma o Funcion de autocorrelacion.

La Figura 6.3 ilustra dos procesos estacionarios en covarianza y sus res-pectivos correlogramas para k ∈ Z+. En la Figura 6.4 se ilustran dosprocesos no estacionarios en covarianza. En el caso (a) el proceso es esta-cionario en media pues la serie tiende a variar alrededor de una constantepero no es estacionaria en varianza ya que la dispersion alrededor de lamedia esta aumentando con el tiempo, mientras que en (b) el procesoes estacionario en varianza pero no en media pues la serie oscila convariabilidad constante alrededor de una tendencia no lineal.

4. Los procesos estacionarios en covarianza deben cumplir ademas conpropiedades ergodicas, es decir, que a partir de una unica realizaciondel proceso se puedan estimar las caracterısticas de este y que tales esti-maciones sean “mejores” a medida que se aumente el tamano muestral olongitud de tal realizacion o serie. En este sentido, “nuevos datos debenaportar informacion adicional”. Para que el proceso estacionario en co-varianza sea ergodico basta con que se cumpla que lım

k→∞ρ(k) = 0 con una

velocidad de convergencia “rapida”. La ergodicidad implica que con laserie que se tiene a mano se pueden obtener estimadores consistentesde los parametros del proceso, es decir la ergodicidad permite equiva-lencias entre valores esperados y estimaciones muestrales obtenidas deuna realizacion suficientemente larga del proceso: Sean µ, σ2 y γ(k) losestimadores basados en una serie de tamano n, para µ, σ2 y γ(k), respec-tivamente. Entonces, si el proceso es ergodico tenemos que,

a) lımn→∞

µ = µ, donde µ = 1n

n∑t=1

Zt.

b) lımn→∞

σ2 = σ2, donde σ2 = 1n

n∑t=1

(Zt − µ)2

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


Figura 6.3: Dos procesos estacionarios en covarianza. Fuente: Martınez [8]

Figura 6.4: Dos procesos no estacionarios en covarianza. Fuente: Martınez [8]

c) lımn→∞

γZ(k) = γZ(k), donde γ(k) = 1n

n∑t=k+1

(Zt−k − µ)(Zt − µ), o bien, γ(k) =

1n

n−k∑t=1

(Zt − µ)(Zt+k − µ),

es decir, los estimadores son consistentes. Note que lımk→∞

ρ(k) = 0 implica

que a medida que aumenta la distancia en el tiempo entre las obser-vaciones de la serie, disminuye la autocorrelacion. En general, supon-dremos que todo proceso estacionario en covarianza es ergodico.

Note que: segun la definicion de procesos estacionarios en covarianza unaserie de tiempo que presente tendencia no constante y/o componente esta-cional no es estacionaria en covarianza, puesto que la media es funcion deltiempo a traves de las componentes de tendencia y estacionalidad. Tampocopuede ser estacionaria en covarianza cualquier serie heterocedastica (de vari-

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ

6.2. PROCESOS ESTACIONARIOS EN COVARIANZA 161

anza no constante).

6.2.1. Procesos de ruido

Un proceso de ruido es un proceso estacionario en covarianza con las si-guientes caracterısticas:

1. La media es constante e igual a cero: µt = 0, ∀ t;

2. La varianza es constante: σ2t = σ2, ∀ t;

3. La autocovarianza es cero y por tanto tambien la autocorrelacion: γ(k) =0, k 6= 0.

Observe que la tercera condicion no implica independencia entre las variablesdel proceso de ruido, solo implica que no hay asociacion de tipo lineal. Enlos procesos de ruido los datos pasados no proporcionan informacion sobre elfuturo, es decir el proceso es sin memoria!!! y por tanto el mejor pronostico esla media del proceso. En la Figura 6.5 se ilustra la funcion de autocovarianzade un proceso de ruido.

0 1 2 3 4−1−2−3−4

γ(k)

k

Figura 6.5: Funcion de autocovarianza γ(k) de un procesos de ruido

6.2.2. Procesos de ruido blanco

Cuando las variables de un proceso de ruido son independientes este esdenominado ruido blanco, un caso particular es cuando el proceso de ruidoes normal multivariado, entonces en ese caso γ(k) = 0 para k 6= 0, implicaindependencia.

Nota: Cuando comenzamos ajustando un modelo de regresion lineal ono lineal a una serie de tiempo, con errores aditivos, suponemos en prin-cipio que los errores de ese modelo son un ruido blanco normal, es decir

Etiid∼ R.B N(0, σ2). En general, esperamos que Et sea al menos estacionario en

covarianza.

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


6.3. Procesos estacionarios en sentido fuerte o estrictamente

estacionarios

La estacionariedad debil o en covarianza no garantiza la estabilidad com-pleta del proceso, es necesario ademas de la estacionariedad debil o en co-varianza, que la funcion de distribucion conjunta de cualquier subconjunto(Zt1 , Zt2 , · · · , Ztm) de las variables aleatorias del proceso estocastico no cambieante desplazamientos en el tiempo, es decir, si FZ(·) representa la funcion dedistribucion conjunta del proceso {Zt}t∈Z+, entonces

FZ(Zt1 , Zt2, · · · , Ztm) = FZ(Zt1+τ , Zt2+τ , · · · , Ztm+τ ), ∀ m, τ, t1, t2, · · · , tm.

Ası, si los primeros momentos de FZ existen, se sigue que E[Zt] = E[Zt+τ ] = µ,de donde E[(Zt − µ)2] = E[(Zt+τ − µ)2] = σ2 y si suponemos que la distribucionconjunta es normal multivariada y el proceso es estacionario en covarianza,entonces el proceso es tambien estacionario en sentido fuerte!!!.

6.4. Funcion de autocovarianza y autocorrelacion muestral

Previamente en la Seccion 6.1 se definieron las funciones de autocovarian-za y de autocorrelacion poblacionales. Suponga que se tiene una realizacionde longitud n de un proceso estacionario en covarianza, {Zt}1≤t≤n, es decir,tenemos la serie Z1, Z2, · · · , Zn. De la Seccion 6.2 tenemos que la funcion deautocovarianza muestral es (considere solo k > 0).

γ(k) =1

n

n∑

t=k+1

(Zt−k − Z)(Zt − Z), o bien, γ(k) =1

n

n−k∑

t=1

(Zt − Z)(Zt+k − Z) (6.1)

de donde tambien resulta que la funcion de autocorrelacion muestral es

ρ(k) =γ(k)

γ(0)=

n∑t=k+1

(Zt−k − Z)(Zt − Z)

n∑t=1

(Zt − Z)2

=

n−k∑t=1

(Zt − Z)(Zt+k − Z)

n∑t=1

(Zt − Z)2

(6.2)

Nota: Para las estimaciones de las funciones de autocovarianza y autocor-relacion para la serie de errores de un modelo estadıstico de una serie detiempo Yt, con errores aditivos E1, E2, · · · , En los cuales son variables no ob-servables, usamos en su lugar los residuales respectivos E1, E2, · · · , En, para

los cuales siempre se cumple que¯E = 1

n

n∑t=1

Et = 0.

De las dos ecuaciones anteriores deberıa notarse que no es posible obtenerlas estimaciones para cualquier valor de rezago o retardo k, desde que esnecesario que k + 1 ≤ n, o equivalentemente, k ≤ n − 1. Tambien, note que loscalculos de estas estimaciones solo involucran n− k de las observaciones, portanto, a medida que aumenta k disminuye n − k y por tanto se hacen menos

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ

6.5. USO DE LA FAC MUESTRAL PARA PROBAR RUIDO BLANCO 163

precisas las estimaciones en los rezagos de mayor valor al involucrar menosterminos de la serie. En general se aconseja solo estimar los valores de estasfunciones para k = 1, 2, · · · , m, con m = [n/4] donde [ ] denota la parte entera.Por ejemplo, para una serie de longitud n = 42 estimarıamos la autocovarianzay la autocorrelacion para k = 1, 2, · · · , 10.

Lo usual es presentar las estimaciones graficamente, es decir, graficar lafuncion de autocovarianza muestral y la funcion de autocorrelacion muestralvs. el valor de k. A la segunda grafica se le llama la ACF o FAC muestral. En Rcontamos con la funcion acf() .

acf(x, lag.max = NULL,t ype = c("correlation", "covariance", "partial"),plot = TRUE, na.action = na.fail, demean = TRUE, ...)

donde x es un objeto serie de tiempo, o un vector numerico, type= “correlation ”construye la ACF, y con type= “covariance ” se obtiene la grafica de la funcionde autocovarianza muestral. Para especificar el numero maximo de rezagosusamos el argumento lag.max=m con m correspondiendo al valor en numerosde [n/4].

6.5. Uso de la FAC muestral para probar que los errores de

un modelo de serie de tiempo son R.B

Bartlett (1946), establecio lo siguiente: Suponga que E1, E2, · · · , En es una

serie de tiempo proveniente de un proceso estacionario en covarianza de media

cero, con funcion de autocorrelacion ρ(k) y su estimador ρ(k). Si ρ(k) = 0 para

k > q, entonces

VAR[ρ(k)] ≈ 1

n

(1 + 2

q∑

j=1

[ρ(j)]2

). (6.3)

En particular, si la serie fuese una realizacion suficientemente larga de un pro-

ceso de ruido blanco entonces q = 0 y por tanto

VAR[ρ(k)] ≈ 1

ny ademas, ρ(k)

aprox.∼N

(0,

1

n

). (6.4)

Con base en este resultado, hacemos uso de la FAC muestral para probarque la serie de errores Et del modelo considerado para una serie dada es unproceso de ruido blanco, realizando m = [n/4] pruebas del tipo

H0 : ρ(k) = 0 versus H1 : ρ(k) 6= 0 (6.5)

k = 1, 2, · · · , m. En cada caso, si la prueba correspondiente es realizada a unnivel de significancia de aproximadamente 5 %, se rechaza H0 en favor de H1 si|ρ(k)| > 2/

√n. La FAC muestral permite chequear rapidamente estas m prue-

bas trazando en la grafica los lımites ±2/√n. Se rechaza que los errores son

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


un ruido blanco si para algun k se observa que |ρ(k)| > 2/√n, es decir, cuando

en al menos una de las m pruebas descritas por (6.5) se rechaza la correspon-diente hipotesis nula.

6.5.1. Ejemplos

Considere las siguientes series at, Z1,t, Z2,t, Z3,t y Z4,t, t = 1, 2, · · · , 100

t at Z1,t Z2,t Z3,t Z4,t t at Z1,t Z2,t Z3,t Z4,t

1 -0.47 -1.76 0.00 0.10 -0.53 51 -1.81 -0.36 1.10 0.56 -1.092 -0.88 -1.14 2.35 -0.43 -0.70 52 0.19 -1.12 2.16 -1.37 0.863 -1.22 -0.45 1.51 1.42 0.03 53 -0.21 -0.61 -0.58 3.77 -1.334 1.75 1.71 4.27 -0.58 0.51 54 -0.31 0.37 0.79 -1.38 0.835 -0.35 1.10 3.52 -0.80 -0.06 55 0.42 -0.85 -1.05 0.50 -0.076 0.30 -0.40 3.91 0.51 1.76 56 0.16 -0.56 -0.86 0.03 -3.307 -1.91 0.02 4.11 -0.00 -0.64 57 -0.25 0.39 -1.14 1.26 2.018 -0.43 1.75 5.62 0.36 0.40 58 2.41 -2.19 0.86 -3.55 -1.259 0.11 1.24 3.84 -1.15 -0.81 59 0.73 -0.75 -1.47 3.04 1.55

10 -0.80 0.95 6.06 1.56 -1.08 60 0.08 -2.64 -0.04 -0.83 -0.3211 1.68 1.55 4.34 -1.65 -0.08 61 -0.02 -1.85 -0.72 0.09 1.1512 0.15 2.77 5.68 2.40 0.68 62 0.40 -1.58 0.01 0.05 -0.7413 -1.55 1.79 4.80 -2.22 0.14 63 -0.89 1.72 0.45 0.01 -0.9214 -0.19 1.47 6.36 0.12 -1.15 64 1.06 2.70 -1.97 -0.66 0.1815 0.61 1.42 5.96 2.53 -0.30 65 1.12 2.87 -0.68 0.75 0.7116 1.10 1.15 6.64 -3.15 0.35 66 -0.24 1.82 -3.55 -1.17 0.3817 -1.34 2.05 5.74 0.89 0.42 67 0.01 0.78 -2.25 0.74 -0.1718 -0.74 0.78 7.12 -0.84 0.25 68 -2.13 -0.74 -1.91 -1.59 -1.6019 0.08 -0.46 6.07 2.34 0.86 69 0.10 -1.50 -2.37 1.21 1.3120 -0.49 -0.76 6.72 -0.27 -0.73 70 0.75 -2.54 -1.38 -0.76 -0.1421 0.25 -1.95 5.91 -0.06 0.30 71 1.06 -0.60 -2.91 0.62 -0.0622 -0.16 -1.50 4.31 -1.76 0.85 72 -1.38 -0.61 -1.48 -0.19 0.6423 -0.49 -2.60 3.98 -0.38 0.44 73 0.95 -1.20 -2.01 -1.23 -0.8124 0.22 -1.33 3.70 1.53 -0.24 74 0.48 -0.01 -2.50 0.47 -1.3425 0.31 -1.48 4.35 -0.13 -0.65 75 1.33 1.01 -3.06 -1.59 -0.2026 1.98 -1.31 4.19 1.24 -0.09 76 -0.30 1.27 -3.38 2.60 0.3127 -1.52 -1.52 2.83 -2.30 0.21 77 1.44 3.62 -4.59 0.20 -1.0328 0.31 -2.22 4.62 1.70 -0.89 78 -1.10 3.53 -5.05 -0.86 0.5729 0.16 0.36 5.90 -1.31 1.13 79 -0.38 3.10 -3.81 -0.86 -1.3830 0.43 0.13 6.57 0.05 -2.01 80 -1.28 1.88 -3.44 1.59 -1.5531 -0.69 -0.36 5.66 1.86 1.82 81 0.20 1.10 -3.12 -2.16 0.8732 0.97 -1.89 5.12 -2.46 -0.00 82 -0.50 2.21 -3.40 -0.23 -1.0033 1.72 -2.43 5.13 -1.97 -0.74 83 0.51 0.87 -0.92 -0.53 0.0934 -0.04 -2.06 5.07 2.98 -0.18 84 0.74 0.17 -1.77 1.71 -0.7935 -0.75 -0.17 2.56 -1.97 1.19 85 1.53 2.29 -2.03 -1.00 -0.5736 0.56 -1.09 3.12 0.65 -0.07 86 -2.44 2.77 -0.71 -0.90 -0.5937 1.88 -2.67 3.97 -2.24 0.69 87 -1.00 1.61 -1.32 2.00 -0.9738 -0.41 -1.15 2.59 3.15 -1.71 88 -0.14 1.16 -2.23 -2.91 -1.0139 -1.73 0.05 3.14 -2.42 1.85 89 -0.31 0.04 -1.97 1.61 0.8340 -1.41 -0.30 3.57 1.32 0.22 90 1.35 0.12 -1.25 -1.02 -1.0041 -0.02 0.39 3.27 -0.59 -2.37 91 1.04 -0.22 -0.62 0.10 -1.1642 0.61 1.65 3.11 -1.21 0.70 92 -0.65 0.33 -2.53 0.34 -0.2843 -0.30 1.32 3.80 2.56 1.48 93 -0.77 0.27 -0.33 -0.45 -0.3044 -1.15 1.17 3.33 -0.30 -0.79 94 1.93 0.88 -2.10 0.00 -0.9645 0.28 0.74 2.88 -0.50 -0.15 95 -0.35 1.63 1.13 -1.17 1.2246 0.28 1.90 3.40 -0.61 -0.45 96 0.34 3.43 -1.24 1.63 -1.6547 -1.42 0.54 1.41 0.55 -0.57 97 1.20 2.60 -0.89 -0.95 1.2448 0.51 0.96 1.07 0.36 1.16 98 0.35 0.59 -1.29 2.36 -0.2849 -0.18 1.11 1.20 0.04 -0.61 99 -1.22 -0.30 -0.72 -1.69 1.0350 -1.04 -0.71 2.61 -0.62 -1.09 100 0.87 -1.01 1.83 0.42 -1.31

A continuacion se presentan las graficas de estas series y sus respectivas

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


ACF’s (ver Codigo R 6.1).

Time

a t

0 20 40 60 80 100

−2

−1

01

2

0 5 10 15 20 25

−0.

20.

00.

20.

40.

60.

81.

0

Lag

AC

F

ACF de la serie at

Figura 6.6: Serie at y su FAC muestral

Time

Z1t

0 20 40 60 80 100

−2

−1

01

23

0 5 10 15 20 25

−0.

20.

00.

20.

40.

60.

81.

0

Lag

AC

F

ACF de la serie Z1t

Figura 6.7: Serie Z1,t y su FAC muestral

Time

Z2t

0 20 40 60 80 100

−4

−2

02

46

0 5 10 15 20 25

−0.

50.

00.

51.

0

Lag

AC

F

ACF de la serie Z2t

Figura 6.8: Serie Z2,t y su FAC muestralESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


Time

Z3t

0 20 40 60 80 100

−2

02

4

0 5 10 15 20 25

−0.

50.

00.

51.

0

Lag

AC

F

ACF de la serie Z3t


Time

Z4t

0 20 40 60 80 100

−3

−2

−1

01

2

0 5 10 15 20 25

−0.

4−

0.2

0.0

0.2

0.4

0.6

0.8

1.0

Lag

AC

F

ACF de la serie Z4t


Para cada una de las anteriores series determine si es una realizacion deun proceso que es:

Estacionario en covarianza ¿por que? ¿Hay patrones en la FAC respecti-va?

Ruido blanco ¿por que?

Codigo R 6.1.

#LECTURA DE ARCHIVO DE DATOS datosejemFACS.txt#EL ARCHIVO TIENE EL NOMBRE DE LAS SERIES EN LA PRIMERA FILA#LAS COLUMNAS SON EN SU ORDEN at, z1t, z2t, z3t y z4tdatos=read.table(file.choose(),header=T)

#TODAS LAS CINCO SERIES TIENEN MISMO INDICE t=1 a 100#PODEMOS CREAR MATRIZ DE SERIES datosdatos=ts(datos,freq=1)

#GRAFICANDO CADA SERIE Y SU ACF MUESTRALwin.graph(height=4,width=7,pointsize=8)plot(datos[,1],lwd=2,ylab=expression(a[t]))abline(h=0,lty=2)win.graph(height=4,width=7,pointsize=8)acf(datos[,1],lag.max=25,ci.type="ma",ci.col="red",main=expression(paste("ACF de la serie ",sep=" ",a[t])),lwd=2)

win.graph(height=4,width=7,pointsize=8)plot(datos[,2],lwd=2,ylab=expression(Z[1 * t]))abline(h=0,lty=2)

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


win.graph(height=4,width=7,pointsize=8)acf(datos[,2],lag.max=25,ci.type="ma",ci.col="red",main=expression(paste("ACF de la serie ",sep=" ",Z[1 * t])),lwd=2)

win.graph(height=4,width=7,pointsize=8)plot(datos[,3],lwd=2,ylab=expression(Z[2 * t]))abline(h=0,lty=2)win.graph(height=4,width=7,pointsize=8)acf(datos[,3],lag.max=25,ci.type="ma",ci.col="red",main=expression(paste("ACF de la serie ",sep=" ",Z[2 * t])),lwd=2)



Considere ahora las ACF’s de la serie del ındice mensual de salario real y delos residuales de sus tres modelos ajustados en el ejemplo presentado en laSeccion 5.2.1, pagina 109:

0 5 10 15 20 25 30 35

−0.

50.

00.

5

Lag

AC

F

ACF serie índice salario real, ener.1990 − nov. 2001

0 5 10 15 20 25 30 35

−0.

40.

00.

20.

40.

60.

8

Lag

AC

F

ACF residuales modelo 1para serie del índice mensual salario real

0 5 10 15 20 25 30 35

−0.

40.

00.

20.

40.

60.

8

Lag

AC

F


0 5 10 15 20 25 30 35

−0.

40.

00.

20.

40.

60.

8

Lag

AC

F


Figura 6.11: FAC’s Serie ındice de salario y residuales de modelos ajustados

Basados en las ACF’s ¿que podemos decir sobre la estacionariedad de laserie y de los errores de los modelos ajustados? ¿Para cada modelo podemos

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


decir que sus errores son ruido blanco? ¿por que?, ¿Que patron particular sedestaca en la ACF de la serie de datos del ındice de salario?

El codigo R utilizado en la obtencion de la grafica anterior es el siguiente:

Continuacion Codigo R 5.1

#ACF SOBRE LA SERIE DE DATOS Y RESIDUALES MODELOS AJUSTADOSm=length(salario)/4nf=layout(rbind(c(1,2),c(3,4)))

acf(as.numeric(salario),lag.max=m,ci.type="ma",ci.col="red",main="ACF serie ´ındice salario real, ener.1990 - nov. 2001")acf(residuals(modelo1),lag.max=m,ci.type="ma",ci.col="red",main="ACF residuales modelo 1\npara serie del ´ındice mensual salario real")acf(residuals(modelo2),lag.max=m,ci.type="ma",ci.col="red",main="ACF residuales modelo 2\npara serie del ´ındice mensual salario real")acf(residuals(modelo3),lag.max=m,ci.type="ma",ci.col="red",main="ACF residuales modelo 3\npara serie del ´ındice mensual salario real")

A continuacion, la ACF para la serie del logaritmo natura de la serie deproduccion trimestral de cemento y de los residuales del modelo ajustado enla Seccion 5.3.3:

0 10 20 30

−0.

50.

00.

5

Lag

AC

F

ACF serie log producción cemento, Q1.1990 − Q3.1994

0 10 20 30

−0.

20.

20.

6

Lag

AC

F

ACF residuales modelo 1para serie log producción de cemento

Figura 6.12: FAC’s Serie log produccion trimestral cemento portland y residuales de mod-

elo ajustado

¿Que podemos decir sobre la estacionariedad de la serie y de los erroresdel modelo ajustado en la Seccion 5.3.3? ¿podemos decir que sus errores sonruido blanco? ¿por que?, ¿Hay algun patron particular en la ACF de la seriede datos del log de produccion de cemento?

La anterior figura fue obtenida con el siguiente codigo R:

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ



m=length(lnyt)/4nf=layout(c(1,2))

acf(as.numeric(lnyt),lag.max=m,ci.type="ma",ci.col="red",main="ACF serie log produccion cemento, Q1.1990 - Q3.1994")acf(residuals(modelo1),lag.max=m,ci.type="ma",ci.col="red",main="ACF residuales modelo 1\npara serie log produccion de cemento")

Finalmente, considere la serie simulada presentada en la Seccion 5.3.1.Para esta serie se ajusta un modelo de tendencia lineal sin estacionalidad. Lasgraficas de la serie de datos y su ACF y de la serie de residuales y su ACF sepresentan a continuacion. Concluya sobre la estacionariedad de la serie y delos errores del modelo ajustado ¿son estos ultimos un ruido blanco?

serie simulada

Time

yt

1980 1985 1990 1995 2000 2005

010

000

3000

050

000

7000

0

0 20 40 60

−0.

50.

00.

51.

0

Lag

AC

F

ACF Serie simulada

Figura 6.13: Serie Yt simulada y su FAC muestral

Serie residuales modelo ajustado a serie simulada

Time

resi

dual

s(re

gres

ion)

0 50 100 150 200 250 300

−10

000

−50

000

5000

1000

0

0 20 40 60

0.0

0.2

0.4

0.6

0.8

1.0

Lag

AC

F

ACF Residuales modelo ajustado a serie simulada

Figura 6.14: Serie residuales modelo lineal ajustado a serie simulada y su FAC muestral

Si la serie Yt es filtrada a traves de su primera diferencia, es decir, Yt =

Yt − Yt−1 (estamos utilizando un filtro lineal1∑

i=0

wiYt−i, con w0 = 1 y w1 = −1), la

serie resultante en este caso es de tendencia constante. En la siguiente figurase ilustra la serie de la primera diferencia y su ACF ¿Que se concluye acercade la estacionariedad de la primera diferencia?

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


Serie primera diferencia para serie simulada

Time

dife

r

1980 1985 1990 1995 2000 2005

−15

000

−50

000

5000

1000

015

000

0 20 40 60

−0.

50.

00.

51.

0

Lag

AC

F

ACF Primera diferencia para serie simulada

Figura 6.15: Primera diferencia de la serie simulada y su FAC muestral

El codigo R usado en este ultimo ejemplo fue el siguiente

Codigo R 6.2.

yt=scan(file.choose()) #leer archivo datossimuleje1recursivos.txtyt=ts(yt,freq=12,start=c(1980,1))t=1:length(yt)regresion=lm(yt˜t) #MODELO DE TENDENCIA LINEAL

#ACF SERIE DE DATOS SIMULADA Y PARA LOS RESIDUALES MODELO AJUSTADOm=length(yt)/4win.graph(height=4,width=7,pointsize=8)plot(yt,main="serie simulada")

win.graph(height=4,width=7,pointsize=8)acf(as.numeric(yt),lag.max=m,ci.type="ma",ci.col="red",main="ACF Serie simulada")

win.graph(height=4,width=7,pointsize=8)plot.ts(residuals(regresion),main="Serie residuales modelo ajustado a serie simulada")abline(h=0,lty=2)

win.graph(height=4,width=7,pointsize=8)acf(residuals(regresion),lag.max=m,ci.type="ma",ci.col="red",main="ACF Residuales modelo ajustado a serie simulada")

#CREANDO SERIE DE LA PRIMERA DIFERENCIA DE LA SERIE SIMULADA Y(t)-Y(t-1)difer=diff(yt)

#GRAFICA SERIE DE LA PRIMERA DIFERENCIA Y SU ACFm=length(difer)/4win.graph(height=4,width=7,pointsize=8)plot(difer,main="Serie primera diferencia para serie simulada")abline(h=0,lty=2)

win.graph(height=4,width=7,pointsize=8)acf(as.numeric(difer),lag.max=m,ci.type="ma",ci.col="red",main="ACF Primera diferencia para serie simulada")ESTADÍS

TICA III

- 300

9137

NELFI G

ONZÁLEZ

6.6. TEST DE BOX-PIERCE Y TEST LJUNG-BOX 171

6.6. Test de Box-Pierce y Test Ljung-Box

En la seccion previa vimos que la funcion de autocorrelacion muestral (ACFo FAC) puede ser usada para probar que un proceso estocastico estacionarioen covarianza de media cero, es un proceso de ruido blanco, mediante m =[n/4] pruebas de hipotesis separadas, del tipo

H0 : ρ(k) = 0 versus H1 : ρ(k) 6= 0,

para k = 1, · · · , m cada una de estas pruebas realizadas a un nivel de sig-nificancia de aproximadamente el 5 %. Sin embargo con esta metodologıala probabilidad de cometer un error tipo I en al menos una de las m prue-bas es (suponiendo que las m pruebas son independientes) aproximadamente1− (1− 0.05)m, es decir, mucho mas grande que 0.05.

Una prueba alternativa a la FAC es aquella que supone en la hipotesis nulaque todas las autocorrelaciones para k = 1, · · · , m son nulas conjuntamente,es decir:

H0 : ρ(1) = ρ(2) = · · · = ρ(m) = 0 vs. H1 : ρ(k) 6= 0 para algun k, k = 1, 2, · · · , m.(6.6)

La hipotesis nula implica que el proceso es un ruido blanco mientras quela hipotesis alternativa rechaza el ruido blanco. Con esta prueba podemosgarantizar que el nivel de significancia es del 5 % u otro que se quiera usar.Hay dos metodos para hacer esta prueba, veamos:

6.6.1. Test de Box-Pierce

Sea {Et}t≥1 un proceso de ruido blanco. Entonces para una realizacion su-

ficientemente grande (E1, E2, · · · , En con n grande), ρ(k)aprox.∼N

(0,

1

n

)para to-

do k y ρ(1), · · · , ρ(m) son aproximadamente independientes. Por consiguiente,√nρ(k)

aprox.∼N (0, 1)⇒ nρ2(k)aprox.∼ χ2

1, y por tanto,

QBP = nm∑

k=1

ρ2(k)aprox.∼ χ2

m (6.7)

donde la distribucion asintotica chi cuadrado es valida bajo H0. De la Figura6.16, se tiene que a un nivel de significancia α se rechaza H0 si QBP ≥ χ2

α,m,o bien, si para el valor P de la prueba se cumple que VP = P (χ2

m ≥ QBP) ≤ α(menor que el nivel de significancia usado). Note que cuando H0 es cierta,todos los ρ(k) deberıan ser proximos a cero y por tanto el valor del estadısticoQBP deberıa ser tambien muy pequeno (estadısticamente hablando), pero siH0 es falsa, entonces algun (o algunos) ρ(k) es estadısticamente significativo odistinto de cero, por tanto el estadıstico de prueba QBP resultarıa grande enterminos estadısticos, luego, para evaluar si QBP es grande, la region crıtica

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


Región crítica de nivel α en la distribución χm2

χ2α,m

Figura 6.16: Region crıtica de nivel α para el test Box-Pierce y Ljung-Box

bajo la distribucion chi cuadrado es de cola derecha, y comparamos el valorobservado contra aquella cantidad que en la distribucion chi cuadrado corres-pondiente constituye el lımite que separa las cantidades significativamentegrandes de las que no lo son.

6.6.2. Prueba de Ljung-Box

Con el fin de mejorar la aproximacion de la distribucion del estadıstico deprueba Box-Pierce en muestras pequenas, Ljung y Box hicieron una modifi-cacion del estadıstico QBP, en la cual en vez de sumar directamente los ρ(k)con peso igual a 1, ponderaron cada uno con un peso igual a (n + 2)/(n − k),respectivamente, es decir, el estadıstico de prueba es

QLB = n(n + 2)m∑

k=1

ρ2(k)

n− kaprox.∼ χ2

m (6.8)

donde la distribucion asintotica chi cuadrado es valida bajo H0. De nuevo, laregion crıtica o de rechazo a un nivel de significancia α es como la indicada enla Figura 6.16 y rechazamos H0 si QLB ≥ χ2

α,m, o bien, si para el valor P de laprueba se cumple que VP = P (χ2

m ≥ QLB) ≤ α.

6.6.3. Pruebas Box-Pierce y Ljung-Box en R

En R es posible realizar los testes Box-Pierce y Ljung-Box mediante la fun-cion

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


Box.test(x, lag = 1, type = c("Box-Pierce", "Ljung-Box"), fitdf = 0)

donde

x : Un vector numerico o una serie univariada.

lag : el numero maximo de rezagos m a ser considerados.

type : para especificar el test deseado. type =“Box-Pierce ” para el testde Box-Pierce y type =“Ljung-Box ” para el test Ljung-Box.

Por ejemplo, considere las series at, Z1,t, Z2,t, Z3,t y Z4,t, t = 1, 2, · · · , 100 presen-tadas en la Sesion 6.5.1. Para estas series tenemos:

Codigo R 6.3.

#LECTURA DE ARCHIVO DE DATOS datosejemFACS.txt#EL ARCHIVO TIENE EL NOMBRE DE LAS SERIES EN LA PRIMERA FILAdatos=read.table(file.choose(),header=T)


#Separando las seriesat=datos[,1]Z1t=datos[,2]Z2t=datos[,3]Z3t=datos[,4]Z4t=datos[,5]

#Calculando m=[n/4]. Todas las series aqu´ı tienen longitud#igual al numero de filas de la matriz de datosm=floor(nrow(datos)/4)

#La siguiente funcion BP.LB.test es creada para calcular#El teste Box-Pierce y Ljung-Box con rezagos maximos de 6, 12,...,[m/6] * 6BP.LB.test=function(serie,maxlag,type="Box"){aux=floor(maxlag/6);X.squared=c(rep(NA,aux))df=c(rep(NA,aux))p.value=c(rep(NA,aux))for(i in 1:aux){test=Box.test(serie,lag=(6 * i),type=type)X.squared[i]=test[[1]]df[i]=test[[2]]p.value[i]=test[[3]]}lag=6 * c(1:aux)teste=as.data.frame(cbind(X.squared,df,p.value))rownames(teste)=lagteste}

#Calculando test Box-Pierce para cada serieBox.at=BP.LB.test(at,maxlag=m,type="Box")Box.Z1t=BP.LB.test(Z1t,maxlag=m,type="Box")Box.Z2t=BP.LB.test(Z2t,maxlag=m,type="Box")Box.Z3t=BP.LB.test(Z3t,maxlag=m,type="Box")Box.Z4t=BP.LB.test(Z4t,maxlag=m,type="Box")

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


#Calculando Test de Ljung-Box a cada serieLjung.at=BP.LB.test(at,maxlag=m,type="Ljung")Ljung.Z1t=BP.LB.test(Z1t,maxlag=m,type="Ljung")Ljung.Z2t=BP.LB.test(Z2t,maxlag=m,type="Ljung")Ljung.Z3t=BP.LB.test(Z3t,maxlag=m,type="Ljung")Ljung.Z4t=BP.LB.test(Z4t,maxlag=m,type="Ljung")

En la siguiente Salida R ilustramos los resultados de los testes Box-Pierce yLung-Box para la serie at:

Salida R 6.1.

> Box.atX.squared df p.value

6 8.492486 6 0.204195612 12.086374 12 0.438768018 16.641272 18 0.547884724 18.986230 24 0.7527236

> Ljung.atX.squared df p.value

6 8.975562 6 0.174957112 13.034928 12 0.366507118 18.515194 18 0.422229624 21.589075 24 0.6037787

Los resultados obtenidos con el Codigo R 6.3 son organizados en la Tabla 6.1.Como puede verse, en todos los casos se ha realizado el test en la ecuacion(6.6), con m = 6, 12, 18, 24. Segun Box-Pierce, ¿cuales de las series son un ruidoblanco y cuales no? ¿y segun Ljung-Box?

Para la serie de los residuales de los tres modelos ajustados por regresiona la serie del ındice mensual de salario real sector manufacturero (sin trilla decafe), se tiene lo siguiente:


#BOX-PIERCE Y LJUNG-BOX SOBRE LA SERIE DE RESIDUALES MODELOS AJUSTADOSm=length(salario)/4

BP.LB.test=function(serie,maxlag,type="Box"){aux=floor(maxlag/6);X.squared=c(rep(NA,aux))df=c(rep(NA,aux))p.value=c(rep(NA,aux))for(i in 1:aux){test=Box.test(serie,lag=(6 * i),type=type)X.squared[i]=test[[1]]df[i]=test[[2]]p.value[i]=test[[3]]}lag=6 * c(1:aux)teste=as.data.frame(cbind(X.squared,df,p.value))rownames(teste)=lagteste}Box.resmodelo1=BP.LB.test(residuals(modelo1),maxlag=m,type="Box")Box.resmodelo2=BP.LB.test(residuals(modelo2),maxlag=m,type="Box")Box.resmodelo3=BP.LB.test(residuals(modelo3),maxlag=m,type="Box")Ljung.resmodelo1=BP.LB.test(residuals(modelo1),maxlag=m,type="Ljung")Ljung.resmodelo2=BP.LB.test(residuals(modelo2),maxlag=m,type="Ljung")Ljung.resmodelo3=BP.LB.test(residuals(modelo3),maxlag=m,type="Ljung")

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


La Tabla 6.2 presenta los resultados obtenidos con el anterior codigo R. ¿Que pode-mos concluir acerca de los errores de cada modelo, segun los testes de Box-Pierce y Ljung-Box?

Tabla 6.1: Resultados Testes Box-Pierce y Ljung-Box para series simuladas, at, Z1,t, Z2,t,

Z3,t y Z4,t, t = 1, 2, · · · , 100

Resultados para serie at

Test Box-Pierce Test Ljung-Box

m QBP df VP QLB df VP

6 8.49 6.00 0.20 8.98 6.00 0.1712 12.09 12.00 0.44 13.03 12.00 0.3718 16.64 18.00 0.55 18.52 18.00 0.4224 18.99 24.00 0.75 21.59 24.00 0.60

Resultados para serie Z1,t



6 88.31 6.00 0.00 91.52 6.00 0.0012 88.70 12.00 0.00 91.96 12.00 0.0018 90.49 18.00 0.00 94.14 18.00 0.0024 94.25 24.00 0.00 99.12 24.00 0.00




6 456.90 6.00 0.00 482.31 6.00 0.0012 789.35 12.00 0.00 856.54 12.00 0.0018 977.56 18.00 0.00 1082.78 18.00 0.0024 1050.84 24.00 0.00 1177.32 24.00 0.00




6 50.95 6.00 0.00 52.63 6.00 0.0012 55.78 12.00 0.00 58.00 12.00 0.0018 58.84 18.00 0.00 61.80 18.00 0.0024 69.98 24.00 0.00 76.06 24.00 0.00




6 16.83 6.00 0.01 17.44 6.00 0.0112 20.73 12.00 0.05 21.91 12.00 0.0418 23.33 18.00 0.18 25.06 18.00 0.1224 25.78 24.00 0.36 28.24 24.00 0.25

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


Tabla 6.2: Resultados Testes Box-Pierce y Ljung-Box para residuales de los tres modelos

ajustados a serie de ındice mensual de salario real

Resultados para serie de residuales modelo 1



6 264.71 6.00 0.00 272.96 6.00 0.0012 270.27 12.00 0.00 278.96 12.00 0.0018 302.86 18.00 0.00 316.25 18.00 0.0024 368.68 24.00 0.00 394.76 24.00 0.0030 394.45 30.00 0.00 426.91 30.00 0.00




6 266.68 6.00 0.00 275.01 6.00 0.0012 272.30 12.00 0.00 281.06 12.00 0.0018 299.64 18.00 0.00 312.34 18.00 0.0024 358.13 24.00 0.00 382.12 24.00 0.0030 378.81 30.00 0.00 407.91 30.00 0.00




6 266.85 6.00 0.00 275.27 6.00 0.0012 274.91 12.00 0.00 283.90 12.00 0.0018 292.14 18.00 0.00 303.68 18.00 0.0024 345.31 24.00 0.00 367.20 24.00 0.0030 382.26 30.00 0.00 413.44 30.00 0.00

Para los residuales del modelo ajustado al logaritmo de la serie de produc-cion trimestral de cemento, en Codigo R 5.7, tenemos que:


m=length(lnyt)/4BP.LB.test=function(serie,maxlag,type="Box"){aux=floor(maxlag/6);X.squared=c(rep(NA,aux))df=c(rep(NA,aux))p.value=c(rep(NA,aux))for(i in 1:aux){test=Box.test(serie,lag=(6 * i),type=type)X.squared[i]=test[[1]]df[i]=test[[2]]p.value[i]=test[[3]]}lag=6 * c(1:aux)teste=as.data.frame(cbind(X.squared,df,p.value))rownames(teste)=lagteste}

Box.resmodelo1=BP.LB.test(residuals(modelo1),maxlag=m,type="Box")Ljung.resmodelo1=BP.LB.test(residuals(modelo1),maxlag=m,type="Ljung")

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


Tabla 6.3: Resultados Testes Box-Pierce y Ljung-Box para residuales del modelo ajustado

a serie de logaritmo de produccion trimestral de cemento portland

Resultados para serie de residualesmodelo log cuadratico estacional



6 243.65 6.00 0.00 250.18 6.00 0.0012 259.03 12.00 0.00 266.82 12.00 0.0018 265.53 18.00 0.00 274.18 18.00 0.0024 270.39 24.00 0.00 279.93 24.00 0.0030 276.54 30.00 0.00 287.48 30.00 0.0036 288.28 36.00 0.00 302.51 36.00 0.00

A partir de estos resultados ¿Que se concluye para los errores del modeloajustado en el codigo R 5.7?

Finalmente, considere los residuales del modelo de tendencia lineal ajusta-do a la serie ilustrada en la Figura 6.13 usando el codigo R 6.2:


m=length(yt)/4

BP.LB.test=function(serie,maxlag,type="Box"){aux=floor(maxlag/6);X.squared=c(rep(NA,aux))df=c(rep(NA,aux))p.value=c(rep(NA,aux))for(i in 1:aux){test=Box.test(serie,lag=(6 * i),type=type)X.squared[i]=test[[1]]df[i]=test[[2]]p.value[i]=test[[3]]}lag=6 * c(1:aux)teste=as.data.frame(cbind(X.squared,df,p.value))rownames(teste)=lagteste}

Box.resregresion=BP.LB.test(residuals(regresion),maxlag=m,type="Box")Ljung.resregresion=BP.LB.test(residuals(regresion),maxlag=m,type="Ljung")

Los resultados se presentan a continuacion. Compare con lo que se con-cluye a partir de la ACF o FAC muestral ilustrada en la Figura 6.14:ESTADÍS

TICA III

- 300

9137

NELFI G

ONZÁLEZ


Tabla 6.4: Test Box-Pierce y Ljung-Box para los residuales del modelo ajustado a la serie

en la Figura 6.13

Resultados para serie de residuales modelo lineal



6 3.70 6.00 0.72 3.78 6.00 0.7112 6.61 12.00 0.88 6.81 12.00 0.8718 13.28 18.00 0.77 13.86 18.00 0.7424 15.35 24.00 0.91 16.12 24.00 0.8830 17.89 30.00 0.96 18.93 30.00 0.9436 26.18 36.00 0.89 28.26 36.00 0.8242 28.58 42.00 0.94 31.06 42.00 0.8948 34.35 48.00 0.93 37.89 48.00 0.8554 41.61 54.00 0.89 46.76 54.00 0.7560 42.91 60.00 0.95 48.37 60.00 0.8666 48.91 66.00 0.94 56.01 66.00 0.8072 53.32 72.00 0.95 61.81 72.00 0.80

¿Podemos concluir que los errores del modelo lineal para la serie son unruido blanco?

6.7. Procesos Autorregresivos de orden 1, AR(1)

Un proceso {Zt}t≥1 es un proceso AR(1) si satisface

Zt = µ+ φ1(Zt−1 − µ) + at, con at ∼ R.B (6.9)

donde at es independiente de Zt−1, Zt−2, · · · . Note que la ecuacion (6.9) implicaun modelo de regresion lineal entre la serie Zt y sus valores rezagados unlugar en el tiempo, de ahı el nombre autorregresivo de orden 1. Para que Zt

sea estacionario en covarianza, es necesario que satisfaga las tres condicionesenunciadas en la Seccion 6.2. Si Zt es estacionario en covarianza con E[Zt] = θ,entonces de la ecuacion (6.9) obtenemos

θ = µ+ φ1(θ − µ)⇒ θ(1− φ1) = µ(1− φ1)

la ultima igualdad se satisface si θ = µ o bien si φ1 = 1, sin embargo, en esteultimo caso la serie no sera estacionaria en covarianza. Solo si |φ1| < 1 la seriesera estacionaria en covarianza. Si llamamos Zt = Zt − µ, podemos escribir

Zt = φ1Zt−1 + at (6.10)

Tambien de (6.9) y si el proceso es estacionario en covarianza, VAR[Zt] =γ(0) entonces

γ(0) = φ21γ(0) + σ2

a ⇒ γ(0) =σ2

a

1− φ21

, con |φ1| < 1

Bajo el supuesto de estacionariedad en covarianza, si en la ecuacion (6.10)multiplicamos ambos lados por Zt−k y tomamos valor esperado, obtenemos

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ

6.8. TEST DURBIN-WATSON DE INCORRELACION DE ORDEN 1 179

la funcion de autocovarianza γ(k) del proceso Zt (tenga en cuenta que at esindependiente de Zt−k),

γ(k) = φ1γ(k − 1) + E[atZt−k] = φ1γ(k − 1)

y haciendo iterativamente, k = 1, 2, · · · vemos que

γ(k) = φk1 ×

(σ2

a

1− φ21

), con |φ1| < 1

de donde la FAC o ACF teorica corresponde a

ρ(k) =γ(k)

γ(0)= φk

1 con |φ1| < 1. (6.11)

Mas adelante veremos que para la estacionariedad en covarianza del procesoAR(1), es necesario que este pueda escribirse como un filtro lineal de la seriede ruido blanco at (Teorema de representacion de Wold), especıficamente, se

debe cumplir que Zt =∞∑

j=0

φj1at−j con

∞∑j=0

φ2j1 <∞, lo cual es valido solo si |φ1| < 1.

En la Figura 6.17 se muestran las funciones de autocorrelacion teoricas paravarios procesos AR(1). Los procesos representados en la Figura 6.3, tambienson procesos AR(1) estacionarios en covarianza.

Note que la ACF o FAC de un proceso AR(1) tiene un comportamiento de

decaimiento exponencial o amortiguado sobre valores positivos si 0 < φ1 < 1 o

alternando entre valores positivos y negativos si −1 < φ1 < 0. Tambien note de la

ecuacion en (6.11), que para que se cumpla la ergodicidad, es decir, lımk→∞

ρ(k) = 0,

esto solo es posible si |φ1| < 1.

6.8. Test Durbin-Watson de incorrelacion de orden 1

A continuacion vamos a enunciar este teste en relacion a los errores de unmodelo de regresion para una serie Yt:

Yt = f(t,β) + Et (6.12)

donde f(t,β) es una funcion determinıstica del tiempo con vector de parame-tros β y Et es la componente aleatoria de media cero.

6.8.1. Formulacion del test

Sea Et un proceso estacionario en covarianza de media cero representandolos errores del modelo en (6.12). El teste Durbin Watson supone inicialmenteque Et constituye un proceso AR(1) gaussiano estacionario en covarianza, esdecir

Et = φ1Et−1 + at con at ∼ R.B N(0, σ2a) y |φ1| < 1. (6.13)

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


0 2 4 6 8 10 12

k

ρ(k)

1φ1 = 0.9

0 2 4 6 8 10 12

k

ρ(k)

1φ1 = 0.4

0 2 4 6 8 10 12

k

ρ(k)

−1

1 φ1 = − 0.8

0 2 4 6 8 10 12

k

ρ(k)

−1

1 φ1 = − 0.5

Figura 6.17: Ejemplos ρ(k) de procesos AR(1)

De (6.11) se tiene que φ1 = ρ(1). Luego, el teste plantea lo siguiente:

H0 : φ1 = 0, o en forma equivalente H0 : ρ(1) = 0 (6.14)

versus

a) H1 : φ1 > 0 o en forma equivalente H1 : ρ(1) > 0

b) H1 : φ1 < 0 o en forma equivalente H1 : ρ(1) < 0

c) H1 : φ1 6= 0 o en forma equivalente H1 : ρ(1) 6= 0

La eleccion de la hipotesis alternativa generalmente se da entre las dos primerasopciones: a) que prueba autocorrelacion positiva de orden 1, y b) que pruebaautocorrelacion negativa de orden 1. Esta eleccion se hace con base en el valordel estadıstico de prueba.

6.8.2. El estadıstico de prueba

A partir de la hipotesis nula vemos que es necesario calcular el estimadordel coeficiente φ1 o equivalentemente, la autocorrelacion de orden 1 ρ(1). SeanE1, E2, · · · , En los valores estimados (los residuales del modelo de regresion)

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


para la serie de E1, E2, · · · , En. De la ecuacion (6.2), con¯Et = 0, para k = 1

tenemos φ1 = ρ(1) donde

ρ(1) =

n∑t=2

Et−1Et

n∑t=1

E2t

o bien, ρ(1) =

n−1∑t=1

EtEt+1

n∑t=1

E2t

(6.15)

Ahora bien, el estadıstico de la prueba Durbin-Watson es

d1 =

n∑t=2

(Et − Et−1)2

n∑t=1

E2t

(6.16)

Para n grande se tienen las siguientes aproximaciones

n∑

t=2

E2t ≈

n∑

t=2

E2t−1 ≈

n∑

t=1

E2t de donde

n∑

t=2

(Et − Et−1)2 ≈ 2

(n∑

t=1

E2t −

n∑

t=2

Et−1Et

)

Luego, de (6.15) y (6.16) obtenemos

d1 ≈ 2 (1− ρ(1)) . (6.17)

6.8.3. La ejecucion de la prueba

Desde que −1 < ρ(1) < 1 entonces 0 < d1 < 4. Note que

1. Si la verdadera autocorrelacion de orden 1, ρ(1), es igual a cero entoncesse espera que ρ(1) ≈ 0 y ası d1 ≈ 2 y la hipotesis H0 no es rechazada.

2. Si ρ(1) > 0 entonces ρ(1) > 0 y por tanto 0 < d1 < 2 y si este estadısticoes muy pequeno (bastante inferior a 2) entonces la hipotesis H0 debe serrechazada.

3. Si ρ(1) < 0 entonces ρ(1) < 0 y por tanto 2 < d1 < 4 y si este estadısticoes muy grande (bastante superior a 2) entonces la hipotesis H0 tambiendebe ser rechazada.

Con base en lo anterior se tiene que los pasos a seguir para la realizacion delteste Durbin-Watson son: calcular primero el estadıstico d1 y luego elegir entrelas hipotesis alternativas a) y b) en (6.14) con base en la siguiente regla:

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


1. si d1 < 2 probamos que

H0 : φ1 = 0 vs. H1 : φ1 > 0 (Hay autocorrelacion positiva de orden 1 en Et)(6.18)

o equivalentemente

H0 : ρ(1) = 0 vs. H1 : ρ(1) > 0 (Hay autocorrelacion positiva de orden 1 en Et)(6.19)

Para la decision consideramos el valor P del test. Sea DW1 la variablealeatoria que corresponde al estadıstico del test Durbin-Watson de orden1 y α el nivel de significancia de la prueba. Para probar autocorrelacionde orden 1 positiva, el valor P es

VP = P (DW1 < d1) (6.20)

Rechazamos H0 en favor de la hipotesis de autocorrelacion positiva deorden 1 si VP ≤ α.

2. si d1 > 2 probamos que

H0 : φ1 = 0 vs. H1 : φ1 < 0 (Hay autocorrelacion negativa de orden 1 en Et)(6.21)

o equivalentemente

H0 : ρ(1) = 0 vs. H1 : ρ(1) < 0 (Hay autocorrelacion negativa de orden 1 en Et)(6.22)

De nuevo, usamos el valor P para la decision. En este caso, para probarautocorrelacion negativa de orden 1, el valor P es dado por

VP = P (DW1 > d1) (6.23)

y Rechazamos H0 en favor de la hipotesis de autocorrelacion negativa deorden 1 si VP ≤ α.

CUIDADO: En ningun caso, no rechazar la hipotesis nula del test Durbin-Watson conduce a concluir que la serie Et sea incorrelacionada y menos aunun ruido blanco. H0 : ρ(1) = 0 no implica que la funcion de autocorrelacionρ(k) = 0 para todo k ≥ 1, solamente dice que para k = 1 es cero y esto nogarantiza que lo mismo sea valido para los demas valores de k.

6.8.4. Test Durbin-Watson en R

En la librerıa car version 2.0-10 de R se dispone de la funcion durbinWatsonTest()(en versiones anteriores a la version 2.0-0 de la librerıa car la funcion esdurbin.watson() ). Su sintaxis es como sigue:

durbinWatsonTest(model, max.lag=1, simulate=TRUE, reps=1000,method=c("resample","normal"),alternative=c("two.sided", "positive", "negative"), ...)

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


donde

model es un objeto de regresion tipo lm o un vector de residuales de unmodelo lineal

max.lag especifica el orden autorregresivo a probar. Por defecto consi-dera k = 1.

simulate por defecto establece el calculo de los valores P mediante elmetodo de simulacion bootstrap

method especifica el metodo bootstrap a aplicar. “resample ” remuestreade la muestra de residuales observados del modelo; “normal ” muestreade la distribucion N(0, σ2), donde σ2 es la varianza estimada en el modeloajustado.

alternative para max.lag=1 permite especificar el signo de la auto-correlacion en la hipotesis alternativa como “two.sided ” para probarρ(1) 6= 0, “positive ” para probar ρ(1) > 0 y “negative ” para probarρ(1) < 0. Si se especifica max.lag=k con k > 1, entonces la funcion soloconsidera la hipotesis alternativa “two.sided ”.

Veamos la aplicacion de este test a los residuales de algunos de los mode-los ajustados a las series consideradas en este capıtulo, para ello usamos lasiguiente funcion de usuario pruebaDW1() , con la cual se puede obtener losvalores P para las pruebas con autocorrelacion positiva y negativa, en cadacaso:

Codigo R 6.4.

###TEST DURBIN WATSON DE ORDEN 1######library(car)pruebaDW1=function(modelo){dwneg=durbinWatsonTest(modelo,max.lag=1,method="normal",alternative="negative")dwpos=durbinWatsonTest(modelo,max.lag=1,method="normal",alternative="positive")res=data.frame(1,dwneg$r,dwneg$dw,dwpos$p,dwneg$p)names(res)=c("lag","rho estimado","Estad´ıstico D-W","VP rho>0","VP rho<0")res}

Tenga en cuenta que para usar la funcion usuario anterior debe correr elcodigo completo antes de invocarla.


pruebaDW1(modelo1)pruebaDW1(modelo2)pruebaDW1(modelo3)

Con lo anterior obtenemos,

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


Salida R 6.2.

> pruebaDW1(modelo1)lag rho estimado Estad´ıstico D-W VP rho>0 VP rho<0

1 1 0.8005603 0.3258302 0 1> pruebaDW1(modelo2)

lag rho estimado Estad´ıstico D-W VP rho>0 VP rho<01 1 0.8017732 0.3308284 0 1> pruebaDW1(modelo3)

lag rho estimado Estad´ıstico D-W VP rho>0 VP rho<01 1 0.7929206 0.3828777 0 1

de donde,

Tabla 6.5: Resultados Test Durbin-Watson de orden 1 para residuales de los tres modelos

ajustados a la serie de ındice mensual de salario real

H1 : ρ(1) > 0 H1 : ρ(1) < 0Modelo k ρ(1) Estadıstico d1 P (DW1 < d1) P (DW1 > d1)

modelo1 1 0.8005603 0.3258302 0 1modelo2 1 0.8017732 0.3308284 0 1modelo3 1 0.7929206 0.3828777 0 1

¿Que test debe realizarse y que se concluye en cada caso?

Aplicando de manera similar la funcion usuario pruebaDW1() al modeloajustado en el codigo R 6.2, obtenemos:

H1 : ρ(1) > 0 H1 : ρ(1) < 0Modelo k ρ(1) Estadıstico d1 P (DW1 < d1) P (DW1 > d1)

regresion 1 0.0474274 1.9041074 0.1750000 0.8150000

¿Cual test debe realizarse y que se concluye?

6.9. Ejercicio

Considere la serie asignada en el trabajo 1 y los modelos ajustados. Apliquecon cada modelo los testes de ruido blanco con la FAC muestral, Box-Pierce yLjung-Box. Ası mismo realice el teste de incorrelacion Durbin-Watson. Analiceel comportamiento de la FAC muestral de los residuales ¿Hay ergodicidad?¿Hay estacionariedad? ¿Son ruido blanco los errores del modelo?

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ

Capıtulo 7

Introduccion a los modelos ARMA

En el capıtulo anterior fue vista la definicion general de procesos esta-cionarios en covarianza ası como el tipo particular de procesos de ruidos blan-co (R.B) y fueron introducidos brevemente los procesos autorregresivos de or-den 1, AR(1). A continuacion se define al operador rezago Bj y el Teorema deWold, con el cual caracterizamos de forma mas especıfica a los procesos esta-cionarios en covarianza. Luego se veran los tipos de procesos estacionarios encovarianza: de medias moviles de orden q o MA(q), los autorregresivos de ordenp o AR(p) y los procesos lineales autorregresivos de medias moviles de orden p,q o ARMA(p,q). Los tres modelos mencionados son aproximaciones de la repre-sentacion de Wold y en ocasiones dos o mas de estos modelos pueden produciraproximaciones igualmente buenas a la representacion de Wold (Diebold [3]),ası, la idea es buscar la aproximacion mas parsimoniosa que capture lo mejorposible el patron de autocorrelacion presente.

7.1. El operador Rezago Bj y polinomio de rezagos de orden

j

El operador rezago Bj es tal que aplicado a la serie {Zt} produce la serie determinos rezagados o retardados j lugares en el tiempo, es decir

BjZt = Zt−j (7.1)

Ahora bien, un polinomio de rezagos de orden j es el que corresponde a lasiguiente expresion

Ψj(B) = 1 + ψ1B + ψ2B2 + ψ3B

3 + · · ·+ ψjBj (7.2)

Observe que la ecuacion anterior define un polinomio de orden j en B.De (7.1) y (7.2) se tiene que al aplicar Ψj(B) sobre la serie {Zt} obtenemos,

Ψj(B)Zt = Zt + ψ1Zt−1 + ψ2Zt−2 + ψ3Zt−3 + · · ·+ ψjZt−j (7.3)

Cuando j =∞ tenemos un polinomio de rezagos infinitos el cual simplementedenotamos como

Ψ(B) =

∞∑

i=0

ψiBi, con ψ0 = 1 (7.4)

185

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ

186 CAPITULO 7. INTRODUCCION A LOS MODELOS ARMA

Este polinomio se conoce como filtro lineal (ver Seccion 4.2.1).

7.2. El Teorema de representacion de Wold

Sea {Zt} cualquier proceso estacionario en covarianza de media cero (seesta requiriendo que el proceso no contenga componentes deterministas), en-tonces este proceso se puede representar como un filtro lineal de un procesode ruido blanco, es decir:

Zt = Ψ(B)at =

∞∑

i=0

ψiat−i, con at ∼ R.B(0, σ2a), ψ0 = 1 y

∞∑

i=1

ψ2i <∞ (7.5)

Los at se denominan innovaciones y a la ecuacion (7.5) proceso lineal gene-ral.

NOTA: Supondremos que el ruido blanco es gaussiano, es decir que los termi-nos que lo conforman son variables aleatorias normales de media cero, vari-anza constante e incorrelacionados (independientes bajo la normalidad).

El Teorema de representacion de Wold nos dice que cuando se formulanmodelos de pronostico para series estacionarias en covarianza de media cero,solo se necesitan considerar modelos de un proceso lineal general o de filtrolineal de un ruido blanco. Puede demostrarse que bajo las condiciones delTeorema de Wold se cumple que:

E[Zt] = 0, la media del proceso (7.6)

VAR = σ2a

∞∑

i=0

ψ2i <∞, la varianza del proceso y es finita (7.7)

E[Zt|at−1, at−2, · · · ] =

∞∑

i=1

ψiat−i, la media dado las innovaciones pasadas (7.8)

VAR[Zt|at−1, at−2, · · · ] = σ2a, la varianza dado las innovaciones pasadas (7.9)

γ(k) = σ2a

∞∑

i=0

ψiψi+k, la autocovarianza del proceso (7.10)

Mientras que la media incondicional es constante en el tiempo, la media condi-cional se mueve en el tiempo en respuesta al conjunto de informacion queevoluciona, capturando la dinamica del proceso, lo cual es importante para larealizacion de pronosticos.

7.3. Funcion de autocorrelacion Parcial o PACF

Considere un proceso estacionario en covarianza {Zt}t≥1 de media cero. Lafuncion de autocorrelacion parcial o PACF (Partial Autocorrelation Function)corresponde a la autocorrelacion entre Zt y Zt+k despues de remover las de-pendencias lineales mutuas con las variables Zt+1, Zt+2, · · · , Zt+k−1. Es decir, la

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ

7.3. FUNCION DE AUTOCORRELACION PARCIAL O PACF 187

PACF es la correlacion condicional Corr(Zt, Zt+k|Zt+1, Zt+2, · · · , Zt+k−1), la cualdenotaremos por φkk.

Teoricamente, Para hallar la PACF es necesario realizar la regresion linealpoblacional (es decir, con base en una muestra infinita de datos) de Zt+k (lavariable respuesta) versus Zt+k−1, Zt+k−2, Zt+k−3, · · · , Zt (las variables explicato-rias) donde el coeficiente en tal regresion que corresponde a Zt es φkk, siendoel modelo de regresion

Zt+k = φk1Zt+k−1 + φk2Zt+k−2 + φk3Zt+k−3 + · · ·+ φkkZt + ut+k (7.11)

donde ut+k ∼ R.B tal que COV(ut+k, Zt+k−j) = 0 ∀ j ≥ 1. Si multiplicamos aambos lados de (7.11) por Zt+k−j, tomamos valor esperado y luego dividimospor γ(0) (la varianza de Zt), obtenemos la ACF en j, esto es

ρ(j) = φk1ρ(j−1)+φk2ρ(j−2)+φk3ρ(j−3)+· · ·+φkkρ(j−k), para j = 1, 2, · · · , k (7.12)

Para hallar el valor del coeficiente φkk se conforma el siguiente sistema de ecua-ciones de orden k × k donde usamos la ecuacion en (7.12) con j = 1, 2, 3, · · · , k:

ρ(1) = φk1ρ(0) + φk2ρ(1) + φk3ρ(2) + · · ·+ φkkρ(k − 1),

ρ(2) = φk1ρ(1) + φk2ρ(0) + φk3ρ(1) + · · ·+ φkkρ(k − 2),

... =...

ρ(k) = φk1ρ(k − 1) + φk2ρ(k − 2) + φk3ρ(k − 3) + · · ·+ φkkρ(0),

con ρ(0) = 1 y ρ(j − k) = ρ(k − j) (porque la autocorrelacion es una funcionsimetrica alrededor de cero). En este sistema de ecuaciones, las incognitasson los coeficientes φkj, pero en particular nos interesa hallar a φkk. El ante-rior sistema de ecuaciones es conocido como el sistema de ecuaciones YuleWalker. Matricialmente, tenemos ρ = Rφ, entonces φ = R−1ρ, donde

ρ =

ρ(1)ρ(2)

...ρ(k)

k×1

R =

1 ρ(1) ρ(2) · · · ρ(k − 1)ρ(1) 1 ρ(1) · · · ρ(k − 2)

......

... · · · ...ρ(k − 1) ρ(k − 2) ρ(k − 3) · · · 1

k×k

φ =

φk1

φk2

φk3...φkk

k×1

La solucion de este sistema de ecuaciones puede ser hallada por la Regla de

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


Cramer, que para k = 1, 2, . . ., establece que

φkk =

∣∣∣∣∣∣∣∣∣

1 ρ(1) ρ(2) · · · ρ(k − 2) ρ(1)ρ(1) 1 ρ(1) · · · ρ(k − 3) ρ(2)

......

... · · · ......

ρ(k − 1) ρ(k − 2) ρ(k − 3) · · · ρ(1) ρ(k)

∣∣∣∣∣∣∣∣∣∣∣∣∣∣∣∣∣∣

1 ρ(1) ρ(2) · · · ρ(k − 2) ρ(k − 1)ρ(1) 1 ρ(1) · · · ρ(k − 3) ρ(k − 2)

......

... · · · ......

ρ(k − 1) ρ(k − 2) ρ(k − 3) · · · ρ(1) 1

∣∣∣∣∣∣∣∣∣

(7.13)

LA PACF muestral, es decir, φkk puede ser calculada mediante el sistema deecuaciones de Yule Walker, pero usando en este sistema los valores estimadosρ(j) de la funcion de autocorrelacion. Otra posibilidad es utilizar un metodorecursivo de estimacion, que consiste de los pasos siguientes:

1. Inicializar con φ11 = ρ(1)

2. Para k > 1 calcular

φk+1,k+1 =

ρ(k + 1)−k∑

j=1

φkjρ(k + 1− j)

1−k∑

j=1

φkjρ(j)

, y

φk+1,j = φkj − φk+1,k+1φk,k+1−j, j = 1, · · · , k.Por ejemplo, para hallar φ22 hacemos k + 1 = 2, es decir, k = 1, por tantoel ındice en las sumatorias solo llega hasta 1:

φ22 =

ρ(2)−1∑

j=1

φ1jρ(2− j)

1−1∑

j=1

φ1jρ(j)

=ρ(2)− φ11ρ(1)

1− φ11ρ(1), y φ21 = φ11 − φ22φ11.

NOTA: La PACF tambien es una funcion simetrica alrededor de cero, luego,basta considerar valores de k no negativos para su estudio.

7.3.1. PACF para un proceso de ruido blanco

Sea {Et}t≥1 un proceso de ruido blanco, entonces para una serie E1, E2, · · · , En

con n “grande”, se cumple que

E[φkk] = 0, VAR[φkk] ≈1

ny φkk

aprox.∼N

(0,

1

n

)(7.14)

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


y desde que para un ruido blanco ρ(0) = 1 y ρ(k) = 0 para todo k 6= 0, entoncestambien φ00 = 1 y φkk = 0 para k 6= 0:

0 1 2 3 4−1−2−3−4

φkk

1

k

Figura 7.1: PACF de un proceso de ruido blanco

Sin embargo en una muestra de tamano n, para establecer si un proceso esun ruido blanco a traves de su PACF muestral, es necesario probar que paratodo k > 0 la PACF es cero, y de la misma manera que cuando consideramosla ACF, tenemos que establecer esto realizando para cada k = 1, 2, · · · , m, m =[n/4] la siguiente prueba de hipotesis:

H0 : φkk = 0 versus H1 : φkk 6= 0 (7.15)

Si en ninguna de las m pruebas se rechaza H0, entonces el proceso puedeconsiderarse un ruido blanco, pero si para algun k se rechaza H0, entoncesel proceso no es ruido blanco. La region de rechazo, con una significanciaaproximada del 5 % esta dada por |φkk| > 2/

√n.

Al igual que en la ACF o FAC, las pruebas para la PACF se realizan grafica-mente, trazando sobre la PACF muestral las bandas de los lımites de aceptacion-rechazo. Una grafica tıpica de la PACF muestral de un ruido blanco es comola de la Figura 7.3.1.

Observe que excepto para k = 0, en los demas rezagos la funcion tomavalores dentro de la region de aceptacion.

7.3.2. PACF muestral con R

En R se obtiene la funcion de autocorrelacion muestral mediante la funcionpacf() :

pacf(x, lag.max, plot, na.action, ...)

donde

x es un objeto serie de tiempo o un vector numericos

lag.max el numero maximo de rezagos para los cuales se desea calcularla funcion

plot argumento logico para indicar si se desea graficar o no la PACF.

na.action Funcion a ser llamada para manejar datos faltantes.

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


0 5 10 15 20 25

k

φ kk

− 2 n

0

2 n

Figura 7.2: PACF muestral de un ruido blanco

7.3.3. Ejemplos

Considere las series at, Z1,t, Z2,t, Z3,t y Z4,t, t = 1, 2, · · · , 100 presentadas en laSeccion 6.5.1. Las PACF muestrales correspondientes son presentadas en laFigura 7.3.

Determine en cada caso, usando la prueba de la PACF, cuales de las seriesson ruido blanco y cuales no lo son. Las PACFs fueron obtenidas con el Codi-go R 7.1.

Codigo R 7.1.

#LECTURA DE ARCHIVO DE DATOS datosejemFACS.txt#EL ARCHIVO TIENE EL NOMBRE DE LAS SERIES EN LA PRIMERA FILAdatos=read.table(file.choose(),header=T)


#Separando las seriesat=datos[,1];Z1t=datos[,2];Z2t=datos[,3];Z3t=datos[,4];Z4t=datos[,5]

#Calculando m=[n/4]. Todas las series aqu´ı tienen longitud#igual al numero de filas de la matriz de datosm=floor(nrow(datos)/4)

#Graficando las PACF muestralesnf=layout(rbind(c(1,2),c(3,4),c(5,6)))pacf(at,lag.max=m,ci.col=2);pacf(Z1t,lag.max=m,ci.col=2);pacf(Z2t,lag.max=m,ci.col=2)pacf(Z3t,lag.max=m,ci.col=2);pacf(Z4t,lag.max=m,ci.col=2)

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


5 10 15 20 25

−0.

20.

00.

10.

2

Lag

Par

tial A

CF

Series at

5 10 15 20 25

−0.

20.

20.

6

Lag

Par

tial A

CF

Series Z1t

5 10 15 20 25

−0.

20.

20.

6

Lag

Par

tial A

CF

Series Z2t

5 10 15 20 25

−0.

6−

0.2

0.2

Lag

Par

tial A

CF

Series Z3t

5 10 15 20 25

−0.

4−

0.2

0.0

0.2

Lag

Par

tial A

CF

Series Z4t

Figura 7.3: PACFs series simuladas en Seccion 6.5.1.

Considere ademas la PACF de los residuales del modelo log cuadratico esta-cional ajustado a la serie de produccion de cemento en la Seccion 5.3.3 yrealice el test de ruido blanco usando la PACF ¿que se concluye?

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


0 10 20 30

−0.

20.

00.

20.

40.

60.

8

Lag

Par

tial A

CF

PACF residuales modelo log cuadrático estacionalSerie producción trimestral de cemento portland

Figura 7.4: PACF residuales modelo log cuadratico estacional serie produccion trimestral

de cemento portland


m=length(lnyt)/4win.graph(width=4.875,height=3.5,pointsize=8)pacf(residuals(modelo1),lag.max=m,ci.col=2,main="PACF residuales modelo log cuadratico estacional\nSerie produccion trimestral de cemento portland")

7.4. Modelos de medias moviles o MA

7.4.1. El proceso de media movil de orden 1 o MA(1)

Llamaremos a un proceso {Zt}t≥1 de media movil de orden 1 al procesoestacionario en covarianza de media cero tal que

Zt = (1 + θ1B)at = at + θ1at−1, donde at ∼ R.B(0, σ2a) (7.16)

Es decir, un MA(1) es un filtro lineal de un ruido blanco con ψ1 = θ1, mientrasque ψj = 0, j ≥ 2. Por tanto, un proceso MA(1) es estacionario en covarianza,de acuerdo al Teorema de representacion de Wold. Claramente, La media delproceso es cero: E[Zt] = 0 y su varianza es VAR[Zt] = σ2

a(1 + θ21).

Funcion de autocorrelacion y autocorrelacion parcial

Por la definicion de covarianza y sus propiedades, tenemos que la funcionde autocovarianza es,

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ

7.4. MODELOS DE MEDIAS MOVILES O MA 193

γ(1) = COV(Zt, Zt−1) = COV(at + θ1at−1, at−1 + θ1at−2)

= COV(θ1at−1, at−1) = θ1σ2a (7.17)

mientras que para todo k ≥ 2

γ(k) = COV(Zt, Zt−k) = COV(at + θ1at−1, at−k + θ1at−k−1) = 0 (7.18)

De donde, la funcion de autocorrelacion del proceso es

ρ(k) =

1 si k = 0;θ1

1 + θ21

si k = 1;

0 si k ≥ 2

(7.19)

Teniendo en cuenta la anterior ecuacion y aplicando iterativamente el sistemade ecuaciones de Yule-Walker antes definido, es posible mostrar que la funcionde autocorrelacion parcial para un MA(1) es

φkk =(−1)k+1θk

1(1− θ21)

1− θ2(k+1)1

, para k ≥ 1 (7.20)

De la Figura 7.5 observe que al contrario de la ACF, la PACF de un MA(1)tiene un comportamiento de cola decreciente exponencialmente en una de dosformas, dependiendo del signo de θ1. Tambien puede mostrarse que |φkk| < 1/2.

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


0 2 4 6 8 10 12

k

ρ(k)

−1

0

1 θ1 = − 0.5

2 4 6 8 10 12

k

φ kk

−0.5

0

0.5 θ1 = − 0.5

0 2 4 6 8 10 12

k

ρ(k)

−1

0

1 θ1 = 0.5

2 4 6 8 10 12

k

φ kk

−0.5

0

0.5 θ1 = 0.5

0 2 4 6 8 10 12

k

ρ(k)

−1

0

1 θ1 = − 0.9

2 4 6 8 10 12

k

φ kk

−0.5

0

0.5 θ1 = − 0.9

0 2 4 6 8 10 12

k

ρ(k)

−1

0

1 θ1 = 0.9

2 4 6 8 10 12

k

φ kk

−0.5

0

0.5 θ1 = 0.9

Figura 7.5: Ejemplos ρ(k) y φkk de procesos MA(1)

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ

7.4. MODELOS DE MEDIAS MOVILES O MA 195

7.4.2. Procesos MA(q)

Un proceso estacionario en covarianza de media cero tal que

Zt = Θq(B)at, con Θq(B) = 1 + θ1B + θ2B2 + · · ·+ θqB

q y at ∼ R.B(0, σ2a) (7.21)

es un proceso de medias moviles de orden q. Este proceso es una general-izacion de un MA(1). Observe que todo proceso MA es estacionario en covari-anza (Teorema de representacion de Wold).

De acuerdo a Guerrero [5] un proceso MA puede interpretarse de la si-guiente manera: dado un proceso en equilibrio, las fluctuaciones alrededor del

punto de equilibrio, {Zt}t≥1, son causadas por choques asociados a eventos ines-

perados. Tales choques no necesariamente se asimilan de manera instantanea,

sino que pueden seguir causando efectos aun despues de transcurrido cierto

numero de perıodos y ademas la intensidad del choque se refleja en el valor de

su ponderacion θi.Para el proceso MA(q) tenemos que E[Zt] = 0, VAR[Zt] = (1+θ2

1 +θ22 + · · ·+θ2

q)σ2a

y su autocovarianza de orden k es dada por

γ(k) =

{(θk + θ1θk+1 + · · ·+ θq−kθq)σ

2a si k = 1, 2, · · · , q

0 si k > q,(7.22)

de donde, la funcion de autocorrelacion de orden k satisface

ρ(k) =

1 si k = 0θk + θ1θk+1 + · · ·+ θq−kθq

1 + θ21 + θ2

2 + · · ·+ θ2q

si k = 1, 2, · · · , q

0 si k > q

(7.23)

lo cual implica que el proceso MA(q) tiene una memoria limitada a q periodos.La PACF puede ser calculada usando el sistema de ecuaciones de Yule-

Walker. En esta funcion, un proceso MA(q) tendra todas sus autocorrela-ciones parciales distintas de cero aunque mostrando convergencia a cero, condecaimiento amortiguado exponencial y/o sinusoidal. Por ejemplo, para unMA(2) tenemos que

γ(k) =

θ1(1 + θ2)σ2a si k = 1

θ2σ2a si k = 2

0 si k > 2,

(7.24)

luego, la funcion de autocorrelacion de orden k satisface

ρ(k) =

1 si k = 0θ1(1 + θ2)

1 + θ21 + θ2

2

si k = 1

θ21 + θ2

1 + θ22

si k = 2

0 si k > 2

(7.25)

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


Su PACF corresponde a

φ11 = ρ(1)

φ22 =ρ(2)− ρ2(1)

1− ρ2(1)

φ33 =ρ3(1)− ρ(1)ρ(2) [2− ρ(2)]

1− ρ2(2)− 2ρ2(1) [1− ρ(2)](7.26)

...

La PACF decae en forma exponencial o sinusoidal dependiendo del signo ymagnitud de las raıces del polinomio Θ2(B) = 1 + θ1B + θ2B

2 = 0. La PAFCoscilara sinusoidalmente si las raıces son complejas. En la Figura 7.6 se re-presentan las ACF’s y PACF’s de algunos procesos MA(2). Note que mientrasla ACF se hace cero abruptamente, la PACF decae amortiguada.

7.5. Modelos autorregresivos de orden p o AR(p)

Los procesos autorregresivos son un tipo de proceso estocastico en el cualel valor actual de una serie esta linealmente relacionado con sus valores pasa-dos mas una perturbacion o choque aleatorio aditivo. En el Capıtulo 6, Sec-cion 6.7 fue introducido el proceso autorregresivo de orden 1 o AR(1), ası quea continuacion trataremos el caso mas general, es decir, los procesos AR(p).

Un proceso estocastico de media cero tal que

Zt = φ1Zt−1 + φ2Zt−2 + . . .+ φpZt−p + at y at ∼ R.B(0, σ2a) (7.27)

con at independiente de Zt−k para todo k > 0, es un proceso autorregresivo deorden p. En terminos del operador de rezagos, Bj, podemos tambien represen-tar el proceso por

Φp(B)Zt = at, con Φp(B) = 1− φ1B − φ2B2 − . . .− φpB

p (7.28)

Un proceso AR(p) es estacionario en covarianza si y solo sı todas las raıcesdel polinomio Φp(B) (es decir, las soluciones de la ecuacion Φp(B) = 0) tienenmodulo mayor a uno (yacen por fuera del cırculo unitario) y de acuerdo alTeorema de representacion de Wold (Seccion 7.2), el proceso podra escribirsecomo un filtro lineal del ruido blanco at, es decir, Zt =

∑∞j=0 ψjat−j = Ψ(B)at con

ψ0 = 1 y∞∑i=1

ψ2i <∞.

Recuerde que si una raız rj de un polinomio es compleja, rj = aj + ibj , i =√−1, su modulo es |rj| =

√a2

j + b2j y que a lo sumo, un polinomio de grado p

tiene p raıces distintas, es decir,

Φp(B) =

p∏

j=1

(1− r−1j B) (7.29)

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ

7.5. MODELOS AUTORREGRESIVOS DE ORDEN P O AR(P) 197

0 2 4 6 8 10 12

k

ρ(k)

−1

0

1 θ1 = 0.5θ2 = 0.7

2 4 6 8 10 12

k

φ kk

−0.5

0

0.5 θ1 = 0.5θ2 = 0.7

0 2 4 6 8 10 12

k

ρ(k)

−1

0

1 θ1 = − 0.5θ2 = − 0.7

2 4 6 8 10 12

k

φ kk

−0.5

0

0.5 θ1 = − 0.5θ2 = − 0.7

0 2 4 6 8 10 12

k

ρ(k)

−1

0

1 θ1 = 0.5θ2 = − 0.7

2 4 6 8 10 12

k

φ kk

−0.5

0

0.5 θ1 = 0.5θ2 = − 0.7

0 2 4 6 8 10 12

k

ρ(k)

−1

0

1 θ1 = − 0.5θ2 = 0.7

2 4 6 8 10 12

k

φ kk

−0.5

0

0.5 θ1 = − 0.5θ2 = 0.7

Figura 7.6: Ejemplos ρ(k) y φkk de procesos MA(2)

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


Para el proceso AR(p) como ha sido definido en (7.27), la media es cero,mientras que su varianza es dada por VAR[Zt] =

∑pk=1 φkγ(k) + σ2

a, con γ(k) =E[ZtZt−k]. Recuerde que γ(0) = VAR[Zt].

7.5.1. Funcion de autocorrelacion y autocorrelacion parcial de un AR(p)

Para hallar la funcion de autocorrelacion ρ(k), multiplicamos ambos ladosde (7.27) por Zt−k, tomamos valor esperado y dividimos por γ(0) = VAR(Zt)(teniendo en cuenta ademas que E(atZt−k = 0, k > 0), obteniendo la siguienteecuacion recursiva

ρ(k) = φ1ρ(k − 1) + φ2ρ(k − 2) + · · ·+ φpρ(k − p) k > 0, (7.30)

y hacemos uso de esta ecuacion para hallar la funcion de autocorrelacion encada k, recursivamente. Por ejemplo, Para un AR(2), tenemos

ρ(1) = φ1 + φ2ρ(1) de donde ρ(1) =φ1

1− φ2

ρ(2) = φ1ρ(1) + φ2, de donde ρ(2) =φ2

1 + φ2(1− φ2)

1− φ2

etc.

Cuando el proceso es estacionario en covarianza, es posible mostrar a par-tir de (7.30) que la ACF presenta un amortiguamiento gradual. El patron deamortiguamiento puede ser uno de tipo monotono como en el caso de un AR(1)con coeficiente φ1 > 0, o siguiendo patrones de oscilacion cıclica que puedenser una mezcla de decaimientos exponenciales y sinusoidales, cuando algunasraıces del polinomio Φp(B) son complejas.

Para obtener la funcion de autocorrelacion parcial φkk, simplemente se haceuso del sistema de ecuaciones Yule-Walker con solucion dada en la ecuacion(7.13), en donde para k > p, la ultima columna de la matriz en el numeradorpuede escribirse como una combinacion lineal de las columnas previas, segunla ecuacion (7.30), y por tanto, φkk = 0 para k > p. Tambien puede usarsepara el calculo de la PACF el metodo recursivo explicado en la pagina 188.No confunda aquı los coeficientes φj de la ecuacion del modelo AR(p) con losφkj, j = 1, 2, . . . , k en la ecuacion (7.11) usada para definir la PACF.

La Figura 7.7 presenta la ACF y PACF de algunos procesos AR(1). La Figura7.8 presenta la ACF y PACF para algunos procesos AR(2). Observe los patronesde decaimiento amortiguado (cola decreciente) en las ACF’s mientras que enlas PACF’s se observa que para todo k > p la PACF es cero (patron de corte).

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ

7.5. MODELOS AUTORREGRESIVOS DE ORDEN P O AR(P) 199

0 2 4 6 8 10 12

k

ρ(k)

−1

0

1 φ1 = 0.9

2 4 6 8 10 12

k

φ kk

−1

0

1 φ1 = 0.9

0 2 4 6 8 10 12

k

ρ(k)

−1

0

1 φ1 = 0.4

2 4 6 8 10 12

k

φ kk

−1

0

1 φ1 = 0.4

0 2 4 6 8 10 12

k

ρ(k)

−1

0

1 φ1 = − 0.9

2 4 6 8 10 12

k

φ kk

−1

0

1 φ1 = − 0.9

0 2 4 6 8 10 12

k

ρ(k)

−1

0

1 φ1 = − 0.4

2 4 6 8 10 12

k

φ kk

−1

0

1 φ1 = − 0.4

Figura 7.7: Ejemplos ρ(k) y φkk de procesos AR(1)

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


0 2 4 6 8 10 12

k

ρ(k)

−1

0

1 φ1 = 0.5φ2 = − 0.7

2 4 6 8 10 12

k

φ kk

−1

0

1 φ1 = 0.5φ2 = − 0.7

0 2 4 6 8 10 12

k

ρ(k)

−1

0

1 φ1 = − 0.5φ2 = 0.3

2 4 6 8 10 12

k

φ kk

−1

0

1 φ1 = − 0.5φ2 = 0.3

0 2 4 6 8 10 12

k

ρ(k)

−1

0

1 φ1 = 0.3φ2 = 0.3

2 4 6 8 10 12

k

φ kk

−1

0

1 φ1 = 0.3φ2 = 0.3

0 2 4 6 8 10 12

k

ρ(k)

−1

0

1 φ1 = 0.8φ2 = − 0.6

2 4 6 8 10 12

k

φ kk

−1

0

1 φ1 = 0.8φ2 = − 0.6

Figura 7.8: Ejemplos ρ(k) y φkk de procesos AR(2)

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ

7.6. MODELOS AUTORREGRESIVOS Y DE MEDIAS MOVILES O ARMA(P,Q)201

NOTAS:

En general, cuando un proceso puede expresarse apropiadamente me-diante un modelo AR, se dice que es invertible. Todo proceso AR(p) es portanto invertible.

Cuando un proceso puede expresarse como un MA es estacionario, portanto todo MA(q) es estacionario.

Cuando un proceso AR(p) es estacionario entonces este es equivalentea un MA(∞), lo cual implica que las raıces del polinomio Φp(B) tienenmodulo mayor a uno.

Cuando un proceso MA(q) es invertible este es equivalente a un AR(∞),lo cual implica que las raıces del polinomio Θq(B) tienen modulo mayor auno.

7.6. Modelos autorregresivos y de medias moviles o ARMA(p,q)

Los procesos ARMA son una generalizacion de los procesos AR y MA, yconsisten en una combinacion de ambos modelos. Por definicion, un proceso{Zt}t≥1 de media cero es un proceso ARMA(p,q) si

Φp(B)Zt = Θq(B)at, at ∼ R.B(0, σ2a) (7.31)

con Φp(B) = 1− φ1B − φ2B2 − · · · − φpB

p y Θq(B) = 1 + θ1B + θ2B2 + · · ·+ θqB

q.

NOTA: En muchos textos de series de tiempo se define el polinomio Θq(B) =1− θ1B− θ2B2−· · ·− θqB

q. En R, funciones como arima() y auto.arima() tra-bajan con el modelo ARMA (y los modelos MA) usando Θq(B) = 1 + θ1B + θ2B

2 +· · ·+ θqB

q.

Cuando las raıces del polinomio Φp(B) yacen fuera del cırculo unitario (esdecir, tienen modulo mayor a uno), el proceso ARMA(p,q) es estacionario encovarianza y admite la siguiente representacion

Zt =Θq(B)

Φp(B)at = Ψ(B)at (7.32)

Si las raıces del polinomio Θq(B) yacen fuera del cırculo unitario, el procesoARMA(p,q) es invertible y puede escribirse como

Φp(B)

Θq(B)Zt = Π(B)Zt = at (7.33)

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


7.6.1. Funcion de autocorrelacion y autocorrelacion parcial de un AR-MA(p,q)

Desde que para k > i se cumple que E[Zt−kat−i] = 0, puede mostrarse que lafuncion de autocovarianza γ(k) satisface

γ(k) = φ1γ(k − 1) + φ2γ(k − 2) + · · ·+ φpγ(k − p), para k > q (7.34)

y por tanto la funcion de autocorrelacion satisface,

ρ(k) = φ1ρ(k − 1) + φ2ρ(k − 2) + · · ·+ φpρ(k − p), para k > q, (7.35)

pero las primeras q autocorrelaciones dependen tanto de los parametros au-torregresivos como de los de medias moviles del modelo. De (7.34) puede es-tablecerse que la ACF decae o amortigua despues del q-esimo rezago como lohace un proceso AR, esto es, hay patron de cola en esta funcion.

Respecto a la funcion de autocorrelacion parcial, debido a que el proceso AR-MA(p,q) contiene al proceso MA como un caso especial, su PACF tambien pre-sentara decaimientos de tipo exponencial y/o sinusoidal, dependiendo de lasraıces de los polinomios Φp(B) y Θq(B). La forma general de la PACF es com-plicada y no necesaria, solo es suficiente notar que tendra patron de cola.

NOTA: Note que lo procesos AR y MA son caso particulares del modelo AR-MA, ası un AR(p) es un ARMA(p,0), mientras que un MA(q) es un ARMA(0,q).

7.6.2. Casos especiales de procesos ARMA

Guerrero [5] establece que algunos casos de procesos ARMA surgen cuandose consideran

1. Series obtenidas por agregacion de componentes, por ejemplo, la serie deproducto interno bruto obtenida al agregar las series correspondientes alos diversos sectores de la economıa, y

2. Series en donde los datos contienen errores de observacion lo cual es uncaso muy comun en las series economicas.

Segun lo anterior podrıa demostrarse que si Zt satisface la relacion

Zt = Z1t + Z2t (7.36)

donde Z1t y Z2t son dos procesos estacionarios, independientes y de mediacero, entonces el proceso Zt estara determinado como se indica en la Tabla7.1. La Tabla 7.2 resume la caracterizacion de la ACF y la PACF de procesosARMA. En las Figuras 7.9 y 7.10 se representan las ACF’s y PACF’s de algunosprocesos ARMA(1,1).

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ

7.6. MODELOS AUTORREGRESIVOS Y DE MEDIAS MOVILES O ARMA(P,Q)203

Tabla 7.1: Modelos resultantes de agregar procesos Z1t y Z2t estacionarios e independi-

entesProcesos individuales Procesos combinados

Z1t Z2t Zt

AR(p) Ruido blanco ARMA(p,p)AR(p1) AR(p2) ARMA(p1 + p2, max(p1, p2))AR(p) MA(q) ARMA(p,p+q)MA(q) Ruido blanco ARMA(0,q)MA(q1) MA(q2) ARMA(0,max(q1, q2))ARMA(p,q) Ruido blanco ARMA(p,max(p, q))

Tabla 7.2: Comportamiento de la ACF y PACF para procesos ARMA

Proceso ACF PACF

AR(p) Muchos valores no nulos que decrecen a cero con k Solamente las primeras p autocorrelacionescomo mezcla de patrones exponenciales y sinusoidales. parciales son distintas de cero.

MA(q) Solo las primeras k autocorrelaciones son distintas Muchos valores no nulos que decrecen a cerode cero. con k como mezcla de patrones exponenciales

y sinusoidales.

ARMA(p,q) Comportamiento irregular de las primeras q autocor- Sucesion infinita que converge a cero.relaciones y despues convergencia a cero para k > q.

2 4 6 8 10 12

k

ρ(k)

−1

0

1 φ1 = 0.9θ1 = − 0.5

2 4 6 8 10 12

k

φ kk

−1

0

1 φ1 = 0.9θ1 = − 0.5

2 4 6 8 10 12

k

ρ(k)

−1

0

1 φ1 = 0.9θ1 = 0.5

2 4 6 8 10 12

k

φ kk

−1

0

1 φ1 = 0.9θ1 = 0.5

Figura 7.9: Ejemplos ρ(k) y φkk de procesos ARMA(1,1)

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


2 4 6 8 10 12

k

ρ(k)

−1

0

1 φ1 = − 0.9θ1 = − 0.5

2 4 6 8 10 12

k

φ kk

−1

0

1 φ1 = − 0.9θ1 = − 0.5

2 4 6 8 10 12

k

ρ(k)

−1

0

1 φ1 = − 0.9θ1 = 0.5

2 4 6 8 10 12

k

φ kk

−1

0

1 φ1 = − 0.9θ1 = 0.5

2 4 6 8 10 12

k

ρ(k)

−1

0

1 φ1 = 0.6θ1 = 0.4

2 4 6 8 10 12

k

φ kk

−0.5

0

1 φ1 = 0.6θ1 = 0.4

2 4 6 8 10 12

k

ρ(k)

−0.25

0

0.25 φ1 = 0.5θ1 = − 0.8

2 4 6 8 10 12

k

φ kk

−0.25

0

0.25 φ1 = 0.5θ1 = − 0.8

Figura 7.10: Mas ejemplos ρ(k) y φkk de procesos ARMA(1,1)

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ

7.7. IDENTIFICACION Y AJUSTE DEL MODELO PARA LOS CICLOS 205

7.7. Identificacion y ajuste del modelo para los ciclos

El analisis de las funciones de autocorrelacion y autocorrelacion parcialmuestrales nos ayuda a identificar el tipo de proceso estocastico relativo a losciclos. Al comparar las graficas de estas funciones con los patrones estable-cidos en la Tabla 7.2, es posible identificar si el proceso es un AR, un MA oun ARMA. Recuerde que el orden p de un proceso AR(p) es determinado enla PACF, mientras que el orden q de un MA(q) es determinado en la ACF. Sinembargo, en el caso de un proceso ARMA(p,q) mas general no es posible iden-tificar los valores p y q por inspeccion directa de las graficas de la ACF y PACFmuestrales, debido a que el patron esperado en ambas graficas es de colasdecrecientes.

En la primera etapa del proceso de identificacion basado en el analisis dela ACF y PACF muestrales, no se pretende identificar a la primera el modelocorrecto, mas bien el objetivo es restringir el conjunto de todos los posiblesmodelos ARMA a un subconjunto de modelos que en principio pueden rep-resentar los rasgos principales de la serie. Por tanto es conveniente tener encuenta lo siguiente:

Cuando el proceso sigue un modelo AR(p), la ACF muestral presenta pa-tron de cola decreciente, con decaimiento exponencial y/o sinusoidal,mientras que la PACF muestral no presenta ningun patron particular dedecaimiento pero sı de corte: ultimo valor significativo cortando algunade las bandas de rechazo, indica el orden autorregresivo p.

Cuando el proceso sigue un modelo MA(q), la PACF muestral presentapatron de cola decreciente con decaimiento exponencial y/o sinusoidal,mientras que la ACF muestral no presenta ningun patron particular dedecaimiento pero sı de corte: ultimo valor significativo cortando algunade las bandas de rechazo, indica el orden de media movil q.

Se deben postular modelos simples que expliquen los rasgos obvios delproceso en su ACF y PACF. Evitar la identificacion inicial de modelosmixtos ARMA y comenzar con modelos AR o MA preferiblemente de ordenbajo.

En relacion a la identificacion de modelos ARMA existen diferentes her-ramientas computacionales basadas en algoritmos de seleccion de vari-ables con base en la evaluacion de algun criterio de informacion (AIC,BIC, AICC) o mediante la funcion de autocorrelacion extendida (EACF).

7.7.1. Metodos de identificacion basados en minimizacion de criteriosde informacion

Lo metodos para identificacion de modelos ARMA(p,q) basados en crite-rios de informacion, basicamente intentan determinar el verdadero modelo

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


minimizando el criterio de informacion correspondiente. Cuando el verdaderomodelo es un ARMA de orden finito, Los ordenes p y q hallados usando el cri-terio BIC son consistentes, es decir, a medida que aumenta el tamano de laserie estos se aproximan a los verdaderos, pero si el verdadero modelo no esun ARMA de orden finitos, entonces el AIC sera el criterio que conducira a unmodelo que es mas proximo al verdadero proceso dentro de todos los modelosbajo estudio.

En R se cuenta con la funcion auto.arima() de la librerıa forecast . Estafuncion identifica automaticamente y ajusta el modelo ARMA (o ARIMA inclu-so, para el caso de series no estacionarias) utilizando por defecto el criterio deinformacion de Akaike (AIC), pero tambien es posible usar el criterio de infor-macion Bayesiana (BIC) y el criterio de informacion de Akaike corregido porsesgo (AICC). Su sintaxis es como sigue

auto.arima(x, d = NA, D = NA, max.p = 5, max.q = 5,max.P = 2, max.Q = 2, max.order = 5,start.p=2, start.q=2, start.P=1, start.Q=1,stationary = FALSE, ic = c("aic","aicc", "bic"),stepwise=TRUE, trace=FALSE,approximation=length(x)>100 | frequency(x)>12, xreg=NULL,test=c("kpss","adf","pp"), allowdrift=TRUE)

donde:

x es la serie de tiempo univariada

d es el orden de primera diferencia sobre la serie, para el caso de seriesno estacionarias que veremos luego. Si se omite, la funcion eligira estevalor mediante el test KPSS (test de raız unitaria; veremos esto en seriesno estacionarias).

Des el orden de diferenciacion estacional, si se omite tambien sera elegidosegun un test CH (el test Canova-Hansen).

max.p es el valor maximo a considerar para p, el orden AR

max.q es el valor maximo a considerar para q, el orden MA

max.P, max.Q es el valor maximo para los ordenes P y Q en modelos noestacionarios con estacionalidad

max.order es el valor maximo para la suma p + q + P +Q si la selecciondel modelo no va a ser stepwise (paso a paso)

start.p, start.q, start.P , start.Q valores iniciales para p, q, P ,y Q respectivamente, en el procedimiento stepwise.

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


stationary argumento que se especifica como igual a TRUE o FALSE,para restringir o no la busqueda a modelos estacionarios.

ic argumento en el cual se especifica el criterio de informacion en laseleccion de modelos: “aic ”, “aicc ” o “bic ”. Por defecto se ajusta a “aic ”,es decir usa AIC.

stepwise para indicar si se usa (TRUE) o no se usa (FALSE) el proced-imiento stepwise, en este ultimo caso hace una busqueda sobre todos losmodelos lo cual puede hacer lento el algoritmo.

trace si es TRUEse reportara la lista de los modelos ARIMA considerados.

approximation si es TRUE, la estimacion es realizada mediante sumasde cuadrados condicionales y los criterios de informacion usados en laseleccion seran aproximados. El modelo final es estimado mediante esti-macion de maxima verosimilitud. Esta opcion debera usarse para seriesde tiempo muy largas o con perıodo estacional (estocastico) alto para re-ducir tiempo de computo.

xreg es un argumento opcional para especificar un vector o matriz devariables regresoras o explicatorias, que deben tener el mismo numerode filas que x .

test para especificar el tipo de test de raız unitaria a usar, esto es paraseries no estacionarias, como luego veremos. Por defecto usa el test deraız unitaria kpss .

allowdrift si se especifica como TRUE, considera modelos con derivas(terminos constantes).

7.7.2. Metodo de identificacion basado en la funcion de autocorrelacionextendida

La funcion de autocorrelacion extendida o EACF para la identificacion demodelos ARMA, es un metodo con buen desempeno en muestras moderada-mente grandes. Esta funcion usa el hecho de que si la parte AR de un ARMAfuese conocida, entonces al filtrar de la serie esta componente mediante re-gresion, se obtendrıa un proceso MA puro con la propiedad de patron de corteen su ACF. Los coeficientes AR son estimados mediante una sucesion finitade regresiones. Para un valor p dado, se inicia realizando una regresion de Zt

vs. sus primeros p rezagos, Zt−1, . . . , Zt−p. Si los residuales de esta regresion noson un ruido blanco, se ajusta un segundo modelo de regresion de Zt vs. susprimeros p rezagos, y vs. el rezago de orden uno de los residuales del modeloen el paso 1. Si de nuevo los residuales de este segundo modelo no son unruido blanco, se ajusta un tercer modelo de regresion de Zt vs. sus primeros p

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


rezagos, y vs. el rezago uno de los residuales del segundo modelo y los rezagosde orden dos de los residuales del primer modelo. Este procedimiento continuahasta que no se halle mas informacion en los residuales de los modelos en laregresion. Si el modelo ARMA es de orden (p,q), entonces seran necesarias qregresiones.

SeanWt,j,k = Zt − φ1Zt−1 − · · · − φkZt−k

los residuales autorregresivos definidos con los coeficientes AR φl, l = 1, . . . , k,estimados iterativamente, asumiendo un orden AR igual a k y un orden MAigual a j. La ACF muestral de estos residuales es lo que se denomina la auto-correlacion muestral extendida, es decir, EACF = ρW (l). Se tiene que cuando elmodelo verdadero es un ARMA(p,q), para k = p y j ≥ q, {Wt,j,k} es aproximada-mente un MA(q), y por tanto su autocorrelacion teorica en rezagos superioresa q es cero. Con k > p hay un problema de sobre ajuste del modelo y esto a suvez incrementa el orden MA del proceso de residuales W . Como solucion fuepropuesto un metodo resumiendo la informacion en la EACF, mediante unatabla donde el elemento en la fila k y columna j toma el valor del sımbolo × sila autocorrelacion muestral de W de orden j+1, ρW (j+1), es significativamentedistinta de cero, y toma el valor de 0 en el caso contrario. Ası, en esta tablaun ARMA(p,q) tendra un patron teorico de un triangulo de ceros, con verticesuperior izquierdo indicando los correspondientes ordenes del proceso ARMA.En la Figura 7.11 el triangulo de ceros es resaltado con las lıneas rojas y suvertice superior izquierdo esta marcado con el sımbolo 0∗, indicando que p = 1y q = 1, luego el proceso es un ARMA(1,1).

En la librerıa R TSA se dispone de la funcion eacf() . En una EACF mues-tral la primera fila superior esta asociada a la ACF muestral de la serie a lacual se aplica. La sintaxis de la funcion R es como sigue:

eacf(z, ar.max = 7, ma.max = 13)

donde,

z es la serie

ar.max el maximo valor del orden autorregresivo p

ma.max el maximo valor del orden Ma, q.

7.7.3. Estimacion de modelos ARMA

Para modelos AR(p) puros la estimacion puede realizarse mediante el meto-do conocido como estimacion de Yule-Walker, basado en el sistema de ecua-ciones Yule-Walker previamente introducido en la Seccion 7.3, pero en lugarde los coeficientes φik se tendrıan los coeficientes φi, i = 1, . . . , p, sin embar-go este metodo esta sujeto a errores substanciales de redondeo. Tambien se

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


0 0 0 0 0 0 0 0 0 0 0 0

0 0 0 0 0 0 0 0 0 0 0

0 0 0 0 0 0 0 0 0 0

0 0 0 0 0 0 0 0 0

0 0 0 0 0 0 0 0

0 0 0 0 0 0 0

0 0 0 0 0 0

0*

0 1 2 3 4 5 6 7 8 9 10 11 12

7

6

5

4

3

2

1

0

Orden MAO

rden

AR

EACF teórica de un ARMA(1,1)

Figura 7.11: Representacion de la EACF teorica de procesos ARMA(1,1)

dispone de metodos de mınimos cuadrados condicionales donde se definen ofijan valores iniciales para Z0, Z−1, . . . , Z−p y el de mınimos cuadrados incondi-cionales, donde Z0, Z−1, . . . , Z−p no son fijados. Otro metodo posible de aplicarbajo el supuesto de normalidad para el ruido blanco, es el metodo de maximaverosimilitud.

Pero en general, para estimar un modelo ARMA(p,q) no es posible utilizarmetodos de estimacion de regresion lineal multiple ordinarios, debido a quelas ecuaciones de minimizacion resultantes no son lineales en los parametrosdesconocidos. Los metodos basados en maxima verosimilitud son mas adecua-dos que los de mınimos cuadrados, puesto que utilizan toda la informacion enlos datos en vez de algunos momentos muestrales como lo hacen los primeros,ademas, para los estimadores de maxima verosimilitud se tienen resultados

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


asintoticos (aproximaciones en distribucion cuando el tamano de la serie esgrande) conocidos.

En R, existen diferentes librerıas que facilitan funciones para estimar mod-elos AR, y modelos ARMA en general. En la librerıa stats se cuenta con lasfunciones ar() , ar.ols() para el ajuste de modelos AR; la funcion arima()permite estimar cualquier modelo ARMA, incluyendo AR y MA, y modelos ARI-MA; en la librerıa FitAR hay una serie de herramientas para modelos AR;la librerıa FitARMA tambien suministra funciones para el ajuste por maximaverosimilitud de modelos ARIMA, y en la librerıa forecast se tiene la funcionArima() .

7.8. Ejemplos

En el codigo R siguiente se simula una serie con modelo AR(1), para Zt =0.67Zt−1 + at, at ∼ RBN(0, 1) y n = 100. Tambien se obtienen las graficas de laserie, su ACF, PACF y EACF y se identifica y ajusta el mejor modelo ARMA conla funcion auto.arima() .

Codigo R 7.2.

library(forecast)library(TSA)

#Simulando un AR(1) estacionario, identificacion y ajuste automaticoAR1.sim=arima.sim(list(order=c(1,0,0),ar=0.67),n=100)

#Graficando la serie y sus funciones ACF y PACF muestralesnf=layout(rbind(c(1,1,2,2),c(0,3,3,0)))plot(AR1.sim)acf(AR1.sim,ci.type="ma",lag.max=25)pacf(AR1.sim,lag.max=25)

#Obteniendo la EACF muestral para identificacion del procesoeacf(AR1.sim)

#Identificacion y ajuste automatico, usando criterio AIC para la identificacion del mejor modeloajuste1=auto.arima(AR1.sim,ic="aic")summary(ajuste1)

#Obteniendo grafica de la serie y proosticos para h=5 periodos futurosplot(forecast(ajuste1,h=5))

#Graficos de residuales y su ACF y PACF,nf=layout(rbind(c(1,1,2,2),c(0,3,3,0)))plot(residuals(ajuste1))abline(h=0,col=2)acf(residuals(ajuste1),ci.type="ma",lag.max=25)pacf(residuals(ajuste1),lag.max=25)

En la Figura 7.12 se muestran la serie simulada y su ACF y PACF mues-trales. De estas ultimas podemos concluir que la serie sigue un proceso ARestacionario en covarianza de orden 1 ¿por que?

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ

7.8. EJEMPLOS 211

Time

AR

1.si

m

0 20 40 60 80 100

−3

−2

−1

01

23

4

0 5 10 15 20 25

−0.

40.

00.

20.

40.

60.

81.

0

Lag

AC

F

Series AR1.sim

5 10 15 20 25

−0.

20.

00.

20.

40.

6

Lag

Par

tial A

CF

Series AR1.sim

Figura 7.12: Serie AR1.sim simulada de Zt = 0.67Zt−1 + at, at ∼ RBN(0, 1) y n = 100

La siguiente salida R presenta el mejor modelo ajustado por auto.arima()y la EACF:

Salida R 7.1.

summary(ajuste1)

Series: AR1.simARIMA(1,0,0) with zero mean

Coefficients:ar1

0.6685s.e. 0.0741sigmaˆ2 estimated as 1.234: log likelihood = -152.7AIC = 309.4 AICc = 309.52 BIC = 314.61In-sample error measures:

ME RMSE MAE MPE MAPE MASE0.04513091 1.11079700 0.84457644 33.32919295 84.68595900 0.89193308

eacf(AR1.sim)AR/MA

0 1 2 3 4 5 6 7 8 9 10 11 12 130 x x x o o o o o o o o o x x1 o o o o o o o o o o o o o o2 x o o o o o o o o o o o o o3 x o o o o o o o o o o o o o4 x o x o o o o o o o o o o o5 x x o o o o o o o o o o o o6 x o x o x o o o o o o o o o7 x x x o x o o o o o o o o o

En la Tabla siguiente presentamos tambien la EACF:

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


Tabla 7.3: EACF muestral, AR(1) simulado (AR1.sim)AR/MA 0 1 2 3 4 5 6 7 8 9 10 11 12 13

0 x x x o o o o o o o o o x x1 o o o o o o o o o o o o o o2 x o o o o o o o o o o o o o3 x o o o o o o o o o o o o o4 x o x o o o o o o o o o o o5 x x o o o o o o o o o o o o6 x o x o x o o o o o o o o o7 x x x o x o o o o o o o o o

De acuerdo a la Tabla 7.3 el proceso para la serie simulada es un AR(1).Observe que el vertice superior derecho del triangulo de ceros senala p = 1y q = 0. De la salida R podemos ver que el mejor modelo ajustado es Zt =0.6685Zt−1. El coeficiente φ1 ha sido estimado con un error estandar de 0.071;el AIC de este modelo ajustado es de 309.4 y el BIC es de 314.61. Las medidasde pronostico ME, RMSE, etc. son calculados dentro de la muestra, luego noson utiles para evaluar capacidad de pronostico fuera de la muestra. La Figura7.13 muestra los residuales del modelo AR(1) ajustado y sus funciones deautocorrelacion y autocorrelacion muestrales. Podemos ver que los residualesevidencian un ruido blanco (teste de ruido blanco en ACF y PACF) y que laserie varıa de forma aproximadamente homogenea alrededor de la lınea cero.

Time

resi

dual

s(aj

uste

1)

0 20 40 60 80 100

−3

−2

−1

01

23

0 5 10 15 20 25

−0.

20.

00.

20.

40.

60.

81.

0

Lag

AC

F

Series residuals(ajuste1)

5 10 15 20 25

−0.

2−

0.1

0.0

0.1

0.2

Lag

Par

tial A

CF

Series residuals(ajuste1)

Figura 7.13: Serie residuales despues de ajustar AR1.sim y ACF, PACF correspondientes

La Figura 7.14 muestra la serie AR1.sim y sus pronosticos con base en el

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ

7.8. EJEMPLOS 213

modelo AR(1) ajustado, para h = 5 perıodos futuros. Luego veremos como sonconstruidos estos pronosticos.

Forecasts from ARIMA(1,0,0) with zero mean

0 20 40 60 80 100

−3

−2

−1

01

23

4

Figura 7.14: Serie AR1.sim simulada y pronosticos para h = 5 perıodos futuros

Considere ahora, las series Z1t, Z3t presentadas en la Seccion 6.5.1 y laserie MA1.sim simulada con el modelo Zt = at + 0.67at−1, at ∼ RBN(0, 1) en elsiguiente codigo

Codigo R 7.3.

library(forecast)library(TSA)#LECTURA DE ARCHIVO DE DATOS datosejemFACS.txt#EL ARCHIVO TIENE EL NOMBRE DE LAS SERIES EN LA PRIMERA FILAdatos=read.table(file.choose(),header=T)

#CREAR MATRIZ DE SERIES datosdatos=ts(datos,freq=1)

#Extrayendo series Z1t y Z3tZ1t=datos[,2] #es un AR(1)Z3t=datos[,4] #es un ARMA(1,1)

#Simulando un MA(1)MA1.sim=arima.sim(list(order=c(0,0,1),ma=0.67),n=100)

#Graficando las tres seriesnf=layout(rbind(c(1,1,2,2),c(0,3,3,0)))plot(Z1t);plot(Z3t);plot(MA1.sim)

#Graficando las ACF y PACF de las tres seriesnf=layout(rbind(c(1,2),c(3,4),c(5,6)))

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


acf(Z1t,ci.type="ma",lag.max=25)pacf(Z1t,lag.max=25)acf(Z3t,ci.type="ma",lag.max=25)pacf(Z3t,lag.max=25)acf(MA1.sim,ci.type="ma",lag.max=25)pacf(MA1.sim,lag.max=25)

#Obtencion de EACF’s muestraleseacf(Z1t)eacf(Z3t)eacf(MA1.sim)

#Identificacion y ajuste automatico para serie Z1tajusteZ1t=auto.arima(Z1t,ic="bic")summary(ajusteZ1t)

#Grafico de residuales y ACF, PACF modelo ajustado a serie Z1tnf=layout(rbind(c(0,1,1,0),c(2,2,3,3)))plot(residuals(ajusteZ1t))abline(h=0,col=2)acf(residuals(ajusteZ1t),ci.type="ma",lag.max=25)pacf(residuals(ajusteZ1t),lag.max=25)

#Identificacion y ajuste automatico para serie Z3tajusteZ3t=auto.arima(Z3t,ic="bic")summary(ajusteZ3t)

#Grafico de residuales y ACF, PACF modelo ajustado a serie Z3tnf=layout(rbind(c(0,1,1,0),c(2,2,3,3)))plot(residuals(ajusteZ3t))abline(h=0,col=2)acf(residuals(ajusteZ3t),ci.type="ma",lag.max=25)pacf(residuals(ajusteZ3t),lag.max=25)

#Identificacion y ajuste automatico para serie MA1.simajusteMA1.sim=auto.arima(MA1.sim,ic="bic")summary(ajusteMA1.sim)

#Grafico de residuales y ACF, PACF modelo ajustado a serie MA1.simnf=layout(rbind(c(0,1,1,0),c(2,2,3,3)))plot(residuals(ajusteMA1.sim))abline(h=0,col=2)acf(residuals(ajusteMA1.sim),ci.type="ma",lag.max=25)pacf(residuals(ajusteMA1.sim),lag.max=25)

#Graficando las tres series y sus pronosticosnf=layout(rbind(c(0,1,1,0),c(2,2,3,3)))plot(forecast(ajusteZ1t,h=5))plot(forecast(ajusteZ3t,h=5))plot(forecast(ajusteMA1.sim,h=5))

Las Figuras 7.15 y 7.16 ilustran las series Z1t, Z3t y MA1.sim y sus funcionesde autocorrelacion y autocorrelacion parcial muestrales ¿Que tipo de procesopodemos especificar para cada una?

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ

7.8. EJEMPLOS 215

Time

Z1t

0 20 40 60 80 100

−2

−1

01

23

Time

Z3t

0 20 40 60 80 100

−2

02

4

Time

MA

1.si

m

0 20 40 60 80 100

−2

−1

01

23

Figura 7.15: Series Z1t, Z3t y MA1.sim, simuladas

5 10 15 20 25

−0.

20.

20.

6

Lag

AC

F

Series Z1t

5 10 15 20 25

−0.

20.

20.

6

Lag

Par

tial A

CF

Series Z1t

5 10 15 20 25

−0.

6−

0.2

0.2

Lag

AC

F

Series Z3t

5 10 15 20 25

−0.

6−

0.2

0.2

Lag

Par

tial A

CF

Series Z3t

5 10 15 20 25

−0.

20.

00.

20.

4

Lag

AC

F

Series MA1.sim

5 10 15 20 25

−0.

20.

20.

4

Lag

Par

tial A

CF

Series MA1.sim

Figura 7.16: ACF’s y PACF’s muestrales de las Series Z1t, Z3t y MA1.sim, simuladas

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


Considere ahora las EACF muestrales. De acuerdo a estas, ¿que tipo deproceso se identifica para cada serie? ¿coinciden con los modelos identificadosen la ACF y PACF?

Tabla 7.4: EACF muestral, Serie Z1tAR/MA 0 1 2 3 4 5 6 7 8 9 10 11 12 13

0 x x x o o o o o o o o o o o1 o o o o o o o o o o o o o o2 x o o o o o o o o o o o o o3 x x o o o o o o o o o o o o4 x o o o o o o o o o o o o o5 x x o o o o o o o o o o o o6 o x o o o o o o o o o o o o7 x x o o x o o o o o o o o o

Tabla 7.5: EACF muestral, Serie Z3tAR/MA 0 1 2 3 4 5 6 7 8 9 10 11 12 13

0 x x o o o o o o o o o o o o1 x x o o o o o o o o o o o o2 x x o o o o o o o o o o o o3 x o x o o o o o o o o o o o4 x x o o o o o o o o o o o o5 x o o o o x o o o o o o o o6 x x x x o x o o o o o o o o7 o o x o o o o o o o o o o o

Tabla 7.6: EACF muestral, Serie MA1.simAR/MA 0 1 2 3 4 5 6 7 8 9 10 11 12 13

0 x o o o o o o o o o o o o o1 x o o o o o o o o o o o o o2 x x x o o o o o o o o o o o3 x x o o o o o o o o o o o o4 o x o o o o o o o o o o o o5 o x o o o o o o o o o o o o6 x x o o o o o o o o o o o o7 x x o o o o o o o o o o o o

A continuacion se exhiben los resultados R de los ajustes automaticos paralas series Z1t, Z3t y MA1.sim. Las Figuras 7.17, 7.18 y 7.19 muestran los resid-uales respectivos y sus ACF y PACF muestrales. La Figura 7.20 presenta lasseries mas sus pronosticos. ¿Que modelos son identificados y ajustados porel metodo automatico y como resultan los ajustes (evaluacion de residuales)?

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ

7.8. EJEMPLOS 217

Salida R 7.2.

summary(ajusteZ1t)Series: Z1tARIMA(1,0,0) with zero mean

Coefficients:ar1

0.7420s.e. 0.0663

sigmaˆ2 estimated as 1.098: log likelihood = -146.98AIC = 297.95 AICc = 298.08 BIC = 303.16

In-sample error measures:ME RMSE MAE MPE MAPE MASE

0.06086727 1.04793888 0.82549189 -36.84375141 219.34814508 0.89982692

summary(ajusteZ3t)Series: Z3tARIMA(1,0,1) with zero mean

Coefficients:ar1 ma1

-0.3537 -0.5875s.e. 0.1130 0.0905



-0.1050398 1.0529324 0.8312345 -55.6478947 308.2121756 0.3713694

summary(ajusteMA1.sim)Series: MA1.simARIMA(0,0,1) with zero mean

Coefficients:ma1

0.7474s.e. 0.0831



0.06831956 1.05631518 0.85781607 85.68407876 146.18878431 0.82785503ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


Timere

sidu

als(

ajus

teZ

1t)

0 20 40 60 80 100

−2

−1

01

23

5 10 15 20 25

−0.

2−

0.1

0.0

0.1

0.2

Lag

AC

F

Series residuals(ajusteZ1t)

5 10 15 20 25

−0.

2−

0.1

0.0

0.1

0.2

Lag

Par

tial A

CF


Figura 7.17: Residuales del modelo ajustado para Z1t, y su ACF y PACF muestrales

Time

resi

dual

s(aj

uste

Z3t

)

0 20 40 60 80 100

−3

−2

−1

01

2

5 10 15 20 25

−0.

2−

0.1

0.0

0.1

0.2

Lag

AC

F


5 10 15 20 25

−0.

2−

0.1

0.0

0.1

0.2

Lag

Par

tial A

CF


Figura 7.18: Residuales del modelo ajustado para Z3t, y su ACF y PACF muestrales

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ

7.8. EJEMPLOS 219

Time

resi

dual

s(aj

uste

MA

1.si

m)

0 20 40 60 80 100

−2

−1

01

2

5 10 15 20 25

−0.

2−

0.1

0.0

0.1

0.2

Lag

AC

F

Series residuals(ajusteMA1.sim)

5 10 15 20 25

−0.

2−

0.1

0.0

0.1

0.2

Lag

Par

tial A

CF

Series residuals(ajusteMA1.sim)

Figura 7.19: Residuales del modelo ajustado para MA1.sim, y su ACF y PACF muestrales

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ



0 20 40 60 80 100

−3

−2

−1

01

23


0 20 40 60 80 100

−2

02

4


0 20 40 60 80 100

−2

−1

01

23

Figura 7.20: Series Z1t, Z3t y MA1.sim y sus pronosticos para h = 5 perıodos futurosESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ

7.9. ESTIMACION POR MAXIMA VEROSIMILITUD EN MODELOS ARMA 221

7.9. Estimacion por maxima verosimilitud en modelos AR-

MA

Ya fue mencionado previamente que la estimacion en modelos ARMA re-quiere de metodos de estimacion no lineal, en particular, bajo el supuestoat ∼ RBN(0, σ2

a), podemos recurrir a la estimacion por maxima verosimilitud:Sean µ = E[Zt], σ

2a, Φ = (φ1, . . . , φp) y Θ = (θ1, . . . , θq), el conjunto de parametros

desconocidos del modelo. Bajo el supuesto de normalidad para at, tenemosque la funcion de densidad conjunta de a1, a2, . . . , an es

f(a1, . . . , an) =1

(2π)n/2σna

exp

[− 1

2σ2a

n∑

t=1

a2t

](7.37)

donde at = Zt − φ1Zt−1 − · · · − φpZt−p − θ1at−1 − · · · − θqat−q, y Zt = Zt − µ. Laverosimilitud de los parametros dado las observaciones es

L = L(µ, σ2a,Φ,Θ) � f(a1, . . . , an)

L(µ, σ2a,Φ,Θ) =

1

σna

exp

[− 1

2σ2a

S(µ, σ2a,Φ,Θ)

](7.38)

donde S(µ, σ2a,Φ,Θ) =

n∑t=1

a2t . Los estimadores de maxima verosimilitud son tales

que L es maxima o bien, l(µ, σ2a,Φ,Θ) = log(L) es maxima, lo cual resulta

cuando S(µ, σ2a,Φ,Θ) es mınimo. Al substituir t = 1, . . . , n en la expresion de

S(µ, σ2a,Φ,Θ), usando at = Zt − φ1Zt−1 − · · · − φpZt−p − θ1at−1 − · · · − θqat−q, ten-

dremos la necesidad de conocer los valores a0, a−1, . . . , a1−q y Z0, Z−1, . . . , Z1−p, esdecir, valores antes del primer tiempo. Tenemos tres alternativas

1. Inicializar aj = 0 para j ≤ 0 y Zj = Z = 1n

n∑t=1

Zt, para j ≤ 0

2. Definir S(µ, σ2a,Φ,Θ) solo para t donde todos los valores at y Zt son cono-

cidos.

3. Utilizar toda la informacion desde t = −M a t = n, donde aj y Zj, j =−M, . . . , 0 son obtenidos mediante backasting (pronostico hacia atras),con M tal que |E [Z−M |Z1, . . . , Zn]−E [Z−M−1|Z1, . . . , Zn] | < ǫ.

Las dos primeras alternativas conducen a estimadores de maxima verosimil-itud o de mınimos cuadrados condicionales, mientras que la tercera conducea estimadores de maxima verosimilitud o mınimos cuadrados incondicionales.

7.10. Pronosticos en modelos ARMA estacionarios e inverti-

bles

Considere un proceso ARMA(p,q) estacionario e invertible, y de media cero(si la media no es cero, considere en lugar de Zt a Zt = Zt − µ). Entonces

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


podemos escribir

Zt =Θq(B)

Φp(B)at = Ψ(B)at =

∞∑

j=0

ψjat−j con ψ0 = 1,∞∑

j=1

ψ2j <∞ (7.39)

Suponga que se conoce los valores de la serie para t = 1, . . . , n, luego, Zj, j =n+ 1, n+ 2, . . . , n+ l, . . . son valores futuros desconocidos. Queremos conocer elpronostico para t = n + l, es decir, queremos pronosticar la variable aleatoriaZn+l,

Zn+l =∞∑

j=0

ψjan+l−j (7.40)

Sea Zn(l) = Zn+l el pronostico para t = n + l con origen en t = n, tal que

Zn(l) =

∞∑

j=0

ψ∗l+jan−j = ψ∗

l an + ψ∗l+1an−1 + ψ∗

l+2an−2 + · · · (7.41)

El objetivo es hallar los ψ∗l+j tales que el error cuadratico medio de pronostico

sea mınimo, es decir, que minimicen a

ECMP = E[e2n(l)

], donde en(l) = Zn+l − Zn(l) (7.42)

en(l) es el error de pronostico l perıodos adelante de t = n. Con algo de ar-itmetica, podemos escribir

en(l) =∞∑

j=0

ψjan+l−j −∞∑

j=0

ψ∗l+jan−j =

l−1∑

j=0

ψjan+l−j +∞∑

j=0

(ψl+j − ψ∗l+j)an−j (7.43)

y de la ultima igualdad puede mostrarse que ECMP es mınimo cuando ψ∗l+j =

ψl+j, por tanto, el pronostico optimo es

Zn(l) =

∞∑

j=0

ψl+jan−j = ψlan + ψl+1an−1 + ψl+2an−2 + · · · (7.44)

Por otra parte, podemos mostrar que

E [Zn+l|Zn, Zn−1, . . .] =

∞∑

j=0

ψl+jan−j = Zn(l) (7.45)

es decir, el pronostico optimo es igual al valor esperado condicional del valorfuturo Zn+l dada la historia de la serie.

NOTA: Tener en cuenta que

an(l−j) = E [an+l−j|Zn, Zn−1, . . .] =

{0 si l ≥ j + 1 (aquı n+ l − j > n)

an+l−j si l ≤ j (aquı n + l − j ≤ n)(7.46)

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ

7.10. PRONOSTICOS EN MODELOS ARMA ESTACIONARIOS E INVERTIBLES223

donde an(l − j) es el pronostico optimo para an+l−j con origen en t = n, y

Zn(l − j) = E [Zn+l−j|Zn, Zn−1, . . .] =

{Zn(l − j) si l ≥ j + 1 (aquı n+ l − j > n)

Zn+l−j si l ≤ j (aquı n+ l − j ≤ n)

(7.47)Observe que para periodos posteriores a n el pronostico optimo para at es cero.

El valor esperado del error de pronostico es cero:

E [en(l)] = E[Zn+l − Zn(l)

]= E

[l−1∑

j=0

ψjan+l−j

]= 0 (7.48)

por tanto, Zn(l) =∞∑

j=0

ψl+jan−j es un estimador insesgado del valor futuro Zn+l,

lo cual es una caracterıstica deseable. Respecto a la varianza del error depronostico, se tiene que

VAR [en(l)] = VAR

[l−1∑

j=0

ψjan+l−j

]= σ2

a

l−1∑

j=0

ψ2j (7.49)

Por tanto bajo el supuesto de normalidad se tiene que un intervalo de predic-cion del (1− α)100 % para el valor futuro Zn+l es

Zn(l)± zα/2σa

√√√√l−1∑

j=0

ψ2j (7.50)

donde zα/2 es el cuantil (1 − α/2) de la distribucion normal estandar. Sin em-bargo, los parametros del modelo son desconocidos, incluyendo a σa y comolos ψj son funcion de los vectores de parametros Φ y Θ, entonces tambien sondesconocidos y deben ser estimados a traves de las estimaciones de estos dosvectores de parametros, luego, en la practica, para n grande se tiene que unintervalo de prediccion aproximado es

Zn(l)± zα/2σa

√√√√l−1∑

j=0

ψ2j (7.51)

Como pronosticar en la practica: Considere

Zn+l = φ1Zn+l−1 +φ2Zn+l−2 + · · ·+φpZn+l−p + an+l + θ1an+l−1 + θ2an+l−2 + · · ·+ θqan+l−q

(7.52)usando esta expresion y definiendo los pronosticos optimos comoZn(l) = E [Zn+l|Z1, . . . , Zn], an(l) = E [an+l|Z1, . . . , Zn] y utilizando los valores esti-mados para los parametros, tenemos que

Zn(l) = φ1Zn(l − 1) + φ2Zn(l − 2) + · · ·+ φpZn(l − p)

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


+ an(l) + θ1an(l − 1) + θ2an(l − 2) + · · ·+ θqan(l − q) (7.53)

donde debemos tener en cuenta lo establecido en las ecuaciones (7.46) y(7.47) para an(l − j), j = 1, . . . , q y Zn(l − k), k = 1, . . . , p, respectivamente. Porejemplo, sea Zt un ARMA(1,1), es decir

Zt = φ1Zt−1 + at + θ1at−1

y suponga que se tiene una serie de tamano n = 200 de este proceso con lacual se obtiene las siguiente estimaciones, φ1 = 0.777 y θ1 = 0.377, entoncespara pronosticar el valor futuro dos perıodos adelante de t = 200, tenemos quecalcular

Z200(2) = 0.777Z200(1) + a200(2) + 0.377a200(1) = 0.777Z200(1)

pues a200(1) = a200(2) = 0, de acuerdo a la ecuacion (7.46), y

Z200(1) = 0.777Z200(0) + a200(1) + 0.377a200(0) = 0.777Z200 + 0.3777a200

la ultima igualdad se deriva de las ecuaciones (7.46) y (7.47). Pero como at

realmente es una variable no observable, en su lugar usamos los residuales at.Suponga que Z200 = −2.586 y a200 = −1.666 entonces, reemplazando en la ultimaecuacion, se obtiene Z200(1) = −2.637404 y finalmente, reemplazamos este valoren la ecuacion para Z200(2) obtenemos Z200(2) = 0.777× (−2.637404) = −2.049263.

NOTAS:

1. En general para un ARMA(p,q), a partir de l > q los pronosticos Zn(l) solodependen de los ultimos p pronosticos Zn(j), y en particular, cuando elproceso es un MA(q) este no es pronosticable mas de q pasos adelante det = n, pues toda la dinamica del proceso que se aprovecha para pronos-ticar se desvanece cuando se llega al horizonte de longitud q, lo cual esun reflejo del comportamiento de la ACF del MA(q): esta se hace cero parak > q.

2. En modelos AR(p) y ARMA(p,q), para l > p los nuevos pronosticos usanpronosticos previos de Zt, esto implica que se cometera mas error enpronosticos con horizonte mas alla de p.

3. Lo anterior implica que no es recomendable en general, pronosticos delargo plazo en los modelos ARMA.

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ

Capıtulo 8

Modelacion de una serie con errores ARMA

En este Capıtulo veremos, mediante dos ejemplos, como se integra en lamodelacion por regresion lineal y no lineal, las componentes de tendencia,estacionalidad determinısticas y los ciclos ARMA identificados para los erroresestructurales del modelo. Para el modelo lineal la estructura general en estecaso es como se indica a seguir,

Yt = Tt + St + Et, con Φp(B)Et = Θq(B)at, at ∼ RB N(0, σ2a), (8.1)

donde Φp(B) = 1 − φ1B − φ2B2 − · · · − φpB

p y Θq(B) = 1 + θ1B + θ2B2 + · · · + θqB

q

son los polinomios autorregresivos y de medias moviles, respectivamente, talesque sus raıces son de modulo mayor a 1, es decir, el proceso ARMA(p,q) paraEt es un proceso estacionario, invertible y de media cero, ademas tales poli-nomios se asumen sin factores en comun.

Respecto a modelos no lineales, consideraremos especıficamente el casocon estructura exponencial, es decir

Yt = exp(Tt + St) + Et, con Φp(B)Et = Θq(B)at, at ∼ RB N(0, σ2a), (8.2)

Este es un modelo parcialmente multiplicativo. Si se considera que en sulugar deberıa ajustarse un modelo completamente multiplicativo, entonces laecuacion (8.1) serıa aplicada a log(Yt) en vez de Yt.

Considere la serie de produccion trimestral de cemento portland una serieestacional multiplicativa que va desde trimestre 1 de 1956 a trimestre 3 de1994, presentada en la Figura 8.1.

8.1. Modelo inicial: Tendencia, estacionalidad y errores R.B

8.1.1. Ajuste y pronostico

Inicialmente vamos a considerar un modelo de regresion global con tenden-cia cubica y estacionalidad trimestral determinıstica con indicadoras, para ellogaritmo de la serie para ser ajustado con los primeros n = 151 observaciones

225

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ

226 CAPITULO 8. MODELACION DE UNA SERIE CON ERRORES ARMA

Producción trimestral cemento portlandMiles de ton. Q11956−Q31994

Time

yt

1960 1970 1980 1990

500

1000

1500

2000

Log de producción trimestral cemento portlandMiles de ton. Q11956−Q31994

Time

log(

yt)

1960 1970 1980 1990

6.5

7.0

7.5

Figura 8.1: Izq.: Serie de produccion trimestral de cemento portland (miles de toneladas) y Der.: su logaritmo

(en total son N = 155 observaciones), Modelo 1: Modelo Log-cubico estacional:

Modelo 1: log(Yt) = β0 + β1t+ β2t2 + β3t

3 +3∑

i=1

δiIi,t + Et, Etiid∼ N(0, σ2) (8.3)

El ajuste con R produce la siguiente tabla de parametros ajustados:

Tabla 8.1: Parametros ajustados en modelo Log-cubico estacional

Parametro Estimacion Error Estandar T0 P (|t144| > |T0|)β0 6.2508 0.0249 251.3447 0.0000β1 0.0199 0.0013 15.3924 0.0000β2 -1.2897×10−4 0.0000 -6.5427 0.0000β3 3.1684×10−7 0.0000 3.7161 0.0003δ1 -0.1317 0.0157 -8.3657 0.0000δ2 -0.0185 0.0157 -1.1772 0.2410δ3 0.0145 0.0157 0.9188 0.3597√

MSE = 0.06813, *Crit. de inf.: AIC = −373.9363, BIC = −349.7981*Medidas de AIC y BIC en escala logarıtmica

Con estos resultados se pronostican los siguientes m = 4 periodos (t =152a 155)

Y151(L) ≈ exp[6.2508 + 0.0199(151 + L)− 1.2897× 10−4(151 + L)2 + 3.1684× 10−7(151 + L)3

−0.1317I1,151+L − 0.0185I2,151+L + 0.0145I3,151+L]× exp

((0.06813)2

2

)

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ

8.1. MODELO INICIAL: TENDENCIA, ESTACIONALIDAD Y ERRORES R.B227

L = 1, · · · , m. Los pronosticos que se obtienen y sus intervalos de predicciondel 95 % son presentados en la Tabla 8.2 y la precision de los pronosticos enla Tabla 8.3. En la Figura 8.3 se aprecia la serie real, ajustada y pronosticadasegun el modelo Log-cubico estacional.

Tabla 8.2: Pronosticos Modelo Log-cubico estacional - Miles de ton.

Perıodo L real pronostico Lim. Inf Lim. Sup

1993 Q4 1 1777 1649.702 1429.387 1903.9761994 Q1 2 1468 1450.015 1255.496 1674.6711994 Q2 3 1732 1628.089 1408.739 1881.5941994 Q3 4 1962 1687.280 1458.900 1951.411

Tabla 8.3: Precision pronosticos Modelo Log-cubico

estacionalME RMSE MAE MPE MAPE

130.98 160.31 130.98 7.10 7.10

Serie real, ajustes y pronósticosModelo Log cúbico estacional

Time

yt

1960 1970 1980 1990

500

1000

1500

2000

OriginalAjustadaPronósticos

Figura 8.2: Serie real, ajustada y pronosticos para la validacion cruzada, modelo Log-cubico estacional

En la Figura 8.3 se aprecian los graficos de residuales obtenidos del ajuste

en escala logarıtmica, es decir Et vs. t y Et vs. log(Yt), donde

Et = log(Yt)−[6.2508 + 0.0199t− 1.2897× 10−4t2 + 3.1684× 10−7t3

−0.1317I1,t − 0.0185I2,t + 0.0145I3,t]

Es clara la presencia de ciclos ası como problemas de varianza hacia el finalde la serie de residuales (o posiblemente presencia de observaciones extremasen ese intervalo causen la apariencia de varianza no constante).

8.1.2. Analisis e identificacion de ciclos en los errores estructurales Et

El analisis de los residuales del modelo ajustado nos llevan a concluir quelos errores no son ruido blanco (¿por que?), sin embargo, son estacionarios encovarianza (¿por que?). Los posibles modelos que se identifican son

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


Del analisis de ACF - PACF: Un AR(6) ¿por que?;

Del analisis de la EACF: ARMA(1,5), ARMA (2,4) ¿por que?;

Con la funcion auto.arima() de la librerıa forecast aplicada sobre elvector de valores de los residuales (sin convertirlos en objeto ts() ) seidentifica un ARMA(2,2) y sobre la serie de tiempo de los residuales (resi-duales convertidos en objeto ts() ) se obtiene un arma estacional esta-cionario ARMA(1,2)×(0, 1)[4];

Con la funcion armasubsets() de la librerıa TSA se identifica un AR-MA(6,7) (con parametros φj, j = 1, 3, 4, 5, y θi, i = 1, 2, . . . , 6, fijos en cero),ARMA(7,10) (con parametros φj, j = 2, 3, 4, 5, 6, y θi, i = 1, 2, . . . , 7, 9, fi-jos en cero). Sin embargo, en las secciones siguientes se trabajara sobreversiones modificadas de estos dos modelos, modificaciones que fueronestablecidas luego de ajustar la serie de logaritmo con las componentesestructurales y los ciclos arma respectivos y verificar que no se obtenıanerrores de ajuste at satisfaciendo el supuesto de ruido blanco.

0 50 100 150

−0.

2−

0.1

0.0

0.1

0.2

t

resi

dual

s(m

odel

o1)

6.2 6.4 6.6 6.8 7.0 7.2 7.4

−0.

2−

0.1

0.0

0.1

0.2

fitted(modelo1)

resi

dual

s(m

odel

o1)

0 5 10 15 20 25 30 35

−0.

4−

0.2

0.0

0.2

0.4

0.6

0.8

ACF modelo1

Lag

AC

F

0 5 10 15 20 25 30 35

−0.

20.

00.

20.

40.

60.

8

Lag

Par

tial A

CF

PACF modelo1

Figura 8.3: Residuales estructurales Et modelo log-cubico estacional y ACF y PACF muestrales

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


Tabla 8.4: EACF para Et, modelo 1

AR/MA 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18

0 x x x x o o o x x x x x x o o o o o o1 x x o x x o o o o o o o o o o o o o o2 x x o x o o o o o o o o o o o o o o o3 o x o x o o o o o o o o o o o o o o o4 o x x x o o o o o o o o o o o o o o o5 x x x x o o o o o o o o o o o o o o o6 x x o o o o o o o o o o o o o o o o o7 x o o o o o o o o o o o o o o o o o o8 x x o o o o o o o o o o o o o o o o o9 x o o o o o o o o o o o o o o o o o o10 x x o o o o o o o o o o o o o o o o o11 x x x o x o o o o o o o o o o o o o o12 x x x x o o o o o o o o o o o o o o o13 o o x x o o o o o o o o o o o o o o o14 x o o o o o o o o o o o o o o o o o o15 x o o o o o o o o o o o o o o o o o o16 x o o o o o o o o o o o o o o o o o o17 x o o o o o x o o o o o o o o o o o o18 o o x o o x o o o o o o o o o o o o o

Tabla 8.5: Test Ljung-Box para Et, modelo 1

m QLB gl P (χ2m > QLB)

6 231.11 6.00 0.0012 282.84 12.00 0.0018 292.75 18.00 0.0024 330.85 24.00 0.0030 349.64 30.00 0.0036 393.11 36.00 0.00

Tabla 8.6: Test Durbin-Watson de orden 1 para Et, modelo 1

H1 : ρ(1) > 0 H1 : ρ(1) < 0k ρ(1) Estadıstico d1 P (DW1 < d1) P (DW1 > d1)1 0.7892629 0.4212927 0.00 1

Tabla 8.7: Identificacion con auto.arima() sobre Et en el

modelo 1ARMA(2,2) φ1 φ2 θ1 θ2

Estimacion 0.1043 0.5094 0.6338 0.2569s.e 0.1316 0.1228 0.1399 0.1109

AIC = −544.72, BIC − 529.63ESTADÍS

TICA III

- 300

9137

NELFI G

ONZÁLEZ


Tabla 8.8: Identificacion con auto.arima() sobre Et en el

modelo 1, convertido a serie de tiempo

ARMA(1,2)×(0, 1)[4] φ1 θ1 θ2 Θ1

Estimacion 0.5935 0.1047 0.3875 0.3713s.e 0.1163 0.1259 0.1074 0.0841

AIC = −552.75, BIC = −537.66

El modelo en la Tabla anterior es un modelo ARMA estacional en el cuallas observaciones sucesivas tienen una estructura ARMA(1,2), mientras quelas observaciones separadas 4 perıodos en el tiempo, tienen una estructuraARMA(0, 1)[4] y cuya representacion teorica es

(1− φ1B)Et = (1 + θ1B + θ2B2)(1 + Θ1B

4)at, at ∼ R.BN(0, σ2a).

Este tipo de modelos sera visto al final del curso. Observe que la anteriorecuacion es equivalente a

(1− φ1B)Et = (1 + θ1B + θ2B2 + Θ1B

4 + θ1Θ1B5 + θ2Θ1B

6)at

es decir, a un ARMA(1,6): (1−φ1B)Et = (1+θ1B+θ2B2+θ3B

3+θ4B4+θ5B

5+θ6B6)at,

con θ1 = θ1, θ2 = θ2, θ3 = 0, θ4 = Θ1, θ5 = θ1Θ1 y θ6 = θ2Θ1.

BIC

(Inter

cept)

AR−la

g1AR

−lag2

AR−la

g3AR

−lag4

AR−la

g5AR

−lag6

AR−la

g7AR

−lag8

AR−la

g9AR

−lag1

0AR

−lag1

1AR

−lag1

2err

or−lag

7err

or−lag

8err

or−lag

9err

or−lag

10err

or−lag

11err

or−lag

12err

or−lag

1err

or−lag

2err

or−lag

3err

or−lag

4err

or−lag

5err

or−lag

6

−120

−120

−120

−130

−130

−130

−140

−140

−140

Figura 8.4: Resultado de la funcion armasubsets sobre Et en modelo log-cubico estacional

A continuacion se presentan las graficas de las ACF’s y PACF’s esperadaspara Et obtenidas con la funcion R ARMAacf(), bajo cada uno de los modelosanteriores (excepto para el SARMA en Tabla 8.8), usando en su construccionlos valores estimados de los parametros φj y θi, cuando estos modelos son

ajustados usando solo la serie de los Et resultantes del ajuste del modelo 1.

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


Los valores de tales parametros estimados se observan en las tablas 8.7, 8.9a 8.13. Para los modelos ARMA(6,7) y ARMA(7,10), las graficas en la Figura 7no corresponden a los modelos inicialmente identificados en el armasubsets,sino a la version modificada de estos, buscando el cumplimiento de ruido blan-co en los modelos sobre log(Yt), como se especifican, respectivamente, en lastablas 8.12 y 8.13 ¿Cual caso es mas proximo al comportamiento observadoen la ACF y PACF muestrales exhibidas en la Figura 8.3?

Tabla 8.9: Ajuste AR(6) sobre Et en el modelo 1

φ1 φ2 φ3 φ4 φ5 φ6

Estimacion 0.6555 0.3246 -0.2722 0.2468 -0.0573 -0.2301s.e 0.0785 0.0947 0.0975 0.0967 0.0953 0.0788

Tabla 8.10: Ajuste ARMA(1,5) sobre Et en el modelo 1

φ1 θ1 θ2 θ3 θ4 θ5

Estimacion 0.5522 0.1215 0.4349 0.0860 0.3881 0.1622s.e 0.1503 0.1556 0.1094 0.1250 0.0825 0.1066

Tabla 8.11: Ajuste ARMA(2,4) sobre Et en el modelo 1

φ1 φ2 θ1 θ2 θ3 θ4

Estimacion 1.0111 -0.3287 -0.3303 0.4541 -0.0760 0.4087s.e 0.2087 0.1758 0.1938 0.1047 0.1013 0.0817

Tabla 8.12: Ajuste ARMA(6,7) sobre Et en el modelo 1. Este es la modifi-

cacion del ARMA(6,7) identificado con armasubsets()φ1 φ2 φ3 φ6 θ7

Estimacion 0.6131 0.4073 -0.1655 -0.1573 -0.1101s.e 0.0790 0.0893 0.0836 0.0554 0.0900

Tabla 8.13: Ajuste ARMA(7,10) sobre Et en el modelo 1. Este es la modifi-

cacion del ARMA(7,10) identificado con armasubsets()φ1 φ7 θ1 θ2 θ4 θ8 θ10

Estimacion 0.3716 -0.1414 0.7969 0.8755 0.9065 -0.2450 -0.1328s.e 0.0901 0.0922 0.1476 0.1690 0.1272 0.1145 0.1523

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


0 5 10 15 20 25 30 35

k

ρ(k)

0

1ARMA(2,2)−teórico

0 5 10 15 20 25 30 35

k

φ kk

0


0 5 10 15 20 25 30 35

k

ρ(k)

0

1AR(6)−teórico

0 5 10 15 20 25 30 35

k

φ kk

0

1AR(6)−teórico

Figura 8.5: ACF’s y PACF’s teoricas de modelos ARMA identificados para Et

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


0 5 10 15 20 25 30 35

k

ρ(k)

0


0 5 10 15 20 25 30 35

k

φ kk

0


0 5 10 15 20 25 30 35

k

ρ(k)

0


0 5 10 15 20 25 30 35

k

φ kk

0



ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


0 5 10 15 20 25 30 35

k

ρ(k)

0


0 5 10 15 20 25 30 35

k

φ kk

0


0 5 10 15 20 25 30 35

k

ρ(k)

0


0 5 10 15 20 25 30 35

k

φ kk

0



ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ

8.2. MODELOS DE TENDENCIA, ESTACIONALIDAD MAS CICLOS ARMA235

8.2. Modelos de tendencia, estacionalidad mas ciclos ARMA

8.2.1. Ciclos AR(6)


3 +3∑

i=1

δiIi,t + Et,

Et =

6∑

j=1

φjEt−j + at, at ∼ RBN(0, σ2a) (8.4)

Ajuste y pronosticos

Tabla 8.14: Tabla parametros estimados Modelo 2

Parametros Estimacion s.e Valor T0* P (|t138| > |T0|)**φ1 0.6546 0.0784 8.3540 0.0000φ2 0.3243 0.0938 3.4584 0.0007φ3 -0.2713 0.0950 -2.8550 0.0050φ4 0.2492 0.0908 2.7431 0.0069φ5 -0.0580 0.0935 -0.6200 0.5363φ6 -0.2338 0.0635 -3.6808 0.0003β0 6.2367 0.0376 166.0218 0.0000β1 0.0207 0.0021 9.7253 0.0000β2 -1.4136×10−4 0.0001 -1.5743 0.1177β3 3.7062×10−7 0.0000 0.7249 0.4698δ1 -0.1307 0.0078 -16.8537 0.0000δ2 -0.0180 0.0069 -2.6036 0.0102δ3 0.0146 0.0077 1.9102 0.0582

AIC = −541.94, BIC = −499.7, σ2a = 0.001327, df = 138

*Calculado manualmente, T0 = Estimacion/s.e**Calculado manualmente, P (|t138| > |T0|) = P (t138 > |T0|) + P (t138 < −|T0|)

La ecuacion de los pronosticos en escala original es

Y151(L) ≈ exp[6.2367 + 0.0207(151 + L)− 1.4136× 10−4(151 + L)2 + 3.7062× 10−7(151 + L)3

−0.1307I1,151+L − 0.0180I2,151+L + 0.0146I3,151+L + E151(L)]× exp (0.001327/2)

donde

E151(L) = 0.6546E151(L− 1) + 0.3243E151(L− 2)− 0.2713E151(L− 3)

+ 0.2492E151(L− 4)− 0.0580E151(L− 5)− 0.2338E151(L− 6)

Tabla 8.15: Predicciones Modelo 2, IP 95 %Perıodo Prediccion Lim.Inf Lim.Sup

1993 Q4 1637.388 1524.544 1758.5841994 Q1 1485.637 1364.104 1617.9971994 Q2 1665.394 1505.609 1842.1361994 Q3 1729.147 1555.993 1921.569

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


Tabla 8.16: Precision pronosticos Modelo 2ME RMSE MAE MPE MAPE

105.36 140.05 114.18 5.59 6.19

Time

yt

1960 1970 1980 1990

500

1000

1500

2000


Figura 8.8: Serie real, ajustada y pronosticos Modelo 2

6.2 6.4 6.6 6.8 7.0 7.2 7.4

−0.

100.

000.

050.

10

Residuales vs. ajustados modelo2

fitted(modelo2)

resi

d.aj

ust2

Residuales vs. tiempo modelo2

Time

resi

d.aj

ust2

1960 1970 1980 1990

−0.

100.

000.

050.

10

0 5 10 15 20 25 30 35

−0.

15−

0.05

0.05

0.15

ACF modelo2

Lag

AC

F

0 5 10 15 20 25 30 35

−0.

15−

0.05

0.05

0.15

Lag

Par

tial A

CF

PACF modelo2

Figura 8.9: Residuales at Modelo 2 y su ACF y PACF muestrales

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


−2 −1 0 1 2

−0.

10−

0.05

0.00

0.05

0.10

Gráfico Normal Residuales Modelo 2


Sam

ple

Qua

ntile

s

Figura 8.10: Grafico Normalidad de at Modelo 2

Tabla 8.17: Test de normalidad para at en Modelo 2

Estadıstico W 0.9862Valor P 0.1378

Test Shapiro-Wilk normality test

8.2.2. Ciclos ARMA(2,2)


3 +3∑

i=1

δiIi,t + Et,

Et =

2∑

j=1

φjEt−j + at +

2∑

k=1

θkat−k, at ∼ RBN(0, σ2a) (8.5)



Parametros Estimacion s.e Valor T0* P (|t140| > |T0|)**φ1 0.1045 0.1312 0.7962 0.4273φ2 0.5093 0.1226 4.1533 0.0001θ1 0.6336 0.1397 4.5346 0.0000θ2 0.2572 0.1108 2.3204 0.0218β0 6.2526 0.0479 130.4447 0.0000β1 0.0197 0.0017 11.3715 0.0000β2 -1.2489×10−4 0.0001 -1.4794 0.1413β3 2.9638×10−7 0.0000 0.4999 0.6180δ1 -0.1312 0.0077 -17.0662 0.0000δ2 -0.0181 0.0057 -3.1631 0.0019δ3 0.0152 0.0077 1.9811 0.0495

AIC = −530.75, BIC = −494.54, σ2a = 0.001473, df = 140


ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ



Y151(L) ≈ exp[6.2526 + 0.0197(151 + L)− 1.2489× 10−4(151 + L)2 + 2.9638× 10−7(151 + L)3

−0.1312I1,151+L − 0.0181I2,151+L + 0.0152I3,151+L + E151(L)]× exp (0.001473/2)

donde

E151(L) = 0.1045E151(L− 1) + 0.5093E151(L− 2) + 0.6336a151(L− 1) + 0.2572a151(L− 2)


1993 Q4 1601.677 1485.618 1726.8031994 Q1 1430.268 1302.612 1570.4351994 Q2 1594.970 1424.557 1785.7671994 Q3 1664.929 1479.227 1873.944


161.79 186.54 161.79 8.87 8.87

Time

yt

1960 1970 1980 1990

500

1000

1500

2000


Figura 8.11: Serie real, ajustada y pronosticos Modelo 3ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


6.2 6.4 6.6 6.8 7.0 7.2 7.4

−0.

100.

000.

050.

10


fitted(modelo3)

resi

d.aj

ust3


Time

resi

d.aj

ust3

1960 1970 1980 1990

−0.

100.

000.

050.

10

0 5 10 15 20 25 30 35

−0.

2−

0.1

0.0

0.1

0.2

ACF modelo3

Lag

AC

F

0 5 10 15 20 25 30 35

−0.

15−

0.05

0.05

0.15

Lag

Par

tial A

CF

PACF modelo3


−2 −1 0 1 2

−0.

10−

0.05

0.00

0.05

0.10



Sam

ple

Qua

ntile

s


ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ







3 +3∑

i=1

δiIi,t + Et,

Et = φ1Et−1 + at +

5∑

k=1




Parametros Estimacion s.e Valor T0* P (|t138| > |T0|)**φ1 0.5509 0.1502 3.6666 0.0003θ1 0.1228 0.1557 0.7888 0.4316θ2 0.4361 0.1086 4.0143 0.0001θ3 0.0869 0.1250 0.6950 0.4882θ4 0.3890 0.0818 4.7556 0.0000θ5 0.1633 0.1065 1.5333 0.1275β0 6.2444 0.0471 132.6452 0.0000β1 0.0201 0.0017 11.4934 0.0000β2 -1.2997×10−4 0.0001 -1.5477 0.1240β3 3.1521×10−7 0.0000 0.5334 0.5946δ1 -0.1307 0.0076 -17.1882 0.0000δ2 -0.0178 0.0072 -2.4684 0.0148δ3 0.0150 0.0076 1.9780 0.0499

AIC = −538.65, BIC = −496.41, σ2a = 0.001357, df = 138



Y151(L) ≈ exp[6.2444 + 0.0201(151 + L)− 1.2997× 10−4(151 + L)2 + 3.1521× 10−7(151 + L)3

−0.1307I1,151+L − 0.0178I2,151+L + 0.0150I3,151+L + E151(L)]× exp (0.001357/2)

donde

E151(L) = 0.5509E151(L− 1) + 0.1228a151(L− 1) + 0.4361a151(L− 2)

+ 0.0869a151(L− 3) + 0.3890a151(L− 4) + 0.1633a151(L− 5)

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ



1993 Q4 1604.400 1492.640 1724.5291994 Q1 1434.798 1315.165 1565.3151994 Q2 1599.942 1440.794 1776.6681994 Q3 1645.541 1471.802 1839.789


163.58 192.66 163.58 8.93 8.93

Time

yt

1960 1970 1980 1990

500

1000

1500

2000



6.2 6.4 6.6 6.8 7.0 7.2 7.4

−0.

100.

000.

050.

10


fitted(modelo4)

resi

d.aj

ust4


Time

resi

d.aj

ust4

1960 1970 1980 1990

−0.

100.

000.

050.

10

0 5 10 15 20 25 30 35

−0.

15−

0.05

0.05

0.15

ACF modelo4

Lag

AC

F

0 5 10 15 20 25 30 35

−0.

15−

0.05

0.05

0.15

Lag

Par

tial A

CF

PACF modelo4


ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


−2 −1 0 1 2

−0.

10−

0.05

0.00

0.05

0.10



Sam

ple

Qua

ntile

s






modelo 5: log(Yt) = β0 + β1t+ β2t2 + β3t

3 +3∑

i=1

δiIi,t + Et,

Et =

2∑

j=1

φjEt−j + at +

4∑

k=1




Parametros Estimacion s.e Valor T0* P (|t138| > |T0|)**φ1 1.0112 0.2084 4.8526 0.0000φ2 -0.3289 0.1754 -1.8751 0.0629θ1 -0.3304 0.1934 -1.7086 0.0898θ2 0.4546 0.1037 4.3820 0.0000θ3 -0.0764 0.1008 -0.7575 0.4501θ4 0.4094 0.0808 5.0643 0.0000β0 6.2447 0.0449 139.1408 0.0000β1 0.0201 0.0017 11.7441 0.0000β2 -1.2995×10−4 0.0001 -1.5474 0.1241β3 3.1540×10−7 0.0000 0.5384 0.5912δ1 -0.1308 0.0076 -17.2161 0.0000δ2 -0.0179 0.0069 -2.6013 0.0103δ3 0.0150 0.0075 1.9853 0.0491

AIC = −539.19, BIC = −496.95, σ2a = 0.001353, df = 138


ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ



Y151(L) ≈ exp[6.2447 + 0.0201(151 + L)− 1.2995× 10−4(151 + L)2 + 3.1540× 10−7(151 + L)3

−0.1308I1,151+L − 0.0179I2,151+L + 0.0150I3,151+L + E151(L)]× exp (0.001353/2)

donde

E151(L) = 1.0112E151(L− 1)− 0.3289E151(L− 2)− 0.3304a151(L− 1)

+ 0.4546a151(L− 2)− 0.0764a151(L− 3) + 0.4094a151(L− 4)


1993 Q4 1604.766 1493.163 1724.7101994 Q1 1436.462 1316.513 1567.3401994 Q2 1598.198 1438.752 1775.3141994 Q3 1647.789 1473.705 1842.437


162.95 191.89 162.95 8.90 8.90

Time

yt

1960 1970 1980 1990

500

1000

1500

2000



ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


6.2 6.4 6.6 6.8 7.0 7.2 7.4

−0.

100.

000.

050.

10


fitted(modelo5)

resi

d.aj

ust5


Time

resi

d.aj

ust5

1960 1970 1980 1990

−0.

100.

000.

050.

10

0 5 10 15 20 25 30 35

−0.

15−

0.05

0.05

0.15

ACF modelo5

Lag

AC

F

0 5 10 15 20 25 30 35

−0.

15−

0.05

0.05

0.15

Lag

Par

tial A

CF

PACF modelo5


−2 −1 0 1 2

−0.

10−

0.05

0.00

0.05

0.10



Sam

ple

Qua

ntile

s





ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ



Modelo 6i: Primero se ajusto con los ciclos indicados en el primer modelo

identificado en la Figura 8.4, es decir, log(Yt) = β0 +β1t+β2t2 +β3t

3 +3∑

i=1

δiIi,t +Et,

Et = φ2Et−2 +φ6Et−6 + at + θ7at−7, at ∼ RBN(0, σ2a). Los residuales at, ACF y PACF

muestrales de estos residuales se muestran en la Figura 8.20, donde es claroque el supuesto de ruido blanco para at no es valido. Ası que se procedio amodificar los ciclos en este modelo como se especifica a continuacion.


3 +3∑

i=1

δiIi,t + Et,

Et = φ1Et−1 + φ2Et−2 + φ3Et−3 + φ6Et−6 + at + θ7at−7, at ∼ RBN(0, σ2a). (8.8)



Parametros Estimacion s.e Valor T0* P (|t139| > |T0|)**φ1 0.6118 0.0789 7.7550 0.0000φ2 0.4077 0.0892 4.5701 0.0000φ3 -0.1635 0.0802 -2.0376 0.0435φ6 -0.1606 0.0347 -4.6225 0.0000θ7 -0.1137 0.0839 -1.3564 0.1772β0 6.2373 0.0377 165.5413 0.0000β1 0.0207 0.0021 9.7483 0.0000β2 -1.4116×10−4 0.0001 -1.5702 0.1186β3 3.6964×10−7 0.0000 0.7164 0.4750δ1 -0.1312 0.0070 -18.8185 0.0000δ2 -0.0183 0.0059 -3.1196 0.0022δ3 0.0144 0.0069 2.0894 0.0385

AIC = −538.96, BIC = −475.6, σ2a = 0.001373, df = 139


ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


6.2 6.4 6.6 6.8 7.0 7.2 7.4

−0.

15−

0.05

0.05

Residuales vs. ajustados modelo6i

fitted(modelo6i)

resi

d.aj

ust6

i

Residuales vs. tiempo modelo6i

Time

resi

d.aj

ust6

i

1960 1970 1980 1990

−0.

15−

0.05

0.05

0 5 10 15 20 25 30 35

−0.

20.

00.

20.

4

ACF modelo6i

Lag

AC

F

0 5 10 15 20 25 30 35

−0.

20.

00.

20.

4

Lag

Par

tial A

CF

PACF modelo6i

Figura 8.20: Residuales at del ajuste con errores ARMA(6,7), con φj , j = 1, 3, 4, 5, y θi, i = 1, 2, . . . , 6, fijos en cero, y su

ACF y PACF muestrales

La ecuacion de los pronosticos del modelo 6 en escala original es

Y151(L) ≈ exp[6.2373 + 0.0207(151 + L)− 1.4116× 10−4(151 + L)2 + 3.6964× 10−7(151 + L)3

−0.1312I1,151+L − 0.0183I2,151+L + 0.0144I3,151+L + E151(L)]× exp (0.001373/2)

donde

E151(L) = 0.6118E151(L− 1) + 0.4077E151(L− 2)− 0.1635E151(L− 3)

− 0.1606E151(L− 6)− 0.1137a151(L− 7)


1993 Q4 1644.559 1529.368 1768.4261994 Q1 1464.141 1344.657 1594.2411994 Q2 1655.941 1494.869 1834.3681994 Q3 1717.747 1538.461 1917.925

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ



114.15 144.05 114.15 6.14 6.14

Time

yt

1960 1970 1980 1990

500

1000

1500

2000



6.2 6.4 6.6 6.8 7.0 7.2 7.4

−0.

100.

000.

050.

10


fitted(modelo6)

resi

d.aj

ust6


Time

resi

d.aj

ust6

1960 1970 1980 1990

−0.

100.

000.

050.

10

0 5 10 15 20 25 30 35

−0.

15−

0.05

0.05

0.15

ACF modelo6

Lag

AC

F

0 5 10 15 20 25 30 35

−0.

15−

0.05

0.05

0.15

Lag

Par

tial A

CF

PACF modelo6

Figura 8.22: Residuales at Modelo 6 y su ACF y PAF muestrales

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


−2 −1 0 1 2

−0.

10−

0.05

0.00

0.05

0.10



Sam

ple

Qua

ntile

s






Modelo 7i: Primero se ajusto con los ciclos indicados en el segundo modelo

de la Figura 8.4, es decir, log(Yt) = β0 + β1t + β2t2 + β3t

3 +3∑

i=1

δiIi,t + Et, Et =

φ1Et−1 + φ7Et−7 + at + θ8at−8 + θ10at−10, at ∼ RBN(0, σ2a). Los residuales at, ACF y

PACF muestrales de estos residuales se muestran en la Figura 8.24, donde esclaro que el supuesto de ruido blanco para at no es valido. Ası que se procedio amodificar los ciclos de este modelo como se especifica a continuacion.


3 +

3∑

i=1

δiIi,t + Et,

Et = φ1Et−1+φ7Et−7+at+θ1at−1+θ2at−2+θ4at−4+θ8at−8+θ10at−10, at ∼ RBN(0, σ2a).(8.9)



Y151(L) ≈ exp[6.2444 + 0.0202(151 + L)− 1.32999× 10−4(151 + L)2 + 3.3228× 10−7(151 + L)3

−0.1309I1,151+L − 0.0182I2,151+L + 0.0149I3,151+L + E151(L)]× exp (0.0006892/2)

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


6.2 6.4 6.6 6.8 7.0 7.2 7.4

−0.

100.

000.

10

Residuales vs. ajustados modelo7i

fitted(modelo7i)

resi

d.aj

ust7

i

Residuales vs. tiempo modelo7i

Time

resi

d.aj

ust7

i

1960 1970 1980 1990

−0.

100.

000.

10

0 5 10 15 20 25 30 35

−0.

20.

00.

10.

2

ACF modelo7i

Lag

AC

F

0 5 10 15 20 25 30 35

−0.

2−

0.1

0.0

0.1

0.2

Lag

Par

tial A

CF

PACF modelo7i

Figura 8.24: Residuales at del ajuste con errores ARMA(7,10), con φj , j = 2, 3, 4, 5, 6, y θi, i = 1, 2, . . . , 7, 9, fijos en cero,

y su ACF y PACF muestrales


Parametros Estimacion s.e Valor T0* P (|t137| > |T0|)**φ1 0.3712 0.0876 4.2400 0.0000φ7 -0.1427 0.0647 -2.2062 0.0290θ1 0.7968 0.1398 5.7012 0.0000θ2 0.8750 0.1686 5.1888 0.0000θ4 0.9068 0.1273 7.1249 0.0000θ8 -0.2446 0.1140 -2.1456 0.0337θ10 -0.1352 0.1209 -1.1180 0.2655β0 6.2444 0.0368 169.7221 0.0000β1 0.0202 0.0021 9.6756 0.0000β2 -1.32999×10−4 0.0001 -1.4904 0.1384β3 3.3228×10−7 0.0000 0.6385 0.5242δ1 -0.1309 0.0073 -17.9633 0.0000δ2 -0.0182 0.0066 -2.7795 0.0062δ3 0.0149 0.0072 2.0671 0.0406

AIC = −534.05, BIC = −458.62, σ2a = 0.0006892, df = 137


donde

E151(L) = 0.3712E151(L− 1)− 0.1427E151(L− 7) + 0.7968a151(L− 1)

+ 0.8750a151(L− 2) + 0.9068a151(L− 4)− 0.2446a151(L− 8)− 0.1352a151(L− 10)

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ



1993 Q4 1612.564 1499.348 1734.3291994 Q1 1452.297 1328.975 1587.0621994 Q2 1606.601 1444.398 1787.0191994 Q3 1676.599 1497.718 1876.845


147.73 176.40 147.73 8.03 8.03

Time

yt

1960 1970 1980 1990

500

1000

1500

2000



6.2 6.4 6.6 6.8 7.0 7.2 7.4

−0.

050.

000.

05


fitted(modelo7)

resi

d.aj

ust7


Time

resi

d.aj

ust7

1960 1970 1980 1990

−0.

050.

000.

05

0 5 10 15 20 25 30 35

−0.

15−

0.05

0.05

0.15

ACF modelo7

Lag

AC

F

0 5 10 15 20 25 30 35

−0.

15−

0.05

0.05

0.15

Lag

Par

tial A

CF

PACF modelo7


ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


−2 −1 0 1 2

−0.

050.

000.

05



Sam

ple

Qua

ntile

s





8.2.7. Ciclos ARMA(1, 2) × (0, 1)[4]


3 +3∑

i=1

δiIi,t + Et,

(1− φ1B)Et = (1 + θ1B + θ2B2)(1 + Θ1B

4)at, at ∼ RBN(0, σ2a). (8.10)



Parametros Estimacion s.e Valor T0* P (|t140| > |T0|)**φ1 0.5933 0.1163 5.1014 0.0000θ1 0.1050 0.1260 0.8334 0.4060θ2 0.3879 0.1065 3.6410 0.0004Θ1 0.3716 0.0838 4.4346 0.0000β0 6.2484 0.0485 128.8175 0.0000β1 0.0199 0.0017 11.3867 0.0000β2 -1.2828×10−4 0.0001 -1.5338 0.1273β3 3.1041×10−7 0.0000 0.5227 0.6020δ1 -0.1309 0.0081 -16.2576 0.0000δ2 -0.0183 0.0063 -2.8894 0.0045δ3 0.0151 0.0080 1.8867 0.0613

AIC = −538.77, BIC = −502.56, σ2a = 0.001394, df = 140



ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


Y151(L) ≈ exp[6.2484 + 0.0199(151 + L)− 1.2828× 10−4(151 + L)2 + 3.1041× 10−7(151 + L)3

−0.1309I1,151+L − 0.0183I2,151+L + 0.0151I3,151+L + E151(L)]× exp (0.001394/2)

donde

E151(L) = 0.5933E151(L− 1) + 0.1050a151(L− 1)

+0.3879a151(L−2)+0.3716a151(L−4)+(0.1050× 0.3716) a151(L−5)+(0.3879× 0.3716) a151(L−6)


1993 Q4 1607.602 1494.156 1729.6621994 Q1 1449.555 1325.774 1584.8921994 Q2 1597.950 1436.036 1778.1211994 Q3 1670.786 1493.204 1869.488


153.28 181.53 153.28 8.34 8.34

Time

yt

1960 1970 1980 1990

500

1000

1500

2000



ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


6.2 6.4 6.6 6.8 7.0 7.2 7.4

−0.

100.

000.

050.

10


fitted(modelo8)

resi

d.aj

ust8


Time

resi

d.aj

ust8

1960 1970 1980 1990

−0.

100.

000.

050.

10

0 5 10 15 20 25 30 35

−0.

10.

00.

1

ACF modelo8

Lag

AC

F

0 5 10 15 20 25 30 35

−0.

15−

0.05

0.05

0.15

Lag

Par

tial A

CF

PACF modelo8


−2 −1 0 1 2

−0.

10−

0.05

0.00

0.05

0.10



Sam

ple

Qua

ntile

s





ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


8.3. Seleccion del mejor modelo

La escogencia del mejor modelo debe realizarse entre modelos validos, esdecir, donde se verifican los supuestos sobre los cuales se construye el mode-lo, y considerando la calidad del ajuste y de los pronosticos en la validacioncruzada. Es necesario tambien que los modelos sean utiles, es decir, que supronosticos sean mejores que los del pronostico simple: MAPEmodelo < MSIMP.Para el caso, los pronosticos con el metodo simple de pronostico son

Y151(L) = Y151+L, L = 1, · · · , 4, o bien, Y151+j(1) = Y151+j+1, j = 0, 1, · · · , 3

Tabla 8.42: Pronosticos metodo simple

Perıodo L j valor real pronostico simple

1993 Q4 1 0 1777.00 1648.001994 Q1 2 1 1468.00 1777.001994 Q2 3 2 1732.00 1468.001994 Q3 4 3 1962.00 1732.00

para lo cual se obtiene el MSIMP = 13.81842 (este es el MAPE de metodosimple de pronostico).

Los pronosticos para L perıodos adelante de t = n en los modelos de com-ponentes aditivas y con ciclos ARMA se calculan como

(Pronostico)n+L = (Pronostico estructura)n+L + (Pronostico errores ARMA)n+L

donde el pronostico de la estructura es

(Pronostico estructura)n+L = Tn+L + Sn+L

es decir, tendencia mas estacionalidad estimadas para t = n+L. Los pronosti-cos para los errores ARMA(p,q) son de acuerdo a lo visto en la Seccion 7.10 delas notas de clase:

En(L) = φ1En(L− 1) + φ2En(L− 2) + · · ·+ φpEn(L− p)+ θ1an(L− 1) + θ2an(L− 2) + · · ·+ θqan(L− q)

NOTA: Si la serie es de componentes multiplicativas y se ajustada el logaritmode la serie por regresion con errores ARMA, producimos primero los valoresajustados y los pronosticos en la escala logarıtmica y luego llevamos a la escalaoriginal exponenciando estos valores y multiplicando por factor de correccioncalculado como exp(σ2

a/2). Respecto al ajuste, los residuales de ajuste at soncalculados y examinados en la escala logarıtmica, pues es en esa escala en lacual se ajustan los modelos.

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ

8.4. CODIGO R USADO 255

Tabla 8.43: Comparacion de los 8 modelos

MODELO DF AIC BIC MAPE VALIDO

1 144 -373.94 -349.80 7.10 No2 138 -541.94 -499.70 6.19 Sı3 140 -530.75 -494.54 8.87 No4 138 -538.65 -496.41 8.93 No (no normalidad)5 138 -539.19 -496.95 8.90 No (no normalidad)6 139 -538.96 -475.6 6.14 Sı7 137 -534.05 -458.62 8.03 Sı8 140 -538.77 -502.56 8.34 Sı

Time

Pro

ducc

ión

1500

1600

1700

1800

1900

1993.Q4 1994.Q1 1994.Q2 1994.Q3

Serie OriginalPronóstico Modelo 1Pronóstico Modelo 2Pronóstico Modelo 3Pronóstico Modelo 4Pronóstico Modelo 5Pronóstico Modelo 6Pronóstico Modelo 7Pronóstico Modelo 8

Figura 8.31: Valores reales y pronosticados con los ocho modelos (Miles de toneladas)

¿Cual modelo seleccionar para ajuste y pronostico? ¿Por que?.

8.4. Codigo R usado

A continuacion se da el codigo R usado para obtener los resultados presen-tados. Tenga en cuenta que los valores de grados de libertad usados en cadacaso corresponde al numero de datos usados en los ajustes menos el total deparametros estimados incluyendo intercepto y parametros del modelo ARMAajustado a los errores.

Codigo R 8.1. Cargando librerıas y definiendo funciones de usuario

library(forecast)library(TSA)library(car)

#Definiendo funcion para evaluar test Ljung-BoxBP.LB.test=function(serie,maxlag,type="Ljung"){aux=floor(maxlag/6);

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


X.squared=c(rep(NA,aux))df=c(rep(NA,aux))p.value=c(rep(NA,aux))for(i in 1:aux){test=Box.test(serie,lag=(6 * i),type=type)X.squared[i]=test[[1]]df[i]=test[[2]]p.value[i]=test[[3]]}lag=6 * c(1:aux)teste=as.data.frame(cbind(X.squared,df,p.value))rownames(teste)=lagteste}

#Definiendo funcion para evaluar test Durbin-WatsonpruebaDW1=function(modelo){dwneg=durbinWatsonTest(modelo,max.lag=1,method="normal",alternative="negative")dwpos=durbinWatsonTest(modelo,max.lag=1,method="normal",alternative="positive")res=data.frame(1,dwneg$r,dwneg$dw,dwpos$p,dwneg$p)names(res)=c("lag","rho estimado","Estad´ıstico D-W","VP rho>0","VP rho<0")res}

Codigo R 8.2. Lectura de los datos, graficas descriptivas, definicion de vari-

ables para ajuste y pronosticos

#LECTURA DE LOS DATOSyt=scan()465 532 561 570 529 604 603 582 554 620 646637 573 673 690 681 621 698 753 728 688 737782 692 637 757 783 757 674 734 835 838 797904 949 975 902 974 969 967 849 961 966 922836 998 1025 971 892 973 1047 1017 948 10321190 1136 1049 1134 1229 1188 1058 1209 11991253 1070 1282 1303 1281 1148 1305 1342 14521184 1352 1316 1353 1121 1297 1318 1281 11091299 1341 1290 1101 1284 1321 1317 1122 12611312 1298 1202 1302 1377 1359 1232 1386 14401439 1282 1573 1533 1651 1347 1575 1475 13571086 1158 1279 1313 1166 1373 1456 1496 12511456 1631 1554 1347 1516 1546 1564 1333 14581499 1613 1416 1625 1770 1791 1622 1719 19721893 1575 1644 1658 1668 1343 1441 1444 14971267 1501 1538 1569 1450 1569 1648 1777 14681732 1962

yt=ts(yt,frequency=4,start=c(1956,1))lnyt=log(yt)

#GRAFICANDO SERIE ORIGINAL Y SU LOGARITMO NATURALplot(yt,main="Produccion trimestral cemento portland\nMiles de ton. Q11956-Q31994")plot(lnyt,main="Log de produccion trimestral cemento portland\nMiles de ton. Q11956-Q31994")

#Valores de la serie y predictores para los ajustesm=4 #No. Obs para validacion cruzadan=length(yt)-myt2=ts(yt[1:n],frequency=4,start=c(1956,1))lnyt2=log(yt2)

#DEFINIENDO INDICE DE TIEMPO Y SU CUADRADO, E INDICADORAS, PARA LAS PRIMERAS n=151 OBSERVACIONESt=1:length(lnyt2)t2=tˆ2

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


t3=tˆ3trimestre=seasonaldummy(lnyt2)Q1=trimestre[,1];Q2=trimestre[,2];Q3=trimestre[,3]X=cbind(t,t2,t3,trimestre) #Esta matriz de los predictores sera usada con funcion Arima() o arima()

#Estos son los valores de los predictores para las prediccionestnuevo=152:155t2nuevo=tnuevoˆ2t3nuevo=tnuevoˆ3trimestrenuevo=seasonaldummyf(lnyt2,h=4)Xnuevo=cbind(t=tnuevo,t2=t2nuevo,t3=t3nuevo,trimestre=trimestrenuevo) #se usa en funcion forecastytf=ts(yt[tnuevo],frequency=4,start=c(1993,4)) #Tomando de la serie completa los ultimos m valores

#que son pronosticados

Codigo R 8.3. Ajuste del modelo 1, pronosticos y evaluacion de supuesto de

R.B sobre el error estructural Et

#AJUSTANDO MODELO AL log(yt2) CON TENDENCIA CUBICA Y ESTACIONALIDAD TRIMESTRALmodelo1=lm(lnyt2˜t+t2+t3+Q1+Q2+Q3)summary(modelo1) #Despliega resultados del modelo ajustado. Note que se ha

#eliminado la indicadora de la estacion 4AIC(modelo1)BIC(modelo1)

#Las predicciones se exponencian para obtener valores en escala originalpredic.modelo1=exp(predict(modelo1,newdata=data.frame(t=tnuevo,t2=t2nuevo,t3=t3nuevo,Q1=trimestrenuevo[,1],Q2=trimestrenuevo[,2],Q3=trimestrenuevo[,3]),level=0.95,interval="prediction")) * exp(summary(modelo1)$sigmaˆ2/2)

predic.modelo1=ts(predic.modelo1,freq=4,start=c(1993,4)) #coviertiendo a serie de tiempo predicciones#y sus I.P

predic.modelo1

ytpron1=predic.modelo1[,1]#Calidad de los pronosticosaccuracy(ytpron1,ytf)

#Graficando la serie original, ajustada y sus pronosticos, en escala original#la exponenciacion de los valores ajustados es necesaria para pasar de escala log a la original.

#Serie de tiempo de valores ajustados en escala original. Se usa factor de correccionythat1=ts(exp(fitted(modelo1)) * exp(summary(modelo1)$sigmaˆ2/2),frequency=4,start=c(1956,1))

plot(yt,main="Serie real, ajustes y pronosticos\nModelo Log cubico estacional")lines(ythat1,col=2)lines(ytpron1,col=4)legend("topleft",legend=c("Original","Ajustada","Pronosticos"),lty=1,lwd=c(1,2,2),col=c(1,2,4))

#Evaluando testes Ljung-Box y Durbin Watson en residuales modelo 1BP.LB.test(residuals(modelo1),maxlag=n/4,type="Ljung")pruebaDW1(modelo1)

#Graficas de residuales modelo 1, ACF, PACF y EACFnf=layout(rbind(c(1,1,2,2),c(3,3,4,4)))plot(t,residuals(modelo1),type="o"); abline(h=0,lty=2)plot(fitted(modelo1),residuals(modelo1),type="p"); abline(h=0,lty=2)acf(residuals(modelo1),ci.type="ma",main="ACF modelo1",lag.max=36)pacf(residuals(modelo1),main="PACF modelo1",lag.max=36)

eacf(residuals(modelo1),ar.max = 18, ma.max = 18) #EACF residuales estructurales

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


Codigo R 8.4. Identificacion automatica de modelos ARMA con funciones au-

to.arima( ) y armasubsets( ). Ajuste sobre los residuales estructurales del modelo

1, de los ciclos identificados, incluyendo los resultantes del analisis de la ACF

y PACF, y de la EACF de los residuales estructurales.

Para los ciclos considerados en los modelos 6 y 7 tenga en cuenta el usodel argumento fixed en la funcion Arima() , donde para cada uno de losparametros AR y MA, en ese orden, se indica en un vector c() , cuales debenestimarse colocando un NA, y cuales deben fijarse en 0, colocando tal numeroen la posicion correspondiente dentro del vector especificado. Este vector debetener p+ q entradas en total.

#GENERANDO GRAFICO del armasubsets()plot(armasubsets(residuals(modelo1),nar=12,nma=12,y.name=’AR’,ar.method=’ml’))

#IDENTIFICACI ON AUTOMATICA Y AJUSTE DE LOS CICLOS IDENTIFICADOSpruebaresAutom=auto.arima(residuals(modelo1))pruebaresAutom

#Lo siguiente puede arrojar un modelo ARMA estacionalserie.et=ts(residuals(modelo1),freq=4,start=c(1956,1))pruebaresAutom2=auto.arima(serie.et,ic="aic")pruebaresAutom2

pruebaresAR6=Arima(residuals(modelo1),order=c(6,0,0),include.mean=FALSE,method="ML")pruebaresAR6

pruebaresARMA15=Arima(residuals(modelo1),order=c(1,0,5),include.mean=FALSE,method="ML")pruebaresARMA15

pruebaresARMA24=Arima(residuals(modelo1),order=c(2,0,4),include.mean=FALSE,method="ML")pruebaresARMA24

#Ajustando sobre residuales estructurales, modificacion del primer modelo arrojado por armasubsets()pruebaresARMA67=Arima(residuals(modelo1),order=c(6,0,7),fixed=c(NA,NA,NA,0,0,NA,rep(0,6),NA),include.mean=FALSE,method="ML")pruebaresARMA67

#Ajustando sobre residuales estructurales, modificacion del segundo modelo arrojado por armasubsets()pruebaresARMA710=Arima(residuals(modelo1),order=c(7,0,10),fixed=c(c(NA,rep(0,5),NA),c(NA,NA,0,NA,rep(0,3),NA,0,NA)),include.mean=FALSE,method="ML")pruebaresARMA710

Codigo R 8.5. Construccion de las graficas de las ACF y PACF esperadas para

los errores estructurales del modelo 1, con base en las estimaciones de los ciclos

hechas en el codigo anterior.

#ACF’S Y PACF’S TEORICAS MODELOS CICLOS IDENTIFICADOS, EXCEPTO EL SARMA#PARAMETROS AJUSTADOSparma2.2=coef(pruebaresAutom)par6=coef(pruebaresAR6)parma1.5=coef(pruebaresARMA15)parma2.4=coef(pruebaresARMA24)parma6.7=coef(pruebaresARMA67)parma7.10=coef(pruebaresARMA710)

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


#ARMA(2,2) AJUSTADO A RESIDUALES MODELO1FAC=ARMAacf(ar = parma2.2[1:2], ma=parma2.2[3:4],lag.max = 36, pacf =FALSE)FACP=ARMAacf(ar = parma2.2[1:2], ma=parma2.2[3:4],lag.max = 36, pacf = TRUE)

nf=layout(rbind(c(1,2),c(3,4)))plot(1:36,FAC[-1],type=’h’,col=2,yaxt="n",bty="l",ylab=expression(rho(k)),xlab="k",lwd=2,ylim=c(-0.2,1))points(1:36,FAC[-1],cex=1.2,pch=19,col=2)axis(2,c(-1,0,1),label=c(-1,0,1),las=2)abline(h=0)legend("topright",legend=c("ARMA(2,2)-teorico"),bty="n")

plot(1:36,FACP,type=’h’,col=2,yaxt="n",bty="l",ylab=expression(phi[kk]),xlab="k",lwd=2,ylim=c(-0.3,1))points(1:36,FACP,cex=1.2,pch=19,col=2)axis(2,c(-1,0,1),label=c(-1,0,1),las=2)abline(h=0)legend("topright",legend=c("ARMA(2,2)-teorico"),bty="n")

#AR(6) AJUSTADOS A RESIDUALES MODELO1FAC=ARMAacf(ar=par6, lag.max = 36, pacf =FALSE)FACP=ARMAacf(ar =par6,lag.max = 36, pacf = TRUE)

plot(1:36,FAC[-1],type=’h’,col=2,yaxt="n",bty="l",ylab=expression(rho(k)),xlab="k",lwd=2,ylim=c(-0.3,1))points(1:36,FAC[-1],cex=1.2,pch=19,col=2)axis(2,c(-1,0,1),label=c(-1,0,1),las=2)abline(h=0)legend("topright",legend=c("AR(6)-teorico"),bty="n")

plot(1:36,FACP,type=’h’,col=2,yaxt="n",bty="l",ylab=expression(phi[kk]),xlab="k",lwd=2,ylim=c(-0.3,1))points(1:36,FACP,cex=1.2,pch=19,col=2)axis(2,c(-1,0,1),label=c(-1,0,1),las=2)abline(h=0)legend("topright",legend=c("AR(6)-teorico"),bty="n")

nf=layout(rbind(c(1,2),c(3,4)))#ARMA(2,4) AJUSTADO A RESIDUALES MODELO1FAC=ARMAacf(ar = parma2.4[1:2],ma=parma2.4[3:6], lag.max = 36, pacf =FALSE)FACP=ARMAacf(ar = parma2.4[1:2],ma=parma2.4[3:6],lag.max = 36, pacf = TRUE)

plot(1:36,FAC[-1],type=’h’,col=2,yaxt="n",bty="l",ylab=expression(rho(k)),xlab="k",lwd=2,ylim=c(-0.2,1))points(1:36,FAC[-1],cex=1.2,pch=19,col=2)axis(2,c(-1,0,1),label=c(-1,0,1),las=2)abline(h=0)legend("topright",legend=c("ARMA(2,4)-teorico"),bty="n")


#ARMA(1,5) AJUSTADO A RESIDUALES MODELO1FAC=ARMAacf(ar = parma1.5[1],ma=parma1.5[2:6], lag.max = 36, pacf =FALSE)FACP=ARMAacf(ar = parma1.5[1],ma=parma1.5[2:6],lag.max = 36, pacf = TRUE)



ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


nf=layout(rbind(c(1,2),c(3,4)))#ARMA(6,7) MODIFICADO SEGUN MODELO 6, AJUSTADO A RESIDUALES MODELO1FAC=ARMAacf(ar = parma6.7[1:6],ma=parma6.7[7:13], lag.max = 36, pacf =FALSE)FACP=ARMAacf(ar = parma6.7[1:6],ma=parma6.7[7:13],lag.max = 36, pacf = TRUE)



#ARMA(7,10) MODIFICADO SEGUN MODELO 7 AJUSTADO A RESIDUALES MODELO1FAC=ARMAacf(ar = parma7.10[1:7],ma=parma7.10[8:17], lag.max = 36, pacf =FALSE)FACP=ARMAacf(ar = parma7.10[1:7],ma=parma7.10[8:17],lag.max = 36, pacf = TRUE)



En los siguientes codigos se presenta el ajuste y pronosticos de los modelos 2a 8. Para la obtencion del AIC y BIC no es necesario invocar las funciones Rcorrespondientes, ya que estas medidas pueden leerse en la salida producidacon la funcion summary() aplicada sobre los objetos que guardan los mod-elos ajustados. Observe que con summary() no se obtienen estadısticos nivalores P para las pruebas de la significancia individual de los parametros, ypor esta razon es necesario realizar los calculos correspondientes para com-pletar la informacion sobre las estimaciones del modelo. Vea en cada caso laconstruccion del objeto denominado tabla . Los grados de libertad df se cal-culan como la diferencia n − k, siendo n el tamano de la muestra usada enlos ajustes y k el total de parametros de los modelos, que incluye tanto losparametros estructurales de tendencia y estacionalidad como los de los ciclosARMA considerados para los errores estructurales Et.

Codigo R 8.6. Ajuste y pronosticos del modelo 2, con df=138 grados de libertad

#Ajuste con errores AR(6)modelo2=Arima(lnyt2,order=c(6,0,0),xreg=X,method="ML")summary(modelo2)resid.ajust2=residuals(modelo2)

#Completando informacion sobre valores T0 y valores Pest=cbind(Estimacion=modelo2$coef,s.e=sqrt(diag(modelo2$var.coef)))t0=est[,1]/est[,2]

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


vp=pt(abs(t0),df=138,lower.tail=FALSE)+pt(-abs(t0),df=138)tabla=cbind(est,t0,vp) #tabla completa de parametros ajustadostabla

#Graficos para residualesnf=layout(rbind(c(1,2),c(3,4)))plot(fitted(modelo2),resid.ajust2,main="Residuales vs. ajustados modelo2")abline(h=0,lty=2)plot(resid.ajust2,main="Residuales vs. tiempo modelo2")abline(h=0,lty=2)acf(as.numeric(resid.ajust2),ci.type="ma",main="ACF modelo2",lag.max=36)pacf(as.numeric(resid.ajust2),main="PACF modelo2",lag.max=36)

#Examen normalidad residualesshapiro.test(resid.ajust2)

qqnorm(resid.ajust2,main="Grafico Normal Residuales Modelo 2")qqline(resid.ajust2,col=2,lwd=2)#Para las predicciones se exponencia para llevar a escala original

#predicciones en escala logpredmod2=forecast(modelo2,xreg =Xnuevo,level=95)

#Prediccion en escala originalpredic.modelo2=exp(cbind(Predic=predmod2$mean,LIP95=predmod2$lower,LSP95=predmod2$upper)) * exp(modelo2$sigma2/2)predic.modelo2

ytpron2=predic.modelo2[,1]#Calidad de pronosticosaccuracy(ytpron2,ytf)

#graficando la serie original, ajustada y sus pronosticos, en escala original#la exponenciacion de los valores ajustados es necesaria para pasar de escala log a la original#se aplica factor de correccionythat2=exp(fitted(modelo2)) * exp(modelo2$sigma2/2)plot(yt)lines(ythat2,col=2,lwd=2)lines(ytpron2,col="blue",lwd=2)legend("topleft",legend=c("Original","ajustado","pronosticado"),lty=1,lwd=c(1,2,2),col=c(1,2,4))

Codigo R 8.7. Ajuste y pronosticos del modelo 3, df=140 grados de libertad

###Modelo con errores ARMA(2,2)modelo3=Arima(lnyt2,order=c(2,0,2),xreg=X,method="ML")summary(modelo3)resid.ajust3=residuals(modelo3)

#Completando informacion sobre valores T0 y valores Pest=cbind(Estimacion=modelo3$coef,s.e=sqrt(diag(modelo3$var.coef)))t0=est[,1]/est[,2]vp=pt(abs(t0),df=140,lower.tail=FALSE)+pt(-abs(t0),df=140)tabla=cbind(est,t0,vp) #tabla completa de parametros ajustadostabla

#Graficos para residualesnf=layout(rbind(c(1,2),c(3,4)))plot(fitted(modelo3),resid.ajust3,main="Residuales vs. ajustados modelo3")abline(h=0,lty=2)plot(resid.ajust3,main="Residuales vs. tiempo modelo3")abline(h=0,lty=2)acf(as.numeric(resid.ajust3),ci.type="ma",main="ACF modelo3",lag.max=36)pacf(as.numeric(resid.ajust3),main="PACF modelo3",lag.max=36)

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


#Examen normalidad residualesshapiro.test(resid.ajust3)

qqnorm(resid.ajust3,main="Grafico Normal Residuales Modelo 3")qqline(resid.ajust3,col=2,lwd=2)#Para las predicciones se exponencia para llevar a escala original


#Prediccion en escala originalpredic.modelo3=exp(cbind(Predic=predmod3$mean,LIP95=predmod3$lower,LSP95=predmod3$upper)) * exp(modelo3$sigma2/2)predic.modelo3ytpron3=predic.modelo3[,1]

#Calidad de pronosticosaccuracy(ytpron3,ytf)

#graficando la serie original, ajustada y sus pronosticos, en escala original#la exponenciacion de los valores ajustados es necesaria para pasar de escala log a la original#se usa factor de correccionythat3=exp(fitted(modelo3)) * exp(modelo3$sigma2/2)plot(yt)lines(ythat3,col=2,lwd=2)lines(ytpron3,lty=1,col="blue",lwd=2)legend("topleft",legend=c("Original","ajustado","pronosticado"),lty=1,lwd=c(1,2,2),col=c(1,2,4))

Codigo R 8.8. Ajuste y pronosticos del modelo 4, df=138 grados de libertad



#Graficas para residualesnf=layout(rbind(c(1,2),c(3,4)))plot(fitted(modelo4),resid.ajust4,main="Residuales vs. ajustados modelo4")abline(h=0,lty=2)plot(resid.ajust4,main="Residuales vs. tiempo modelo4")abline(h=0,lty=2)acf(as.numeric(resid.ajust4),ci.type="ma",main="ACF modelo4",lag.max=36)pacf(as.numeric(resid.ajust4),main="PACF modelo4",lag.max=36)

#Normalidad residualesshapiro.test(resid.ajust4)

qqnorm(resid.ajust4,main="Grafico Normal Residuales Modelo 4")qqline(resid.ajust4,col=2,lwd=2)


#Prediccion en escala originalpredic.modelo4=exp(cbind(Predic=predmod4$mean,LIP95=predmod4$lower,LSP95=predmod4$upper)) * exp(modelo4$sigma2/2)predic.modelo4

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


ytpron4=predic.modelo4[,1]


#graficando la serie original, ajustada y sus pronosticos, en escala original#la exponenciacion de los valores ajustados es necesaria para pasar de escala log a la originalythat4=exp(fitted(modelo4)) * exp(modelo4$sigma2/2)

plot(yt)lines(ythat4,col=2,lwd=2)lines(ytpron4,col="blue",lwd=2)legend("topleft",legend=c("Original","ajustado","pronosticado"),lty=1,lwd=c(1,2,2),col=c(1,2,4))

Codigo R 8.9. Ajuste y pronosticos del modelo 5, df=138 grados de libertad.











ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


Para los modelos 6i, 6, 7i y 7 tenga en cuenta el uso del argumento fixeden la funcion Arima() , donde para cada uno de los parametros AR, MA, losparametros betas y deltas, en ese orden, se indica en un vector c() , cualesdeben estimarse colocando un NA, y cuales de ellos deben fijarse en 0, colo-cando tal numero en la posicion correspondiente dentro del vector especifi-cado. Este vector debe tener p + q + r entradas en total, con r el numero deparametros en la parte estructural determinıstica de tendencia y estacionali-dad; para estos ultimos, la entrada correspondiente en el vector debe ser unNA. Mire tambien con cuidado como se construye en estos casos el objeto estdonde hay una variante en la programacion en relacion a la forma en que sedefinio en los modelos 2 a 5.

Codigo R 8.10. Ajuste del modelo 6i. Ajuste y pronosticos del modelo 6, df=139

grados de libertad para este ultimo modelo.

##Modelo 6i (sus errores de ajuste no cumplen R.B)####Modelo con errores ARMA(6,7) con phij=0 para j=1,3,4,5 y thetai=0 para i=1,2,...,6modelo6i=Arima(lnyt2,order=c(6,0,7),fixed=c(c(0,NA,rep(0,3),NA),c(rep(0,6),NA),rep(NA,7)),xreg=X,method="ML")

resid.ajust6i=residuals(modelo6i)

#Graficas para residualesnf=layout(rbind(c(1,2),c(3,4)))plot(fitted(modelo6i),resid.ajust6i,main="Residuales vs. ajustados modelo6i")abline(h=0,lty=2)plot(resid.ajust6i,main="Residuales vs. tiempo modelo6i")abline(h=0,lty=2)acf(as.numeric(resid.ajust6i),ci.type="ma",main="ACF modelo6i",lag.max=36)pacf(as.numeric(resid.ajust6i),main="PACF modelo6i",lag.max=36)

##Modelo6 finalmente usadomodelo6=Arima(lnyt2,order=c(6,0,7),fixed=c(c(NA,NA,NA,0,0,NA),c(rep(0,6),NA),rep(NA,7)),xreg=X,method="ML")summary(modelo6)

resid.ajust6=residuals(modelo6)

#Calculo estad´ıstico T0 y valores P del ajuste anteriorest=cbind(Estimacion=modelo6$coef[modelo6$coef!=0],s.e=sqrt(diag(modelo6$var.coef)))t0=est[,1]/est[,2]vp=pt(abs(t0),df=139,lower.tail=FALSE)+pt(-abs(t0),df=139)tabla=cbind(est,t0,vp) #tabla completa de parametros ajustadostabla




ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ







Codigo R 8.11. Ajuste modelo 7i. Ajuste y pronosticos modelo 7, df=137 grados

de libertad para este ultimo.

##Modelo 7i (sus errores de ajuste no cumplen R.B)####Modelo con errores ARMA(7,10) con phij=0 para j=2,3,4,5,6 y thetai=0 para i=1,2,...,7,9modelo7i=Arima(lnyt2,order=c(7,0,10),fixed=c(c(NA,rep(0,5),NA),c(rep(0,7),NA,0,NA),rep(NA,7)),xreg=X,method="ML")

resid.ajust7i=residuals(modelo7i)

#Graficas para residualesnf=layout(rbind(c(1,2),c(3,4)))plot(fitted(modelo7i),resid.ajust7i,main="Residuales vs. ajustados modelo7i")abline(h=0,lty=2)plot(resid.ajust7i,main="Residuales vs. tiempo modelo7i")abline(h=0,lty=2)acf(as.numeric(resid.ajust7i),ci.type="ma",main="ACF modelo7i",lag.max=36)pacf(as.numeric(resid.ajust7i),main="PACF modelo7i",lag.max=36)

modelo7=Arima(lnyt2,order=c(7,0,10),fixed=c(c(NA,rep(0,5),NA),c(NA,NA,0,NA,rep(0,3),NA,0,NA),rep(NA,7)),xreg=X,method="ML")summary(modelo7)

resid.ajust7=residuals(modelo7)

#Calculo estad´ıstico T0 y valores P del ajuste anteriorest=cbind(Estimacion=modelo7$coef[modelo7$coef!=0],s.e=sqrt(diag(modelo7$var.coef)))t0=est[,1]/est[,2]vp=pt(abs(t0),df=137,lower.tail=FALSE)+pt(-abs(t0),df=137)tabla=cbind(est,t0,vp) #tabla completa de parametros ajustadostabla


ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ









Codigo R 8.12. Ajuste y pronostico con modelo 8, df=140 grados de libertad.

Note el uso del argumento seasonal para especificar en la funcion Arima() la

estructura ARMA en la parte estacional.

###Modelo con errores ARMA(1,2)x(0,1)[4]modelo8=Arima(lnyt2,order=c(1,0,2),seasonal=list(order=c(0,0,1)),xreg=X,method="ML")summary(modelo8)resid.ajust8=residuals(modelo8)






#Prediccion en la escala originalpredic.modelo8=exp(cbind(Predic=predmod8$mean,LIP95=predmod8$lower,

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ

8.5. MODELACION INICIAL: ESTRUCTURA EXPONENCIAL Y ERRORES R.B267

LSP95=predmod8$upper)) * exp(modelo8$sigma2/2)predic.modelo8ytpron8=predic.modelo8[,1]




Codigo R 8.13. Comparacion grafica de los 8 pronosticos. Tenga en cuenta

que se grafican en total 9 series incluyendo a los valores reales en los perıodos

pronosticados, por esto los argumentos pch (para el sımbolo de los puntos a

graficar) y col (para el color de la lıneas) usados en las funciones plot() y

legend() se especifican iguales a un vector con 9 entradas, una para cada

una de las columnas de la matriz guardada en el objeto de nombre p, respecti-

vamente.

#Comparando todos los pronosticos con valores reales#Juntando en una matriz los valores reales y pronosticados#(colocados en columnas) obteniendo un objeto de serie de tiempo multivariadop=cbind(ytf,ytpron1,ytpron2,ytpron3,ytpron4,ytpron5,ytpron6,ytpron7,ytpron8)p

plot(p,plot.type="single",type="b",pch=c(19,1:8),col=c(1:9),lty=1,lwd=2,ylab="Produccion",xaxt="n")axis(1,at=time(p),labels=c("1993.Q4","1994.Q1","1994.Q2","1994.Q3"))

legend("topleft",legend=c("Serie Original","Pronostico Modelo 1","Pronostico Modelo 2","Pronostico Modelo 3","Pronostico Modelo 4","Pronostico Modelo 5","Pronostico Modelo 6","Pronostico Modelo 7","Pronostico Modelo 8"),pch=c(19,1:8),lty=1,col=c(1:9),lwd=2,bty="n")

A continuacion se presenta la modelacion de la misma serie de producciontrimestral de cemento portland utilizando una estructura exponencial maserrores ARMA

8.5. Modelacion inicial: Estructura exponencial y errores R.B

8.5.1. Ajuste y pronostico

El modelo exponencial con los primeros n = 151 datos de la serie (en totalson N = 155 observaciones), asumiendo que los errores son ruido blanco,corresponde a:

Yt = exp(β0 + β1t+ β2t2 + β3t

3 +3∑

i=1

δiIi,t) + Et, Et ∼ RBN(0, σ2) (8.11)

La Tabla 8.44 exhibe los parametros estimados.

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


Tabla 8.44: Parametros ajustados en modelo exponencial cubico estacional

Parametro Estimacion Error Estandar T0 P (|t144| > |T0|)β0 6.2547 0.0475 131.6348 0.0000β1 0.0201 0.0021 9.6295 0.0000β2 -1.3229×10−4 0.0000 -4.7567 0.0000β3 3.3012×10−7 0.0000 2.9983 0.0032δ1 -0.1431 0.0183 -7.8079 0.0000δ2 -0.0296 0.0172 -1.7195 0.0877δ3 0.0051 0.0169 0.3039 0.7616

Crit. de inf. con C∗

n(p): AIC = 9.100153, BIC = 9.240027, df = 144

Los pronosticos para los siguientesm = 4 perıodos (t = 152 a 155) se obtienensegun la siguiente ecuacion:

Y151(L) = exp[6.2547 + 0.0201(151 + L)− 1.3229× 10−4(151 + L)2 + 3.3012× 10−7(151 + L)3

−0.1431I1,151+L − 0.0296I2,151+L + 0.0051I3,151+L]

Serie real, ajustes y pronósticosModelo exponencial cúbico estacional

Time

yt

1960 1970 1980 1990

500

1000

1500

2000

OriginalAjustadaPronósticos

Figura 8.32: Serie real, ajustada y pronosticos para la validacion cruzada, modelo exponencial cubico estacional

La Tabla 8.45 muestra los pronosticos puntuales y en la Tabla 8.46 sepresentan las medidas de precision de pronosticos (actualmente, la funcionpredict() no proporciona lımites de prediccion para un objeto nls ).

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


Tabla 8.45: Pronosticos con Modelo exponencial cubico estacional

PerıodoAno Q1 Q2 Q3 Q4

1993 - - - 1668.8571994 1450.493 1629.504 1691.936 -

En la Figura 8.32 se presenta los ajustes y pronosticos con el modelo ex-ponencial; en la Figura 8.33 se presentan los residuales estructurales y en laFigura 8.34 su ACF y PACF y la EACF es presentada en la Tabla 8.47.

Tabla 8.46: Precision pronosticos Modelo exponen-

cial cubico estacionalMedida Resultado

ME 124.55RMSE 154.47

MAE 124.55MPE 6.74

MAPE 6.74

8.5.2. Analisis de residuales e identificacion ciclos

Residuos vs. tModelo exponencial cúbico estacional

Time

resi

dual

s(m

odel

o2b)

0 50 100 150

−30

0−

200

−10

00

100

200

300

600 800 1000 1200 1400 1600

−30

0−

200

−10

00

100

200

300

Residuos vs. ajustadosModelo exponencial cúbico estacional

fitted(modelo2b)

resi

dual

s(m

odel

o2b)

Figura 8.33: Residuales en ajuste exponencial cubico estacional

0 5 10 15 20 25 30 35

−0.

4−

0.2

0.0

0.2

0.4

0.6

0.8

ACF residuales estructurales

Lag

AC

F

0 5 10 15 20 25 30 35

−0.

20.

00.

20.

40.

60.

8

Lag

Par

tial A

CF

PACF residuales estructurales

Figura 8.34: ACF y PACF para residuales estructurales

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


Tabla 8.47: EACF con residuales estructurales, Et

AR/MA 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18

0 x x x x x o o x x x x x x o o o o o o1 x x o x x o o x o o o o o o o o o o o2 x x o x o o o o o o o o o o o o o o o3 o x o x o x o o o o o o o o o o o o o4 x x o x o x o o o o o o o o o o o o o5 x x x x o x o x o o o o o o o o o o o6 x x x o o o o x o o o o o o o o o o o7 x o o o o o o o o o o o o o o o o o o8 x x o o o o o o o o o o o o o o o o o9 o x o x o o o o o o o o o o o o o o o

10 o x x o o o o o o o o o o o o o o o o11 x o x x x o o o o o o o o o o o o o o12 x o x x o o o o o o o o o o o o o o o13 x x x o o o o o o o o o o o o o o o o14 x x x o o o o o o o o x o o o o o o o15 x o x o o o o o o o o x o o o o o o o16 x o o o o o o o o o o x x o o o o o o17 x x x o o o o o o o o x o o o o o o o18 o o x o o x o x o o o o x x o o o o o

Del analisis de residuales es claro que los errores estructurales Et no sonun ruido blanco ¿por que? pero segun ACF pudieran considerarse estacionar-ios. Los modelos ARMA identificados son los siguientes:

1. De la ACF y PACF se identifica que los errores del modelo exponencialpueden ser un AR(6) o un AR(18); sin embargo, consideraremos primeroal AR(6).

2. De la EACF se identifican los siguientes modelos: ARMA(1,8) y ARMA(2,5).

3. Con la funcion auto.arima() sobre el vector de residuales estructuralessin convertirlos en serie de tiempo, y el criterio del AIC, se identifica unARMA(2,2) como muestra la Tabla 8.48.

4. Con la funcion auto.arima() sobre el vector de residuales estructuralesconvertidos en serie de tiempo, y el criterio del AIC, se identifica un SAR-MA(1,2)(0,1)[4] como muestra la Tabla 8.52.

5. Con la funcion armasubsets() , (ver Figura 8.35) se identifican inicial-mente en la primera fila superior un ARMA(6,7) con φj = 0 para j 6= 2, 6y θi = 0, para i 6= 7 y en la segunda fila superior tambien un ARMA(6,7)pero con φj = 0 para j 6= 2, 6 y θi = 0, para i 6= 6, 7. Estos dos modelos sonmodificados como se indica en las Tablas 8.53 y 8.54 de forma tal quefuese satisfecho el supuesto de ruido blanco sobre los errores de ajusteat.

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


BIC

(Inter

cept)

AR−la

g1AR

−lag2

AR−la

g3AR

−lag4

AR−la

g5AR

−lag6

AR−la

g7AR

−lag8

AR−la

g9AR

−lag1

0AR

−lag1

1AR

−lag1

2err

or−lag

7err

or−lag

8err

or−lag

9err

or−lag

10err

or−lag

11err

or−lag

12err

or−lag

1err

or−lag

2err

or−lag

3err

or−lag

4err

or−lag

5err

or−lag

6

−140

−140

−140

−140

−140

−150

−150

−150

−160

Figura 8.35: Resultado de la funcion armasubsets sobre Et en modelo exponencial cubico estacional

8.5.3. Ajuste de los ciclos

A diferencia de los modelos de estructuras lineales donde es posible ajustarsimultaneamente la estructura y los ciclos ARMA con la funcion Arima() de lalibrerıa forecast , en el caso exponencial procederemos ajustando separada-mente los ciclos que luego seran sumados a la estructura exponencial estima-da1. De igual manera se procedera para obtener los pronosticos de la serie. Enla Tabla 8.48 observamos el modelo ajustado ARMA(2,2) sobre los residualesestructurales Et = Yt − exp [6.2547 + 0.0201t− 1.3229× 10−4t2 + 3.3012× 10−7t3

−0.1431I1,t − 0.0296I2,t + 0.0051I3,t]. En la Figura 8.36, se muestran los graficosde los residuales del ajuste resultante at y su grafico de probabilidad normal.

Tabla 8.48: Resultados de auto.arima() sobre E sin convertirlos en serie de tiempo

Parametro Estimacion s.e Z0* P (|Z| > |Z0|)**φ1 0.1885 0.1444 1.3052 0.1918φ2 0.4789 0.1269 3.7742 0.0002θ1 0.5615 0.1538 3.6505 0.0003θ2 0.2594 0.1007 2.5763 0.0100

*Calculado manualmente, Z0 = Estimacion/s.e**Calculado manualmente, P (|Z| > |Z0|) = P (Z > |Z0|) + P (Z < −|Z0|)

1Si bien en R se dispone de la funcion gnls() de la librerıa nlme , con la cual se puedenajustar modelos de regresion no lineal con errores ARMA, esta funcion es numericamenteinestable, es decir, presenta comunmente problemas de convergencia.

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


Time

resi

dual

s(m

cicl

os1)

0 50 100 150

−10

00

100

200

−200 −100 0 100 200 300

−10

00

100

200

as.numeric(hatciclos1)re

sidu

als(

mci

clos

1)

0 5 10 15 20 25 30 35

−0.

2−

0.1

0.0

0.1

0.2

Series residuals(mciclos1)

Lag

AC

F

0 5 10 15 20 25 30 35

−0.

2−

0.1

0.0

0.1

Lag

Par

tial A

CF


−2 −1 0 1 2

−10

00

100

200

Normal Q−Q Plot


Sam

ple

Qua

ntile

s

Estadístico W0.9567

Valor P1e−04

Figura 8.36: Residuales de ajuste del ARMA(2,2) ajustado a los residuos estructurales del modelo exponencial

En la Tabla 8.49 se presentan los parametros ajustados del modelo AR(6)ajustado a los residuos estructurales del modelo exponencial estacional. Enla Figura 8.37 pueden observarse los graficos de residuales y de normalidad,para los residuos de ajuste resultantes.

Tabla 8.49: Resultados AR(6)Parametro Estimacion s.e Z0* P (|Z| > |Z0|)**

φ1 0.6494 0.0784 8.2876 0.0000φ2 0.3558 0.0944 3.7675 0.0002φ3 -0.2366 0.0998 -2.3711 0.0177φ4 0.1802 0.0989 1.8217 0.0685φ5 -0.0365 0.0957 -0.3815 0.7028φ6 -0.2401 0.0791 -3.0355 0.0024


En la Tabla 8.50 se exhiben los parametros estimados del modelo AR-MA(1,8) ajustado a los residuos estructurales. En la Figura 8.38 los respec-tivos residuales de ajuste.

Tabla 8.50: Resultados ARMA(1,8)Parametro Estimacion s.e Z0* P (|Z| > |Z0|)**

φ1 0.4453 0.9173 0.4854 0.6274θ1 0.2410 0.9198 0.2620 0.7933θ2 0.5511 0.6297 0.8752 0.3815θ3 0.2236 0.7810 0.2863 0.7746θ4 0.5007 0.5503 0.9099 0.3629θ5 0.2526 0.6890 0.3667 0.7139θ6 0.0679 0.5328 0.1274 0.8987θ7 0.0272 0.2922 0.0931 0.9258θ8 -0.0428 0.1709 -0.2504 0.8023


ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


Time

resi

dual

s(m

cicl

os2)

0 50 100 150

−15

0−

500

5010

015

020

0

−200 −100 0 100 200

−15

0−

500

5010

015

020

0fitted(mciclos2)

resi

dual

s(m

cicl

os2)

0 5 10 15 20 25 30 35

−0.

15−

0.05

0.05

0.15


Lag

AC

F

0 5 10 15 20 25 30 35

−0.

15−

0.05

0.05

0.10

0.15

Lag

Par

tial A

CF


−2 −1 0 1 2

−15

0−

100

−50

050

100

150

200

Normal Q−Q Plot


Sam

ple

Qua

ntile

s


Valor P2e−04

Figura 8.37: Residuales de ajuste del AR(6) ajustado a los residuos estructurales del modelo exponencial

Time

resi

dual

s(m

cicl

os3)

0 50 100 150

−15

0−

500

5010

015

020

0

−200 −100 0 100 200 300

−15

0−

500

5010

015

020

0

fitted(mciclos3)

resi

dual

s(m

cicl

os3)

0 5 10 15 20 25 30 35

−0.

10.

00.

1


Lag

AC

F

0 5 10 15 20 25 30 35

−0.

15−

0.05

0.05

0.10

0.15

Lag

Par

tial A

CF


−2 −1 0 1 2

−15

0−

100

−50

050

100

150

200

Normal Q−Q Plot


Sam

ple

Qua

ntile

s


Valor P0


En la Tabla 8.51 se exhiben los parametros estimados del modelo AR-MA(2,5) ajustado a los residuales estructurales del modelo exponencial. LaFigura 8.39 presenta los correspondientes residuales de ajuste.ESTADÍS

TICA III

- 300

9137

NELFI G

ONZÁLEZ


Tabla 8.51: Resultados ARMA(2,5)Parametro Estimacion s.e Z0* P (|Z| > |Z0|) ∗ ∗

φ1 1.7150 0.0738 23.2498 0.0000φ2 -0.7579 0.0724 -10.4639 0.0000θ1 -1.1234 0.0907 -12.3921 0.0000θ2 0.4845 0.1174 4.1281 0.0000θ3 -0.3981 0.1262 -3.1557 0.0016θ4 0.4417 0.1183 3.7326 0.0002θ5 -0.4046 0.0864 -4.6822 0.0000


Time

resi

dual

s(m

cicl

os4)

0 50 100 150

−15

0−

500

5010

015

0

−200 −100 0 100 200

−15

0−

500

5010

015

0

fitted(mciclos4)

resi

dual

s(m

cicl

os4)

0 5 10 15 20 25 30 35

−0.

15−

0.05

0.05

0.15


Lag

AC

F

0 5 10 15 20 25 30 35

−0.

15−

0.05

0.05

0.10

0.15

Lag

Par

tial A

CF


−2 −1 0 1 2

−15

0−

100

−50

050

100

150

Normal Q−Q Plot


Sam

ple

Qua

ntile

s


Valor P0.00016


En la Tabla 8.52 se exhiben los parametros estimados del modelo SAR-MA(1,2)(0,1)[4] , ajustado a los residuales estructurales del modelo exponen-cial. La Figura 8.40 presenta los correspondientes residuales de ajuste.

Tabla 8.52: Resultados SARMA(1,2)(0,1)[4], identificado con auto.arima() sobre

los residuos estructurales convertidos en serie de tiempo

Parametro Estimacion s.e Z0* P (|Z| > |Z0|) ∗ ∗φ1 0.6588 0.0977 6.7446 0.0000θ1 0.0361 0.1135 0.3182 0.7503θ2 0.3819 0.0946 4.0359 0.0001Θ1 0.3715 0.0841 4.4153 0.0000


ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


Time

resi

dual

s(m

cicl

os5)

1960 1970 1980 1990

−10

00

100

200

−200 −100 0 100 200 300

−10

00

100

200

as.numeric(hatciclos5)re

sidu

als(

mci

clos

5)

0 5 10 15 20 25 30 35

−0.

2−

0.1

0.0

0.1

0.2

Series as.numeric(residuals(mciclos5))

Lag

AC

F

0 5 10 15 20 25 30 35

−0.

20−

0.10

0.00

0.10

Lag

Par

tial A

CF

Series as.numeric(residuals(mciclos5))

−2 −1 0 1 2

−10

00

100

200

Normal Q−Q Plot


Sam

ple

Qua

ntile

s


Valor P2e−04

Figura 8.40: Residuales de ajuste del SARMA(1,2)(0,1)[4] ajustado a los residuos estructurales del modelo exponencial

En la Figura 8.41 se muestran los residuales del modelo ARMA(6,7) ini-cialmente identificado en la primera fila de la Figura 8.35, es decir, Et =φ2Et−2 + φ6Et−6 + at + θ7at−7,at ∼ R.B N(0, σ2

a), como puede verse, no se cumpleel supuesto de ruido blanco sobre at, por lo que se modifico este modelo de lasiguiente manera, Et = φ2Et−2 + φ6Et−6 + at + θ1at−1 + θ7at−7, at ∼ R.B N(0, σ2

a).

En la Tabla 8.53 se exhiben los parametros estimados del modelo ARMA(6,7)a

que corresponde a la version modificada del primer modelo identificado en laFigura 8.35, ajustado a los residuales estructurales del modelo exponencial.La Figura 8.42 presenta los correspondientes residuales de ajuste.

Tabla 8.53: Resultados ARMA(6,7)a

Parametro Estimacion s.e Z0* P (|Z| > |Z0|) ∗ ∗φ2 0.8222 0.0640 12.8393 0.0000φ6 -0.3131 0.0603 -5.1919 0.0000θ1 0.6797 0.0713 9.5310 0.0000θ7 -0.0897 0.0675 -1.3289 0.1839

*Calculado manualmente, Z0 = Estimacion/s.e**Calculado manualmente, P (|Z| > |Z0|) = P (Z > |Z0|) + P (Z < −|Z0|)ESTADÍS

TICA III

- 300

9137

NELFI G

ONZÁLEZ


Timere

sidu

als(

mci

clos

6i)

0 50 100 150

−20

0−

100

010

020

0

−300 −200 −100 0 100 200

−20

0−

100

010

020

0

as.numeric(fitted(mciclos6i))

resi

dual

s(m

cicl

os6i

)

0 5 10 15 20 25 30 35

−0.

2−

0.1

0.0

0.1

0.2

0.3

0.4

Series residuals(mciclos6i)

Lag

AC

F

0 5 10 15 20 25 30 35

−0.

20.

00.

10.

20.

30.

4

LagP

artia

l AC

F


Figura 8.41: Residuales de ajuste del ARMA(6,7): Et = φ2Et−2 + φ6Et−6 + at + θ7at−7, ajustado a los residuos estruc-

turales del modelo exponencial

Time

resi

dual

s(m

cicl

os6)

0 50 100 150

−15

0−

500

5010

015

020

0

−200 −100 0 100 200

−15

0−

500

5010

015

020

0

as.numeric(hatciclos6)

resi

dual

s(m

cicl

os6)

0 5 10 15 20 25 30 35

−0.

15−

0.05

0.05

0.15


Lag

AC

F

0 5 10 15 20 25 30 35

−0.

15−

0.05

0.05

0.10

0.15

Lag

Par

tial A

CF


−2 −1 0 1 2

−15

0−

100

−50

050

100

150

200

Normal Q−Q Plot


Sam

ple

Qua

ntile

s


Valor P1e−04

Figura 8.42: Residuales de ajuste del ARMA(6,7)a ajustado a los residuos estructurales del modelo exponencial

En la Figura 8.43 se presentan los residuos de ajuste del segundo modeloARMA(6,7) identificado en la fila 2 de la Figura 8.35, es decir, el modelo Et =φ2Et−2 + φ6Et−6 + at + θ6at−6 + θ7at−7, at ∼ R.B N(0, σ2

a). Como puede observarse,para este modelo no es valido el supuesto de ruido blanco sobre sus erroresde ajuste at. Por esta razon, se modifico tal modelo de la siguiente manera:Et = φ2Et−2+φ6Et−6+at+θ1at−1+θ6at−6+θ7at−7, at ∼ R.B N(0, σ2

a). En la Tabla 8.54se presentan los parametros estimados de este ultimo modelo ARMA(6,7)b. LaFigura 8.44 presenta los residuales de ajuste correspondientes.

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


Tabla 8.54: Resultados ARMA(6,7)b

Parametro Estimacion s.e Z0* P (|Z| > |Z0|) ∗ ∗φ2 0.8401 0.0693 12.1283 0.0000φ6 -0.2775 0.0797 -3.4817 0.0005θ1 0.6836 0.0706 9.6764 0.0000θ6 -0.0933 0.1318 -0.7077 0.4791θ7 -0.1399 0.0979 -1.4296 0.1528


Time

resi

dual

s(m

cicl

os7i

)

0 50 100 150

−20

0−

100

010

020

0

−300 −200 −100 0 100 200

−20

0−

100

010

020

0

as.numeric(fitted(mciclos7i))

resi

dual

s(m

cicl

os7i

)

0 5 10 15 20 25 30 35

−0.

2−

0.1

0.0

0.1

0.2

0.3

0.4


Lag

AC

F

0 5 10 15 20 25 30 35

−0.

20.

00.

10.

20.

30.

4

Lag

Par

tial A

CF


Figura 8.43: Residuales de ajuste del ARMA(6,7): Et = φ2Et−2 + φ6Et−6 + at + θ6at−6 + θ7at−7,at ∼ R.B N(0, σ2a),

ajustado a los residuos estructurales del modelo exponencial

Time

resi

dual

s(m

cicl

os7)

0 50 100 150

−15

0−

500

5010

015

020

0

−200 −100 0 100 200

−15

0−

500

5010

015

020

0

as.numeric(hatciclos7)

resi

dual

s(m

cicl

os7)

0 5 10 15 20 25 30 35

−0.

15−

0.05

0.05

0.15


Lag

AC

F

0 5 10 15 20 25 30 35

−0.

15−

0.05

0.05

0.10

0.15

Lag

Par

tial A

CF


−2 −1 0 1 2

−15

0−

100

−50

050

100

150

200

Normal Q−Q Plot


Sam

ple

Qua

ntile

s


Valor P1e−04

Figura 8.44: Residuales de ajuste del ARMA(6,7)b ajustado a los residuos estructurales del modelo exponencial

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


8.6. Ajuste y pronostico aproximado de Yt

Los ajustes para la serie, se hallan como

Yt = (Ajuste estructura)t + (Ajuste ciclos ARMA)t

donde el ajuste de la estructura es

(Ajuste estructura)t = exp[6.2547 + 0.0201t− 1.3229× 10−4t2 + 3.3012× 10−7t3

−0.1431I1,t − 0.0296I2,t + 0.0051I3,t]

es decir, el ajuste del modelo exponencial. Los ajustes para los ciclos AR-MA(p,q) son de acuerdo al modelo ARMA(p,q) ajustado sobre el residuo es-tructural Et:

Et = φ1Et−1 + φ2Et−2 + · · ·+ φpEt−p + θ1at−1 + θ2at−2 + · · ·+ θqat−q

de modo que se cumple que los residuos de ajuste son at = Yt − Yt = Et − Et.

En las Figuras 8.45 y 8.46 se presentan la serie real y sus ajustes de losmodelos con parte estructural exponencial mas los ciclos ARMA correspondi-entes a los casos ajustados a los residuales estructurales. Para estos ajustesno tenemos como medir globalmente los errores estandar de los estimadoresya que no se realiza una estimacion conjunta de la estructura y los ciclos.Pero podemos calcular de manera aproximada el AIC y el BIC, usando lasecuaciones

AIC ≈ log

(1

n

n∑

t=1

a2t

)+ 2k/n

BIC ≈ log

(1

n

n∑

t=1

a2t

)+ k log(n)/n

donde k es el numero total de parametros estimados entre estructura y ci-clos y at son los residuales del ajuste en cada modelo de los ciclos ARMAajustados sobre los residuales estructurales Et del modelo exponencial inicial.Estas mismas formulas pueden utilizarse tambien usando los residuales es-tructurales del modelo exponencial estacional inicial (es decir, usando Et enlugar de at), para obtener para este ultimo el AIC y BIC aproximados, siendo kigual numero de parametros del modelo exponencial. La Tabla 8.55 presentalos resultados de estas medidas.

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ

8.6. AJUSTE Y PRONOSTICO APROXIMADO DE YT 279

Serie real, ajustesModelo exponencial cúbico estacional

Time

yt

1960 1970 1980 1990

500

1000

1500

2000

OriginalEstructura + ciclos ARMA(2,2)pronosticado


Time

yt

1960 1970 1980 1990

500

1000

1500

2000

OriginalEstructura + ciclos AR(6)Pronosticado


Time

yt

1960 1970 1980 1990

500

1000

1500

2000

OriginalAEstructura + ciclos ARMA(1,8)Pronosticado


Time

yt

1960 1970 1980 1990

500

1000

1500

2000

OriginalEstructura + ciclos ARMA(2,5)Pronosticado

Figura 8.45: Comparacion de serie real y sus ajustes mediante los modelos que intengran la estimacion estructural

exponencial mas los ciclos ARMA identificados para los residuales estructurales del modelo exponencial

Tabla 8.55: Criterios de informacion calculados, aproximados por C∗

n(k)Criterio Estructura Estructura Estructura Estructura Estructura Estructura Estructura Estructura

+ARMA(2,2) +AR(6) +ARMA(1,8) +ARMA(2,5) +SARMA(1,2)(0,1)[4] +ARMA(6,7)a +ARMA(6,7)b

AIC 9.10 7.95 7.86 7.90 7.81 7.89 7.83 7.84BIC 9.24 8.17 8.12 8.22 8.09 8.11 8.05 8.08

Los pronosticos L perıodos adelante de n = 151 se calculan como

Y151(L) = (Pronostico estructura)151(L) + (Pronostico ciclos ARMA)151(L)

donde el pronostico de la estructura es

(Pronostico estructura)151(L) = exp[6.2547 + 0.0201(151 + L)− 1.3229× 10−4(151 + L)2

+3.3012× 10−7(151 + L)3 − 0.1431I1,151+L − 0.0296I2,151+L + 0.0051I3,151+L

]

es decir, los pronosticos del modelo exponencial.

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ



Time

yt

1960 1970 1980 1990

500

1000

1500

2000

OriginalEstructura + ciclos SARMA(1,2)(0,1)[4]Pronosticado


Time

yt

1960 1970 1980 1990

500

1000

1500

2000

OriginalEstructura + ciclos ARMA(6,7)aPronosticado


Time

yt

1960 1970 1980 1990

500

1000

1500

2000

OriginalEstructura + ciclos ARMA(6,7)bPronosticado

Figura 8.46: Comparacion de serie real y sus ajustes mediante los modelos que intengran la estimacion estructural

exponencial mas los ciclos ARMA identificados para los residuales estructurales del modelo exponencial(Cont.)

Los pronostico para los ciclos ARMA(p,q) se realizan con los modelos ajus-tados a los residuos estructurales:

E151(L) = φ1E151(L− 1) + φ2E151(L− 2) + · · ·+ φpE151(L− p)+ θ1a151(L− 1) + θ2a151(L− 2) + · · ·+ θqa151(L− q)

Los pronosticos para los trimestre 1993-Q4 a 1994Q3, se presentan en laTabla 8.56 y las medidas de precision de los pronosticos en la Tabla 8.57. Noteque los pronosticos estructura mas ciclos AR(6) son los mas proximos a losvalores reales seguidos de los pronosticos estructura mas ciclos ARMA(6,7)a,aunque todos los pronosticos subestiman los valores reales. En la Figura 8.47puede observarse con mas claridad lo que ocurre en cuanto a los pronosticospuntuales.

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ

8.6. AJUSTE Y PRONOSTICO APROXIMADO DE YT 281

Tabla 8.56: Predicciones en miles de toneladas1993.Q4 1994.Q1 1994.Q2 1994.Q3

Real 1777 1468 1732 1962Estructura 1668.857 1450.493 1629.504 1691.936Estructura+ARMA(2,2) 1619.683 1425.202 1601.187 1674.486Estructura+AR(6) 1645.965 1470.623 1651.707 1712.287Estructura+ARMA(1,8) 1621.304 1435.367 1602.182 1654.960Estructura+ARMA(2,5) 1623.773 1444.994 1606.944 1667.228Estructura+SARMA(1,2)(0,1)[4] 1626.864 1446.181 1601.858 1679.003Estructura+ARMA(6,7)a 1637.283 1463.777 1631.607 1700.717Estructura+ARMA(6,7)b 1632.509 1459.207 1628.023 1692.970

Tabla 8.57: Precision de los pronosticos estructurales+ciclos ARMA

Modelo ME RMSE MAE MPE MAPE

Estructura 124.55 154.47 124.55 6.74 6.74Estructura+ARMA(2,2) 154.61 177.73 154.61 8.49 8.49Estructura+AR(8) 114.60 146.61 115.92 6.14 6.23Estructura+ARMA(1,8) 156.30 184.68 156.30 8.53 8.53Estructura+ARMA(2,5) 149.02 177.86 149.02 8.11 8.11Estructura+SARMA(1,2)(0,1)[4] 146.27 173.23 146.27 7.97 7.97Estructura+ARMA(6,7)a 126.40 156.43 126.40 6.82 6.82Estructura+ARMA(6,7)b 131.57 161.36 131.57 7.11 7.11

Time

Pro

ducc

ión

1400

1500

1600

1700

1800

1900

2000

1993.Q4 1994.Q1 1994.Q2 1994.Q3

Serie OriginalPron. sin ciclosEstructura+ARMA(2,2)Estructura+AR(6)Estructura+ARMA(1,8)Estructura+ARMA(2,5)Estructura+SARMA(1,2)(0,1)[4]Estructura+ARMA(6,7)aEstructura+ARMA(6,7)b

Figura 8.47: Comparacion de serie real y sus pronosticos, para el modelo exponencial sin y con los ciclos ARMA

identificados para los residuales estructurales del modelo exponencial inicial

¿Cual modelo con estructura exponencial se elige para el ajuste y pronosti-co de la serie? ¿Por que?

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


8.7. Codigo R usado

A continuacion se presenta la programacion R empleada. Tenga en cuentaque con la funcion Arima() no es posible estimar conjuntamente la estruc-tura exponencial y los ciclos, por ello, se recurre a la estimacion separadade la estructura con la funcion nls() y de los ciclos con funcion Arima()aplicada sobre los residuales estructurales del modelo exponencial, que en laprogramacion han sido guardados bajo el nombre et1 (sin formato de serie detiempo) y como Et1 (con formato de serie de tiempo). Los ajuste de los ciclosdeben sumarse a los de la estructura y de igual forma, los pronosticos de losciclos (obtenidos con la funcion forecast() ) se suman a los pronosticos de laestructura (obtenidos con la funcion predict() ).

Nota 1: Ademas de las funciones R usadas en este ejemplo para identificarlos modelos ARMA tambien puede usarse cualquier otra funcion de identifi-cacion automatica disponible en diferentes librerıas.

NOTA 2: Tambien se pueden construir las ACF y PACF esperadas bajo losdistintos modelos de ciclos identificados sobre los residuos estructurales, us-ando en la funcion ARMAacf() de la librerıa TSA los valores estimados de losparametros de los respectivos modelos ARMA identificados.

Vea Taller “Modelacion de una serie multiplicativa con errores ARMA: Serie Pro-

duccion trimestral Cemento Portland”.

Codigo R 8.14. Cargando librerıas y definiendo funciones de usuario.

library(TSA)library(forecast)

#Funcion para el calculo de AIC y BIC aproximados para modelo exponencial sin cicloscrit.inf=function(modelo,AIC="TRUE"){n.par=length(coef(modelo))residuales=residuals(modelo)if(AIC=="TRUE"){#Calcula AICCI=log(mean(residualesˆ2))+2 * n.par/length(residuales)}if(AIC=="FALSE"){#Calcula BICCI=log(mean(residualesˆ2))+n.par * log(length(residuales))/length(residuales)}CI}

#Funcion para el calculo de AIC y BIC aproximados para modelos combinadosAIC.aprox=function(modeloarma,n1=n,npar.estruct=pestruct){k=length(coef(modeloarma))+npar.estructaic=log(mean(residuals(modeloarma)ˆ2))+2 * k/n1aic}

BIC.aprox=function(modeloarma,n1=n,npar.estruct=pestruct){k=length(coef(modeloarma))+npar.estruct

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


bic=log(mean(residuals(modeloarma)ˆ2))+k * log(n1)/n1bic}

Codigo R 8.15. Lectura de los datos, graficas descriptivas y definicion de vari-

ables para el ajuste y los pronosticos

yt=scan()465 532 561 570 529 604 603 582 554 620 646637 573 673 690 681 621 698 753 728 688 737782 692 637 757 783 757 674 734 835 838 797904 949 975 902 974 969 967 849 961 966 922836 998 1025 971 892 973 1047 1017 948 10321190 1136 1049 1134 1229 1188 1058 1209 11991253 1070 1282 1303 1281 1148 1305 1342 14521184 1352 1316 1353 1121 1297 1318 1281 11091299 1341 1290 1101 1284 1321 1317 1122 12611312 1298 1202 1302 1377 1359 1232 1386 14401439 1282 1573 1533 1651 1347 1575 1475 13571086 1158 1279 1313 1166 1373 1456 1496 12511456 1631 1554 1347 1516 1546 1564 1333 14581499 1613 1416 1625 1770 1791 1622 1719 19721893 1575 1644 1658 1668 1343 1441 1444 14971267 1501 1538 1569 1450 1569 1648 1777 14681732 1962

yt=ts(yt,frequency=4,start=c(1956,1)) #serie con todas las observaciones

s=4 #longitud estacionalidadm=4 #Numero de per´ıodos a pronosticar dentro de la muestran=length(yt)-m #tamano de la muestra para el ajuste

yt2=ts(yt[1:n],frequency=4,start=c(1956,1)) #serie con las primeras n observacioneslnyt2=log(yt2)t=1:n #´ındice de tiempot2=tˆ2t3=tˆ3

#DEFINIENDO INDICADORAS PARA ESTACIONALIDADtrimestre=seasonaldummy(yt2) #observe que se usa funcion seasonaldummy()Q1=trimestre[,1]Q2=trimestre[,2]Q3=trimestre[,3]

#valores variables para los pronosticostnuevo=c((n+1):(n+m)) #definiendo valor de t para las m observaciones a pronosticast2nuevo=tnuevoˆ2t3nuevo=tnuevoˆ3

ytf=ts(yt[tnuevo],frequency=4,start=c(1993,4)) #Tomando de la serie completa los ultimos m valores#que son pronosticados

trimestrenuevo=seasonaldummyf(yt2,h=m)Q1nuevo=trimestrenuevo[,1]Q2nuevo=trimestrenuevo[,2]Q3nuevo=trimestrenuevo[,3]

Codigo R 8.16. Ajuste y pronosticos del modelo 1: Modelo exponencial suponien-

do errores estructurales R.B.

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


#AJUSTANDO MODELO LOG CUBICO ESTACIONAL CON LOS n PRIMEROS DATOSmodelo.aux=lm(lnyt2˜t+t2+t3+Q1+Q2+Q3)

#AJUSTANDO MODELO EXPONENCIAL USANDO COMO VALORES INICIALES#PARAMETROS AJUSTADOS DEL MODELO ANTERIOR, SON SIETE EN TOTAL CON beta0coef0=coef(modelo.aux) #extrae coeficientes ajustados del modelo auxiliar

modelo1=nls(yt2˜exp(beta0+beta1 * t+beta2 * t2+beta3 * t3+delta1 * Q1+delta2 * Q2+delta3 * Q3),start=list(beta0=coef0[[1]],beta1=coef0[[2]],beta2=coef0[[3]],beta3=coef0[[4]],delta1=coef0[[5]],delta2=coef0[[6]],delta3=coef0[[7]]))summary(modelo1)

#Valores ajustados estructuraythat.estruct=ts(fitted(modelo1),frequency=4,start=c(1956,1))

#Residuos estructuraleset1=residuals(modelo1)

#Residuales estructurales convertidos en serie de tiempoEt1=ts(et1,frequency=4,start=c(1956,1))

#GRAFICOS DE RESIDUALESplot.ts(et1,main="Residuos vs. t\nModelo exponencial cubico estacional")abline(h=0,col=2)

plot(ythat.estruct,et1,main="Residuos vs. ajustados\nModelo exponencial cubico estacional")abline(h=0,col=2)

#PRONOSTICOS#Pronostico estructura solapred.estruct=predict(modelo1,newdata=data.frame(t=tnuevo,t2=t2nuevo,t3=t3nuevo,Q1=Q1nuevo,Q2=Q2nuevo,Q3=Q3nuevo),interval="prediction")

pred.estruct=ts(pred.estruct,frequency=4,start=c(1993,4))

#Precision de pronostico con solo la estructuraaccuracy(pred.estruct,ytf)

plot(yt,main="Serie real, ajustes\nModelo exponencial cubico estacional")lines(ythat.estruct,col=2)lines(pred.estruct,col=4)legend("topleft",legend=c("Original","Ajustada","Pronosticos"),col=c(1,2,4),lty=1)

Codigo R 8.17. Analisis de supuesto de R.B e identificacion de posibles mode-

los para los ciclos, mediante funciones ACF, PACF y EACF muestrales aplicadas

a los residuales estructurales Et y uso de la funcion R armasubsets().

acf(et1,ci.type="ma",lag.max=36,main="ACF residuales estructurales")pacf(et1,lag.max=36,main="PACF residuales estructurales")eacf(et1,ar.max=18,ma.max=18) #identifica ARMA(1,8), ARMA(2,5)

plot(armasubsets(et1,nar=12,nma=12,y.name=’AR’,ar.method=’ml’)) #Identifica dos ARMA(6,7) con algunos#coeficientes fijos en cero

A continuacion se presentan los modelos ajustados para los ciclos quequedan en los residuales estructurales del modelo exponencial. Observe quepara la validacion de supuestos se consideran ahora a los errores de ajuste at

y por tanto se analizan los residuales at resultantes en los ajustes de los ciclosARMA.

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


Codigo R 8.18. Identificacion automatica con funcion auto.arima() usando

criterio del AIC sobre los residuos estructurales sin convertirlos en serie de tiem-

po. Ajustes para los ciclos con el modelo resultante guardado en mciclos1.

#Identificacion y ajuste automatico con auto.arimamciclos1=auto.arima(et1,ic="aic") #identifica un ARMA(2,2)

summary(mciclos1)

#Completacion tabla parametros estimados para mciclos1est=cbind(Estimacion=mciclos1$coef,s.e=sqrt(diag(mciclos1$var.coef)))z0=est[,1]/est[,2]vp=pnorm(abs(z0),lower.tail=FALSE)+pnorm(-abs(z0))tabla=cbind(est,z0,vp)tabla

hatciclos1=ts(fitted(mciclos1),freq=4,start=c(1956,1))

layout(rbind(c(1,1,2,2),c(3,3,4,4)))plot.ts(residuals(mciclos1))abline(h=0,col=2)plot(as.numeric(hatciclos1),residuals(mciclos1))abline(h=0,col=2)acf(residuals(mciclos1),ci.type="ma",lag.max=36)pacf(residuals(mciclos1),lag.max=36)

test=shapiro.test(residuals(mciclos1)) #Test de normalidad sobre residuales de ajuste#Grafico de normalidad con informacion del test Shapiroqqnorm(residuals(mciclos1),cex=1.5)qqline(residuals(mciclos1),lty=2,lwd=2,col=2)legend("topleft",legend=c("Estad´ıstico W",round(test$statistic,digits=4),"Valor P",round(test$p.value,digits=4)),cex=0.8,ncol=2)

Codigo R 8.19. Ajuste de ciclos AR(6) sobre residuos estructurales Et. Objeto R

que guarda el modelo ajustado es mciclos2.

#Ajuste ciclos AR(6)mciclos2=Arima(et1,order=c(6,0,0),include.mean=F)summary(mciclos2)

#Completacion tabla parametros estimadosest=cbind(Estimacion=mciclos2$coef,s.e=sqrt(diag(mciclos2$var.coef)))z0=est[,1]/est[,2]vp=pnorm(abs(z0),lower.tail=FALSE)+pnorm(-abs(z0))tabla=cbind(est,z0,vp)tabla


layout(rbind(c(1,1,2,2),c(3,3,4,4)))plot.ts(residuals(mciclos2))abline(h=0,col=2)plot(fitted(mciclos2),residuals(mciclos2))abline(h=0,col=2)acf(residuals(mciclos2),ci.type="ma",lag.max=36)pacf(residuals(mciclos2),lag.max=36)


ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


Codigo R 8.20. Ajuste de ciclos ARMA(1,8) sobre residuos estructurales Et.

Objeto R que guarda el modelo ajustado es mciclos3.

#Ajuste ciclos ARMA(1,8)mciclos3=Arima(et1,order=c(1,0,8),include.mean=F)summary(mciclos3)





Codigo R 8.21. Ajuste de ciclos ARMA(2,5) sobre residuos estructurales Et.


#Ajuste ciclos ARMA(2,5)mciclos4=Arima(et1,order=c(2,0,5),include.mean=F)summary(mciclos4)

#Completacion tabla parametros estimadosest=cbind(Estimacion=mciclos4$coef,s.e=sqrt(diag(mciclos4$var.coef)))z0=est[,1]/est[,2]vp=pnorm(abs(z0),lower.tail=FALSE)+pnorm(-abs(z0))tabla=cbind(est,z0,vp);tabla




ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


Codigo R 8.22. Ajuste de ciclos SARMA(1,2)(0,1)[4] sobre residuos estructurales

Et. Objeto R que guarda el modelo ajustado es mciclos5.

mciclos5=auto.arima(Et1,ic="aic")summary(mciclos5)



layout(rbind(c(1,1,2,2),c(3,3,4,4)))plot.ts(residuals(mciclos5))abline(h=0,col=2)plot(as.numeric(hatciclos5),residuals(mciclos5))abline(h=0,col=2)acf(as.numeric(residuals(mciclos5)),ci.type="ma",lag.max=36)pacf(as.numeric(residuals(mciclos5)),lag.max=36)


Codigo R 8.23. Ajuste de ciclos ARMA(6,7)a sobre residuos estructurales Et.


#Ajuste primer modelo identificado con armasubsets. Este modelos es modificado en mciclos6mciclos6i=Arima(et1,order=c(6,0,7),fixed=c(c(0,NA,rep(0,3),NA),c(rep(0,6),NA)),include.mean=F,method="ML")

layout(rbind(c(1,1,2,2),c(3,3,4,4)))plot.ts(residuals(mciclos6i))abline(h=0,col=2)plot(as.numeric(fitted(mciclos6i)),residuals(mciclos6i))abline(h=0,col=2)acf(residuals(mciclos6i),ci.type="ma",lag.max=36)pacf(residuals(mciclos6i),lag.max=36)

#Ajuste modelo ARMA(6,7)amciclos6=Arima(et1,order=c(6,0,7),fixed=c(c(0,NA,rep(0,3),NA),c(NA,rep(0,5),NA)),include.mean=F,method="ML")summary(mciclos6)

#Completacion tabla parametros estimadosest=cbind(Estimacion=mciclos6$coef[mciclos6$coef!=0],s.e=sqrt(diag(mciclos6$var.coef)))z0=est[,1]/est[,2]vp=pnorm(abs(z0),lower.tail=FALSE)+pnorm(-abs(z0))tabla=cbind(est,z0,vp)tabla


layout(rbind(c(1,1,2,2),c(3,3,4,4)))plot.ts(residuals(mciclos6))

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


abline(h=0,col=2)plot(as.numeric(hatciclos6),residuals(mciclos6))abline(h=0,col=2)acf(residuals(mciclos6),ci.type="ma",lag.max=36)pacf(residuals(mciclos6),lag.max=36)eacf(residuals(mciclos6))


Codigo R 8.24. Ajuste de ciclos ARMA(6,7)b sobre residuos estructurales Et.


#Ajuste segundo modelo identificado con armasubsets. Este modelos es modificado en mciclos7mciclos7i=Arima(et1,order=c(6,0,7),fixed=c(c(0,NA,rep(0,3),NA),c(rep(0,5),NA,NA)),include.mean=F,method="ML")

layout(rbind(c(1,1,2,2),c(3,3,4,4)))plot.ts(residuals(mciclos7i))abline(h=0,col=2)plot(as.numeric(fitted(mciclos7i)),residuals(mciclos7i))abline(h=0,col=2)acf(residuals(mciclos7i),ci.type="ma",lag.max=36)pacf(residuals(mciclos7i),lag.max=36)

#Ajuste modelo ARMA(6,7)bmciclos7=Arima(et1,order=c(6,0,7),fixed=c(c(0,NA,rep(0,3),NA),c(NA,rep(0,4),NA,NA)),include.mean=F,method="ML")summary(mciclos7)

est=cbind(Estimacion=mciclos7$coef[mciclos7$coef!=0],s.e=sqrt(diag(mciclos7$var.coef)))z0=est[,1]/est[,2]vp=pnorm(abs(z0),lower.tail=FALSE)+pnorm(-abs(z0))tabla=cbind(est,z0,vp)tabla


layout(rbind(c(1,1,2,2),c(3,3,4,4)))plot.ts(residuals(mciclos7))abline(h=0,col=2)plot(as.numeric(hatciclos7),residuals(mciclos7))abline(h=0,col=2)acf(residuals(mciclos7),ci.type="ma",lag.max=36)pacf(residuals(mciclos7),lag.max=36)


Codigo R 8.25. Aproximacion del ajuste total de la serie como la suma del

ajuste del modelo exponencial mas el ajuste de los ciclos ARMA. Calculo del AIC

y BIC aproximados de cada ajuste total.

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


ythat1=ythat.estruct+hatciclos1ythat2=ythat.estruct+hatciclos2ythat3=ythat.estruct+hatciclos3ythat4=ythat.estruct+hatciclos4ythat5=ythat.estruct+hatciclos5ythat6=ythat.estruct+hatciclos6ythat7=ythat.estruct+hatciclos7

#Calculo de AICs y BICs de todos los ajustes incluyendo los del modelo exponencialpestruct=length(coef(modelo1)) #Numero de parametros en modelo inicialAICstodos=cbind(crit.inf(modelo1),AIC.aprox(mciclos1),AIC.aprox(mciclos2),AIC.aprox(mciclos3),AIC.aprox(mciclos4),AIC.aprox(mciclos5),AIC.aprox(mciclos6),AIC.aprox(mciclos7))

AICstodos

BICstodos=cbind(crit.inf(modelo1,AIC="FALSE"),BIC.aprox(mciclos1),BIC.aprox(mciclos2),BIC.aprox(mciclos3),BIC.aprox(mciclos4),BIC.aprox(mciclos5),BIC.aprox(mciclos6),BIC.aprox(mciclos7))

BICstodos

medidas=rbind(AICstodos,BICstodos)dimnames(medidas)=list(c("AIC","BIC"),c("Estructura","Estructura+ARMA(2,2)","Estructura+AR(6)","Estructura+ARMA(1,8)","Estructura+ARMA(2,5)","Estructura+SARMA(1,2)(0,1)[4]","Estructura+ARMA(6,7)a","Estructura+ARMA(6,7)b"))

medidas

Codigo R 8.26. Aproximacion del pronostico total de la serie como la suma del

pronostico del modelo exponencial mas el pronostico de los ciclos ARMA. Calculo

de precision de los pronosticos totales.

pred.ciclos1=ts(forecast(mciclos1,h=m)$mean,freq=4,start=c(1993,4))ytpron1=pred.estruct+pred.ciclos1accuracy(ytpron1,ytf)







ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


Codigo R 8.27. Graficas de la serie real y ajustada mediante la suma de la es-

timacion de la estructura exponencial mas los ciclos ARMA. Tambien se grafican

los respectivos pronosticos en cada caso.

layout(rbind(c(1,1,2,2),c(3,3,4,4)))plot(yt,main="Serie real, ajustes\nModelo exponencial cubico estacional")lines(ythat1,col=2)lines(ytpron1,col=4)legend("topleft",legend=c("Original","Estructura + ciclos ARMA(2,2)","pronosticado"),col=c(1,2,4),lty=1)

plot(yt,main="Serie real, ajustes\nModelo exponencial cubico estacional")lines(ythat2,col=2)lines(ytpron2,col=4)legend("topleft",legend=c("Original","Estructura + ciclos AR(6)","Pronosticado"),col=c(1,2,4),lty=1)

plot(yt,main="Serie real, ajustes\nModelo exponencial cubico estacional")lines(ythat3,col=2)lines(ytpron3,col=4)legend("topleft",legend=c("Original","AEstructura + ciclos ARMA(1,8)","Pronosticado"),col=c(1,2,4),lty=1)

plot(yt,main="Serie real, ajustes\nModelo exponencial cubico estacional")lines(ythat4,col=2)lines(ytpron4,col=4)legend("topleft",legend=c("Original","Estructura + ciclos ARMA(2,5)","Pronosticado"),col=c(1,2,4),lty=1)

layout(rbind(c(1,1,2,2),c(0,3,3,0)))plot(yt,main="Serie real, ajustes\nModelo exponencial cubico estacional")lines(ythat5,col=2)lines(ytpron5,col=4)legend("topleft",legend=c("Original","Estructura + ciclos SARMA(1,2)(0,1)[4]","Pronosticado"),col=c(1,2,4),lty=1)

plot(yt,main="Serie real, ajustes\nModelo exponencial cubico estacional")lines(ythat6,col=2)lines(ytpron6,col=4)legend("topleft",legend=c("Original","Estructura + ciclos ARMA(6,7)a","Pronosticado"),col=c(1,2,4),lty=1)

plot(yt,main="Serie real, ajustes\nModelo exponencial cubico estacional")lines(ythat7,col=2)lines(ytpron7,col=4)legend("topleft",legend=c("Original","Estructura + ciclos ARMA(6,7)b","Pronosticado"),col=c(1,2,4),lty=1)

Codigo R 8.28. Comparacion grafica de los pronosticos. Tenga en cuenta que se

grafican en total 9 series incluyendo a los valores reales en los perıodos pronos-

ticados, por esto los argumentos pch (para el sımbolo de los puntos a graficar)

y col (para el color de la lıneas) usados en las funciones plot() y legend()se especifican iguales a un vector con 9 entradas, una para cada una de las

columnas de la matriz guardada en el objeto de nombre p, respectivamente.

#Comparando todos los pronosticos con valores realeswin.graph(height=16,width=16)

#Juntando en una matriz los valores reales y pronosticados (colocados en columnas)#obteniendo un objeto de serie de tiempo multivariado

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


p=cbind(ytf,pred.estruct,ytpron1,ytpron2,ytpron3,ytpron4,ytpron5,ytpron6,ytpron7)

colnames(p)=c("Real","Estructura","Estructura+ARMA(2,2)","Estructura+AR(6)","Estructura+ARMA(1,8)","Estructura+ARMA(2,5)","Estructura+SARMA(1,2)(0,1)[4]","Estructura+ARMA(6,7)a","Estructura+ARMA(6,7)b")p

plot(p,plot.type="single",type="b",pch=c(19,1:8),col=c(1:9),lty=1,lwd=2,ylim=c(1400,2000),ylab="Produccion",xaxt="n")

axis(1,at=time(p),labels=c("1993.Q4","1994.Q1","1994.Q2","1994.Q3"))

legend("topleft",legend=c("Serie Original","Pron. sin ciclos","Estructura+ARMA(2,2)","Estructura+AR(6)","Estructura+ARMA(1,8)","Estructura+ARMA(2,5)","Estructura+SARMA(1,2)(0,1)[4]","Estructura+ARMA(6,7)a","Estructura+ARMA(6,7)b"),pch=c(19,1:8),lty=1,col=c(1:9),lwd=2,bty="n")

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ

Capıtulo 9

Modelos ARIMA

9.1. Introduccion

Todas las series que hemos tratado de modelar a traves de la identificaciony ajuste de una estructura de tendencia y estacionalidad, no son estaciona-rias, puesto que la media de tales series es funcion del tiempo (no es constante)y en el caso de series con componentes multiplicativas, tenemos ademas va-rianza no constante. Los ciclos no identificados y que permanecen en la com-ponente de error en esta estrategia de modelacion, han sido ajustados me-diante modelos ARMA estacionarios.

En este capıtulo abordaremos otra estrategia de modelacion para series noestacionarias con tendencia y sin estacionalidad, es decir, series de la formaYt = Tt + Et, modelo conocido como ARIMA. En el Capıtulo siguiente se con-siderara el caso de series con tendencia y estacionalidad, Yt = Tt + St + Et, yel modelo en este caso es denominado SARIMA. Los modelos ARIMA-SARIMAtambien son conocidos como modelos de Box-Jenkins.

9.2. Procesos homogeneos

La gran mayorıa de los procesos economicos, ambientales, etc., no sonestacionarios y su nivel medio varıa con el tiempo (Martınez [8]). Considerela serie mensual presentada en la Seccion 5.3.1, la cual fue simulada bajo elmodelo Yt = 3500 + 200t + Et, Et ∼ R.BN(0, (4000)2), con n = 300 observaciones,ilustrada en la Figura 9.1, junto con su primera diferencia, ∇Yt = Yt − Yt−1.

De la grafica de la serie Yt y de su ACF muestral, es claro que la serie no esestacionaria en covarianza; sin embargo, la serie ∇Yt de la primera diferencia(la cual es un filtro lineal de la serie original) sı es estacionaria en covarianza,pues es estable en media y varianza y la ACF presenta un comportamientoergodico. Observe ademas que segun el patron en la ACF y PACF de la seriediferencia, esta puede ser modelada como un MA(1) (ignorando el corte que seobserva en k = 31 en la ACF, el orden MA puede tomarse igual a 1).

293

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ

294 CAPITULO 9. MODELOS ARIMA

Serie Yt

Time

yt

1980 1985 1990 1995 2000 2005

020

000

5000

0

0 5 10 15 20 25 30 35

−0.

50.

00.

51.

0

Lag

AC

F

ACF Yt

Serie ∇Yt = Yt − Yt−1

Time

dife

r

1980 1985 1990 1995 2000 2005−15

000

010

000

0 5 10 15 20 25 30 35

−0.

4−

0.2

0.0

Lag

AC

F

ACF ∇Yt

0 5 10 15 20 25 30 35

−0.

4−

0.2

0.0

Lag

Par

tial A

CF

PACF ∇Yt

Figura 9.1: Serie simulada como Yt = 3500 + 200t + Et, Et ∼ N(0, (4000)2) y su primera

diferencia

En este ejemplo vemos que al diferenciar la serie, es decir, al obtener a ∇Yt,se obtiene un proceso estacionario.

Llamamos a ∇Yt proceso diferencia de orden 1 de Yt. Observe que ∇Yt =(1−B)Yt. Llamaremos proceso diferencia de orden 2 de una serie Yt al proceso∇2Yt = ∇Yt−∇Yt−1 = Yt−2Yt−1+Yt−2 = (1−B)2Yt, y en general, llamamos procesodiferencia de orden d al proceso ∇dYt = (1− B)dYt.

Cuando al diferenciar un proceso d veces, d ∈ Z+, se obtiene un procesoestacionario, entonces decimos que el proceso original es homogeneo de or-den d. Por ejemplo, el proceso Yt = β0 + β1t + Et, donde Et es estacionario, es

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ

9.2. PROCESOS HOMOGENEOS 295

un proceso homogeneo de orden 1. En efecto al diferenciarlo una vez tenemos

∇Yt = Yt − Yt−1 = β0 + β1t+ Et − [β0 + β1(t− 1) + Et−1]

= β1 + Et − Et−1

= β1 + Ut (9.1)

donde Ut = Et − Et−1, es estacionario. Observe que si Et es un ruido blancoentonces ∇Yt es un MA(1) de media β1, con parametro θ1 = −1.

En general, procesos generados como una tendencia polinomica de ordend mas un proceso estacionario cualquiera Et, sera homogeneo de orden d:

Yt = β0 + β1t+ β2t2 + · · ·+ βdt

d + Et, Et estacionario. (9.2)

Luego, la serie simulada como Yt = 3500+200t+Et, Et ∼ N(0, (4000)2) es definidapor un proceso homogeneo de orden d = 1 y por tanto ∇Yt = 200 + Et − Et−1

es un proceso MA(1) estacionario con media 200. Esto ultimo es verificado, dela ACF y PACF muestrales para ∇Yt, y tambien de la correspondiente EACFmuestral que se muestra a continuacion: esta EACF nos indica claramente que

EACF muestral para ∇Yt

AR/MA 0 1 2 3 4 5 6 7 8 9 10 11 12 13

0 x o o o o o o o o o o o o o1 x x o o o o o o o o o o o o2 x x o o o o o o o o o o o o3 x o o x o o o o o o o o o o4 x x x x o o o o o o o o o o5 x x x o x o o o o o o o o o6 x o x x x o x o o o o o o o7 x o x o o o x x o o o o o o

el modelo ARMA apropiado es p = 0 y q = 1, es decir un MA(1). Ajustamos estemodelo a la serie ∇Yt usando la funcion R Arima() de la librerıa forecast , yobtenemos lo siguiente:

Tabla parametros estimados Modelo MA(1) para ∇Yt

Parametro Estimacion s.e Z0 P (|Z| > |Z0|)θ1 -1.0000 0.0090 -110.9714 0.0000

Intercepto (β1) 201.6340 2.6545 75.9605 0.0000

AIC = 5815.89, BIC = 5826.99, σ2 = 15777871

Observe que el intercepto en los resultados del ajuste corresponde a lapendiente β1 y no a β0, de acuerdo a la ecuacion (9.1), luego, β1 = 201.6340.

Tambien tenemos que θ1 = −1 y σ2 = VAR(Et) = 15777871 (el verdadero valorera 16000000). En la Figura 9.2 se presenta los graficos de los residuales Et

y su ACF y PACF muestrales. Obviando el corte en k = 31 en la ACF y PACF, yteniendo en cuenta los resultados de la EACF, del test de Ljung-Box, y el testde normalidad, podemos concluir que los errores Et provienen de un ruidoblanco normal.

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


Residuos ajuste MA(1) para ∇Yt

Time

resi

dual

s(aj

uste

dife

renc

ia)

1980 1985 1990 1995 2000 2005

−10

000

050

00

−10000 0 5000 10000

−10

000

050

00

Residuos ajuste MA(1) para ∇Yt

fitted(ajustediferencia)re

sidu

als(

ajus

tedi

fere

ncia

)

0 5 10 15 20 25 30 35

−0.

15−

0.05

0.05

Lag

AC

F

ACF residuos ajuste MA(1) para ∇Yt

0 5 10 15 20 25 30 35

−0.

15−

0.05

0.05

Lag

Par

tial A

CF

PACF residuos ajuste MA(1) para ∇Yt

Figura 9.2: Graficos para analisis de residuales Et del ajuste MA(1) sobre la serie ∇Yt

Test Ljung-Box para Et

Modelo MA(1) ajustado a ∇Yt

m QLB g.l P (χ2m > QLB)

6 3.82 6.00 0.7012 6.82 12.00 0.8718 13.76 18.00 0.7424 16.00 24.00 0.8930 18.76 30.00 0.9436 27.97 36.00 0.83

Test Shapiro Wilk para residuos Et



ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


EACF muestral para residuos Et


AR/MA 0 1 2 3 4 5 6 7 8 9 10 11 12 13

0 o o o o o o o o o o o o o o1 x o o o o o o o o o o o o o2 x x o o o o o o o o o o o o3 x x o o o o o o o o o o o o4 x o o o o o o o o o o o o o5 o x o x x o o o o o o o o o6 x x x o x o o o o o o o o o7 x o x x x o x o o o o o o o

El codigo R usado para el calculo de la diferencia de la serie y su ajuste fueel siguiente:

Codigo R 9.1.


yt=scan(file.choose()) #leer archivo datossimuleje1recursivos.txtyt=ts(yt,freq=12,start=c(1980,1))

#Creando serie primera diferencia Y(t)-Y(t-1)difer=diff(yt)

#Graficando la serie Yt, su ACF, y la serie primera diferencia con sus ACF y PACFnf=layout(rbind(c(1,2),c(3,4),c(5,6)))plot(yt,main=expression(paste("Serie",sep=" ",Y[t])))

acf(as.numeric(yt),lag.max=36,ci.type="ma",ci.col="red",main=expression(paste("ACF",sep=" ",Y[t])))

plot(difer,main=expression(paste("Serie",sep=" ",nabla,sep="",Y[t]==Y[t]-Y[t-1])))abline(h=0,lty=2)

acf(as.numeric(difer),lag.max=36,ci.type="ma",ci.col="red",main=expression(paste("ACF",sep=" ",nabla,sep="",Y[t])))

pacf(as.numeric(difer),lag.max=36,ci.col="red",main=expression(paste("PACF",sep=" ",nabla,sep="",Y[t])))

#Calculando la EACF muestral para la serie primera diferenciaeacf(difer)

#Ajustando modelo MA(1) identificado segun EACF para la primera diferencia,ajustediferencia=Arima(difer,order=c(0,0,1))summary(ajustediferencia)

#para completar informacion de tabla de parametros ajustadosest=cbind(Estimacion=ajustediferencia$coef,s.e=sqrt(diag(ajustediferencia$var.coef)))z0=est[,1]/est[,2]vp=pnorm(abs(z0),lower.tail=FALSE)+pnorm(-abs(z0))

#Chequeo sobre residuales ajuste MA(1) para primera diferencia de la serie simuladanf=layout(rbind(c(1,2),c(3,4)))plot(residuals(ajustediferencia),main=expression(paste("Residuos ajuste MA(1) para ",sep=" ",nabla,sep="",Y[t])))abline(h=0,lty=2)

plot(fitted(ajustediferencia),residuals(ajustediferencia),main=expression(paste("Residuos ajuste MA(1) para ",sep=" ",nabla,sep="",Y[t])))abline(h=0,lty=2)

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


acf(as.numeric(residuals(ajustediferencia)),lag.max=36,ci.type="ma",ci.col="red",main=expression(paste("ACF residuos ajuste MA(1) para",sep=" ",nabla,sep="",Y[t])))

pacf(as.numeric(residuals(ajustediferencia)),lag.max=36,ci.col="red",main=expression(paste("PACF residuos ajuste MA(1) para",sep=" ",nabla,sep="",Y[t])))

#Creando funcion para resultados Ljung-BoxBP.LB.test=function(serie,maxlag,type="Box"){aux=floor(maxlag/6);X.squared=c(rep(NA,aux))df=c(rep(NA,aux))p.value=c(rep(NA,aux))for(i in 1:aux){test=Box.test(serie,lag=(6 * i),type=type)X.squared[i]=test[[1]]df[i]=test[[2]]p.value[i]=test[[3]]}lag=6 * c(1:aux)teste=as.data.frame(cbind(X.squared,df,p.value))rownames(teste)=lagteste}

BP.LB.test(residuals(ajustediferencia),maxlag=36,type="Ljung")xtable::xtable(BP.LB.test(residuals(ajustediferencia),maxlag=36,type="Ljung"))

#Calculando EACF para residuos del ajuste MA(1) de la primera diferenciaeacf(residuals(ajustediferencia))

#Teste de normalidad para residuos del ajuste MA(1) de la primera diferenciashapiro.test(residuals(ajustediferencia))

Para un proceso de la forma Yt = β0 + β1t + β2t2 + Et, con Et estacionario y

de media cero, se tiene que

∇Yt = (β1 − β2) + 2β2t+ Ut, con Ut = Et −Et−1 (9.3)

∇2Yt = 2β2 +Wt, con Wt = Et − 2Et−1 + Et−2 (9.4)

Claramente, ∇Yt no es estacionario y su media es E[∇Yt] = (β1 − β2) + 2β2t,mientras que ∇2Yt es estacionario y su media es E[∇2Yt] = 2β2, y si Et es unruido blanco, entonces∇2Yt es una proceso MA(2) de media dada y parametrosθ1 = −2, θ2 = 1.

Por ejemplo, sea el proceso definido por Yt = 10000 + 1.8t + 15t2 + Et, conEt ∼ R.BN(0, (5000)2). Una realizacion de n = 300 observaciones de este procesofue obtenido por simulacion y la serie junto con su ACF es presentada enla Figura 9.3. Es evidente que la serie presenta tendencia cuadratica y queno es estacionaria en covarianza. Al calcular la diferencias de orden 1 y 2obtenemos las series ∇Yt y ∇2Yt que se muestran en la Figura 9.4, junto consus respectivas ACF; en la misma figura tambien se observa la PACF de ladiferencia de orden 2. Puede observarse que la serie de la diferencia de orden1 es una serie con tendencia lineal y por tanto no es estacionaria, pero la serie∇2Yt oscila alrededor de una tendencia constante y es estacionaria segun suACF; mas aun, de acuerdo a los patrones en su ACF y PACF, esta diferencia

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


Serie simulada Yt = 10000 + 1.8t + 15t2 + Et

Time

yt

1980 1985 1990 1995 2000 2005

020

0000

6000

0010

0000

014

0000

0

0 5 10 15 20 25 30 35

−0.

50.

00.

51.

0

Lag

AC

F

ACF Yt

Figura 9.3: Serie simulada Yt = 10000 + 1.8t + 15t2 + Et, Et ∼ R.BN(0, (5000)2) y su ACF

muestral.

sigue un proceso MA(2) (obviando los cortes despues de k = 15, en la ACF),lo cual tambien es evidenciado a partir de la EACF muestral que se ilustra acontinuacion:

EACF para ∇2Yt = (1 − B)2Yt

AR/MA 0 1 2 3 4 5 6 7 8 9 10 11 12

0 x x o o o o o o o o o o o1 x o o o o o o o o o o o o2 x o o o o o o o o o o o o3 x o o x o o o o o o o o o4 x x x o o x o o o o o o o5 x x x x x x x o o o o o o6 x x x o o x x x o o o o o7 x x x o o o x o o o o o o

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


Serie ∇Yt

Time

dife

r1

1980 1985 1990 1995 2000 2005

−20

000

020

000

0 5 10 15 20 25 30 35

−0.

3−

0.1

0.1

Lag

AC

F

ACF ∇Yt

Serie ∇2Yt

Time

dife

r2

1980 1985 1990 1995 2000 2005

−30

000

020

000

0 5 10 15 20 25 30 35

−0.

6−

0.2

0.2

Lag

AC

F

ACF ∇2Yt

0 5 10 15 20 25 30 35

−0.

6−

0.2

Lag

Par

tial A

CF

PACF ∇2Yt

Figura 9.4: Diferencias de orden 1 y 2 de serie simulada Yt = 10000 + 1.8t + 15t2 + Et,

Et ∼ R.BN(0, (5000)2).

Al realizar el ajuste del modelo MA(2) a la serie ∇2Yt, se obtuvieron lossiguientes resultados

Tabla parametros estimados Modelo MA(2) para ∇2Yt

Parametro Estimacion s.e Z0 P (|Z| > |Z0|)θ1 -1.9634 0.0242 -81.1580 0.0000θ2 0.9636 0.0237 40.7018 0.0000

Intercepto (2β2) 29.9791 0.4325 69.3094 0.0000

AIC = 5937.71, BIC = 5952.49, σ2 = 24492346

Observamos que θ1 = −1.9634, θ2 = 0.9636, β2 = 29.9791/2 = 14.98955, todos

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


muy proximos de los verdaderos valores, -2, 1, 15, respectivamente. Ası mis-mo, la varianza estimada es proxima de la verdadera, 25000000. El analisisde los residuales del ajuste Et, basados en los siguientes resultados, indicanque Et es aproximadamente un ruido blanco normal.

Residuos ajuste MA(2) para ∇2Yt

Time

resi

dual

s(aj

uste

dife

r2)

1980 1985 1990 1995 2000 2005

−15

000

−50

0050

0015

000

−20000 0 10000 30000

−15

000

−50

0050

0015

000

Residuos ajuste MA(2) para ∇2Yt

fitted(ajustedifer2)

resi

dual

s(aj

uste

dife

r2)

0 5 10 15 20 25 30 35

−0.

100.

000.

10

Lag

AC

F

ACF residuos ajuste MA(2) para ∇2Yt

0 5 10 15 20 25 30 35

−0.

100.

000.

10

Lag

Par

tial A

CF

PACF residuos ajuste MA(2) para ∇2Yt

Figura 9.5: Graficos para analisis de residuales Et del ajuste MA(2) sobre la serie ∇2YtESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


EACF muestral para residuos Et

Modelo MA(2) ajustado a ∇2Yt

AR/MA 0 1 2 3 4 5 6 7 8 9 10 11 12 13

0 o o o o o o o o o o o o o o1 x o o o o o o o o o o o o o2 x o o o o o o o o o o o o o3 x x x o o o o o o o o o o o4 x x o x o o o o o o o o o o5 x o o x x o o o o o o o o o6 x x x x o x o o o o o o o o7 x x x x o o x o o o o o o o

Test Ljung-Box para Et



6 1.27 6.00 0.9712 5.03 12.00 0.9618 10.48 18.00 0.9224 25.85 24.00 0.3630 29.92 30.00 0.4736 37.94 36.00 0.38

Test Shapiro Wilk para residuos Et



A continuacion se exhibe el codigo R usado en este segundo ejemplo.

Codigo R 9.2.


#Creando Funcion usuario para Test Ljung-BoxBP.LB.test=function(serie,maxlag,type="Box"){aux=floor(maxlag/6);X.squared=c(rep(NA,aux))df=c(rep(NA,aux))p.value=c(rep(NA,aux))for(i in 1:aux){test=Box.test(serie,lag=(6 * i),type=type)X.squared[i]=test[[1]]df[i]=test[[2]]p.value[i]=test[[3]]}lag=6 * c(1:aux)teste=as.data.frame(cbind(X.squared,df,p.value))rownames(teste)=lagteste}

yt=scan(file.choose()) #leer archivo datossimulejem2ARIMA.txtyt=ts(yt,freq=12,start=c(1980,1))

#Calcular los procesos diferencia de primer y segundo ordendifer1=diff(yt)difer2=diff(yt,1,2)

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ

9.3. RAIZ UNITARIA AUTORREGRESIVA 303

#Obtencion EACF del proceso diferencia de orden 2eacf(difer2)

#Grafica de la serie Yt y de su ACF muestralnf=layout(rbind(c(0,1,1,0),c(2,2,2,2)))plot(yt, main=expression(paste("Serie simulada",sep=" ",Y[t]==10000+1.8 * t+15 * tˆ2+E[t])))acf(as.numeric(yt),lag.max=36,ci.type="ma",ci.col="red",main=expression(paste("ACF",sep=" ",Y[t])))

#Graficas de las series diferencias de orden 1 y 2 y sus ACF,#ademas se grafica la PACF de la serie diferencia de orden 2

nf=layout(rbind(c(1,2),c(3,4),c(5,6)))plot(difer1,main=expression(paste("Serie ",sep=" ",nabla,sep="",Y[t])))

acf(as.numeric(difer1),lag.max=36,ci.type="ma",ci.col="red",main=expression(paste("ACF",sep=" ",nabla,sep="",Y[t])))

plot(difer2,main=expression(paste("Serie ",sep=" ",nablaˆ2,sep="",Y[t])))

acf(as.numeric(difer2),lag.max=36,ci.type="ma",ci.col="red",main=expression(paste("ACF",sep=" ",nablaˆ2,sep="",Y[t])))

pacf(as.numeric(difer2),lag.max=36,ci.col="red",main=expression(paste("PACF",sep=" ",nablaˆ2,sep="",Y[t])))

#Ajustando modelo MA(2) a serie diferencia de orden 2ajustedifer2=Arima(difer2,order=c(0,0,2))summary(ajustedifer2)

#Completando informacion de tabla de parametros estimados del modlo ajustadoest=cbind(Estimacion=ajustedifer2$coef,s.e=sqrt(diag(ajustedifer2$var.coef)))z0=est[,1]/est[,2]vp=pnorm(abs(z0),lower.tail=FALSE)+pnorm(-abs(z0))

#Chequeo sobre residuales del ajuste MA(2) para segunda diferencia de la serie simuladanf=layout(rbind(c(1,2),c(3,4)))plot(residuals(ajustedifer2),main=expression(paste("Residuos ajuste MA(2) para ",sep=" ",nablaˆ2,sep="",Y[t])))abline(h=0,lty=2)

plot(fitted(ajustedifer2),residuals(ajustedifer2),main=expression(paste("Residuos ajuste MA(2) para ",sep=" ",nablaˆ2,sep="",Y[t])))abline(h=0,lty=2)

acf(as.numeric(residuals(ajustedifer2)),lag.max=36,ci.type="ma",ci.col="red",main=expression(paste("ACF residuos ajuste MA(2) para",sep=" ",nablaˆ2,sep="",Y[t])))

pacf(as.numeric(residuals(ajustedifer2)),lag.max=36,ci.col="red",main=expression(paste("PACF residuos ajuste MA(2) para",sep=" ",nablaˆ2,sep="",Y[t])))

eacf(residuals(ajustedifer2))BP.LB.test(residuals(ajustedifer2),maxlag=36,type="Ljung")shapiro.test(residuals(ajustedifer2))

9.3. Raız unitaria autorregresiva

Considere un modelo ARMA(p,q)

Φp(B)Yt = Θq(B)Et, Et ∼ R.BN(0, σ2)

tal que una de las p raıces del polinomio autorregresivo Φp(B) es igual a 1.Decimos que Yt tiene una raız unitaria autorregresiva o simplemente una raız

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


unitaria y ası, tenemos que Φp(B) = (1− B)Φp−1(B), donde Φp−1(B) tiene raıcescon modulo fuera del cırculo unitario. En este caso,

(1−B)Φp−1(B)Yt = Θq(B)Et =⇒ Φp−1(B)∇Yt = Θq(B)Et (9.5)

es decir, ∇Yt es un ARMA(p−1,q).

Para una serie de tiempo proveniente de un proceso con raız unitaria, suACF y PACF presentan el patron de cola decreciente - corte, respectivamente,tıpico de un AR, pero la ACF decrece lentamente mientras que la PACF pre-senta un corte con valor muy proximo de 1 en k = 1 y para el resto de rezagoslos valores son casi cero. Ver ejemplo la Figura 9.6.

0 5 10 15 20 25 30 35

−0.

50.

00.

51.

0

Lag

AC

F

ACF Yt

0 5 10 15 20 25 30 35

0.0

0.2

0.4

0.6

0.8

1.0

Lag

Par

tial A

CF

PACF Yt

Figura 9.6: ACF y PACF de una serie proveniente de un proceso ARIMA(p,1,q)

Tambien puede presentarse el caso de mas de una raız unitaria. Cuan-do existen d raıces unitarias, se requiere diferenciar d veces para obteneruna serie estacionaria, es decir, Φp−d(B)(1 − B)dYt = Θq(B)Et, entonces ∇dYt ∼ARMA(p−d,q) (en esta notacion asumimos p ≥ d). En la practica son comuneslos valores d = 1, 2.

9.4. Caminata aleatoria

9.4.1. Caminata aleatoria sin tendencia

Sea un proceso AR(1), esto es, Yt = φ1Yt−1 + Et, donde Et ∼ R.BN(0, σ2). Siφ1 = 1, tenemos un proceso no estacionario conocido como caminata aleatoria

sin tendencia:

Yt = Yt−1 + Et, Et ∼ R.BN(0, σ2) (9.6)

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ

9.4. CAMINATA ALEATORIA 305

Asumiendo que el proceso inicia en t = 0, con un valor y0, puede mostrarseque

Yt = y0 +

t∑

i=1

Ei (9.7)

E[Yt] = y0 (9.8)

VAR[Yt] = tσ2 (9.9)

COV[Yt, Yt+k] = COV

[t∑

i=1

Ei,

t+k∑

i=1

Ei

]= tσ2 (9.10)

Corr[Yt, Yt+k] =t√

t(t + k)(9.11)

Observe que lımt→∞ VAR[Yt] =∞, es decir, la varianza crece y no converge a unvalor finito, mientras que para t grande la ACF tomara valores proximos a 1 ydecrecera muy lentamente con k.

9.4.2. Caminata aleatoria con tendencia o deriva

Considere ahora un proceso de la forma

Yt = δ + Yt−1 + Et, Et ∼ R.BN(0, σ2) (9.12)

este proceso es conocido como caminata aleatoria con tendencia o deriva.Suponiendo que el proceso inicia en t = 0 con un valor y0, se tiene que

Yt = y0 + δt+t∑

i=1

Ei (9.13)

E[Yt] = y0 + δt (9.14)

VAR[Yt] = tσ2 (9.15)

COV[Yt, Yt+k] = COV

[t∑

i=1

Ei,t+k∑

i=1

Ei

]= tσ2 (9.16)

Corr[Yt, Yt+k] =t√

t(t + k)(9.17)

de nuevo, lımt→∞ VAR[Yt] =∞ y la ACF no es ergodica.La caminata aleatoria con tendencia tambien es conocida como modelo de

tendencia estocastica.

Nota:

1. Observe que al reescribir las ecuaciones (9.6) y (9.12) en terminos de∇Yt = Yt − Yt−1, obtenemos que el proceso diferencia de orden 1 es esta-cionario y por tanto, una caminata aleatoria es un proceso homogeneode orden d = 1.

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


2. Una caminata aleatoria no presenta reversion a la media, es decir, vahacia arriba y abajo en forma aleatoria sin una tendencia a regresar adeterminado nivel.

3. A pesar del comportamiento incierto de la caminata aleatoria, su primeradiferencia es una serie bien comportada: se comporta como un ruidoblanco (aunque su media puede ser distinta de cero, dependiendo de δ).

9.5. Procesos integrados

Se dice que una serie no estacionaria es integrada si su no estacionar-iedad puede deshacerse diferenciandola (Diebold [3]). Por tanto, los procesoshomogeneos son procesos integrados. Cuando solo se requiere una diferencia,la serie es denominada integrada de orden 1 y se denota por I(1). En general,si se requieren d (d ∈ Z+) diferencias para obtener la estacionariedad, el pro-ceso es integrado de orden d y es denotado por I(d). Ası, un ruido blanco esun proceso I(0), mientras que una caminata aleatoria es un proceso I(1), estosson los proceso integrados mas simples.

Note que el orden de integracion d es igual a la cantidad de raıces unitariasautorregresivas.

9.5.1. Procesos autorregresivos integrados de medias moviles o ARIMA

Se dice que una serie de tiempo Yt sigue un proceso autorregresivo inte-

grado de media movil si su d-esima diferencia, ∇dYt, es un proceso ARMAestacionario, es decir,

Φp(B)∇dYt = Θq(B)Et, Et ∼ R.BN(0, σ2) (9.18)

o equivalentemente,

Φp(B)(1−B)dYt = Θq(B)Et, Et ∼ R.BN(0, σ2) (9.19)

donde las raıces del polinomio autorregresivo Φp(B) tienen modulo mayor a 1, ydenotamos el proceso por ARIMA(p,d,q). De acuerdo a lo anterior, podemos de-cir que I(1)=ARIMA(0,1,0) (o sea, una caminata aleatoria), y I(0)=ARIMA(0,0,0)(o sea, un ruido blanco). Tambien, cuando p = 0, el proceso es denotado porIMA(d,q), y si q = 0, el proceso es simplemente denotado por ARI(p,d).

Si denotamos Φp+d(B) = Φp(B)(1− B)d, podemos tambien escribir el modeloARIMA de la siguiente forma

Φp+d(B)Yt = Θq(B)Et, Et ∼ R.BN(0, σ2) (9.20)

donde el polinomio autorregresivo Φp+d(B) tiene d raıces unitarias, de ahı que elproceso seguido por Yt no es estacionario. Φp(B) y Θq(B) son, respectivamentelos polinomios autorregresivos y de medias moviles del proceso estacionario∇dYt.

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ

9.6. AJUSTE Y PRONOSTICO DE MODELOS ARIMA 307

9.6. Ajuste y pronostico de modelos ARIMA

Una vez determinado el orden apropiado de diferenciacion, d, de la serie, seidentifican los ordenes p y q para la serie diferenciada ∇dYt de la misma formaque en el caso estacionario; luego, se ajusta el proceso completo ARIMA(p,d,q)lo cual podemos hacer usando la funcion R Arima() de la librerıa forecast ,indicando en el argumento order=c(p,d,q) los ordenes p, d, q del modeloARIMA.

En cuanto a los pronosticos, de acuerdo a lo visto en la Seccion 7.10, elpronostico optimo para l perıodos adelante de t = n, que minimiza el errorcuadratico medio de pronostico, es dado por Yn(l), que corresponde a la esper-anza condicional del valor de la serie en t = n + l, l ≥ 1, dada la informacion ohistoria conocida de la serie, es decir,

Yn(l) = E[Yn+l|Yn, Yn−1, . . .], (9.21)

y el error de pronostico esen(l) = Yn+l − Yn(l) (9.22)

Para obtener facilmente los pronosticos expresamos el modelo ARIMA en suforma de ecuacion en diferencia, para ello usamos el polinomio Φp+d(B). Sea

Φp+d(B) = Φp(B)(1−B)d = 1− φ1B − · · · − φp+dBp+d (9.23)

entonces el modelo ARIMA(p,d,q) general en (9.20) puede escribirse como lasiguiente ecuacion en diferencia (es decir, como un ARMA(p+d,q)),

(1− φ1B − · · · − φp+dBp+d)Yt = (1 + θ1B + · · ·+ θqB

q)Et (9.24)

ası, para t = n+ l, tenemos

Yn+l = φ1Yn+l−1+φ2Yn+l−2+· · ·+φp+dYn+l−p−d+En+l+θ1En+l−1+· · ·+θqEn+l−q (9.25)

y tomando la esperanza condicional con origen de tiempo en t = n, obtenemosque la ecuacion de pronostico es dada porESTADÍS

TICA III

- 300

9137

NELFI G

ONZÁLEZ


Yn(l) =φ1Yn(l − 1) + φ2Yn(l − 2) + · · ·+ φp+dYn(l − p− d)+ En(l) + θ1En(l − 1) + · · ·+ θqEn(l − q) (9.26)

donde

Yn(j) =

{E[Yn+j|Yn, Yn−1, . . .] si j ≥ 1

Yn+j si j ≤ 0,(9.27)

En(j) =

{0 si j ≥ 1

En+j si j ≤ 0,(9.28)

y desde que los errores Et no son observables, entonces tomamos en su lugara los residuales Et.

Para estudiar las propiedades del error de pronostico en(l), l perıodos ade-lante de t = n, para una serie modelada segun un ARIMA(p,d,q), consideramosuna nueva representacion para el proceso ARIMA, en la cual el modelo esescrito en la forma de un proceso lineal truncado (Cryer y Chan [2], Wei [9]),

Yn+l = Cn(l) + In(l) (9.29)

donde,

In(l) = En+l + ψ1En+l−1 + ψ2En+l−2 + · · ·+ ψl−1En+1 para l ≥ 1 (9.30)

y si el proceso es invertible, Cn(l) es una cierta funcion de la historia finitadefinida por Y1, . . . , Yn. Para ello, escribimos el proceso en su forma autorre-gresiva,

Π(B)Yt = Et, con Π(B) = 1−∞∑

j=1

πjBj =

Φp(B)(1−B)d

Θq(B)(9.31)

o equivalentemente,

Yt =

∞∑

j=1

πjYt−j + Et (9.32)

y ası, para t = n + l tenemos Yn+l =∞∑

j=1

πjYn+l−j + En+l. Se define ademas el

polinomio Ψl−1(B),

Ψl−1(B) = 1 + ψ1B + · · ·+ ψl−1Bl−1 (9.33)

tal que

m∑

i=0

πm−iψi = 0, para m = 1, 2, . . . , l − 1, con π0 = −1, ψ0 = 1. (9.34)

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ

9.6. AJUSTE Y PRONOSTICO DE MODELOS ARIMA 309

Ası, aplicando el operador Ψl−1(B) a la ecuacion (9.32), con t = n+l, obtenemos

Yn+l =∞∑

j=1

π(l)j Yn−j+1 +

l−1∑

i=0

ψiEn+l−i = Cn(l) + In(l), con π(l)j =

l−1∑

i=0

πl−1+j−iψi (9.35)

Luego, para el pronostico optimo l perıodos adelante de t = n, es decir Yn(l) =E[Yn+l|Yn, Yn−1, . . .], tenemos que

Yn(l) = E[Cn(l)|Yn, Yn−1, . . .] + E[In(l)|Yn, Yn−1, . . .] = Cn(l) =

∞∑

j=1

π(l)j Yn−j+1, l ≥ 1,

(9.36)Por tanto, para el error de pronostico et(l) = Yt+l − Yt(l) tenemos que

en(l) = Cn(l) + In(l)− Cn(l) = En+l + ψ1En+l−1 + ψ2En+l−2 + · · ·+ ψl−1En+1 (9.37)

De lo anterior, se obtiene que para un proceso ARIMA general invertible, secumple que

E[en(l)] = 0 (9.38)

VAR[en(l)] = σ2

l−1∑

j=0

ψ2j para l ≥ 1, (9.39)

por tanto, para una realizacion suficientemente grande (n grande), un intervalode pronostico de (1− α)100 % puede calcularse como

Yn(l)± Zα/2σ

√√√√1 +

l−1∑

j=1

ψ2j (9.40)

donde σ y ψj son estimados.

Nota:

1. Observe que los pronosticos optimos Yn(l) pueden ser obtenidos tanto con(9.26) como por (9.36), aunque la primera es la mas practica ya que en la

segunda expresion es necesario hallar los pesos π(l)j , j = 1, 2, . . ..

2. De (9.26) es claro que los pronosticos con un horizonte mayor a p + destaran basados en pronosticos, por tanto, solo es recomendable realizarpronosticos de corto plazo.

3. Para series no estacionarias, los pesos ψj no decaen a cero a medida queaumenta j (como sı ocurre en el caso estacionario). Por ejemplo, parauna caminata aleatoria se puede mostrar que ψj = 1 para todo j, de

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


donde VAR[et(l)] = σ2l; para un modelo IMA(1,1), ψj = 1 + θ1, ∀j ≥ 1, luego

VAR[et(l)] = σ2[1 + (l − 1)(1 + θ1)2]; para un ARI(1,1) ψj =

1−φj+11

1−φ1, j ≥ 1 y por

tanto, VAR[et(l)] = σ2

[1 +

l−1∑j=1

(1−φj+1

1

1−φ1

)2].

9.7. Pruebas para raıces unitarias

En la Seccion 9.3 vinos que una raız unitaria aparece cuando el polinomioautorregresivo de un ARMA presenta una raız sobre el cırculo unitario, lo cualimplica que es necesario diferenciar la serie para poder obtener estacionar-iedad.

Los testes de raıces unitarias son una herramienta adicional a los analisisgraficos de la serie y su ACF para definir el grado de diferencia necesario a finde obtener una serie estacionaria. De acuerdo a Guerrero [5], diferenciar demas conduce a un modelo mas complejo de lo necesario y causa perdida deeficiencia en la estimacion de parametros, ademas de la sobreestimacion de lavarianza del error de pronostico, aunque no se afectara el insesgamiento ni laconsistencia de los estimadores; pero subdiferenciar tiene consecuencias masgraves pues conduce a la invalidez de los supuestos teoricos para los modelosestacionarios asumidos para la serie subdiferenciada, ya que no se logra laestacionariedad, y por tanto se invalida la interpretacion de los resultadosde los ajustes y pronosticos, ademas, se subestima la varianza del error depronostico y el modelo que se ajusta carece de capacidad adaptativa a efectosno estacionarios sobre el nivel de la serie.

Para poder introducir los testes de raız unitaria, considere inicialmente elproceso AR(1) de media cero,Yt = φ1Yt−1+Et Et,∼ R.BN(0, σ2). Queremos probar

H0 : φ1 = 1 versus H1 : φ1 < 1 (9.41)

Suponga que |φ1| < 1 y que estimamos φ1 mediante la regresion de Yt en Yt−1.Sea φ1,MC el estimador por mınimos cuadrados. Tenemos que el estimador demınimos cuadrados es asintoticamente equivalentes al estimador de maximaverosimilitud, y

φ1,MC =

n∑t=1

YtYt−1

n∑t=1

Y 2t−1

(9.42)

φ1,MC − φ1 =

n∑t=1

EtYt−1

n∑t=1

Y 2t−1

(9.43)

entonces(φ1,MC − φ1)

s.e(φ1,MC)

a∼ N(0, 1) (9.44)

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ

9.7. PRUEBAS PARA RAICES UNITARIAS 311

donde

s.e(φ1,MC) =S√

n∑t=1

Y 2t−1

, con S2 =1

n− 2

n∑

t=2

(Yt − φ1,MCYt−1)2 (9.45)

Sin embargo, si φ1 = 1 la aproximacion normal ya no es aplicable. Para probar(9.41) es necesario estudiar el comportamiento del estadıstico φ1,MC − 1.

9.7.1. Prueba de raız unitaria de Dickey-Fuller (DF)

Caso 1:

Yt ∼ AR(1) con media cero, es decir, Yt = φ1Yt−1 + Et, modelo que podemosreescribir de la forma

∇Yt = φ∗1Yt−1 + Et, con φ∗

1 = φ1 − 1, Et ∼ R.BN(0, σ2) (9.46)

Luego, probar (9.41) es equivalente a probar

H0 : φ∗1 = 0 versus H1 : φ∗

1 < 0 (9.47)

φ∗1 puede ser estimado mediante mınimos cuadrados en la regresion de ∇Yt enYt−1. Sea φ∗

1,MC tal estimador. Definimos como estadıstico de la prueba a

τ =φ∗

1,MC

S/

√n∑

t=1

Y 2t−1

=φ1,MC − 1

S/

√n∑

t=1

Y 2t−1

, con S2 =1

n− 2

n∑

t=2

(∇Yt − φ∗1,MCYt−1)

2 (9.48)

Suponga que Y0 = 0; entonces puede mostrarse que bajo el supuesto Et ∼R.BN(0, σ2)

τa∼ 1

2× ([W (1)]2 − 1)√

1∫0

[W (s)]2ds

(9.49)

donde W (s) es un proceso estocastico conocido como movimiento Brownianoestandar y [W (1)]2 ∼ χ2

1. Los valores crıticos para el estadıstico τ , con nivelesde significancia 0.01, 0.05,, son, respectivamente, -2.60, -1.95, para n = 100.Rechazamos H0 si τ < τcrıtico.

Caso 2:

Yt sigue un proceso AR(1) con media distinta de cero. En este caso el modeloes Yt = β0 + φ1Yt−1 + Et, el cual reescribimos como

∇Yt = β0 + φ∗1Yt−1 + Et, con φ∗

1 = φ1 − 1, Et ∼ R.BN(0, σ2) (9.50)

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


Aquı el parametro β0 = µ(1 − φ1), con µ = E[Yt]. De nuevo, se usa mınimoscuadrados para estimar φ∗

1 en la regresion de ∇Yt en Yt−1, pero esta vez elmodelo tiene intercepto. El estadıstico de la prueba es

τµ =φ∗

1,MC

S/

√n∑

t=1

(Yt−1 − Y )2

=φ1,MC − 1

S/

√n∑

t=1

(Yt−1 − Y )2

, con S2 =1

n− 3

n∑

t=2

(∇Yt−β0,MC−φ∗1,MCYt−1)

2

(9.51)Suponiendo Y0 = 0 y bajo el supuesto Et ∼ R.BN(0, σ2), tenemos que

τµa∼

12([W (1)]2 − 1)−W (1)

1∫0

W (s)ds

√1∫0

[W (s)]2ds−(

1∫0

W (s)ds

)2(9.52)

La distribucion de τµ es aun mas distante de la normal que en el caso de mediacero. Los valores crıticos con muestras grandes, para niveles de significanciade 0.01 y 0.05, son respectivamente, -3.42, -2.86 y rechazamos H0 si τµ <τµ,crıtico.

Caso 3:

Yt ∼ AR(1) con tendencia lineal, es decir, Yt = β0 + β1t + φ1Yt−1 + Et, modeloque reescribimos como

∇Yt = β0 + β1t+ φ∗1Yt−1 + Et, con φ∗

1 = φ1 − 1, Et ∼ R.BN(0, σ2) (9.53)

ττ =φ∗

1,MC

s.e(φ∗1,MC)

(9.54)

donde s.e(φ∗1,MC) es el error estandar del estimador φ∗

1,MC en la estimacion pormınimos cuadrados de la regresion de ∇Yt versus (t, Yt−1). La distribucionlımite de ττ tambien es bastante alejada de la normal y es funcion de losprocesos W (1) y W (t) y de t. El criterio de rechazo sigue siendo si ττ < ττ,crıtico.

9.7.2. Prueba de raız unitaria Dickey-Fuller aumentada (ADF)

En el test DF se supone un proceso AR(1) para la serie Yt. A continuacionconsideraremos el caso en que Yt ∼ AR(p), siendo el modelo general dado por

(Yt − µ) = φ1(Yt−1 − µ) + · · ·+ φp(Yt−p − µ) + Et, Et ∼ R.BN(0, σ2) (9.55)

donde µ = E[Yt], o equivalentemente,

Yt = β0 +

p∑

j=1

φjYt−j + Et, Et ∼ R.BN(0, σ2) (9.56)

con β0 = µ(1−p∑

j=1

φj).

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


Caso 1:

Yt ∼ AR(p) con media cero. En este caso el modelo en (9.55) se reduce aYt =

∑j=1

φjYt−j + Et = φ1Yt−1 +∑j=2

φjYt−j + Et. Este modelo puede ser reescrito de

la siguiente forma:

∇Yt = φ∗1Yt−1 + φ∗

2∇Yt−1 + · · ·+ φ∗p∇Yt−p+1 + Et, Et ∼ R.BN(0, σ2) (9.57)

con φ∗1 =

p∑i=1

φi − 1, y φ∗j = −

p∑i=j

φi, j = 2, . . . , p. Deseamos probar si el polinomio

autorregresivo Φp(B) tiene una raız unitaria, es decir que Φp(1) = 0, lo cual

implicap∑

i=1

φi = 1, luego, φ∗1 = 0, esto es, probamos que

H0 : φ∗1 = 0 versus H1 : φ∗

1 < 0, con φ∗1 =

p∑

i=1

φi − 1. (9.58)

Observe que bajo H0, se tiene que ∇Yt ∼ AR(p-1).

Para la prueba, φ∗1 puede ser estimado como el coeficiente de Yt−1, ajustan-

do por mınimos cuadrados la regresion de ∇Yt versus (Yt−1,∇Yt−1, . . . ,∇Yt−p+1),segun el modelo sin intercepto dado en (9.57). Para n grande, bajo la hipotesisnula, el estadıstico de prueba τ tiene la misma distribucion asintotica que enel caso 1 del test DF.

Caso 2:

Yt ∼ AR(p) con media diferente de cero. En este caso el modelo de la seriees dado por (9.56), y podemos reescribirlo como,

∇Yt = β0 + φ∗1Yt−1 + φ∗


con los φ∗j definidos de la misma forma que en el caso 1. La hipotesis nula y

alternativa es igual a (9.58), y bajo H0, el termino β0 = 0 ya que se cumple quep∑

i=1

φi = 1.

De nuevo, estimamos φ∗1 mediante el metodo de mınimos cuadrados en la

regresion de ∇Yt versus (Yt−1,∇Yt−1, . . . ,∇Yt−p+1), segun el modelo con inter-cepto dado en (9.59) y para n grande, bajo la hipotesis nula, el estadıstico deprueba τµ tiene la misma distribucion asintotica que en el caso 2 del test DF.

Caso 3:

Yt ∼ AR(p) con tendencia lineal. En este caso, el modelo es

(Yt − a− bt) =

p∑

j=1

φj[Yt−j − a− b(t− j)] + Et, Et ∼ R.BN(0, σ2) (9.60)

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


o equivalentemente,

Yt = β0 + β1t+

p∑

j=1

φjYt−j + Et, Et ∼ R.BN(0, σ2) (9.61)

con β0 = a(1 −p∑

j=1

φj) + bp∑

j=1

jφj y β1 = b(1 −p∑

j=1

φj). Este modelo a su vez puede

ser reescrito de la siguiente forma,

∇Yt = β0 + β1t+ φ∗1Yt−1 + φ∗


con los φ∗j definidos de la misma forma que en el caso 1. El test a realizar igual

a (9.58) y bajo H0, β0 = bp∑

j=1

jφj y β1 = 0, desde quep∑

i=1

φi = 1 y el estadıstico

de prueba ττ tiene la misma distribucion asintotica que la correspondiente alcaso 3 del test DF.

Nota: Observe que rechazar H0 en cualquiera de los pruebas DF y ADF diceque no hay raız unitaria; sin embargo no rechazar tal hipotesis no implicaque se deba asumir que existe una raız unitaria, pues estas pruebas adolecende problemas tales como baja potencia para distinguir procesos estacionariospersistentes (con |φ1| cercano a 1) de aquellos no estacionarios, ademas la po-tencia disminuye con la introduccion de terminos determinısticos al modeloAR(1) basico sin constante. Diebold [3] establece que los problemas de poten-cia surgen porque en general las hipotesis alternativas relevantes son muycercanas a la hipotesis nula, y tambien estas pruebas presentan problemasrelacionadas al tamano de la muestra ya que en el test deberıa incluirse infini-tos rezagos lo cual es imposible en la practica. En conclusion, segun Diebold[3]: “aunque a veces son utiles las pruebas de raız unitaria, no son definitivas y

por tanto son el final de la historia respecto a la decision de si especificar o no

modelos en niveles o en diferencias; ... necesitamos usar introspeccion y teorıa,

ademas de pruebas formales, para guiar la difıcil decision de imponer raıces

unitarias y comparar la eficiencia del pronostico con distintos modelos con y sin

raıces unitarias”.Guerrero [5] tambien establece que “en ocasiones las series de tiempo son

afectadas por la ocurrencia de fenomenos que tienen efectos de caracter per-

manente y que vuelven ineficaces las pruebas de raıces unitarias, a menos que

se haga explıcita su presencia en el modelo que representa a dicha serie. Per-

ron (1989) estudio el problema de las raıces unitarias en presencia de cambios

en la estructura de comportamiento de la serie. En particular, encontro que si

una serie de tiempo estacionaria se ve afectada por un cambio de nivel, en-

tonces, al aplicar las pruebas Dickey-Fuller, la conclusion a la que seguramente

se llegara es que la serie es integrada de orden 1. Por otro lado, una serie no

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


estacionaria tambien puede verse afectada por cambios en nivel, en pendiente,

o en ambos”. Este tema en particular no sera explorado en este curso, parainformacion ver Guerrero [5], Seccion 4.4.2 pp. 165-170.

La aplicacion de la prueba ADF requiere determinar cual de los tres casosse aproxima mejor a la serie original Yt, donde es influyente el orden p del poli-nomio autorregresivo que se considere. La sobreespecificacion puede generarperdida de potencia y la sub-especificacion puede sesgar los resultados haciael no rechazo de la hipotesis nula. De acuerdo a Diebold [3] es mejor esti-mar modelos que incluyan intercepto o intercepto y tendencia, porque ası seobtiene una mejor aproximacion a la dinamica de los datos, con o sin raızunitaria. Por otra parte, se debe diferenciar solo cuando exista raız unitaria; sila diferenciacion no es adecuada esto puede ser peligroso incluso asintotica-mente.

Se puede recurrir a la seleccion de modelos basados en algun criterio deinformacion para distinguir cual de los tres casos del test ADF con modelosAR(p) es el mas apropiado. En cuanto al orden autorregresivo, algunos autoressugieren comenzar con p = [n1/4] + 1, con [·] la funcion parte entera de suargumento, por ejemplo, si n = 100 entonces considerar p = 4. En general,elegir un valor p mayor al que se supone a priori que deberıa ser (Guerrero[5]).

9.7.3. Test DF y ADF en R

En R, en la librerıa urca se dispone de la funcion ur.df() que permiterealizar tanto el test Dickey-Fuller como el Dickey-Fuller aumentado,

ur.df(y, type = c("none", "drift", "trend"), lags = 1,selectlags = c("Fixed", "AIC", "BIC"))

donde,

y : Vector de datos o serie a ser probada para raız unitaria;

type : El tipo de caso “none ” para el caso 1, “drift ” para el caso 2 y“trend ” para el caso 3.

lags : el numero de rezagos de variables endogenas a incluir. Para el testDF se especifica lags=0 y para el test ADF se especifica lags=p , donde pes el orden autorregresivo;

selectlags : Una seleccion del orden autorregresivo puede ser hecha deacuerdo al criterio de informacion de Akaike “AIC ” o el de Bayes “BIC ”. Elnumero maximo de rezagos a considerar es el definido en el argumentolags . Por defecto (selectlags = “Fixed ”) se usa el polinomio autorregre-sivo del orden fijado en lags .

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


9.8. Ejemplo: Modelacion de la serie tasa de cambio Yen/Dolar

Esta serie es presentada en Diebold [3] y consta de N = 283 observacionesque corresponden a la tasa de cambio (promedio mes) yen/dolar desde en-ero de 1973 a julio de 1996. Para fines de validacion cruzada, se usaran lasprimeras n = 264 observaciones (de 1973.01 a 1994.12) y se pronosticaran lasultimas m = 19 observaciones. La serie original y su logaritmo, junto con susprimeras diferencias, son ilustradas en la Figura 9.7.

Time

Yt

1975 1980 1985 1990 1995

100

150

200

250

300

Time

∇Y

t

1975 1980 1985 1990 1995

−20

−10

010

Time

log(

Yt)

1975 1980 1985 1990 1995

4.6

4.8

5.0

5.2

5.4

5.6

Time

∇lo

g(Y

t)

1975 1980 1985 1990 1995

−0.

10−

0.05

0.00

0.05

Figura 9.7: Serie original tasa mensual de cambio yen/US, su logaritmo y sus respectivas

diferencias de orden 1

De la figura anterior es claro que para la serie original la diferenciacionestabiliza el nivel de la serie pero hay problemas con la varianza, por eso sedecide considerar la transformacion logaritmo. Para esta ultima, la diferen-ciacion estabiliza el nivel, y la varianza mejora sustancialmente en cuanto aestabilidad. Por lo anterior, se decide trabajar de aquı en adelante con la serieen escala logarıtmica.

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ

9.8. EJEMPLO: MODELACION DE LA SERIE TASA DE CAMBIO YEN/DOLAR317

9.8.1. Analisis preliminar

La serie del logaritmo no presenta patrones estacionales y parece de ten-dencia estocastica; aun mas, su ACF y PACF exhibidas en la Figura 9.8, nosindica presencia de raız unitaria.

0 5 10 15 20 25 30 35

−0.

50.

00.

51.

0

Lag

AC

F

ACF de log(Yt)

0 5 10 15 20 25 30 35

0.0

0.2

0.4

0.6

0.8

1.0

Lag

Par

tial A

CF

PACF de log(Yt)

0 5 10 15 20 25 30 35

−0.

20.

00.

10.

20.

3

Lag

AC

F

ACF de ∇log(Yt)

0 5 10 15 20 25 30 35

−0.

10.

00.

10.

20.

3

Lag

Par

tial A

CF

PACF de ∇log(Yt)

Figura 9.8: Arriba: ACF y PACF log tasa mensual de cambio yen/US; Abajo: ACF y PACF

primera diferencia del logaritmo

Por otro lado, el analisis de la ACF y PACF para la primera diferencia dellogaritmo de la serie nos revela un proceso estacionario en covarianza, aunquea primera vista no es claro si es un AR o un MA, ası que asumiremos unARMA(p,q) y usaremos la EACF y la identificacion automatica para definir losposibles ordenes p y q.

9.8.2. Identificacion de modelos

Considere la EACF de ∇ log(Yt) que se muestra a continuacion. Siendo es-trictos con la regla del triangulo de ceros, el modelo que se identifica es unARMA(3,2); sin embargo, si se obvia la x en la casilla (2,12), puede consid-erarse tambien un MA(1) o incluso un ARMA(1,1), luego, esto implicarıa que

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


los modelos posibles para la serie log(Yt) serıan ARIMA(3,1,2), ARIMA(0,1,1) yARIMA(1,1,1) (pero este ultimo no es presentado).

EACF ∇ log(Yt)AR/MA 0 1 2 3 4 5 6 7 8 9 10 11 12 13

0 x o o o o o o o o o o o o o1 x o o o o o o o o o o o o o2 x x o o o o o o o o o o x o3 x x o o o o o o o o o o o o4 x x x o o o o o o o o o o o5 x x x x o o o o o o o o o o6 x x x o o o o o o o o o o o7 x x o o o o o o o o o o o o

Por otra parte, tambien se realizo la identificacion automatica usando lasfunciones R autoarmafit() de la librerıa timsac sobre la serie ∇ log(Yt) yauto.arima() de la librerıa forecast sobre la serie log(Yt), en el primer ca-so, segun el AIC y en el segundo caso, segun el BIC. En la Salida R 9.1,vemos parte de los resultados con la funcion autoarmafit() , en la que se ex-hiben los dos mejores modelos; nos interesa solo los ordenes p y q. Luego, losdos mejores modelos identificados para ∇ log(Yt) son ARMA (3,2) y ARMA(2,3);esto implica que para la serie log(Yt) los modelos serıan ARIMA(3,1,2) y ARI-MA(2,1,3).

Salida R 9.1.

Best ARMA modelAR coefficient (order =3) 0.025498 -0.858122 0.278330MA coefficient (order =2) -0.336749 -0.905025

Case No. 1I AR(I) STANDARD DEVIATION1 0.025498 0.0855612 -0.858122 0.0448023 0.278330 0.067767

I MA(I) STANDARD DEVIATION1 -0.336749 0.0616502 -0.905025 0.055826

AIC -1920.565606Innovation variance 0.000649Final gradient 2.720034e-09 1.026303e-08 1.593054e-08 1.191777e-08 -1.788662e-08

Case No. 2I AR(I) STANDARD DEVIATION1 -0.323346 0.0470002 -0.934306 0.044688

I MA(I) STANDARD DEVIATION1 -0.692615 0.0776152 -1.059193 0.0599463 -0.281288 0.067470

AIC -1920.455432Innovation variance 0.000649Final gradient -5.622938e-08 -5.308665e-08 8.198043e-08 -3.253739e-09 2.652625e-09

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


Nota: La funcion autoarmafit() estima modelos ARMA de la forma

Zt =

p∑

j=1

φjZt−j + at −q∑

k=1

θkat−k, at ∼ R.BN(0, σ2a)

En la Salida R 9.2 se observan los resultados de la funcion auto.arima() ;vemos que el mejor modelo para log(Yt) segun el BIC, es un ARIMA(1,1,0).

Salida R 9.2.

Series: lnyARIMA(1,1,0)

Coefficients:ar1

0.3463s.e. 0.0589

sigmaˆ2 estimated as 0.0006871: log likelihood = 584.48AIC = -1164.97 AICc = -1164.92 BIC = -1157.82


-0.002660729 0.026164337 0.019707790 -0.052387889 0.378215878 0.941893880

9.8.3. Ajuste modelos identificados

Se ajustan los siguientes modelos a log(Yt);

Modelo 1: ARIMA(1,1,0)

(1− φ1B)(1−B) log(Yt) = Et, Et ∼ R.BN(0, σ2)


(1− B) log(Yt) = Et + θ1Et−1, Et ∼ R.BN(0, σ2)


(1−φ1B−φ2B2)(1−B) log(Yt) = Et +θ1Et−1 +θ2Et−2 +θ3Et−3, Et ∼ R.BN(0, σ2)


(1− φ1B−φ2B2− φ3B

3)(1−B) log(Yt) = Et + θ1Et−1 + θ2Et−2, Et ∼ R.BN(0, σ2)

Modelos con tendencia determinıstica lineal y errores ARMA(p,q)

log(Yt) = β0 + β1t+ Et, Φp(B)Et = θq(B)at, at ∼ R.BN(0, σ2a)

Este ultimo tipo de modelos se considera desde que un proceso homogeneode orden 1 tambien conduce a que la primera diferencia sea estacionaria. Acontinuacion se presentan los resultados de los modelos 1 a 4. Los modeloscon tendencia determinıstica seran tratados posteriormente.

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


En la siguiente tabla se presentan los resultados del ajuste para los mode-los 1 a 4. valores omitidos en la tabla se deben a que la funcion Arima() produjovalores faltantes en el calculo del error estandar y por tanto no es posibleobtener el estadıstico Z0 y el correspondiente valor P para la prueba de signif-icancia individual de los parametros.

Estimaciones para modelos 1 a 4 con funcion Arima()

Ajuste Modelo 1

Parametros Estimacion s.e Valor Z∗

0 P (|Z| > |Z0|)∗∗φ1 0.3463 0.0589 5.8812 0.0000

Ajuste Modelo 2


0 P (|Z| > |Z0|)∗∗θ1 0.3806 0.0567 6.7150 0.0000

Ajuste Modelo 3


0 P (|Z| > |Z0|)∗∗φ1 -0.0092φ2 0.7379θ1 0.3978θ2 -0.6897 0.1429 -4.8269 0.0000θ3 -0.2394

Ajuste Modelo 4


0 P (|Z| > |Z0|)∗∗φ1 0.1699 0.0592 2.8693 0.0041φ2 -0.9307 0.0110 -84.2780 0.0000φ3 0.3611 0.0588 6.1400 0.0000θ1 0.1973 0.0139 14.1525 0.0000θ2 0.9983


Usando la funcion R forecast() de la librerıa forecast , se obtienen lospronosticos y los intervalos de prediccion del 95 % para log(Yt), para los mesescomprendidos entre 1995.01 a 1996.07; con la funcion accuracy() se obtu-vieron las medidas de precision de pronosticos. En las dos tablas siguientesse exhiben los resultados para los pronosticos de los modelos 1 a 4.

Precision pronosticos modelos 1 a 4, con funcion accuracy()

Modelo 1

ME RMSE MAE MPE MAPE MASE ACF1 Theil’s U

-0.03 0.09 0.07 -0.65 1.53 3.32 0.65 2.47

Modelo 2


-0.03 0.09 0.07 -0.60 1.54 3.33 0.65 2.45

Modelo 3


-0.02 0.09 0.07 -0.58 1.54 3.33 0.65 2.45

Modelo 4


-0.03 0.09 0.07 -0.70 1.55 3.35 0.65 2.49

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


Pronosticos modelos 1 a 4, con funcion forecast()

Modelo 1 Modelo 2

Mes Point Forecast Lo 95 Hi 95 Point Forecast Lo 95 Hi 95

Jan 1995 4.6144 4.5631 4.6658 4.6159 4.5648 4.6669Feb 1995 4.6170 4.5309 4.7032 4.6159 4.5289 4.7029Mar 1995 4.6179 4.5035 4.7324 4.6159 4.5039 4.7278Apr 1995 4.6182 4.4800 4.7564 4.6159 4.4836 4.7482May 1995 4.6184 4.4596 4.7771 4.6159 4.4660 4.7658Jun 1995 4.6184 4.4413 4.7955 4.6159 4.4502 4.7815Jul 1995 4.6184 4.4247 4.8122 4.6159 4.4359 4.7959Aug 1995 4.6184 4.4093 4.8275 4.6159 4.4226 4.8092Sep 1995 4.6184 4.3950 4.8418 4.6159 4.4101 4.8216Oct 1995 4.6184 4.3816 4.8552 4.6159 4.3984 4.8334Nov 1995 4.6184 4.3689 4.8679 4.6159 4.3873 4.8445Dec 1995 4.6184 4.3568 4.8800 4.6159 4.3767 4.8551Jan 1996 4.6184 4.3453 4.8915 4.6159 4.3665 4.8653Feb 1996 4.6184 4.3342 4.9026 4.6159 4.3567 4.8750Mar 1996 4.6184 4.3235 4.9133 4.6159 4.3473 4.8844Apr 1996 4.6184 4.3132 4.9236 4.6159 4.3382 4.8935May 1996 4.6184 4.3033 4.9335 4.6159 4.3294 4.9023Jun 1996 4.6184 4.2936 4.9432 4.6159 4.3209 4.9109Jul 1996 4.6184 4.2843 4.9526 4.6159 4.3126 4.9192

Modelo 3 Modelo 4



En la Figura 9.9 se muestra la serie de log(Yt) y sus pronosticos junto conlos lımites de prediccion representados por la zona coloreada, para los modelos1 a 4. Considerando los resultados graficos y los numericos, podemos decirque los primeros cuatro modelos alcanzan la misma calidad de pronostico, enla escala logarıtmica.ESTADÍS

TICA III

- 300

9137

NELFI G

ONZÁLEZ


Log tasa yen/$USPronósticos modelo 1

1975 1980 1985 1990 1995

4.4

4.6

4.8

5.0

5.2

5.4

5.6

Realizaciónpronosticado zona amarilla


1975 1980 1985 1990 1995

4.4

4.6

4.8

5.0

5.2

5.4

5.6



1975 1980 1985 1990 1995

4.5

5.0

5.5



1975 1980 1985 1990 1995

4.4

4.6

4.8

5.0

5.2

5.4

5.6


Figura 9.9: Serie log tasa yen/Us y pronosticos modelos 1 a 4

Para el analisis de los residuales de los modelos 1 a 4 considere los sigu-ientes resultados. En cada caso ¿podemos decir que los errores satisfacen elsupuesto de ruido blanco normal? ¿por que?ESTADÍS

TICA III

- 300

9137

NELFI G

ONZÁLEZ


Residuos ARIMA(1,1,0) para log(Yt)

Time

resi

dual

s(m

od1)

1975 1980 1985 1990 1995

−0.

10−

0.05

0.00

0.05

4.6 4.8 5.0 5.2 5.4 5.6

−0.

10−

0.05

0.00

0.05


fitted(mod1)

resi

dual

s(m

od1)

0 5 10 15 20 25 30 35

−0.

15−

0.05

0.05

0.15

Lag

AC

F

ACF residuos ARIMA(1,1,0) para log(Yt)

0 5 10 15 20 25 30 35

−0.

100.

000.

10

Lag

Par

tial A

CF

PACF residuos ARIMA(1,1,0) para log(Yt)


Time

resi

dual

s(m

od2)

1975 1980 1985 1990 1995

−0.

10−

0.05

0.00

0.05

4.6 4.8 5.0 5.2 5.4 5.6

−0.

10−

0.05

0.00

0.05


fitted(mod2)

resi

dual

s(m

od2)

0 5 10 15 20 25 30 35

−0.

15−

0.05

0.05

Lag

AC

F


0 5 10 15 20 25 30 35

−0.

100.

000.

10

Lag

Par

tial A

CF


Figura 9.10: Graficas para analisis de residuales, modelos 1 y 2

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ



Time

resi

dual

s(m

od3)

1975 1980 1985 1990 1995

−0.

10−

0.05

0.00

0.05

4.6 4.8 5.0 5.2 5.4 5.6

−0.

10−

0.05

0.00

0.05


fitted(mod3)

resi

dual

s(m

od3)

0 5 10 15 20 25 30 35

−0.

15−

0.05

0.05

Lag

AC

F


0 5 10 15 20 25 30 35

−0.

100.

000.

10

Lag

Par

tial A

CF



Time

resi

dual

s(m

od4)

1975 1980 1985 1990 1995

−0.

050.

000.

05

4.6 4.8 5.0 5.2 5.4 5.6

−0.

050.

000.

05


fitted(mod4)

resi

dual

s(m

od4)

0 5 10 15 20 25 30 35

−0.

100.

000.

10

Lag

AC

F


0 5 10 15 20 25 30 35

−0.

100.

000.

10

Lag

Par

tial A

CF


Figura 9.11: Graficas para analisis de residuales, modelos 3 y 4

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


EACF’s residuales modelos 1 a 4

Modelo 1

AR/MA 0 1 2 3 4 5 6 7 8 9 10 11 12 13

0 o x o o o o o o o o o o o o1 o o o o o o o o o o o o o o2 x x o o o o o o o o o o o o3 x x x o o o o o o o o o o o4 x x x x o o o o o o o o o o5 x x x o x o o o o o o o o o6 o x x x o o o o o o o o o o7 x x x o o o o o o o o o o o

Modelo 2

AR/MA 0 1 2 3 4 5 6 7 8 9 10 11 12 13

0 o o o o o o o o o o o o o o1 x o o o o o o o o o o o o o2 o x o o o o o o o o o o o o3 x x x o o o o o o o o o o o4 x x x x o o o o o o o o o o5 x x x o o o o o o o o o o o6 x x x o o o o o o o o o o o7 x x x o o o x o o o o o o o

Modelo 3

AR/MA 0 1 2 3 4 5 6 7 8 9 10 11 12 13

0 o o o o o o o o o o o o o o1 x o o o o o o o o o o o o o2 x x o o o o o o o o o o o o3 o x x o o o o o o o o o o o4 o x x o o o o o o o o o o o5 o x o x x o o o o o o o o o6 x x o x x o o o o o o o o o7 x x o o x x o o o o o o o o

Modelo 4

AR/MA 0 1 2 3 4 5 6 7 8 9 10 11 12 13

0 o o o o o o o o o o o o o o1 o o o o o o o o o o o o o o2 x x o o o o o o o o o o o o3 x o x o o o o o o o o o o o4 x x x x o o o o o o o o o o5 x x x o x o o o o o o o o o6 x x x o o o o o o o o o o o7 o x x o o o o o o o o o o o

Test Ljung-Box, modelos 1 a 4

Modelo 1 Modelo 2

m QLB g.l P (χ2m > QLB) QLB g.l P (χ2

m > QLB)6 10.14 6.00 0.12 4.04 6.00 0.67

12 16.55 12.00 0.17 9.09 12.00 0.6918 29.96 18.00 0.04 21.07 18.00 0.2824 38.91 24.00 0.03 27.97 24.00 0.2630 43.80 30.00 0.05 31.11 30.00 0.4136 50.40 36.00 0.06 36.14 36.00 0.46

Modelo 3 Modelo 4


m > QLB)6 4.32 6.00 0.63 2.71 6.00 0.84

12 9.43 12.00 0.67 6.50 12.00 0.8918 21.95 18.00 0.23 12.54 18.00 0.8224 29.41 24.00 0.21 15.06 24.00 0.9230 33.05 30.00 0.32 17.53 30.00 0.9736 38.58 36.00 0.35 19.67 36.00 0.99

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


Test Shapiro Wilk, modelos 1 a 4

Modelo 1 Modelo 2 Modelo 3 Modelo 4

Estadıstico W0 0.980998 0.979536 0.980136 0.980302Valor P 0.001357445 0.000758748 0.000961386 0.001027001

A continuacion, se presentaran los resultados relativos a la identificacion,ajuste y pronosticos para modelos con tendencia determinıstica lineal y er-rores ARMA. Primero es necesario ajustar el modelo

Modelo 5a: log(Yt) = β0 + β1t+ Et, Et ∼ R.BN(0, σ2),

y a partir del analisis de los residuales de este modelo, se identificara el modeloARMA para los errores estructurales Et. Veamos.

Ajuste modelo tendencia lineal y Et ∼ R.BN(0, σ2)Parametros Estimacion s.e T0 P (|t262| > |T0|)

β0 5.8011 0.0170 342.09 0.0000β1 -0.0041 0.0001 -37.01 0.0000

0 50 100 150 200 250

−0.

3−

0.1

0.1

0.3

Residuos modelo 5a para log(Yt)

t

resi

dual

s(m

od5a

)

4.8 5.0 5.2 5.4 5.6 5.8

−0.

3−

0.1

0.1

0.3

Residuos modelo 5a para log(Yt)

fitted(mod5a)

resi

dual

s(m

od5a

)

0 5 10 15 20 25 30 35

−0.

50.

00.

51.

0

Lag

AC

F

ACF residuos modelo 5a para log(Yt)

0 5 10 15 20 25 30 35

−0.

40.

00.

40.

8

Lag

Par

tial A

CF

PACF residuos modelo 5a para log(Yt)

Figura 9.12: Graficos residuales modelo tendencia lineal y Et ∼ R.BN(0, σ2)

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


EACF residuales Ajuste Modelo tendencia lineal y Et ∼ R.BN(0, σ2)AR/MA 0 1 2 3 4 5 6 7 8 9 10 11 12 13

0 x x x x x x x x x x x x x x1 x o o x o o o o o o x x o o2 x x o o o o o o o o o x o o3 x x o o o o o o o o o o x o4 x x o o o o o o o o o o o o5 o x o x o o o o o o o o o o6 o x o x o o o o o o o o o o7 x x x x x o o o o o o o o o

De la ACF y PACF en la Figura 9.12 se identifica un AR(2) para los erroresestructurales del modelo de tendencia lineal. Por otro lado, de la EACF, siignoramos la x en la casilla (3,12), parece que el modelo apropiado para Et

es una ARMA(3,2), aunque aplicando en forma estricta la regla del triangulo,el modelo serıa un ARMA(4,3) pero este ultimo no sera considerado. Observeademas que el decaimiento en la ACF no es rapido, ¿sera que estos residuosno provienen de un proceso estacionario?. De todas formas, se definen lossiguientes dos modelos

Modelo 5b: Tendencia lineal y errores AR(2),

log(Yt) = β0 + β1t+ Et, con Et = φ1Et−1 + φ2Et−2 + at, at ∼ R.BN(0, σ2a)

Modelo 5c: Tendencia lineal y errores ARMA(3,2),

log(Yt) = β0 + β1t+ Et, con

Et = φ1Et−1 + φ2Et−2 + φ3Et−3 + at + θ1at−1 + θ2at−2, at ∼ R.BN(0, σ2a)

Estimaciones para modelos 5b y 5c con funcion Arima()

Ajuste Modelo 5b

Parametro Estimacion s.e Z∗

0 P (|Z| > |Z0|)∗∗φ1 1.3172 0.0586 22.4760 0.0000φ2 -0.3462 0.0589 -5.8831 0.0000β0 5.8026 0.0913 63.5832 0.0000β1 -0.0042 0.0006 -7.2713 0.0000

Ajuste Modelo 5c

Parametro Estimacion s.e Z∗

0 P (|Z| > |Z0|)∗∗φ1 0.2777 1.2965 0.2142 0.8304φ2 0.7285 1.1913 0.6115 0.5409φ3 -0.0673 0.1741 -0.3863 0.6993θ1 1.0766 1.2970 0.8301 0.4065θ2 0.2245 0.5629 0.3987 0.6901β0 5.7961 0.0961 60.3095 0.0000β1 -0.0042 0.0006 -6.9445 0.0000


Para el modelo 5b, las raıces del polinomio autorregresivo ajustado, 1−1.3172B+0.3462B2, son 1.047674 y 2.757063, es decir, casi tiene una raız unitaria!!!.Para el modelo 5c las raıces del polinomio autorregresivo ajustado, 1−0.2777B−

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


0.7285B2 + 0.0673B3, son 1.039333, -1.290755 y 11.076088, en este caso tam-bien vemos una raız casi unitaria; observe tambien que aparentemente ningunode los coeficientes del modelo ARMA(3,2) son significativos. Lo anterior implicaque modelos asumiendo oscilaciones estacionarias alrededor de una tenden-cia lineal posiblemente no sean adecuados y que serıa mejor tener en cuentamodelos que consideren la existencia de raız unitaria en la serie log(Yt).

Los pronosticos de los modelos 5b y 5c son presentados en la Figura 9.13y en la tabla siguiente.

Log tasa yen/$USPronósticos modelo 5b

1975 1980 1985 1990 1995

4.4

4.6

4.8

5.0

5.2

5.4

5.6


Log tasa yen/$USPronósticos modelo 5c

1975 1980 1985 1990 1995

4.4

4.6

4.8

5.0

5.2

5.4

5.6


Figura 9.13: Serie log tasa yen/Us y pronosticos modelos 5b y 5c

Pronosticos modelos 5b y 5c, con funcion forecast()

Modelo 5b Modelo 5c



ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


Precision pronosticos modelos 5b y 5c, con funcion accuracy()

Modelo 5b


-0.01 0.10 0.08 -0.36 1.73 3.76 0.68 2.59

Modelo 5c


-0.01 0.10 0.08 -0.25 1.78 3.87 0.68 2.60

Para el analisis de los residuales de los modelos 5b y 5c tenga en cuentalos siguientes resultados graficos y numericos ¿Que puede decirse sobre loserrores de ajuste at de estos dos modelos? ¿cumplen supuestos?

EACF’s residuales modelos 5b y 5c

Modelo 5b

AR/MA 0 1 2 3 4 5 6 7 8 9 10 11 12 13

0 o o o o o o o o o o o o o o1 x o o o o o o o o o o o o o2 x x o o o o o o o o o o o o3 x x x o o o o o o o o o o o4 x x x x o o o o o o o o o o5 x x o x x o o o o o o o o o6 x x x x o o o o o o o o o o7 x x o x o x o o o o o o o o

Modelo 5c

AR/MA 0 1 2 3 4 5 6 7 8 9 10 11 12 13

0 o o o o o o o o o o o o o o1 o o o o o o o o o o o o o o2 o o o o o o o o o o o o o o3 x x x o o o o o o o o o o o4 x x x x o o o o o o o o o o5 x x o x x o o o o o o o o o6 o x o x o o o o o o o o o o7 o x o x o o x o o o o o o o

Test Ljung-Box, modelos 5b y 5c

Modelo 5b Modelo 5c


m > QLB)6 9.49 6.00 0.15 4.65 6.00 0.59

12 17.08 12.00 0.15 10.78 12.00 0.5518 28.42 18.00 0.06 21.11 18.00 0.2724 37.03 24.00 0.04 27.96 24.00 0.2630 41.39 30.00 0.08 30.92 30.00 0.4236 47.88 36.00 0.09 36.13 36.00 0.46

Test Shapiro Wilk, modelos 5b y 5c

Modelo 5b Modelo 5c

Estadıstico W0 0.981524 0.979888Valor P 0.001679138 0.000871606

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


Residuos modelo 5b para log(Yt)

Time

resi

dual

s(m

od5b

)

1975 1980 1985 1990 1995

−0.

050.

000.

05

4.6 4.8 5.0 5.2 5.4 5.6

−0.

050.

000.

05

Residuos modelo 5b para log(Yt)

fitted(mod5b)

resi

dual

s(m

od5b

)

0 5 10 15 20 25 30 35

−0.

15−

0.05

0.05

0.15

Lag

AC

F

ACF residuos modelo 5b para log(Yt)

0 5 10 15 20 25 30 35

−0.

100.

000.

10

Lag

Par

tial A

CF

PACF residuos modelo 5b para log(Yt)

Residuos modelo 5c para log(Yt)

Time

resi

dual

s(m

od5c

)

1975 1980 1985 1990 1995

−0.

050.

000.

05

4.6 4.8 5.0 5.2 5.4 5.6

−0.

050.

000.

05

Residuos modelo 5c para log(Yt)

fitted(mod5c)

resi

dual

s(m

od5c

)

0 5 10 15 20 25 30 35

−0.

15−

0.05

0.05

Lag

AC

F

ACF residuos modelo 5c para log(Yt)

0 5 10 15 20 25 30 35

−0.

100.

000.

10

Lag

Par

tial A

CF

PACF residuos modelo 5c para log(Yt)

Figura 9.14: Graficas para analisis de residuales, modelos 5b y 5c

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


9.8.4. Pruebas de raız unitaria

A continuacion se exhibe parte de los resultados de los testes DF para laserie log(Yt).

Salida R 9.3 (DF casos 1, 2 y 3).

summary(df.mediacero)

################################################ Augmented Dickey-Fuller Test Unit Root Test ################################################Test regression none

Call:lm(formula = z.diff ˜ z.lag.1 - 1)

Value of test-statistic is: -2.4525

Critical values for test statistics:1pct 5pct 10pct

tau1 -2.58 -1.95 -1.62

summary(df.drift)

################################################ Augmented Dickey-Fuller Test Unit Root Test ################################################Test regression drift

Call:lm(formula = z.diff ˜ z.lag.1 + 1)

Value of test-statistic is: 0.0616 3.0207


tau2 -3.44 -2.87 -2.57phi1 6.47 4.61 3.79

summary(df.tend)

################################################ Augmented Dickey-Fuller Test Unit Root Test ################################################Test regression trend

Call:lm(formula = z.diff ˜ z.lag.1 + 1 + tt)

Value of test-statistic is: -1.5916 3.07 1.5618


tau3 -3.98 -3.42 -3.13phi2 6.15 4.71 4.05phi3 8.34 6.30 5.36

En la Salida R 9.3 se muestran parte de los resultados R obtenidos conla funcion ur.df() de la librerıa urca , para los tres testes Dickey-Fuller, quetambien resumimos a continuacion, para α = 0.05.

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


Resultados Testes DF para log(Yt)Caso 1 Caso 2 Caso 3

τ τ0.05 τµ τµ,0.05 ττ ττ,0.05

-2.4525 -1.95 0.0616 -2.87 -1.5916 -3.42

De acuerdo a lo anterior, a un nivel de significancia del 5 %, en el test DFcasos 2 y 3 no se rechaza la hipotesis nula de raız unitaria; en el caso 1 hayrechazo al 5 %, aunque al 1 % no hay rechazo. Estos resultados apoyan lanecesidad de diferenciar la serie del logaritmo de la tasa de cambio yen/US.

Pero ¿cual de estas tres pruebas es la mas apropiada? Para resolver estacuestion se puede recurrir al ajuste de los modelos implicados por las ecua-ciones de regresion asociadas a estas pruebas, es decir, dadas por las ecua-ciones (9.46), (9.50) y (9.53) y su comparacion mediante el AIC. Para el ajustese puede usar la funcion R dynlm() de la librerıa dynlm . Dentro de esta fun-cion ∇Zt se representa por d(Zt) , Zt−k por L(Zt,k) y ∇Zt−j por L(d(Zt),j) obien por L(difZt,j) donde difZt ha sido definido previamente como la difer-encia de orden 1 de Zt . Si ademas se necesita incluir una tendencia lineal esdecir, a β0 + β1t, esta se especifica como trend(Zt,scale=F) , donde Zt es unobjeto R definido como la serie de tiempo de interes. Por ejemplo, para correrel modelo en (9.53) para log(Yt), escribimos

dynlm(d(lny)˜L(lny,1)+trend(lny,scale=F))

donde lny es definido previamente en la programacion como el logaritmo dela serie. Si se quiere correr un modelo sin intercepto, como en el caso de laecuacion (9.46), escribimos

dynlm(d(lny)˜L(lny,1)-1)

donde el -1 indica que no se incluye el intercepto en la regresion.Los modelos como los anteriores, donde las variables explicatorias son vari-

ables endogenas, son conocidos como modelos dinamicos.Los AIC de los tres modelos correspondientes a los casos 1 a 3 de la prueba

DF se muestran en la siguiente tabla. Observe que no hay mucha diferenciaentre los tres casos, sin embargo el de menor AIC es para el caso 1, estoindicarıa que serıa mejor usar el test DF sin deriva.

AIC’s modelos DF sobre log(Yt)Caso 1 caso 2 Caso 3

-1138.50 -1136.55 -1137.69

Considere el test ADF. Recuerde que en este test se asume un modelo AR(p)donde p debe ser determinado, ası como el caso ADF mas apropiado. Paraesto, la funcion ur.df() cuenta con los argumentos lags y selectlags conlos cuales es posible especificar, respectivamente, un valor maximo para p y

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


un criterio de seleccion, en cada uno de los casos del test ADF. Se ha definidoel valor maximo de p igual a [n0.25] + 1 = [2640.25] + 1 = 5. Recuerde que en elejemplo se ajusta con las primeras 264 observaciones de la serie. Utilizandoen cada caso del test ADF los criterios de seleccion de modelos AIC y BIC, seobtuvieron los siguientes resultados:

Salida R 9.4 (ADF caso 1).

summary(ADF.drift0AIC)################################################ Augmented Dickey-Fuller Test Unit Root Test ################################################Test regression none

Call:lm(formula = z.diff ˜ z.lag.1 - 1 + z.diff.lag)


-0.091680 -0.014278 0.001978 0.016301 0.070659


z.lag.1 -0.0004754 0.0003093 -1.537 0.1256z.diff.lag1 0.3603906 0.0624916 5.767 2.34e-08 ***z.diff.lag2 -0.1292056 0.0659723 -1.958 0.0513 .z.diff.lag3 0.1024456 0.0624253 1.641 0.1020---



tau1 -2.58 -1.95 -1.62

summary(ADF.drift0BIC)################################################ Augmented Dickey-Fuller Test Unit Root Test ################################################Test regression none

Call:lm(formula = z.diff ˜ z.lag.1 - 1 + z.diff.lag)


-0.093027 -0.014829 0.002271 0.015562 0.070540


z.lag.1 -0.0004830 0.0003082 -1.567 0.118z.diff.lag 0.3209434 0.0592524 5.417 1.4e-07 ***---



tau1 -2.58 -1.95 -1.62

Segun estos resultados, los mejores modelos para el test ADF caso 1 sonp = 4 (segun AIC) y p = 2 (segun BIC).

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ



summary(ADF.driftAIC)################################################ Augmented Dickey-Fuller Test Unit Root Test ################################################Test regression drift

Call:lm(formula = z.diff ˜ z.lag.1 + 1 + z.diff.lag)


-0.091549 -0.014369 0.001935 0.016303 0.070747


(Intercept) 0.002829 0.025372 0.111 0.9113z.lag.1 -0.001010 0.004808 -0.210 0.8337z.diff.lag1 0.361020 0.062868 5.743 2.67e-08 ***z.diff.lag2 -0.128689 0.066263 -1.942 0.0532 .z.diff.lag3 0.103275 0.062988 1.640 0.1023---

Value of test-statistic is: -0.2101 1.1827


tau2 -3.44 -2.87 -2.57phi1 6.47 4.61 3.79

summary(ADF.driftBIC)################################################ Augmented Dickey-Fuller Test Unit Root Test ################################################Test regression drift

Call:lm(formula = z.diff ˜ z.lag.1 + 1 + z.diff.lag)


-0.092946 -0.014875 0.002287 0.015635 0.070638


(Intercept) 0.0022346 0.0251709 0.089 0.929z.lag.1 -0.0009062 0.0047770 -0.190 0.850z.diff.lag 0.3215859 0.0598071 5.377 1.71e-07 ***---

Value of test-statistic is: -0.1897 1.2268


tau2 -3.44 -2.87 -2.57phi1 6.47 4.61 3.79

De acuerdo a estos resultados los mejores modelos para el test ADF caso 2son p = 4 (segun AIC) y p = 2 (segun BIC).

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ



summary(ADF.tendAIC)################################################ Augmented Dickey-Fuller Test Unit Root Test ################################################Test regression trend

Call:lm(formula = z.diff ˜ z.lag.1 + 1 + tt + z.diff.lag)


-0.090184 -0.013679 0.001223 0.016159 0.073434


(Intercept) 1.723e-01 6.916e-02 2.491 0.01338 *z.lag.1 -2.964e-02 1.188e-02 -2.495 0.01324 *tt -1.409e-04 5.359e-05 -2.629 0.00908 **z.diff.lag1 3.643e-01 6.216e-02 5.861 1.44e-08 ***z.diff.lag2 -1.174e-01 6.564e-02 -1.789 0.07485 .z.diff.lag3 1.155e-01 6.244e-02 1.850 0.06545 .---



tau3 -3.98 -3.42 -3.13phi2 6.15 4.71 4.05phi3 8.34 6.30 5.36

summary(ADF.tendBIC)################################################ Augmented Dickey-Fuller Test Unit Root Test ################################################Test regression trend

Call:lm(formula = z.diff ˜ z.lag.1 + 1 + tt + z.diff.lag)


-0.088827 -0.012777 0.001856 0.017450 0.073870


(Intercept) 1.692e-01 6.855e-02 2.468 0.0143 *z.lag.1 -2.910e-02 1.178e-02 -2.471 0.0141 *tt -1.399e-04 5.352e-05 -2.613 0.0095 **z.diff.lag 3.283e-01 5.919e-02 5.547 7.3e-08 ***---



tau3 -3.98 -3.42 -3.13phi2 6.15 4.71 4.05phi3 8.34 6.30 5.36

Estos resultados indican que los mejores modelos para el test ADF caso 3 sonp = 4 (segun AIC) y p = 2 (segun BIC).

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


Un resumen de los resultados de los seis testes ADF se exhibe en la sigu-iente tabla,

Resultados Testes ADF para log(Yt)Caso 1 Caso 2 Caso 3

Criterio τ τ0.05 τµ τµ,0.05 ττ ττ,0.05

AIC -1.5369 -1.95 -0.2101 -2.87 -2.4948 -3.42BIC -1.5669 -1.95 -0.1897 -2.87 -2.4710 -3.42

De acuerdo a estos resultados, en todos los casos no se rechaza la hipotesisde raız unitaria para el logaritmo de la tasa de cambio yen/US.

Ajustamos todos los seis modelos ADF anteriores usando la funcion dynlm()y luego calculamos los AIC, que se muestran a continuacion

AIC mejores modelos teste ADF para log(Yt)Caso 1 Caso 2 Caso 3

Segun AIC Segun BIC Segun AIC Segun BIC Segun AIC Segun BIC

AIC -1162.26 -1169.31 -1160.27 -1167.32 -1165.31 -1172.06

De esta tabla vemos que el mejor modelo para la prueba ADF es el obtenidocomo mejor modelo segun BIC en el caso 3, es decir,

∇ log(Yt) = β0 + β1t+ φ∗1 log(Yt−1) + φ∗

2∇ log(Yt−1) + Et, Et ∼ R.BN(0, σ2)

donde φ∗1 = φ1 + φ2 − 1, y φ∗

2 = −φ2, es decir que log(Yt) ∼ AR(2) con tendencialineal.

Ahora bien, comparando los modelos asociados a los test DF y ADF, segunAIC, de nuevo el mejor modelo es log(Yt) ∼ AR(2) con tendencia lineal, estoindica que debemos usar este modelo para probar la existencia de raız unitariaen la serie de logaritmo de la tasa de cambio yen/US.

9.8.5. Seleccion del mejor modelo para el ajuste y pronostico del logar-itmo de la tasa de cambio yen/dolar

Considere todos los resultados numericos y graficos relativos al ajuste co-mo a los pronosticos presentados previamente para el logaritmo de la serie,ademas de la siguiente tabla que muestra los AIC de los modelos 1 a 4 y 5b,5c (en escala logarıtmica), y determine

¿cual modelo ajusta mejor al conjunto de datos 1973.01 a 1994.12?

¿Cual modelo pronostica mejor los datos 1995.01 a 1996.07?

¿Cual modelo recomendarıa? Escriba sus ecuaciones ajustada y de pronosti-co.

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


AIC’s de los seis modelos ajustados

Modelo 1 Modelo 2 Modelo 3 Modelo 4 Modelo 5b Modelo 5c

-1164.97 -1168.34 -1161.63 -1172.77 -1169.45 -1166.50

9.8.6. Codigo R usado

A continuacion se exhibe el codigo R usado en la obtencion de resultadosgraficos y numericos presentados en este ejemplo. Tenga en cuenta que losmodelos dinamicos ajustados con la funcion dynlm() fueron aquellos que lafuncion ur.df() arrojo en los testes DF y ADF, por ello, se debe primero correrlos testes de raız unitaria con esta ultima funcion y ver con un summary() losrespectivos modelos asociados antes de ajustarlos con la funcion dynlm() ,esto con el fin de obtener luego los AIC’s respectivos para determinar cual testde raız unitaria deberıa aplicarse a la serie.

Codigo R 9.3.

library(urca)library(forecast)library(TSA)library(timsac)library(dynlm)

#Funcion usuario para obtener resultados Ljung-Box#como se presentan en estas notas de clase

BP.LB.test=function(serie,maxlag,type="Box"){aux=floor(maxlag/6);X.squared=c(rep(NA,aux))df=c(rep(NA,aux))p.value=c(rep(NA,aux))for(i in 1:aux){test=Box.test(serie,lag=(6 * i),type=type)X.squared[i]=test[[1]]df[i]=test[[2]]p.value[i]=test[[3]]}lag=6 * c(1:aux)teste=as.data.frame(cbind(X.squared,df,p.value))rownames(teste)=lagteste}

###################################################################################Lectura de los datos y analisis preliminar################################################################################datos=read.table(file.choose(),header=F) #Leer EXCHYENDOLAR.txtdatos=ts(datos,freq=12,start=c(1973,1))

#definicion del tamano de la muestra a usar para ajuste#variable de tiempo en el ajuste y en pronostico con modelos linealesn=length(datos)-19t=1:ntnuevo=(n+1):length(datos)pmax=floor(nˆ0.25)+1 #define numero maximo de p en testes ADF

#definiendo el log de los datos a ajustar y su primera diferencialny=ts(log(datos[1:n]),freq=12,start=c(1973,1))

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


dif1lny=diff(lny)

#Graficas de la serie, su diferencia y de log y su diferencianf=layout(rbind(c(1,2),c(3,4)))plot(datos,ylab=expression(Y[t]))plot(diff(datos),ylab=expression(paste(nabla,sep="",Y[t])))abline(h=0)plot(lny,ylab=expression(log(Y[t])))plot(dif1lny,ylab=expression(paste(nabla,sep="",log(Y[t]))))abline(h=0)

#Graficas de ACF’s y PAC’s del log y de su diferencianf=layout(rbind(c(1,2),c(3,4)))acf(as.numeric(lny),lag.max=36,ci.type="ma",ci.col="red",main=expression(paste("ACF",sep=" ","de",sep=" ",log(Y[t]))))pacf(as.numeric(lny),lag.max=36,ci.col="red",main=expression(paste("PACF",sep=" ","de",sep=" ",log(Y[t]))))acf(as.numeric(dif1lny),lag.max=36,ci.type="ma",ci.col="red",main=expression(paste("ACF",sep=" ","de",sep=" ",nabla,sep="",log(Y[t]))))pacf(as.numeric(dif1lny),lag.max=36,ci.col="red",main=expression(paste("PACF",sep=" ","de",sep=" ",nabla,sep="",log(Y[t]))))

##################################################################################Identificacion de modelos################################################################################Identificacion modelos ARMA para la primera diferencia del log de la serieeacf(dif1lny)

identif1=autoarmafit(dif1lny)identif1

#Identificacion modelo ARIMA para log de la serie usando criterio BICidentif2=auto.arima(lny,ic="bic")summary(identif2)

##################################################################################Realizando pruebas de ra´ız unitaria para log de la serie################################################################################Test de ra´ız unitaria DF con media cerodf.mediacero=ur.df(lny,lags=0,type=’none’)summary(df.mediacero)

#Ajuste modelo DF con media ceroreg.DFdrift0=dynlm(d(lny)˜L(lny,1)-1)

#Test ra´ız unitaria DF con driftdf.drift=ur.df(lny,lags=0,type=’drift’)summary(df.drift)

#Ajuste modelo DF con driftreg.DFdrift=dynlm(d(lny)˜L(lny,1))

#Test ra´ız unitaria DF con tendenciadf.tend=ur.df(lny,lags=0,type=’trend’)summary(df.tend)

#Ajuste modelo DF con tendenciareg.DFtend=dynlm(d(lny)˜L(lny,1)+trend(lny,scale=F))

#AIC’s mejores modelos DFcbind(AICDrift0=AIC(reg.DFdrift0),AICDrift=AIC(reg.DFdrift),AICtend=AIC(reg.DFtend))

#Test ra´ız unitaria ADF media cero, con seleccion de p segun AICADF.drift0AIC=ur.df(lny,lags=pmax,type=’none’,selectlags =’AIC’)summary(ADF.drift0AIC)

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


#El modelo que se ajusta es el arrojado por ADF.drift0AICreg.ADFdrift0aic=dynlm(d(lny)˜L(lny,1)+L(dif1lny,1)+L(dif1lny,2)+L(dif1lny,3)-1)

#Test ra´ız unitaria ADF media cero, con seleccion de p segun BICADF.drift0BIC=ur.df(lny,lags=pmax,type=’none’,selectlags =’BIC’)summary(ADF.drift0BIC)

#El modelo que se ajusta es el arrojado por ADF.drift0BICreg.ADFdrift0bic=dynlm(d(lny)˜L(lny,1)+L(dif1lny,1)-1)

#Test ra´ız unitaria ADF con drift, con seleccion de p segun AICADF.driftAIC=ur.df(lny,lags=pmax,type=’drift’,selectlags =’AIC’)summary(ADF.driftAIC)

#El modelo que se ajusta es el arrojado por ADF.driftAICreg.ADFdriftaic=dynlm(d(lny)˜L(lny,1)+L(dif1lny,1)+L(dif1lny,2)+L(dif1lny,3))

#Test ra´ız unitaria ADF con drift, con seleccion de p segun BICADF.driftBIC=ur.df(lny,lags=pmax,type=’drift’,selectlags =’BIC’)summary(ADF.driftBIC)

#El modelo que se ajusta es el arrojado por ADF.driftBICreg.ADFdriftbic=dynlm(d(lny)˜L(lny,1)+L(dif1lny,1))

#Test ra´ız unitaria ADF con tendencia, con seleccion de p segun AICADF.tendAIC=ur.df(lny,lags=pmax,type=’trend’,selectlags =’AIC’)summary(ADF.tendAIC)

#El modelo que se ajusta es el arrojado por ADF.tendAICreg.ADFtendaic=dynlm(d(lny)˜L(lny,1)+trend(lny,scale=F)+L(dif1lny,1)+L(dif1lny,2)+L(dif1lny,3))

#Test ra´ız unitaria ADF con tendencia, con seleccion de p segun BICADF.tendBIC=ur.df(lny,lags=pmax,type=’trend’,selectlags =’BIC’)summary(ADF.tendBIC)

#El modelo que se ajusta es el arrojado por ADF.tendBICreg.ADFtendbic=dynlm(d(lny)˜L(lny,1)+trend(lny,scale=F)+L(dif1lny,1))

#AIC’s mejores modelos ADFcbind(AICDrift0a=AIC(reg.ADFdrift0aic),AICDrift0b=AIC(reg.ADFdrift0bic),AICDrifta=AIC(reg.ADFdriftaic),AICDriftb=AIC(reg.ADFdriftbic),AICtenda=AIC(reg.ADFtendaic),AICtendb=AIC(reg.ADFtendbic))

##################################################################################Ajustes modelos ARIMA identificados para log de la serie################################################################################Modelo 1: ARIMA(1,1,0)mod1=Arima(lny,order=c(1,1,0))summary(mod1)

#Calculando valores de estad´ısticos Z0 y sus valores P en modelo 1est=cbind(Estimacion=mod1$coef,s.e=sqrt(diag(mod1$var.coef)))z0=est[,1]/est[,2]vp=pnorm(abs(z0),lower.tail=FALSE)+pnorm(-abs(z0))

#predicciones en escala log modelo 1predmod1=forecast(mod1,h=(length(datos)-n),level=95)predmod1

#Graficando la serie de logaritmos y predicciones modelo 1plot(predmod1,main="Log tasa yen/$US\nPronosticos modelo 1")lines(time(datos)[(n+1):length(datos)],log(datos)[(n+1):length(datos)],type=’l’,col=2,lwd=2)legend("topright",legend=c("Realizacion","pronosticado zona amarilla"),lwd=c(2,2),col=c(2,1))

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


#Calculando precision de pronosticos en escala log modelo 1accuracy(predmod1,log(datos)[(n+1):length(datos)])

#Analisis residuales del modelo 1nf=layout(rbind(c(1,2),c(3,4)))plot(residuals(mod1),main=expression(paste("Residuos ARIMA(1,1,0) para ",sep=" ",log(Y[t]))))abline(h=0,lty=2)plot(fitted(mod1),residuals(mod1),main=expression(paste("Residuos ARIMA(1,1,0) para ",sep=" ",log(Y[t]))))abline(h=0,lty=2)acf(as.numeric(residuals(mod1)),lag.max=36,ci.type="ma",ci.col="red",main=expression(paste("ACF residuos ARIMA(1,1,0) para",sep=" ",log(Y[t]))))pacf(as.numeric(residuals(mod1)),lag.max=36,ci.col="red",main=expression(paste("PACF residuos ARIMA(1,1,0) para",sep=" ",log(Y[t]))))

eacf(residuals(mod1))BP.LB.test(residuals(mod1),maxlag=36,type="Ljung")shapiro.test(residuals(mod1))

################################################################################Modelo 2: ARIMA(0,1,1)mod2=Arima(lny,order=c(0,1,1))summary(mod2)

#Calculando estad´ısticos Z0 y sus valores P en modelo 2est=cbind(Estimacion=mod2$coef,s.e=sqrt(diag(mod2$var.coef)))z0=est[,1]/est[,2]vp=pnorm(abs(z0),lower.tail=FALSE)+pnorm(-abs(z0))

#Pronosticos en escala log modelo 2predmod2=forecast(mod2,h=(length(datos)-n),level=95)predmod2


#Calculando precision de los pronosticos en escala log modelo 2accuracy(predmod2,log(datos)[(n+1):length(datos)])

#Analisis de residuales modelo 2nf=layout(rbind(c(1,2),c(3,4)))plot(residuals(mod2),main=expression(paste("Residuos ARIMA(0,1,1) para ",sep=" ",log(Y[t]))))abline(h=0,lty=2)plot(fitted(mod2),residuals(mod2),main=expression(paste("Residuos ARIMA(0,1,1) para ",sep=" ",log(Y[t]))))abline(h=0,lty=2)acf(as.numeric(residuals(mod2)),lag.max=36,ci.type="ma",ci.col="red",main=expression(paste("ACF residuos ARIMA(0,1,1) para",sep=" ",log(Y[t]))))pacf(as.numeric(residuals(mod2)),lag.max=36,ci.col="red",main=expression(paste("PACF residuos ARIMA(0,1,1) para",sep=" ",log(Y[t]))))

eacf(residuals(mod2))BP.LB.test(residuals(mod2),maxlag=36,type="Ljung")shapiro.test(residuals(mod2))#################################################################################Modelo 3: ARIMA(2,1,3)mod3=Arima(lny,order=c(2,1,3))summary(mod3)

#Calculando estad´ısticos Z0 y sus valores P en modelo 3est=cbind(Estimacion=mod3$coef,s.e=sqrt(diag(mod3$var.coef)))z0=est[,1]/est[,2]

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


vp=pnorm(abs(z0),lower.tail=FALSE)+pnorm(-abs(z0))


#graficando la serie de logaritmos y predicciones modelo 3plot(predmod3,main="Log tasa yen/$US\nPronosticos modelo 3")lines(time(datos)[(n+1):length(datos)],log(datos)[(n+1):length(datos)],type=’l’,col=2,lwd=2)legend("topright",legend=c("Realizacion","pronosticado zona amarilla"),lwd=c(2,2),col=c(2,1))



eacf(residuals(mod3))BP.LB.test(residuals(mod3),maxlag=36,type="Ljung")shapiro.test(residuals(mod3))#################################################################################Modelo 4: ARIMA(3,1,2)mod4=Arima(lny,order=c(3,1,2))summary(mod4)

#Calculando estad´ısticos Z0 y sus valores P en modelo 4est=cbind(Estimacion=mod4$coef,s.e=sqrt(diag(mod4$var.coef)))z0=est[,1]/est[,2]vp=pnorm(abs(z0),lower.tail=FALSE)+pnorm(-abs(z0))





eacf(residuals(mod4))BP.LB.test(residuals(mod4),maxlag=36,type="Ljung")

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


shapiro.test(residuals(mod4))###################################################################################Ajuste modelos de tendencia determin´ıstica#################################################################################Modelo 5a: tendencia determin´ıstica y errores R.Bmod5a=lm(lny˜t)summary(mod5a)

#Analisis de residuales modelo 5anf=layout(rbind(c(1,2),c(3,4)))plot(t,residuals(mod5a),type=’l’,main=expression(paste("Residuos modelo 5a para ",sep=" ",log(Y[t]))))abline(h=0,lty=2)plot(fitted(mod5a),residuals(mod5a),main=expression(paste("Residuos modelo 5a para ",sep=" ",log(Y[t]))))abline(h=0,lty=2)acf(as.numeric(residuals(mod5a)),lag.max=36,ci.type="ma",ci.col="red",main=expression(paste("ACF residuos modelo 5a para",sep=" ",log(Y[t]))))pacf(as.numeric(residuals(mod5a)),lag.max=36,ci.col="red",main=expression(paste("PACF residuos modelo 5a para",sep=" ",log(Y[t]))))

eacf(residuals(mod5a))#################################################################################Tendencia deterministica y errores AR(2)mod5b=Arima(lny,order=c(2,0,0),xreg=t,method=’ML’)summary(mod5b)

#Calculando estad´ısticos Z0 y sus valores P en modelo 5best=cbind(Estimacion=mod5b$coef,s.e=sqrt(diag(mod5b$var.coef)))z0=est[,1]/est[,2]vp=pnorm(abs(z0),lower.tail=FALSE)+pnorm(-abs(z0))

#predicciones en escala log modelo 5bpredmod5b=forecast(mod5b,xreg =tnuevo,level=95)predmod5b

#Graficando la serie de logaritmos y predicciones modelo 5bplot(predmod5b,main="Log tasa yen/$US\nPronosticos modelo 5b")lines(time(datos)[(n+1):length(datos)],log(datos)[(n+1):length(datos)],type=’l’,col=2,lwd=2)legend("topright",legend=c("Realizacion","pronosticado zona amarilla"),lwd=c(2,2),col=c(2,1))

#Calculando precision de los pronosticos en escala log modelo 5baccuracy(predmod5b,log(datos)[(n+1):length(datos)])

#Analisis de residuales modelo 5bnf=layout(rbind(c(1,2),c(3,4)))plot(residuals(mod5b),main=expression(paste("Residuos modelo 5b para ",sep=" ",log(Y[t]))))abline(h=0,lty=2)plot(fitted(mod5b),residuals(mod5b),main=expression(paste("Residuos modelo 5b para ",sep=" ",log(Y[t]))))abline(h=0,lty=2)acf(as.numeric(residuals(mod5b)),lag.max=36,ci.type="ma",ci.col="red",main=expression(paste("ACF residuos modelo 5b para",sep=" ",log(Y[t]))))pacf(as.numeric(residuals(mod5b)),lag.max=36,ci.col="red",main=expression(paste("PACF residuos modelo 5b para",sep=" ",log(Y[t]))))

eacf(residuals(mod5b))BP.LB.test(residuals(mod5b),maxlag=36,type="Ljung")shapiro.test(residuals(mod5b))#################################################################################Tendencia determin´ıstica y errores ARMA(3,2)mod5c=Arima(lny,order=c(3,0,2),xreg=t,method=’ML’)summary(mod5c)

#Calculando estad´ısticos Z0 y sus valores P en modelo 5c

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


est=cbind(Estimacion=mod5c$coef,s.e=sqrt(diag(mod5c$var.coef)))z0=est[,1]/est[,2]vp=pnorm(abs(z0),lower.tail=FALSE)+pnorm(-abs(z0))

#predicciones en escala log modelo 5cpredmod5c=forecast(mod5c,xreg =tnuevo,level=95)predmod5c

#Graficando la serie de logaritmos y pronosticos modelo 5cplot(predmod5c,main="Log tasa yen/$US\nPronosticos modelo 5c")lines(time(datos)[(n+1):length(datos)],log(datos)[(n+1):length(datos)],type=’l’,col=2,lwd=2)legend("topright",legend=c("Realizacion","pronosticado zona amarilla"),lwd=c(2,2),col=c(2,1))

#Calculando precision de los pronosticos en escala log modelo 5caccuracy(predmod5c,log(datos)[(n+1):length(datos)])

#Analisis de residuales modelo 5cnf=layout(rbind(c(1,2),c(3,4)))plot(residuals(mod5c),main=expression(paste("Residuos modelo 5c para ",sep=" ",log(Y[t]))))abline(h=0,lty=2)plot(fitted(mod5c),residuals(mod5c),main=expression(paste("Residuos modelo 5c para ",sep=" ",log(Y[t]))))abline(h=0,lty=2)acf(as.numeric(residuals(mod5c)),lag.max=36,ci.type="ma",ci.col="red",main=expression(paste("ACF residuos modelo 5c para",sep=" ",log(Y[t]))))pacf(as.numeric(residuals(mod5c)),lag.max=36,ci.col="red",main=expression(paste("PACF residuos modelo 5c para",sep=" ",log(Y[t]))))

eacf(residuals(mod5c))BP.LB.test(residuals(mod5c),maxlag=36,type="Ljung")shapiro.test(residuals(mod5c))

#################################################################################Calculo AIC’s modelos ajustados a log de la serie################################################################################

cbind(AICmod1=AIC(mod1),AICmod2=AIC(mod2),AICmod3=AIC(mod3),AICmod4=AIC(mod4),AICmod5b=AIC(mod5b),AICmod5c=AIC(mod5c))

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ

Capıtulo 10

Modelos SARIMA

10.1. Introduccion

La estacionalidad es un tipo particular de no estacionariedad que se pre-senta en muchas series de tiempo, en particular, series afectadas por fenomenosde consumo, ambientales, entre otros. La estacionalidad ha sido definida comofluctuaciones que se repiten anualmente, posiblemente con cambios gradualesa lo largo de los anos; sin embargo, aunque en general se considere como unfenomeno repetitivo anual esto no implica que no pueda existir modelos decomportamiento periodicos con duracion menor al ano.

De acuerdo a Martınez [8], si la estacionalidad fuese exactamente periodica,entonces podrıa ser filtrada de la serie mediante una componente determinısti-ca, pero en general, la estacionalidad es solo aproximadamente constante.

Sea s la longitud del perıodo estacional. Casi siempre la estacionalidadpuede ser eliminada de una serie tomando diferencias entre las observacionesseparadas s lugares en el tiempo y esto es denominado como diferencia esta-

cional y denotado por

∇sYt = Yt − Yt−s, con ∇s = 1− Bs.

Note que ∇s 6= ∇s, donde ∇s = (1− B)s. En general, el operador de diferenciasestacionales de perıodo s se define como ∇D

s = (1−Bs)D, de modo que aplicadoa la serie Yt obtenemos,

∇Ds Yt = (1− Bs)DYt =

D∑

j=0

D!

j!(D − j)!(−1)jYt−js, (10.1)

comunmente con D = 1, 2. Por ejemplo, si D = 2 y s = 12, tenemos que

∇212Yt = (1− B12)2Yt = Yt − 2Yt−12 + Yt−24

Note que al aplicar el operador ∇Ds se pierden las primeras s×D observaciones.

Considere ahora el caso D = 1 y suponga una serie con la siguiente estruc-tura,

Yt = St + Et

345

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ

346 CAPITULO 10. MODELOS SARIMA

donde St es una componente estacional determinıstica de perıodo s satisfa-ciendo

St = St−ks para k = ±1,±2, . . . ,

y Et un proceso estacionario. Entonces

∇sYt = Yt − Yt−s

= (St − St−s) + (Et − Et−s)

= ∇sEt

es decir, la serie Wt = ∇sYt es un proceso estacionario. Ahora suponga que laestacionalidad es tal que (una estacionalidad estocastica)

St = St−s + Ut

donde {Et} y {Ut} son procesos estacionarios independientes. Entonces,

∇sYt = Yt − Yt−s

= (St − St−s) + (Et − Et−s)

= Ut +∇sEt

entonces, en este caso tambien obtenemos que la serie Wt = ∇sYt es un procesoestacionario.

Con los dos casos anteriores se quiere mostrar que el operador ∇s puedeconvertir un proceso estacional en un proceso estacionario.

Nota:

1. Si el proceso {Ut} es un ruido blanco entonces St = St−s + Ut define una

caminata aleatoria estacional.

2. Si VAR[Ut] ≪ VAR[Et], entonces {St} modelarıa una componente esta-cional que cambia lentamente.

3. Bajo la condicion de que {Et} y {Ut} son ruidos blancos independientes,la ACF de ∇sYt = Ut +∇sEt tendra un patron similar al correspondiente ala ACF de un modelo MA(1)s, que se vera mas adelante.

10.2. Modelos ARIMA estacionales

En muchos casos, es posible que la estacionalidad de una serie en lugarde ser una componente determinıstica e independiente de otras componentesde la serie, sea una componente estocastica y correlacionada con compo-nentes no estacionales. De acuerdo a Wei [9], un proceso {Yt} puede contenerrelaciones intra periodos y entre perıodos estacionales. Las relaciones intra

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ

10.2. MODELOS ARIMA ESTACIONALES 347

perıodos representan la correlacion entre . . . , Yt−2, Yt−1, Yt, Yt+1, Yt+2, . . ., mien-tras que las relaciones entre perıodos estacionales representan la correlacionentre . . . , Yt−2s, Yt−s, Yt, Yt+s, Yt+2s, . . . Las relaciones intra perıodos pueden mod-elarse por un modelo ARIMA(p,d,q), es decir, de la forma

φp(B)∇dYt = θq(B)bt (10.2)

donde bt es un ruido blanco, φp(B) = 1 − φ1B − φ2B2 − · · · − φpB

p y θq(B) = 1 +θ1B+θ2B

2+· · ·+θqBq, ambos polinomios sin raıces comunes y de modulo mayor

a 1. Sin embargo, si bt contiene correlaciones no explicadas entre perıodosestacionales, es decir, si sigue un proceso ARIMA(P,D,Q)s, dado por

ΦP (Bs)∇Ds bt = ΘQ(Bs)Et, con Et ∼ R.B (10.3)

donde ΦP (Bs) = 1−Φ1Bs−Φ2B

2s−· · ·−ΦPBPs y ΘQ(Bs) = 1+Θ1B

s +Θ2B2s + · · ·+

ΘQBQs, ambos polinomios de Bs sin raıces comunes y con modulo mayor a 1,

entonces, combinando (10.2) y (10.3), obtenemos el modelo Arima estacional

multiplicativo o SARIMA, dado por

φp(B)ΦP (Bs)∇d∇Ds Yt = θq(B)ΘQ(Bs)Et, Et ∼ R.BN(0, σ2) (10.4)

donde φp(B) y θq(B) son llamados los polinomios autorregresivo y de mediasmoviles, regulares, respectivamente, en tanto que ΦP (Bs) y ΘQ(Bs) son llama-dos los polinomios autorregresivo y de medias moviles, estacionales, respecti-vamente. El modelo en (10.4) es denotado por ARIMA(p,d,q)× (P,D,Q)s donde sse refiere al perıodo estacional.

Nota:

1. Si d = D = 0, el modelo es conocido como Arma estacional o estacionarioestacional y denotado por ARMA(p,q)× (P,Q)s, es decir,

φp(B)ΦP (Bs)Yt = θq(B)ΘQ(Bs)Et, Et ∼ R.BN(0, σ2) (10.5)

con φp(B) y ΦP (Bs) sin raıces unitarias en B y Bs, respectivamente.

2. Decimos que un proceso {Yt} sigue un modelo Arima estacional multi-plicativo de perıodo s, con parte regular con ordenes p, d, q y parte esta-cional con ordenes P, D, Q, si la serie diferenciada Wt = ∇d∇D

s Yt satisfaceun modelo Arma estacional, ARMA(p,q)× (P,Q)s.

10.2.1. Algunos casos especiales de modelos SARIMA

Modelos ARIMA puramente estacionales

Estos corresponden a los casos ARIMA(0,0,0)× (P,D,Q)s y tambien denota-dos por ARIMA(P,D,Q)s, con ecuacion,

ΦP (Bs)∇Ds Yt = ΘQ(Bs)Et, Et ∼ R.BN(0, σ2) (10.6)

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


Si D = 0, Q = 0 y P = 1 tenemos el modelo AR(1)s, donde Yt = Φ1Yt−s + Et. Paraeste proceso se tiene que

γk =

σ2Φj1

1− Φ21

para k = js, j = 0, 1, 2, . . .

0 ∀ k 6= js

Luego, la ACF y PACF son dadas por

ρk =γk

γ0=

{Φj

1 para k = js, j = 0, 1, 2, . . .

0 ∀ k 6= js, φkk =

1 para k = 0;

Φ1 para k = s;

0 ∀ k 6= 0, s

Observe por ejemplo, la siguiente figura.

k

ρ(k)

−1

0

1

0 s 2s 3s 4s 5s 6s

Φ1 > 0

k

φ kk

−1

0

1

s

Φ1 > 0

k

ρ(k)

−1

0

1

0 s 2s 3s 4s 5s 6s

Φ1 < 0

k

φ kk

−1

0

1

s

Φ1 < 0

Figura 10.1: ACF’s y PACF’s modelos AR(1)s

Si P = 0, D = 0 y Q = 1, el proceso sigue un modelo MA(1)s, dado porYt = Et + Θ1Et−s, para el cual

γ(k) =

σ2(1 + Θ21) si k = 0

Θ1σ2 si k = s

0 si k 6= 0, s

;

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


y la ACF y PACF son dadas por

ρ(k) =

1 si k = 0Θ1

1 + Θ21

si k = s

0 si k 6= 0, s

; φkk =

1 si k = 0,

(−1)k+1Θk1(1−Θ2

1)

1−Θ2(k+1)1

si k = js, j = 1, 2, . . .;

Observe las ACF’s y PACF’s que se ilustran a continuacion.

k

ρ(k)

−1

0

1

0 s 2s 3s 4s 5s 6s

Θ1 > 0

k

φ kk

−0.5

0

0.5

s 2s 3s 4s 5s 6s

Θ1 > 0

k

ρ(k)

−1

0

1

0 s 2s 3s 4s 5s 6s

Θ1 < 0

k

φ kk

−0.5

0

0.5

s 2s 3s 4s 5s 6s

Θ1 < 0

Figura 10.2: ACF’s y PACF’s modelos MA(1)s

En el caso de un ARMA(P,Q)s, es decir, ΦP (Bs)Yt = ΘQ(Bs)Et, Et ∼ R.B,observaremos que la ACF y PACF se comportan como en el caso de un AR-MA(p,q), es decir, patron de cola en ambas graficas, solo que tomando valoresno nulos en k = js, j = 1, 2, . . .. Por ejemplo, vea las ACF y PACF ilustradas enla Figura 10.3.

Modelos ARMA(p,q)× (P,Q)s

En estos casos, d = D = 0. Estos modelos son como un ARMA(p+Ps,q+Qs)pero solo p+P +q+Q+pP +qQ coeficientes son diferentes de cero. Por ejemplo,MA(1)×MA(1)s, MA(1)× AR(1)s, AR(1)×MA(1)s, AR(1)× AR(1)s. En las Figuras10.4, 10.5, 10.6 y 10.7 se ilustran la ACF y PACF de algunos de estos casos.

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


k

ρ(k)

−1

0

1

0 s 2s 3s 4s 5s 6s

Φ1 > 0, Θ1 > 0

k

φ kk

−1

0

1

s 2s 3s 4s 5s 6s

Φ1 > 0, Θ1 > 0

k

ρ(k)

−1

0

1

0 s 2s 3s 4s 5s 6s

Φ1 < 0, Θ1 < 0

k

φ kk

−1

0

1

s 2s 3s 4s 5s 6s

Φ1 < 0, Θ1 < 0

k

ρ(k)

−1

0

1

0 s 2s 3s 4s 5s 6s

Φ1 > 0, Θ1 < 0, Φ1 > Θ1

k

φ kk

−0.5

0

0.5

s 2s 3s 4s 5s 6s

Φ1 > 0, Θ1 < 0, Φ1 > Θ1

k

ρ(k)

−1

0

1

0 s 2s 3s 4s 5s 6s

Φ1 > 0, Θ1 < 0, Φ1 < Θ1

k

φ kk

−0.5

0

0.5

s 2s 3s 4s 5s 6s

Φ1 > 0, Θ1 < 0, Φ1 < Θ1

Figura 10.3: ACF’s y PACF’s modelos ARMA(1,1)s

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


k

ρ(k)

−1

0

1

0 12 24 36

θ1 = 0.5, Θ1 = 0.8

k

φ kk

−1

0

1

12 24 36

θ1 = 0.5, Θ1 = 0.8

k

ρ(k)

−1

0

1

0 12 24 36

θ1 = − 0.5, Θ1 = 0.8

k

φ kk

−1

0

1

12 24 36

θ1 = − 0.5, Θ1 = 0.8

k

ρ(k)

−1

0

1

0 12 24 36

θ1 = − 0.5, Θ1 = − 0.8

k

φ kk

−1

0

1

12 24 36

θ1 = − 0.5, Θ1 = − 0.8

Figura 10.4: ACF’s y PACF’s modelos MA(1)×MA(1)12

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


k

ρ(k)

−1

0

1

0 12 24 36

Φ1 = 0.75, θ1 = 0.4

k

φ kk

−1

0

1

12 24 36

Φ1 = 0.75, θ1 = 0.4

k

ρ(k)

−1

0

1

0 12 24 36

Φ1 = 0.75, θ1 = − 0.4

k

φ kk

−1

0

1

12 24 36

Φ1 = 0.75, θ1 = − 0.4

k

ρ(k)

−1

0

1

0 12 24 36

Φ1 = − 0.75, θ1 = − 0.4

k

φ kk

−1

0

1

12 24 36

Φ1 = − 0.75, θ1 = − 0.4

Figura 10.5: ACF’s y PACF’s modelos MA(1)× AR(1)12

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


k

ρ(k)

−1

0

1

0 12 24 36

Θ1 = 0.8, φ1 = 0.7

k

φ kk

−0.5

0

0.71

12 24 36

Θ1 = 0.8, φ1 = 0.7

k

ρ(k)

−1

0

1

0 12 24 36

Θ1 = 0.8, φ1 = − 0.7

k

φ kk

−0.71

0

0.5

12 24 36

Θ1 = 0.8, φ1 = − 0.7

k

ρ(k)

−1

0

1

0 12 24 36

Θ1 = − 0.8, φ1 = − 0.7

k

φ kk

−1

0

1

12 24 36

Θ1 = − 0.8, φ1 = − 0.7

Figura 10.6: ACF’s y PACF’s modelos AR(1)×MA(1)12

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


k

ρ(k)

−1

0

1

0 4 8 12 16 20 24

φ1 = 0.5, Φ1 = 0.8

k

φ kk

−1

0

1

4 8 12 16 20 24

φ1 = 0.5, Φ1 = 0.8

k

ρ(k)

−1

0

1

0 4 8 12 16 20 24

φ1 = 0.5, Φ1 = − 0.8

k

φ kk

−1

0

1

4 8 12 16 20 24

φ1 = 0.5, Φ1 = − 0.8

k

ρ(k)

−1

0

1

0 4 8 12 16 20 24

φ1 = − 0.5, Φ1 = 0.8

k

φ kk

−1

0

1

4 8 12 16 20 24

φ1 = − 0.5, Φ1 = 0.8

k

ρ(k)

−1

0

1

0 4 8 12 16 20 24

φ1 = − 0.5, Φ1 = − 0.8

k

φ kk

−1

0

1

4 8 12 16 20 24

φ1 = − 0.5, Φ1 = − 0.8

Figura 10.7: ACF’s y PACF’s modelos AR(1)× AR(1)4

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ

10.3. ACF DE PROCESOS ESTACIONALES 355

Modelos “Air Passengers”

Corresponde al modelo ARIMA(0, 1, 1)× (0, 1, 1)s, es decir

(1− B)(1−Bs)Yt = (1 + θ1B)(1 + Θ1Bs)Et, Et ∼ R.BN(0, σ2)

Este modelo ha sido muy util para representar series de tiempo estacionalestales como datos de aerolıneas, de ahı su nombre. Observe que considerandoel proceso definido por Wt = ∇∇sYt, este sigue un MA(1)×MA(1)s, para el cualse tiene que su ACF es dada por

ρ(k) =

1 si k = 0θ1

1 + θ21

si k = 1

θ1Θ1

(1 + θ21)(1 + Θ2

1)si k = s− 1, s+ 1

Θ1

1 + Θ21

si k = s

0 en otro caso

.

10.2.2. Series con tendencia y estacionalidad estocasticas

Considere un proceso {Yt}, tal que

Yt = Tt + St + Et

dondeTt = Tt−1 + Ut, St = St−s + Vt

con {Et}, {Ut} y {Vt} son ruidos blancos mutuamente independientes y la com-ponente estacional es de perıodo s. Bajo estas condiciones observe que {Tt}describe una caminata aleatoria y {St} una caminata aleatoria estacional. Eneste caso es necesario tomar tanto una diferencia regular como una diferenciaestacional para obtener un proceso estacionario,

∇∇sYt = (Et + Ut + Vt)− (Et−1 + Vt−1)− (Et−s + Ut−s) + Et−s−1

este proceso tiene una ACF distinta de cero en k = 0, 1, s− 1, s, s+ 1 como en elcaso de un proceso MA(1) ×MA(1)s Ası, el proceso {Yt} se comporta de man-era similar a un proceso ARIMA(0,1,1)× (0,1,1)s, aunque a diferencia de esteultimo, involucra tres tipos de innovaciones definidas por los ruidos blancos.

10.3. ACF de procesos estacionales

Sea Wt = ∇d∇Ds Yt = (1 − B)d(1 − Bs)DYt el proceso estacionario resultante

de diferenciar d veces de forma regular y D veces de forma estacional a Yt.Entonces Wt ∼ ARMA(p+ Ps, q +Qs), tal que

φp(B)ΦP (Bs)Wt = θq(B)ΘQ(Bs)Et, Et ∼ R.BN(0, σ2)

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


La ACF de Wt es una mezcla de sus componentes regulares y estacionales. Deacuerdo a Martinez [8], puede mostrarse que si rj son las autocorrelacionesdel proceso ARMA(p,q) “regular”

φp(B)xt = θq(B)ut

y si Rjs son las autocorrelaciones en los rezagos s, 2s, 3s, . . . del proceso ARMA(P,Q)s“estacional”

ΦP (Bs)zt = ΘQ(Bs)vt

entonces la ACF ρ(k) del proceso Wt satisface

ρ(k) =

rk +∞∑

j=1

Rjs(rjs+k + rjs−k)

1 + 2∞∑

j=1

rjsRjs

(10.7)

Si suponemos que rk ≈ 0 en rezagos k altos, entonces

1. En rezagos k bajos (k < s) se observara unicamente la ACF de la parteregular, es decir, ρ(k) ≈ rk.

2. En valores de rezagos estacionales (k = js, j = 1, 2, . . .), se observara basica-mente la ACF de la parte estacional y suponiendo que rjs ≈ 0 paraj = 1, 2, . . ., entonces ρ(js) ≈ Rjs, j = 1, 2, . . ..

3. Alrededor de los rezagos estacionales, k = js, j = 1, 2, . . ., donde ρ(k) nosea nulo, se observara la interaccion entre la parte regular y la estacional,que se manifestara como la repeticion de la ACF de la parte regular aambos lados de cada rezago estacional.

Guerrero [5], Seccion 5.2.1 (pp. 185 - 205) presenta las ACF’s teoricas dealgunos modelos SARIMA.

10.4. PACF y EACF de procesos estacionales

Segun Wei [9], las componentes autorregresivas regular y estacional delproceso producen patrones de corte en la PACF, en los rezagos no estacionalesy estacionales, respectivamente; por otro lado, las componentes de mediasmoviles estacionales y no estacionales producen patrones de decaimiento ex-ponenciales y/o sinusoidales amortiguados, en los respectivos rezagos esta-cionales y no estacionales. Martınez [8] tambien enuncia lo siguiente:

1. En los primeros rezagos aparece la PACF de la parte regular y en losrezagos estacionales aparece la PACF de la parte estacional.

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ

10.5. CONSTRUCCION Y PRONOSTICOS EN MODELOS ESTACIONALES357

2. A la derecha de cada coeficiente de autocorrelacion parcial estacional nonulo, es decir, en los rezagos k = js + 1, js + 2, . . . aparece la PACF de laparte regular, en forma invertida si φjs,js es positivo y con su signo si φjs,js

es negativo.

3. A la izquierda de φjs,js, es decir, en los rezagos k = js − 1, js − 2, . . . seobservara la ACF de la parte regular.

4. En modelos estacionales la PACF en k = js, j = 1, 2, . . . suele ser de mag-nitud mucho menor que en el caso de una estructura estacional pura.

De acuerdo a Wei [9], en modelos estacionales la construccion de la EACF esbastante dispendiosa y en general muy complicada y su uso en la identifi-cacion de series estacionales es muy limitada.

10.5. Construccion y pronosticos en modelos estacionales

Desde que los modelos Arima estacionales son un caso especial de los mod-elos Arima, la identificacion del modelo, la estimacion de los parametros, elchequeo de supuestos y diagnosticos y la obtencion de pronosticos para estosmodelos estacionales utilizan los mismos metodos generales vistos para losmodelos Arima, aunque la identificacion es un poco mas complicada ya queel numero de modelos que podrıan postularse para una serie dada aumentaconsiderablemente. Tenga en cuenta que la identificacion de la estructura noestacionaria consiste en (Martınez [8]):

1. Determinar si es necesario realizar alguna transformacion de los datospara estabilizar la varianza.

2. Determinar el numero de diferencias regulares d para que la media seaconstante, generalmente d = 1, 2. Si la serie tiene tendencia o muestracambio de nivel en la media, debe diferenciarse y esta situacion se deducegeneralmente del grafico de la serie; sin embargo, si la decision no resultaclara a traves del grafico de la serie, se debe estudiar la ACF y PACF dondeuna serie no estacionaria presenta una estructura AR con decrecimientolento en la ACF. En procesos con estructura estacional sinusoidal la ACFsera una mezcla de las componentes regulares y estacionales, y puedemostrarse que esta funcion seguira un patron sinusoidal; en este casola no estacionaridad se manifestara tambien por un decrecimiento muylento de la ACF y sera necesario diferenciar la serie.

Debido a que al diferenciar una serie no estacionaria hasta convertirla enuna serie estacionaria se espera tambien una disminucion de la varian-za, algunos autores recomiendan diferenciar en forma regular hasta quela varianza aumente al diferenciar; sin embargo, hay que ser cautos conesta recomendacion pues es posible que para una serie estacionaria su

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


varianza tambien disminuya al diferenciarla. Otra forma de determinarla necesidad de diferenciar es mediante la aplicacion de un test de raızunitaria, sin embargo recuerde que estos testes adolecen de baja poten-cia, es decir, tienden a rechazar poco la hipotesis nula de raız unitariacuando en realidad hay estacionariedad.

3. Si la serie puede ser a priori estacional con un perıodo s, aplicar la difer-encia estacional ∇s = 1−Bs, y siempre que exista componente estacionalhay que aplicar una diferencia estacional. Recuerde que la estacionalidadse manifiesta cuando

a) en el grafico de la serie aparece un patron repetido en todos los anos;

b) en la ACF se presentan coeficientes de autocorrelacion altos que de-crecen lentamente, en los rezagos k = s, 2s, 3s, etc.

c) Cuando tanto una diferencia regular y una estacional son necesaria,observamos que al aplicar solo la diferencia regular que elimina latendencia, las pautas estacionales aparecen mas claramente.

4. Para la identificacion de la estructura ARMA, una vez obtenida la serieestacionaria Wt = ∇d∇D

s Yt, para d y D apropiados, se calcula la ACF yPACF muestrales del proceso Wt. Si este proceso es estacional debe es-tudiarse la ACF y PACF en los rezagos k = s, 2s, . . . para identificar laestructura ARMA estacional. Recuerde que la estructura ARMA regularen la ACF y PACF aparecen en los rezagos bajos y que alrededor de losrezagos estacionales se observa la interaccion entre la parte regular yla estacional. Tenga en cuenta lo descrito previamente sobre las carac-terısticas de la ACF y PACF de Arimas estacionales.

En esta etapa tambien se recomienda iniciar primero con modelos AR oMA de orden bajo, pero tambien tratando de explicar los rasgos obviosobservados en la ACF y PACF, ademas, utilizar las interacciones alrede-dor de los rezagos estacionales para confirmar la concordancia entre laparte regular y la estacional.

5. Respecto a la busqueda de componentes determinısticas, Martınez [8]muestra que en general el modelo

(1− B)dYt = (1−B)dEt, Et ∼ R.B

es equivalente al modelo de tendencia polinomica

Yt = β0 + β1t+ · · ·+ βdtd + Et

La anterior situacion tambien se da con los operadores estacionales. Porejemplo, la solucion de

(1−B12)Yt = (1−B12)Et, Et ∼ R.B

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ

10.6. RAICES UNITARIAS ESTACIONALES 359

es Yt = St + Et con St funcion periodica de perıodo s tal que St = St−12

para todo t. Ası, por ejemplo, cuando aparece una componente MA(1)estacional con parametro Θ1 ≈ −1, esto puede ser un indicio de que haycomponente estacional determinıstica. Pero hay que tener cuidado conesta conclusion puesto que una raız unitaria en la parte MA (regular oestacional) tambien puede originarse por una sobre diferenciacion. Porejemplo, si se toma una diferencia estacional en el modelo Yt = St + Et

cuando St = 0, o una diferencia regular en el modelo Yt = β0 + Et.

10.6. Raıces unitarias estacionales

Cuando hay estacionalidad lo mas conveniente es incluir esta componenteen el modelo, y al hacerlo, es necesario contar con una metodologıa que per-mita probar la existencia de raıces unitarias estacionales (Guerrero [5]).

Al igual que en el caso de raıces unitarias regulares visto en el Capıtu-lo anterior, las raıces unitarias estacionales estan asociadas con el grado dediferenciacion necesaria para estacionarizar la serie. Pero en este caso, deacuerdo a Guerrero [5], el hecho de que una serie requiera de diferencias esta-cionales debe verse como senal de que los efectos estacionales de la serie noson estables en el tiempo. Por otra parte, debemos considerar los testes deraıces unitarias estacionales como herramientas que complementan el anali-sis exploratorio de la serie que se realiza con base en la grafica de la serie, laACF muestral y la evaluacion de la varianza con distintos ordenes de diferen-ciacion.

Recuerde que la diferenciacion estacional se realiza con el filtro ∇Ds =

(1 − Bs)D. Si se requieren d diferencias regulares y D diferencias estacionalespara estacionarizar una serie Yt, decimos que Yt es integrada de orden d, D yescribimos Yt ∼ I(d,D)s. Tambien tenga en cuenta que cuando hay estacionali-dad, existen tres posibles modelos para la serie,

1. Modelos de componentes determinısticas y modelos de descomposicion;

2. Modelos no estacionarios integrados estacionalmente (SARIMA), es decirARIMA(p,d,q)× (P,D,Q)s, con d 6= 0 y D 6= 0;

3. Modelo estacionario estacional, es decir, ARIMA(p,0,q)×(P,0,Q)s o ARMA(p,q)×(P,Q)s, que es equivalente a un ARMA(p+Ps,q+Qs) estacionario, es decir,sus polinomios autorregresivos regular y estacional son de raıces conmodulo mayor a 1, y es invertible si los polinomios de medias movilesregular y estacional son tambien de raıces con modulo mayor a 1. Estemodelo tambien es llamado SARMA.

Cada uno de estos tres diferentes tratamientos de las series sera correcto sise le aplica a un determinado comportamiento del proceso generador de losdatos. Ası, por ejemplo, si empleamos variables indicadoras para tratar la esta-cionalidad cuando lo correcto era diferenciar, entonces tendremos un modelo

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


mal especificado que puede conducir a conclusiones erradas. Si el procesoque genera los datos implica que el comportamiento estacional es puramentedeterminıstico, entonces la mejor aproximacion sera emplear variables indi-cadoras. Si por el contrario, el proceso generador de los datos correspondea un proceso estacionario estacional, entonces la mejor opcion sera estimarun modelo SARMA. Pero, si por el contrario el proceso generado de los datosimplica la presencia de un proceso no estacionario estacional (raıces unitariasestacionales) entonces la aproximacion correcta es emplear la integracion (odiferenciacion) estacional.

La diferencia entre estas tres posibles formas de estacionalidad es que enel caso de la estacionalidad determinıstica y la estacionaria los choques enel modelo desaparecen en el largo plazo (se regresa a la media o a la ten-dencia segun sea el caso). Por el contrario, en los modelos no-estacionariosestacionales los choques tienen efecto permanente y se incorporan a la serie yestos procesos tienen propiedades similares a las series integradas ordinarias,tales como memoria larga, varianzas que crecen linealmente y asintoticamenteno esta correlacionados con otras raıces de otras frecuencias.

Hylleberg, Engle, Granger y Yoo [6] establece ademas, que una serie conuna estacionalidad clara puede incluso tener una combinacion de algunos delos tres tipos de modelos de estacionalidad citados.

Para poder introducir las pruebas de raıces unitarias estacionales, con-sidere la siguiente definicion:

Definicion: Un proceso ARMA(p,q) se dice es integrado estacional o de raızunitaria estacional, de perıodo s (con s par), si alguna o todas las raıces de1− xs son raıces del polinomio que define la parte autorregresiva del proceso.

Por ejemplo, si s = 4, tenemos que las raıces de 1−x4 son 1,−1, i,−i, con i =√−1. Si s = 12 entonces las raıces de 1−x12 son 1,−1,±i,−(1±i

√3)/2, (1±i

√3)/2,

−(√

3± i)/2 y (√

3± i)/2.

Las raıces unitarias se pueden identificar con los angulos que forma |x|(modulo de x) con el eje X, definidos por θ = 2πj/s, j = 0, 1, 2, . . . , s − 1. Estosangulos se denominan las frecuencias estacionales.

10.6.1. Test HEGY de raız unitaria estacional

Este test fue propuesto por Hylleberg, et. al. [6]. El objetivo de esta pruebaes determinar si se necesitara diferenciar o no la serie y el tipo de diferen-ciacion, para obtener estacionaridad. La prueba parte de un modelo AR (in-finito) ϕ(B)Yt = Et y construye una ecuacion de regresion del tipo visto en eltest de Dickey-Fuller para probar las hipotesis de interes, y para ello se haceuso del siguiente resultado llamado Representacion de Lagrange:

Cualquier polinomio ϕ(x), posiblemente infinito o racional, que toma un valor

finito sobre los puntos c1, c2, . . . , cr, distintos de cero y posiblemente complejos

(ck ∈ C, k = 1, 2, . . . , r) puede expresarse en terminos de polinomios elementales

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


mas un residuo, de la siguiente manera

ϕ(x) =r∑

k=1

λk∆(x)[1− δk(x)]δk(x)

+ ∆(x)φ∗(x) (10.8)

donde φ∗(x) es un polinomio que corresponde a un proceso estacionario,

λk =ϕ(ck)∏

j 6=k

δj(ck); ∆(x) =

r∏

k=1

δk(x); δk(x) = 1− x

ck. (10.9)

De la definicion de λk y de δk(x), se deduce que el polinomio ϕ(x) tendra unaraız unitaria en ck si y solo sı el correspondiente λk es igual a cero, es decir,

ϕ(ck) = 0 ⇐⇒ λk = 0

Por tanto, el polinomio ϕ(B) tendra una raız ck si y solo sı λk = 0.La prueba de raız unitaria estacional es para determinar si ck es una raız

estacional. Los λk aparecen involucrados en los coeficientes de una regresionlineal multiple que se define usando (10.8) en la ecuacion ϕ(B)Yt = Et.

Para entender como opera esta prueba considere el caso s = 4, es decir, esta-cionalidad trimestral. Las raıces a evaluar son c1 = 1, c2 = −1, c3 = i y c4 = −i.En este caso se quiere determinar si en la representacion autorregresiva delproceso de la serie observada, alguno o todos los ck son raıces del polinomioϕ(B), donde la raız c1 = 1 implica que Yt ≈ Yt−1 y por tanto esta asociada aun proceso no estacional (de frecuencia cero por ano); la raız c2 = −1 impli-ca que Yt ≈ −Yt−1 ≈ Yt−2, por tanto esta asociada a un proceso de frecuenciaestacional de dos veces por ano; por su parte, las raıces ±i implican conjun-tamente que Yt ≈ −Yt−2 ≈ Yt−4 y por tanto, estan asociadas a procesos defrecuencia estacional de 1 vez por ano.

Note que si ∇4Yt = (1− B4)Yt es estacionario, debe cumplirse al menos unade las siguientes condiciones

C1. (1−B) = 0 y por lo tanto tendremos que Yt−Yt−1 sera estacionario y existeuna raız unitaria no estacional.

C2. (1 + B) = 0, esto implica que Yt + Yt−1 sera estacionario y existe una raızsemestral (bianual).

C3. 1 + B2 = 0 y por lo tanto Yt + Yt−2 sera estacionario, y existe una raızunitaria anual.

Usando los valores ck identificados, tenemos que

δ1(B) = 1− B; δ2(B) = 1 +B; δ3(B) = 1 + iB; δ4(B) = 1− iB (10.10)

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


luego ∆(B) =4∏

k=1

δk(B) = 1−B4, y reemplazando en (10.8), con x = B, obtenemos

ϕ(B) =λ1B(1 +B +B2 +B3) + λ2(−B)(1− B +B2 − B3)

+ λ3(−iB)(1− B2)(1− iB) + λ4(iB)(1−B2)(1 + iB) + (1−B4)φ∗(B)(10.11)

y comoϕ(B) es real, λ3 y λ4 deben ser complejos conjugados.La prueba de HEGY emplea estadısticos que permiten comprobar las 3

condiciones C1, C2, C3 conjuntamente y de manera individual. Para ello, de-fine las siguientes variables

X1,t = (1 +B)(1 +B2)Yt = (1 +B +B2 +B3)Yt

X2,t = −(1−B)(1 +B2)Yt = −(1− B +B2 − B3)Yt =

X3,t = −(1−B)(1 +B)Yt = −(1− B2)Yt (10.12)

tambien se definen los parametros,

π1 = −λ1, π2 = −λ2, 2λ3 = −π3 + π4i, 2λ4 = −π3 − π4i

y utilizando estas nuevas variables y los parametros πj, reescribimos la ecuacionϕ(B)Yt = Et como

ϕ(B)Yt = −π1X1,t−1 − π2X2,t−1 − (π4 + π3B)X3,t−1 + φ∗(B)∇4Yt = Et

de donde

φ∗(B)∇4Yt = π1X1,t−1 + π2X2,t−1 + π4X3,t−1 + π3X3,t−2 + Et (10.13)

Note que X1,t tiene asociada a la raız c1 = 1 y por tanto corresponde a unproceso no estacional (de frecuencia cero veces por ano); X2,t esta asociada ala raız c2 = −1 y por tanto corresponde a un proceso estacional de frecuenciados veces por ano, mientras que X3,t tiene asociadas las raıces c3 = i y c4 = −iy su frecuencia estacional es de una vez por ano. Por otro lado, se asume queel polinomio φ∗(B) tiene un orden suficientemente grande para que se cumplael supuesto de que Et es ruido blanco, por tanto, p− 1 ≥ 1. Luego, escribimos,

∇4Yt = π1X1,t−1 + π2X2,t−1 + π4X3,t−1 + π3X3,t−2 +

p−1∑

i=1

bi∇4Yt−i + Et (10.14)

Esta ultima ecuacion define un modelo de regresion con variable respuesta∇4Yt y variables explicatorias X1,t−1, X2,t−1, X3,t−1, X3,t−2 y rezagos ∇4Yt−i. Basa-dos en el ajuste de este modelo por mınimos cuadrados, se estiman los πj yse prueba luego las siguientes hipotesis para determinar si ϕ(B) tiene comoraıces todos o algunos de los valores ck = 1,−1, i,−i:

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


Test 1. H1 : ϕ(1) = 0 ⇐⇒ π1 = 0 (raız unitaria no estacional) vs. H1 : ϕ(1) > 0 ⇐⇒π1 < 0;

Test 2. H0 : ϕ(−1) = 0 ⇐⇒ π2 = 0 (raız unitaria semestral) vs. H1 : ϕ(−1) > 0 ⇐⇒π2 < 0;

Test 3. H0 : |ϕ(i)| = 0 ⇐⇒ π3 = π4 = 0 (raız unitaria anual) vs. H1 : |ϕ(i)| > 0 ⇐⇒π3 < 0 o π4 6= 0.

En los test 1 y 2 el estadıstico de la prueba se construye como un estadısticotipo t-student, aunque no es exactamente la distribucion de tales estadısticos.En el test 3, el estadıstico de la prueba se construye como un estadıstico tipoF, pero aquı tampoco la distribucion resulta ser exactamente una F. Por otraparte, de acuerdo a Guerrero [5], es importante que la seleccion del numerode rezagos p en la ecuacion de regresion en (10.14) haga explıcita la longitudestacional, es decir, conviene comenzar con p−1 = 4 (el caso de estacionalidadtrimestral) y probar la significancia estadıstica conjunta de los cuatro rezagos.

Las conclusiones posibles en las pruebas HEGY son las siguientes:

No habran raıces unitarias estacionales cuando se rechace en los testes2 y 3;

No habra ningun tipo de raız unitaria presente si se rechaza en los testes1 a 3 y la serie se clasifica como una serie estacionaria estacional, esdecir, puede modelarse como cierto ARMA de ordenes altos.

En el test 1 no rechazar H0 significa que existe una raız unitaria no esta-cional;

No rechazar H0 en el test 2 significa que existe una raız unitaria esta-cional con frecuencia semianual;

En el test 3 el no rechazo de H0 implica que existe una raız unitariaestacional de frecuencia anual.

Para el caso s = 12, la prueba HEGY se construye de una forma similar alcaso anterior, pero esta vez es necesario considerar la factorizacion del oper-ador ∇12, en la cual se obtiene que exceptuando al factor (1 − B), todos losdemas factores corresponden a raıces estacionales, que son −1 (6 ciclos porano), ±i (3 ciclos por ano), −(1± i

√3)/2 (4 ciclos por ano), (1± i

√3)/2 (2 ciclos

por ano), −(√

3 ± i)/2 ( dos raıces en la frecuencias 5π/6 o 5 ciclos por ano) y(√

3 ± i)/2 (un ciclo por ano). Se definen 12 parametros πj y nuevas variablesXi,t, relacionadas con las raıces anteriores y se construye un modelo de regre-sion como el dado en (10.14), pero en lugar de ∇4Yt se tiene a ∇12Yt. Los testesque se realizan son los siguientes

Test 1. H0 : π1 = 0 (raız unitaria no estacional) vs. H1 : π1 < 0;

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


Test 2. H0 : π2 = 0 (raız unitaria bimensual) vs. H1 : π2 < 0;

Test 3. π3 = π4 = 0 (raız unitaria para perıodos de 4 meses) vs. π3 < 0 o π4 6= 0.

Test 4. π5 = π6 = 0 (raız unitaria trimestral) vs. π5 < 0 o π6 6= 0.

Test 5. π7 = π8 = 0 (raız unitaria semestral) vs. π7 < 0 o π8 6= 0.

Test 6. π9 = π10 = 0 (raız unitaria en la frecuencia 5π/6) vs. π9 < 0 o π10 6= 0.

Test 7. π11 = π12 = 0 (raız unitaria anual) vs. π11 < 0 o π12 6= 0.

Test HEGY en R

En la librerıa uroot (disponible en https://r-forge.r-project.org/R/?group id=525;en Download hacer click en Windows multi-arch binary (.zip)) esta implemen-tada la prueba HEGY en la funcion HEGY.test() :

HEGY.test(wts,itsd,regvar=0,selectlags=list(mode="signf",Pmax=NULL))

wts la serie de tiempo sobre la cual se hara la prueba.

itsd para indicar la inclusion de componentes determinısticas en elmodelo de la prueba: componentes regulares (tendencia lineal), compo-nentes estacionales (variables indicadoras). Por ejemplo, itsd=c(0,0,c(0))indica que ningun intercepto, ni tendencia ni variables indicadoras seranincluidas, en cambio itsd=c(1,0,c(1,2,3)) indica que el intercepto ylas tres primeras indicadoras de la estacionalidad determinıstica seranincluidas.

regvar para especificar en una matriz otras variables regresoras a serincluidas en el modelo. Si no hay regresoras se especifica regvar=0 .

selectlags para especificar mediante una lista el metodo de selecciondel numero de rezagos p y el maximo de este parametro a considerar ental proceso de seleccion. Por ejemplo selectlags=list(mode="bic",Pmax=12)especifica que se use el criterio del BIC y un valor maximo para p de 12.Los metodos de seleccion disponibles son “aic", "bic", "signf" .

10.6.2. Test Canova-Hansen (CH)

Este test trata de determinar si los patrones estacionales presentes en unaserie son determinısticos y por tanto estables en el tiempo o por el contrario,siguen un proceso estocastico y por tanto no son estables a lo largo del tiempo,especıficamente, un proceso con raız unitaria estacional. Ası la hipotesis nula

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


de este test establece la estabilidad estructural de la componente estacional.El procedimiento considera el siguiente modelo de regresion,

Yt = β0 + β1t+

k∑

j=1

[αj sin

(2πjt

s

)+ γj cos

(2πjt

s

)]+ Et (10.15)

con k = s/2 con s par, donde el j−esimo par (sin (2πjt/s) , cos (2πjt/s)) corre-sponde a la j−esima frecuencia estacional armonica λj = 2πj/s. Recuerde quepara j = s/2, sin (2πjt/s) = sin(πt) = 0, y por tanto solo se requieren s− 1 coefi-cientes en la parte estacional representada con las funciones trigonometricas.Se requiere ademas que Yt no tenga raıces unitarias en la frecuencia cero conel fin de distinguir la no estacionariedad en las frecuencias estacionales y enla frecuencia cero. Si existe raız unitaria en la frecuencia cero, entonces seconsidera a ∇Yt = Yt − Yt−1 como la variable dependiente. Considere los vec-tores α = (α1, . . . , αs/2−1)

′ y γ = (γ1, . . . , γs/2−1)′. Bajo la hipotesis alterna, un

patron estacional cambiante puede conducir a la variacion en los vectores decoeficientes α y γ a lo largo del tiempo segun una caminata aleatoria, es de-cir, αt = αt−1 + ut y γt = γt−1 + vt, donde ut y vt son vectores aleatorios iidde media cero y tambien son independientes de Et. Para probar la estabilidadde los parametros estacionales se prueba que las autocovarianzas de ut y vt,respectivamente es cero mientras que bajo la hipotesis alterna, en cada caso,es mayor que cero, o equivalentemente

H0 : αt = α, γt = γ versus H1 : αt = αt−1 + ut, γt = γt−1 + vt (10.16)

El estadıstico de la prueba denominado L sugerido por Canova y Hansen notiene una distribucion estandar (como la t-Student, la normal estandar, la F ,por ejemplo) pero tiene p grados de libertad, donde p se deriva del numeroposible de raıces unitarias. Por ejemplo, si la estacionalidad determinıstica esprobada, solo se permiten p− 1 raıces unitarias estacionales bajo la hipotesisalternativa. El modelo en (10.15) tambien admite variables explicatorias quepodrıan incluir a Yt−1.

Test CH en R

El test CH esta disponible en la librerıa uroot , en la funcion CH.test() :

CH.test (wts,frec=NULL,f0=1,DetTr=FALSE,ltrunc=NULL)

donde

wts un objeto serie de tiempo el cual sera chequeado con este test.

frec un vector para especificar los ciclos estacionales a analizar. Pordefecto se incluyen todos. Para especificar se usa un vector de ceros y 1’sdonde 0 indica que tal frecuencia no sera considerada y 1 lo contrario.La posicion de cada frecuencia en el vector es como sigue: c(π/2, π) paraseries trimestrales y c(π/6, π/3, π/2, 2π/3, 5π/6, π) para series mensuales.

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


f0 con valor igual a 0 o 1, para indicar si se incluye (1) o no (0) el rezagode orden 1 de la variable dependiente en la regresion auxiliar.

DetTr Toma valor de TRUE o FALSE para indicar si se incluye o no unatendencia lineal determinıstica en la regresion auxiliar.

ltrunc parametro de truncamiento del rezago para calcular la matriz decovarianza de los residuales. Por defecto toma el valor de parte entera de(n/100)0.25 × s, donde n es la longitud de la serie y s la periodicidad de losdatos.

Se recomienda que para aplicar este test se elimine la tendencia de la serie encaso de existir, lo cual puede hacerse eliminando la componente Tt estimadamediante el filtro stl() visto en los primeros capıtulos y aplicamos el testsobre Wt = Yt − Tt, con los argumentos f0=0 y DetTr=FALSE .

10.7. Ejemplo

A continuacion vamos a modelar la serie de produccion trimestral de ce-mento portland, introducida en capıtulos previos. Desde que la serie presentavarianza no constante, trabajaremos el proceso de modelacion sobre el loga-ritmo. Se tiene un total de N = 155 observaciones pero se ajusta con n = 151para realizar validacion cruzada con las ultimas observaciones. En el Capıtulo8 se encontro como mejor modelo uno de tendencia cuadratica, estacionali-dad trimestral con variables indicadoras y errores con estructura AR(6). Estemodelo asume que la estacionalidad es determinıstica. Ahora, someteremosentonces esta serie a la modelacion con modelos ARIMA(p,d,q)× (P,D,Q)4.

Time

Y t

1960 1970 1980 1990

500

1000

1500

2000

Time

log(Y t)

1960 1970 1980 1990

6.57.0

7.5

Figura 10.8: Serie de produccion trimestral de cemento portland y su logaritmo

A continuacion examinamos las graficas de las diferencias regular y esta-cional ilustradas en la Figura 10.9. Como puede observarse existen todavıaalgunos cambios en la varianza y particularmente valores bastante distantes

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ

10.7. EJEMPLO 367

del resto al final de esta series. Sin embargo, las series ∇∇4 log(Yt) y ∇4∇ log(Yt)tienen una varianza mas estable y ademas estas dos series son las mismas, locual es de esperarse. Note tambien que aplicar solo la diferencia ∇ no eliminael patron estacional, mientras que aplicar solo una diferencia estacional, dejauna fuerte autocorrelacion entre valores consecutivos, lo que se refleja en elpatron cıclico.

Time

∇lo

g(Y

t)

1960 1970 1980 1990

−0.

2−

0.1

0.0

0.1

0.2

Time

∇4l

og(Y

t)

1960 1970 1980 1990

−0.

3−

0.1

0.0

0.1

0.2

Time

∇∇

4log

(Yt)

1960 1970 1980 1990

−0.

15−

0.05

0.05

0.15

Time

∇4∇

log(

Yt)

1960 1970 1980 1990

−0.

15−

0.05

0.05

0.15

Figura 10.9: Diferencias ∇, ∇4, ∇∇4 y ∇4∇ para el logaritmo de la produccion trimestral

de cemento portland.

En la Figura 10.10 se ilustran las ACF’s de las serie del logaritmo, suprimera diferencia regular, su diferencia estacional y de la diferencia ∇∇4.La ACF del logaritmo muestra un patron en el cual la autocorrelacion tantoen los rezagos no estacionales y estacionales decae lentamente. En la ACFde la primera diferencia se ve mas claramente que existe una fuerte autocor-relacion entre las observaciones separadas k = 4j, lo que evidencia la existen-cia de estacionalidad. En la ACF de la serie con la diferencia estacional vemosque este filtro no elimina la autocorrelacion intra perıodos mientras que en

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


la ACF de la serie filtrada estacional y regularmente se observa un patronestacionario.

0 5 10 15 20 25 30 35

−0.

50.

00.

5

Lag

AC

F

ACF de log(Yt)

0 5 10 15 20 25 30 35

−0.

6−

0.2

0.2

0.6

LagA

CF

ACF de ∇log(Yt)

0 5 10 15 20 25 30 35

−0.

40.

00.

20.

40.

6

Lag

AC

F

ACF de ∇4log(Yt)

0 5 10 15 20 25 30 35

−0.

3−

0.1

0.1

0.2

Lag

AC

F

ACF de ∇∇4log(Yt)

Figura 10.10: ACF’s para el logaritmo de la produccion de cemento portland y de sus

diferencias ∇, ∇4, ∇∇4.

A continuacion tratamos de identificar que posible proceso ARMA esta-cionario estacional sigue la serie ∇∇4 log(Yt). Para ello, examinamos su ACFy PACF y adicionalmente usamos la funcion R armasubsets() disponible enla librerıa TSA, esta funcion selecciona modelos ARMA con base en el criterioBIC y resulta util porque permite identificar rezagos autorregresivos y de me-dias moviles especıficos que son significativos en los modelos. Los resultadosse presentan graficamente en la Figura 10.11. Evaluemos inicialmente lo quesucede en los rezagos estacionales. Segun la PACF aparentemente existe unpatron de cola decreciente en rezagos estacionales y en la ACF puede ser unpatron de corte con cortes significativos en k = 4, 8; esto nos estarıa indicandoque para la parte estacional el modelo podrıa ser un MA de orden 2.

Para la parte regular nos concentramos en el comportamiento de los primerosrezagos, pero al ser tan pocos para el caso s = 4, no es facil distinguir patrones.

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ

10.7

.E

JE

MPLO

369

05

1015

2025

3035

−0.3 −0.1 0.0 0.1 0.2

Lag

ACF

AC

F de ∇

∇4 log(Y

t )

05

1015

2025

3035

−0.4 −0.2 0.0 0.1 0.2

Lag

Partial ACF

PAC

F de ∇

∇4 log(Y

t )

BIC

(Intercept)

test−lag1

test−lag2

test−lag3

test−lag4

test−lag5

test−lag6

test−lag7

test−lag8

test−lag9

test−lag10

test−lag11

test−lag12

error−lag1

error−lag2

error−lag3

error−lag4

error−lag5

error−lag6

error−lag7

error−lag8

error−lag9

error−lag10

error−lag11

error−lag12

−20

−33

−34

−36

−37

−37

−38

−39

Figu

ra1

0.1

1:A

CF,

PA

CF

yre

su

ltado

de

lafu

ncio

na

rma

sub

sets()

para∇∇

4sobre

el

logaritm

ode

lapro

du

ccio

nde

cem

en

toportla

nd.

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


Sin embargo, observe que si fuese un AR en la parte regular la PACF nos es-tarıa mostrando un orden p = 2, y si fuese un MA, la ACF tambien estarıamostrando que q = 2. Por otro lado no podemos descartar una ARMA ası quepodrıamos iniciar con un ARMA(2,2) en la parte regular.

Si examinamos la tabla arrojada por la funcion armasubsets() , vemos queen todos los modelos, menos el ultimo, aparece significativo el rezago autorre-gresivo de orden 2; el rezago 1 en la parte de medias moviles tambien apareceen los mejores modelos exceptuando el segundo, tambien resalta el rezagoen medias moviles de orden 4. Considerando solo los resultados para los dosprimeros modelos, parece que en la parte regular hay polinomio autorregresi-vo de orden 2 y puede que haya un polinomio de media movil de orden 1; enla parte estacional, como no aparecen en estos dos modelos rezagos autorre-gesivos en multiplos de cuatro o en 4j + k, k = 1, 2, 3, j = 1, 2, descartamos poreste medio un polinomio autorregresivo estacional. En cuanto al polinomiode medias moviles estacional puede ser de orden 1 o 2 ya que el rezago 4 demedias moviles parece significativo en la mayorıa de los modelos y el rezago 8solo en los dos primeros y el penultimo modelo.

Resumiendo, de los analisis anteriores, se pueden postular los siguientesmodelos para la serie log(Yt),

Modelo 1: log(Yt) ∼ ARIMA(2,1,0)× (0,1,2)4.



Modelo 4: log(Yt) ∼ ARIMA(2,1,1)× (0,1,2)4.Adicionalmente, se uso la funcion auto.arima() sobre ∇∇4 log(Yt), conel criterio del AIC. No se aplica esta funcion directamente sobre la seriesin diferenciar ya que internamente realiza el test CH de raız unitariaestacional y la presencia de raız unitaria regular puede hacer ineficienteel procedimiento. El modelo arrojado es ∇∇4 log(Yt) ∼ ARMA(0,3)× (2,1)4,luego tenemos que,


A seguir, se presentan las tablas de los ajustes de estos cinco modelos, susAIC’s (en escala log), sus medidas de precision de pronosticos para los ultimoscuatro valores de la serie (en escala real), los resultados de los testes Ljung-Box sobre los residuales de ajuste. ¿Que se concluye de estos resultados?

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ

10.7. EJEMPLO 371

Parametros estimados

Modelo 1

Parametro Estimacion s.e Z0 P (|Z| > |Z0|)φ1 -0.1615 0.0807 -2.0001 0.0455φ2 0.2382 0.0824 2.8892 0.0039Θ1 -0.7369 0.0972 -7.5773 0.0000Θ2 -0.1363 0.0974 -1.3997 0.1616

Modelo 2

Parametro Estimacion s.e Z0 P (|Z| > |Z0|)θ1 -0.1137 0.0849 -1.3399 0.1803θ2 0.2476 0.0847 2.9249 0.0034Θ1 -0.6581 0.0959 -6.8594 0.0000Θ2 -0.2036 0.0914 -2.2285 0.0259

Modelo 3

Parametro Estimacion s.e Z0 P (|Z| > |Z0|)φ1 -0.6921 0.4204 -1.6464 0.0997φ2 -0.3340 0.3177 -1.0511 0.2932θ1 0.5472 0.3972 1.3778 0.1683θ2 0.5135 0.2416 2.1252 0.0336Θ1 -0.6545 0.1349 -4.8533 0.0000Θ2 -0.2133 0.1260 -1.6929 0.0905

Modelo 4

Parametro Estimacion s.e Z0 P (|Z| > |Z0|)φ1 -0.2935 0.2698 -1.0876 0.2768φ2 0.2132 0.1018 2.0953 0.0361θ1 0.1388 0.2678 0.5181 0.6044Θ1 -0.7513 0.1052 -7.1450 0.0000Θ2 -0.1241 0.1037 -1.1972 0.2312

Modelo 5

Parametro Estimacion s.e Z0 P (|Z| > |Z0|)θ1 -0.1890 0.0859 -2.2010 0.0277θ2 0.2562 0.0878 2.9163 0.0035θ3 -0.2239 0.1016 -2.2042 0.0275Φ1 0.1298 0.0968 1.3413 0.1798Φ2 -0.2573 0.0914 -2.8156 0.0049Θ1 -0.8206 0.0582 -14.1002 0.0000

AIC’s Modelos 1 a 5 (escala log)

Modelo 1 Modelo 2 Modelo 3 Modelo 4 Modelo 5

-499.9882 -498.3687 -498.3162 -498.2444 -503.7367

Medidas de precision de pronosticos (escala original)

Modelo ME RMSE MAE MPE MAPE

1 149.4414 177.5695 149.4414 8.1460 8.14602 146.2509 175.5318 146.2509 7.9567 7.95673 157.4289 184.6768 157.4289 8.6080 8.60804 151.4899 179.1132 151.4899 8.2657 8.26575 182.5585 209.3829 182.5585 10.0441 10.0441

Test de Normalidad Shapiro Wilks

Modelos

1 2 3 4 5

Estadıstico 0.9774 0.9794 0.9731 0.9770 0.9846Valor P 0.0137 0.0228 0.0046 0.0125 0.0920

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


Test Ljung-Box

Modelo 1 Modelo 2


m > QLB)6 4.7462 6.0000 0.5767 5.9699 6.0000 0.4266

12 13.3704 12.0000 0.3427 12.4091 12.0000 0.413418 20.2747 18.0000 0.3176 18.5562 18.0000 0.419624 24.9259 24.0000 0.4098 22.4213 24.0000 0.554130 28.5152 30.0000 0.5432 25.1747 30.0000 0.716536 35.9964 36.0000 0.4688 31.0833 36.0000 0.7014

Modelo 3 Modelo 4


m > QLB)6 3.0932 6.0000 0.7971 4.7633 6.0000 0.5745

12 10.6008 12.0000 0.5634 13.7165 12.0000 0.319218 18.1481 18.0000 0.4459 20.7533 18.0000 0.292024 23.1214 24.0000 0.5126 25.5099 24.0000 0.378530 27.5799 30.0000 0.5927 29.3338 30.0000 0.500136 35.4124 36.0000 0.4964 37.0788 36.0000 0.4190

Modelo 5


6 3.2693 6.0000 0.774412 9.0008 12.0000 0.702918 14.2987 18.0000 0.709424 17.8387 24.0000 0.810830 20.2943 30.0000 0.908736 27.7392 36.0000 0.8364

A continuacion se presentan resultados graficos para valoracion de ajustes,pronosticos, y validacion de supuestos. ¿Que se concluye de estas graficas?

Producción trimestral de CementoPronósticos modelo 1

Time

Yt

1960 1970 1980 1990

500

1000

1500

2000

Realizaciónpronosticado zona naranja

Figura 10.12: Ajuste y pronosticos de la produccion de cemento portland con Modelo SARI-

MA 1.

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ

10.7. EJEMPLO 373


Time

Yt

1960 1970 1980 1990

500

1000

1500

2000



Time

Yt

1960 1970 1980 1990

500

1000

1500

2000



Time

Yt

1960 1970 1980 1990

500

1000

1500

2000



Time

Yt

1960 1970 1980 1990

500

1000

1500

2000


Figura 10.13: Ajuste y pronosticos de la produccion de cemento portland con Modelo SARI-

MA 2 a 5.

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


1400

1500

1600

1700

1800

1900

Time

Pro

ducc

ión

1993.Q4 1994.Q1 1994.Q2 1994.Q3

Serie OriginalPronóstico Modelo 1Pronóstico Modelo 2Pronóstico Modelo 3Pronóstico Modelo 4Pronóstico Modelo 5

Figura 10.14: Comparacion de los pronosticos en escala original, de los modelos SARIMA 1

a 5 ajustados al logaritmo de la produccion de cemento portland con Modelo.ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ

10.7. EJEMPLO 375

Time

resi

dual

s(m

odsa

rima1

)

1960 1970 1980 1990

−0.

100.

000.

10

6.2 6.4 6.6 6.8 7.0 7.2 7.4 7.6

−0.

100.

000.

10

fitted(modsarima1)

resi

dual

s(m

odsa

rima1

)

Time

resi

dual

s(m

odsa

rima2

)

1960 1970 1980 1990

−0.

100.

000.

10

6.2 6.4 6.6 6.8 7.0 7.2 7.4 7.6

−0.

100.

000.

10

fitted(modsarima2)

resi

dual

s(m

odsa

rima2

)

Time

resi

dual

s(m

odsa

rima3

)

1960 1970 1980 1990

−0.

100.

000.

10

6.2 6.4 6.6 6.8 7.0 7.2 7.4 7.6

−0.

100.

000.

10

fitted(modsarima3)

resi

dual

s(m

odsa

rima3

)

Time

resi

dual

s(m

odsa

rima4

)

1960 1970 1980 1990

−0.

100.

000.

10

6.2 6.4 6.6 6.8 7.0 7.2 7.4 7.6

−0.

100.

000.

10

fitted(modsarima4)

resi

dual

s(m

odsa

rima4

)

Figura 10.15: Graficos de residuales de ajuste de los modelos SARIMA 1 a 4 ajustados al

logaritmo de la produccion de cemento portland con Modelo.

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


0 5 10 15 20 25 30 35

−0.

20.

00.

2

Lag

AC

F

ACF residuos Modelo 1

0 5 10 15 20 25 30 35

−0.

150.

000.

15

Lag

Par

tial A

CF

PACF residuos Modelo 1

0 5 10 15 20 25 30 35

−0.

20.

00.

2

Lag

AC

F


0 5 10 15 20 25 30 35

−0.

150.

000.

15

Lag

Par

tial A

CF


0 5 10 15 20 25 30 35

−0.

20.

00.

2

Lag

AC

F


0 5 10 15 20 25 30 35

−0.

150.

000.

15

Lag

Par

tial A

CF


0 5 10 15 20 25 30 35

−0.

20.

00.

2

Lag

AC

F


0 5 10 15 20 25 30 35

−0.

150.

000.

15

Lag

Par

tial A

CF


Figura 10.16: ACF’s y PACF’s para residuales de ajuste de los modelos SARIMA 1 a 4

ajustados al logaritmo de la produccion de cemento portland con Modelo.

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ

10.7. EJEMPLO 377

Time

resi

dual

s(m

odsa

rima5

)

1960 1970 1980 1990

−0.

100.

05

6.2 6.4 6.6 6.8 7.0 7.2 7.4

−0.

100.

05

fitted(modsarima5)

resi

dual

s(m

odsa

rima5

)

0 5 10 15 20 25 30 35

−0.

10.

1

Lag

AC

F


0 5 10 15 20 25 30 35−

0.15

0.05

Lag

Par

tial A

CF


Figura 10.17: Graficos de residuales de ajuste y su ACF y PACF, modelo SARIMA 5 para el

logaritmo de la produccion de cemento portland con Modelo.

Finalmente, se presentan los resultados de las pruebas HEGY y CH pararaıces unitarias estacionales.

Salida R 10.1.

---- ----HEGY test---- ----Null hypothesis: Unit root.Alternative hypothesis: Stationarity.

----HEGY statistics:

Stat. p-valuetpi_1 2.017 0.1tpi_2 -0.773 0.1Fpi_3:4 0.678 0.1Fpi_2:4 0.650 NAFpi_1:4 1.491 NA

El anterior test no rechaza ninguna de las hipotesis nula, es decir, que parala serie de log(Yt), hay raız unitaria no estacional o en la frecuencia 0 (ver re-sultados para tpi 1), hay raız unitaria estacional semestral o en la frecuenciaπ (resultados en tpi 2) y hay raız unitaria estacional en las frecuencias π/2 y3π/2 (resultados en tpi 3:4 ). En resumen la serie log(Yt) tiene tanto raız uni-taria en la tendencia como estacional, luego es apropiado ajustar un modeloSARIMA a esta serie.

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


Vea a continuacion los resultados del test CH aplicado sobre la serie Wt =log(Yt) − Tt, donde Tt es la componente de tendencia de la serie log(Yt) filtra-da con stl() . De estos resultados podemos concluir que para un valor delestadıstico de la prueba L = 1.734 y un nivel de significancia de 0.05 es re-chazada la hipotesis nula de componente estacional determinıstica en favorde una componente estacional con raız unitaria que corresponde a la inesta-bilidad de tal componente.

Salida R 10.2.

------ - ------ ----Canova & Hansen test------ - ------ ----Null hypothesis: Stationarity.Alternative hypothesis: Unit root.Frequency of the tested cycles: pi/2 , pi ,

L-statistic: 1.734Lag truncation parameter: 4

Critical values:0.10 0.05 0.025 0.01

0.846 1.01 1.16 1.35

10.7.1. Programacion R usada en Ejemplo

Codigo R 10.1.

library(TSA)library(forecast)library(uroot)

BP.LB.test=function(serie,maxlag,type="Box"){aux=floor(maxlag/6);X.squared=c(rep(NA,aux))df=c(rep(NA,aux))p.value=c(rep(NA,aux))for(i in 1:aux){test=Box.test(serie,lag=(6 * i),type=type)X.squared[i]=test[[1]]df[i]=test[[2]]p.value[i]=test[[3]]}lag=6 * c(1:aux)teste=as.data.frame(cbind(X.squared,df,p.value))rownames(teste)=lagteste}#################################################################################LECTURA DE LOS DATOS, DEFINICION DE VARIABLES Y GRAFICACION DE LA SERIE################################################################################yt=scan()465 532 561 570 529 604 603 582 554 620 646637 573 673 690 681 621 698 753 728 688 737782 692 637 757 783 757 674 734 835 838 797904 949 975 902 974 969 967 849 961 966 922836 998 1025 971 892 973 1047 1017 948 10321190 1136 1049 1134 1229 1188 1058 1209 11991253 1070 1282 1303 1281 1148 1305 1342 1452

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ

10.7. EJEMPLO 379

1184 1352 1316 1353 1121 1297 1318 1281 11091299 1341 1290 1101 1284 1321 1317 1122 12611312 1298 1202 1302 1377 1359 1232 1386 14401439 1282 1573 1533 1651 1347 1575 1475 13571086 1158 1279 1313 1166 1373 1456 1496 12511456 1631 1554 1347 1516 1546 1564 1333 14581499 1613 1416 1625 1770 1791 1622 1719 19721893 1575 1644 1658 1668 1343 1441 1444 14971267 1501 1538 1569 1450 1569 1648 1777 14681732 1962

yt=ts(yt,frequency=4,start=c(1956,1))lnyt=log(yt)

win.graph(width=12,height=6)nf=layout(cbind(c(1,1),c(2,2)))plot(yt,ylab=expression(Y[t]))plot(lnyt,ylab=expression(log(Y[t])))

#Valores de la serie log para los ajustesm=4n=length(yt)-myt2=ts(yt[1:n],frequency=4,start=c(1956,1))lnyt2=log(yt2)

dif1dif4lnyt2=diff(diff(lnyt2,4),1) #serie log con diferencia y diferencia estacional

#################################################################################GRAFICAS PARA LA DISTINTAS DIFERENCIAS PRESENTADAS PARA EL LOG DE LA SERIE################################################################################nf=layout(rbind(c(1,2),c(3,4)))#Grafica de la primera diferenciaplot(diff(lnyt2),ylab=expression(paste(nabla,sep="",log(Y[t]))))abline(h=mean(diff(lnyt2)))

#Grafica de la primera diferencia estacional trimestralplot(diff(lnyt2,4),ylab=expression(paste(nabla[4],sep="",log(Y[t]))))abline(h=mean(diff(lnyt2,4)))

#Graficas de las diferencias regular y estacional combinadasplot(diff(diff(lnyt2,4),1),ylab=expression(paste(nabla,sep="",nabla[4],sep="",log(Y[t]))))abline(h=mean(diff(diff(lnyt2,4),1)))plot(diff(diff(lnyt2,1),4),ylab=expression(paste(nabla[4],sep="",nabla,sep="",log(Y[t]))))abline(h=mean(diff(diff(lnyt2,1),4)))

#ACF’s y PACF’s para la diferenciasnf=layout(rbind(c(1,2),c(3,4)))acf(as.numeric(lnyt2),ci.type="ma",lag.max=36,main=expression(paste("ACF de",sep=" ",log(Y[t]))))

acf(as.numeric(diff(lnyt2)),ci.type="ma",lag.max=36,main=expression(paste("ACF de",sep=" ",nabla,sep="",log(Y[t]))))

acf(as.numeric(diff(lnyt2,4)),ci.type="ma",lag.max=36,main=expression(paste("ACF de",sep=" ",nabla[4],sep="",log(Y[t]))))

acf(as.numeric(dif1dif4lnyt2),ci.type="ma",lag.max=36,main=expression(paste("ACF de",sep=" ",nabla,sep="",nabla[4],sep="",log(Y[t]))))

#Graficas de ACF y PACF de la diferencia combinada mas resultados de#la funcion armasubsetswin.graph(width=12,height=16)nf=layout(rbind(c(1,1),c(2,2),c(3,3)))acf(as.numeric(dif1dif4lnyt2),ci.type="ma",lag.max=36,main=expression(paste("ACF de",sep=" ",nabla,sep="",nabla[4],sep="",log(Y[t]))))

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


pacf(as.numeric(dif1dif4lnyt2),lag.max=36,main=expression(paste("PACF de",sep=" ",nabla,sep="",nabla[4],sep="",log(Y[t]))))

res=armasubsets(y=dif1dif4lnyt2,nar=12,nma=12,y.name=’test’,ar.method=’ml’)plot(res)

#################################################################################AJUSTE DE MODELOS IDENTIFICADOS#################################################################################Modelo1modsarima1=Arima(lnyt2,order=c(2,1,0),seasonal=list(order=c(0,1,2)))modsarima1

#Calculo estad´ıstico Z0 y valores Pest=cbind(Estimacion=modsarima1$coef,s.e=sqrt(diag(modsarima1$var.coef)))z0=est[,1]/est[,2]vp=pnorm(abs(z0),lower.tail=FALSE)+pnorm(-abs(z0))

#################################################################################Modelo 2modsarima2=Arima(lnyt2,order=c(0,1,2),seasonal=list(order=c(0,1,2)))modsarima2






#################################################################################Modelo 5auto.arima(dif1dif4lnyt2) #arroja un ARMA(0,3) * (2,1)_4 estacionario

#Se ajusta ARIMA(0,1,3) * (2,1,1)_4 a la serie del logmodsarima5=Arima(lnyt2,order=c(0,1,3),seasonal=list(order=c(2,1,1)))modsarima5


#################################################################################PRONOSTICOS EN ESCALA ORIGINAL, SUS GRAFICAS Y PRECISI ON#################################################################################Modelo 1

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ

10.7. EJEMPLO 381

predmodsarima1=exp(as.data.frame(forecast(modsarima1,h=m,level=95)))

#Precision pronosticosaccuracy(predmodsarima1[,1],yt[(n+1):length(yt)])

plot(yt,ylab=expression(Y[t]),,main="Produccion trimestral de Cemento\nPronosticos modelo 1")lines(exp(fitted(modsarima1)),col=2)

#Para graficar bandas de prediccion sombreadaxx1=c(time(yt)[(n+1):length(yt)],rev(time(yt)[(n+1):length(yt)]))yy1=c(predmodsarima1[,2],rev(predmodsarima1[,3]))polygon(xx1, yy1, col="orange", border = "orange")lines(time(yt)[(n+1):length(yt)],predmodsarima1[,1],lty=1,col=2,lwd=1)lines(time(yt)[(n+1):length(yt)],log(yt)[(n+1):length(yt)],lty=1,col=2,lwd=2)legend("topleft",legend=c("Realizacion","pronosticado zona naranja"),lwd=c(2,2),col=c(2,1))

#################################################################################Modelo 2predmodsarima2=exp(as.data.frame(forecast(modsarima2,h=m,level=95)))











#Para graficar bandas de prediccion sombreadaxx1=c(time(yt)[(n+1):length(yt)],rev(time(yt)[(n+1):length(yt)]))yy1=c(predmodsarima4[,2],rev(predmodsarima4[,3]))

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


polygon(xx1, yy1, col="orange", border = "orange")lines(time(yt)[(n+1):length(yt)],predmodsarima4[,1],lty=1,col=2,lwd=1)lines(time(yt)[(n+1):length(yt)],log(yt)[(n+1):length(yt)],lty=1,col=2,lwd=2)legend("topleft",legend=c("Realizacion","pronosticado zona naranja"),lwd=c(2,2),col=c(2,1))





#################################################################################COMPARANDO GRAFICAMENTE TODOS LOS PRONOSTICOS EN LA ESCALA ORIGINAL################################################################################win.graph(height=6,width=6)matplot(152:155,cbind(yt[(n+1):length(yt)],predmodsarima1[,1],predmodsarima2[,1],predmodsarima3[,1],predmodsarima4[,1],predmodsarima5[,1]),xlab="Time",ylab="Produccion",col=1,type="b",pch=c(19,1:5),xaxt=’n’,lwd=2)

axis(1,at=152:155,labels=c("1993.Q4","1994.Q1","1994.Q2","1994.Q3"))

legend("topleft",legend=c("Serie Original","Pronostico Modelo 1","Pronostico Modelo 2","Pronostico Modelo 3","Pronostico Modelo 4","Pronostico Modelo 5"),pch=c(19,1:5),bty="n")

################################################################################COMPARANDO LOS AJUSTES SEGUN AIC, EN ESCALA LOG###############################################################################AICs=cbind(AICmod1=AIC(modsarima1),AICmod2=AIC(modsarima2),AICmod3=AIC(modsarima3),AICmod4=AIC(modsarima4),AICmod5=AIC(modsarima5))AICs

#################################################################################GRAFICAS PARA ANALISIS DE RESIDUALES#################################################################################Graficos de residuales Modelos 1 a 4win.graph(width=14,height=16)nf=layout(rbind(c(1,2),c(3,4),c(5,6),c(7,8)))plot(residuals(modsarima1))abline(h=0)plot(fitted(modsarima1),residuals(modsarima1))abline(h=0)plot(residuals(modsarima2))abline(h=0)plot(fitted(modsarima2),residuals(modsarima2))abline(h=0)plot(residuals(modsarima3))abline(h=0)plot(fitted(modsarima3),residuals(modsarima3))abline(h=0)plot(residuals(modsarima4))abline(h=0)plot(fitted(modsarima4),residuals(modsarima4))

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ

10.7. EJEMPLO 383

abline(h=0)

#Graficos de ACF y PACF Modelos 1 a 4win.graph(width=16,height=16)nf=layout(rbind(c(1,2),c(3,4),c(5,6),c(7,8)))acf(as.numeric(residuals(modsarima1)),ci.type="ma",lag.max=36,main="ACF residuos Modelo 1")pacf(as.numeric(residuals(modsarima1)),lag.max=36,main="PACF residuos Modelo 1")acf(as.numeric(residuals(modsarima2)),ci.type="ma",lag.max=36,main="ACF residuos Modelo 2")pacf(as.numeric(residuals(modsarima2)),lag.max=36,main="PACF residuos Modelo 2")acf(as.numeric(residuals(modsarima3)),ci.type="ma",lag.max=36,main="ACF residuos Modelo 3")pacf(as.numeric(residuals(modsarima3)),lag.max=36,main="PACF residuos Modelo 3")acf(as.numeric(residuals(modsarima4)),ci.type="ma",lag.max=36,main="ACF residuos Modelo 4")pacf(as.numeric(residuals(modsarima4)),lag.max=36,main="PACF residuos Modelo 4")

#Graficas de residuales, y ACF y PACF Modelo 5win.graph(width=8,height=5)nf=layout(rbind(c(1,2),c(3,4)))plot(residuals(modsarima5))abline(h=0)plot(fitted(modsarima5),residuals(modsarima5))abline(h=0)acf(as.numeric(residuals(modsarima5)),ci.type="ma",lag.max=36,main="ACF residuos Modelo 5")pacf(as.numeric(residuals(modsarima5)),lag.max=36,main="PACF residuos Modelo 5")

#################################################################################PRUEBAS LJUNG-BOX SOBRE RESIDUOS MODELOS AJUSTADOS################################################################################BP.LB.test(residuals(modsarima1),36,type="Ljung")BP.LB.test(residuals(modsarima2),36,type="Ljung")BP.LB.test(residuals(modsarima3),36,type="Ljung")BP.LB.test(residuals(modsarima4),36,type="Ljung")BP.LB.test(residuals(modsarima5),36,type="Ljung")

#################################################################################PRUEBAS SHAPIRO WILK SOBRE RESIDUOS MODELOS AJUSTADOS################################################################################shapiro.test(residuals(modsarima1))shapiro.test(residuals(modsarima2))shapiro.test(residuals(modsarima3))shapiro.test(residuals(modsarima4))shapiro.test(residuals(modsarima5))

#################################################################################Test HEGY para la serie del logaritmo################################################################################HEGY.test(wts=lnyt2,itsd=c(0,0,c(0)),selectlags=list(mode="aic", Pmax=12))

#################################################################################Test CH para la serie del logaritmo################################################################################Tt=stl(lnyt2,s.window="periodic")[[1]][,2]wt=lnyt2-Tt

CH.test(wt,f0=0,DetTr=FALSE)

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ

Apendice A

Funciones R

A.1. Funcion decompose: Descomposicion estacional clasica

mediante medias moviles

Esta funcion R descompone una serie de tiempo en sus componentes detendencia, estacionalidad y componente de error utilizando medias moviles,para series de componentes aditivas o multiplicativas. Su sintaxis general esla siguiente:

decompose(x, type = c("additive", "multiplicative"), filt er = NULL)

donde,

x: Es un serie de tiempo (objeto del tipo ts )

type: El tipo de componente estacional, aditiva (“additive ”) segun mod-elo en (2.1) o multiplicativa ("multiplicative" ) segun modelo en (2.2);

filter: Un vector de coeficientes de filtramiento dados en orden inversodel tiempo (como para los coeficientes AR o MA), usado para filtrar lacomponente estacional. Si su valor es NULL, entonces la funcion aplicauna media movil con ventana simetrica.

La funcion procede de la siguiente manera: Primero halla la componente detendencia usando una media movil (si filter es igual a NULL, decomposeusa una ventana simetrica con pesos iguales, es decir, calcula las mediasmoviles bilaterales) y la remueve de la serie restandola de la serie original(caso aditivo) o dividiendo la serie original por esta componente. Luego, lacomponente estacional es calculada mediante promedios para cada estacionsobre todos los periodos. Esta componente es luego centrada para que los fac-tores estacionales sumen cero (caso aditivo) o normalizados dividiendo por elpromedio de los factores estacionales crudos (caso multiplicativo). Finalmente,la componente de error es obtenida eliminando de la serie original la tenden-cia y la estacionalidad, para esto, si la serie es aditiva, a los datos originales le

385

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ

386 APENDICE A. FUNCIONES R

resta las componentes de tendencia y estacionalidad, y en el caso multiplica-tivo, divide la serie original por el producto de las componentes de tendenciay estacionalidad.

Valor: La funcion decompose produce un objeto Rde la clase "decomposed.ts"que tiene los siguientes componentes:

seasonal: La componente estacional para t = 1, · · · , n;

figure: Solo los s factores estacionales estimados ;

trend: La componente de tendencia;

random El error o resto de la serie;

type: El valor especificado para el tipo de serie.

Ejemplo: Considere la serie presentada en la Figura A.1;

Codigo R A.1.

yt=scan()154 96 73 49 36 59 95 169 210 278 298 245200 118 90 79 78 91 167 169 289 347 375 203223 104 107 85 75 99 135 211 335 460 488 326346 261 224 141 148 145 223 272 445 560 612 467518 404 300 210 196 186 247 343 464 680 711 610613 392 273 322 189 257 324 404 677 858 895 664628 308 324 248 272


descom=decompose(yt,type="multiplicative")descom$seasonal #produce los siguientes datos

Jan Feb Mar Apr May Jun Jul1965 1.3262761 0.8516414 0.6680514 0.5296497 0.4422268 0.4887194 0.70078261966 1.3262761 0.8516414 0.6680514 0.5296497 0.4422268 0.4887194 0.70078261967 1.3262761 0.8516414 0.6680514 0.5296497 0.4422268 0.4887194 0.70078261968 1.3262761 0.8516414 0.6680514 0.5296497 0.4422268 0.4887194 0.70078261969 1.3262761 0.8516414 0.6680514 0.5296497 0.4422268 0.4887194 0.70078261970 1.3262761 0.8516414 0.6680514 0.5296497 0.4422268 0.4887194 0.7007826

Aug Sep Oct Nov Dec1965 0.8660279 1.3621465 1.7570249 1.8533501 1.15410341966 0.8660279 1.3621465 1.7570249 1.8533501 1.15410341967 0.8660279 1.3621465 1.7570249 1.8533501 1.15410341968 0.8660279 1.3621465 1.7570249 1.8533501 1.15410341969 0.8660279 1.3621465 1.7570249 1.8533501 1.15410341970 0.8660279 1.3621465 1.7570249 1.8533501 1.1541034

descom$figure #produce los siguientes datos[1] 1.3262761 0.8516414 0.6680514 0.5296497 0.4422268 0.4887194 0.7007826[8] 0.8660279 1.3621465 1.7570249 1.8533501 1.1541034

descom$trend #produce los siguientes datosJan Feb Mar Apr May Jun Jul Aug

1965 NA NA NA NA NA NA 148.7500 151.58331966 165.5833 168.5833 171.8750 178.0417 184.1250 185.5833 184.7917 185.16671967 185.5833 186.0000 189.6667 196.2917 205.7083 215.5417 225.7917 237.45831968 272.0000 278.2083 285.3333 294.0833 303.4167 314.4583 327.5000 340.62501969 367.0833 371.0417 374.7917 380.5833 389.7083 399.7917 409.7083 413.1667

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ

A.1. FUNCION DECOMPOSE 387

1970 428.2917 434.0417 445.4583 461.7500 476.8333 486.7500 489.6250 486.75001971 NA NA NA NA NA

Sep Oct Nov Dec1965 153.2083 155.1667 158.1667 161.25001966 185.2917 186.2500 186.3750 186.58331967 248.8750 256.0833 261.4583 266.41671968 349.7500 355.7917 360.6667 364.37501969 411.5417 415.0833 419.4583 422.12501970 485.3750 484.4167 484.7917 NA1971

descom$random #produce los siguientes datosJan Feb Mar Apr May Jun Jul

1965 NA NA NA NA NA NA 0.91134611966 0.9107086 0.8218842 0.7838265 0.8377545 0.9579366 1.0033278 1.28958741967 0.9060078 0.6565437 0.8444675 0.8175764 0.8244499 0.9398193 0.85318371968 0.9591207 1.1015739 1.1751293 0.9052322 1.1030043 0.9435074 0.97165091969 1.0639744 1.2785036 1.1981784 1.0417916 1.1372902 0.9519620 0.86027811970 1.0791627 1.0604688 0.9173725 1.3166195 0.8962932 1.0803577 0.9442742

Aug Sep Oct Nov Dec1965 1.2873700 1.0062667 1.0196907 1.0165853 1.31650241966 1.0538821 1.1450333 1.0603647 1.0856408 0.94271081967 1.0260374 0.9881883 1.0223477 1.0070705 1.06025791968 0.9220628 0.9340679 0.8958068 0.9155624 1.11051291969 0.9585990 0.8277141 0.9323859 0.9145834 1.25211451970 0.9583928 1.0239705 1.0080691 0.9961172 NA

descom$type #arroja la siguiente informacion[1] "multiplicative"

#Graficando la serie original y su descomposicionwin.graph(width=4,height=5,pointsize=8)plot(descom)

200

400

600

800

obse

rved

150

250

350

450

tren

d

0.4

0.8

1.2

1.6

seas

onal

0.7

0.9

1.1

1.3

1965 1966 1967 1968 1969 1970 1971

rand

om

Time

Decomposition of multiplicative time series

Figura A.1: Descomposicion de una serie multiplicativa. Fuente:O.D. Anderson (1976)

and O’Donovan (1983). Ventas mensuales companıa X, ene 65 - may 71.

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


A.2. Funcion nls: Mınimos cuadrados no lineales

Esta funcion estima por mınimos cuadrados los parametros de modelos nolineales. Su sintaxis es como sigue:

nls(formula,data,start,control,algorithm,trace,subset,weights,na.action,model,lower,upper, ...)

formula : Formula aritmetica del modelo no lineal incluyendo variables yparametros.

data : Un data frame opcional que contiene las variables especificadas endata y los pesos weight (para mınimos cuadrados no lineales ponder-ados). Puede ser tambien un objeto lista o un ambiente R pero no unamatriz.

start : Un objeto lista de R para especificar los valores iniciales de losparametros a estimar, nombrados usando el mismo nombre dado a cadauno en formula .

control : Una lista R para ajustar algunos valores de control del algorit-mo tales como el maximo de iteraciones, la tolerancia para el criterio deconvergencia del algoritmo, entre otros. Este argumento tiene valores pordefecto. Ver ayuda R, nls.control .

algorithm : Una cadena de caracteres para especificar el metodo numeri-co a usar. Por defecto es el metodo de Gauss-Newton.

trace : Un valor logico (FALSE o TRUE) que indica si se debe imprimir losresultados de cada iteracion. Por defecto es FALSE.

subset : Un vector opcional para especificar un subconjunto de observa-ciones a ser usadas para el proceso de ajuste.

weights : Un vector numerico opcional de pesos fijos cuando se va a re-alizar mınimos cuadrados ponderados.

na.action : Una funcion que indica que se debe hacer cuando los datoscontienen observaciones NA’s (datos faltantes), por defecto produce unmensaje de error en caso de datos faltantes. Puede modificarse a na.action=na.omitpara excluir las observaciones incompletas. ver mas en ayuda R.

model : Un argumento logico para exhibir o no el modelo. Por defecto esFALSE.

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ

A.3. FUNCION STL: DESCOMPOSICION USANDO LOESS 389

A.3. Funcion stl: Descomposicion usando LOESS

STL es un metodo para estimar las componentes de tendencia y estacional-idad en series estacionales aditivas y multiplicativas. Consiste en una apli-cacion iterativa de la regresion local LOESS. Es necesario que el objeto sobreel cual se desea aplicar la funcion stl() sea un objeto de serie de tiempo, conla frecuencia de 52 (serie semanal), 4 (serie trimestral) o 12 (serie mensual).La sintaxis es como sigue:

stl(x, s.window, s.degree = 0,t.window = NULL, t.degree = 1,l.window = nextodd(period), l.degree = t.degree,s.jump = ceiling(s.window/10),t.jump = ceiling(t.window/10),l.jump = ceiling(l.window/10),robust = FALSE,inner = if(robust) 1 else 2,outer = if(robust) 15 else 0,na.action = na.fail)

donde,

x : Es una serie de tiempo univariada creada con funcion ts() y de fre-cuencia mayor a 1.

s.window : se especifica como “periodic ” o bien, un entero impar indi-cando el ancho de la ventana de la regresion loess para la extraccion dela componente estacional

s.degree : El grado del polinomio ajustado localmente en la extraccionde la componente estacional. Debe ser cero o uno.

t.window : Un numero impar para indicar el ancho de la ventana loessa usar para la extraccion de la tendencia, por defecto es ajustada comonextodd(ceiling((1.5 * period) / (1-(1.5/s.window)))) .

t.degree : el grado del polinomio local a usar en la extraccion de la ten-dencia, solo puede ser cero o uno.

l.window : El ancho de la ventana loess para el filtro de las subseries dela estacionalidad. Por defecto, es el impar mas pequeno que es mayor ala frecuencia de la serie.

l.degree : El grado del polinomio ajustado localmente para la filtracionde las subseries de la estacionalidad. Puede ser cero o uno.

s.jump, t.jump, l.jump : Valores enteros indicando la velocidad de in-cremento del respectivo suavizador.

robust : Un valor logico (TRUE o FALSE) para indicar si debe usarse unajuste robusto en el procedimiento loess.

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ


inner, outer : el numero de iteracciones “dentro” y “fuera”, respectiva-mente, en las estimaciones robustas.

na.action : Accion a realizar con valores faltantes.

Este procedimiento halla la componente estacional ajustando por loess lassubseries de cada estacion; si s.window = “periodic ” el suavizamiento esreemplazado tomando medias. Los valores estacionales son removidos y luegola serie resultante es suavizada para hallar la tendencia. El nivel global esremovido de la componente estacional y sumado a la tendencia. Este proce-so es repetido iterativamente varias veces. La componente de error es halladaluego por diferencia de la serie original menos la tendencia y estacionalidadajustadas.

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ

Bibliografıa

[1] Campos Santillan, T., Problemario de Pronosticos para la Toma de Deci-

siones. Thomson Learning, Mexico, 2001.

[2] Cryer, J. D and Chan, K-S., Time Series Analysis With Applications in R.2nd ed. Springer, New York, 2008.

[3] Diebold, F., Elementos de Pronosticos. Thomson Learning, Mexico, 2001.

[4] Gaynor, P. E and Kirkpatrick, R. C., Introduction to Time-Series Model-

ing and Forecasting in Business and Economics. McGrawh-Hill, Inc. NewYork, 1994.

[5] Guerrero V. M. Analisis Estadıstico de Series de Tiempo Economicas 2.ed. Thompson Learning, Mexico, 2003.

[6] Hylleberg, S., Engle, R. F, Granger, C. W. J and Yoo, B. S. (1990). Sea-sonal Integration and Cointegration. “Journal of Econometrics”, 44, 215-238.

[7] Makridakis, Wheelwright and McGee Forecasting: Methods and Applica-

tions. Wiley, 1983.

[8] Martinez J. Modelos Box Jenkins. Curso introductorio. II Simposio de Es-tadıstica, Analisis de Series temporales, Departamento de Estadıstica,Facultad de Ciencias, Universidad Nacional de Colombia, Bogota, 1991.

[9] Wei, William W. S. Time Series Analysis. Univariate and Multivariate

Methods. Addison-Wesley Publishing Company, Inc., New York, 1990.

391

ESTADÍSTIC

A III - 3

0091

37

NELFI G

ONZÁLEZ

Documents

NOTASDECLASEESTADISTICAIIIv.01