22
Ver. 27/10/2022, Pag. # 1 Econometría II Análisis de series temporales (I): Procesos estacionarios Miguel Jerez y Sonia Sotoca Universidad Complutense de Madrid Marzo 2010

Series1 - Analisis de series temporales

Embed Size (px)

Citation preview

Page 1: Series1 - Analisis de series temporales

Ver. 14/04/2023, Pag. # 1

Econometría IIAnálisis de series temporales (I): Procesos estacionarios

Miguel Jerez y Sonia Sotoca

Universidad Complutense de Madrid

Marzo 2010

Page 2: Series1 - Analisis de series temporales

Ver. 14/04/2023, Pag. # 2

• Introducción

• Conceptos básicos

• Procesos elementales

• Identificación

• Anexo: Estudio de los procesos más comunes

Índice:

Page 3: Series1 - Analisis de series temporales

Ver. 14/04/2023, Pag. # 3

Introducción (I)

El análisis de series temporales es distinto de la Econometría estudiada anteriormente

Hay tres diferencias principales:

1) No consideramos, de momento, variables exógenas

2) Se trata de construir un modelo sencillo que aproveche la inercia de los datos pasados para predecir los valores futuros de la serie

3) Los datos están ordenados, desde el pasado hasta el futuro

¿Por qué es tan importante el orden de los datos?

Page 4: Series1 - Analisis de series temporales

Ver. 14/04/2023, Pag. # 4

Introducción (II)

Relación entre edad y estatura de un conjunto de individuos:

• Los datos no se distribuyen en el tiempo (es una “sección cruzada” o “corte transversal”)

• No hay un orden natural de la muestra

• No es razonable suponer que la estatura de un individuo depende de la estatura (o la edad) del individuo anterior (¿cuál es?)

• La dirección de causalidad es natural, pero arbitraria

Relación entre ventas y publicidad de una empresa:

• El orden natural de los datos es el cronológico

• Es razonable que las ventas de hoy dependan de las ventas de ayer

• Es razonable que las ventas de hoy dependan de la publicidad de hoy y de la de ayer

• La mala noticia es que las relaciones son más complejas, la buena es que hay un fundamento objetivo para la causalidad: X causa a Y si el pasado de X ayuda a predecir (o está correlado con) Y

El que los datos de una serie temporal estén ordenados determina qué relaciones son posibles y cuáles no:

Page 5: Series1 - Analisis de series temporales

Ver. 14/04/2023, Pag. # 5

Introducción (III): Dos series de datos reales

0

100

200

300

400

500

600

700

1950 1952 1954 1956 1958 1960

Pasajeros de líneas aéreas, total mensual

Mile

s d

e p

ers

on

as

Rendimientos diarios del índice NIKKEI de la Bolsa de Tokio. Estos datos:• fluctúan establemente en torno a una

media nula,• muestran períodos de alta y baja

volatilidad

Número de pasajeros de líneas aéreas. Esta serie mensual muestra:• un perfil creciente (tendencia),• fluctuaciones estacionales y• una variabilidad que crece a medida que

aumenta el nivel de la serie.

-15

-10

-5

0

5

10

15

1986 1988 1990 1992 1994 1996

Rendimientos (logx100) del índice NIKKEI

Pu

nto

s lo

g x

10

0

Los primeros y segundos momentos (media y varianza) de distintas series temporales pueden comportarse de formas muy diferentesLas series temporales de naturaleza similar (p. ej., financieras) a menudo presentan rasgos comunes que son de gran utilidad para analizarlas

Page 6: Series1 - Analisis de series temporales

Ver. 14/04/2023, Pag. # 6

Conceptos básicos (I): Definiciones

Serie temporal, es un conjunto de observaciones o medidas realizadas secuencialmente en intervalos predeterminados y de igual, o aproximadamente igual, duraciónProceso estocástico es un conjunto de variables aleatorias asociadas a distintos instantes de tiempo

• La relación entre una serie temporal y el proceso estocástico que la genera es la misma que hay entre una muestra y la variable aleatoria de la que procede

• Las características peculiares de una serie temporal (frente a una muestra) y de un proceso estocástico (frente a una variable aleatoria) son:– las series temporales y los procesos estocásticos están referidos a instantes de tiempo

concretos, y

– los datos están ordenados desde el pasado hasta el presente

• El objetivo del análisis de series temporales es inferir la forma del proceso estocástico a partir de las series temporales que genera

Page 7: Series1 - Analisis de series temporales

Ver. 14/04/2023, Pag. # 7

Conceptos básicos (II): Hipótesis simplificatorias

• En ciencias sociales suele ser imposible obtener varias muestras de una serie temporal, por lo que es necesario realizar una serie de supuestos simplificatorios.

• Los supuestos más comunes son:

– Linealidad: El valor que toma hoy la serie (o el proceso) depende linealmente de: a) sus valores pasados y b) los valores presentes y pasados de otras series.

– Estacionariedad (débil): La media y varianza incondicional de una serie (o proceso) son constantes, las autocovarianzas entre dos valores sólo dependen de la distancia temporal que los separa. Formalmente:

– Normalidad: El proceso estocástico generador sigue un modelo normal de distribución de probabilidad (proceso “gaussiano”).

,

, : ( )

[( ) ]

[( )( )]

t t z

t t t z

t t t k t k t k k

t k E z

E z

E z z

m m

m s s

m m g g- -

" = =

- = =

- - = =

2 2 2

Page 8: Series1 - Analisis de series temporales

Ver. 14/04/2023, Pag. # 8

Un proceso de ruido blanco representa una variable que:• oscila en torno a una media constante,• con una volatilidad constante y• cuyo pasado no contiene información útil para predecir valores futuros.

Podemos representar esta variable como con:

Procesos elementales (I): Ruido blanco.

t tzz am= +

[ ]( ) ( )t z tE z E am= =0 ( )t z aE z s g s= = =2 2 2

0% ;k

k kg

rg

= = ³0

0 1

-.4

-.3

-.2

-.1

.0

.1

.2

.3

.4

100 200 300 400 500

Ruido blanco

La figura muestra el perfil de 500 observaciones simuladas del proceso de ruido blanco:

; iid N(0,.01)t t tz a a= :

Page 9: Series1 - Analisis de series temporales

Ver. 14/04/2023, Pag. # 9

Un proceso autorregresivo de primer orden, AR(1), representa una variable cuyo valor actual está relacionado con su valor anterior mediante un modelo de regresión. Esto es:

con:

Procesos elementales (II): AR(1).

;t t tz c z aff -= + + <1 1

( )t z

cE z m

f= =

-1( ) a

t zE zs

s gf

= = =-

22 2

0 21% ;k

k kr f= ³ 0

-.4

-.3

-.2

-.1

.0

.1

.2

.3

.4

100 200 300 400 500

AR(1) phi=.5

-.6

-.4

-.2

.0

.2

.4

.6

100 200 300 400 500

AR(1), phi=.9

(estacionariedad)

La figura muestra el perfil de dos series generadas por un AR(1) sin constante, con distintos valores del parámetro :

Page 10: Series1 - Analisis de series temporales

Ver. 14/04/2023, Pag. # 10

Un proceso de medias móviles de primer orden, MA(1), representa una variable cuyo valor actual está correlado con su valor anterior . Esto es:

Con:

Procesos elementales (III): MA(1).

;t z t tz a am q q-= + - <1 1

( )t zE z m= ( ) ( )t z aE z s g q s= = = +2 2 2 2

0 1%k

si k

si k

qr q

ì -ïï =ïï= +íïï >ïïî

2 11

0 1

-.4

-.3

-.2

-.1

.0

.1

.2

.3

.4

100 200 300 400 500

MA(1), theta=.5

-.4

-.3

-.2

-.1

.0

.1

.2

.3

.4

100 200 300 400 500

ma(1), theta=.9

(invertibilidad)

La figura muestra el perfil de dos series generadas por un proceso MA(1) sin constante, con distintos valores de :

Page 11: Series1 - Analisis de series temporales

Ver. 14/04/2023, Pag. # 11

Procesos elementales (IV): Paseo aleatorio.

-4

-3

-2

-1

0

1

100 200 300 400 500

Paseo aleatorio sin deriva

Un paseo aleatorio representa una variable cuyos cambios son ruido blanco y, por tanto, imprevisibles. Esto es:

t t ty c y a-+ += 1

La figura muestra el perfil de dos series generadas por paseos aleatorios con y sin deriva. Como puede observarse, la característica fundamental de este proceso es la falta de afinidad de las series a una media estable:

0

10

20

30

40

50

10 20 30 40 50 60 70 80 90 100

Paseo aleatorio con deriva

Page 12: Series1 - Analisis de series temporales

Ver. 14/04/2023, Pag. # 12

Para contrastar puede usarse el estadístico:

Coeficientes muestrales de asimetría y kurtosis:

La hipótesis de normalidad puede contrastarse mediante el test de Jarque-Bera:

Identificación (I): Estadística descriptiva

0

10

20

30

40

50

60

-0.25 0.00 0.25

Series: WNOISESample 1 500Observations 500

Mean 0.002643Median 0.006559Maximum 0.386147Minimum -0.304903Std. Dev. 0.102973Skewness -0.046988Kurtosis 3.393006

Jarque-Bera 3.401768Probability 0.182522

: XH m =0 0ˆ

/ˆx

n

x

t tn

m

s-= 1:

H0

ˆˆˆ

ni x

i x

XCA

n

ms=

æ ö- ÷ç ÷= ç ÷ç ÷çè øå

3

1

1 ˆˆˆ

ni x

i x

XCK

n

ms=

æ ö- ÷ç ÷= ç ÷ç ÷çè øå

4

1

1

ˆ ˆ( )CA CKJB n c

æ ö- ÷ç ÷= +ç ÷ç ÷÷çè ø

2 222

36 24

:H0

El histograma muestra el perfil de una muestra del proceso:

Obsérvese que los momentos muestrales son muy parecidos a los poblacionales y el test de Jarque-Bera no rechaza normalidad.

; iid N(0,.01)t t tz a a= :

Page 13: Series1 - Analisis de series temporales

Ver. 14/04/2023, Pag. # 13

El coeficiente muestral de autocorrelación simple de orden k ( ) se define como:

con:

Para hacer inferencia sobre la función de autocorrelación simple (FAS o ACF) pueden usarse los siguientes resultados:• Para muestras suficientemente grandes• Si es cierto entoncesen donde: K es el número de retardos de la ACF

p es el número de parámetros estimados, si la serie es de residuos.

Identificación (II): Función de autocorrelación simple

: KH r r r r= = = = =0 1 2 3 0K

gr

g=

0

ˆ

ˆk

k ; , , ,ˆn

k t t k t tt k

z z z z z kn

g -= +

= = - =å1

112%% % K

r$k

En la figura se muestra la función de autocorrelación simple de una muestra del proceso:

... como puede observarse su configuración se parece, sin coincidir exactamente, a la FAS teórica de un proceso MA(1)

. ; iid N(0,.01)t t t tz a a a-= - 15 :

( ) ( )K

k K pk

Q K n nn k H

r c -=

= +-å

22

10

12 $ :

. .( ) /ks e nr 1$ ;

Page 14: Series1 - Analisis de series temporales

Ver. 14/04/2023, Pag. # 14

Identificación (III): Función de autocorrelación parcial

Los procesos MA tienen una FAS finita. Por tanto en este caso la FAS resulta muy útil, tanto para detectar una estructura MA como para identificar su orden.

Un instrumento con propiedades análogas para procesos AR es el coeficiente muestral de autocorrelación parcial de orden k ( ), que se define como el k-ésimo coeficiente de una autorregresión de orden k estimada por MCO:

al gráfico de barras de los coeficientes frente a su correspondiente retardo se le llama función de autocorrelación parcial (abreviadamente, FAP o PACF).

f$kk

ˆ ˆ ˆ ˆ ; , ,t k t k t kk t k ktz z z z kff f e- - -= + + + + =1 1 2 2 12% % % %K K

En la figura se muestran las funciones de autocorrelación de una muestra del proceso:

como puede observarse, la FAP identifica con claridad la naturaleza y el orden del proceso generador de los datos.

. ; iid N(0,.01)t t t tz z a a-= +15 :

f$kk

Page 15: Series1 - Analisis de series temporales

Ver. 14/04/2023, Pag. # 15

Identificación (IV)

Ruido blanco:

AR(1):

-.4

-.3

-.2

-.1

.0

.1

.2

.3

.4

100 200 300 400 500

Ruido blanco

-.4

-.3

-.2

-.1

.0

.1

.2

.3

.4

100 200 300 400 500

AR(1) phi=.5

Combinando instrumentos gráficos y estadísticos pueden reconocerse de forma aproximada las pautas de autocorrelación características de los distintos procesos.

En análisis de series temporales, a este proceso de especificación empírica se le llama “identificación”

; iid N(0,.01)t t tz a a= :

. ; iid N(0,.01)t t t tz z a a-= +15 :

Page 16: Series1 - Analisis de series temporales

Ver. 14/04/2023, Pag. # 16

MA(1):

Paseo aleatorio:

La identificación puede estructurarse como una secuencia de preguntas:• ¿Es estacionaria la

serie?• ¿Tiene una media

significativa?• ¿Es finita o infinita

la ACF?• ¿Es finita o infinita

la PACF?

-4

-3

-2

-1

0

1

100 200 300 400 500

Paseo aleatorio sin deriva

-.4

-.3

-.2

-.1

.0

.1

.2

.3

.4

100 200 300 400 500

MA(1), theta=.5

Identificación (V)

. ; iid N(0,.01)t t t tz a a a-= - 15 :

; iid N(0,.01)t t t ty y a a-= +1 :

Page 17: Series1 - Analisis de series temporales

Ver. 14/04/2023, Pag. # 17

Combinando el análisis de la ACF y la PACF, la identificación de los procesos estacionarios puede reducirse a decidir:• ¿Cuál de las dos funciones es finita? para determinar la naturaleza del proceso

generador:

• ¿A partir de qué retardo muere la ACF o PACF? para determinar el orden del proceso.

Estas técnicas requieren usar estadísticos como la media, la varianza o la covarianza muestrales, que sólo tienen sentido si el proceso es estacionario, esto es, si los datos tienen una media y una varianza finitas y aproximadamente constantes.

Identificación (VI)

ACF

Finita Infinita

PACF Finita Ruido blanco AR

Infinita MA ARMA

Page 18: Series1 - Analisis de series temporales

Ver. 14/04/2023, Pag. # 18

;t t tz c z aff -= + + <1 1

( )t z

cE z m

f= =

-1

( ) at zE z

ss g

f= = =

-

22 2

0 21%

;kkk k

gr f

g= = ³

0

0

f< <0 1

f- < <1 0

A.1. Estudio de los procesos más comunes: AR(1)

ACF PACF

Los procesos AR(1) se reconocen por una ACF infinita y una PACF que se anula a partir del segundo retardo. Si los datos tienen media, es necesario especificar un término constante.

Retardo

+1

-1

Retardo

+1

-1

Retardo

+1

-1

Retardo

+1

-1

Page 19: Series1 - Analisis de series temporales

Ver. 14/04/2023, Pag. # 19

;t z t tz a am q q-= + - <1 1

( )t zE z m=

( ) ( )t z aE z s g q s= = = +2 2 2 2

0 1%

kk

si k

si k

qg

r qg

ì -ïï =ïï= = +íïï >ïïî

2

0

11

0 1

q< <0 1

q- < <1 0

ACF PACF

Los procesos MA(1) se reconocen por una PACF infinita y una ACF que se anula a partir del segundo retardo.Si los datos tienen media, es necesario especificar un término constante.

A.2. Estudio de los procesos más comunes: MA(1)

Retardo

+1

-1

Retardo

+1

-1

Retardo

+1

-1

Retardo

+1

-1

Page 20: Series1 - Analisis de series temporales

Ver. 14/04/2023, Pag. # 20

t t t tz c z z aff - -= + + +1 1 2 2

( )t z

cE z m

ff= =

- -1 21

;

con :k k k kr f r f r- -= + ³1 1 2 2 1

;ff > >1 20 0; ;ff ff f+ < - < <2 1 2 1 21 1 1

;ff

r r fff

= = +- -

21 1

1 2 22 21 1

;ff < >1 20 0

ACF PACF

Los procesos AR(2) se reconocen por una ACF infinita y una PACF que se anula a partir del tercer retardo.Si los datos tienen media, es necesario especificar un término constante.

A.3. Estudio de los procesos más comunes: AR(2)

Retardo

+1

-1

Retardo

+1

-1

Retardo

+1

-1

Retardo

+1

-1

Page 21: Series1 - Analisis de series temporales

Ver. 14/04/2023, Pag. # 21

;ff < <1 20 0

;ff > <1 20 0ACF PACF

A.4. Estudio de los procesos más comunes: AR(2)

Retardo

+1

-1

Retardo

+1

-1

Retardo

+1

-1

Retardo

+1

-1

Page 22: Series1 - Analisis de series temporales

Ver. 14/04/2023, Pag. # 22

t z t t tz a a am q q- -= + - -1 1 2 2

( )t zE z m=

( ) ( )t z aE z s g q q s= = = + +2 2 2 2 2

0 1 21%

( )

kk

si k

si k

si k

q qq q

g qr

g q q

ì - -ïï =ïï + +ïïï -ïïï= = =íï + +ïïï >ïïïïïîï

1 22 21 2

22 2

0 1 2

11

1

21

0 2

; ;q q q q q+ < - < <2 1 2 1 21 1 1 ;q q> >1 20 0

;q q< >1 20 0

;q q< <1 20 0

;q q> <1 20 0

ACF ACF

Los procesos MA(2) se reconocen por una PACF infinita (no se muestra aquí) y una ACF que se anula a partir del tercer retardo.Si los datos tienen media, es necesario especificar un término constante.

A.5. Estudio de los procesos más comunes: MA(2)

Retardo

+1

-1

Retardo

+1

-1

Retardo

+1

-1

Retardo

+1

-1