Econometria de Datos en Panelesportal.eco.unc.edu.ar/files/ief/seminarios-conferencias/...>Porque paneles? Modelos lineales para datos en paneles En terminos econometricos Existe una

¿Porque paneles?Modelos lineales para datos en paneles

Econometria de Datos en Paneles

Walter Sosa-Escudero

Universidad de San Andres

Agosto de 2011

Walter Sosa-Escudero Econometria de Datos en Paneles


¿Porque paneles?

Ejemplo (Cronwell y Trumbull): Determinantes del crimen

y = g(I), y = crimen, I = variables de justicia criminal.

Corte transversal: (yi, Ii) para varias regiones i = 1, . . . , n

I resulta ‘muy importante’

Critica: I capta el efecto de otros efectos regionales, quetambien son determinantes del crimen.



En terminos econometricos

Existe una variable omitida y relacionada positivamente con I.

El estimador de MCO que regresa y en I es sesgado (haciaarriba)

Solucion? ‘Controlar’ por esta varaible omitida.

Paneles al rescate: una solucion simple sin tener que incorporarnuevas variables



Datos en paneles

Una base de datos en panel contiene informacion para variosindividuos (empresas, paises, etc.) en el tiempo.

El aspecto fundamental es esta bidimensionalidad de los datos.

Ejemplos: PSID: 6500 familias desde 1968.La EPH tiene una estructura de panel rotativo.



Ventajas

Control de ‘heterogeneidades no observables’

Con N individuos y T periodos podriamos estimar N modelosde series de tiempo y T modelos de corte transversal.

Las ventajas de disponer de un panel tienen que ver con laposibilidad de agregar esta informacin de alguna manera.

Ejemplo: yit = x′itβ + uit

Supone que el modelo lineal subyacente es el mismo paratodos los individuos y periodos.

Mayor informacion sobre un mismo parametro. Mayoreficiencia.



Desventajas

No siempre es posible agregar informacion temporal y de cortetransversal (pueden ser ms observaciones pero de poblacionesheterogeneas).

Los paneles son costosos de implementar y administrar.

Problemas de selectividad: auto-seleccion, no respuesta,”attrition”.

Dimension temporal corta



El Modelo

El modelo basico es:

yit = x′itβ + uit

uit = µi + δt + εit

i = 1, . . . , N, t = 1, . . . , T . xit es un vector de K variablesexplicativas, incluyendo una constante.

El termino de error incluye tres componentes, que representanlas tres posibles fuentes de variabilidad no observable.

Supondremos δt = 0 y que εit satisface todos los supuestosclasicos.



Caso mas simple: µi = 0

En este caso, uit = εit satisface todos los supuestos del teorema deGauss-Markov:

E(εit) = 0

E(εitehs) =

σ2 si i = h y t = s0 si i 6= h o t 6= s

El estimador de MCO es MELI. La estructura de panel no agregainformacion



En terminos matriciales

Y = Xβ + u

YNT×1, XNT+×K , apilando las observaciones por individuo,primero ordenadas temporalmente.Entonces:

βMCO = (X ′X)−1X ′Y



El estimador de efectos fijos

yit = x′itβ + µi + εit

Las realizaciones de µi pueden ser estimadas con un panel (no conun corte transversal!).

Puede ser visto un modelo lineal en donde cada individuo tiene supropia ordenada al origen:

yit = µi + β1︸︷︷︸+β2 x2,it + · · ·+ βK xK,it + εit

El modelo se puede estimar usando N − 1 variables binarias porindividuo, para evitar la ‘trampa de variables binarias’.




Y = Xβ +Dµ+ u

Y es NT × 1, X es NT ×K, X incluye el intercepto.D es una matriz de N − 1 variables binarias por individuo.

1N ≡

11...1

, Z =

1N 0 · · · 0

0 1N 0...

.... . .

...0 0 · · · 1N

NT×(N−1)T



Reescribamos el modelo como:

Y = Xβ +Dµ+ u = Xδ + u

con X ≡ [X D] y δ ≡ [β′ µ′]′.

Entonces, el estimador de efectos fijos es:

δEF =

(βEFµEF

)= (X ′X)−1X ′Y

que no es otra cosa que un estimador de MCO agregando N − 1variables binarias por individuo.



Efectos fijos y transformacion ‘within’

Comencemos con el modelo


Tomando promedios por individuo:

yi = x′iβ + µi + εi

Restandoyit − yi = (xit − xi)′β + εit − εi

oy∗it = xit∗′β + ε∗it

con m∗it ≡ mit − mi, m = y, x, ε.



Resultado:

βEF = (X∗′X∗)−1X∗′ Y ∗

(Prueba: Teorema de Frisch,Waugh, Lovell)

Existen dos formas identicas de computar βEF .

Regresar Y en X y las variables binarias por individuo. βEF son loscoeficientes estimados para X.

En dos pasos: 1) Expresar las variables en desvios con respecto a lamedia por individuo. 2) MCO en base a estos desvios.



Terminologia:

Modelo within

yit − yi = (xit − xi)′β + εit − εi

Modelo betweenyi = x′iβ + µi + εi



Propiedades de βEF

Es insesgado (X y Dµ son exogenas con respecto a ε).

Es consistente, cuando N o T →∞.

Importante: la insesgadez y consistencia de βEF no presuponeque X y Dµ son ortogonales (puede haber correlacion entreX y Dµ



Efectos fijos y control de heterogeneidades no observables

Supongamos que el modelo es

yit = x′itβ + z′iδ + µi + εit

zi no es observable, pero esta correlacionada con xit.

La transformacion within de este modelo es

y∗it = xit∗′β + ε∗it

La tranformacion within elimina cualquier variable que no varia enel tiempo (zi y µi): estimar por efectos fijos permite ‘controlar’por la presencia de zi.



Es relevante notar que sin datos de panel, no podriamos haberdado cuenta de zi (que no sea incluyendola en el nodelo.

Con datos de corte transversal el modelo es

yi = x′iβ + z′iδ + µi + εi,

de modoe que omitir zi conduce a sesgos. Observar que latranformacion within es inaplicable (trivialmente cero).

Este es el sentido en el cual la disponibilidad de paneles permitecontrolar por variables omitidas que no varian en el tiempo.



Una exploracion grafica



Verbalizacion

Y = tasa de criminalidad

X = ineficiencia del sistema judicial (mas ineficiente, mascriminalidad).

Dos regiones

Determinante omitido del crimen, a que varia solo por regiony correlacionado (positivamete) con la ineficiencia judicial:densidad poblacional.







El estimador de efectos aleatorios

El modelo es el mismo



Y = Xβ +Dµ+ ε

Si Dµ es ortogonal a X, y si E(µi|X) = 0, entonces, el estimadorde MCO que regresa Y en X es insesgado.

Es decir, si Dµ es ortogonal a X, la omision de las variablesbinarias no sesga al estimador de MCO.



Efectos fijos vs aleatorios

Discusion muy extrana. Es mas una cuestion de tratamiento

Y = Xβ +Dµ+ ε

Efectos fijos (controla por Dµ)

Y = Xβ +Dµ+ ε

Efectos aleatorios (trata a Dµ como variable omitida)

Y = Xβ +Dµ+ ε



Y = Xβ +Dµ+ ε

Y = Xβ + u, u ≡ Dµ+ ε

Problema: u no satisface los supuestos clasicos, aun cuando Dµ yε por separado lo hagan.

Prueba simple: supuestos clasicos por separado (esperanza nula,no correlacion ni heterocedasticidad), ademas, no correlacion entreDµ y ε. Entonces

V (u) = V (Dµ+ ε)

= DV (µ)D′ + V (ε)

= σ2µ + σ2ε INT

que no es un escalar por la matriz identidad (los elementos fuerade la diagonal no son cero).



Intuicion: uit = µi + εit

Trivialmente, uit esta correlacionado con ui,t−1 ya que ambos‘comparten’ µi: la presencia permanente de µi hace que laespecificacion de efectos aleatorios induzca autocorrelacion.

Si bien MCO es insesgado, no es eficiente, por la presencia deautocorrelacion.

Eficiente? Minimos cuadrados generalizados.



MCG para efectos aleatorios

Consideremos un modelo lineal basico:

Y = X ′β + u

en donde valen todos los supuestos clasicos, salvo que:

V (u) = Ω

Ω es una matriz simetrica y positiva definida (permite,potencialmente, autocorrelacion y heterocedasticidad).Teorema (Aitken): el MELI de β es:

βMCG = (X ′Ω−1X)−1X ′Ω−1Y



En nuestro caso

V (u) = σ2µDD′ + σ2ε INT ≡ Ω(θ)

con θ′ = (σ2µ, σ2ε )′

La implementacion de MCG requiere primero estimar θ (loscomponentes de varianzas).

Estimador de efectos aleatorios: estimador MCG.



Resumen

Y = Xβ +Dµ+ ε

X ⊥ Dµ: MCO, EF, EA y between son todos consistentesparar β. EA es eficiente.

X ¬⊥ Dµ: solo EF es consistente para β.

La practica gravita mayoritariamente a EF.



Test de Hausman

H0 : X ⊥ Dµ, HA : X ¬⊥ Dµ

Test de Hausman: bajo H0

H = (βEA − βEF )′(ΩEF − ΩEA)−1(βEA − βEF ) ∼ χ2(K)

Rechazar si H es significativamente distinto de cero.

Intuicion: bajo H0, βEA y βEF son consistentes, H deberiaser pequeno. Bajo HA, solo βEF es consistente, H deberiaser alto.

Permitiria, bajo H0, explotar las ganancias de eficiencia deestimar por EA.


Documents

Econometria de Datos en Panelesportal.eco.unc.edu.ar/files/ief/seminarios-conferencias/...>Porque paneles? Modelos lineales para datos en paneles En terminos econometricos Existe una