Upload
others
View
8
Download
0
Embed Size (px)
Citation preview
¿Porque paneles?Modelos lineales para datos en paneles
Econometria de Datos en Paneles
Walter Sosa-Escudero
Universidad de San Andres
Agosto de 2011
Walter Sosa-Escudero Econometria de Datos en Paneles
¿Porque paneles?Modelos lineales para datos en paneles
¿Porque paneles?
Ejemplo (Cronwell y Trumbull): Determinantes del crimen
y = g(I), y = crimen, I = variables de justicia criminal.
Corte transversal: (yi, Ii) para varias regiones i = 1, . . . , n
I resulta ‘muy importante’
Critica: I capta el efecto de otros efectos regionales, quetambien son determinantes del crimen.
Walter Sosa-Escudero Econometria de Datos en Paneles
¿Porque paneles?Modelos lineales para datos en paneles
En terminos econometricos
Existe una variable omitida y relacionada positivamente con I.
El estimador de MCO que regresa y en I es sesgado (haciaarriba)
Solucion? ‘Controlar’ por esta varaible omitida.
Paneles al rescate: una solucion simple sin tener que incorporarnuevas variables
Walter Sosa-Escudero Econometria de Datos en Paneles
¿Porque paneles?Modelos lineales para datos en paneles
Datos en paneles
Una base de datos en panel contiene informacion para variosindividuos (empresas, paises, etc.) en el tiempo.
El aspecto fundamental es esta bidimensionalidad de los datos.
Ejemplos: PSID: 6500 familias desde 1968.La EPH tiene una estructura de panel rotativo.
Walter Sosa-Escudero Econometria de Datos en Paneles
¿Porque paneles?Modelos lineales para datos en paneles
Ventajas
Control de ‘heterogeneidades no observables’
Con N individuos y T periodos podriamos estimar N modelosde series de tiempo y T modelos de corte transversal.
Las ventajas de disponer de un panel tienen que ver con laposibilidad de agregar esta informacin de alguna manera.
Ejemplo: yit = x′itβ + uit
Supone que el modelo lineal subyacente es el mismo paratodos los individuos y periodos.
Mayor informacion sobre un mismo parametro. Mayoreficiencia.
Walter Sosa-Escudero Econometria de Datos en Paneles
¿Porque paneles?Modelos lineales para datos en paneles
Desventajas
No siempre es posible agregar informacion temporal y de cortetransversal (pueden ser ms observaciones pero de poblacionesheterogeneas).
Los paneles son costosos de implementar y administrar.
Problemas de selectividad: auto-seleccion, no respuesta,”attrition”.
Dimension temporal corta
Walter Sosa-Escudero Econometria de Datos en Paneles
¿Porque paneles?Modelos lineales para datos en paneles
El Modelo
El modelo basico es:
yit = x′itβ + uit
uit = µi + δt + εit
i = 1, . . . , N, t = 1, . . . , T . xit es un vector de K variablesexplicativas, incluyendo una constante.
El termino de error incluye tres componentes, que representanlas tres posibles fuentes de variabilidad no observable.
Supondremos δt = 0 y que εit satisface todos los supuestosclasicos.
Walter Sosa-Escudero Econometria de Datos en Paneles
¿Porque paneles?Modelos lineales para datos en paneles
Caso mas simple: µi = 0
En este caso, uit = εit satisface todos los supuestos del teorema deGauss-Markov:
E(εit) = 0
E(εitehs) =
σ2 si i = h y t = s0 si i 6= h o t 6= s
El estimador de MCO es MELI. La estructura de panel no agregainformacion
Walter Sosa-Escudero Econometria de Datos en Paneles
¿Porque paneles?Modelos lineales para datos en paneles
En terminos matriciales
Y = Xβ + u
YNT×1, XNT+×K , apilando las observaciones por individuo,primero ordenadas temporalmente.Entonces:
βMCO = (X ′X)−1X ′Y
Walter Sosa-Escudero Econometria de Datos en Paneles
¿Porque paneles?Modelos lineales para datos en paneles
El estimador de efectos fijos
yit = x′itβ + µi + εit
Las realizaciones de µi pueden ser estimadas con un panel (no conun corte transversal!).
Puede ser visto un modelo lineal en donde cada individuo tiene supropia ordenada al origen:
yit = µi + β1︸ ︷︷ ︸+β2 x2,it + · · ·+ βK xK,it + εit
El modelo se puede estimar usando N − 1 variables binarias porindividuo, para evitar la ‘trampa de variables binarias’.
Walter Sosa-Escudero Econometria de Datos en Paneles
¿Porque paneles?Modelos lineales para datos en paneles
En terminos matriciales
Y = Xβ +Dµ+ u
Y es NT × 1, X es NT ×K, X incluye el intercepto.D es una matriz de N − 1 variables binarias por individuo.
1N ≡
11...1
, Z =
1N 0 · · · 0
0 1N 0...
.... . .
...0 0 · · · 1N
NT×(N−1)T
Walter Sosa-Escudero Econometria de Datos en Paneles
¿Porque paneles?Modelos lineales para datos en paneles
Reescribamos el modelo como:
Y = Xβ +Dµ+ u = Xδ + u
con X ≡ [X D] y δ ≡ [β′ µ′]′.
Entonces, el estimador de efectos fijos es:
δEF =
(βEFµEF
)= (X ′X)−1X ′Y
que no es otra cosa que un estimador de MCO agregando N − 1variables binarias por individuo.
Walter Sosa-Escudero Econometria de Datos en Paneles
¿Porque paneles?Modelos lineales para datos en paneles
Efectos fijos y transformacion ‘within’
Comencemos con el modelo
yit = x′itβ + µi + εit
Tomando promedios por individuo:
yi = x′iβ + µi + εi
Restandoyit − yi = (xit − xi)′β + εit − εi
oy∗it = xit∗′β + ε∗it
con m∗it ≡ mit − mi, m = y, x, ε.
Walter Sosa-Escudero Econometria de Datos en Paneles
¿Porque paneles?Modelos lineales para datos en paneles
Resultado:
βEF = (X∗′X∗)−1X∗′ Y ∗
(Prueba: Teorema de Frisch,Waugh, Lovell)
Existen dos formas identicas de computar βEF .
Regresar Y en X y las variables binarias por individuo. βEF son loscoeficientes estimados para X.
En dos pasos: 1) Expresar las variables en desvios con respecto a lamedia por individuo. 2) MCO en base a estos desvios.
Walter Sosa-Escudero Econometria de Datos en Paneles
¿Porque paneles?Modelos lineales para datos en paneles
Terminologia:
Modelo within
yit − yi = (xit − xi)′β + εit − εi
Modelo betweenyi = x′iβ + µi + εi
Walter Sosa-Escudero Econometria de Datos en Paneles
¿Porque paneles?Modelos lineales para datos en paneles
Propiedades de βEF
Es insesgado (X y Dµ son exogenas con respecto a ε).
Es consistente, cuando N o T →∞.
Importante: la insesgadez y consistencia de βEF no presuponeque X y Dµ son ortogonales (puede haber correlacion entreX y Dµ
Walter Sosa-Escudero Econometria de Datos en Paneles
¿Porque paneles?Modelos lineales para datos en paneles
Efectos fijos y control de heterogeneidades no observables
Supongamos que el modelo es
yit = x′itβ + z′iδ + µi + εit
zi no es observable, pero esta correlacionada con xit.
La transformacion within de este modelo es
y∗it = xit∗′β + ε∗it
La tranformacion within elimina cualquier variable que no varia enel tiempo (zi y µi): estimar por efectos fijos permite ‘controlar’por la presencia de zi.
Walter Sosa-Escudero Econometria de Datos en Paneles
¿Porque paneles?Modelos lineales para datos en paneles
Es relevante notar que sin datos de panel, no podriamos haberdado cuenta de zi (que no sea incluyendola en el nodelo.
Con datos de corte transversal el modelo es
yi = x′iβ + z′iδ + µi + εi,
de modoe que omitir zi conduce a sesgos. Observar que latranformacion within es inaplicable (trivialmente cero).
Este es el sentido en el cual la disponibilidad de paneles permitecontrolar por variables omitidas que no varian en el tiempo.
Walter Sosa-Escudero Econometria de Datos en Paneles
¿Porque paneles?Modelos lineales para datos en paneles
Una exploracion grafica
Walter Sosa-Escudero Econometria de Datos en Paneles
¿Porque paneles?Modelos lineales para datos en paneles
Verbalizacion
Y = tasa de criminalidad
X = ineficiencia del sistema judicial (mas ineficiente, mascriminalidad).
Dos regiones
Determinante omitido del crimen, a que varia solo por regiony correlacionado (positivamete) con la ineficiencia judicial:densidad poblacional.
Walter Sosa-Escudero Econometria de Datos en Paneles
¿Porque paneles?Modelos lineales para datos en paneles
Walter Sosa-Escudero Econometria de Datos en Paneles
¿Porque paneles?Modelos lineales para datos en paneles
Walter Sosa-Escudero Econometria de Datos en Paneles
¿Porque paneles?Modelos lineales para datos en paneles
El estimador de efectos aleatorios
El modelo es el mismo
yit = x′itβ + µi + εit
En terminos matriciales
Y = Xβ +Dµ+ ε
Si Dµ es ortogonal a X, y si E(µi|X) = 0, entonces, el estimadorde MCO que regresa Y en X es insesgado.
Es decir, si Dµ es ortogonal a X, la omision de las variablesbinarias no sesga al estimador de MCO.
Walter Sosa-Escudero Econometria de Datos en Paneles
¿Porque paneles?Modelos lineales para datos en paneles
Efectos fijos vs aleatorios
Discusion muy extrana. Es mas una cuestion de tratamiento
Y = Xβ +Dµ+ ε
Efectos fijos (controla por Dµ)
Y = Xβ +Dµ+ ε
Efectos aleatorios (trata a Dµ como variable omitida)
Y = Xβ +Dµ+ ε
Walter Sosa-Escudero Econometria de Datos en Paneles
¿Porque paneles?Modelos lineales para datos en paneles
Y = Xβ +Dµ+ ε
Y = Xβ + u, u ≡ Dµ+ ε
Problema: u no satisface los supuestos clasicos, aun cuando Dµ yε por separado lo hagan.
Prueba simple: supuestos clasicos por separado (esperanza nula,no correlacion ni heterocedasticidad), ademas, no correlacion entreDµ y ε. Entonces
V (u) = V (Dµ+ ε)
= DV (µ)D′ + V (ε)
= σ2µ + σ2ε INT
que no es un escalar por la matriz identidad (los elementos fuerade la diagonal no son cero).
Walter Sosa-Escudero Econometria de Datos en Paneles
¿Porque paneles?Modelos lineales para datos en paneles
Intuicion: uit = µi + εit
Trivialmente, uit esta correlacionado con ui,t−1 ya que ambos‘comparten’ µi: la presencia permanente de µi hace que laespecificacion de efectos aleatorios induzca autocorrelacion.
Si bien MCO es insesgado, no es eficiente, por la presencia deautocorrelacion.
Eficiente? Minimos cuadrados generalizados.
Walter Sosa-Escudero Econometria de Datos en Paneles
¿Porque paneles?Modelos lineales para datos en paneles
MCG para efectos aleatorios
Consideremos un modelo lineal basico:
Y = X ′β + u
en donde valen todos los supuestos clasicos, salvo que:
V (u) = Ω
Ω es una matriz simetrica y positiva definida (permite,potencialmente, autocorrelacion y heterocedasticidad).Teorema (Aitken): el MELI de β es:
βMCG = (X ′Ω−1X)−1X ′Ω−1Y
Walter Sosa-Escudero Econometria de Datos en Paneles
¿Porque paneles?Modelos lineales para datos en paneles
En nuestro caso
V (u) = σ2µDD′ + σ2ε INT ≡ Ω(θ)
con θ′ = (σ2µ, σ2ε )′
La implementacion de MCG requiere primero estimar θ (loscomponentes de varianzas).
Estimador de efectos aleatorios: estimador MCG.
Walter Sosa-Escudero Econometria de Datos en Paneles
¿Porque paneles?Modelos lineales para datos en paneles
Resumen
Y = Xβ +Dµ+ ε
X ⊥ Dµ: MCO, EF, EA y between son todos consistentesparar β. EA es eficiente.
X ¬⊥ Dµ: solo EF es consistente para β.
La practica gravita mayoritariamente a EF.
Walter Sosa-Escudero Econometria de Datos en Paneles
¿Porque paneles?Modelos lineales para datos en paneles
Test de Hausman
H0 : X ⊥ Dµ, HA : X ¬⊥ Dµ
Test de Hausman: bajo H0
H = (βEA − βEF )′(ΩEF − ΩEA)−1(βEA − βEF ) ∼ χ2(K)
Rechazar si H es significativamente distinto de cero.
Intuicion: bajo H0, βEA y βEF son consistentes, H deberiaser pequeno. Bajo HA, solo βEF es consistente, H deberiaser alto.
Permitiria, bajo H0, explotar las ganancias de eficiencia deestimar por EA.
Walter Sosa-Escudero Econometria de Datos en Paneles