Upload
uai
View
1
Download
0
Embed Size (px)
Citation preview
Guía de Ejercicios 3 Econometría – Prof. Diana Kruger
Guía de Ejercicios 3 – Regresión Lineal Múltiple (parte I)
1.
(i) Sí. A causa de las restricciones de presupuesto, es sensato decir que, a mayor número
de hermanos en una familia, menor es la educación para cada uno de los niños en la
familia. Para hallar el aumento en el número de hermanos que reduce en un año el
número de años de educación estimados, resolvemos 1 = 0.094(Δsibs), de esta forma
Δsibs = 1/0.094 10.6.
(ii) Al mantener fijos sibs y feduc, un año más de educación de la madre implica 0.131
años más de educación estimada. Así que si la madre tiene 4 años más de educación,
para su hijo se estima aproximadamente medio año (0.524) más de educación.
(iii) Ya que el número de hermanos es el mismo, pero meduc y feduc son diferentes, los
coeficientes de meduc y feduc requieren ser contabilizados. La diferencia estimada en
educación entre B y A es 0.134(4) + 0.210 (4) = 1.364.
Guía de Ejercicios 3 Econometría – Prof. Diana Kruger
2.
(i) Si los adultos sustituyen tiempo de sueño por trabajo, más trabajo implica menos
tiempo de sueño (demás variables constantes), por lo tanto 1 < 0.
(ii) Los signos de 2 y 3 no son obvios. Uno podría argumentar que la mayoría de la
gente educada quiere conseguir más de la vida, por esto, con las demás variables
constantes, ellos duermen menos (2 < 0). La relación entre el sueño y la edad es más
complicada que lo que este modelo sugiere, y los economistas no están en la mejor
posición para juzgar estas cosas.
(iii) Ya que totwrk se mide en minutos, debemos convertir cinco horas en minutos: Δtotwrk
= 5(60) = 300. Entonces sleep se estima que disminuya 0.148(300) = 44.4 minutos.
Para una semana, 45 minutos menos de sueño no es una variación importante.
(iv) Más educación implica menos tiempo de sueño estimado, pero el efecto es pequeño. Si
asumimos que la diferencia entre el colegio y la universidad es cuatro años, el graduado
del colegio duerme cerca de 45 minutos menos por semana, las demás variables
permanecen constantes.
(v) No es sorprendente que las tres variables expliquen solo cerca del 11.3% de la variación
en sleep. Un factor importante en términos de error es La salud en general. Otro es el
estado civil, y si la persona tiene hijos. La salud (Aunque nosotros la midamos), el
estado civil y el número y edad de los hijos podrían generalmente estar correlacionados
con totwrk. (Por ejemplo, gente menos sana podría tender a trabajar menos).
Guía de Ejercicios 3 Econometría – Prof. Diana Kruger
3. (i) No. Por definición study + sleep + work + leisure = 168. Si cambiamos study, debemos cambiar
al menos una de las otras categorías para que la suma siga siendo 168.
(ii) De la parte (i), podemos escribir, decir, study como una función lineal perfecta de las otras
variables independientes: study = 168 − sleep − work − leisure. Esto se mantiene para cada
observación, por esto se viola el supuesto RLM4.
(iii) Simplemente sacando una de las variables independientes, digamos leisure:
GPA study sleep work u 0 1 2 3
Ahora, por ejemplo, 1 se interpreta como la variación en GPA cuando study aumenta en una
hora, donde sleep, work, y u han permanecido constantes. Si mantenemos sleep y work
constantes pero aumentamos study en una hora, entonces debemos reducir leisure en una
hora. Los otros parámetros tienen una interpretación similar.
4.
Sólo (i), al omitir una variable importante, puede provocar sesgo, y esto es cierto solo cuando la variable
omitida está correlacionada con las variables incluidas. El grado de colinealidad entre las variables en la
muestra, aún si es reflejado en una correlación tan alta como 0.95, no afecta los supuestos de Gauss-Markov.
Solo si hay una relación lineal perfecta entre dos o más variables se viola el MLR4.
Guía de Ejercicios 3 Econometría – Prof. Diana Kruger
5.
Por definición, 2 > 0, y por supuesto, Corr x x1 2 0, . Además, hay un sesgo negativo en
~:
~ 1 1 1E . Esto significa que el estimador de una regresión simple subestima el efecto del programa
de entrenamiento. Es aún posible que E~1 sea negativo aunque 1
> 0.
Guía de Ejercicios 3 Econometría – Prof. Diana Kruger
7.
Anteriormente, en la tabla 3.2, se ha discutido como determinar la dirección del sesgo en los estimadores
MCO cuando una variable importante (habilidad en este caso) ha sido omitida de la regresión. Como se
dijo entonces, la tabla 3.2 únicamente se mantiene con una variable incluida en la regresión, pero nosotros
ignoramos la presencia de otras variables independientes y usamos esta tabla como una guía. (O, podemos
usar los resultados del problema 3.10 para un análisis más preciso.) Si menos trabajadores hábiles están
más deseosos de recibir entrenamiento que train y u están negativamente correlacionados. Si ignoramos la
presencia de educ y exper, o al menos asumimos que train y u están negativamente correlacionados después
de determinar educ y exper, entonces podemos usar la Tabla 3.2: el estimador MCO de 1 (con habilidad
como el término de error) tiene un sesgo hacia abajo. Al pensar que 1 0 , estamos menos deseosos de
concluir que el programa de entrenamiento fue efectivo. Intuitivamente, esto hace sentido: si aquellos
escogidos para el entrenamiento no han recibido entrenamiento, ellos podrían tener salarios más bajos, en
rango, que el grupo de control.
Guía de Ejercicios 3 Econometría – Prof. Diana Kruger
8.
(i) H0 3 0: . H1 3 0: .
(ii) El efecto proporcional sobre salary es 0.00024(50) = 0.012. Para obtener el efecto de porcentaje, multiplicamos esto por 100: 1.2 %. Además, un aumento en el ceteris paribus de 50 puntos en ros se estima para aumentar el salario solo un 1.2 %. En la práctica, este es un efecto muy pequeño para un cambio tan largo en ros.
(iii) El valor crítico del 10% para un test unilateral, usando df = , se obtiene de la Tabla G.2 como 1.282. La estadística t en ros es 0.00024/0.00054 0.44, el cual está por debajo del valor
crítico. No rechazamos H0 a un nivel de significatividad del 10 %.
(iv) Basados en esta muestra, el coeficiente estimado de ros no es diferente de cero y puede ser
omitido del modelo final. Por otro lado, incluir ros puede no causar ningún daño; depende de
cuan correlacionada esté con las otras variables independientes (aunque estas son muy
significativas aún con ros en la ecuación).
Guía de Ejercicios 3 Econometría – Prof. Diana Kruger
i) B = (X’X)-1X’Y =[0.03 0 0
0 0.03 −0.010 −0.01 0.02
] [1322492
] = [3.96−0.21.6
], lo cual implica:
𝛽0 = 3.96, 𝛽1 = −0.2, 𝛽2 = 1.6
ii) Matriz VC = 𝜎2(𝑋′𝑋)−1 = 150*[0.03 0 0
0 0.03 −0.010 −0.01 0.02
] = [4.5 0 00 4.5 −1.50 −1.5 3
]
iii) Se estima valor t para el coeficiente:
𝑡 =�̂�2
𝑠𝑑(�̂�2)=
1.6
√3≈ 0.924
El estadístico t estimado es menor que el valor crítico de la distribución t con cualquier nivel de
significancia aceptable (10%, 5%, o 1%), para test de 2 colas (no podemos estimar test de 1 cola
porque no tenemos ninguna teoría que nos guíe para sugerir cuál sería la hipótesis alternativa).
Guía de Ejercicios 3 Econometría – Prof. Diana Kruger
12. Suponga que se estima la ecuación
sleep totwrk educ age . . . . 363825 0148 1113 2 20
(112.28) (0.017) (5.88) (1.45)
n R 706 01132, . ,
donde proporcionamos los errores estándar junto con las estimaciones.
(i) ¿Son educ o age individualmente significativas al 5 por ciento usando contrastes de dos
colas? Explicar en qué se basa la respuesta.
(ii) Al eliminar educ y age de la ecuación, se obtiene
sleep totwrk . . 363825 0148
(38.91) (0.017)
n = 706, R2 = 0.103
¿Son educ y age conjuntamente significativas al 5 por ciento en la ecuación original?
Justificar la respuesta.
(iii) El incluir educ y age en el modelo ¿afecta mucho a la disyuntiva estimada entre dormir
y trabajar?
Respuesta
(i) Con df = 706 – 4= 702, usamos el valor crítico normal estándar (df = según tabla
G.2), el cual es 1,96 para un test bilateral a un nivel de 5%. Ahora teduc = -11.13/5.88
-1.89, por lo que teduc 189 196. . , rechazamos H educ0 0: a un nivel de 5%.
También, tage 1.52, por lo que age es también estadísticamente insignificante a un
nivel del 5%.
(ii) Necesitamos calcular el R-cuadrado de la estadística F para la significatividad conjunta.
Pero F 0113 0103 1 0113 702 2 396. . / . / . . El valor crítico al 5 % en la
distribución F2 702, puede ser obtenido de la Tabla G.3b con denominador df = : cv =
300. Además, educy age son conjuntamente significativas a un nivel del 5% (3.96
>3.00). De hecho, el valor p es aproximadamente 0.019, y por eso educ y age son
conjuntamente significativas a un nivel de 2%.
(iii) No realmente. Estas variables son conjuntamente significativas, pero incluirlas solo
varía el coeficiente en totwrk de –0.151 a –0.148.