Guía de Ejercicios 3 Guía de Ejercicios 3 – Regresión Lineal Múltiple (parte I

Guía de Ejercicios 3 Econometría – Prof. Diana Kruger

Guía de Ejercicios 3 – Regresión Lineal Múltiple (parte I)

1.

(i) Sí. A causa de las restricciones de presupuesto, es sensato decir que, a mayor número

de hermanos en una familia, menor es la educación para cada uno de los niños en la

familia. Para hallar el aumento en el número de hermanos que reduce en un año el

número de años de educación estimados, resolvemos 1 = 0.094(Δsibs), de esta forma

Δsibs = 1/0.094 10.6.

(ii) Al mantener fijos sibs y feduc, un año más de educación de la madre implica 0.131

años más de educación estimada. Así que si la madre tiene 4 años más de educación,

para su hijo se estima aproximadamente medio año (0.524) más de educación.

(iii) Ya que el número de hermanos es el mismo, pero meduc y feduc son diferentes, los

coeficientes de meduc y feduc requieren ser contabilizados. La diferencia estimada en

educación entre B y A es 0.134(4) + 0.210 (4) = 1.364.


2.

(i) Si los adultos sustituyen tiempo de sueño por trabajo, más trabajo implica menos

tiempo de sueño (demás variables constantes), por lo tanto 1 < 0.

(ii) Los signos de 2 y 3 no son obvios. Uno podría argumentar que la mayoría de la

gente educada quiere conseguir más de la vida, por esto, con las demás variables

constantes, ellos duermen menos (2 < 0). La relación entre el sueño y la edad es más

complicada que lo que este modelo sugiere, y los economistas no están en la mejor

posición para juzgar estas cosas.

(iii) Ya que totwrk se mide en minutos, debemos convertir cinco horas en minutos: Δtotwrk

= 5(60) = 300. Entonces sleep se estima que disminuya 0.148(300) = 44.4 minutos.

Para una semana, 45 minutos menos de sueño no es una variación importante.

(iv) Más educación implica menos tiempo de sueño estimado, pero el efecto es pequeño. Si

asumimos que la diferencia entre el colegio y la universidad es cuatro años, el graduado

del colegio duerme cerca de 45 minutos menos por semana, las demás variables

permanecen constantes.

(v) No es sorprendente que las tres variables expliquen solo cerca del 11.3% de la variación

en sleep. Un factor importante en términos de error es La salud en general. Otro es el

estado civil, y si la persona tiene hijos. La salud (Aunque nosotros la midamos), el

estado civil y el número y edad de los hijos podrían generalmente estar correlacionados

con totwrk. (Por ejemplo, gente menos sana podría tender a trabajar menos).


3. (i) No. Por definición study + sleep + work + leisure = 168. Si cambiamos study, debemos cambiar

al menos una de las otras categorías para que la suma siga siendo 168.

(ii) De la parte (i), podemos escribir, decir, study como una función lineal perfecta de las otras

variables independientes: study = 168 − sleep − work − leisure. Esto se mantiene para cada

observación, por esto se viola el supuesto RLM4.

(iii) Simplemente sacando una de las variables independientes, digamos leisure:

GPA study sleep work u 0 1 2 3

Ahora, por ejemplo, 1 se interpreta como la variación en GPA cuando study aumenta en una

hora, donde sleep, work, y u han permanecido constantes. Si mantenemos sleep y work

constantes pero aumentamos study en una hora, entonces debemos reducir leisure en una

hora. Los otros parámetros tienen una interpretación similar.

4.

Sólo (i), al omitir una variable importante, puede provocar sesgo, y esto es cierto solo cuando la variable

omitida está correlacionada con las variables incluidas. El grado de colinealidad entre las variables en la

muestra, aún si es reflejado en una correlación tan alta como 0.95, no afecta los supuestos de Gauss-Markov.

Solo si hay una relación lineal perfecta entre dos o más variables se viola el MLR4.


5.

Por definición, 2 > 0, y por supuesto, Corr x x1 2 0, . Además, hay un sesgo negativo en

~:

~ 1 1 1E . Esto significa que el estimador de una regresión simple subestima el efecto del programa

de entrenamiento. Es aún posible que E~1 sea negativo aunque 1

> 0.


7.

Anteriormente, en la tabla 3.2, se ha discutido como determinar la dirección del sesgo en los estimadores

MCO cuando una variable importante (habilidad en este caso) ha sido omitida de la regresión. Como se

dijo entonces, la tabla 3.2 únicamente se mantiene con una variable incluida en la regresión, pero nosotros

ignoramos la presencia de otras variables independientes y usamos esta tabla como una guía. (O, podemos

usar los resultados del problema 3.10 para un análisis más preciso.) Si menos trabajadores hábiles están

más deseosos de recibir entrenamiento que train y u están negativamente correlacionados. Si ignoramos la

presencia de educ y exper, o al menos asumimos que train y u están negativamente correlacionados después

de determinar educ y exper, entonces podemos usar la Tabla 3.2: el estimador MCO de 1 (con habilidad

como el término de error) tiene un sesgo hacia abajo. Al pensar que 1 0 , estamos menos deseosos de

concluir que el programa de entrenamiento fue efectivo. Intuitivamente, esto hace sentido: si aquellos

escogidos para el entrenamiento no han recibido entrenamiento, ellos podrían tener salarios más bajos, en

rango, que el grupo de control.


8.

(i) H0 3 0: . H1 3 0: .

(ii) El efecto proporcional sobre salary es 0.00024(50) = 0.012. Para obtener el efecto de porcentaje, multiplicamos esto por 100: 1.2 %. Además, un aumento en el ceteris paribus de 50 puntos en ros se estima para aumentar el salario solo un 1.2 %. En la práctica, este es un efecto muy pequeño para un cambio tan largo en ros.

(iii) El valor crítico del 10% para un test unilateral, usando df = , se obtiene de la Tabla G.2 como 1.282. La estadística t en ros es 0.00024/0.00054 0.44, el cual está por debajo del valor

crítico. No rechazamos H0 a un nivel de significatividad del 10 %.

(iv) Basados en esta muestra, el coeficiente estimado de ros no es diferente de cero y puede ser

omitido del modelo final. Por otro lado, incluir ros puede no causar ningún daño; depende de

cuan correlacionada esté con las otras variables independientes (aunque estas son muy

significativas aún con ros en la ecuación).





i) B = (X’X)-1X’Y =[0.03 0 0

0 0.03 −0.010 −0.01 0.02

] [1322492

] = [3.96−0.21.6

], lo cual implica:

𝛽0 = 3.96, 𝛽1 = −0.2, 𝛽2 = 1.6

ii) Matriz VC = 𝜎2(𝑋′𝑋)−1 = 150*[0.03 0 0

0 0.03 −0.010 −0.01 0.02

] = [4.5 0 00 4.5 −1.50 −1.5 3

]

iii) Se estima valor t para el coeficiente:

𝑡 =�̂�2

𝑠𝑑(�̂�2)=

1.6

√3≈ 0.924

El estadístico t estimado es menor que el valor crítico de la distribución t con cualquier nivel de

significancia aceptable (10%, 5%, o 1%), para test de 2 colas (no podemos estimar test de 1 cola

porque no tenemos ninguna teoría que nos guíe para sugerir cuál sería la hipótesis alternativa).


12. Suponga que se estima la ecuación

sleep totwrk educ age . . . . 363825 0148 1113 2 20

(112.28) (0.017) (5.88) (1.45)

n R 706 01132, . ,

donde proporcionamos los errores estándar junto con las estimaciones.

(i) ¿Son educ o age individualmente significativas al 5 por ciento usando contrastes de dos

colas? Explicar en qué se basa la respuesta.

(ii) Al eliminar educ y age de la ecuación, se obtiene

sleep totwrk . . 363825 0148

(38.91) (0.017)

n = 706, R2 = 0.103

¿Son educ y age conjuntamente significativas al 5 por ciento en la ecuación original?

Justificar la respuesta.

(iii) El incluir educ y age en el modelo ¿afecta mucho a la disyuntiva estimada entre dormir

y trabajar?

Respuesta

(i) Con df = 706 – 4= 702, usamos el valor crítico normal estándar (df = según tabla

G.2), el cual es 1,96 para un test bilateral a un nivel de 5%. Ahora teduc = -11.13/5.88

-1.89, por lo que teduc 189 196. . , rechazamos H educ0 0: a un nivel de 5%.

También, tage 1.52, por lo que age es también estadísticamente insignificante a un

nivel del 5%.

(ii) Necesitamos calcular el R-cuadrado de la estadística F para la significatividad conjunta.

Pero F 0113 0103 1 0113 702 2 396. . / . / . . El valor crítico al 5 % en la

distribución F2 702, puede ser obtenido de la Tabla G.3b con denominador df = : cv =

300. Además, educy age son conjuntamente significativas a un nivel del 5% (3.96

>3.00). De hecho, el valor p es aproximadamente 0.019, y por eso educ y age son

conjuntamente significativas a un nivel de 2%.

(iii) No realmente. Estas variables son conjuntamente significativas, pero incluirlas solo

varía el coeficiente en totwrk de –0.151 a –0.148.

Documents

Guía de Ejercicios 3 Guía de Ejercicios 3 – Regresión Lineal Múltiple (parte I