29
Ejercicios de Econometra (Trabajo Final Ejercicios) Presentado por: Luis HernÆndez Caldera Profesora Dra. Marylœ Zeledn Torres

Con Solid Ado Trabajo Final de a

Embed Size (px)

Citation preview

Page 1: Con Solid Ado Trabajo Final de a

Ejercicios de Econometría (Trabajo Final Ejercicios)

Presentado por: Luis Hernández Caldera

Profesora

Dra. Marylú Zeledón Torres

id82434574 pdfMachine by Broadgun Software - a great PDF writer! - a great PDF creator! - http://www.pdfmachine.com http://www.broadgun.com

Page 2: Con Solid Ado Trabajo Final de a

2

Problema Nº 1: Análisis del demanda de Pollo

Teniendo información a mano pertinente al problema en cuanto a sus datos cuantitativos, notaciones, etc., se procedió a realizar regresiones separadas para de los siguientes modelos

1. tttt uxxy 3322 lnlnln 1

2. ttttt uxyxyxyyy 4433221 lnlnlnln

3. tt uxxxy 5433221 lnlnlnln

4. tttttt uxxxxy 554433221 lnlnlnlnln

5. ttttt uxxxy 6433221 lnlnlnln

Siendo:

Y: Consumo per cápita de pollos, en libras.

X2: Ingreso per cápita real disponible, US$

X3: Precio real al menudeo del pollo por libra US$

X4: Precio real al menudeo de cerdo por libra, US$

X5: Precio real al menudeo de carne de res por libra, US$

X6: Precio real compuesto de los sustitutos del pollo, US$ por libra. Precio ponderado

Se pregunta:

(a) Entre las funciones de demanda que aquí se presentan, ¿Cuál podría escogerse y por que?

Se escogería la función Nº 1 uno denotada por tttt uxxy 3322 lnlnln 1 que

re-escrita sería itt uXY 3221 lnlnln . Esta selección se debe a varios hechos a demostrarse:

Primero: que las variables precio de la carne de cerdo, precio de la carne de res ya sea agregadas o por separado tiene poco o ninguna contribución al modelo inicial.

Aunque la correlación entre dos variables no tiene efecto causal, puede darnos pistas interesantes acerca del comportamiento de las variables en el modelo. Por ejemplo, observemos que la correlación de orden cero existente entre lnYt lnX3, tiene un valor de 0.815 sin embargo cuando eliminamos lnYt baja hasta -0.770 y

Modelo 1 Coefficientsa

1,997 ,119 16,836 ,000

,450 ,026 1,370 17,000 ,000 ,973 ,967 ,561 ,168 5,965

-,361 ,067 -,436 -5,405 ,000 ,815 -,770 -,178 ,168 5,965

(Constant)

lnX2

lnX3

Model1

B Std. Error

UnstandardizedCoefficients

Beta

StandardizedCoefficients

t Sig. Zero-order Partial Part

Correlations

Tolerance VIF

Collinearity Statistics

Dependent Variable: lnYIa.

Page 3: Con Solid Ado Trabajo Final de a

3

Modelo 4 Coefficientsa

2,107 ,160 13,210 ,000

,377 ,087 1,146 4,353 ,000 ,973 ,716 ,147 ,016 61,132

-,456 ,117 -,550 -3,897 ,001 ,815 -,677 -,131 ,057 17,536

,116 ,106 ,235 1,096 ,288 ,924 ,250 ,037 ,025 40,673

,050 ,105 ,101 ,477 ,639 ,934 ,112 ,016 ,025 39,735

(Constant)

lnX2

lnX3

lnX4

lnX5

Model1

B Std. Error

UnstandardizedCoefficients

Beta

StandardizedCoefficients

t Sig. Zero-order Partial Part

Correlations

Tolerance VIF

Collinearity Statistics

Dependent Variable: lnYIa.

cuando el efecto atribuible a lnX2 se elimina de lnX3, el valor de baja hasta -0.178 de tal manera que podría concluirse que la relación entre consumo de pollo y precio de la carne de pollo (lnYt � lnYX3) puede explicarse casi por completo recurriendo a la variable lnX2t, ingreso per cápita. El mismo análisis puede ser

aplicado al modelo 4 en donde las variables lnX4, lnX5, muestran baja en la correlación y por tanto su influencia puede ser explicada en su mayoría por lnX2. Dado que en el resto de modelos el patrón se mantiene, presentamos únicamente los resultados del modelo 4, en donde se puede observar que los valores relativos a los coeficientes semi parciales de correlación lnX4 y lnX5 con valores de 0.037 y 0.016, pueden ser explicados por las variables lnX2 y lnX3.

Comprendiendo que lo desarrollado hasta ahora no responde claramente la pregunta realizada, vamos a proceder a demostrar que la adición de lnX4, lnX5 ya sea en forma parcial o conjunta no aumentará el valor explicativo de la función propuesta

La técnica de análisis de varianza puede utilizarse para demostrar si las variables lnX4 y lnX5, aumentan el poder explicativo de la función propuesta, es decir, si la incorporación de estas dos variables aumentan en gran medida la Suma de Cuadrados Explicativa y por tanto el coeficiente de determinación. La función entonces quedaría planteada en la siguiente forma: tttttt uxxxxy 55443322 lnlnlnlnln 1

Para evaluar la contribución incremental de lnX4 y lnX5 seguiremos la siguiente fórmula:

)mod#(

/#)(

elonuevooseneldeparametrngdelSRCasnuevasderegresorSECSEC

Fnueva

viejanueva

Donde SECnueva = Suma de cuadrados bajo el modelo nuevo (es decir, después de agregar las regresoras nuevas), SECvieja = Suma de cuadrados bajo el viejo modelo o modelo original y SRCnuvea =SRC Suma de Cuadrados de los Residuos bajo el modelo nuevo, es decir, después de considerar todas las regresoras. Bajo estas suposiciones, este valor F deberá seguir la distribución F con 1 y 22 grados de libertad. Explicado lo anterior, procedemos a realizar nuestra prueba de hipótesis.

Page 4: Con Solid Ado Trabajo Final de a

4

Prueba de hipótesis

1. Ho. La agregación de las variables lnX4 y lnX5 relativas al precio de la carne de cerdo y precio de la carne de res aumentará significativamente la Suma de Cuadrados Explicativas y por tanto deberán agregarse al modelo

itt uXY 3221 lnlnln

2. H1. La agregación de las variables lnX4 y lnX5 relativas a precio de la carne de cerdo y precio de la carne de res no aumentará significativamente la Suma de Cuadrados Explicativas y por tanto no deberán ser agregadas al modelo

itt uXY 3221 lnlnln

3. Nivel de significancia á= 0.05 con (1-á) = 95% 4. Muestra = 23 observaciones 5. El estadístico a utilizar es F = á = 0.05 y G de l con 1 y 18 grados de libertad 6. Valores críticos y regla de decisión. Los valores críticos para F considerando 1 grado de libertad en numerador y 18 grados de libertad en el denominador. Se rechaza Ho, si F calculado es mayor que F esperado con á = 0.05 y 1 y 18 grados de libertad; de otra manera no se rechaza. En nuestro caso F esperado = 4.41 7. Cálculos

MODELO 1 ANOVA MODELOb

,756 2 ,378 449,084 ,000a

,017 20 ,001

,772 22

Regression

Residual

Total

Model1

Sum ofSquares df Mean Square F Sig.

Predictors: (Constant), lnX3, lnX2a.

Dependent Variable: lnYIb.

Modelo 4 ANOVAb

,757 4 ,189 215,872 ,000a

,016 18 ,001

,772 22

Regression

Residual

Total

Model1

Sum ofSquares df Mean Square F Sig.

Predictors: (Constant), lnX5, lnX3, lnX4, lnX2a.

Dependent Variable: lnYIb.

CONCEPTO Suma de Cuadrados

G de l

Media Cuadrática

Suma Explicada de Cuadrados debido a lnX2 y lnX3 0.7555 2 0.3778Suma Explicada debido a la adición de lnX4 y lnX5 0.0011 1 0.0011Suma Explicada debido a lnX2,lnX3, lnX4 y lnX5 0.7566 4 0.1891Suma de Residuos 0.0160 18 0.0009Total 0.7723 22

TABLA ANOVA DE ANALISIS INCREMENTAL

)mod#(

/#)(

elonuevooseneldeparametrngdelSRCasnuevasderegresorSECSEC

Fnueva

viejanueva

Page 5: Con Solid Ado Trabajo Final de a

5

8. Conforme los resultados obtenidos podemos concluir que el valor F calculado es < que el valor F esperado.

9. Decisión. Dado que el valor F calculado = 1.222 es menos que F esperado con alfa = 0.05 con 1 y 18 grados de libertad = 4.41 se rechaza la hipótesis nula que supone que la agregación de las variables precio de la carne de cerdo y la precio de la carne de res aumentarían significativamente el valor de la Suma de Cuadrados Explicativas.

10. Considerando que la agregación de las variables precio de la carne de cerdo y precio de la carne de res a la función itt uXY 3221 lnlnln a un nivel de significancia á = 0.05 resulto estadísticamente no significativa se rechaza la hipótesis nula aceptándose la hipótesis alternativa que afirma que las variables precio de la carne de cerdo y precio de la carne de res no agregan valor a la función y por tanto no deben agregarse.

Para ratificar lo anterior, procederemos ahora a mostrar que las variables precio de la carne de pollo, precio de la carne de cerdo y precio de la carne de res no están correlacionadas, procedemos a realizar la siguiente prueba de hipótesis.

Prueba de Hipótesis

1. Ho. .b4=b5 = 0. La carne de pollo, carne de cerdo y carne de res, son productos no correlacionados

2. H1. .b4 = b5 ≠ 0. La carne de cerdo, de pollo y de res son productos relacionados

3. Tamaño de la muestra 23

3. Estadístico t

4. Nivel de significancia á = 0.05

5. Valores Críticos para tá=0.05 con 23-5 g de libertad = 2.08

6. Regla de decisión: Se rechaza Ho si t calculado > que tá=0.05 con 23-2 gdl = 2.08 de lo contrario no se rechaza.

7. Cálculos: Utilizando la fórmula.

)�,�cov(2)�()�( 5454

54

VarVart

222.10009.0

0011.0

4/)7566.0(

1/)7555.07566.0(

F

Page 6: Con Solid Ado Trabajo Final de a

6

Coefficient Correlationsa

1,000 -,627 ,439 -,831

-,627 1,000 -,739 ,592

,439 -,739 1,000 -,778

-,831 ,592 -,778 1,000

,01097 -,00767 ,00487 -,00753

-,00767 ,01367 -,00916 ,00600

,00487 -,00916 ,01122 -,00714

-,00753 ,00600 -,00714 ,00749

lnX5

lnX3

lnX4

lnX2

lnX5

lnX3

lnX4

lnX2

Correlations

Covariances

Model1

lnX5 lnX3 lnX4 lnX2

Dependent Variable: lnYIa.

8. ¿El t calculado es mayor o menor que los valores críticos?

El resultado informa que t calculado es menor que t esperado tá=0.05 (23,5 gdl) = 2.01

9. Decisión: Visto que t calculado = 0.5881 es < que tá=0.05 (23,5 gdl) = 2.01 por tanto se acepta Ho.

10. Dado que el estadístico t observado es menor que t crítico a un nivel de 5% de nivel de significación para 23 y 5 grados de libertad no hay razón para rechazar la hipótesis que sugiere que la carne de pollo, la carne de cerdo y la carne de res son productos no relacionados.

El mismo procedimiento puede ser aplicado para demostrar que agregar la variable lnX6 y demostrar que esa acción contribuiría a la mejora de la Suma de Cuadrados de Explicada; o bien a un aumento del coeficiente de determinación R2 Ajustado.

5851.0)00487.0(201097.001122.0

0500.01160.0

t

Page 7: Con Solid Ado Trabajo Final de a

7

D b1 b2 b3Yi= 1.9970 + 0.4500 lnX2 - 0.3610 lnX3ee(B) 0.1190 0.0260 0.0670t 16.8360 17.0000 -5.4050Sig. 0.0000 0.0000 0.0000

R2 R2 AJ DW F EE0.978 0.976 1.627 449.08 0.0290

I b1 b2 b3 b4Yi= 2.0760 + 0.4110 lnX2t - 0.4210 lnX3t + 0.0940 lnX4tee(B) 0.1420 0.0470 0.0890 0.0930t 14.5920 8.7150 -4.7150 1.0070Sig. 0.0000 0.0000 0.0000 0.3260

R2 R2 AJ DW F EE0.979 0.976 1.557 299.95 0.2899

I b1 b2 b3 b5Yi= 1.9970 + 0.4510 lnX2 - 0.3610 lnX3 + 0.0000 lnX5ee(B) 0.1240 0.0550 0.0790 0.0950t 16.0930 8.2460 -4.5600 -0.004Sig 0.0000 0.0000 0.0000 0.997

R2 R2 AJ DW F EE0.978 0.975 1.627 284.42 0.2976

Yi= 2.1070 + 0.3770 lnX2 - 0.4560 lnX3 + 0.1160 lnX4 + 0.0500 lnX5ee(B) 0.1600 0.0870 0.1170 0.1060 0.1050t 13.2100 4.3530 -3.8970 1.0960 0.477Sig. 0.0000 0.0000 0.0010 0.2880 0.639

R2 R2 AJ DW F EE0.980 0.975 1.563 215.87 0.2960

EE= Error de estimación

tttt uxxy 3322 lnlnln 1

ttttt uxyxyxyyy 4433221 lnlnlnln

tt uxxxy 5433221 lnlnlnln

tttttt uxxxxy 554433221 lnlnlnlnln

Con toda la información obtenida podemos observar que los valores de R2 Ajustado, cambiaban casi imperceptiblemente al agregársele variables lo que era un indicador claro de que contribuían a mejorar la bondad de ajuste de la función; obsérvese también que los coeficientes tuvieron poca variación y F disminuyó sustancialmente a medida que se agregaban variables.

Para llegar a esta misma conclusión se pudieron haber tomado otros caminos. Por ejemplo, se pudo utilizar el SPSS introduciendo el método stepwise, que es una forma de seleccionar las variables en función de un valor F de entrada y salidas; también se pudiese haber realizado otros análisis en cuanto a contribución incremental o marginal de una variable, entre otros caminos a seguir.

b. ¿Como se interpretan los coeficientes de lnX2 y lnX3, en estos modelos?

Los coeficientes de lnX2 y lnX3, miden la elasticidad parcial de la variable dependiente y con respecto a cada variable lo cual ocurre siempre que se tiene un modelo de regresión log-lineal con cualquier número de variables.

Por ejemplo, en el primer caso, â2 mide la elasticidad del ingreso que es la variación porcentual de la cantidad demandada de un bien respecto a la variación

Page 8: Con Solid Ado Trabajo Final de a

8

porcentual del ingreso; si la elasticidad ingreso es positiva (como nuestro caso), se dice que son bienes normales. Si la elasticidad ingreso es menor que uno, se dice que son bienes necesarios, si es mayor que uno se dice que son bienes de lujo o suntuarios.

En el caso de â3 mide la elasticidad precio de la demanda o elasticidad de la demanda que es el cambio porcentual de la cantidad demandada dividido por el cambio porcentual del precio.

c. ¿Cual es la diferencia entre las especificaciones (2) y (4)?

La función 2 contempla la utilización de tres variables (X2, X3 y X4) mientras que la función 4 propone la utilización de 4 variables (X2, X3, X4 y X5) este hecho representa una variación cuantitativa como cualitativo; como hemos visto en el desarrollo de nuestro ejercicio, algunas de esas variables contribuyen más que otras al ajuste del modelo, sin embargo, en nuestro caso, el agregar la carne de cerdo no ayudo mucho al ajuste y aún más al agregar la carne de res que tampoco agrega valor al modelo al menos en nuestro análisis, solo viene a complicar las cosas puesto que como hemos analizado ambas variables corren riesgo de sufrir de colinealidad o fuerte correlación; formular una función con estas debilidades nos conduciría a realizar pronósticos equivocados violando supuestos y principios como el de la parsimonia.

d. Son el Cerdo y/o la carne de res productos que compiten con el pollo o que lo sustituyen? ¿Cómo se sabe?

El hecho de que la carne de pollo, la carne de cerdo y la carne de res son productos no correlacionados ha sido demostrado mediante prueba de hipótesis no obstante se pueden agregar otras técnicas. El conocer si el cerdo y la carne de res son productos que compiten con la carne de pollo o si le sustituyen puede indagarse mediante el análisis de la elasticidad cruzada de la demanda es decir, el análisis merece atención en conocer como o de que manera responden los individuos ante cambios en los precios de de la carne de res, de pollo y de cerdo, esto se hace a través de la técnica conocida como elasticidad precio cruzado de la demanda.

La elasticidad cruzada es la variación porcentual de la cantidad demandada de un bien ante la variación porcentual del precio de otro bien. El valor que toma la elasticidad cruzada permite clasificar a los bienes. Dos bienes cualesquiera, x y z, son sustitutos si la elasticidad cruzada es positiva y son complementarios si la elasticidad cruzada es negativa.

Page 9: Con Solid Ado Trabajo Final de a

9

e. Supóngase que la función 5 es la demanda correcta. Estímese los parámetros de este modelo, obtenga los errores estándar, así como el R2 y R2 Ajustado, F. Interprete los resultados.

Coefficientsa

1,995 ,120 16,577 ,000

,493 ,070 1,499 7,019 ,000 ,973 ,850 ,235 ,025 40,703

-,331 ,082 -,399 -4,027 ,001 ,815 -,679 -,135 ,114 8,759

-,087 ,133 -,165 -,654 ,521 ,941 -,148 -,022 ,018 56,504

(Constant)

lnX2

lnX3

lnX6

Model1

B Std. Error

UnstandardizedCoefficients

Beta

StandardizedCoefficients

t Sig. Zero-order Partial Part

Correlations

Tolerance VIF

Collinearity Statistics

Dependent Variable: lnYIa.

Conforme el cálculo realizado en SPSS, la función correspondiente al modelo

solicitado es la siguiente: iii XXXYi 632 lnln331.0ln493.0995.1 la cual nos informa lo siguiente: La constante, no trasmite que si el resto de variables toman el valor cero, habrá un consumo latente per cápita de 1.995 libras; el coeficiente b2 representativo de la elasticidad - ingreso, informa que un aumento del ingreso del consumidor del orden de 1 dólar aumentaría el consumo de pollo en aproximadamente 4.93 libras per cápita; el coeficiente b3, que representa y el precio propio de la carne de pollo, significa que un aumento en el precio de la carne de pollo del orden de 1 centavo disminuiría el consumo de pollo en 0.33 libras per cápita; finalmente, el coeficiente b4, que mide la elasticidad de los productos sustitutos de la carne de pollo, indica que un aumento del precio de estos productos del orden de 1 centavo, permitiría aumentaría la demanda en 0.87 libras per cápita.

ModelO 6 Summaryb

,989a ,979 ,975 ,02943 1,674Model1

R R SquareAdjustedR Square

Std. Error ofthe Estimate

Durbin-Watson

Predictors: (Constant), lnX6, lnX3, lnX2a.

Dependent Variable: lnYIb.

R, el coeficiente de correlación = 0.989 nos indica que entre las variables existe un alto grado de correlación lineal no causal; el R2 o coeficiente de determinación se refiere a la bondad del ajuste que en caso se puede interpretar como una relación casi perfecta lo cual permite pronosticar con bastante certeza los valores del consumo de carne de pollo; en otras palabras R2, mide la proporción o el porcentaje de variación total en Y que es explicada por el modelo de regresión. El R2 Ajustado, mide lo mismo que R2, es un indicador cuya medida se hace tomando en cuenta el ajuste del número de grados de libertad.

Page 10: Con Solid Ado Trabajo Final de a

10

CONCLUSION GENERAL

Dada la siguiente función 3610.04500.0997.1 Yi y los análisis realizados en el presente trabajo podemos concluir que los el comportamiento que el consumo per cápita de pollo no se ve afectada directamente por los precios de la carne de cerdo, la de res o por los productos �sustitutos� del pollo en vista que son productos no relacionados como se ha demostrado además, el resultado de la función muestra que b2 es mayor que 0 y menor que 1 y que b3 tiene signo negativo y su valor es mayor que cero y menor que uno lo cual significa lo siguiente:

Primero, que la carne de pollo es un producto que responde muy poco a la baja de precios; es decir aún cuando los precios sufriesen grandes cambios o aumentos, solo se producirían cambios pequeños en la demanda y por lo tanto se concluye que la carne de pollo es inelástica al precio;

Segundo, el signo menos únicamente refleja el tipo de relación existente entre el precio y la cantidad demandada que es de tipo inversa lo cual significa que el coeficiente de elasticidad precio de la demanda siempre será un precio negativo y por tanto debe verse en términos de valor absoluto; de tal manera que en la función propuesta no debe interpretarse como que si existe una demanda negativa de 0.3610 debe leerse como: Una aumento del precio la carne de pollo de 1 centavo, daría lugar a una reducción en el consumo per cápita del 0.33 libras.

Page 11: Con Solid Ado Trabajo Final de a

11

1. Ejercicio 7.9, Pág. 201 a. Utilizando el modelo de regresión ii uXiiXYi 42 4321

obtenga una estimación de los coeficientes de regresión e interprete los resultados.

Coefficientsa

-33,460 48,783 -,686 ,507

,019 ,019 ,264 1,009 ,335

15,522 9,465 ,425 1,640 ,129

,813 1,911 ,111 ,425 ,679

(Constant)

Ingreso

TXfamilia

Desemp

Model1

B Std. Error

UnstandardizedCoefficients

Beta

StandardizedCoefficients

t Sig.

Dependent Variable: PFTa.

Conforme con los resultados, tendríamos la siguiente función de regresión:

iii XXXYi 432 813.052.15019.0460.33

El intercepto, cuyo valor es de -33.430, interpretado linealmente, sería la tasa de reserva de desempleo del grupo de las FPU; es decir, el la tasa normal de desempleo existente en este grupo social. El coeficiente de regresión parcial del Ingreso Familiar Promedio (IFP) = 0.019, indica que si la influencia del Tamaño Medio de la Familia (TMF) y la Tasa de Desempleo (FD) se mantienen constante, conforme el IFP aumente en un dólar, el porcentaje de participación de las Familias Pobres Urbanas (FPU), aumentará en 0.019 unidades; dicho de otra manera, si IFP aumentará en 100 dólares la tasa de participación de las FPU, aumentará en 1.9%. El coeficiente 0.813 que mide la tasa de desempleo, señala que si la influencia del IFP y el TMF se mantienen constante, en la medida que el desempleo aumente (disminuya) en una unidad o sea un 1% la tasa de participación de las FPU en la fuerza de trabajo aumentará en 0.813%.

Cuales son los signos lógicos a priori para los coeficientes de regresión? ¿Por qué?

Para beta 1 negativo, para beta 2, posito porque en la medida que el ingreso aumenta (salario) las FPU, estarán motivadas a incrementar su participación en la fuerza de trabajo; para b3 negativo puesto en medida en que la familia aumente su tamaño promedio, más complejo será colocarse en el mercado de trabajo; para b4 negativo, ya que en la medida que disminuya la tasa de desempleo, la participación de las FPU, deberá aumentar.

Page 12: Con Solid Ado Trabajo Final de a

12

¿Cómo se verifica la hipótesis de que la tasa global de desempleo no tiene efecto alguno sobre la participación de la fuerza de trabajo de familias urbanas pobres?

De hecho, los resultados en SPSS, nos indican que ninguna de las variables es estadísticamente significativa al nivel de á = 0.05 lo cual significa que si tratamos de contrastar la hipótesis nula de b4 = 0, tendríamos que aceptar esa hipótesis puesto que t= 0.425 y Sig. = 0.679.

Coefficientsa

-33,460 48,783 -,686 ,507

,019 ,019 ,264 1,009 ,335 ,301 ,291 ,259 ,964 1,037

15,522 9,465 ,425 1,640 ,129 ,451 ,443 ,421 ,981 1,020

,813 1,911 ,111 ,425 ,679 ,040 ,127 ,109 ,975 1,026

(Constant)

Ingreso

TXfamilia

Desemp

Model1

B Std. Error

UnstandardizedCoefficients

Beta

StandardizedCoefficients

t Sig. Zero-order Partial Part

Correlations

Tolerance VIF

Collinearity Statistics

Dependent Variable: PFTa.

Además de la prueba t, podríamos aplicar la prueba F para medir la contribución de esa variable a la función en general. Sin embargo, los resultados de las pruebas SPSS, por simple inspección nos indican una serie de problemas con esta función, por ejemplo, que el nivel de correlación entre las variables es sumamente bajo; si observamos los coeficientes parciales de correlación observamos que todas las variables se correlación poco con la variable independiente; esto lo podemos confirmar a través observando el Coeficiente de determinación Ajustada cuyo valor es de 0.078; dicho de otro modo que estas variables explican poco o nada el comportamiento de la participación de las FPU en la fuerza de trabajo.

Model Summaryb

,525a ,275 ,078 18,3822 2,407Model1

R R SquareAdjustedR Square

Std. Error ofthe Estimate

Durbin-Watson

Predictors: (Constant), Desemp, TXfamilia, Ingresoa.

Dependent Variable: PFTb.

Esto puede deberse (otra hipótesis) que pude existir autocorrelación negativa (DW=2.407) puesto que la tasa de desempleo es un ponderado de los grupos que componen la población civil activa que representa los diferentes grupos sociales entre ellos, negros, jóvenes y adolescentes, familias urbanas, etc.

Obsérvese que si eliminamos esta variable, el R2 Ajustado aumenta sustantivamente pasando del 0.078 a 0.141 mejorando la explicación aunque todavía pobremente.

Page 13: Con Solid Ado Trabajo Final de a

13

Model Summaryb

,513a ,264 ,141 17,7438 2,308Model1

R R SquareAdjustedR Square

Std. Error ofthe Estimate

Durbin-Watson

Predictors: (Constant), TXfamilia, Ingresoa.

Dependent Variable: PFTb.

Para quedar todos contentos vamos a proceder a realizar la prueba de hipótesis igualando b4=0 utilizando el método de prueba de significancia del ese coeficiente de regresión.

1. Ho: B4 = 0. Tasa desempleo efecto 0 en la participación de FPU en la FT

2. H1. B4 ≠ 0. Tasa desempleo efecto ≠ 0 en la participación de FPU en FT

3. Nivel de Significancia = 0.05 = (1-á) 95% de probabilidad

4. Estadístico: t

5. Muestra = 15

6. Valores críticos= (n-k) = 15 � 4 = 13 grados de libertad t á/2 = +/- 2.201. n= número de observaciones y K= número de parámetros incluyendo b1.

7. Reglas de decisión: Si bajo Ho. Se encuentra dentro del intervalo de confianza -2.201 y +2.201, no se rechace Ho, pero si esta por fuera del intervalo rechace Ho.

8. Procedimientos de cálculos

1

)�(

~�Pr 2/

4

42/ t

eet

425.0911.1

0813.0

t

9. ¿Región de rechazo o de aceptación? Es evidente que 0.425 se encuentra entre -2.201 y +2.201 o sea dentro de la región de aceptación de la hipótesis nula

10. Decisión. A un nivel de significancia de 0.05 se encuentra que la prueba es estadísticamente no significativa por tanto se acepta la hipótesis nula que asegura que la tasa global de desempleo tiene efecto 0 en la participación de las FPU en la fuerza de trabajo rechazándose la hipótesis alterna que asegura que la tasa de desempleo tiene efecto sobre la participación de las FPU en las fuerza de trabajo.

Page 14: Con Solid Ado Trabajo Final de a

14

¿Deberían excluirse del modelo algunas variables? ¿Por qué?

Para responder la pregunta hemos realizado cuatro corridas en SPSS. La primera la hicimos corriendo el modelo original puede observarse que tenemos un R2 ajustado de tan solo de 0.078; de las cuatro corridas solamente dos logran mejorar este coeficiente; el modelo 2 (Ingreso + TX-Familia) con R2 Ajus. = 0.141 y el modelo 4 (TX-Familia) con R2 Ajustado que también presenta el menor error de estimación y el menor DW; de tal manera que podemos concluir que la variable más influyente es Tamaño de la familia puesto que cuando realizamos la regresión únicamente con Ingreso, R2 Ajustado bajo a 0.021 y el error aumento. Podríamos concluir que deberíamos retirar las variables tasa de empleo e ingreso promedio; no obstante creemos que no se trata de sumar o restar aplicando lo que se conoce como elaboración de un modelo bajo el enfoque ascendente; por una parte, por otra un modelo que explique muy poco el comportamiento de la variable independiente parece no ser indicado.

¿Qué otras variables debería usted tener en cuenta para que se incluyeran en el modelo?

Podemos especular con algunos supuestos tales como agregar variables dicótomas para analizar la influencia de la raza, los años de estudio, la zona, la edad, experiencia previa, nivel educativo, etc. sin embargo todo esto es especulativo. A nuestro juicio el modelo adolece de mala especificación lo cual constituye la violación de un supuesto importante. A continuación vamos a tratar de demostrar esa violación.

Prueba Global de Significancia del Modelo

Para comprobar nuestra hipótesis, vamos a recurrir a la prueba de significancia global en donde Ho: B2=B3=B4=0 a un nivel de significancia de 0.05, con n= 15 y k= 4 (incluyendo a b1). A continuación desarrollamos nuestra prueba.

Model Summaryb

,525a ,2 75 ,078 18,3 822 2,40 7Model1

R R Squa reAdju stedR Squ are

Std. Error ofthe Estima te

Durbi n-Watso n

Predictors: (Constant), Desemp, TXfamilia, Ingresoa.

Dependent Variable: PFTb. Model Summaryb

,513a ,2 64 ,141 17,7 438 2,30 8Model1

R R Squa reAdju stedR Squ are

Std. Error ofthe Estima te

Durbi n-Watso n

Predictors: (Constant), TXfamil ia, Ingresoa.

Dependent Variable: PFTb. Model Summaryb

,301a ,0 91 ,021 18,9 411 2,20 0Model1

R R Squa reAdju stedR Squ are

Std. Error ofthe Estima te

Durbi n-Watso n

Predictors: (Constant), Ingresoa.

Dependent Variable: PFTb. Model Summaryb

,451a ,2 03 ,142 17,7 339 2,14 6Model1

R R Squa reAdju stedR Squ are

Std. Error ofthe Estima te

Durbi n-Watso n

Predictors: (Constant), TXfamiliaa.

Dependent Variable: PFTb.

Page 15: Con Solid Ado Trabajo Final de a

15

ANOVAb

1413,160 3 471,053 1,394 ,296a

3716,977 11 337,907

5130,137 14

Regression

Residual

Total

Model1

Sum ofSquares df Mean Square F Sig.

Predictors: (Constant), Tasa de desempleo, Tamaño medio de la familia, IngresoFamiliar promedio

a.

Dependent Variable: % en la fuerza de trabajo Y*b.

1. Ho: b2=b3=b4 = 0. Todos los coeficientes son simultáneamente = cero

2. H1: b2=b3=b4 ≠ 0. No todos los coeficientes son simultáneamente = cero

3. Estadístico: F

4. Nivel de Significancia = 0.05 = (1-á) 95% de probabilidad

5. Tamaño Muestra = 15

6. Valores críticos: Los valores críticos estarán determinados por Fá (k-1 para el numerador y n-k para el denominador) donde k es el número de parámetros incluyendo b1 y n= al número de observaciones siendo F esperado = 3.59

7. Reglas de decisión: Si F calculado es > F crítico =Fá (k-1, n-k), rechazar Ho; de lo contrario, no se rechace.

8. Procedimientos de cálculos

)/(

)1(/

knSRCkgdelSECF

9. ¿Región de rechazo o de aceptación? Es claro que 1.3939 > 3.59.

10. Decisión. Dado que a un nivel de significancia de 0.05 F crítico es mayor que calculado Fá (k-1, n-k), se acepta la hipótesis nula mediante la cual se propone que todos los coeficientes son simultáneamente igual a cero encontrándola estadísticamente no significativa y por tanto se declara que no existe relación entre el la variable % de participación de las familias pobres urbanas, el ingreso, el tamaño medio de la familia y la tasa de desempleo.

3939.111/)98.716,3(

3/)16.413,1(F

Page 16: Con Solid Ado Trabajo Final de a

16

Ejercicio 8.10

Klein y Goldberger intentaron ajustar el siguiente modelo de regresión a la economía de los Estados Unidos: iiiii uXXXY 433221 Donde: Y= Consumo; X2 = Ingreso, X3 = Ingreso diferente a salarios o diferente a ingreso agrícola y X4 = Ingresos Agrícolas. Pero, puesto que se espera que X2, X3 y X4 tengan alta colinealidad, ellos obtuvieron estimaciones para b3 y b4 utilizando análisis de series de corte transversal de la siguiente manera b3 = 0.75 b2 y b4 = 0.625 b2. Utilizando estas estimaciones, formularon su función de consumo de la siguiente manera: iiiiii uZuXXXYi 214221 )625.03753.0( donde

iiii XXXZDonde 432 625.075.0: .

Preguntas:

a. Ajuste el modelo a los siguientes datos y obtenga de b2 a b4.

Al efectuar la regresión ii uYi 21 se obtuvo los siguientes datos:

Coefficientsa

23,803 6,364 3,740 ,003

,685 ,066 ,948 10,303 ,000

(Constant)

Zi

Model1

B Std. Error

UnstandardizedCoefficients

Beta

StandardizedCoefficients

t Sig.

Dependent Variable: Ya.

Que traducidos a lenguaje econométrico sería ZiYi 685.0803.23 . Dado que hemos obtenido b2; podemos estimar b3 y b4 a partir de la relación postulada entre b2 - b3 y b2 � b4; así tendríamos:

5138.075.0*685.03

428.0685.0*685.04 B

Por tanto la función quedaría así: iXiXiXYi 4428.035138.02685.0803.23

b. ¿Cómo se interpretaría usted la variable Z? ¿Porqué?

La variable Z, es una regresión auxiliar que permite a Klein y Goldberger combinar dos técnicas para remediar la colinealidad utilizando información de corte transversal mediante la cual pudieron obtener una estimación de los valores de b3 y b4. Con este artificio, ellos lograron no excluir ninguna variable del modelo original utilizando un procedimiento práctico (información a priori e información de corte transversal) puesto que esto conduciría a un error de especificación. Dado que en el modelo original b3=b4 lo cual se demuestra a continuación:

1. Ho.: b3=b4 o b3-b4=0

2. H1.: b3≠b4 o b3-b4≠0

3. Estadístico de prueba = t

Page 17: Con Solid Ado Trabajo Final de a

17

4. Nivel de significancia = á=0.05

5. Tamaño de la muestra: n=14

6. Valores críticos para n-k = 14 � 4 (cuatro regresoras incluyendo constante)= 2.228

7. Regla de decisión: Si tá=0.05; para 10 gdl > t calculado, rechazar hipótesis nula; de lo contrario no se rechace.

8. Cálculos

)�,�cov(2)�var()�var(

��

4343

43

t

Coefficientsa

19,556 6,880 2,842 ,017

,334 ,256 ,354 1,306 ,221 ,933 ,382 ,117 ,108 9,231

1,525 ,614 ,580 2,485 ,032 ,946 ,618 ,222 ,147 6,825

,480 1,386 ,053 ,346 ,736 ,769 ,109 ,031 ,336 2,974

(Constant)

X2

X3

X4

Model1

B Std. Error

UnstandardizedCoefficients

Beta

StandardizedCoefficients

t Sig. Zero-order Partial Part

Correlations

Tolerance VIF

Collinearity Statistics

Dependent Variable: Ya.

Regresión original = iii XXXYi 432 480.0525.1334.0556.19

Coefficient Correlationsa

1,000 ,065 -,514

,065 1,000 -,824

-,514 -,824 1,000

1,921 ,055 -,182

,055 ,376 -,129

-,182 -,129 ,066

X4

X3

X2

X4

X3

X2

Correlations

Covariances

Model1

X4 X3 X2

Dependent Variable: Ya.

409.0)129.0(2921.1376.0

480.0525.1

t

9. Decisión: Es evidente que 0.409 no excede al valor crítico 2.228.

10. Dado que a un nivel de significancia de á = 0.05 con 10 grados de libertad la prueba t calculada es menor que t esperado; se acepta la hipótesis nula de que b3 y b4 son iguales o bien que b3 � b4=0.

Dado lo anterior, es comprensible que ambos investigadores hayan tomado la decisión de utilizar una regresión auxiliar que les permitiera no excluir ninguna variable utilizando además información de corte transversal.

Page 18: Con Solid Ado Trabajo Final de a

18

(d) Suponga que usted ya ha corregido la regresión y que posteriormente desea introducir otra variable ortogonal, digamos la variable Xk-1 en el modelo. ¿Se tienen que volver a calcular todos los coeficientes anteriores desde b1 hasta bk? ¿Porqué sí o porqué no?

Asumiendo que iiiiii uZuXXXYi 214221 )625.03753.0( es el modelo �verdadero�, adicionar otra variable implicaría volver a calcular todos los coeficientes anteriores puesto que esa nueva �variable� explicaría en parte el comportamiento de la variable independiente incrementando o disminuyendo el error de estimación; debe considerarse que este recurso utilizado por los investigadores, esta suponiendo implícitamente que b3 y b4 han sido obtenidos a partir de una análisis puro lo que podría acarrear problemas de interpretación; por una parte, por otra hay que considerar que la utilización de la técnica de datos transversales tiene la restricción de que debe ser aplicada en situaciones en donde las estimaciones de corte transversal no varían sustancialmente de un grupo a otro por tal razón, agregar otra variable que tanta es la variación de la información entre los grupos.

Page 19: Con Solid Ado Trabajo Final de a

19

Ejercicio 8.19.-

La siguiente tabla proporciona datos sobre importantes, PNB e índice de precios al consumidor (IPC) para los Estados Unidos durante el periodo 1970-1983.

Se solicita considerar el siguiente modelo:

ittt uIPCPNBnesimportacio lnlnln 321

(a) Calcule los parámetros de este modelo utilizando la información dada en la tabla.

Coefficientsa

-2,311 1,029 -2,245 ,046

3,230 ,751 1,941 4,299 ,001 ,981 ,792 ,210 ,012 85,039

-1,968 ,920 -,965 -2,138 ,056 ,964 -,542 -,105 ,012 85,039

(Constant)

LnPNB

LnCPI

Model1

B Std. Error

UnstandardizedCoefficients

Beta

StandardizedCoefficients

t Sig. Zero-order Partial Part

Correlations

Tolerance VIF

Collinearity Statistics

Dependent Variable: Lnimporta.

Conforme los resultados tendríamos la siguiente función.

IPCtPNBtnesimportacio ln968.1ln230.3311.2ln

(b) ¿Sospecha usted que existe multicolinealidad en los datos?

Model Summaryb

,987a ,974 ,969 ,11875 1,314Model1

R R SquareAdjustedR Square

Std. Error ofthe Estimate

Durbin-Watson

Predictors: (Constant), LnCPI, LnPNBa.

Dependent Variable: Lnimportb.

En efecto, a priori, hay indicios de multicolinealidad:

1. Un alto coeficiente de determinación conjuntamente con ningún valor t significativo;

2. Valores de la T (tolerancia) cercanos a cero con VIF altos lo que indica que existe alta variación;

(c) Examine la naturaleza de la multicolinealidad utilizando el índice de condición.

Collinearity Diagnosticsa

2,998 1,000 ,00 ,00 ,00

,002 37,272 ,29 ,00 ,01

1,81E-005 406,756 ,71 1,00 ,99

Dimension1

2

3

Model1

EigenvalueCondition

Index (Constant) LnPNB LnCPI

Variance Proportions

Dependent Variable: Lnimporta.

Page 20: Con Solid Ado Trabajo Final de a

20

El Índice de condición muestra un valor = 406.756 lo que nos permite clasificar la multicolinealidad existente como severa pues excede el límite de 30 fijado.

(d) Regrese las siguientes funciones:

1. tPNBAAnesimportacio lnln 21

2. tIPCBBnesimportacio lnln 21

3. tt IPCCCPNB lnln 21

Con base en estas regresiones ¿Qué puede decir usted sobre la naturaleza de la multicolinealidad en los datos?

Caso Original = ittt uIPCPNBnesimportacio lnlnln 321

Model Summaryb

,987a ,974 ,969 ,11875 1,314Model1

R R SquareAdjustedR Square

Std. Error ofthe Estimate

Durbin-Watson

Predictors: (Constant), LnCPI, LnPNBa.

Dependent Variable: Lnimportb.

-2,311 1,029 -2,245 ,046

3,230 ,751 1,941 4,299 ,001 ,981 ,792 ,210 ,012 85,039

-1,968 ,920 -,965 -2,138 ,056 ,964 -,542 -,105 ,012 85,039

(Constant)

LnPNB

LnCPI

Model1

B Std. Error

UnstandardizedCoefficients

Beta

StandardizedCoefficients

t Sig. Zero-order Partial Part

Correlations

Tolerance VIF

Collinearity Statistics

Dependent Variable: Lnimporta.

Retomando los resultados iniciales de

ittt uIPCPNBnesimportacio lnlnln 321 , observamos que los signos no están acorde con las expectativas a priori puesto que un aumento en el IPC, afectaría negativamente las importaciones y un incremento en el PNB reflejaría un aumento en las importaciones; también podemos apreciar que ningún coeficiente parcial es significativo no obstante, también puede verificarse que la Tol tiende a aproximarse a cero y el Factor de Inflación de la Varianza (VIF) se dispara lo cual significa que las varianzas y las covarianzas se incrementan; sin embargo el estadístico F = 203.161 y por tanto significativo, demuestra que cuando la colinealidad es �alta pero no perfecta�, no son confiables las pruebas sobre las regresoras individuales en tal caso la F global es la que demostrará que si Y, esta relacionada con las diversas regresoras. Este hecho de que la prueba F sea significativa pero los valores t de X2 y X3 no los sean significativos individualmente prueba que las dos variables, están tan altamente correlacionadas que es difícil aislar el impacto individual del PNB o del IPC sobre los niveles de importación.

Page 21: Con Solid Ado Trabajo Final de a

21

Caso 2: tPNBAAnesimportacio lnln 21

Cuando se efectúa la regresión de las importaciones (Y) sobre el PNB (X2), obtenemos los siguientes resultados:

Model Summaryb

,981a ,963 ,960 ,13528 ,688Model1

R R SquareAdjustedR Square

Std. Error ofthe Estimate

Durbin-Watson

Predictors: (Constant), LnPNBa.

Dependent Variable: Lnimportb.

Coefficientsa

-,543 ,699 -,777 ,452

1,633 ,093 ,981 17,595 ,000 ,981 ,981 ,981 1,000 1,000

(Constant)

LnPNB

Model1

B Std. Error

UnstandardizedCoefficients

Beta

StandardizedCoefficients

t Sig. Zero-order Partial Part

Correlations

Tolerance VIF

Collinearity Statistics

Dependent Variable: Lnimporta.

Primero, observamos que R2 Ajustado, se mantiene alto con R2 Ajustado= 0.960; además desaparece puesto que T=1 y VIF = 1; además b2 es significativo estadísticamente aunque la constante continua siendo no significativa pero manteniendo el signo negativo.

Caso 3: tIPCBBnesimportacio lnln 21

Model Summaryb

,964a ,929 ,923 ,18614 ,486Model1

R R SquareAdjustedR Square

Std. Error ofthe Estimate

Durbin-Watson

Predictors: (Constant), LnCPIa.

Dependent Variable: Lnimportb.

Coefficientsa

1,508 ,815 1,850 ,089

1,966 ,156 ,964 12,564 ,000 ,964 ,964 ,964 1,000 1,000

(Constant)

LnCPI

Model1

B Std. Error

UnstandardizedCoefficients

Beta

StandardizedCoefficients

t Sig. Zero-order Partial Part

Correlations

Tolerance VIF

Collinearity Statistics

Dependent Variable: Lnimporta.

Ahora si realizamos la regresión de importaciones (Y) sobre X3 (IPC), obtenemos el siguiente resultado:

Page 22: Con Solid Ado Trabajo Final de a

22

Ahora tenemos un R2 Ajustado = 0.923 y obsérvese que b1 continua siendo cambio de signo pero aún continua siendo no no aparecen signos de colinealidad puesto que T=1 y VIF =1.

Caso 4: tt IPCCCPNB lnln 21

Finalmente, si regresamos ahora PNB (X2) sobre IPC (X3), tendremos los siguientes resultados:

Model Summaryb

,994a ,988 ,987 ,04563 ,796Model1

R R SquareAdjustedR Square

Std. Error ofthe Estimate

Durbin-Watson

Predictors: (Constant), LnCPIa.

Dependent Variable: LnPNBb.

Coefficientsa

1,182 ,200 5,915 ,000

1,218 ,038 ,994 31,756 ,000 ,994 ,994 ,994 1,000 1,000

(Constant)

LnCPI

Model1

B Std. Error

UnstandardizedCoefficients

Beta

StandardizedCoefficients

t Sig. Zero-order Partial Part

Correlations

Tolerance VIF

Collinearity Statistics

Dependent Variable: LnPNBa.

Aunque este otro modelo, podremos valor el impacto aislado que el IPC, tiene sobre el PNB, algo que hasta el momento no hemos podido verificar con exactitud; observemos que el coeficiente de determinación entre X3 y X3 es alto, o sea que una buena parte de lo que ocurre en PNB es explicado por IPC; no obstante el signo no esta acorde ya que un aumento en el IPC, deberá incidir negativamente en las importaciones debido a la baja en el poder adquisitivo.

Un facto no comentado hasta ahora es que todas las regresiones muestran clara tendencia a la autocorrelación positiva ya que en caso 1 DW= 1.314; caso 2 DW=0.688; Caso 3 DW = 0.486 y Caso 5 DW=0.796.

Independientemente de lo anterior podemos concluir que la naturaleza de la multicolinealidad, dificulta el cálculo de los coeficientes estimados con errores pequeños.

(e) Suponiendo que existe multicolinealidad en los datos pero que b2 y b3 son individualmente significativas al nivel de 5% y que la prueba F también es significativa, en ese caso ¿debemos preocuparnos sobre el problema de la multicolinealidad?

La multicolinealidad es un problema de marca mayor cuando en la forma de multicolinealidad perfecta puesto que los coeficientes de regresión se tornan indeterminados o sea no se puede obtener una solución única de los coeficientes de regresión individual; sin embargo, en presencia de multicolinealidad imperfecta no existe razón a priori para pensar que no se puedan calcular dichos coeficientes; el único efecto de la multicolinealidad, según Christopher Achen, es que dificulta el

Page 23: Con Solid Ado Trabajo Final de a

23

cálculo de los coeficientes estimado con errores pequeños; por tanto hay que preocuparse cuando existe multicolinealidad muestral para lo cual se debe agrandar la muestra o utilizar otras técnicas a fin de lidiar con el engorroso hecho de aislar la influencia individual de las variables sobre Y.

Page 24: Con Solid Ado Trabajo Final de a

24

9.7. En una encuesta de más de 9966 economistas en 1964 se obtuvieron los siguientes datos:

a.- Desarrolle un modelo adecuado de regresión que explique el salario mediano en relación con la edad.

¿¿????

b. Suponiendo que la varianza del término de perturbación es proporcional al cuadrado de la edad, transforme los datos de tal manera que él término de perturbación resultante sea homocedástico.

Vamos a proceder en la siguiente forma:

Primero vamos a realizar las transformaciones sugeridas

Segundo se realizará una prueba de Park para determinar si hay o no hetereoscedasticidad partiendo de Ho = Hay homocedasticidad versus H1 = no hay homocedasticidad. La regla de decisión será: Si â resulta estadísticamente significativo, se rechaza Ho de lo contrario no se rechaza.

Para el primer caso simbólicamente sería: 22

2)( iXuiVar . Los resultados son:

Model Summaryb

,738a ,544 ,494 1887,394Model1

R R SquareAdjustedR Square

Std. Error ofthe Estimate

Predictors: (Constant), Edad2a.

Dependent Variable: Salariosb.

Coefficientsa

9102,542 1114,635 8,166 ,000

1,267 ,386 ,738 3,279 ,010 1,000 1,000

(Constant)

Edad2

Model1

B Std. Error

UnstandardizedCoefficients

Beta

StandardizedCoefficients

t Sig. Tolerance VIF

Collinearity Statistics

Dependent Variable: Salariosa.

Pasos prueba de ParK:

1. Realizar regresión asumiendo homocedasticidad

2. Salvar los residuos

3. Elevar al cuadrado los residuos

4. Transformar los residuos al cuadrado a logaritmo

Page 25: Con Solid Ado Trabajo Final de a

25

5. Transformar la edad media a logaritmo

Una vez hecho esto se procederá a correr el siguiente modelo:

viXiui lnln 2

Los resultados son:

Coefficientsa

-,131 4,419 -,030 ,977

-,191 1,159 -,055 -,164 ,873

(Constant)

lnEdad

Model1

B Std. Error

UnstandardizedCoefficients

Beta

StandardizedCoefficients

t Sig.

Dependent Variable: lnZre2a.

Dado que â resulta ser no significativo estadísticamente, se acepta Ho; es decir no hay razón para pensar que existe hetereoscedasticidad.

c.- Repita (b) suponiendo que la varianza es proporcional a la edad. ¿Cuál de las transformaciones parece plausible?

Simbólicamente esta propuesta sería iXuiVar 22 ~

)( los resultados para este caso son:

Model Summary

,815a ,664 ,626 1621,985Model1

R R SquareAdjustedR Square

Std. Error ofthe Estimate

Predictors: (Constant), Spropocionala.

Coefficientsa

5968,947 1568,101 3,806 ,004

,513 ,122 ,815 4,213 ,002

(Constant)

Spropocional

Model1

B Std. Error

UnstandardizedCoefficients

Beta

StandardizedCoefficients

t Sig.

Dependent Variable: Salariosa.

Siguiendo la misma ruta y la misma hipótesis nula presentamos los resultados de la regresión son:

Page 26: Con Solid Ado Trabajo Final de a

26

Coefficientsa

-5,183 10,524 -,493 ,634

,451 1,124 ,133 ,401 ,698

(Constant)

lnSpropor

Model1

B Std. Error

UnstandardizedCoefficients

Beta

StandardizedCoefficients

t Sig.

Dependent Variable: lnZre2c2a.

Dado que â igual que en el caso anterior resulta no ser estadísticamente significativo por tanto se acepta la hipótesis nula de existencia de homocedasticidad.

d.- Si ninguna de las transformaciones anteriores parece razonable, suponga que el término de varianza es proporcional a la expectativa condicional del salario mediano, condicionado a la edad dada. ¿Cómo transformaría usted los datos para que la varianza resultante sea homocedástica?

A nuestro juicio, conforme las pruebas de Park, no existe hetereoscedasticidad, lo que existe es una mala especificación del modelo puesto que hacen falta variables explicativas.

Page 27: Con Solid Ado Trabajo Final de a

27

10.3.- Al estudiar el movimiento en la participación de los obreros de producción en el valor agregado (es decir, la participación en la mano de obra), Gujarati considero los siguientes modelos*.

Modelo A: it utY 10

Modelo B: uittYt 21 2

donde Y=participación de la mano de obra y t=tiempo. Con base en datos anuales para el período 1949-1964, se obtuvieron los siguientes resultados para la industria medica primaria:

tYt 0041.04529.0 R2=0.5284; d=0.8252; t=(-3.9608)

ttYt 0005.00127.04786.0 ; R2 =0.6629 d=1.82; tb2=(-3.2724); tb3=(2.7777).

Prueba de hipótesis Modelo A

1. Ho: Autocorrelación = 0

2. H1: Autocorrelación ≠ 0

3. Estadístico: Durbin � Watson modificado

4. Tamaño Muestra = 16 (1949 � 1964)

5. Nivel de Significancia = 2á = 0.01

6. Valores críticos: Los valores críticos estarán determinados para n=16 y 2 regresoras incluyendo la constante = dL= 0.737 dU=1.252 de tal manera que los valores críticos a dos alfas serán: d < dU ó (4-d) < dU.

7. Reglas de decisión:

Si d calculado < dU ó (4 - d) < dU, rechácese Ho al nivel de 2á; estadísticamente, hay evidencia de autocorrelación positiva o negativa.

8. Procedimientos de cálculos

Dado que �d� calculado es igual 0.8252 < que dU=1.252 rechácese Ho.

9. Dado que a un nivel de significancia de 2 á = 0.01 para 16 observaciones y 2 regresoras incluyendo la constante se constata que el d calculado en menor que dU encontrándose significancia estadística de tal manera que a ese nivel de significancia se rechaza la hipótesis nula aceptándose la hipótesis alternativa de que existe correlación ya sea esta positiva o negativa.

Modelo B: uittYt 21 2 ; se seguirían los mismos procedimientos para

un �d� = 1.82 con n= 16 observaciones y K = a 3 regresoras para valores críticos = dL=0.636 y dU=1.446; con la siguiente regla de decisión: Si d calculado < dU ó (4 - d) < dU, rechácese Ho al nivel de 2á; estadísticamente, hay evidencia de autocorrelación positiva o negativa.

Page 28: Con Solid Ado Trabajo Final de a

28

Dado que 4 � 1.82 en mayor que dU = 1.446 se acepta Ho; o se no existe razón para pensar que existe autocorrelación positiva o negativa.

(b) ¿Qué explica la correlación serial?

Asumimos que los términos correlación serial o autocorrelación en la práctica son sinónimos que pueden explicar tanto la correlación existente entre dos series de tiempo o bien la correlación de una rezagada de una serie consigo misma, rezagada por un número de unidades de tiempo; en otras palabras, el término correlación serial o autocorrelación, explica como la correlación entre miembros de series de observaciones ordenadas en el tiempo o en el espacio. En el contexto de la regresión, el modelo clásico de regresión lineal supone que no existe correlación en las perturbaciones.

(c) Cómo distinguiría usted entre la autocorrelación �pura� y el sesgo de especificación.

En principio hay que analizar el tipo de datos que estamos manejando; si se trata de series de tiempo es muy probable que se este en presencia de autocorrelación pura para ello tendremos que incluir la variable tiempo - tendencia a fin de observar la relación entre las variables analizadas; si después de hacer este tipo de transformaciones, �d� continua siendo bajo, estaremos en presencia de un mala especificación del modelo. Aplicando el DW sobre un modelo al que ya se le ha tratado para corregir la autocorrelación lo que observamos no es la correlación positiva o negativa observada en los residuos cuando se ajusta un modelo sino son los errores de especificación. La correlación observada refleja el hecho de que hay una o más variables pertenecientes al modelo que están incluidas en términos del error y necesitan ser rechazadas de este ser introducidas por derecho propio.

Page 29: Con Solid Ado Trabajo Final de a

29

Ejercicio 12.5

Suponiendo que modificamos la regresión del salario de un profesor universitario (12.4.1) así: uoBXDDiDDYi iiii ),( 32433221

Donde:

Yi= Salario anual de un profesor universitario

Xi= Años de experiencia docente

D2= 1 si es hombre y cero en los demás casos

D3= 1 si es blanco y cero en los demás casos

(a) El término (D2iD3i) representa el efecto de interacción ¿Qué significa esta expresión)

En este modelo el sexo y la raza son regresoras cualitativas y los años de docencia cuantitativos. Esta implícito en este modelo la suposición de que el efecto diferencial de la variable sexo, D2, es constante en las dos categorías de raza y el efecto diferencial de la variable dicótoma raza, D3, también es constante en los dos sexos. Es decir, si el salario medio es mayor para los hombres que para las mujeres, se debe a que pertenezcan o no pertenezcan a la categoría de blanco. De igual forma, si los no blancos tienen salarios medios menores, se debe a que son hombres o mujeres; no obstante en muchas ocasiones un hombre no blanco tal vez gane menor salario que un hombre de esa misma categoría. En otras palabras, quizás hay interacción en las dos variables cualitativas D2 y D3. Por tanto, su efecto sobre la media Y quizás no sea simplemente aditivo sino multiplicativo con el modelo presentado uiBXDDiDDYi iiii ),( 32433221 .

(b) ¿Qué significado tiene el coeficiente á4?

El coeficiente alfa 4 mide el efecto diferencial de no ser blanco.

(c) Halle ),13,12|( XiDDYiE ii e interprételo.

¿?

.