Upload
brian-lara-molina
View
42
Download
0
Embed Size (px)
DESCRIPTION
IMPACTO DE LOS FACTORES QUE CARACTERIZAN AL PRODUCTO VIVIENDA DE “KASAS BIENES RAICES” SOBRE SU PRECIO DE MERCADO EN AREQUIPA, DURANTE EL PRIMER TRIMESTRE 2014
Citation preview
"Año de la Inversión para el Desarrollo Rural y la Seguridad Alimentaria"
UNIVERSIDAD NACIONAL DE SAN AGUSTIN
FACULTAD DE ECONOMIA
“IMPACTO DE LOS FACTORES QUE CARACTERIZAN AL PRODUCTO VIVIENDA DE “KASAS BIENES RAICES” SOBRE SU PRECIO DE MERCADO EN
AREQUIPA, DURANTE EL PRIMER TRIMESTRE 2014”
CURSO: Econometría
PROFESOR: Econ. Orlando Torres Montes
TEMA: Econometría Aplicada
Alumnos:
Lara Molina, Brian
AÑO: 3ro “A”
2014
Este trabajo va dedicado a nuestros padres por el apoyo incondicional, a la inmobiliaria KASAS por facilitar la obtención de los datos y a las personas que ayudaron a la realización de este trabajo.
PRESENTACION
En el presente trabajo mostraremos el respectivo análisis sobre el impacto de los factores que caracterizan al producto vivienda de “kasas bienes y raíces” sobre su precio de mercado en Arequipa, durante el primer trimestre 2014.
Con el fin de de contribuir con los consumidores del mercado de bienes puesto que el modelo sirve para predecir cuánto debería pagar por una vivienda específica con las características analizadas en este estudio.
ContenidoPRESENTACION..............................................................................................................................................3
INTRODUCCION..............................................................................................................................................5
CAPITULO I.....................................................................................................................................................7
Marco Teórico................................................................................................................................................7
Pregunta central..........................................................................................................................................10
Objetivo.......................................................................................................................................................10
Hipótesis......................................................................................................................................................10
Modelo empírico..........................................................................................................................................11
Modelo Matemático....................................................................................................................................13
Modelo Económico......................................................................................................................................13
Modelo Econométrico inicial.......................................................................................................................13
Capitulo 2.....................................................................................................................................................14
Análisis de las variables dicótomas..........................................................................................................14
Observaciones......................................................................................................................................15
Análisis del Modelo Inicial........................................................................................................................16
Regresión inicial:..................................................................................................................................16
Análisis de la variable: “Años de antigüedad”......................................................................................17
Modelo LOG - LIN.................................................................................................................................29
Capitulo 3.....................................................................................................................................................31
Modelo Final – Semielástico (LOG-LIN)....................................................................................................31
Regresión del Modelo LOG – LIN..........................................................................................................31
Matriz de Gráficos de Dispersión del Modelo LOG – LIN......................................................................34
Pruebas de validación del Modelo Econométrico LOG – LIN................................................................35
Conclusiones................................................................................................................................................46
INTRODUCCION
La inmobiliaria “KASAS BIENES RAICES” tiene en el mercado una trayectoria de 10 años, siendo su principal actividad económica la compra y venta de inmuebles. Es un negocio que se inició con capitales familiares
La vivienda en Arequipa ha experimentado un incremento en los precios muy importante en los últimos años. Se abordan dos preguntas que hacen los compradores: ¿Por qué se han alzado estos niveles de precios y cuál será su evolución en el futuro próximo? No existe una única respuesta, pues son muchas las razones explicativas de este fenómeno, algunas del propio sector, otras relacionadas con los mercados financieros, además de la renta disponible. Dichas variables se pueden clasificar en dos grandes apartados, según afecten a la demanda o a la oferta del mercado de la vivienda. Como es de esperar, no todas han contribuido de igual manera a esta escalada de precios.
Para este trabajo de investigación nos vamos a enfocar en los factores que afectan a la oferta del mercado de viviendas pero somos consientes que actualmente existe demanda insatisfecha de viviendas, como lo indica el “III Estudio del Mercado de Edificaciones Urbanas en la provincia de Arequipa”, elaborado en enero pasado por el Instituto de la Construcción y el Desarrollo (ICD) de la Cámara Peruana de la Construcción (CAPECO), de los 33327 hogares en la provincia que requieren de una casa o departamento, 31627 hogares no satisfacen sus expectativas de consumo o no encuentran viviendas que puedan pagar, es decir el casi el 95%. El estudio indica que la insatisfacción no está distribuida de manera uniforme. De las 1700 viviendas que se ofrecen en la actualidad en el mercado inmobiliario (entre departamentos y casas), 1366 tienen un precio superior a US$80.000. El 80% de la oferta de vivienda actual es para la población con ingresos altos.
Es claro que el Boom inmobiliario en Arequipa es una realidad innegable que se inició aproximadamente hace 3 años, como lo indica un artículo del diario La República de abril del 2013, los precios de lotes y casas se mantienen al alza por la gran demanda. Se estima que creció en 30% en el primer trimestre de ese año. En el año 2012 se vendieron 23 mil casas, 10% más que en el 2011. Cayma, Yanahuara, Sachaca, Cerro Colorado y José Luis Bustamante y Rivero son los distritos donde se concentra la mayor presión de urbanizar, indica el artículo. Además que las zonas de Cayma y Yanahuara figuran como las más costosas. El metro cuadrado (m2) de terreno sin construir supera los 1000, cifra inpensada hace cinco años; las cotizaciones apenas llegaban a US$60 por m2. En el caso de las viviendas construidas, los precios varían de US$70 mil a US$500 mil, dependiendo de la ubicación y el tamaño de la misma.
Otra variable económica de los factores que afectan a la oferta de viviendas en Arequipa es el nivel de los salarios de la mano de obra de construcción. Hace cinco años un obrero de construcción civil llegaba a ganar por proyecto cerca de S/.140 por semana. Ahora su sueldo no baja de los S/. 420 semanales. Un maestro de obras ganaba máximo dos sueldos mínimos al mes, ahora sus honorarios no bajan de S/.520 por semana. En este sentido las empresas constructoras se ven obligadas a esperar la culminación de esos proyectos o a contratar a gente fuera de Arequipa.
Con entrevistas al Gerente de una inmobiliaria nos dimos cuenta que la variable financiamiento y/o créditos hipotecarios son muy importantes en el momento de que los
posibles compradores decidan adquirir una vivienda. Más específicamente en los primeros meses de este año los créditos hipotecarios han decrecido y se mantienen constantes. Esta medida preventiva por parte de los agentes financieros la hacen ante el temor de la existencia de una burbuja inmobiliaria en la que el propietario se vea imposibilitado de pagar un inmueble obtenido a crédito y los bienes raíces se devalúen. Es por esta razón que hemos hecho la investigación con datos del primer trimestre del año 2014, ya que de haber incluido datos de fechas anteriores, las variables de financiamiento no serían las mismas y ocasionaría errores al elaborar el modelo econométrico.
CAPITULO I
Marco Teórico
La vivienda es un bien necesario para el hombre, tanto desde el puto de vista individual como colectivo (GOMEZ-MORÁN, 1972), y por lo tanto, en la valoración de la inversión vivienda, habrá que tener en cuenta su valor de uso. Éste puede ser disfrutado por el propietario del bien o por un arrendatario del mismo. Una forma de valorar este uso es a partir de la cuantificación de la utilidad para el usuario tiene el disfrute del bien. En este sentido, el adquiriente puede ser el propietario (propietario-usuario) o puede ser un arrendador. En ambos casos existe la posibilidad de cuantificar económicamente el disfrute de este bien, ya sea a partir de las cuotas de alquiler que se dejan de pagar (en el caso del propietario-usuario), ya sea a partir de las cuotas de alquiler que se cobran del arrendatario (LARRAUIRI, 1996). Así, el precio del “servicio-vivienda” o renta, se convierte en una variable fundamental a la hora de estimar el valor del activo vivienda.
Un segundo objetivo de la posesión del activo vivienda es la inversión pura, entendida ésta como la que lleva a cabo un comprador del activo-vivienda cuyo único fin es el de conseguir una plusvalía con el transcurso del tiempo tras su venta. En este caso, el adquiriente es un “inversor puro” que contempla el activo-vivienda como una alternativa capaz de experimentar una importante revalorización, superior en términos reales a la que puede derivarse de otros activos, de hecho, el activo vivienda constituye uno de los llamados “bienes refugio”.
Los diferentes objetivos perseguidos con la inversión en vivienda se ponen de manifiesto cuando se analizan las variables que influyen en la determinación de su precio.
Los factores que mayor importancia pueden tener en la determinación del precio de este activo son:
Factores de la demanda:o A largo plazo
Factores demográficos: población total, población perteneciente a un determinado corte de edad, índice de nupcialidad, número de personas por vivienda. Estas variables pueden determinar la demanda potencial de la vivienda.
o A corto plazo Factores económicos: nivel de renta per cápita/unidad familiar. Factores financieros: tipos de interés del mercado hipotecario,
volumen disponible de crédito hipotecario, el ratio préstamo/valor de la vivienda, etc.
Factores fiscales: minoraciones en el impuesto derivadas del pago de intereses y de la inversión en vivienda.
Factores determinantes de la oferta: Disponibilidad de crédito: cuanto mayor sea el ahorro, mayor será
la cantidad de dinero utilizable para la inversión en construcción. Variables que afectan a la demanda: población, renta, stock de
viviendas existentes, etc. Costes de construcción: ésta puede ser la variable que más influye
en la fijación del precio desde el punto de vista de la oferta y constituye el límite inferior al precio de la vivienda.
Calidad y características del producto: localización del inmueble, años de antigüedad, número de habitaciones, materiales de construcción, acabados, etc. Estas variables influyen en la fijación del precio desde el punto de vista de la demanda.
Dentro de la literatura sobre análisis económico de la vivienda, existe una importante línea de trabajo, denominada “enfoque hedónico” o “modelo de precios hedónicos”, que se aproxima al estudio del bien vivienda teniendo en cuenta su carácter heterogéneo. Esta línea parece ser la más adecuada para nuestro análisis, en la medida que permite cubrir nuestras necesidades de modelización y resolver el objetivo planteado, relacionado con la variabilidad de precios de vivienda.
El enfoque hedónico es una perspectiva de análisis desarrollada en torno a los viene heterogéneos o diferenciados, que surge ante las dificultades de comprensión de su funcionamiento en el mercado desde una perspectiva ortodoxa. En efecto, este tipo de viene heterogéneos, como es el caso de la vivienda, se caracterizan porque aparecen en
el mercado en forma de diferentes variedades o modelos. Esto supone que, bajo una denominación común, existen en realidad bienes de distinta calidad, sustancialmente distintos en sus características o composición, y además la distinta calidad de estos bienes provoca diferencias significativas en sus precios. Todo esto provoca dificultades para el funcionamiento de los mercados de estos bienes, pues en ellos no se intercambian bienes homogéneos y perfectamente sustituibles, y los precios no suponen valoración de una misma realidad. En este sentido, el “enfoque hedónico” plantea una nueva perspectiva y pretende analizar los bienes heterogéneos y la variabilidad de sus precios, tomando como punto de referencia fundamental, no tanto las distintas unidades o variables de ese bien, sino las características o atributos que componen dichas variedades.
La principal aportación para comprender los fundamentos teóricos del enfoque hedónico los constituye el modelo elaborado por Sherwin Rosen (1974) para productos heterogéneos o diferenciados. Rosen elabora un modelo teórico de equilibrio parcial para los viene heterogéneos en un mercado competitivo. Este modelo implica una serie de propuestas metodológicas en relación a la concepción de los bienes heterogéneos y su funcionamiento en el mercado, susceptibles de ser aplicadas al bien vivienda:
1) En primer lugar plantea una modelización de los bienes heterogéneos (vivienda) que tiene presente las múltiples dimensiones que estos incorporan y que permite representar las diferencias de calidad existentes entre las diferentes variedades de cada bien heterogéneo. Propone caracterizar las distintas variedades o modelos de vivienda, a través de un reducido conjunto de las características o componentes que posee, y por lo tanto este bien se entenderá como un “conjunto de atributos individuales cada uno de los cuales proporciona servicios de vivienda” (ROTENBERG, 1991)
Z=(z1+z2+z3…zn)2) Las decisiones de los agentes (consumidores y oferentes) se evalúan no en el
espacio de las distintas variedades de bienes similares, sino en el espacio de las características que los componen” (ROSEN, 1974). Esta nueva perspectiva indica:
Los intercambios de bienes heterogéneos (vivienda) que se dan en el mercado, son en realidad transacciones de las características o atributos que componen estos bienes, que se demandan y ofrecen de forma conjunta.
Las decisiones de consumidores y las valoraciones que estos sacan al mercado tienen en cuenta fundamentalmente las características que tienen estos bienes. El consumidor no maximiza su utilidad eligiendo entre las distintas variedades de viviendas, sino entre las distintas características que ofrece cada unidad de vivienda.
En la medida en que los agentes valoran los atributos o características que componen estos bienes heterogéneos, se puede señalar la existencia de mercados implícitos para dichas características con sus consiguientes
precios implícitos, diferentes comportamientos de los agentes y distintas elasticidades respecto a dichas características.
3) Se propone una nueva explicación de la situación de equilibrio que se produce en dicho mercado y del significado del precio de equilibrio para los bienes heterogéneos (vivienda).Una vez realizado el análisis del comportamiento de los consumidores y productores por separado, se hace necesario ver cómo interactúan ambos y como se produce el encuentro entre ellos en el mercado para dar lugar a la transacción y al equilibrio del mercado.
Pregunta central
¿Cuáles son los efectos de impacto de la localización, área útil, antigüedad y número de habitaciones en el precio de mercado de las viviendas?
Objetivo
Determinar la influencia de la localización, área útil, antigüedad y número de habitaciones sobre el precio de mercado de las viviendas en 76 ventas de la inmobiliaria “Kasas” en Arequipa metropolitana, para el primer trimestre del año 2014.
Hipótesis
La influencia de la localización, área útil, antigüedad y número de habitaciones son factores de oferta que determinan las relaciones económicas del precio de mercado de las viviendas; independientemente de los factores demográficos y financieros de la demanda.
Metodología
Modelo empírico
1. Fuente de datos elegida para la estimaciónPara la estimación de la función precios de viviendas, utilizando técnicas de regresión resulta esencial contar con una fuente de datos adecuada, que nos permita obtener las observaciones sobre precios y características de distintas unidades de vivienda necesarias para la estimación.
Para el desarrollo de la aplicación empírica hemos escogido como fuente de datos el “Registro de ventas de la inmobiliaria Kasas Bienes Raíces (Enero, Febrero y Marzo año 2014)”
La elección de los datos proporcionados por este registro como fuente adecuada para la investigación, se justifica en la medida que dicha fuente cumple determinadas condiciones:
a. Constituye una fuente de datos sobre el mercado de vivienda de carácter microeconómico. En esta fuente se recoge información sobre precios y características de vivienda, son observaciones individualizadas para cada unidad de vivienda.
b. Recoge “observaciones completas” sobre cada una de las unidades de vivienda encuestadas, en el sentido de que ofrecen información tanto sobre el precio de dichas viviendas, que funcionará como variable dependiente, como sobre un número suficiente y valorizado de atributos que permiten definir consistentemente la vivienda (área útil, localización, antigüedad, número de habitaciones) que funcionarán como variables independientes.
c. Accesibilidad a la información, la fuente de datos por pertenecer a la inmobiliaria “Kasas” se ha ofrecido ayudarnos en la investigación proporcionando las facilidades que les sean permitidas.
2. Elección de variables a. Elección de variable dependiente
Como variable dependiente o explicada a incluir en la ecuación de regresión tomaremos el dato de “Precio total al contado de cada vivienda analizada” expresado en dólares americanos US$.
b. Elección de variables independientesPara realizar una selección previa de las variables sobre atributos de la vivienda que pueden ser potencialmente significativas en la explicación del precio de la misma, y por lo tanto pueden ser incluidas en la ecuación de regresión, se han utilizado los siguientes criterios:
Se trata de variables sobre atributos de la vivienda observables y evaluables en cada variedad de vivienda del mercado por los agentes que participan
Se trata de variables sobre atributos de la vivienda que presentan indicios de ser explicativas del precio de la misma, fundamentados en la reflexión teórica o en antecedentes de otros trabajos empíricos.
Se trata de un conjunto de variables que permiten describir de forma correcta y completa la realidad heterogénea del bien vivienda, de tal modo que queden expresadas las distintas
dimensiones esenciales de este bien: tamaño, localización, tipo de vivienda, antigüedad.
En cuanto al número de variables a introducir en la estimación de la regresión hedónica, hemos preferido introducir un número no muy extenso de variables posibles, ya que la inmobiliaria no maneja muchos datos con características específicas de los inmuebles, además nuestro trabajo se enfoca en los factores que caracterizan al producto como factores de la oferta de viviendas en la fijación de un precio de mercado.
No obstante, para determinar de forma definitiva las variables independientes que son significativas para explicar el precio de las viviendas, el criterio utilizado es la observación de estadísticos de significatividad de dichas variables (estadístico t) que se obtienen con la estimación de la ecuación de regresión.
Las variables elegidas son:
Área útil: variable de tipo cuantitativo, expresada en metros cuadrados, que hace referencia directamente al tamaño de cada vivienda observada.
Localización: variable cualitativa binaria o dicótoma: Se desagrega por puntos cardinales tomando en consideración al norte, sur y al oeste, se codifica 1 si la vivienda observada se localiza en dichas zonas y 0 si la vivienda no se localiza en ellas.
N° de habitaciones: variable de tipo cuantitativo. Expresa el número de habitaciones que cuenta la vivienda, incluyendo la habitación de servicio en caso de que la vivienda la posea. Añade información adicional sobre el tamaño y distribución de la misma
Años de Antigüedad: variable de tipo cuantitativo. Expresa los años transcurridos desde la construcción de la vivienda, hasta la actualidad. Expresa información sobre la calidad de la vivienda.
Modelo Matemático
Como estamos analizando el efecto que causan los atributos de las viviendas como factores de la oferta, independientemente de los factores de la demanda, utilizaremos inicialmente el siguiente modelo lineal:
Px=f (X 1 ,X 2 , X 3 ,… Xn)
Donde:
Px = Precio de la vivienda al contado expresado en dólares americanos US$ X = Son los atributos que caracterizan al producto vivienda
Modelo Económico
Dentro de la literatura sobre análisis económico de la vivienda, existe una importante línea de trabajo, denominada “enfoque hedónico” o “modelo de precios hedónicos”, que se aproxima al estudio del bien vivienda teniendo en cuenta su carácter heterogéneo. Esta línea parece ser la más adecuada para nuestro análisis, en la medida que permite cubrir nuestras necesidades de modelización y resolver el objetivo planteado, relacionado con la variabilidad de precios de vivienda.
Px=f (AREA , AÑOS DE ANTIGUEDAD, N ° HABITACIONES ,LOCALIZACIÓN )
Modelo Econométrico inicial
De carácter específico cada una de las variables independientes influye de forma distinta a la variable explicada. Del mismo modo se introduce el efecto de todas las demás variables que no han sido consideradas expresadas en el error.
Px=β0+ β1∗Años Antiguedad+ β2∗Área útil+ β3∗N ° Habitaciones+ β4∗Localización+e i
Capitulo 2
Análisis de las variables dicótomas
En la primera parte se realizan tablas de contingencia para cada una de las Localizaciones estudiadas (Norte, Oeste y Sur) mostrando los promedios de las demás variables estudiadas cuando pertenecen o no, a estas localizaciones.
Localización
Norte:
Se puede observar que si el inmueble queda situado en la zona Norte de la ciudad (Yanahuara, Alto Selva Alegre y Cayma) tiende a tener un precio mas elevado respaldado por una menor antigüedad y una mayor área.
Oeste:
Si comparamos los datos de esta tabla con la anterior observaremos que una casa ubicada al norte tendrá un mayor precio que una al Oeste (Sachaca y Cerro Colorado) de igual manera sucedería con el área.
Total 190500 1.368421 177.3158 3.578947 1 218125 1.125 186 3.8125 0 170409.1 1.545455 171 3.409091 Z1Nor PX ANT AR NHa
Total 190500 1.368421 177.3158 3.578947 1 195222.2 1.222222 164.1111 3.444444 0 189034.5 1.413793 181.4138 3.62069 Z1Oe PX ANT AR NHa
Sur:
En esta circunstancia se puede observar que los inmuebles ubicados al sur tienen menor precio respaldado en un monto mayor de antigüedad y una menor área.
Observaciones
Con este análisis descriptivo se puede notar que las propiedades localizadas en la zona Norte tienen un precio mayor que a de las otras zonas, mientras que las ubicadas al Sur cuentan con una mayor antigüedad.
Habiendo eliminado otras tales como la contaminación, el transporte y la existencia de parques debido a su irrelevancia para nuestro análisis.
La mayoría de inmuebles llevan carretera a diferencia de un lote que puede estar ubicado en una zona geográfica un tanto inaccesibles por ello esta variable no añade valor u signicancia a nuestro estudio.
Para tener en cuenta la existencia de parques , se tendría que hacer un análisis un tanto mas especifico acerca de la población que adquirió los inmuebles (Existencia de hijos, Edad, Sexo) por lo cual esta variable quedo descartada debido que para muchas personas es indiferente este tipo de bien.
Total 190500 1.368421 177.3158 3.578947 1 138142.9 2 128.2857 3 0 202322.6 1.225806 188.3871 3.709677 Z1Sur PX ANT AR NHa
Análisis del Modelo Inicial
Regresión inicial:
Para el análisis de nuestro modelo inicial de manera conjunta podemos percatarnos que el término del error (47646) es muy elevado alejándose del óptimo que debería ser un valor bastante cercano a cero irrumpiendo así su eficiencia.
Evaluación de forma conjunta (Usando el estadístico F)
o Planteando la hipótesis nula: No existe relación lineal entre PX y las variables explicativas. Mediante la prueba F se rechaza la hipótesis nula, al ser el valor P menor de 0.05, demostrando que si existe una relación estadísticamente significativa de PX y las variables explicativas.
Evaluación de forma individual (Usando el estadístico t)
_cons -7236.859 31883.99 -0.23 0.821 -70843.67 56369.95 Z1Sur 31673.17 19673.74 1.61 0.112 -7574.865 70921.21 Z1Oe 49422.79 18232.36 2.71 0.008 13050.23 85795.36 Z1Nor 51038.38 16548.42 3.08 0.003 18025.19 84051.57 NHa 40652.53 9066.391 4.48 0.000 22565.58 58739.49 AR 210.6208 71.94328 2.93 0.005 67.09783 354.1437 ANT -17635.35 3928.098 -4.49 0.000 -25471.69 -9799.005 PX Coef. Std. Err. t P>|t| [95% Conf. Interval]
Total 5.2826e+11 75 7.0435e+09 Root MSE = 47646 Adj R-squared = 0.6777 Residual 1.5664e+11 69 2.2701e+09 R-squared = 0.7035 Model 3.7162e+11 6 6.1937e+10 Prob > F = 0.0000 F( 6, 69) = 27.28 Source SS df MS Number of obs = 76
. xi: reg PX ANT AR NHa Z1Nor Z1Oe Z1Sur
o Planteamiento de la hipótesis nula: No existe un precio autónomo en la venta de viviendas de la empresa “KASAS”. Se puede observar que el termino constante (Precio de los inmuebles) tiene una probabilidad mayor al 5% por ende se estaría aceptando que no existe un precio fijo o un “precio autónomo“en la venta de las viviendas por la empresa “KASAS” de Arequipa en el primer trimestre de 2014.
o En esta primera regresión la prueba individual (t) explica que todas las variables tienes influencia sobre el precio exceptuando a Z1Sur quien al tener una probabilidad mayor a 5% estaría aceptando que no existe influencia de la localización sobre el precio
Análisis de la variable: “Años de antigüedad”
De aquí en adelante trataremos de demostrar el grado de significancia que muestra la variable antigüedad sobre el precio.
Regresión del Precio de Venta con respecto a los Años de antigüedad de la vivienda
xi: reg PX ANT
_cons 232306.5 10996.86 21.12 0.000 210394.7 254218.2
ANT -30550.87 5427.479 -5.63 0.000 -41365.36 -19736.38
PX Coef. Std. Err. t P>|t| [95% Conf. Interval]
Total 5.2826e+11 75 7.0435e+09 Root MSE = 70700
Adj R-squared = 0.2903
Residual 3.6989e+11 74 4.9985e+09 R-squared = 0.2998
Model 1.5838e+11 1 1.5838e+11 Prob > F = 0.0000
F( 1, 74) = 31.68
Source SS df MS Number of obs = 76
Para el análisis de nuestro modelo inicial de manera conjunta podemos percatarnos que el término del error (70700) es muy elevado alejándose del óptimo que debería ser un valor bastante cercano a cero irrumpiendo así su eficiencia.
Evaluación de forma conjunta (Usando el estadístico F)
o Planteando la hipótesis nula: No existe relación lineal entre PX y ANT (Años de antigüedad). Mediante la prueba F se rechaza la hipótesis nula, al ser el
valor P menor de 0.05, demostrando que si existe una relación estadísticamente significativa de PX y ANT.
Evaluación de forma individual (Usando el estadístico t)
o Planteamiento de la H0: No existe un precio autónomo en la venta de viviendas de la empresa “KASAS”. Se puede observar que el termino constante (Precio de los inmuebles) tiene una probabilidad menor al 5% por ende se estaría rechazando que no existe un precio fijo o un “precio autónomo “en la venta de las viviendas por la empresa “KASAS” de Arequipa en el primer trimestre de 2014.
o Planteamiento de la Hipótesis para la variable ANT, H0: No existe influencia de los años de antigüedad sobre el precio de venta. Se observa que la antigüedad sí tiene influencia sobre el precio debido a que tiene una probabilidad menor al 5% por ende se estaría rechazando que no existe influencia de los años de antigüedad sobre el precio de venta de las viviendas por la empresa “KASAS” de Arequipa en el primer trimestre de 2014.
o Este modelo no es válido para predecir de forma correcta el precio de venta de las viviendas, debido al error del modelo; el cual nos estaría indicando la existencia de heteroscedasticidad por tal motivo aplicaremos otros modelos para su ajuste y eficiencia.
Habiendo obtenido de la regresión como varianza y como desviación estándar los siguientes:
display "Varei=" (3.6989e+11/(76-2)) = 4.999e+09 display "stdei=" sqrt(4.999e+09) = 70703.607
Tabla de Media Aritmética, Geométrica y Armónica means PX ANT
Harmonic 48 1.570338 1.36869 1.841669 Geometric 48 1.825115 1.541455 2.160975 ANT Arithmetic 76 1.368421 1.024709 1.712133 Harmonic 76 157108.7 142369.9 175251.6 Geometric 76 173212 156478.5 191735 PX Arithmetic 76 190500 171322.2 209677.8 Variable Type Obs Mean [95% Conf. Interval]
Tabla Resumen: Precio de Venta - Antigüedad summ PX ANT
ANT 76 1.368421 1.504146 0 6 PX 76 190500 83925.6 75000 450000 Variable Obs Mean Std. Dev. Min Max
Gráfica de Dispersión del Precio de Venta en función de los Años de Antigüedad
tw (scatter PX ANT), yline(190500)xline(1.368421)
100,
000.
0020
0,00
0.00
300,
000.
0040
0,00
0.00
500,
000.
00P
RE
CIO
(U
S$)
0 2 4 6ANTIGÜEDAD (AÑOS)
twoway (scatter PX ANT)||(lfit PX ANT, lcolor(blue)), yline(190500)xline(1.368421)
0.00
100,
000.
00200
,000
.0030
0,00
0.004
00,0
00.0
0500,
000.
00
0 2 4 6ANTIGÜEDAD (AÑOS)
PRECIO (US$) Fitted values
tw (scatter PX ANT)||(lfit PX ANT, by(Z1Nor)),legend(label(2 "tendencia"))
0.0
05
00
,00
0.0
0
0 2 4 6 0 2 4 6
0 1
PRECIO (US$) tendencia
ANTIGÜEDAD (AÑOS)
Graphs by = 1 si esta al Norte (Yanahuara y Alto selva Alegre y Cayma)
scatter PX ANT,by(Z1Nor,total row(1))||(lfit PX ANT,by(Z1Nor)),legend(label(2 "tendencia"))
0.0
05
00
,00
0.0
0
0 2 4 6 0 2 4 6 0 2 4 6
0 1 Total
PRECIO (US$) tendencia
ANTIGÜEDAD (AÑOS)
Graphs by = 1 si esta al Norte (Yanahuara y Alto selva Alegre y Cayma)
Intervalos de confianza
twoway (lfitci PX ANT, bc(mint))(scatter PX ANT)
010
0000
2000
0030
0000
4000
0050
0000
0 2 4 6ANTIGÜEDAD (AÑOS)
95% CI Fitted valuesPRECIO (US$)
DIAGRAMA DE CAJA
graph box ei, title("Mercado inmobiliario: Precio vs Antiguedad")subtitle("Diagrama de caja: Distribucion de los terminos del error (ei)")
-100000
0100000
200000
300000
Resi
duals
Diagrama de caja: Distribucion de los terminos del error (ei)Mercado inmobiliario: Precio vs Antiguedad
Los errores no se distribuyen normalmente quiere decir que existen valores aberrantes o atípicos.
El siguiente grafico se utiliza para medir la varianza de las perturbaciones
symplot ei
050
000
1000
0015
0000
2000
0025
0000
Dis
tanc
e ab
ove
med
ian
0 20000 40000 60000 80000 100000Distance below median
Residuals
xi: reg PX ANT
_cons 232306.5 10996.86 21.12 0.000 210394.7 254218.2 ANT -30550.87 5427.479 -5.63 0.000 -41365.36 -19736.38 PX Coef. Std. Err. t P>|t| [95% Conf. Interval]
Total 5.2826e+11 75 7.0435e+09 Root MSE = 70700 Adj R-squared = 0.2903 Residual 3.6989e+11 74 4.9985e+09 R-squared = 0.2998 Model 1.5838e+11 1 1.5838e+11 Prob > F = 0.0000 F( 1, 74) = 31.68 Source SS df MS Number of obs = 76
Para predecir los errores estandarizados:
predict est, rstandar
Luego realizamos la prueba de JARQUE – BERA:
ssc install jb jb ei
Jarque-Bera test for Ho: normality:Jarque-Bera normality test: 45.08 Chi(2) 1.6e-10
Por lo tanto si la probabilidad es mayor al 5% los términos del error se distribuyen normalmente
jb est
Jarque-Bera test for Ho: normality:Jarque-Bera normality test: 43.58 Chi(2) 3.4e-10
histogram ei, frequency normal
Observamos que es leptocurtica
05
1015
2025
Fre
quen
cy
-100000 0 100000 200000 300000Residuals
Criterio de Akakike y Schwarz
estat ic
Note: N=Obs used in calculating BIC; see [R] BIC note . 76 -969.0001 -955.4571 2 1914.914 1919.576 Model Obs ll(null) ll(model) df AIC BIC
histogram est, frequency normal
05
1015
2025
Fre
quen
cy
-2 0 2 4Standardized residuals
DIAGRAMA DE TALLOS Y HOJAS
Stem ei
24**** 8244,8244 23**** 22**** 21**** 20**** 19**** 18**** 17**** 16**** 15**** 14**** 13**** 0999,0999 12**** 8244,8244 11**** 7694,7694 10**** 9**** 8**** 7694,7694 7**** 6**** 5**** 8795,8795 4**** 7694,7694 3**** 2694,2694 2**** 7694,7694 1**** 7694,7694,9346,9346 0**** 2694,2694,4694,4694,5448,5448,6795,6795,8244,8244 -0**** 5103,5103,2306,2306,2306,2306 -1**** 2306,2306,1756,1756 -2**** 6756,6756,0654,0654,0654,0654 -3**** 6756,6756,6205,6205,2306,2306 -4**** 2306,2306,1756,1756 -5**** 5654,5654,3654,3654,2306,2306 -6**** 6756,6756,6205,6205 -7**** 1205,1205 -8**** 1756,1756 -9**** 6205,6205 -10**** 9756,9756
TEST DE RAMSEY
xi: reg PX ANT
_cons 232306.5 10996.86 21.12 0.000 210394.7 254218.2 ANT -30550.87 5427.479 -5.63 0.000 -41365.36 -19736.38 PX Coef. Std. Err. t P>|t| [95% Conf. Interval]
Total 5.2826e+11 75 7.0435e+09 Root MSE = 70700 Adj R-squared = 0.2903 Residual 3.6989e+11 74 4.9985e+09 R-squared = 0.2998 Model 1.5838e+11 1 1.5838e+11 Prob > F = 0.0000 F( 1, 74) = 31.68 Source SS df MS Number of obs = 76
Demostración de la Heterocedasticidad - Método Gráfico
-10
0000
010
0000
2000
0030
0000
Re
sid
uals
50000 100000 150000 200000 250000Fitted values
Diagrama de dispersion del error
Según el gráfico de dispersión se revela que el error no está distribuido de forma homogénea y por lo tanto se puede concluir que el modelo es Heterocedásticos. Por tal motivo aplicaremos un modelo Semi-Logarítmico (LOG-LIN) para disminuir el error y encontrar un mejor modelo econométrico.
Lista de resumen del error
list PX ANT Shat ei eStd eStu in 1/10
10. 230,000.00 0 232306.5 -2306.452 -.0330251 -.0328014 9. 100,000.00 2 171204.7 -71204.71 -1.015042 -1.015253 8. 105,000.00 4 110103 -5102.978 -.0742083 -.0737079 7. 165,000.00 1 201755.6 -36755.58 -.5235482 -.5209645 6. 85,000.00 5 79552.11 5447.891 .0808163 .080272 5. 120,000.00 1 201755.6 -81755.59 -1.16453 -1.167381 4. 220,000.00 0 232306.5 -12306.45 -.1762107 -.1750527 3. 160,000.00 1 201755.6 -41755.58 -.5947685 -.5921532 2. 85,000.00 5 79552.11 5447.891 .0808163 .080272 1. 210,000.00 1 201755.6 8244.417 .1174339 .1166486 PX ANT Shat ei eStd eStu
qnorm eStu, title("Mercado inmobiliario: Precio vs Antiguedad")subtitle("Distribucion normal de los residuos Estudentizados") //No hay distribucion normal
-20
24
Stu
dent
ized
res
idua
ls
-2 -1 0 1 2Inverse Normal
Distribucion normal de los residuos EstudentizadosMercado inmobiliario: Precio vs Antiguedad
qnorm eStd, title("Mercado inmobiliario: Precio vs Antiguedad")subtitle("Distribucion normal de los residuos Estandarizados")
-20
24
Sta
ndar
dize
d re
sidu
als
-2 -1 0 1 2Inverse Normal
Distribucion normal de los residuos EstandarizadosMercado inmobiliario: Precio vs Antiguedad
qnorm ei, title("Mercado inmobiliario: Precio vs Antiguedad")subtitle("Distribucion normal de los residuos ")
-200
000
-100
000
010
0000
2000
0030
0000
Res
idua
ls
-200000 -100000 0 100000 200000Inverse Normal
Distribucion normal de los residuos Mercado inmobiliario: Precio vs Antiguedad
Modelo LOG - LINxi: reg PXLn ANT
_cons 12.30591 .0555755 221.43 0.000 12.19517 12.41664
ANT -.1780415 .0274292 -6.49 0.000 -.2326954 -.1233877
PXLn Coef. Std. Err. t P>|t| [95% Conf. Interval]
Total 14.8258988 75 .197678651 Root MSE = .3573
Adj R-squared = 0.3542
Residual 9.44711572 74 .127663726 R-squared = 0.3628
Model 5.3787831 1 5.3787831 Prob > F = 0.0000
F( 1, 74) = 42.13
Source SS df MS Number of obs = 76
En esta regresión se observa que el término del error de manera conjunta disminuye significativamente hasta 0.3573, con lo cual se ha logrado una mayor eficiencia del modelo para predecir el Precio de Venta de las viviendas.
De forma individual, los Betas aceptan la Hipótesis alternativa: Sí existe un precio autónomo para las ventas realizadas por la empresa “Kasas”; además sí existe influencia de los años de antigüedad sobre el precio de venta de las viviendas; es decir, que por un año adicional de antigüedad el precio de las viviendas se verá disminuido en 17.80 %.
El análisis anterior se puede representar en la siguiente gráfica
PRECIO(US$)
ANTIGÜEDAD(AÑOS)
0.00
500,000.00
0.00 500,000.00
0
2
4
6
0 2 4 6
Matriz: Precio de Venta VS Años de Antiguedad
Se observa que existe una relación inversa entre la variable Precio de Venta y Años de Antigüedad de las viviendas.
Capitulo 3
Modelo Final – Semielástico (LOG-LIN)
Después de haber realizado los ajustes respectivos se encontró que el siguiente modelo es el que mejor explica sobre la venta de inmuebles
Regresión del Modelo LOG – LIN xi: reg PXLn ANT AR NHa Z1Nor Z1Oe Z1Sur
_cons 11.01775 .1529137 72.05 0.000 10.7127 11.32281
Z1Sur .2245442 .0943541 2.38 0.020 .0363129 .4127755
Z1Oe .2564053 .0874413 2.93 0.005 .0819646 .4308459
Z1Nor .3497357 .0793652 4.41 0.000 .1914064 .508065
NHa .2199315 .0434819 5.06 0.000 .1331875 .3066755
AR .0009154 .000345 2.65 0.010 .000227 .0016037
ANT -.1127293 .0188389 -5.98 0.000 -.1503119 -.0751466
PXLn Coef. Std. Err. t P>|t| [95% Conf. Interval]
Total 14.8258988 75 .197678651 Root MSE = .22851
Adj R-squared = 0.7359
Residual 3.60287273 69 .052215547 R-squared = 0.7570
Model 11.2230261 6 1.87050435 Prob > F = 0.0000
F( 6, 69) = 35.82
Source SS df MS Number of obs = 76
Prueba Conjunta
H0: B1 = 0 No existe relación cuadrática significativa entre la variable endógena con las variables exógenas.
H1: B1 ≠ 0 Existe relación cuadrática significativa entre la variable endógena con las variables exógenas.
Estadístico de prueba:
F=
SCEP
SCRn−P−1
=
11.22302616
3.6028727376−6−1
=35.82274752
Conclusión:
Como el F de prueba 35.82 es mayor al de tablas F(6,69)= 2.24, se rechaza la hipótesis nula; es decir el modelo tiene una relación cuadrática significativa entre la variable endógena y las variables exógenas.
Pruebas individuales
1. Precio de venta
H0: B0 = 0 No existe un precio autónomo para las ventas de viviendas de la empresa Kasas durante el primer trimestre del 2014.
H1: B0 ≠ 0 Existe un precio autónomo para las ventas de viviendas de la empresa Kasas durante el primer trimestre del 2014.
Estadístico de prueba:
t=B̂0
S2B0=11.017750.1529137
=72.05207905
Conclusión:
Como el t de prueba 72.05 es mayor al de tablas t(0.05,69) = 1.671 se rechaza la hipótesis nula; es decir sí existe un precio autónomo para las ventas de viviendas de la empresa Kasas durante el primer trimestre del 2014.
2. Años de Antigüedad
H0: B1 = 0 Los años de antigüedad no tienen un efecto significativo sobre el precio venta de viviendas de la empresa Kasas durante el primer trimestre del 2014.
H1: B1 ≠ 0 Los años de antigüedad tienen un efecto significativo sobre el precio venta de viviendas de la empresa Kasas durante el primer trimestre del 2014.
Estadístico de prueba:
t=B̂1
S2B1=
−0.11272930.0188389
=−5.983857869
Conclusión:
Como el t de prueba 5.98 es mayor al de tablas t(0.05,69) = 1.671 se rechaza la hipótesis nula; es decir sí existe un efecto significativo de los años de antigüedad sobre el precio de venta de viviendas de la empresa Kasas durante el primer trimestre del 2014.
3. Área útil
H0: B2 = 0 El área útil no tiene un efecto significativo sobre el precio de venta de las viviendas de la empresa Kasas durante el primer trimestre del 2014.
H1: B2 ≠ 0 El área útil tiene un efecto significativo sobre el precio de venta de las viviendas de la empresa Kasas durante el primer trimestre del 2014.
Estadístico de prueba:
t=B̂2
S2B2=0.00091540.000345
=2.65333
Conclusión:
Como el t de prueba 2.6533 es mayor al de tablas t(0.05,69) = 1.671 se rechaza la hipótesis nula; es decir sí existe un efecto significativo del área útil sobre el precio de venta de viviendas de la empresa Kasas durante el primer trimestre del 2014.
4. Número de habitaciones
H0: B3 = 0 El número de habitaciones no tiene un efecto significativo sobre el precio venta de viviendas de la empresa Kasas durante el primer trimestre del 2014.
H1: B3 ≠ 0 El número de habitaciones tiene un efecto significativo sobre el precio venta de viviendas de la empresa Kasas durante el primer trimestre del 2014.
Estadístico de prueba:
t=B̂3
S2B3=0.21993150.0434819
=5.058
Conclusión:
Como el t de prueba 5.058 es mayor al de tablas t(0.05,69) = 1.671 se rechaza la hipótesis nula; es decir el número de habitaciones tienen un efecto significativo sobre el precio de venta de viviendas de la empresa Kasas durante el primer trimestre del 2014.
5. Zona Norte
H0: B4 = 0 La ubicación de la vivienda en la Zona Norte no tiene un efecto significativo sobre el precio de venta de viviendas de la empresa Kasas durante el primer
trimestre del 2014. H1: B4 ≠ 0 La ubicación de la vivienda en la Zona Norte tiene un efecto significativo
sobre el precio de venta de viviendas de la empresa Kasas durante el primer trimestre del 2014.
Estadístico de prueba:
t=B̂4
S2B4=0.34973570.0793652
=4.40666
Conclusión:
Como el t de prueba 4.4066 es mayor al de tablas t(0.05,69) = 1.671 se rechaza la hipótesis nula; es decir la ubicación de la vivienda en la zona norte tiene un efecto significativo sobre el precio de venta de viviendas de la empresa Kasas durante el primer trimestre del 2014.
Matriz de Gráficos de Dispersión del Modelo LOG – LIN
Logdel
precio
ANTIGÜEDAD(AÑOS)
AREATERRENO
N°HABITACIONES
11
12
13
11 12 13
0
2
4
6
0 2 4 6
0
200
400
600
0 200 400 600
2
4
6
2 4 6
Matriz: Precio de venta VS Varibles Exogenas
Tabla de Resumen tabstat PX ANT AR NHa Z1Nor Z1Oe ,s(n mean sum variance sd cv skewness kurtosis
min max)
max 450000 6 557 6 1 1
min 75000 0 55 2 0 0
kurtosis 3.754724 4.052891 6.820728 3.091093 1.102273 2.532567
skewness .8666175 1.201576 2.026231 .693176 .3198011 1.237969
cv .4405543 1.099184 .6204402 .2468253 1.180395 1.806982
sd 83925.6 1.504146 110.0138 .8833747 .4970086 .4279695
variance 7.04e+09 2.262456 12103.05 .7803509 .2470175 .1831579
sum 1.45e+07 104 13476 272 32 18
mean 190500 1.368421 177.3158 3.578947 .4210526 .2368421
N 76 76 76 76 76 76
stats PX ANT AR NHa Z1Nor Z1Oe
Ahora se procederá a realizar las pruebas para comprobar la eficiencia del modelo propuesto.
Pruebas de validación del Modelo Econométrico LOG – LIN
Pruebas de Heterocedasticidad1. Prueba BREUSCH – PAGAN – GODFREY (BPG)
o H 0 :σ i2=σ2 Los términos de error son Homocedásticos
o H 0 :σ i2≠ σ2 Los términos del error son Heterocedásticos
xi: reg PXLn ANT AR NHa Z1Nor Z1Oe Z1Sur
_cons 11.01775 .1529137 72.05 0.000 10.7127 11.32281
Z1Sur .2245442 .0943541 2.38 0.020 .0363129 .4127755
Z1Oe .2564053 .0874413 2.93 0.005 .0819646 .4308459
Z1Nor .3497357 .0793652 4.41 0.000 .1914064 .508065
NHa .2199315 .0434819 5.06 0.000 .1331875 .3066755
AR .0009154 .000345 2.65 0.010 .000227 .0016037
ANT -.1127293 .0188389 -5.98 0.000 -.1503119 -.0751466
PXLn Coef. Std. Err. t P>|t| [95% Conf. Interval]
Total 14.8258988 75 .197678651 Root MSE = .22851
Adj R-squared = 0.7359
Residual 3.60287273 69 .052215547 R-squared = 0.7570
Model 11.2230261 6 1.87050435 Prob > F = 0.0000
F( 6, 69) = 35.82
Source SS df MS Number of obs = 76
predict eiBPG, resid display "VarMV="(3.60287273/76) = VarMV=.04740622v gen eiBPG2=eiBPG^2 gen Pi=(eiBPG2/VarMV)
xi: reg Pi ANT AR NHa Z1Nor Z1Oe Z1Sur
_cons .4148845 1.080876 0.38 0.702 -1.741404 2.571173
Z1Sur -.6510298 .6669454 -0.98 0.332 -1.981549 .6794898
Z1Oe .1624802 .6180822 0.26 0.793 -1.07056 1.395521
Z1Nor -.0149263 .5609961 -0.03 0.979 -1.134083 1.10423
NHa .1100843 .3073532 0.36 0.721 -.5030685 .7232372
AR .0020162 .0024389 0.83 0.411 -.0028493 .0068816
ANT -.0574684 .1331636 -0.43 0.667 -.3231225 .2081858
Pi Coef. Std. Err. t P>|t| [95% Conf. Interval]
Total 197.664005 75 2.63552007 Root MSE = 1.6152
Adj R-squared = 0.0101
Residual 180.014696 69 2.60890863 R-squared = 0.0893
Model 17.6493098 6 2.94155164 Prob > F = 0.3557
F( 6, 69) = 1.13
Source SS df MS Number of obs = 76
display "TETA=" (17.6493098/2) = TETA=8.8246549
χ2=12.5916 (Valor en tabla) Al compáralo con teta se acepta la hipótesis nula, es decir los términos de error son Homocedásticos.
2. Prueba de WHITE
o H 0 :σ i2=σ2 Los términos de error son Homocedásticos
o H 0 :σ i2≠ σ2 Los términos del error son Heterocedásticos
xi: reg PXLn ANT AR NHa Z1Nor Z1Oe Z1Sur
_cons 11.01775 .1529137 72.05 0.000 10.7127 11.32281
Z1Sur .2245442 .0943541 2.38 0.020 .0363129 .4127755
Z1Oe .2564053 .0874413 2.93 0.005 .0819646 .4308459
Z1Nor .3497357 .0793652 4.41 0.000 .1914064 .508065
NHa .2199315 .0434819 5.06 0.000 .1331875 .3066755
AR .0009154 .000345 2.65 0.010 .000227 .0016037
ANT -.1127293 .0188389 -5.98 0.000 -.1503119 -.0751466
PXLn Coef. Std. Err. t P>|t| [95% Conf. Interval]
Total 14.8258988 75 .197678651 Root MSE = .22851
Adj R-squared = 0.7359
Residual 3.60287273 69 .052215547 R-squared = 0.7570
Model 11.2230261 6 1.87050435 Prob > F = 0.0000
F( 6, 69) = 35.82
Source SS df MS Number of obs = 76
predict yhatw gen yhatw2=yhatw^2 predict eiw, res gen eiw2=eiw^2
xi: reg eiw2 ANT2 AR2 NHa2 Z1Nor Z1Oe Z1Sur
.
_cons .0426592 .0313875 1.36 0.179 -.0199572 .1052756
Z1Sur -.0351499 .0314814 -1.12 0.268 -.0979536 .0276538
Z1Oe .0018177 .0293944 0.06 0.951 -.0568226 .060458
Z1Nor -.0022281 .0269975 -0.08 0.934 -.0560866 .0516305
NHa2 .0009722 .0018505 0.53 0.601 -.0027194 .0046638
AR2 9.00e-08 1.99e-07 0.45 0.652 -3.06e-07 4.86e-07
ANT2 -.0013102 .0012479 -1.05 0.297 -.0037996 .0011793
eiw2 Coef. Std. Err. t P>|t| [95% Conf. Interval]
Total .444220155 75 .005922935 Root MSE = .07646
Adj R-squared = 0.0131
Residual .403339172 69 .005845495 R-squared = 0.0920
Model .040880983 6 .006813497 Prob > F = 0.3348
F( 6, 69) = 1.17
Source SS df MS Number of obs = 76
display "R^2=" (1-(.403339172/.444220155))= R^2=.09202865 display “X^2=”(0.09202865*76)= X^2=6.9941774 X^2(6 grados de libertad) en tabla es 12 .5916
Como X^2=6.9941774 es menor al valor en tabla se acepta la hipótesis nula, es decir los términos
de error son Homocedásticos.
Pruebas de Autocorrelación
1. Método gráfico
xi: reg PXLn ANT AR NHa Z1Nor Z1Oe Z1Sur
_cons 11.01775 .1529137 72.05 0.000 10.7127 11.32281
Z1Sur .2245442 .0943541 2.38 0.020 .0363129 .4127755
Z1Oe .2564053 .0874413 2.93 0.005 .0819646 .4308459
Z1Nor .3497357 .0793652 4.41 0.000 .1914064 .508065
NHa .2199315 .0434819 5.06 0.000 .1331875 .3066755
AR .0009154 .000345 2.65 0.010 .000227 .0016037
ANT -.1127293 .0188389 -5.98 0.000 -.1503119 -.0751466
PXLn Coef. Std. Err. t P>|t| [95% Conf. Interval]
Total 14.8258988 75 .197678651 Root MSE = .22851
Adj R-squared = 0.7359
Residual 3.60287273 69 .052215547 R-squared = 0.7570
Model 11.2230261 6 1.87050435 Prob > F = 0.0000
F( 6, 69) = 35.82
Source SS df MS Number of obs = 76
predict yhat, xb predict eic, resid label var eic predict res, rstand label var res
-3-2
-10
12
Re
sid
uos
stan
dariz
ado
s
0 20 40 60 80N° de observaciones
Prueba general de autocorrelacion: M. GraficoDiagrama de Dispersion del error Standarizado
Como se puede observar estamos en presencia de Autocorrelación, debido a que hay puntos que sale del rango de -2 a 2 de residuos estandarizados.
2. Contraste de Breusch - Godfrey
xi: reg PXLn ANT AR NHa Z1Nor Z1Oe Z1Sur
_cons 11.01775 .1529137 72.05 0.000 10.7127 11.32281
Z1Sur .2245442 .0943541 2.38 0.020 .0363129 .4127755
Z1Oe .2564053 .0874413 2.93 0.005 .0819646 .4308459
Z1Nor .3497357 .0793652 4.41 0.000 .1914064 .508065
NHa .2199315 .0434819 5.06 0.000 .1331875 .3066755
AR .0009154 .000345 2.65 0.010 .000227 .0016037
ANT -.1127293 .0188389 -5.98 0.000 -.1503119 -.0751466
PXLn Coef. Std. Err. t P>|t| [95% Conf. Interval]
Total 14.8258988 75 .197678651 Root MSE = .22851
Adj R-squared = 0.7359
Residual 3.60287273 69 .052215547 R-squared = 0.7570
Model 11.2230261 6 1.87050435 Prob > F = 0.0000
F( 6, 69) = 35.82
Source SS df MS Number of obs = 76
estat bgodfrey
H0: no serial correlation > 1 0.450 1 0.5024 > > 2 lags(p) chi2 df Prob > chi > Breusch-Godfrey LM test for autocorrelation
estat bgodfrey, lag(1/3)
H0: no serial correlation > 3 1.298 3 0.7295 2 0.697 2 0.7057 1 0.450 1 0.5024 > > 2 lags(p) chi2 df Prob > chi > Breusch-Godfrey LM test for autocorrelation
Planteamiento de hipótesis
o H0: B0 = 0 Los términos de error son independienteso H1: B0 ≠ 0 Los términos del error no son independientes
3. LJUNG - BOX y BOX - PIERCE
xi: reg PXLn ANT AR NHa Z1Nor Z1Oe Z1Sur
_cons 11.01775 .1529137 72.05 0.000 10.7127 11.32281
Z1Sur .2245442 .0943541 2.38 0.020 .0363129 .4127755
Z1Oe .2564053 .0874413 2.93 0.005 .0819646 .4308459
Z1Nor .3497357 .0793652 4.41 0.000 .1914064 .508065
NHa .2199315 .0434819 5.06 0.000 .1331875 .3066755
AR .0009154 .000345 2.65 0.010 .000227 .0016037
ANT -.1127293 .0188389 -5.98 0.000 -.1503119 -.0751466
PXLn Coef. Std. Err. t P>|t| [95% Conf. Interval]
Total 14.8258988 75 .197678651 Root MSE = .22851
Adj R-squared = 0.7359
Residual 3.60287273 69 .052215547 R-squared = 0.7570
Model 11.2230261 6 1.87050435 Prob > F = 0.0000
F( 6, 69) = 35.82
Source SS df MS Number of obs = 76
predict eiL, resid wntestq eiL
Prob > chi2(36) = 0.0388 Portmanteau (Q) statistic = 52.2906 Portmanteau test for white noise
corrgram eiL, lags(20)
20 -0.0920 -0.1494 30.955 0.0558 19 -0.1200 0.0283 30.06 0.0510 18 -0.1198 -0.1442 28.563 0.0540 17 -0.1720 -0.1417 27.096 0.0567 16 0.1017 0.0091 24.124 0.0868 15 -0.0917 -0.1287 23.102 0.0820 14 -0.1316 -0.2408 22.284 0.0730 13 -0.1916 -0.1819 20.63 0.0806 12 -0.0886 -0.0864 17.176 0.1431 11 0.1567 0.1123 16.45 0.1252 10 0.0075 -0.0218 14.21 0.1636 9 0.0854 -0.0670 14.204 0.1152 8 -0.2020 -0.1992 13.56 0.0940 7 0.1437 0.1625 10.001 0.1885 6 -0.0210 0.0010 8.2267 0.2220 5 0.2441 0.3075 8.1894 0.1461 4 0.1477 0.1473 3.2163 0.5223 3 -0.0985 -0.0923 1.421 0.7006 2 0.0570 0.0539 .63337 0.7286 1 -0.0687 -0.0694 .37306 0.5413 LAG AC PAC Q Prob>Q [Autocorrelation] [Partial Autocor]
pac DS12.eiL, lags(20) srv title(Prueba: LJUNG - BOX y BOX - PIERCE) subtitle(Autocorrelacion de los terminos del error)
-0.5
00.
000.
50P
artia
l aut
ocor
rela
tions
of
DS
12.e
iL
0 5 10 15 20Lag
95% CIPartial autocorrelations of DS12.eiL
Standardized variances
95% Confidence bands [se = 1/sqrt(n)]
Autocorrelacion de los terminos del errorPrueba: LJUNG - BOX y BOX - PIERCE
Corrección de la Autocorrelación
1. Cochrane Orcutt
prais PXLn ANT AR NHa Z1Nor Z1Oe Z1Sur, corc //correcta
Durbin-Watson statistic (transformed) 1.988804Durbin-Watson statistic (original) 2.113255 rho -.0958022 _cons 10.98858 .1521146 72.24 0.000 10.68504 11.29212 Z1Sur .2153581 .0900209 2.39 0.020 .0357241 .3949921 Z1Oe .2606885 .0837645 3.11 0.003 .0935391 .4278379 Z1Nor .350583 .0763672 4.59 0.000 .1981946 .5029715 NHa .2382043 .0440472 5.41 0.000 .1503096 .3260991 AR .0007684 .000339 2.27 0.027 .0000918 .0014449 ANT -.1172852 .0189271 -6.20 0.000 -.1550536 -.0795167 PXLn Coef. Std. Err. t P>|t| [95% Conf. Interval]
Total 15.7002413 74 .212165423 Root MSE = .22718 Adj R-squared = 0.7567 Residual 3.50947506 68 .051609927 R-squared = 0.7765 Model 12.1907662 6 2.03179437 Prob > F = 0.0000 F( 6, 68) = 39.37 Source SS df MS Number of obs = 75
Cochrane-Orcutt AR(1) regression -- iterated estimates
Iteration 8: rho = -0.0958Iteration 7: rho = -0.0958Iteration 6: rho = -0.0958Iteration 5: rho = -0.0958Iteration 4: rho = -0.0957Iteration 3: rho = -0.0952Iteration 2: rho = -0.0919Iteration 1: rho = -0.0692Iteration 0: rho = 0.0000
A través del método de Cochrane Orcutt se ha corregido la Autocorrelación, ajustando el coeficiente de Durbin Watson a 1.988 es decir este ajuste será más perfecto mientras nuestro índice se acerque más a 2.
Pruebas de Multicolinealidad1. Matriz de correlación
xi: reg PXLn ANT AR NHa Z1Nor Z1Oe Z1Sur
_cons 11.01775 .1529137 72.05 0.000 10.7127 11.32281 Z1Sur .2245442 .0943541 2.38 0.020 .0363129 .4127755 Z1Oe .2564053 .0874413 2.93 0.005 .0819646 .4308459 Z1Nor .3497357 .0793652 4.41 0.000 .1914064 .508065 NHa .2199315 .0434819 5.06 0.000 .1331875 .3066755 AR .0009154 .000345 2.65 0.010 .000227 .0016037 ANT -.1127293 .0188389 -5.98 0.000 -.1503119 -.0751466 PXLn Coef. Std. Err. t P>|t| [95% Conf. Interval]
Total 14.8258988 75 .197678651 Root MSE = .22851 Adj R-squared = 0.7359 Residual 3.60287273 69 .052215547 R-squared = 0.7570 Model 11.2230261 6 1.87050435 Prob > F = 0.0000 F( 6, 69) = 35.82 Source SS df MS Number of obs = 76
corr PXLn ANT AR NHa Z1Nor Z1Oe Z1Sur, means
Z1Sur -0.2886 0.2009 -0.2132 -0.3135 -0.4052 -0.2647 1.0000 Z1Oe -0.0229 -0.0545 -0.0673 -0.0854 -0.4751 1.0000 Z1Nor 0.3613 -0.1389 0.0678 0.2270 1.0000 NHa 0.7081 -0.2831 0.6945 1.0000 AR 0.6141 -0.3050 1.0000 ANT -0.6023 1.0000 PXLn 1.0000 PXLn ANT AR NHa Z1Nor Z1Oe Z1Sur
Z1Sur .1842105 .3902316 0 1 Z1Oe .2368421 .4279695 0 1 Z1Nor .4210526 .4970086 0 1 NHa 3.578947 .8833747 2 6 AR 177.3158 110.0138 55 557 ANT 1.368421 1.504146 0 6 PXLn 12.06227 .4446107 11.22524 13.017 Variable Mean Std. Dev. Min Max
corr PXLn ANT AR NHa Z1Nor Z1Oe Z1Sur, covariance
Z1Sur -.050066 .117895 -9.15228 -.10807 -.078596 -.044211 .152281 Z1Oe -.004351 -.035088 -3.16912 -.032281 -.101053 .183158 Z1Nor .079848 -.10386 3.70526 .099649 .247018 NHa .278115 -.37614 67.4947 .780351 AR 30.0399 -50.4646 12103 ANT -.402811 2.26246 PXLn .197679 PXLn ANT AR NHa Z1Nor Z1Oe Z1Sur
pcorr PXLn ANT AR NHa Z1Nor Z1Oe Z1Sur
Z1Sur 0.2754 0.1412 0.0759 0.0199 0.0201 Z1Oe 0.3329 0.1740 0.1108 0.0303 0.0046 Z1Nor 0.4686 0.2615 0.2196 0.0684 0.0000 NHa 0.5201 0.3002 0.2705 0.0901 0.0000 AR 0.3042 0.1574 0.0926 0.0248 0.0099 ANT -0.5845 -0.3551 0.3416 0.1261 0.0000 Variable Corr. Corr. Corr.^2 Corr.^2 Value Partial Semipartial Partial Semipartial Significance
vif
Mean VIF 1.92 ANT 1.15 0.867054 Z1Sur 1.95 0.513538 Z1Oe 2.01 0.497141 AR 2.07 0.483188 NHa 2.12 0.471881 Z1Nor 2.23 0.447456 Variable VIF 1/VIF
findit collin collin PXLn ANT AR NHa Z1Nor Z1Oe Z1Sur
Mean VIF 2.61
----------------------------------------------------
Z1Sur 2.11 1.45 0.4746 0.5254
Z1Oe 2.26 1.50 0.4421 0.5579
Z1Nor 2.86 1.69 0.3492 0.6508
NHa 2.90 1.70 0.3442 0.6558
AR 2.28 1.51 0.4385 0.5615
ANT 1.75 1.32 0.5708 0.4292
PXLn 4.12 2.03 0.2430 0.7570
----------------------------------------------------
Variable VIF VIF Tolerance Squared
SQRT R-
Collinearity Diagnostics
Det(correlation matrix) 0.0402
Eigenvalues & Cond Index computed from scaled raw sscp (w/ intercept)
Condition Number 169.3995
---------------------------------
8 0.0002 169.3995
7 0.0184 16.6115
6 0.0739 8.2791
5 0.2416 4.5791
4 0.5196 3.1223
3 1.0006 2.2500
2 1.0803 2.1654
1 5.0655 1.0000
---------------------------------
Eigenval Index
Cond
Cuando el VIF resulta mayor a 10 hay presencia de multicolinealidad, en nuestro caso, es menor; es decir no hay presencia de multicolinealidad.
Conclusiones
El modelo econométrico que se ha validado para la función Precio de venta de las viviendas con respecto a las variables:
o Años de Antigüedado Área útilo Número de habitacioneso Localización
Es el siguiente:
LnPX=B0−B1∗X 1+B2∗X 2+B3∗X 3+B4∗X 4+B5∗X5+B6∗X 6+ei
Donde:
PX= Precio de venta de las viviendas expresado porcentaje
X1=Años de antigüedad de la vivienda
X2=Área útil de la vivienda
X3=Número de habitaciones de la vivienda
X4= Se localiza en la Zona Norte de Arequipa metropolitana
X5= Se localiza en la Zona Oeste de Arequipa metropolitana
X6= Se localiza en la Zona Sur de Arequipa metropolitana
e i= Error de estimación
El modelo basado en los factores de la oferta (características observables de las viviendas) predicen eficientemente los precios de venta con respecto a los reales.
Los resultados de cada coeficiente tomados en términos porcentualeso B0 = 10.98858 o B1 =0.1172852
Por cada año adicional en antigüedad el precio se verá disminuido en 12%o B2 = 0.0007684
Por cada metro cuadrado adicional el precio se verá favorecido en 0.08%o B3 = 0.2383043
Por cada habitación extra el precio aumentara en 23.8%o B4 = 0.358503
Si el inmueble se encuentra ubicado en zona norte su precio se verá incrementado en 35.9%
o B5=0.2606865 Si el inmueble se encuentra ubicado en zona oeste su precio se verá
incrementado en 26.1%o B6=0.2153581
Si el inmueble se encuentra ubicado en zona sur su precio se verá incrementado en 21.5%
Desde el punto de vista de los consumidores, el modelo sirve para predecir cuánto debería pagar por una vivienda específica con las características analizadas en este estudio.
Desde el punto de vista del empresario vendedor Desde el punto de vista del gobierno Ministerio de vivienda para que tenga una referencia de los
precios de las viviendas con respecto a sus atributos
ANEXOS
1. Base de datos
2. Comandos