ECONOMETRIA CORTE TRANSVERSAL

Embed Size (px)

Citation preview

Econometra de Corte TransversalLasherramientasmetodolgicasquesepresentanacontinuacinsonaplicablesa informacinobtenidaenunmomentoenel tiempoparaungrupodeterminadode individuos, sean stos personas, empresas, bancos, etc.. Por lo mismo, el componentetemporal pierde(momentneamente) importancia, centrndoseahorael intersenlassimilitudesodisparidadesdeesegrupoendeterminadoinstantede tiempo; es as que nuestras observaciones pasarn a tener el subndice i (y ya no t), donde i hace referencia al individuo i de la muestra.Pese a esta caracterstica de la informacin, el uso de MCO no se invalida siempre que la dependiente sea una variable continua sin ninguna limitacin, siendo slo necesario ser cuidadosoconlaposibleheterocedasticidaddel modelo estimado,lamismaque debe ser convenientemente corregida. No obstante, cuando la dependiente no satisface estascondiciones,el estimadorMCOdejadeser el msapropiadosurgiendootros estimadoresdemejorespropiedadesfinitasyasintticas. Sonstosestimadoresel centro del anlisis de las siguientes pginas.Debido a que el problema se centra en la dependiente, dividiremos el anlisis sobre la basedelascaractersticasquestamuestre, distinguiendoentreunadependiente discreta de aquella que siendo continua tiene rangos limitados de trabajo.1. Variable dependiente discreta1.1. Las binomialesSon aquellas que toman slo dos valores, tradicionalmente 0 y 1, es decir: Yi =1, si se cumple cierta condicin 0, de cualquier otra formapor ejemplo,Yi = 1, si una persona trabaja 1 0,si una persona no trabaja1.1.1. 1.1.1. Modelo de Probabilidad Lineal(MPL) Modelo de Probabilidad Lineal(MPL)Supongamos que decidimos modelar la variable dependiente de (1) usando un modelo lineal de la forma:Y X ui i i + ',2donde ( ) E ui 0. Podemos decir que:( ) ( ) ( ) E Y X Yi Yii i/ + 1 0 Prob =1Prob = 03adems de (2) se puede deducir que:( )i i iX X Y E ' / 41por lo que se puede concluir que:( )i i iY X Y ob ' 1 Pr 5es decir, la probabilidad de que la persona trabaje es Xi, la que por lgica tiene que estar entre 0 y 1. No obstante, en el modelo no hay nada que restringa a iYa estarlo. Adems, se tiene problemas con el error, pues ste toma slo dos valor, a saber:Si ui PrYi = 1 1- Xi Xi P(Yi =1)Yi = 0 - Xi 1- XiP(Yi = 0)Total1Es decir, el error es binomial y no normal, siendo su varianza igual a:( ) ( ) ( ) ( ) ( )i i i i i i iX X X X X X u Var ' 1 ' ' 1 ' ' ' 1 ) (2 2 + 16de forma tal que, como depende de las observaciones, termina siendo heterocedstica.De esta forma podemos concluir que existen tres grandes limitaciones para el uso del estimador MCO en estos modelos: El error es heteroscedstico El error no es normal Nada restringe a Yi = Xi = Pr (Yi = 1)a estar entre 0 y 1Los dos primeros problemas pueden ser resueltos con relativa facilidad, utilizando MCG y ampliando la muestra, respectivamente. No obstante, no existe forma de resolver el ltimoproblema, raznpor lacual nosvemosenlanecesidaddetrabajar conun mtodo que garantice que la probabilidad resultante se mueva entre esos lmites; para ello se recurrir a la funcin de distribucin acumulada del error, la cual ser utilizada para hallar el estimador MV de los parmetros de inters.1.1.2. 1.1.2. Los modelos probabilsticos: Probit y Logit Los modelos probabilsticos: Probit y LogitSupongamos que se tiene el siguiente modelo:Y X ui i i* ' + 7en el que Yi * es una variable no observable e igual, por ejemplo, alnmero de horas deseadas de trabajo. La variable que se observa es Yi, la misma que toma el valor de 1si Yi * > 0, y de 0siYi * < 0.Notequeahora iX ' es igual a ( )i iX Y E / * y noa ( )i iX Y E / ,por loquenohay necesidaddequeestrestringidoa0y1, msansi tenemosencuentaquela Pr(Yi=1) ya no es igual a BXi. Es as que:( ) ( ) ( ) Pr Pr * Pr Y Y u Xi i i i > 1 0 > - ' 1 Ntese que ello implica que:( ) ( ) ( ) [ ] 1 Pr 1 1 Pr ' 1 ' ) ( i i i i iY Y X X u Var 2 = ( ) 1 F Xi'8

donde F() es la funcin de densidad acumulada del error.Lafuncindeverosimilitudpertinente, paralosnindividuosdeunamuestra, estara dada por:L = F X F XiYiiYi( ' ) [ ( ' )] 0 119Si F(u)esnormal estndar estaramoshablandodel modeloProbit, mientrasquesi fueralogstica2nosreferiramosal modeloLogit. Cabemencionar quecomoambas funciones son simtricas podemos concluir que( ) ( )i iX F Y ' ) X ' F(- - 1 1 Pri .Comparemos un poco ms estas dos funciones. La principal diferencia entre ellas es la amplitud desuscolas,ya que la logstica tiene colas ms anchas. Porlo mismolos resultados que se obtienen con cada una de ellas no son comparables. Dado que en el modelo probit el uso de una normal estndar arroja s estandarizados (siendo =1), la comparacin con los s logit requiere estandarizar estos ltimos tambin, para lo cual hay que dividir los estimados entre la desviacin estndar, que es igual a 3. Es decir 3 Lvs.P Dadoquenohayformadesaber apriori cmosecomportanloserroresdelos modelos que queremos estimar, y que la diferencia entre estas funciones es relativamente sutil, la eleccin entre probit y logit depender del mejor ajuste que se logre utilizando una u otra indistintamente.Finalmente, vale la pena comparar las implicancias de utilizar los modelos probabilsticosfrentealaposibilidaddeutilizar MPL.Comovimosen1.1.1,el MPL implica que Pr(Yi = 1) = Xi , mientras que los modelos probabilsticos suponen que Pr(Yi = 1) = F( Xi ).De esta forma, en el primer caso el efecto marginal o impacto de un cambio en una unidad de las Xs sera constante, a saber:Pr( ) YXi1 10mientras que para los modelos probabilsticos este efecto sera: Pr( )( ' ).YiXf Xi1 11es decir, dependera del nivel de las Xs para cada individuo. Esto ltimo coincide con lo que se observa en la vida real. Por ejemplo, el cambio en la probabilidad de que un nio asista al colegio frente a un aumento enel ingreso, ser distinto en el casode 2 Recurdese que la funcin logstica tiene la siguiente especificacin:F(u) = exp( )exp( )uu 1+3familias de altos y bajos ingresos, esperando para las primeras un incremento casi nulo de la probabilidad y para las segundas una bastante mayor.3Veamos ahora la matemtica del modelo Logit. Su funcin de verosimilitud se define como:L = 11 111+

_,

+

_,

exp( ' )exp( ' )exp( ' ) XXXiinYiiiYi12L= ( )exp ( )exp ( ' ) X YXi iiniin+11113Y tomando logaritmo:[ ]ln ln exp L X Yi i + 1( ' X )iderivando respecto a los parmetros y maximizando:( ) 0i0) X ' ( exp + 1) ' ( exp lnS XXY XLikii i14Comovemos, 14esunaecuacinnolineal en, por loquepararesolverlaes necesario recurrira algn mtodo iterativo. Uno de los ms usado es elde Newton-Raphson. As, se define:( ) [ ] ( ) 010 0 1 I + = Sdonde [I(0)] es la matriz de informacin. De esta forma, se utiliza un valor cualquier para 0, que podra ser el de MCO, y se contina iterando hasta hallar elque haga S(0) = 0. 1.1.3. 1.1.3. Bondad de Ajuste Bondad de AjustePara establecer la bondad de ajuste del modelo se requerira comparar la prediccin de lavariabledependienteconlarealmenteobservada. Noobstante, enunmodelo discretoellopierdesentidoyaqueseobservalaeleccinreal (01, enel caso binomial) mientras queel modeloarrojaprobabilidades. Esas queel R2, quese basara en estos errores distorsionados, pierde sentido.UnaalternativaloconstituyeelTest delaRazndeVerosimilitud,cuyaHoesque todos los s del modelo (excepto la constante), o un subconjunto de ellos, es igual a 0. El estadstico asociado se define como:3 Cuando hablamos de bajos ingresos no queremos referirnos a las familias de mayor pobreza entre las que es posible que la mencionada probabilidad tambin sea nula. Esto ltimo no hace sino reafirmar la lgica del uso dela funcin dedensidad cuyos extremos son menos empinados que el resto de la funcin.4( )( )

maxmaxL O L15donde L*(0) es la funcin de verosimilitud del modelo restringido (que slo considera constante, olasexplicativasquenoestnsometidasalapruebadesignificancia)y L*() es la del modelo completo.Segn Wilks (1962):2ln ( ) X q216donde q es el nmero de restricciones.A partir de la funcin de verosimilitud es posible construir un seudo R2. As hay que tener en cuenta que comoL() esgeneralmenteunaproductoriadeprobabilidades puede tomar valores entre 0 y 1. Por ello,ln L() < 0. Si definimos L*() como el valor mximo del logaritmo de la funcin de verosimilitud, es decir:L*()= mx ln L()Entonces debe ser cierto que:L*() L*(0) Es decir, L*() debe estar muy cerca de 0 para que el modelo estimado sea bueno, y cuantomejor sealadistanciarespectoaL*(0) deberaser mayor. Esas quesi definimos el seudo R2 como:( )( )210 LL** 17Si el modelo es bueno L*() se aproximara a 0, por lo que 2 tendera a 1. Si el modelo esmaloL*() estaramuycercadeL*(0) por loque2tenderaa0. Comoregla prctica, es de esperar que un buen modelo tenga un 2 entre 0.2 y 0.4.1.1.4. 1.1.4. Procedimiento para estimar un modelo Procedimiento para estimar un modeloParaestimar correctamenteunmodelodiscretosesugiereseguir lospasosquese explican a continuacin:1. Analizar lamatriz decorrelaciones entre ladependientey el conjuntode posibles explicativas. A partir de ella se busca rescatar dos cosas: Establecer el grado de relacin de las explicativas y la dependiente as como su signo esperado. Establecer laposiblecorrelacinentreexplicativaspotenciales. Como regla prctica, sidosvariables tienen una correlacinmayor a 75%se debe elegir entre ellas a aquella que ajuste mejor; no incluir a ambas en el modelo.52. Analizar tablas cruzadas entre la dependiente y las explicativas que mostraron en1.ser lasmsrelacionadasconlaprimera. Atravsdeesteanlisisse pretende confirmar la direccin y magnitud de la relacin.3. Estimar la ecuacin con todas las explicativas que aparecieron como relevantes en 1 y 2. Una vez corrido el modelo dejar aquellas explicativas que tengan el signo esperado y cuya probabilidad asociada a t no sea mayor a 10% 15%. Ntese que en el caso de los modelos discretos el t reduce su validez, por lo que se relaja la necesidad de ser muy estrictos respecto de las conclusiones que arroja este test.Unodelos resultados claves del modeloestimadoes laprediccindela probabilidadasociadaalavariable dependiente, lamisma quepuedeser determinada para lamedia muestral opara individuos con caractersticas especficas dentro de la muestra.4. Determinar los efectos impactos de las variables explicativas del modelo. En el caso de una variable explicativa discreta k ste sera igual a:( )( )ki ikikX fXYEI . '

1 Pr18El mismoquepuedeser evaluadoenlamediamuestral oparaunconjunto especfico de valores de las explicativas.En el caso deuna variable explicativa discreta tendra quecalcularse la diferenciadelaprobabilidadcuandodichavariabletomaunvaloruotro.Por ejemplo, si estamos analizando la decisin de trabajar y la variable explicativa deinters es el sexodelapersona,definidocomo 1si eshombrey0si es mujer, el efecto impacto de la misma sobre la probabilidad de trabajar sera:( ) ( )EI F X X X F X X XX 2 1 1 2 3 3 4 4 1 1 2 3 3 4 41 0 + + + + + + + + ( ) .... ( ) .... -En este caso tambin podra calcularse el efecto para la media muestral o para caractersticas determinadas del individuo.Note que cualquiera sea el tipo de variable explicativa, el efecto impacto arroja elcambio de la probabilidad, en puntos porcentuales,frente a la variacinen unaunidaddelaexplicativa, raznpor lacual suutilidadesmayor cuando analizamos explicativas discretas.5. Determinar la elasticidad de la probabilidad respecto de cambios en las variables explicativas. La misma puede definirse como para la variable explicativa k:( ) X F XEIKX KK'. 19La elasticidad indica el cambio porcentual en la probabilidad ante una variacin de1%enlavariableexplicativadeinters, raznpor lacual resultams conveniente estimarla para explicativas continuas. No obstante, dado que 6carece de unidades, la elasticidad puede servir tambin para rankear todas las variables explicativas de acuerdo con su importancia relativa en el modelo.1.2. Modelos MultinomialesLos modelos multinomiales son aqullos cuyo objetivo es explicar variables dependientesdiscretasperodemltiplesopciones, deformatal quesemodelael proceso a travs del cual una persona escoge entre diferentes alternativas de eleccin, de acuerdo con aqulla que le d la ms alta utilidad. De esta forma, si definimos:ij ij ijx U + '*20donde Uij* es la utilidad que recibe el individuo i al escoger la alternativa j, dicha utilidad est en funcin de un conjunto de variables explicativas xij, a travs de los parmetros , que pueden o no depender de las alternativas de eleccin.El modelo general se basa en la resolucin de la funcin de verosimilitud construida a partir delafuncindedistribucinconjuntadecadaunodelosindividuosdela muestra. Es decir:niYimimYiiYiiP P P L12211...... .21donde Yij toma el valor de 1 si el individuo i escoge la categora j y Pij es la probabilidad del mismo de elegir dicha categora. La especificacin de las probabilidades estar en funcin del tipo de modelo multinomial que se est trabajando, el que depende a su vez de la forma de la variable que se quiere explicar.1.2.1. 1.2.1. Variables dependientes no ordenadas Variables dependientes no ordenadasSon aqullas que se caracterizan por especificar un conjunto de posibles alternativas quenopresentanuna relacinde ordenentreellas,comoporejemplo, profesiones, hobbies, modos de transporte, marcas de cigarrillos, etc. Tomando el primer ejemplo, supngase que se desean explicar los determinantes del tipo de ocupacin del jefe de hogar de las familias peruanas, de forma tal que la variable se define como:Yi = Ocupacin del jefe de hogar=1Mdico2Abogado3 Carpintero . m Otros7De esta forma, se tienen en total m categoras no ordenadas. El hecho de que stas no puedanser relacionadas deacuerdo a algn ordenamiento especfico genera la necesidad deestablecer un orden a prioria travsde la seleccin de una categora base o referencial. A partir de ella se podr especificar la probabilidad de escoger cada categora, utilizando un conjunto de modelos binomiales entre ellas y la categora base, es decir:( )( )( ) ' ''222111X FP P PX FP P PX FP P Pjm jjmm+++22donde F() es lafuncin de densidad delos erroresde la ecuacin explicativade la utilidad. A partir de (22) se define una especificacin para Pj y Pm de forma que:4( ) ( )( )( )( )P P F X P F XPPF XF XG Xj j j m jjmjjj + ' ''''123donde G() es la funcin de densidad de la diferencia de los errores de las ecuaciones explicativasdelautilidadquedalaalternativaj ylam. Ahorasepuedederivar la probabilidad de escoger la categora m aplicando sumatoria al cociente Pj/Pm:( )( )11111111 '' 11 111]1

+ mjj mmjjmj m mmmjX G PX GP PPPP24y a partir de Pm hallar la probabilidad de escoger una alternativa j cualquiera:( )( )( )+11' 1''mjjjjm j jX GX GPP X G P25Las expresiones de Pj y Pm resultan ser el centro del inters del modelo. G() puede ser normal o logstica, aunque dada la necesidad de evaluar mltiples integrales en el caso de usar una normalse prefiere la distribucin logstica, resultando lo que seconoce como el Modelo Logit Multinomial. En el mismo los resultan ser parmetros relativos respecto de la categora base por lo que no pueden ser analizados en forma individual.Este modelo tiene especificaciones determinadas que dependen de la utilidad final que seled. As, cuandosesuponequelaprobabilidaddeescoger unacategoraj 4 Ver Amemiya (1983)8depende exclusivamente de caractersticas del individuo i se puede reescribir el Pjde (25), de forma que:( )( )+11' 1'mji ji jijX GX GP26donde, como se observa, las variables explicativas dependen del individuo i.No obstante, es posible tener una especificacin alternativa en donde las explicativas dependen del individuo y de la alternativa, mientras que los son invariables a ambos factores. Esteesel conocidomodelocondicional deMcFadden(1973)endondela probabilidad de que el individuo i escoja la alternativa j est dada por:( )( )+11' 1'mjijijijX GX GP27enestaespecificacinlosrepresentanlos "precios implcitos" delas diferentes caractersticas de las alternativas a escoger (o pesos especficos) mientras que Xij es la valoracin que el individuo i tiene respecto de cada caracterstica de la alternativa j.Como se observa, la especificacin de cada modelo responde a un objetivo especfico. As, el primer modelo definido por (26) se utiliza para predecir la probabilidad que un individuo fuera de la muestra escoja una de las m alternativas analizadas, dadas sus caractersticas especficas. Por su lado, el modelo que define (27) permite predecir la probabilidad deescoger unaalternativanoconsideradaentrelas mestimadas,pero paralaquesetienenlasvaloracionesdecadaindividuoi Xij;ellograciasaquese cuentaconlospreciosimplcitosoponderacionesdelascaractersticasdelasm alternativas con las que se realiz la estimacin.5Finalmente, seraposibleconsiderar unmodelocombinadoqueincorporetantola valoracin de las caractersticas de las alternativas como aqullas de los individuos que conforman la muestra. Ello implicara una nueva especificacin de la probabilidad de que el individuo i escoja la alternativa j de la forma:( )( )+ ++11''' 1'mji j iji j ijijY X GY X GP 285Es posible notar,adems,que en elprimermodelo elnmero de parmetros a estimares igual al nmerodevariablesexplicativasdel individuopor m-1, si esqueseconsiderala normalizacin de uno de los parmetros a estimar(o=0). En el segundo modelo se estiman tantos parmetros como caractersticas se hayan considerado para cada alternativa.9donde Xij representa las valoraciones del individuo i respecto de las caractersticas de la alternativa j, mientras que Yi indica las caractersticas particulares del individuo i.1.2.2. 1.2.2. Variables dependientes ordenadas Variables dependientes ordenadasLas variables multinomiales ordenadas son aqullas que indican diversas alternativas que guardan entre s un ordenamiento especfico. Ese sera el caso de un ranking de prioridades de inversin, de rangos de ingresos, de categoras de instituciones prestadoras de salud, entre otras variables. Si tomamos este ltimo ejemplo podramos definir la variable Yi como:Yi = Institucin de salud donde se obtiene el servicio = 4 Clnicas particulares= 3 Hospitales pblicos= 2 Centros y postas= 1 Otros proveedoresEste ordenamiento supone que son las instituciones a las que se les coloca un mayor valor de la variable Y las de mejor servicio.El modelo se basa en la definicin de un ndice de performance I*, el que se encuentra relacionado con un conjunto de variables explicativas vinculadas con el individuo y las alternativas j, tal como:i i iX I + ' * 29Asimismo se establecen puntos de corte ('s) entre los cuales se mueve el I*. As, si I*