16

estadistica no parametrica

Embed Size (px)

DESCRIPTION

estadistica no parametrica

Citation preview

  • Estadstica no paramtrica A modo de introduccin

    2da. edicin

  • COLECCIN: EL NMERO DE ORO Director: Act. Alberto Landro

    lgebra para estudiantes de Ciencias Econmicas Alejandro E. Garca Venturini Axel Kicillof Anlisis Matemtico I para estudiantes de Ciencias Econmicas Alejandro E. Garca Venturini Axel Kicillof Anlisis Matemtico II para estudiantes de Ciencias Econmicas Alejandro E. Garca Venturini Axel Kicillof Los matemticos que hicieron la historia Alejandro E. Garca Venturini Anlisis de Series de Tiempo, univariadas y multivariadas Heriberto Urbisaia Juana Brufman Decisin Estadstica Bayesiana, a modo de introduccin Emma Fernndez Loureiro de Prez Estadstica no Paramtrica, a modo de introduccin Emma Fernndez Loureiro de Prez Teora de los Conjuntos Borrosos, a modo de introduccin Emma Fernndez Loureiro de Prez Estadstica: Herramientas de Inferencia Gabriela Kurincic Estadstica: Probabilidades y Distribuciones Gabriela Kurincic Los Mtodos Cuantitativos en las Ciencias Sociales Alejandro E. Garca Venturini Federico Castelli Aplicaciones del Anlisis Matemtico a la Economa Blanca R. Vitale Modelos para el Anlisis de Series de Tiempo Juan Carlos Abril Anlisis Matemtico I para estudiantes de Ingeniera Alejandro E. Garca Venturini Mnica Scardigli Clculo Financiero Juan R. Garnica Hervs - Esteban O. Thomasz - Romina P. Garfalo Elementos de Econometra de los fenmenos dinmicos Alberto H. Landro Mirta L. Gonzlez Acerca de la probabilidad Alberto H. Landro

  • Comit Editorial

    Prof. Carlos Bulcourf Lic. Alejandro Garca Venturini

    Dr. Axel Kicillof Act. Alberto Landro

    Dr. Juan Carlos Seltzer

    La presente publicacin se enmarca en las actividades de la Seccin de Investigaciones en Mtodos Cuantitativos para la Gestin del. Instituto de Investigaciones en Administracin, Contabilidad y M-todos Cuantitativos para la Gestin. Facultad de Ciencia Econmicas (UBA)

  • Emma Fernndez Loureiro de Prez

    Estadstica no paramtrica A modo de introduccin

    2da. edicin

  • Fernndez Loureiro de Prez, Emma Estadstica no paramtrica: a modo de introduccin 2 ed. Buenos Aires: Cooperativas, 2011. 160 p.; 21x14 cm. ISBN 987-98315-3-5 1. Estadstica. Ttulo CDD 310

    2011 Ediciones Cooperativas Tucumn 3227, (1189) Buenos Aires Argentina

    (54 011) 4864 5520 / (15) 49376915 http://www.edicionescoop.org.ar info@ edicionescoop.org.ar

    2011 Emma Fernndez Loureiro de Prez Derechos exclusivos

    EEddii ttoorr iiaa ll aassoocciiaaddaa aa::

    IMPRESO EN ARGENTINA PRINTED IN ARGENTINA

    Impreso y encuadernado por: Imprenta Dorrego. Dorrego 1102, CABA. 2 ed. Tirada: 100 ejemplares. Se termin de imprimir en Julio de 2011.

    Hecho el depsito que establece la ley 11.723

    2da edicin julio 2011

    Coleccin: El Nmero de Oro Director: Act. Alberto Landro

    Ediciones Cooperativas es un emprendimiento cooperativo de docentes de la Facultad de Ciencias

    Econmicas de la Universidad de Buenos Aires para difundir sus trabajos e investigaciones

    Diseo de Cubierta: Federico Castelli

    Ninguna parte de esta publicacin, incluido el diseo de cubierta puede ser reproducida, almacenada o transmitida en manera alguna ni por ningn medio, ya sea electrnico, mecnico, ptico de grabacin o de fotocopia sin permiso previo del Editor.

  • Estadstica no paramtrica. A modo de introduccin Segunda Edicin

    Presentacin

    Hace ya diez aos que presentamos la primera edicin de Estadstica no paramtrica. A modo de introduccin. En aquella ocasin, como ocurre comnmente, hemos detectado errores que, como corresponde, los hemos ido corrigiendo. Aun cuando suponemos haberlos corregido todos, el trans-curso del tiempo nos ha hecho pensar sobre la necesidad de realizar algunos retoques. La estructura del libro es similar a la anterior, de hecho algunos captulos y ejemplos son prcticamente copia textual. Hemos introducido modificacio-nes que estimamos tiles para la mejor comprensin de los conceptos. En este sentido debemos agradecer las crticas y sugerencias de colegas y alumnos que han ledo el libro. Hemos agregado de un captulo sobre Anlisis Exploratorio de Datos que, en nuestra opinin, es tema primordial al iniciar el anlisis estadstico y otro, slo introductorio, sobre Regresin no paramtrica. Seguimos pretendiendo que el libro sea bsicamente conceptual y que el lector, y con mayor razn el que se est iniciando en el tema, se concentre precisamente en los conceptos. Sin embargo, la creciente divulgacin de softs estadsticos, algunos con acceso desde Internet, nos aconsejaron in-cluir resolucin de problemas aplicndolos. A esto dedicamos un captulo especial. Por ser Excel un sistema muy divulgado incluimos en el texto los resultados que presenta para obtener puntos y valores crticos. El captulo 10, destinado al uso de softs estadsticos fue elaborado por Ana Marsanasco, doctorando en la Facultad de Ciencias Econmicas e integran-te del Proyecto de Investigacin (Programacin UBACyT 2008/2010) On-

  • Emma Fernndez Loureiro de Prez

    8

    tologa de las Organizaciones del que ambas somos integrantes y cuyo Di-rector es el Dr. Pablo Garca. El proyecto tiene su sede en la hoy Seccin de Investigaciones en Mtodos Cuantitativos para la Gestin, de la Facultad de Ciencias Econmicas de la Universidad de Buenos Aires. Hemos seleccionado bsicamente el soft GraphPad Prism 5.0 por dos moti-vos, en primer lugar porque nos result til en tareas de investigacin que encaramos conjuntamente donde hemos aplicado Estadstica no Paramtrica y, adems porque puede ser bajado de Internet (www.graphpad.com). Tam-bin y en menor medida, para algunos ejemplo, hemos utilizado SPSS 13.0. La circunstancia de vivir en una sociedad implica necesariamente que nada se hace en soledad, siempre existen personas u organizaciones que hacen aportes, perceptibles o imperceptibles, para concluir una tarea. Deseo agradecer aqu a la Universidad Pblica personificada en la Facultad de Ciencias Econmicas de la Universidad de Buenos Aires, donde, saliendo de mi adolescencia ingres como alumna hace ms de cincuenta aos. All me form como profesional, fui Auxiliar de Cte-dra, Profesora y, a la fecha, Profesora consulta. Mi caluroso recuerdo y agradecimiento a todos aquellos que, como deca, perceptible o imper-ceptiblemente colaboraron en mi desarrollo profesional.

    Emma Fernndez Loureiro de Prez Buenos Aires, mayo de 2011

  • Presentacin de la primera edicin Esta publicacin fue elaborada en el marco de la programacin de actividades del Instituto de Estadstica y Matemtica Actuarial Prof. Dr. Fausto I. Toran-zos de la Facultad de Ciencias Econmicas de la Universidad de Buenos Ai-res. Tiene como antecedente una publicacin del Centro de Estudiantes de Ciencias Econmicas editada en agosto de 1999. Publicacin que, corregida y ampliada en varios aspectos, permiti elaborar la presente. Esta presentacin supone que el lector tiene conocimientos sobre inferencia estadstica clsica en general y, en particular, sobre pruebas de hiptesis. Imaginamos que ser til para nuestros alumnos de la Ctedra Estadstica para Administradores que dictamos en la Facultad de Ciencias Econmicas de la Universidad de Buenos Aires quienes ya pasaron un curso de Estadstica Gene-ral y durante la mitad del cuatrimestre ven inferencia estadstica clsica. Iniciamos con una revisin de las escalas de medicin pues las pruebas no pa-ramtricas son aplicables a escalas de medicin de nivel ms bajo que el que usamos en la inferencia paramtrica. Continuamos con una comparacin entre ambos tipos de pruebas. Presentamos posteriormente algunas de las pruebas de hiptesis estadsticas no paramtrica ms comunes con el siguiente criterio: Una seccin para pruebas que suponen una sola muestra o dos muestras relacionadas, seguimos con prue-bas para dos o ms muestras independientes. Posteriormente incorporamos una seccin particular para destacar la impor-tancia de la mediana como medida de tendencia central. En esta seccin volve-mos sobre algunas pruebas anteriores cambiando las hiptesis planteadas en forma genrica por hiptesis relativas a la mediana. En la ltima seccin incluimos Tablas de contingencia, medidas y pruebas de hiptesis para la asociacin entre dos variables.

  • Emma Fernndez Loureiro de Prez

    10

    Al final de cada prueba presentamos algunos ejemplos que, reales o no, son de aplicacin a la prueba presentada. Los ejercicios propuestos fueron preparados por mi distinguido ex alumno, hoy colaborador en la Ctedra Estadstica para Administradores, Csar Augusto Fernndez Magn. A l agradezco su colabora-cin y sugerencias para que el texto fuera ms comprensivo. En un Anexo final incluimos algunas Tablas que, con las limitaciones propias de no ser exhaustivas, pueden ser tiles para resolver algunos problemas. Hemos omitido conscientemente toda referencia al uso de programas de com-putadora porque slo pretendemos hacer una presentacin conceptual. Diversos programas resuelven de una u otra forma los clculos, muchas veces tediosos, que requieren estas tcnicas, pero seguramente cuando esta publicacin llegue a manos de los eventuales lectores ya hayan sido superadas por otros programas.

    Agradezco a todos mis ex alumnos que, usndolo como material de estudio, corrigieron errores y aportaron sugerencias a Una Introduccin a las pruebas de Hiptesis Estadsticas no paramtricas, publicada por el Centro de Estu-diantes de Ciencias Econmicas en agosto de 1999.

    Un agradecimiento especial a quienes tuvieron la paciencia, en los ltimos aos, de introducirme en el mundo de la PC y sus consecuencias: Rita, Geor-gina, Walter, Claudia y Juan Pablo. A Malena, que me ayud a traducir del ingls, algunos prrafos con los que tuve inconvenientes. A Rodolfo, con quien comparto la aventura de muchos aos de matrimonio, que siempre me alienta ante aventuras que intento emprender. Esta publicacin es una de ellas.

    Emma Fernndez Loureiro de Prez Buenos Aires, agosto de 2000

  • Contenido 1. Acerca de la medicin 1.1Introduccin............................................................................1.2 Escalas...................................................................................1.3 Magnitudes extensivas e intensivas.......................................

    13 14 19

    2. Pruebas paramtricas versus no paramtricas 2.1 Pruebas paramtricas........................................................... 2.2 Pruebas no paramtricas......................................................

    21 22

    3. Consideraciones previas. 3.1 Acerca de promedio, medidas de posicin y de tendencia Central..3.2 Para construir una prueba de hiptesis.3.3 El valor p (p-value)3.4 Tratamiento de los empates en escales de orden3.5 Correccin por continuidad.

    25 27 28 28 29

    4. Anlisis exploratorio de datos 4.1 Antecedentes4.2 Diagrama de tallo y hojas 4.3 Grfico de Caja.

    31 32 34

    5. Pruebas para una muestra y dos muestra relacionadas 5.1 Prueba Binomial....................................................................5.2 Prueba de los signos..............................................................5.3 Prueba de rachas (o de corridas)...................................5.4 Prueba de suma de rangos con signo de Wilcoxon..............

    39 46 54 62

    6. Pruebas de bondad de ajuste 6.1 Prueba de Chicuadrado.......................................................6.2 Prueba de Kolmogorov-Smirnov........................................... 6.3 Comparacin entre las pruebas 2 y K-S.............................

    69 78 82

    7. Pruebas para dos y k muestras independientes 7.1 Prueba de suma de rangos de Mann Whitney........................7.2 Prueba de suma de rangos de Kruskal-Wallis.................

    83 91

  • Emma Fernndez Loureiro de Prez

    12

    8. Tablas de Contingencia y Medidas de Asociacin 8.1 Tablas de Contingencia Prueba de 2....................................8.2 Coeficiente rs de Spearman....................................................8.3 Coeficiente (tau) de Kendall...............................................

    97 105 112

    9. Nociones sobre Regresin no paramtrica 9.1 Revisin del concepto de regresin lineal clsico..9.2 Por qu regresin no paramtrica..9.3 Comparacin..9.4 Algunas formas de encarar la regresin no paramtrica.

    121 124 124 124

    10. Uso de softs estadsticos 10.1 Uso de SPSS para el Anlisis exploratorio de datos.10.2Ejemplos resueltos mediante Graph Pad Prism. 10.3Excel, SPSS, Graph Pad Prism para correlacin de rangos

    129 132 145

    11. Anexo: Tablas estadsticas....................................................

    151

    12.Bibliografa.............................................................................

    159

  • Estadstica no paramtrica

    13

    1. Acerca de la medicin

    1.1 Introduccin 1.2 Escalas

    1.3 Magnitudes extensivas e intensivas 1.1 Introduccin Dice J. Mosterin. El mundo percibido es la resultante de al menos dos factores: nuestro aparato sensorial y el mundo exterior...El mundo pensa-do es tambin la resultante de al menos dos factores: nuestro sistema con-ceptual y el mundo real... En nuestra actividad cientfica tenemos que partir de nuestro aparato sensorial y del sistema conceptual plasmado en nuestro lenguaje ordinario o comn. Pero difcilmente podra ponerse en marcha la empresa cientfica si no nos fuera posible trascender las limita-ciones de nuestro aparato sensorial y conceptual. Mediante instrumentos materiales apropiados, que son como extensiones de nuestros sentidos... (telescopios, balanzas...) podemos captar mensajes y radiaciones inasequi-bles a nuestro aparato sensorial. De igual modo, podemos extender y preci-sar nuestro sistema conceptual introduciendo conceptos ms precisos y de mayor alcance que los del lenguaje ordinario, conceptos cientficos que nos permiten describir hechos y formular hiptesis con una precisin y univer-salidad crecientes. Tres son los conceptos bsicos segn Mosterin: clasificatorios, comparati-vos y mtricos. Un concepto clasificatorio sirve para referirnos a un grupo determinado de objetos o sucesos que tienen algo en comn. Los sustantivos y adjetivos del lenguaje ordinario suelen corresponder a conceptos clasificatorios: hombre, mujer, rbol, camin, azul, puntiagudo, muerto. ...los conceptos comparativos encuentran su punto de partida en un rasgo de nuestra lengua cotidiana: el llamado por los gramticos grado compa-rativo de los adjetivos. El lenguaje ordinario no slo nos permite clasifi-car a nuestros congneres en altos y bajos, tambin nos permite precisar

  • Emma Fernndez Loureiro de Prez

    14

    que un individuo determinado, aunque bajo, es ms alto que otro. Expresio-nes como ms alto, ms viejo, mayor, ms ligero, corresponden a conceptos comparativos. Los conceptos mtricos, tambin llamados conceptos cuantitativos o mag-nitudes, no tienen correspondencia en el lenguaje ordinario. Son una crea-cin original de los lenguajes cientficos... Los conceptos mtricos asig-nan nmeros reales o vectores a objetos o sucesos... No hay que confun-dir metrizacin con medida. La medida supone que ya disponemos de un concepto mtrico y consiste en la bsqueda del nmero real o vector que ese concepto mtrico asigna a un objeto o suceso determinado...El con-cepto mtrico de masa asigna un nmero real a cada cuerpo, el de producto nacional bruto asigna un nmero real a cada economa nacional y ao. Estos tres conceptos (clasificatorio, comparativo y mtrico) son nuestro punto de partida para introducirnos en el concepto de escalas de medicin. 1.2 Escalas Segn Pedhazur y Pedhazur Schmelkin, ... mucho de lo que hacemos, decisiones que tomamos, decisiones que se toman con respecto a nosotros incorpora el concepto de medicin en algn sentido. Dado la amplitud del concepto es imprescindible tener presente que la medicin no es un fin en si misma sino un medio en procesos tales como descripcin, diferenciacin, explicacin, prediccin, diagnstico, toma de decisiones, etc. Comnmente aceptamos que un proceso de medicin consiste en asignar smbolos a objetos, atributos, observaciones, etc. de acuerdo con ciertas reglas. Sobre esa base y, segn el nmero y tipo de relaciones y operaciones ma-temticas aplicables a los smbolos asignados a las variables, se pueden distinguir cuatro niveles (escalas) de medicin:

    a. Nominal (concepto clasificatorio) b. Ordinal (concepto comparativo) c. De intervalos (concepto mtrico) d. Proporcional o de razn (concepto mtrico)

  • Estadstica no paramtrica

    15

    a. Escala Nominal Es el nivel ms bajo de medicin en el sentido amplio del trmino.

    Consiste en asignar smbolos a objetos, atributos, etc. con el slo propsito de clasificarlos. Los smbolos asignados, que comnmente son nmeros, slo se usan a modo de etiquetas, como sustitutos de nombres y pueden ser cambiados por cualquier otro nmero sin que ello altere su significado. No se formulan supuestos acerca de las relaciones entre los objetos. Supongamos una poblacin clasificada segn el estado civil en casados, solteros, viudos, divorciados y otros. En tal caso una codificacin posible consistira en asignar nmero 1 a casados, 2 a solteros y as sucesivamente. No cambiara el significado si por algn motivo asignramos otros nmeros a cada uno de los grupos de la clasificacin.

    Una clasificacin supone:

    - que est perfectamente delimitado el mbito o dominio de los individuos a clasificar,

    - que a cada concepto clasificatorio corresponde al menos un in-

    dividuo de ese mbito, - que ningn individuo cae bajo dos conceptos clasificatorios

    distintos,

    - que todo individuo del mbito en cuestin cae bajo alguno de los conceptos de la clasificacin.

    Toda clasificacin constituye una particin de un conjunto no vaco en sentido matemtico. Por ejemplo, la clasificacin de los seres humanos segn la raza a que pertenecen es una particin del conjunto de los seres humanos. Una particin requiere una relacin de equivalencia que implica tres pro-piedades: reflexiva (A=A), simtrica (si A=B, entonces B=A) y transitiva (si A=B y B=C, entonces A=C).