66
12.1 Estadística no paramétrica. 12.1.1 Características de las pruebas no paramétricas. 12.2 Ventajas y desventajas del uso de métodos no paramétricos. 12.3 Prueba del signo. 12.4 Prueba del rango con signo de Wilcoxon. 12.5 Pruebas de suma de rangos. 12.5.1 Prueba de Wilcoxon. 12.5.2 Prueba U de Mann Whitney. 12.6 Prueba de Kolmogorov–Smirnov. Iniciaremos el contenido de este capítulo bajo una estrategia de aprendizaje denominada mapa conceptual, para tener una visión global de lo que se presentará. Objetivo: El lector reconocerá las ventajas y desventajas del uso de métodos no paramétricos; además, identificará cuál prueba de varias de tipo no paramétrico como son la de Wilcoxon, U de Mann Withney y Kolmogorov–Smirnov, es la más conveniente y pertinente para aplicar en problemáticas con variables de tipo cualitativo en el área de ciencias sociales y administrativas. INTRODUCCIÓN A LA ESTADÍSTICA NO PARAMÉTRICA CAPÍTULO 12 Figura 12.1 Estadística no paramétrica Fuente: http://www.jmcprl.net/ntps/@datos/ ntp_380_archivos/n380_06.jpg TIPO DE VARIABLES M. INDEPENDIENTES M. PAREADAS CUALITATIVA CUALITATIVA Prueba z de comparación de proporciones x 2 de Pearson Test de Mc Nemar CUALITATIVA (k = 2) CUALITATIVA t Student-Fisher Análisis de la varianza U de Mann-Whitney t de Student-Fisher Wilcoxon CUALITATIVA (k = 2) CUALITATIVA Análisis de la varianza Kruskal-Wallis* Análisis de la varianza Friedman*

INTRODUCCIÓN A LA ESTADÍSTICA NO PARAMÉTRICAlibroweb.alfaomega.com.mx/book/868/free/data/cap12.pdf · 12.1 Estadística no paramétrica. 12.1.1Características de las pruebas no

Embed Size (px)

Citation preview

12.1 Estadística no paramétrica. 12.1.1 Características de las pruebas no paramétricas.12.2 Ventajas y desventajas del uso de métodos no

paramétricos.12.3 Prueba del signo.12.4 Prueba del rango con signo de Wilcoxon.12.5 Pruebas de suma de rangos. 12.5.1 Prueba de Wilcoxon. 12.5.2 Prueba U de Mann Whitney.12.6 Prueba de Kolmogorov–Smirnov.

Iniciaremos el contenido de este capítulo bajo una estrategia de aprendizaje denominada mapa conceptual, para tener una visión global de lo que se presentará.

Objetivo:

El lector reconocerá las ventajas y desventajas del uso de métodos no paramétricos; además, identificará cuál prueba de varias de tipo no paramétrico como son la de Wilcoxon, U de Mann Withney y Kolmogorov–Smirnov, es la más conveniente y pertinente para aplicar en problemáticas con variables de tipo cualitativo en el área de ciencias sociales y administrativas.

INTRODUCCIÓN A LA ESTADÍSTICA NO PARAMÉTRICA

CAPÍTULO

12Figura 12.1 Estadística no paramétrica Fuente:

http://www.jmcprl.net/ntps/@datos/ntp_380_archivos/n380_06.jpg

TIPO DE VARIABLES M. INDEPENDIENTES M. PAREADAS

CUALITATIVA

CUALITATIVA

Prueba z de comparación de proporcionesx2 de Pearson

Test de Mc Nemar

CUALITATIVA (k = 2)

CUALITATIVA

t Student-FisherAnálisis de la varianzaU de Mann-Whitney

t de Student-FisherWilcoxon

CUALITATIVA (k = 2)

CUALITATIVA

Análisis de la varianzaKruskal-Wallis*

Análisis de la varianzaFriedman*

518 12 IntroduccIón a la estadístIca no paramétrIca

Alfaomega estadística en el área de las ciencias sociales y administrativas – aragón

Figura 12.2 Mapa conceptual de estadística no paramétrica

Introducción:

Algunas problemáticas generan respuestas que no son cuantificables, porque son cualitativas, es decir, producen mediciones que logran ordenarse, aunque la posición de la respuesta en una escala de medición es arbitraria. Este tipo de fenómenos ocurren en casi todos los campos de estudio, pero son particularmente frecuentes en las ciencias sociales y administrativas.

Los métodos estadísticos no paramétricos son útiles no únicamente cuando los datos representan una ordenación como la mencionada, también lo son cuando se tienen diferencias direccionales.

El cúmulo de conocimientos a considerar y aprender no es todo lo que hay por estudiar ni es poco para plantear desde su aplicación. Tales conocimientos se basan en pruebas no paramétricas diversas que desde una postura personal, como autora, considero deben ser tratadas, pues son un complemento a las vistas en capítulos anteriores para el caso paramétrico.

Con la finalidad de llevar a cabo la aplicación o el uso de dichas pruebas no paramétricas no se necesita hacer suposiciones acerca de la distribución de la población. En ocasiones, por esto último, se utiliza el nombre de que son libres de distribución. Además, remarcamos que no requieren que las respuestas estén clasificadas, razón por la que llegan a ser medidas con una escala ordinal, de razón o de intervalo.

Estadística no Paramétrica

Características del signo

de suma de rangos

de Kolmogorov - Smirnov

del rango con signo

Wilcoxon

Wilcoxon

U de Mann Whitney

Introducción

Ventajas y desventajas en su uso

Pruebas

Consta de

Tiene

y

Consta de

como

como

y

Alfaomegaestadística en el área de las ciencias sociales y administrativas – aragón

12.1 estadístIca no paramétrIca 519

En este capítulo se consideran cinco pruebas no paramétricas; a saber, la del signo, la del rango con signo de Wilcoxon, la de suma de rangos de Wilcoxon, la de U de Mann Withney y la de Kolmogorov–Smirnov.

12.1 Estadística no paramétrica

Hay muchas situaciones en las cuales no es posible aplicar los métodos paramétricos, ya que estos se relacionan con parámetros tales como la media, la proporción, la varianza, diferencia de medias y de proporciones, por mencionar algunos. Varias de dichas situaciones, que se presentarán como ejemplos, son las siguientes:

Ejemplo 12.1Si se pide a un comité que evalué la capacidad de diez candidatos para un puesto y a los jueces que ordenen por rango los méritos relativos de cinco finalistas en un concurso de belleza, ¿qué se plantearía al respecto?

Solución

Las medidas a aplicar para dar respuesta a lo solicitado serán de una naturaleza completamente diferente a las trabajadas, ya que siempre que se realicen observaciones o mediciones en términos de rangos u órdenes resultan adecuados los métodos no paramétricos (a menudo se denominan como técnicas de orden), pues éstos no se refieren a parámetros.

Nota: Recordemos que en la estadística paramétrica los parámetros son características de la población, mientras que los estadísticos lo son de la muestra. Luego, en consecuencia, se entendería que redactar un parámetro poblacional estadísticamente parecería un pleonasmo.

Ejemplo 12.2Suponga que se desean evaluar y comparar las habilidades de cuatro vendedores. ¿Qué plantearía al respecto?

Solución

Es claro que dar una medida exacta de la habilidad en ventas, es imposible.

Ejemplo 12.3Suponga que se desea medir las características de sabor de cinco marcas de cereales. ¿Qué plantearía al respecto?

Solución

Dar una medida cuantitativa del sabor en comida alguna sería muy difícil, aunque en determinadas situaciones hay quien lo pretenda hacer sin tomar en consideración que lo que se está trabajando estadísticamente conlleva error y a veces ese error es grave.

520 12 IntroduccIón a la estadístIca no paramétrIca

Alfaomega estadística en el área de las ciencias sociales y administrativas – aragón

Ejemplo 12.4Una persona suele indicar su preferencia entre un par de artículos de prueba. ¿Qué plantearía al respecto?

Solución

Preferencia no quiere decir no querer o no poder indicar una medida de la magnitud de su preferencia.

A algunas técnicas no paramétricas se les llama a menudo “pruebas de rango”, “pruebas de orden”, cuyos títulos nos indican otras diferencias con las pruebas paramétricas. Al computar pruebas paramétricas, sumamos, dividimos y multiplicamos los puntajes de las muestras. Cuando tales operaciones aritméticas se hacen con puntajes que no son verdaderamente numéricos, ocasionan deformaciones de los datos y menoscaban el valor de las conclusiones de la prueba. En cambio, muchas pruebas no paramétricas se fijan en el orden o rango de los puntajes, no en sus “valores numéricos”, mientras otras técnicas no paramétricas se utilizan con datos en los que ni siquiera es posible imprimir una orden, por ejemplo, con datos clasificatorios.

No todas las poblaciones tienen siempre el comportamiento de una distribución normal, como la ya trabajada prueba de bondad de ajuste, donde se indicó que la población aproximadamente tenía un comportamiento como la distribución normal, donde no siempre estamos seguros de que tener la razón, ya que la prueba no es confiable en un 100%. También se dan situaciones donde el empleo de la distribución normal no es el adecuado, en cuyos casos necesitamos alternativas frente a la estadística paramétrica; más aún, en las pruebas de hipótesis específicas que se han utilizado hasta aquí.

Hay quienes diferencian lo paramétrico de lo no paramétrico por el uso del tipo de variable, es decir, que las variables de tipo cuantitativo van de la mano con lo paramétrico y las variables cualitativas van con lo no paramétrico.

Los estadísticos han desarrollado técnicas útiles que no hacen suposiciones restrictivas sobre la forma o el comportamiento de las distribuciones de las poblaciones. A dichas técnicas se les conoce con el nombre de pruebas no paramétricas.

12.2.1 Características de las pruebas no paramétricas

Es conveniente plantear las características de las pruebas no paramétricas bajo el establecimiento inicial de las paramétricas, para hacer la diferencia y remarcar la importancia de las características de las no paramétricas.

Características de las pruebas paramétricas

Algunas características de los procedimientos para pruebas paramétricas son las que se enuncian en seguida:

• Implican forzosamente la prueba de los parámetros hipotéticos. Como se ha planteado en capítulos anteriores, para situaciones que contienen una sola muestra pequeña la prueba t de Student se relaciona con un valor específico para la media de la población, mientras que para situaciones que contienen dos o más muestras las pruebas t y F se ocupan de probar diferencias entre medias verdaderas o reales. Este nombre lo reciben para referirse a que son de la población y no de la muestra

Alfaomegaestadística en el área de las ciencias sociales y administrativas – aragón

12.1 estadístIca no paramétrIca 521

• En los procedimientos del caso se alcanza un nivel “complejo” de medición de los datos recopilados, lo cuales se conocen como escala de intervalo o escala de proporción, es decir, en ellos el nivel de medición obtenido debe ser de “suficiente fuerza” de modo que las operaciones aritméticas de suma, resta, multiplicación y división de los datos obtenidos sean significativas. Por supuesto lo anterior implica que los datos habrán de ser continuos y cuantitativos, no cualitativos. En consecuencia, los datos no se logran con sólo clasificar las observaciones en diversas categorías distintas, como “sí”, “no” “no está seguro”, ni tampoco con sólo darles orden o rangos a las observaciones con base en esquemas como “del más bajo al más alto”.

• Tienen la necesidad de hacer supuestos muy estrictos, sólo son válidos si estas suposiciones se cumplen. Algunas de tales suposiciones son las siguientes:

• Que los datos de una muestra se extraigan en forma aleatoria de una población con distribu-ción normal y que las observaciones sean independientes entre sí.

• Para situaciones relacionadas con medidas de tendencia central, para las cuales se han to-mado dos o más muestras, que éstas sean elegidas de poblaciones con comportamiento de una distribución normal y que sus varianzas sean iguales.

Características de las pruebas no paramétricas

Algunas características de los procedimientos para pruebas no paramétricas se consideran, en términos gene-rales, como lo enunciado en seguida:

• No se relacionan con los parámetros de una población.

• Que la prueba estadística no depende de la forma del comportamiento de la distribución subya-cente a la población de la cual se tomaron los datos de la muestra.

• Que se cuente con datos fuertes para aplicar operaciones aritméticas significativas.

Algunas pruebas trabajadas en estadística paramétrica, como las pruebas para una, dos y “c” muestras para las proporciones, así como las pruebas de Ji-cuadrada de independencia y la de bondad de ajuste parecen seguir las características para pruebas no paramétricas en forma amplia.

Las técnicas no paramétricas son útiles porque no hacen suposiciones restrictivas sobre la forma de las distri-buciones poblacionales.

Los métodos no paramétricos son libres de distribución, es decir, no requieren de consideración acerca del patrón de la distribución de la población que es la base. Sin embargo, los términos “no paramétrico” y libre de distribución” no son sinónimos, ya que “no paramétrico” se emplea para describir una prueba que no implica parámetros específicos, mientras que “libre de distribución” se refiere a una prueba que no requiere consideración acerca de la forma de la distribución o el compor-tamiento de la población. A pesar de esta diferencia, el término “métodos no paramétricos” se utiliza comúnmente para referirse a pruebas que impliquen cualquiera o ambos de los casos ya referidos.

Los métodos no paramétricos requieren menos consideraciones y son más fáciles de explicar, entender y utili-zar, ya que son especialmente aplicables cuando las observaciones son susceptibles de ordenarse, pero no de medirse con el empleo de una escala cuantitativa.

522 12 IntroduccIón a la estadístIca no paramétrIca

Alfaomega estadística en el área de las ciencias sociales y administrativas – aragón

Ventajas

Hay numerosas ventajas del uso de pruebas no paramétricas, algunas de las cuales se enlistan en seguida.

a) Suelen ser más económicos que los procedimientos clásicos, porque el que está llevando a cabo su aplicación logra aumentar la potencia de respuesta al ahorrar tiempo, dinero y trabajo, cuando selecciona muestras más grandes de datos que se miden con más exactitud, es decir, datos cualitativos o datos en forma de rango para obtener una solución más rápida de los problemas.

b) Suelen ser fáciles de aplicar y rápidos para operar cuando los tamaños de las muestras son pequeñas, lo cual casi siempre ocurre. A menudo, se usan, para pruebas piloto, estudios preliminares en situaciones donde hay necesidad de respuestas casi inmediatas.

c) Permiten la solución de problemas que no implican la prueba de los parámetros.

d) Es posible utilizarlas con tipos de datos cualitativos como son: de escala nominal, de escala ordinal y de escala de intervalo o de proporción.Los de escala nominal son aquellos que, como su nombre lo indica, son nombres o categorías, los posibles valores de la variable.Los datos de escala ordinal son los que se localizan o abarcan una forma de orden creciente o decreciente, o un rango.Los datos de escala de intervalo o proporción son esos que se han medido con más precisión.

e) Tienen menos suposiciones y no son tan estrictas, ya que se satisfacen con más facilidad que los procedimientos paramétricos o clásicos.

f) Gozan de mayor aplicabilidad, puesto que dan por resultado un grupo de conclusiones más generales bajo una base más amplia.

g) Llegan a ser casi tan potentes, según el procedimiento particular seleccionado, como los procedimientos paramétricos, cuando se satisfacen las suposiciones de estos últimos y ser más eficientes, cuando no se cumplen los supuestos del procedimiento clásico o paramétrico.

Se debe remarcar que los métodos o procedimientos no paramétricos se llegan a emplear con ventaja en variedad de situaciones.

Desventajas

Algunas desventajas del uso de pruebas no paramétricas se enlistan en seguida:

a) Conforme aumenta el tamaño de la muestra, la operatividad de datos requerida para los procedimientos no paramétricos suelen ser laboriosas, salvo que estén disponibles programas en paquetes computacionales, para la solución de dichos problemas específicos.

b) Resulta desventajoso utilizar los procedimientos no paramétricos cuando se satisfacen todas las suposiciones de los procedimientos paramétricos y los datos se miden en una escala de intervalo o de proporción, salvo que se usen métodos paramétricos en tales casos. El que maneja métodos no paramétricos no aprovecha al máximo los datos, ya que se pierde la información cuando se convierten los datos recopilados de una escala de intervalo o de proporción a una escala ordinal o a una escala nominal.En particular, en esas circunstancias, hay algunas pruebas no paramétricas muy rápidas y sencillas, que tienen mucha menos potencia que los métodos paramétricos y, por lo tanto, se deben evitar en lo posible.

12.2 Ventajas y desventajas del uso de métodos no paramétricos

Alfaomegaestadística en el área de las ciencias sociales y administrativas – aragón

12.3 prueba del sIgno 523

c) Hay varios tipos de problemas estadísticos para los cuales todavía no se han desarrollado procedimientos no paramétricos.

En conclusión, la principal ventaja de las pruebas no paramétricas consiste en que llegan a realizarse inferencias exactas cuando las suposiciones fundamentales de los métodos estándar no se cumplen en su totalidad; su principal desventaja radica en que exigen menos cuando todas las suposiciones se satisfacen.

Algunos tipos de pruebas no paramétricas se enuncian en seguida:

1. La prueba del signo. Se aplica a datos pareados en una muestra y se basa en signos positivos y negativos, los cuales sustituyen

a los valores cuantitativos.

2. La prueba del rango con signo. También llamada prueba de Wilcoxon. Es más completa que la prueba del signo, ya que no ignora la magnitud

de la diferencia entre pares de valores de una muestra.

3. La pruebas de suma de rangos. La prueba de Wilcoxon se utiliza cuando no se satisfacen las suposiciones de una prueba paramétrica para dos muestras como sería una prueba con la distribución t de Student.

a) La prueba de Kruskal–Wallis, que generaliza el análisis de variancia para permitirnos prescindir del supuesto de que las poblaciones están distribuidas normalmente.

b) La prueba U de Mann Withney, que llega a emplearse para determinar si dos muestras independientes han sido tomadas de la misma población, la cual usa más información que la prueba del signo.

4. La prueba de Kolmogorov–Smirnov. No requiere que los datos sean agrupados en alguna forma, y sirve para determinar si hay una diferencia significativa entre la distribución de frecuencias observadas y una distribución teóricas de frecuencias.

12.3 Prueba del signo

La prueba debe su nombre al uso de los signos y para establecer una diferencia en función de dirección, no en magnitud de un par de observaciones, en la medición en lugar de cantidades, como es en el caso paramétrico. Es particularmente útil cuando la medición cuantitativa es imposible o no es práctica, aunque se cuenta con un cierto orden entre los miembros de cada pareja en una muestra. Tal prueba es aplicable en el caso de se cuente con dos muestras relacionadas y cuando él que la utiliza desea establecer que ambas condiciones son diferentes. El único supuesto asociado a la prueba es la continuidad de la variable considerada, es decir, no se hace ningún supuesto acerca de la forma de la distribución de las diferencias ni se pide que todos los datos se tomen de la misma población.

Una aplicación común de esta prueba se presenta en la investigación de mercados, donde consiste en emplear una muestra de “n” clientes potenciales para determinar la preferencia hacia una de dos marcas de un cierto producto; por ejemplo, leche, cafés, refrescos, etcétera. Como es posible identificar, las preferencias son una variable nominal, pero lo que interesa es encontrar si hay una diferencia entre las preferencias hacia los dos artículos que se comparan.

524 12 IntroduccIón a la estadístIca no paramétrIca

Alfaomega estadística en el área de las ciencias sociales y administrativas – aragón

La prueba del signo se llega a presentar en tres tipos de problemáticas y bajo dos tamaños de pares comparados, es decir, para una muestra de diferencias pequeña y para una muestra de diferencias grande.

Para el caso de una muestra de diferencias pequeña n 20, se establece la prueba de dos extremos o de un extremo en dos casos, que son los siguientes:

a) Por información previa o por la naturaleza de la información se cuenta con un valor promedio (mediana) de referencia, denotado por µ0 y un solo conjunto de datos u observaciones que, al ser comparados con ese valor fijo, nos darán los signos de más y de menos, según sean mayores o menores, respectivamente, que el valor fijo, con la diferencia efectuada. Luego se trabaja la prueba bajo una distribución de probabilidad binomial, con una proporción del 50%, es decir, .50, con el estadístico de prueba x, definido por el número de signos positivos ().

b) Cuando no se cuenta con ese valor fijo, se establece la elección sobre sólo dos alternativas, por ello se considera de nuevo llevar la prueba bajo una distribución de probabilidad binomial con la equidad de posibilidades, es

decir, nuevamente 12

.50π = = , o sea que el estadístico de prueba x siendo el número de signos positivos ().

En ambos casos, la regla de decisión cambia según el tipo de prueba que se aplique.Para una prueba de dos extremos, la regla de decisión analítica se establece de la siguiente forma con x el número de éxitos:

Si xn

yP X xcuando H< ≤ =( ) ≤2

50 0π α. se rechaza.

Si xn

yP X xcuando H> ≥ =( ) ≤2

50 0π α. se rechaza.

Para una prueba de un extremo, la regla de decisión analítica se establece de la siguiente forma con x como el número de éxitos.Prueba de extremo izquierdo P(X x cuando .50) ⇒ H0, se rechazaPrueba de extremo derecho P(X x cuando .50) ⇒H0, se rechaza

Para el caso de una muestra de diferencias grande n 20, se establece la prueba de una distribución muestral

de proporciones aproximada por la distribución de probabilidad normal con parámetros y1n

µ π µπ π( )

= =−

π π

Procedimiento de la prueba

• Se determina el signo de la diferencia entre los dos datos de cada pareja, pero previamente se ha establecido un orden en la muestra que está constituida por las parejas, es decir, cuál es el primer dato y cuál es el segundo dato, de acuerdo con el contexto del problema o la naturaleza de la información.

• Se determina el valor de “n”, es decir, el número de parejas cuyas diferencias exhiben un signo, con lo cual se establece que aquellas parejas con igual valor tienes una diferencia de cero; luego entonces no deben ser consideradas en el conteo de los signos.

• Se formula el planteamiento de la hipótesis.

• Se aplica la aproximación a una distribución normal con el resto de los pasos de una prueba de hipótesis, cuando n es de más de 20 pares ordenados.

Alfaomegaestadística en el área de las ciencias sociales y administrativas – aragón

12.3 prueba del sIgno 525

En prueba de hipótesis del signo se ensaya H0: 0, contra una H1, sobre la base de una muestra aleatoria de tamaño pequeño n 20, donde se sustituye cada valor de la muestra mayor que 0 con un signo positivo y cada valor de la muestra menor que 0 con un signo negativo. Los valores que coincidan con 0 habrán de descartarse del análisis, y el número de signos positivos y negativos será el nuevo valor de n a utilizar en las tablas respectivas para la resolución del problema.

Ejemplo 12.5Una compañía turística desea comprobar la calidad de uno de sus productos de excursiones para exportación, que se promociona con un promedio de 8200 dólares en el mercado internacional. Para ello se consideraron 16 paquetes de excursiones en el mercado internacional con la finalidad de obtener el precio en dólares al que fueron ofertados. Los resultados obtenidos se mostrarán en la siguiente tabla:

8 140 8 150 8 020 8 230 8 100 8 170 8 430 8 200

8 130 8 120 8 510 8 010 8 200 8 020 8 650 8 190

Pruebe que el precio promedio en dólares de una excursión en el mercado internacional es menor al promocionado con 5%.

Solución

Al aplicar la prueba del signo, anotamos un signo positivo por cada dato con valor que exceda los 8200 dólares y un signo negativo por cada dato con valor menor de 8200 dólares, con lo que se obtienen los siguientes resultados:

8 140 8 150 8 020 8 230 8 100 8 170 8 430 8 200 8 130 8 120 8 510 8 010 8 200 8 020 8 650 8 190

0 0

Tabla 12.1 Anotación del precio menor al promocionado por medio de signos, del ejemplo 12.5

El número de ensayos válidos para este análisis es de n 14, ya que dos se descartaron al no dar un signo, sino cero, por ser del mismo valor que el proporcionado al 8200 dólares.

El número de signos positivos x será el estadístico de prueba, luego x 4

B(X 4; 14, .50) .0898 por tablas, puesto que es prueba de un extremo izquierdo.

5%

En estos momentos ya es posible comenzar a dar respuesta a lo solicitado, es decir, la prueba de una diferencia para el promedio poblacional.

Siguiendo los pasos de toda prueba de hipótesis, se tiene el algoritmo siguiente:

H : 82000 µ = el precio promedio de la excursión en el mercado internacional es el promocionado.H : 82001 µ < el precio promedio es menor al promocionado.

526 12 IntroduccIón a la estadístIca no paramétrIca

Alfaomega estadística en el área de las ciencias sociales y administrativas – aragón

Regla de decisión: H0 se rechaza si P(X 4) . Ahora, como P(X 4) .0898 y es mayor a .0500 ⇒ H0, se acepta.

Conclusión: Existe evidencia significativa establece que el precio promedio de la excursión en el mercado in-ternacional es el promocionado.

Ahora, si observamos con cuidado las hipótesis siguientes:

H :

H :0 0

1 0

µ µµ µ=≠

H :

H :0 0

1 0

µ µµ µ=>

H :

H :0 0

1 0

µ µµ µ=<

se notará que la situación de promedio comparado con un valor fijo es equivalente a una selección de dos op-ciones o que el dato es mayor que un valor determinado o menor, es decir, el caso se analizará mediante una

distribución binomial con parámetros n 20 y 12

π =

Ejemplo 12.6Una empresa productora de jugos desea realizar un estudio de preferencia del consumidor sobre su producto de manzana M1 ya que un competidor lanzó en el mercado local un nuevo producto de manzana M2, por lo que se obtiene una muestra de 12 individuos a quienes se les da a probar ambos productos de manera aleatoria. Los resultados obtenidos se indican en la siguiente tabla:

Consumidor 1 2 3 4 5 6 7 8 9 10 11 12

Preferencia M1 M2 M1 M2 M1 M1 M1 M1 M1 M1 M1 M1

Pruebe si hay preferencia hacia uno u otro producto bajo un nivel de significancia del .05

Solución

Sea H la proporción de consumidores que favorecen a un producto cualquiera de los dos.

Los datos de preferencia de los consumidores se definieron bajo el signo más () si el consumidor seleccionaba el producto M2 y un signo menos () si seleccionaba el producto M1.

Preferencia M1 M2 M1 M2 M1 M1 M1 M1 M1 M1 M1 M1

Signo

Tabla 12.2 Anotación del tipo de preferencia por medio de signos, del ejemplo 12.6

Los 12 consumidores del estudio mostraron una preferencia particular por un producto, ninguno mostró un gusto indistinto por los productos y se observó que sólo dos consumidores marcaron su preferencia por el producto M2, por lo que deberemos probar la hipótesis nula para una prueba de dos extremos, luego habrá que obtener

P(X 2) o P(X 10) con n 12 y12

.50π = = ; por tablas, se obtiene que P(X 2) .0192 y P(X 10) .0192 5%.

Alfaomegaestadística en el área de las ciencias sociales y administrativas – aragón

12.3 prueba del sIgno 527

En estos momentos ya es posible comenzar a dar respuesta a lo solicitado, es decir, concretar la prueba de una diferencia para la proporción poblacional.

Siguiendo los pasos de toda prueba de hipótesis, se tiene el algoritmo siguiente:

H : .50

H : .500

1

ππ=

no existe diferencia entre las preferencias de los dos productos.

existe diferencia entre las preferencias de los dos productos.

Como el nivel de significación es del 5% y la prueba es de dos extremos, la regla de decisión analítica está dada por lo siguiente:

Puesto que 2 6 y .0192 12

.05 ⇒H0 se rechaza, luego H1 se acepta.

Conclusión: Sí hay diferencia entre las preferencias de los dos productos comparados, ya que los consumidores encuestados prefieren el producto M1 al tener éste mayor frecuencia en la preferencia.

Por otro lado, si recordamos que en la distribución de probabilidad binomial cuando n p y n q son cada una al menos 5, es decir, la muestra es grande n 20, entonces será posible aproximar a la distribución binomial por la distribución normal estándar.

Ejemplo 12.7Consideremos el resultado de una comunidad de 40 universitarios de primer año, donde se evalúa la eficacia de dos tipos de grupos escolares: grupos numerosos a cargo de profesores de tiempo completo o grupos pequeños a cargo de asistentes graduados. Las respuestas fueron obtenidas con la siguiente indicación: Califica la efica-cia en la transmisión del conocimiento en estos dos tipos de grupos con la siguiente escala: excelente, 4; muy bueno, 3; bueno, 2, y deficiente, 1. Los resultados obtenidos se presentan en la siguiente tabla:

528 12 IntroduccIón a la estadístIca no paramétrIca

Alfaomega estadística en el área de las ciencias sociales y administrativas – aragón

Número de miembrode la comunidad

Puntuación a gruposnumerosos

Puntuación a grupospequeños

1 2 3

2 1 2

3 4 2

4 4 3

5 3 4

6 3 2

7 4 2

8 2 1

9 4 3

10 1 1

11 3 2

12 3 3

13 4 4

14 4 4

15 4 3

16 1 2

17 1 3

18 2 2

19 2 3

20 4 3

21 4 1

22 4 4

23 4 3

24 3 3

25 3 2

26 2 2

27 3 1

28 4 1

29 3 1

30 4 3

31 3 2

32 1 2

33 4 4

34 3 4

35 2 3

36 2 3

37 2 1

38 1 1

39 3 4

40 3 2

Alfaomegaestadística en el área de las ciencias sociales y administrativas – aragón

12.3 prueba del sIgno 529

Si la oficina del rector quiere probar la hipótesis de que no hay diferencia entre la percepción de los alumnos sobre ambos tipos de grupos, a un nivel de significancia del 5%, a qué conclusión se llegaría.

Solución

Comenzaremos convirtiendo en signos las evaluaciones de ambos métodos de enseñanza en los dos tipos de grupos. Aquí, un signo significa que el alumno prefiere grupos numerosos, un signo significa una preferencia a grupos pequeños, mientras un cero representa un empate o la ausencia de preferencia, lo cual será mostrado en la siguiente tabla:

Puntuación a grupos numerosos(1)

Puntuación a grupos pequeños(2)

Signo de la puntuación(1) (2)

2 3

1 2

4 2

4 3

3 4

3 2

4 2

2 1

4 3

1 1 03 2

3 3 04 4 04 4 04 3

1 2

1 3

2 2 02 3

4 3

4 1

4 4 04 3

3 3 03 2

2 2 03 1

4 1

3 1

4 3

3 2

1 2

4 4 03 4

2 3

2 3

2 1

1 1 03 4

3 2

Tabla 12.3 Anotación del tipo de preferencia por medio de signos del ejemplo 12.7

530 12 IntroduccIón a la estadístIca no paramétrIca

Alfaomega estadística en el área de las ciencias sociales y administrativas – aragón

Número de signos 19

Número de signos 11

Número de ceros 10

Total 40

Tabla 12.4 Resumen de signos de las 40 evaluaciones

Puesto que estamos por probar diferencias percibidas, excluiremos las evaluaciones empatadas, es decir, aquellas que nos dieron un valor de cero. Por lo mismo, quedan 30 diferencias donde la proporción de que la primera

puntuación sea mayor a la segunda es de 1930

.6333π = =

Ahora se establece estadísticamente que si no hay diferencia de preferencia entre ambos tipos de grupos, cabe esperar que se obtuvieran 15 signos más y 15 signos menos. Lo anterior indica que la probabilidad de que la primera puntuación sea mayor que la segunda será de un 50%, es decir, el parámetro proporción toma ese valor: .50.

Continuando con los conceptos necesarios para realizar la prueba de hipótesis para la proporción, bajo una aproximación a la distribución normal, se tiene lo siguiente:

Calculando el error estándar de la proporción, se tiene:

1n

.50 .50

30.00833 .0913σ

π π ( )( )( )=

−= = ≅π

Para determinar los valores críticos, que son dos porque se desea realizar una prueba de dos extremos, bajo la distribución Normal estándar, se busca en las tablas correspondientes los valores equidistantes de la media que nos den un área de 95%, ya que el nivel de significación es de 5% repartido en ambos extremos, siendo estos ZC 1.96.

En estos momentos ya es posible comenzar a dar respuesta a lo solicitado, es decir, hay que conocer la prueba de una diferencia para la proporción poblacional.

Siguiendo los pasos de toda prueba de hipótesis, se tiene el algoritmo siguiente:

No hay diferencia entre los dos tipos de grupos.H : .50

H : .500

1

ππ=

≠ Hay diferencia entre los dos tipos de grupos.

R.R.R.R. R. A.

α/2 = .025α/2 = .025

0�1�2�3�4 4321

1� α = 95%

�ZC= �1.96 ZC= 1.96

Figura 12.3 Regla de decisión gráfica en unidades estandarizadas

Aceptar H si 1.96 Z 1.960 p− ≤ ≤

Alfaomegaestadística en el área de las ciencias sociales y administrativas – aragón

12.4 prueba del rango con sIgno de WIlcoxon 531

El cálculo del valor de prueba por el modelo correspondiente es:

Z.6333 .5000

.09131.46p

π πσ

=−

=−

≅π

Ahora, como Zp 1.46 cae en el intervalo (1.96, 1.96) ⇒H0 se acepta.

Conclusión: El rector debe aceptar la evidencia estadística no significativa que indica que no hay diferencia en cuanto a preferencia entre los dos tipos de grupos, los numerosos y los pequeños.

La principal desventaja de la prueba del signo radica, como ya se enuncio en desventajas de las pruebas no paramétricas, en el hecho de que ignora la magnitud de la diferencia entre pares de va-lores por completo. En 1945, Frank Wilcoxon desarrolló una prueba diferente a la prueba del signo donde sí toma en consideración la magnitud de las diferencias; la llamó prueba del rango con signo.

12.4 Prueba del rango con signo de Wilcoxon

Como ya se planteó, esta prueba toma en consideración la magnitud de la diferencia absoluta entre pares de valores. En consecuencia, se sabe que se relaciona con la dirección y la magnitud de las diferencias.

La prueba es posible utilizarla en lugar de la prueba paramétrica t de Student para una muestra en la cual se necesita probar una hipótesis en relación con un parámetro que refleja una tendencia central. Tal prueba no paramétrica es conocida como prueba de rangos con signos de Wilcoxon, la cual se maneja cuando se tienen datos medidos a un nivel más alto que una escala ordinal. Cuando se violan las suposiciones de la prueba t, la prueba de Wilcoxon, que hace menos suposiciones y menos estrictas, es pertinente usarla para detectar las diferencias significativas.

Las suposiciones necesarias para efectuar esta prueba de Wilcoxon son las siguientes:

• Que los datos obtenidos se midan a un nivel más alto que el de escala ordinal.

• Que el fenómeno aleatorio de interés genere una variable continua.

• Que los datos se seleccionen en forma aleatoria e independiente.

• Que la distribución de las diferencias entre los datos observados y la mediana hipotética sea aproximadamente simétrica.

La prueba de Wilcoxon, de rangos con signo de una muestra, considera no sólo si un valor observado es o no mayor (menor) que la mediana hipotética, sino también qué tan grande (pequeña) es.

Procedimiento de la prueba

• Se determina el signo de la diferencia entre los dos datos de cada pareja, previamente establecido un orden en la muestra que está constituida por las parejas, es decir, cuál es el primer dato y cuál es el segundo dato, de acuerdo con el contexto del problema o la naturaleza de la información. Si

532 12 IntroduccIón a la estadístIca no paramétrIca

Alfaomega estadística en el área de las ciencias sociales y administrativas – aragón

no hay parejas, y es un solo conjunto de datos de tamaño n , se obtienen las diferencias entre cada uno de los valores observados y la mediana hipotética M0, lo cual se denota como D X Mi i ed= − donde i 1, 2, 3, ... n

• No se toman en cuenta los signos más ni menos para obtener un grupo de n diferencias absolutas; en lenguaje simbólico, se tiene D X Mi i ed= − , donde i 1, 2, 3, .... n

• Cualquier par con diferencia absoluta de cero no será considerado, es decir, se omite cualquier diferencia absoluta con puntaje de cero, con lo cual se tiene un conjunto de n diferencias absolutas de puntajes distintos de cero, entonces n n .

• Poner por rango (orden creciente) las diferencias absolutas entre pares de valores, desde la menor hasta la mayor, es decir, a la diferencia absoluta menor se le asigna el rango 1, a la siguiente en aumento el rango 2 y así sucesivamente. Lo anterior significa que se asignan rangos Ri desde 1 hasta n a cada una de las |Di|, de modo que el puntaje más pequeño obtenga el rango 1 y el puntaje mayor obtenga el rango n.

• Como las diferencias son absolutas, entonces no se toma en consideración su signo, por lo que algunas parejas tendrán un rango con el mismo valor; luego el rango a asignarse en este caso debe ser el valor del promedio de las posiciones a las que pertenecen, es decir, debido a la falta de precisión en el proceso de medición, si dos o más Di son iguales, se les asigna el “rango promedio” de los rangos que se les asignarían individualmente si no hubieran ocurrido empates en los datos.

• Una vez que a las diferencias se les ha asignado un rango con orden creciente, el signo de la diferencia se indica en su rango para posteriormente sumar los rangos positivos y los rangos negativos por separado. Lo anterior significa que se vuelve a asignar el símbolo o el a cada uno de los n valores absolutos, distintos de las diferencias de puntajes |Di| según si Xi Med fue positiva o negativa.

La prueba de hipótesis para una mediana M0 de la población es de un extremo o de dos extremos. En lenguaje simbólico se tendría lo siguiente:

Prueba de un extremo izquierdo Prueba de un extremo derecho Prueba de dos extremos

H0 mediana Med H0: mediana Med H0: mediana Med

H1 mediana Med H1: mediana Med H1: mediana Med

• Tomando de nuevo en cuenta el signo de las diferencias, deberán sumarse, por una parte, todos

los valores de orden (rango) positivos, a los que se denotará por W Ri∑ ( )+ = + , en tanto que la

suma de todos los valores de orden negativos serán denotados por W Ri∑ ( )− = − . Además, habrá que definir a W como el mínimo de (W , W ).

• La idea de Wilcoxon se fundamenta en que si la hipótesis nula se establece como H :0 A Bµ µ= y fuera verdadera, entonces el total de la suma de rangos positivos W debería ser aproximadamente igual al total de la suma de rangos negativos W. En consecuencia se rechazará la hipótesis nula a favor de la hipótesis alternativa denotada por H :1 A Bµ µ≠ si ambos totales (W, W) son pequeños en una prueba de dos extremos (bilateral).

• La hipótesis nula se rechazará en favor de una hipótesis alternativa en una prueba de un extremo (unilateral) si sucede, por ejemplo, lo siguiente:

H1:A B sólo si sucede que W es pequeña y W es grande.

H1:A B sólo si sucede que W es grande y W es pequeña.

Alfaomegaestadística en el área de las ciencias sociales y administrativas – aragón

12.4 prueba del rango con sIgno de WIlcoxon 533

Como los términos pequeño y grande son vagos, Wilcoxon y Wilcox elaboraron una tabla especial con valores críticos para esta prueba, con n 5, la cual se encuentra en los anexos.

En cualquier caso, la hipótesis nula se rechazará si el valor de prueba W, W o W, según corresponda al tipo de prueba, es menor o igual al valor crítico, como se indica en la siguiente tabla:

Tipo de prueba valor deprueba

Extremo izquierdo W

Extremo derecho W

Dos extremos W

Tabla 12.4 Valor de W+, W– o W que se debe seleccionar en cada tipo de prueba

• Otra alternativa para la obtención del valor de prueba de Wilcoxon surge al considerar la suma de los rangos con signo positivo o la suma de rangos con signo negativo; en lenguaje simbólico, serí

R RW i∑ ( )= + o R RW i∑ ( )= − , en tanto que para muestras con n 8, este valor de prueba tiene

aproximadamente un comportamiento de una distribución normal y se llega a utilizar el modelo

siguiente para determinarlo ZR

pW R

R

W

W

=−σσ

donde la nomenclatura es:

RW suma de los rangos positivos, es decir, RW Ri ().

MRW valor de la media de RW, donde n n 1

4RWµ ( )

=+

.

RW error estándar de RW, donde n n 1 2n 1

24RWσ

( )( )=

+ +.

n número de puntajes de diferencias absolutas con valor no cero en la muestra.

Así el valor de prueba queda establecido por el siguiente modelo ZR

n n 14

n n 1 2n 124

p

W

( )

( )

( )=

−+

+ + y al

considerar el valor del nivel de significación dado, es posible rechazar (aceptar) la hipótesis nula si el valor calculado de Zp cae en la región apropiada de la zona de rechazo (aceptación), según se utilice una prueba de un extremo o de dos extremos.

Ejemplo 12.8Se seleccionan aleatoriamente diez pares de niños de una estancia infantil, cada par formado de acuerdo con su fecha de nacimiento. Se dividen en dos grupos, un niño de cada par se coloca en el grupo I y el otro en el grupo II. Se emplean dos dietas diferentes para alimentar a los dos grupos y después de cierto tiempo se registran sus aumentos de peso en gramos como se muestra en la siguiente tabla:

534 12 IntroduccIón a la estadístIca no paramétrIca

Alfaomega estadística en el área de las ciencias sociales y administrativas – aragón

Número depares de niños

Aumento de peso con las dos dietas

X (Grupo I) Y Grupo II)

1 15 12

2 16 20

3 19 34

4 20 22

5 14 21

6 18 16

7 17 26

8 21 20

9 17 22

10 13 21

Tal información proporciona suficiente evidencia estadística para probar que la dieta correspondiente al grupo I es menos efectiva, en cuanto al aumento de peso, que la dieta del grupo II. Utilice un nivel de significación del 5%.

Solución

Comenzaremos determinando las diferencias de pesos para indicar los signos correspondientes; en seguida, los rangos sin signo y por último el resto de la información de acuerdo con el procedimiento ya descrito, para establecerlo en la siguiente tabla:

Aumento de peso con las dos dietas Rango con signo

X Y X Y Rango Negativos Positivos

15 12 +3 4 4

16 20 4 5 5

19 34 15 10 10

20 22 2 2.5 2.5

14 21 7 7 7

18 16 +2 2.5 2.5

17 26 9 9 9

21 20 +1 1 1

17 22 5 6 6

13 21 8 8 8

Totales 47.5 7.5

Tabla 12.5 Anotación de diferencias con signo, así como rangos sin y con signo del ejemplo 12.8

Alfaomegaestadística en el área de las ciencias sociales y administrativas – aragón

12.4 prueba del rango con sIgno de WIlcoxon 535

Puesto que estamos por probar diferencias, excluiremos las evaluaciones empatadas, es decir, aquellas que nos dieron un valor de cero. En este ejemplo no ocurrió, por lo que n 10 diferencias. Además, obsérvese que las diferencias absolutas del cuarto y sexto pares son las mismas, luego el rango a asignarles es el promedio de los

rangos que les corresponden, segundo y tercero, para obtener 2 3

252

2.5+

= =

También obsérvese que como se quiere probar que la dieta correspondiente al grupo I (X) es menos efectiva, en cuanto al aumento de peso, que la dieta del grupo II (Y), entonces la diferencia X Y se espera tenga signo negativo y que el valor absoluto de la suma de signos negativos sea mayor que el promedio de las dos sumas absolutas, que será por lo tanto, la media.

47.5 7.52

552

27.5RWµ =

+= =

Si continuamos con los conceptos necesarios para realizar la prueba de hipótesis para la variable rango con signo bajo una aproximación a la distribución normal, tendremos lo siguiente:

n n 14

10 10 1

4110

427.5RW

µ( )( )

=+

=+

= =

σRW

n n n=

+( ) +( )=

+( ) ( ) +( )=

1 2 1

24

10 10 1 2 10 1

24

10 11(( )( )= ≅

21

24231024

9 81.

Sea R RW i∑ ( )= − la suma de los rangos negativos, considerando su valor de la tabla 12.5: R 47.5W = −

El valor crítico, al establecer una prueba de extremo izquierdo, con un nivel de significación del 5%, es decir, .05 por tablas correspondientes a la normal estándar, se tiene que es Z 1.645C = −

En estos momentos ya es posible comenzar a dar respuesta a lo solicitado, es decir, la prueba de rangos con signo de extremo izquierdo bajo la aproximación a la distribución normal estándar.

Si seguimos los pasos de toda prueba de hipótesis, tendremos el algoritmo siguiente:

La hipótesis nula es que ambas dietas son igualmente efectivas.

La hipótesis alternativa es que la dieta utilizada para el grupo I, o sea X, es menos efectiva que la del grupo II, o sea Y, en cuanto al aumento de peso en los niños.

En lenguaje simbólico, con diferencia, sería lo siguiente:

H : X Y 0

H : X Y 00

1

− =

− <

R. A.

R.R.

0�1�2�3�4 4321

α = 5%

1 � α= 95%

–Zc = –1.64

Figura 12.4 Regla de decisión gráfica en unidades estandarizadas

536 12 IntroduccIón a la estadístIca no paramétrIca

Alfaomega estadística en el área de las ciencias sociales y administrativas – aragón

Aceptar H si z 1.6450 p ≥ −

Cálculo del valor de prueba por el modelo correspondiente, con diferencias sin valor absoluto:

ZR

pW R

R

W

W

=−

= − − = − ≅ −µ

σ47 5 27 5

9 81175

9 8117 64

. .. .

.

Como Z 7.64 1.645p = − < − , entonces se localiza en la región de rechazo ⇒ H0 se rechaza luego H1 se acepta.

Conclusión: La información proporciona evidencia estadística significativa para establecer que la dieta correspondiente al grupo II es más efectiva, en cuanto al aumento de peso, que la dieta del grupo I.

La solución por la otra alternativa, al considerar que como el tamaño de la muestra es mayor que 5, es decir, n 5, se logra aplicar la tabla de rangos con signo de Wilcoxon.

Lo anterior se presentará en el siguiente ejemplo con la misma información:

Ejemplo 12.9Se seleccionan aleatoriamente diez pares de niños de una estancia infantil, cada par formado de acuerdo con su fecha de nacimiento. Luego se dividen en dos grupos, un niño de cada par se coloca en el grupo I (X) y el otro en el grupo II (Y). Se emplean dos dietas diferentes para alimentar a los dos grupos; después de cierto tiempo, se registran sus aumentos de peso en gramos X y Y, como se muestra en la siguiente tabla:

Número depares de niños

Aumento de peso con las dos dietas

X (Grupo I) Y (Grupo II)

1 15 12

2 16 20

3 19 34

4 20 22

5 14 21

6 18 16

7 17 26

8 21 20

9 17 22

10 13 21

La información proporciona suficiente evidencia estadística para probar que la dieta correspondiente al grupo I es menos efectiva, en cuanto al aumento de peso, que la dieta del grupo II. Utilice un nivel de significación del 5%.

Alfaomegaestadística en el área de las ciencias sociales y administrativas – aragón

12.4 prueba del rango con sIgno de WIlcoxon 537

Solución

Comenzaremos por determinar las diferencias de pesos indicando los signos correspondientes. En seguida pa-saremos a los rangos sin signo y por último el resto de la información de acuerdo con el procedimiento descrito, para establecerlo en la siguiente tabla:

Aumento de peso con las dos dietas Rango con signo

X Y X Y Rango Negativos Positivos

15 12 3 4 4

16 20 4 5 5

19 34 15 10 10

20 22 2 2.5 2.5

14 21 7 7 –7

18 16 2 2.5 2.5

17 26 9 9 9

21 20 1 1 1

17 22 5 6 6

13 21 8 8 8

Totales 47.5 7.5

Tabla 12.6 Anotación de diferencias con signo, así como con rangos sin y con signo del ejemplo 12.9

Puesto que estamos por probar diferencias, excluiremos las evaluaciones empatadas, es decir, aquellas que nos dieron un valor de cero. En este ejemplo no ocurrió lo anterior, por lo que n 10 diferencias. Además, obsérvese que las diferencias absolutas del cuarto y sexto pares son las mismas. Luego el rango a asignarles es el promedio

de los rangos que les corresponden, segundo y tercero, para obtener 2 3

252

2.5+

= = .

En seguida, a partir de la tabla 12.6, y luego de establecer que al realizar una prueba de extremo izquierdo o una prueba unilateral se aplica la tabla de rangos con signo de Wilcoxon, conjuntamente con los datos del tamaño de la muestra y el nivel de significación, es decir, en lenguaje simbólico, n 10 y .05, se obtiene que WC 11. El procedimiento para el uso de la tabla de rangos con signo de Wilcoxon, es similar al de algunas distribuciones de probabilidad ya trabajadas, en el caso paramétrico, se cruzan el renglón correspondiente al tipo de prueba y nivel de significación con la columna que indica el valor del tamaño de muestra, como se observa en seguida en un fragmento de dicha tabla:

Unilateral Bilateral n 5 n 6 n 7 n 8 n 9 n 10

P 0.05 P 0.10 1 2 4 6 8 11

P 0.025 P 0.05 1 2 4 6 8

P 0.01 P 0.02 0 2 3 5

P 0.005 P 0.01 0 2 3

Tabla 12.7 Fragmento de la tabla especial de Wilcoxon para n 10, .05 y prueba unilateral

538 12 IntroduccIón a la estadístIca no paramétrIca

Alfaomega estadística en el área de las ciencias sociales y administrativas – aragón

Si continuamos con los elementos para efectuar la prueba, tocará establecer la regla de decisión, la cual, bajo la teoría de este método alternativo, es rechazar H0 si Wp WC. La consideración del valor de prueba está dado por el tipo de prueba: extremo izquierdo (Tabla 12.4) luego Wp W 7.5, ahora como 7.5 11, entonces H0 se rechaza y, por consiguiente, se acepta H1

Conclusión: Hay evidencia estadística no significativa para establecer que la dieta correspondiente al grupo I es menos efectiva, en cuanto al aumento de peso, que la dieta del grupo II.

Tales pruebas son útiles para resolver problemáticas que ocurren a menudo en estudios de investigación de mercados, así como en comportamiento de consumidores y de psicología experimental, donde sólo se llegan a obtener datos del tipo ordinal; por consiguiente, la prueba paramétrica correspondiente la t de Student en dos muestras no es aplicable por no cumplirse todos las suposiciones estrictas de que las muestras sean independientes, que sean éstas elegidas de poblaciones con comportamiento según una distribución normal, que tengan estas últimas variancias iguales conocidas y que los datos se midan cuando menos con la fuerza de una escala de intervalo.

Por otra parte, quien desea aplicar la teoría paramétrica correspondiente a la t de Student y consiga obtener los datos con las propiedades de una escala de intervalo o una proporción, tendrá la sensación y la impresión de que los supuestos de la prueba a utilizar t son irreales para el conjunto de datos.

En esas circunstancias, es posible hacer uso de pruebas no paramétricas como son: la de Wilcoxon, la de Kruskal-Wallis y la de U Mann Withney de suma de rangos, las cuales han demostrado ser casi tan poderosas, en condiciones apropiadas, como su contraparte paramétrica, la distribución t de Student.

12.5.1 Prueba de Wilcoxon

Dicha prueba fue diseñada para detectar cualquier clase de diferencia entre dos grupos; algunas de ellas son: ubicación, dispersión, forma, o las tres. Es posible usarla cuando se ha logrado una medición de la información en cuando menos escala ordinal y se desea probar que dos muestras mutuamente independientes se han tomado o no de la misma población o de poblaciones idénticas.

Los únicos supuestos necesarios para aplicar la prueba son los siguientes:

• Para evitar empates que la variable aleatoria de interés sea continua.

• Que los datos a recopilar cuando menos tengan una escala ordinal de medición, tanto entre como dentro de las dos muestras.

• Que ambas muestras sean elegidas en forma aleatoria e independiente de sus respectivas poblaciones.

En resumen, el procedimiento de la prueba de Wilcoxon de suma de rangos requiere un conjunto de suposiciones menos estrictas que la prueba t de Student, ya que sólo se especifica que las poblaciones tengan distribución continua con la misma forma sesgada o simétrica, así como que los datos se logren medir en una escala ordinal en ambas muestras.

12.5 Pruebas de suma de rangos

Alfaomegaestadística en el área de las ciencias sociales y administrativas – aragón

12.5 pruebas de suma de rangos 539

Suele ser de interés usar la prueba de suma de rangos de Wilcoxon en forma específica para probar diferencias en la posición, es decir para las diferencias de medianas poblacionales.

Para llevar a cabo la aplicación de la prueba de suma de rangos de Wilcoxon, se debe seguir los siguientes puntos.

Procedimiento de la prueba

• El tamaño de las muestras será denotado respectivamente a partir de cómo fueron proporcionadas o elegidas las muestras; la primera como n1 y la segunda como n2. Por consiguiente, los rangos combinados serán en número n1 n2 lo que se denota por n n1 n2.

• Se debe establecer siempre que los tamaños de las muestras sean desiguales, n1 representará la muestra con menos elementos o la más pequeña, mientras n2 será la muestra con más elementos o la más grande.

• Poner por rangos combinados todos los datos de ambas muestras, desde el menor hasta el mayor, es decir, al dato menor se le asigna el rango 1, al siguiente en aumento el rango 2 y así sucesivamente, salvo por supuesto que los datos obtenidos ya tuvieran los rangos inicialmente asignados.

• El valor de prueba para la prueba de Wilcoxon de suma de rangos es sólo la suma de los rangos asignados a los n1 datos de la muestra más pequeña, lo que es denotado por Sn1.

• Para muestras de igual tamaño es posible seleccionar cualquier muestra para la determinación de Sn1

.

• Ahora, como matemáticamente se sabe que la suma de los primeros n enteros positivos consecutivos

se obtiene por la expresión general n n 1

2( )+

, entonces el estadístico para la prueba Sn1, más la

suma de los rangos asignados a los n2 datos de la muestra grande Sn2, debe ser igual a este valor.

En lenguaje simbólico se tendría lo siguiente:

S Sn n 1

2n n1 2

( )+ =

+, ecuación que servirá para verificar el punto a seguir para asignar los rangos.

• Cuando en las muestras sus tamaños n1 y n2, por separado, son menores o iguales a 10, se suele usar una tabla de valores críticos de la suma de rangos de Wilcoxon (véase los anexos) con el valor de prueba de Sn1

, ya sea que la prueba es de uno o de dos extremos, con diversos niveles de significación.

• Para muestras de tamaño grande, n1 y n2 por separado son estrictamente mayores a 10. El estadístico para la prueba Sn1

tiene un comportamiento aproximado de una distribución normal. Luego, los parámetros a utilizar en la prueba están dados por los siguientes modelos:

µS n1

=+( )n n 1

2 σ S n1

=+( )n n n1 2 1

12

Por lo anterior, el valor de prueba queda de la siguiente forma, con n1 n2

ZS

p

n S

S

=−

σn1

n1

La prueba de hipótesis para dos medianas M1 y M2 de la población sería de un extremo o de dos extremos. En lenguaje simbólico quedaría así:

540 12 IntroduccIón a la estadístIca no paramétrIca

Alfaomega estadística en el área de las ciencias sociales y administrativas – aragón

Prueba de un extremo izquierdo Prueba de un extremo derecho Prueba de dos extremos

H : M M

H : M M0 1 2

1 1 2

≥<

H : M M

H : M M0 1 2

1 1 2

≤>

H : M M

H : M M0 1 2

1 1 2

=≠

en donde: M1 a la mediana de la población de la que se seleccionaron n1 datos de la primera muestra, que es la más pequeña.M2 a la mediana de la población de la que se seleccionaron n2 datos de la segunda muestra, que es la más grande.

Ejemplo 12.10Un analista financiero desea comparar el rendimiento en dividendos de ciertas emisiones negociadas en la bolsa de valores durante los dos años consecutivos últimos. Para ello, se seleccionan muestras de ocho y diez papeles para cada año, respectivamente, en orden cronológico, con los resultados presentados en la siguiente tabla:

Bolsa de valores penúltimo año Bolsa de valores último año

Dividendospor acción

Preciopor acción

Dividendospor acción

Preciopor acción

$ 1.30 $ 14.25 $ 2.00 $ 20.38

.24 14.75 .80 14.25

.18 3.40 1.00 18.25

.12 8.75 .50 7.75

.80 8.25 .22 8.00

.60 11.88 1.59 16.75

.32 3.88 .80 17.12

.35 3.12 3.60 33.25

1.08 15.50

.60 8.25

Solución

Comenzaremos determinando los rendimientos de dividendos, en seguida los rangos combinados de los rendimientos de dividendos y por último el resto de la información, de acuerdo con el procedimiento anteriormente descrito, en la siguiente tabla:

Alfaomegaestadística en el área de las ciencias sociales y administrativas – aragón

12.5 pruebas de suma de rangos 541

Bolsa de valores penúltimo año n1 8 Bolsa de valores último año n2 10

Dividendospor

acción(1)

Preciopor

acción(2)

Rendimientode dividendos

(1)(2)

Rango combinado de

rendimientos de dividendos

Dividendospor

acción(1)

Preciopor

acción(2)

Rendimientode dividendos

(1)(2)

Rango combinado de

rendimientos de dividendos

$ 1.30 $ 14.25 9.1% 13 $ 2.00 $ 20.38 9.8% 16

.24 14.75 1.6 2 .80 14.25 5.6 8

.18 3.40 5.3 6 1.00 18.25 5.5 7

.12 8.75 1.4 1 .50 7.75 6.5 9

.80 8.25 9.7 15 .22 8.00 2.8 3

.60 11.88 5.1 5 1.59 16.75 9.5 14

.32 3.88 8.2 12 .80 17.12 4.7 4

.35 3.12 11.2 18 3.60 33.25 10.8 17

1.08 15.50 7.0 10

.60 8.25 7.3 11

Sn1 72 Sn2 99

Tabla 12.8 Anotación de rendimientos de dividendos y rangos combinados del ejemplo 12.10

Recordemos que el rendimiento de dividendos se encuentra establecido por la razón entre los dividendos y el precio por acción.

Si al analista financiero le interesa en forma específica la comparación de la mediana de producción de divi-dendos, más bien que sólo las diferencias que hubiera en la generación de los rendimientos de dividendos, se debe suponer que la distribución de los rendimientos de los dividendos en ambas poblaciones, de las cuales se tomaron muestras aleatorias, habrán de ser idénticas, excepto quizá por las diferencias en ubicación como son las medianas.

Por lo anterior y para saber la prueba que se realizará, calculemos las medianas de los rendimientos de los divi-dendos para cada una de las muestras, para lo cual hay que seguir el procedimiento de un listado, acercándonos a la posición central a partir de los extremos, que en ambos casos serán dos valores los que se ubiquen en ellas, por ser las dos muestras en cantidad un número par.

n1 8 1 4 1 6 5 1 5 3 8 2 9 1 9 7 11 2= . , . , . , . , . , . , . , . Mediana5.3 8.2

213.5

26.75=

+= =

n2 10 2 8 4 7 5 5 5 6 6 5 7 0 7 3 9 5 9 8 10= . , . , . , . , . , . , . , . , . , ..8 Mediana6.5 7.0

213.5

26.75=

+= =

Con lo obtenido y que el analista financiero tampoco especifico cuál de los dos grupos es viable que posea un mayor (menor) rendimiento mediano de dividendos, la prueba será de dos extremos.

Ahora se efectuará la verificación del proceso de asignación de rangos combinados, entendiendo esto como que se van a considerar todos los datos como un todo y no muestra por muestra en forma separada, con el planteamiento

542 12 IntroduccIón a la estadístIca no paramétrIca

Alfaomega estadística en el área de las ciencias sociales y administrativas – aragón

visto en la teoría de que se use la ecuación siguiente: S Sn n 1

2n n1 2

( )+ =

+. En consecuencia, al tener las sumas

de los rangos ya determinadas para cada muestra en la tabla 12.8, se cumplirá que:

S Sn n 1

2

72 9918 18 1

2

17118 19

2171 171

n n1 2

( )

( )

( )+ =

+

+ =+

=

=

Por último, y antes de iniciar la prueba, se determinarán los valores críticos de ésta a partir de las tablas ela-boradas por estadísticos para muestras pequeñas (menores o iguales de diez elementos cada una), su uso es similar a otras ya trabajadas como son la t de Student, la ji cuadrada y la normal estándar, por mencionar algunas.

En este caso, para la prueba de Wilcoxon de suma de rangos, se consideran varios valores: uno en la columna externa, que es el tamaño de la muestra grande n2, mientras en el renglón superior de los dos primeros valores se elige el que va de acuerdo con el tipo de prueba para luego bajar por él hasta el valor del nivel de significa-ción y, junto con el valor inicialmente elegido, se marca una línea horizontal, que se va a interceptar con la línea vertical correspondiente al valor del tamaño de la muestra pequeña n1.

Tal procedimiento quedará visualizado con un fragmento de dicha tabla, para el ejemplo en cuestión, seguido con los datos ya enunciados, que remarcaremos aquí:

Prueba de dos extremos, nivel de significación del 5%, es decir, .05, n1 8 y n2 10.

n2

n1

Un extremo Dos extremos 7 8 9

.05 .10 (43,76) (54,90) (66,105)

.025 .05 (40,79) (51,93) (62,109)

9 .01 .02 (37,82) (47.97) (59,112)

.005 .01 (35,84) (45,99) (56,115)

.05 .10 (45,81) (56.96) (69,111)

10 .025 .05 (42,84) (53,99) (65,115)

.01 .02 (39,87) (49,103) (61,119)

.005 .01 (37,89) (47,105) (58,122)

Tabla 12.9 Fragmento de la tabla para obtener valores críticos de la prueba de Wilcoxon de suma de rangos para muestras pequeñas

Alfaomegaestadística en el área de las ciencias sociales y administrativas – aragón

12.5 pruebas de suma de rangos 543

En estos momentos ya es posible comenzar a dar respuesta a lo solicitado, es decir, la prueba de suma de rangos de Wilcoxon de dos extremos.

Si seguimos los pasos de toda prueba de hipótesis, se tiene el algoritmo siguiente:

Las medianas de rendimiento de dividendos son iguales.H : M M

H : M M0 1 2

1 1 2

=≠ Las medianas de rendimiento de dividendos son diferentes.

Ahora, como los valores críticos inferior y superior, respectivamente, para una prueba de dos extremos son los obtenidos en la tabla anterior, con valores (53,99), así como el valor de prueba es la suma de rangos de la muestra más pequeña, entonces se tiene a Sn1 72.

La regla de decisión, por ser prueba de dos extremos, se establece simbólicamente como lo siguiente:

Aceptar H si L S Li n s0 1≤ ≤

Entendamos que el valor Sn1 72 se encuentra dentro del intervalo, que es la región de aceptación, es decir,

53 991

≤ ≤Sn

Conclusión: Se establece que hay evidencia estadística de que las medianas de rendimiento de dividendos son iguales en esos dos años consecutivos.

El ejemplo anterior fue para muestras menores o iguales a 10, es decir, pequeñas. En seguida se establecerá uno para muestras grandes o con tamaños estrictamente mayores a diez.

Ejemplo 12.11Un cierto banco desea analizar si los saldos promedio en cuentas de cheques de sus clientes, en dos de sus sucursales en dos delegaciones distintas del Distrito Federal, son idénticos. Por ello, el gerente de planeación toma dos muestras aleatorias simples e independientes, una en cada sucursal. Los datos obtenidos se presentan en la siguiente tabla:

Saldos en cuentas de cheques para dos sucursales en un cierto banco

Sucursal 1Saldos promedio en dólares

Sucursal 2Saldos promedio en dólares

885 1095

850 955

915 1200

950 1195

800 925

750 950

865 805

1000 945

1050 875

935 1055

1025

975

544 12 IntroduccIón a la estadístIca no paramétrIca

Alfaomega estadística en el área de las ciencias sociales y administrativas – aragón

¿Indican estos datos que las poblaciones de los saldos promedio de cuentas de cheques de las dos sucursales son idénticas? Pruebe a un nivel de significancia del 5%.

Solución

Comenzaremos determinando los rangos combinados de los saldos promedio de cuentas de cheques para las dos sucursales, luego haremos lo mismo que el ejemplo anterior con el resto de la información, pero siguiendo el procedimiento descrito para muestras grandes obteniendo la siguiente tabla:

Sucursal 1Saldos promedio

en dólares

Rangos combinados

Sucursal 2 Saldos promedio

en dólares

Rangoscombinados

885 7 1095 20

850 4 955 14

915 8 1200 22

950 12.5 1195 21

800 2 925 9

750 1 950 12.5

865 5 805 3

1000 16 945 11

1050 18 875 6

935 10 1055 19

1025 17

975 15

Sn1 83.5 Sn2

169.5

Tabla 12.10 Anotación de rangos combinados de los saldos promedio en cuentas de cheques del ejemplo 12.11

Antes de continuar, es pertinente establecer los datos con que se cuenta hasta este momento del desarrollo de solución del problema.

n1 10, n2 12, n n1 n2 22, Sn1 83.5, Sn2

169.5 y Sn1 Sn2 253

Ahora es conveniente verificar si lo que se ha realizado hasta el momento es correcto. Para efectuar la verifica-ción del proceso de asignación de rangos combinados, entendiendo esto como que se van a considerar todos los datos como un todo y no muestra por muestra en forma separada, se planteó que se use la ecuación siguiente:

S Sn n 1

2n n1 2

( )+ =

+

Alfaomegaestadística en el área de las ciencias sociales y administrativas – aragón

12.5 pruebas de suma de rangos 545S S

n nn n1 2

1

2

83 5 169 522 22 1

2

25322 23

+ =+( )

+ =+( )

=

. .

(( )

=2

253 253

Ahora continuamos con los conceptos necesarios para realizar la prueba de hipótesis para la variable suma de rangos de Wilcoxon, bajo una aproximación a la distribución normal, se tendrá lo siguiente:

n n 12

10 23

25 23 115S

1n1

µ( ) ( )( )

=+

= = =

n n n 112

10 12 23

12230 15.166S

1 2n1

σ( ) ( )( )

=+

= = ≅

Por lo que el valor de prueba queda de la siguiente forma, con n1 n2:

ZS 83.5 115

15.1662.08p

n S

S

1 n1

n1

µ

σ=

−=

−≅ −

El valor crítico, al establecer una prueba de dos extremos, con un nivel de significación del 5%, es decir, .05 por tablas correspondientes a la normal estándar, se tiene que ZC 1.96.

En estos momentos ya es posible comenzar a dar respuesta a lo solicitado, es decir, la prueba de suma de rangos de Wilcoxon de dos extremos bajo la aproximación de la distribución normal estándar.

H0: Las poblaciones de los saldos promedio de cuentas de cheques de las dos sucursales son idénticas.

H1: Las poblaciones de los saldos promedio de cuentas de cheques de las dos sucursales son diferentes.

R.R.R.R. R. A.

α/2 = .025α/2 = .025

0�1�2�3�4 4321

1� α = 95%

�ZC= �1.96 ZC= 1.96

Figura 12.5 Regla de decisión gráfica en unidades estandarizadas

Aceptar H si Zp0 1 96 1 96− ≤ ≤. .

546 12 IntroduccIón a la estadístIca no paramétrIca

Alfaomega estadística en el área de las ciencias sociales y administrativas – aragón

Como el valor de prueba ya fue calculado previamente y es de Z 2.08p ≅ − entonces este valor no cae en el intervalo (1.96, 1.96) por ser 2.08 1.96 ⇒H0 se rechaza luego H1 se acepta.

Conclusión: Hay evidencia estadística no significativa que indica que las poblaciones de los saldos promedio de cuentas de cheques de las dos sucursales difieren.

12.5.2 Prueba U de Mann Whitney

La prueba se usa para constatar si dos muestras independientes han sido seleccionadas de la misma población o de poblaciones diferentes que poseen el mismo comportamiento, bajo una distribución de probabilidad, es decir, que sus medias son iguales. La prueba, a diferencia de la de Wilcoxon, no se fundamenta en muestras pareadas, es decir, muestras en las que se obtienen dos observaciones para el mismo individuo o fenómeno. Es otra de las pruebas no paramétricas poderosas, aunque es la alternativa a la prueba del signo, ya que con ella no se pierde información al utilizar la ordenación por rangos combinados. De nuevo, es la contraparte de la prueba paramétrica t de Student que permite evitar las suposiciones que exige la prueba paramétrica: varianzas iguales o distribuciones simétricas, y que la medición sea más vaga que la escala de intervalo. Si este último supuesto (la simetría) se elimina, la mediana debe reemplazar a la media como estadístico de prueba.

La prueba U de Mann Whitney tiene como finalidad contrastar la igualdad de las distribuciones de probabilidad de dos muestras independientes y determinar si éstas provienen o no de la misma población; por lo tanto, se comparan sus medias o bien sus medianas.

Procedimiento de la prueba

• Ordenar por rangos combinados todas las puntuaciones en orden creciente, es decir, hay que considerar de corrido ambos datos de las dos muestras.

• Indicar al lado de cada valor del rango un símbolo relacionado con la característica que corresponde a cada muestra, ya que es lo que se desea relacionar del problema a resolver y probar.

• Después, se obtiene la suma de rangos para cada muestra.

• El valor de prueba U resulta al usar los valores de los tamaños de las muestras n1 y n2 mientras la suma de rangos de los elementos de la primera o segunda muestras están denotadas por R1 y R2, respectivamente, según el tipo de prueba de un extremo o de dos extremos. Las expresiones siguientes establecen el valor de prueba respectivo.

U n nn n

R1 1 21 1

1

1

2= +

+( )− y U n n

n nR2 1 2

2 22

1

2= +

+( )−

• Para verificar la obtención de la suma de rangos y de los valores de prueba se debe cumplir la siguiente relación: U1 U2 n1 n2, que es un comportamiento análogo a la prueba de suma de rangos de Wilcoxon.

• El comportamiento de esta prueba U, cuando el tamaño de ambas muestras por separado es mayor de diez elementos, es decir, en lenguaje simbólico n1 10 y n2 10 (muestras grandes), es una aproximación por la distribución normal con media y error estándar establecidas por los siguientes modelos:

n n2U1 2µ =

n n n n 1

12U1 2 1 2σ

( )=

+ +

Alfaomegaestadística en el área de las ciencias sociales y administrativas – aragón

12.5 pruebas de suma de rangos 547

En consecuencia el valor de prueba queda de la siguiente forma:

ZU

pU

U

µσ

=−

• Establecimiento del nivel de significación para obtener el valor crítico o los valores críticos, lo que depende si es prueba de un extremo o de dos extremos.

• También, para el caso de muestras grandes, la prueba se realiza no en unidades estandarizadas, sino en datos originales, bajo el despeje de U en el cambio de variable Z, así como determinando límites inferior y superior, según el tipo de prueba que se necesite realizar de un extremo o de dos extremos, por lo que queda el modelo en lenguaje simbólico de la siguiente forma:

U ZI U C Uµ σ= − y U ZS U C Uµ σ= +

Además, la regla de decisión se prueba con el valor de U1 o U2.

Lo anterior es establecido conjuntamente con el tipo de prueba, como se muestra en la siguiente tabla:

H0 H1Valor deprueba

1 2 1 2 U1

1 2 1 2 U2

1 2 1 2 Ui

Tabla 12.11 Valor adecuado del estadístico en cada tipo de prueba y en datos originales

El dato Ui es el valor adecuado, en algunos casos se elige el más pequeño en cantidad de estos dos valores de prueba U1 y U2.

• Si n1 y n2 son extrictamente menores a 10, en lenguaje simbólico n1 10 y n2 10, es decir, se consideran como muestras pequeñas, los valores críticos de esta prueba U deberán buscarse en la tabla de T correspondiente (véase anexos), donde n1 indica el tamaño de la muestra cuya suma de rangos se emplea en la prueba, es decir, R1 o R2 y el valor de Ti inferior se obtiene directamente de la tabla, luego con su valor se obtiene el deTs superior a partir del modelo Ts n1 (n1 n2 1) Ti.

• Ni Ti ni Ts están en la región de rechazo de la regla de decisión para la hipótesis nula, entonces si las poblaciones son idénticas se debe rechazar sólo cuando la Ri de prueba sea estrictamente menor que Ti o estrictamente mayor que Ts El subíndice “i” indica que la selección correspondiente está de acuerdo con lo que se éste probando; por ejemplo, la muestra indicada como la primera tendrá el subíndice “1”, aunque se localice en la información como la segunda.

Ejemplo 12.12Supóngase que la junta de gobierno de una universidad desea demostrar que las puntuaciones promedio que los estudiantes obtuvieron en una prueba de aptitudes académicas, aplicada por un organismo externo, en dos ramas de todas las que ofrece en las diversas carreras que se imparten en esa casa de estudios, son diferentes. La junta conserva bases de datos con los resultados de esas pruebas de los alumnos en todas las ramas de su sistema educativo. Se seleccionan aleatoriamente dos muestraa de igual tamaño de 15 alumnos pertenecientes cada una a cada rama por analizar, los datos que se obtuvieron se presentan en la tabla siguiente:

548 12 IntroduccIón a la estadístIca no paramétrIca

Alfaomega estadística en el área de las ciencias sociales y administrativas – aragón

Rama “A” 1000 1100 800 750 1300 950 1050 1250 1400 850 1150 1200 1500 600 775

Rama “S” 920 1120 830 1360 650 725 890 1600 900 1140 1550 550 1240 925 500

Utilice un nivel de significación del 10%.

Solución

Comenzaremos por identificar que el material teórico a utilizar, para resolver lo planteado, es la prueba U de Mann Whitney para muestras grandes. Se tendría, en lenguaje simbólico,n1 y n2 10. Luego hay que determinar las puntuaciones, los rangos en orden creciente de ambas muestras mezcladas en una sola, por último, a que rama pertenecen, lo cual se establece en la siguiente tabla:

Puntuación Rango Rama Puntuación Rango Rama

500 1 S 1 000 16 A

550 2 S 1 050 17 A

600 3 A 1 100 18 A

650 4 S 1 120 19 S

725 5 S 1 140 20 S

750 6 A 1 150 21 A

775 7 A 1 200 22 A

800 8 A 1 240 23 S

830 9 S 1 250 24 A

850 10 A 1 300 25 A

890 11 S 1 360 26 S

900 12 S 1 400 27 A

920 13 S 1 500 28 A

925 14 S 1 550 29 S

950 15 A 1 600 30 S

Tabla 12.12 Puntuaciones de la prueba de aptitudes académicas clasificadas en orden creciente, así como rangos combinados y rama a la que pertenecen, del ejemplo 12.12

Para continuar con el procedimiento ya descrito, se retorna a la separación de las dos muestras con sus respec-tivos rangos combinados, para así obtener las sumas de los rangos combinados, denotados respectivamente como R1 y R2, lo cual se indica en la siguiente tabla:

Alfaomegaestadística en el área de las ciencias sociales y administrativas – aragón

12.5 pruebas de suma de rangos 549

Rama “A”n1 15

Rango combinado

Rama “S”n2 = 15

Rango combinado

1 000 16 920 13

1 100 18 1 120 19

800 8 830 9

750 6 1 360 26

1 300 25 650 4

950 15 725 5

1 050 17 890 11

1 250 24 1600 30

1 400 27 900 12

850 10 1 140 20

1 150 21 1550 29

1 200 22 550 2

1 500 28 1 240 23

600 3 925 14

775 7 500 1

R1 247 R2 218

Tabla 12.13 Anotación de rangos combinados y suma de estos para el ejemplo 12.12

Ahora se procederá a determinar los conceptos necesarios para realizar la prueba de hipótesis para la variable “puntuaciones de una prueba estándar en dos ramas diferentes”, bajo una aproximación por la distribución normal. Con los datos ya obtenidos en las tablas auxiliares anteriores, se tiene lo siguiente:

n1 n2 15, R1 247 y R2 218

µU

n n= =

( )= =1 2

2

15 15

22252

112 5.

σU

n n n n=

+ +( )=

( )( ) + +( )=

(1 2 1 2 1

12

15 15 15 15 1

12

225))( )= = ≅

31

12697512

581 25 24 109. .

Para el valor de prueba U se determinan los valores de U1 y U2, bajo la teoría se considera para U el de menor valor.

U n nn n 1

2R 15 15

15 15 12

247 225 120 247 981 21 1

1

( ) ( )( ) ( )= +

+− = +

+− = + − =

U n nn n

R2 1 22 2

2

1

2225 120 218 127= +

+( )− = + − =

Ahora es el momento de verificar si los rangos combinados y sus sumas son correctas, al cumplirse lo establecido en la teoría, con que.

U U n n1 2 1 2

127 98 15 15

225 225

+ =

+ = ( )( )=

550 12 IntroduccIón a la estadístIca no paramétrIca

Alfaomega estadística en el área de las ciencias sociales y administrativas – aragón

Los valores críticos, al establecer una prueba de dos extremos, con un nivel de significación del 10%, es decir, .10, por tablas correspondientes a la normal estándar se tiene que ZC 1.645.

En estos momentos ya es posible comenzar a dar respuesta a lo solicitado, es decir, la prueba de suma de rangos de U Mann Whitney de dos extremos bajo la aproximación de la distribución normal estándar.

Al seguir los pasos de toda prueba de hipótesis, se tiene el algoritmo siguiente:La hipótesis nula es que ambas muestras tienen igual promedio de puntuaciones en la prueba. La hipótesis alternativa es que las puntuaciones de las muestras no provienen de poblaciones con promedios idénticos. En lenguaje simbólico, y con puntuaciones promedio, sería lo siguiente:

H :

H :

0 U U

1 U U

1 2

1 2

µ µ

µ µ

=

0�1�2�3�4 4321

R. A.

1 � α = 90%

R.R�/2 � .05

R.R�/2 � .05

cZ � 1.645c�Z � 1.645

Figura 12.6 Regla de decisión gráfica en unidades estandarizadas

Aceptar H si 1.645 Z 1.6450 p− ≤ ≤

Cálculo del valor de prueba por el modelo correspondiente.

ZU

pU

U

=−

= − = − ≅ −µ

σ98 112 5

24 10914 5

24 109601

..

..

.

Ahora como Zp .602 se localiza en el intervalo (1.645, 1.645), entonces cae en la región de aceptación ⇒H0 se acepta.

Conclusión: La información proporciona evidencia estadística significativa para establecer que ambas muestras tienen igual promedio de puntuaciones en la prueba o que fueron extraídas de poblaciones idénticas.

Ejemplo 12.13Supondremos que se toma una muestra aleatoria de siete trabajadores eventuales del sector salud y otra mues-tra aleatoria de ocho trabajadores eventuales del sector educativo en diferentes lugares del país. A cada uno de los elementos de las muestras se les aplicó un instrumento de investigación para recabar la información en relación con sus ingresos promedio por hora trabajada. Los datos obtenidos se indican en la siguiente tabla:

Alfaomegaestadística en el área de las ciencias sociales y administrativas – aragón

12.5 pruebas de suma de rangos 551

Ingreso promedio por horaSector salud

Ingreso promedio por horaSector educativo

$20.50 $26.00

19.00 24.00

22.00 25.00

18.00 22.40

21.00 25.80

22.50 26.70

20.00 24.60

23.00

¿Hay diferencia del ingreso promedio por hora entre trabajadores del sector salud y el sector educativo? Use un nivel de significación del 0.05

Solución

Comenzaremos por identificar que el material teórico a utilizar para resolver lo planteado es la prueba U de Mann Whitney para muestras pequeñas, es decir, en lenguaje simbólico, n1 y n2 10. Luego hay que determinar los ingresos promedio por hora y los rangos en orden creciente de ambas muestras mezcladas en una sola, lo cual se establece en la siguiente tabla:

Ingreso por hora Rango

$18.00 1

19.00 2

20.00 3

20.50 4

21.00 5

22.00 6

22.40 7

22.50 8

23.00 9

24.00 10

24.60 11

25.00 12

25.80 13

26.00 14

26.70 15

Tabla 12.14 Ingresos promedio por hora de todos los 15 trabajadores y rangos combinados en orden creciente del ejemplo 12.13

552 12 IntroduccIón a la estadístIca no paramétrIca

Alfaomega estadística en el área de las ciencias sociales y administrativas – aragón

Si continuamos con el procedimiento descrito en la teoría, retornaremos a la separación de las dos muestras con sus respectivos rangos combinados, para así obtener las sumas de los mismos, denotados respectivamente como R1 y R2, lo cual se indica en la siguiente tabla:

Sector salud

n1 7

Rango combinado

Sector educativo

n2 8

Rango combinado

$20.50 4 $26.00 14

19.00 2 24.00 10

22.00 6 25.00 12

18.00 1 22.40 7

21.00 5 25.80 13

22.50 8 26.70 15

20.00 3 24.60 11

23.00 9

R1 29 R2 91

Tabla 12.15 Anotación de rangos combinados y suma de estos para cada muestra del ejemplo 12.13

Ahora se procederá a determinar los conceptos necesarios para realizar la prueba de hipótesis para la variable “ingreso promedio por hora de trabajadores en los sectores salud y educativo”, bajo la tabla T correspondiente para la prueba U Mann Whitney, para muestras pequeñas (véase anexos). Con los datos obtenidos en las tablas auxiliares anteriores, se tiene lo siguiente:

n1 7, n2 8, R1 29 y R2 91

Para el estadístico U, se tiene:

U n nn n 1

2R 7 8

7 7 12

29 56 28 29 551 1 21 1

1

( ) ( )( ) ( )= +

+− = +

+− = + − =

U n nn n

R2 1 22 2

2

1

27 8

8 8 1

229 56 3= +

+( )− = ( )( ) + +( )

− = + 66 91 1− =

Ahora es el momento de verificar si los rangos combinados y sus sumas son correctas, al cumplirse lo establecido en la teoría, con que U U n n1 2 1 2+ = . Luego se tiene que.

U U n n

55 1 7 8

56 56

1 2 1 2

( )( )+ =

+ =

=

Alfaomegaestadística en el área de las ciencias sociales y administrativas – aragón

11.3 InferencIas en regresIón y correlacIón 553

Por último, y antes de iniciar la prueba, se determinarán los valores críticos de la misma a partir de unas tablas elaboradas por estadísticos para muestras pequeñas o estrictamente menores de diez elementos cada una.

Para la prueba U de suma de rangos, como ya se mencionó, en este caso son para obtener valores de T y no valores de probabilidad p. El uso de tales tablas es a partir de la consideración de varios elementos, uno en la columna externa, que es el tamaño de la muestra pequeña n1, y en el renglón superior el tamaño de la muestra más grande de las dos, que en este caso es n2; ambas tienen valores del 2 hasta 10.

Por último, un recuadro en el extremo superior izquierdo, donde se indica el nivel de significación (en las tablas de los anexos sólo se cuenta con cuadros para dos valores de ) en seguida se procede a marcar una línea ho-rizontal a partir del valor de n1,que se va a interceptar con la línea vertical que corresponde al valor de n2. Este procedimiento quedará visualizado con un fragmento de dicha tabla, para el ejemplo en cuestión, seguida con los datos ya enunciados, pero que remarcaremos aquí. Prueba de dos extremos, nivel de significación del .05, es decir, 5%, n1 7 y n2 8.

5%n2

6 7 8 9

n1

19 21 22 23

6 27 28 30 32

7 35 37 39 41

8 45 47 50 52

Tabla 12.16 Fragmento de la tabla para obtener valores críticos de la prueba de suma de rangos de U Mann Whitney para muestras pequeñas

Si continuamos con los elementos necesarios para realizar la prueba de dos extremos, tendremos los valores críticos con un nivel de significación del 5%; además, con el uso de la tabla 12.16 (que es un fragmento de las tablas correspondientes) se obtendrá el valor crítico inferior, que es Ti 39. Ahora con ese valor determinaremos TS, valor representado por T n n n TS i= + +( )− = + +( )− =1 1 2 1 7 7 8 1 39 73

En estos momentos ya es posible comenzar a dar respuesta a lo solicitado, es decir, la prueba de suma de rangos de U Mann Whitney de dos extremos, bajo la tabla de T para muestras pequeñas.

Si seguimos los pasos de toda prueba de hipótesis, obtendremos el algoritmo siguiente:

La hipótesis nula es que ambas muestras tienen igual promedio de ingresos por hora. La hipótesis alternativa es que el ingreso promedio por hora de los trabajadores en el sector salud (µU1

) es diferente al ingreso promedio por hora de los trabajadores en el sector educativo (µU2

).

En lenguaje simbólico, seria así:H :

H :

0 U U

1 U U

1 2

1 2

µ µ

µ µ

=

554 12 IntroduccIón a la estadístIca no paramétrIca

Alfaomega estadística en el área de las ciencias sociales y administrativas – aragón

La regla de decisión, por ser prueba de dos extremos, se establece simbólicamente como:

Aceptar H0 si Ti R1 o R2 TS para el ejemplo 39 R1 o R2 73

Identifiquemos que tanto el valor R1 29 como el valor R2 91 no se encuentran dentro del intervalo, que es la región de aceptación, es decir, no es válido que 39 29 73, ni que 39 91 73 ⇒ H0 se rechaza, luego H1 se acepta.

Conclusión: Hay evidencia estadística significativa de que el ingreso promedio por hora de los trabajadores en el sector salud es diferente al ingreso promedio por hora del trabajador en el sector educativo.

12.6 Prueba de Kolmogorov–Smirnov

La prueba no paramétrica de Kolmogorov–Smirnov es la contraparte de la distribución ji cuadrada, para el caso de bondad de ajuste en las pruebas paramétricas, ya que se desea probar que no hay diferencia en la distribu-ción de las frecuencias observadas ni en la distribución de frecuencias teóricas, esperadas o estimadas. Esto es, lo que interesa es el grado de ajuste entre la distribución de un conjunto de valores de una muestra, que son los puntajes observados, y alguna distribución teórica especifica. Asimismo, establece si razonablemente se logra plantear que los puntajes en la muestra provengan de una población con la distribución teórica a probar. La prueba no paramétrica de Kolmogorov – Smirnov es muy fácil de usar, puesto que no requiere que los datos sean agrupados en determinada forma.

El estadístico de la prueba no paramétrica de Kolmogorov – Smirnov tiene una distribución de probabilidad que depende del tamaño de la muestra “n” y será denotado como Dks. Más aún, la distribución Dks es independiente de la distribución de frecuencias teóricas o esperadas, por lo que éste se utiliza cuando se desea ver cuánto se acerca la distribución de frecuencias observadas a la distribución de frecuencias teóricas.

Al aplicar la prueba de Kolmogorov – Smirnov hacemos uso de una distribución de frecuencias acumuladas relativas para cada muestra de frecuencias, como son las observadas (fear)y las estimadas (fear), con los mismos intervalos para ambas distribuciones.

Procedimiento de la prueba

• Ordenar los datos en forma creciente con sus respectivas frecuencias observadas.

• Indicar al lado de cada valor las frecuencias teóricas correspondientes a la descripción del com-portamiento que se desea probar sigue la información de la muestra, ya que es lo que se desea ajustar del problema a resolver.

• El valor de prueba de esta teoría de Kolmogorov – Smirnov se establece o define como la máxima desviación absoluta entre la frecuencia esperada acumulada relativa y la frecuencia observada acumulada relativa. En lenguaje simbólico, se establecería la expresión siguiente:

Dks Máxima|fear foar|

Alfaomegaestadística en el área de las ciencias sociales y administrativas – aragón

12.6 prueba de Kolmogorov–smIrnov 555

donde fear es la frecuencia esperada, o teórica acumulada relativa, y foar es la frecuencia observada acumulada relativa, es decir, es el punto en el que las dos distribuciones, la teórica y la observada, muestran la mayor divergencia.

• El comportamiento de esta prueba va de acuerdo con la distribución que se desea probar, misma que siguen los datos recopilados en una sola muestra.

• Establecimiento del nivel de significación para obtener el valor crítico DC con tablas correspon-dientes a una prueba de Kolmogorov – Smirnov para una muestra.

• Siempre es una prueba de un extremo derecho, como la prueba paramétrica Ji cuadrada, pero sólo se ha construido una tabla que es para dos extremos, por lo que será en la que nos apoyaremos.

Ejemplo 12.14Una compañía telefónica cuenta con un equipo automático que se usa para intercambios. Lleva un control de esos intercambios llamados “emisores”, con los que en un determinado momento se seleccionan 3754 emisiones, con la finalidad de planear la inversión de capital. El jefe del departamento de presupuesto en la compañía afirma que el patrón de uso sigue una distribución de Poisson, con un promedio de emisiones recibidas o trabajadas de 8.8. Él quiere establecer su afirmación como una hipótesis y probarla a un nivel de significación del 1%, para lo que utiliza una prueba no paramétrica como es la de Kolmogorov – Smirnov. La recopilación de la información de la muestra se indica en la siguiente tabla:

Númerosocupados

Frecuenciaobservada

0 0

1 4

2 15

3 25

4 56

5 112

6 196

7 277

8 379

9 417

10 462

11 432

12 414

13 357

14 220

15 144

16 110

17 56

18 44

19 15

20 8

21 7

22 4

556 12 IntroduccIón a la estadístIca no paramétrIca

Alfaomega estadística en el área de las ciencias sociales y administrativas – aragón

Solución

Comenzaremos por determinar las frecuencias observadas acumuladas y seguiremos con las frecuencias observadas acumuladas relativas fear.

Númerosocupados

Frecuenciaobservada

Frecuenciaobservadaacumulada

Frecuenciaobservadaacumulada

relativa

0 0 0 .0000

1 4 4 .0011

2 15 19 .0051

3 25 44 .0117

4 56 100 .0266

5 112 212 .0565

6 196 408 .1087

7 277 685 .1825

8 379 1 064 .2834

9 417 1 481 .3945

10 462 1 943 .5176

11 432 2 375 .6327

12 414 2 789 .7429

13 357 3 146 .8380

14 220 3 366 .8966

15 144 3 510 .9350

16 110 3 620 .9643

17 56 3 676 .9792

18 44 3 720 .9909

19 15 3 735 .9949

20 8 3 743 .9971

21 7 3 750 .9989

22 4 3 754 1.0000

Tabla 12.17 Emisiones del equipo y las frecuencias observadas acumuladas relativas foar, que pertenecen al ejemplo 12.14

Alfaomegaestadística en el área de las ciencias sociales y administrativas – aragón

12.6 prueba de Kolmogorov–smIrnov 557

Ahora, para determinar las frecuencias teóricas, se tienen dos alternativas; la que es la más rápida y consiste en usar las tablas de la distribución de Poisson para 8.8 y la otra que es cuando no se cuenta con tablas y hay

que apoyarse en una calculadora para obtenerla bajo el modelo de la distribución de Poisson en forma analítica

P X xe

x!

xλ( )= =λ−

, con todos los casos de la variable posibles para obtener probabilidades con aproximaciones

a cuatro decimales significativos.

Númerosocupados

Frecuenciaesperadarelativa

Frecuenciaesperadarelativa

acumulada

0 .0002 .0002

1 .0013 .0015

2 .0058 .0073

3 .0171 .0244

4 .0377 .0621

5 .0663 .1284

6 .0972 .2256

7 .1222 .3478

8 .1344 .4822

9 .1315 .6137

10 .1157 .7294

11 .0925 .8219

12 .0679 .8898

13 .0459 .9357

14 .0289 .9646

15 .0169 .9815

16 .0093 .9908

17 .0048 .9956

18 .0024 .9980

19 .0011 .9991

20 .0005 .9996

21 .0002 .9998

22 .0001 .9999

Tabla 12.18 Emisiones del equipo y las frecuencias teóricas esperadas relativas acumuladas fear con = 8.8 del ejemplo 12.14

558 12 IntroduccIón a la estadístIca no paramétrIca

Alfaomega estadística en el área de las ciencias sociales y administrativas – aragón

Al comparar estas frecuencias teóricas con las anteriores, se observa el grado de diferencias que hay entre ellas, para así llegar a obtener sus desviaciones absolutas, que son las diferencias entre las frecuencias espe-radas acumuladas relativas y las frecuencias observadas acumuladas relativas, es decir, en lenguaje simbólico: |fear foar| como se enuncia en la siguiente tabla:

Númerosocupados

Frecuenciaobservada

Frecuenciaobservadaacumulada

Frecuenciaobservadaacumulada

relativafoar

Frecuenciaesperadarelativa

Frecuenciaesperadarelativa

acumuladafear

Desviaciones absolutas

|fear foar|

0 0 0 .0000 .0002 .0002 .0002

1 4 4 .0011 .0013 .0015 .0003

2 15 19 .0051 .0058 .0073 .0022

3 25 44 .0117 .0171 .0244 .0127

4 56 100 .0266 .0377 .0621 .0355

5 112 212 .0565 .0663 .1284 .0719

6 196 408 .1087 .0972 .2256 .1169

7 277 685 .1825 .1222 .3478 .1653

8 379 1 064 .2834 .1344 .4822 .1988

9 417 1 481 .3945 .1315 .6137 .2192

10 462 1 943 .5176 .1157 .7294 .2118

11 432 2 375 .6327 .0925 .8219 .1892

12 414 2 789 .7429 .0679 .8898 .1469

13 357 3 146 .8380 .0459 .9357 .0977

14 220 3 366 .8966 .0289 .9646 .0680

15 144 3 510 .9350 .0169 .9815 .0465

16 110 3 620 .9643 .0093 .9908 .0265

17 56 3 676 .9792 .0048 .9956 .0164

18 44 3 720 .9909 .0024 .9980 .0071

19 15 3 735 .9949 .0011 .9991 0042

20 8 3 743 .9971 .0005 .9996 .0025

21 7 3 750 .9989 .0002 .9998 .0009

22 4 3 754 1.0000 .0001 .9999 .0001

Tabla 12.19 emisiones del equipo, frecuencias teóricas relativas acumuladas fear, frecuencias observadas acumuladas relativas foar y desviaciones absolutas de ellas, del ejemplo 11.24

Nota: recordemos que acumulada relativa es lo mismo que relativa acumulada.

Alfaomegaestadística en el área de las ciencias sociales y administrativas – aragón

12.6 prueba de Kolmogorov–smIrnov 559

Los valores críticos, con el establecimiento de una prueba de dos extremos y un nivel de significación del 1%,

es decir, 2 .005α = por tablas correspondientes a la prueba de Kolmogorov – Smirnov para una muestra, serán

determinados por el cruce de un renglón perteneciente al tamaño de la muestra, que en este caso es n 3 754, y una columna con el valor del nivel de significación, que en este caso es .01, se muestra todo lo descrito en un fragmento de dicha tabla.

Tamañode muestra

n

Nivel de significación

.10 .05 .01

16 .295 .328 .392

17 .286 .318 .381

18 .278 .309 .371

19 .272 .301 .363

20 .264 .294 .356

25 .24 .27 .32

30 .22 .24 .29

35 .21 .23 .27

Más de 351.22

n

1.36

n1.63

n

Tabla 12.20 Fragmento de la tabla para obtener valores críticos de la prueba de Kolmogorov – Smirnov para una muestra

En consecuencia, se tiene que DnC = = =1 63 1 63

37540266

. ..

En estos momentos ya es posible comenzar a dar respuesta a lo solicitado, es decir, usar la aplicación de la prueba de Kolmogorov – Smirnov para una muestra.

Si seguimos los pasos de toda prueba de hipótesis, se tendrá el algoritmo siguiente:

La hipótesis nula: Una distribución de Poisson con 8.8 es una buena descripción del patrón de equipo para el intercambio telefónico. La hipótesis alternativa: Una distribución de Poisson con 8.8 no es una buena descripción del patrón de equipo para el intercambio telefónico.

560 12 IntroduccIón a la estadístIca no paramétrIca

Alfaomega estadística en el área de las ciencias sociales y administrativas – aragón

α/2=.005R.R.

α/2=.005R.R.

−D =-.0266c D =.0266c

R.A.

1 − α = 99%

Figura 12.7 Regla de decisión gráfica en unidades de la tabla correspondiente a la prueba de Kolmogorov – Smirnov

Aceptar H si Dks0 0266 0266− ≤ ≤. .

El cálculo del valor de prueba, como está dado por el modelo correspondiente, debe ser la máxima desviación absoluta, por lo que se localiza en la última tabla que contiene las desviaciones absolutas, de donde:D Máxima fe foks ar ar= − = .2192

Ahora como Dks .2192 se localiza fuera del intervalo (.0266, .0266), entonces cae en la región de rechazo ⇒H0 también se rechaza, pero H1 se acepta.Conclusión: La información proporciona evidencia estadística significativa para establecer que una distribución de Poisson, con una media de 8.8 emisiones, no es una buena descripción del comportamiento de uso por parte del equipo para el intercambio telefónico.

Ejemplo 12.15Un inspector de una delegación política en la ciudad de México investiga el cumplimiento, por parte de los propietarios de condominios, seis puntos específicos del régimen condominal. El inspector desea probar, al elegir una muestra de 200 condominios en la delegación en estudio, que el número de violaciones reales por condominio es una variable aleatoria que se comporta según una distribución binomial. La muestra arrojó los resultados presentados en la siguiente tabla:

Número de violacionesposibles

Número de condóminos

0 10

1 31

2 45

3 70

4 20

5 15

6 9

Ayude al inspector y realice la prueba correspondiente con un nivel de significancia del 5%.

Alfaomegaestadística en el área de las ciencias sociales y administrativas – aragón

12.6 prueba de Kolmogorov–smIrnov 561

Solución

Comenzaremos por determinar las frecuencias observadas acumuladas y posteriormente las frecuencias obser-vadas acumuladas relativas foar en una primera tabla.

Número deviolaciones

posibles

Frecuencia observada

Frecuencia observada acumulada

Frecuencia observada acumulada

relativa

0 10 10 .0500

1 31 41 .2050

2 45 86 .4300

3 70 156 .7800

4 20 176 .8800

5 15 191 .9550

6 9 200 1.0000

Tabla 12.21 Número de condóminos y frecuencias observadas acumuladas relativas foar que pertenecen al ejemplo 12.15

Nota: es de hacer notar que para obtener foar se debe tomar el tamaño de la muestra a veces denotado por n.

Ahora, para determinar las frecuencias teóricas, contamos con dos alternativas, una que es la más rápida, consistente en usar las tablas de la distribución binomial para n 6 y la probabilidad de éxito que en estos momentos se desconoce, pero se obtendrá en seguida, y la otra, que es cuando no hay tablas se debe apoyar en una calculadora con la finalidad de obtener del modelo de la distribución binomial las probabilidades en forma analítica: P X x p qx

n x n x( )( )= = − , donde en todos los valores de la variable las probabilidades deben ir con aproximaciones a cuatro decimales significativos.

Nota: bajo la Distribución Binominal el simbolo n denota el número de ensayos de...

Para determinar el valor de la probabilidad de éxito “p”, nos apoyamos en el concepto de la media para esta teoría de una distribución de probabilidad binomial establecida por n p; retomando de la estadística descriptiva, la media muestral se define como el promedio de todos los valores de la variable. Así, al tener tales valores algebraicamente se despeja la probabilidad de éxito. Para lo anterior, nos apoyaremos en una tabla donde se compactará la información, que será enunciada en seguida.

562 12 IntroduccIón a la estadístIca no paramétrIca

Alfaomega estadística en el área de las ciencias sociales y administrativas – aragón

Número de violaciones

posiblesX

Número de condóminos

fi

fiX

0 10 0

1 31 31

2 45 90

3 70 210

4 20 80

5 15 75

6 9 54

f 200i∑ =

f X 540i∑ =

Tabla 12.22 Cálculos para obtener el valor de “p” con los datos del ejemplo 12.15

Se establece que x = = = =∑∑

∑f X

f

f Xi

i

i

Ν540200

2 7. ; así por estimación puntual 2.7 y como np ⇒ np 2.7 de

donde se despeja a p para obtener,donde p2.7n

2.76

.45= = = .

Remarcando con este parámetro se buscan las probabilidades para los valores de la variable en tablas o se obtienen con el modelo en forma analítica para establecerlos en la siguiente tabla, conjuntamente con sus acumulamientos.

Número deviolaciones

posibles

Frecuenciaesperadarelativa

Frecuenciaesperadarelativa

acumulada

0 .0277 .0277

1 .1359 .1636

2 .2780 .4416

3 .3032 .7448

4 .1861 .9309

5 .0609 .9918

6 .0082 1.0000

Tabla 12.23 Número de condóminos y frecuencias teóricas acumuladas relativas fear que pertenecen al ejemplo 12.15

Al comparar estas frecuencias teóricas con las observadas, se logra identificar el grado de diferencias que hay entre ellas y así llegar a obtener sus desviaciones absolutas, que son las diferencias entre las frecuencias

Alfaomegaestadística en el área de las ciencias sociales y administrativas – aragón

12.6 prueba de Kolmogorov–smIrnov 563

esperadas acumuladas relativas y las frecuencias observadas acumuladas relativas, es decir, en lenguaje simbólico tendríamos: |fear foar| como se enuncia en la siguiente tabla:

Número deviolaciones

posibles

Frecuenciaobservada

Frecuenciaobservadaacumulada

Frecuenciaobservadaacumulada

relativafoar

Frecuenciaesperadarelativa

Frecuencia esperada relativa

acumulada fear

Desviaciones absolutas

|fear foar|

0 10 10 .0500 .0277 .0277 .0223

1 31 41 .2050 .1359 .1636 .0414

2 45 86 .4300 .2780 .4416 .0116

3 70 156 .7800 .3032 .7448 .0352

4 20 176 .8800 .1861 .9309 .0509

5 15 191 .9550 .0609 .9918 .0368

6 9 200 1.0000 .0082 1.0000 0

Tabla 12.24 Número de condóminos, frecuencias teóricas o esperadas relativas acumuladas fear frecuencias observadas acumuladas relativas foar y desviaciones absolutas de ellas del ejemplo 12.15

La obtención de los valores críticos estableciendo una prueba de dos extremos, con un nivel de significación del 5%, es decir, ⁄ 2 .025, por tablas correspondientes a la prueba de Kolmogorov – Smirnov para una muestra, serán determinados por el cruce de un renglón perteneciente al tamaño de la muestra, en este caso n 200, y una columna con el valor del nivel de significación, en este caso .05, se muestra todo lo descrito en un fragmento de dicha tabla.

Tamañode muestra

n

Nivel de significación

.10 .05 .01

16 .295 .328 .392

17 .286 .318 .381

18 .278 .309 .371

19 .272 .301 .363

20 .264 .294 .356

25 .24 .27 .32

30 .22 .24 .29

35 .21 .23 .27

Más de 351.22

n

1.36

n

1.63

n

Tabla 12.25 Fragmento de la tabla para obtener valores críticos de la prueba de Kolmogorov – Smirnov para una muestra

564 12 IntroduccIón a la estadístIca no paramétrIca

Alfaomega estadística en el área de las ciencias sociales y administrativas – aragón

En consecuencia, se tiene que DnC = = =1 36 1 36

2000962

. ..

En estos momentos ya es posible comenzar a dar respuesta a lo solicitado, es decir, usaremos la aplicación de la prueba de Kolmogorov– Smirnov para obtener una muestra.

Si seguimos los pasos de toda prueba de hipótesis, obtendremos el algoritmo siguiente:

La hipótesis nula: El número de violaciones por condominio en la población de todos éstos en una cierta dele-gación está distribuido en forma binomial, con una probabilidad de éxito de 45% en cualquier ensayo.La hipótesis alternativa: Una distribución binomial con n 6 y p .45 no es una buena descripción del patrón del número de violaciones por condominio en la población de todos éstos en una cierta delegación.

α/2=.025R.R. α/2=.025

R.R.

-D =-.0962c D =.0962c

R.A.1 − α = 95%

Figura 12.8 Regla de decisión gráfica en unidades de la tabla correspondiente a la prueba de Kolmogorov – Smirnov

Acepta H si Dks0 0962 0962− ≤ ≤. .

El cálculo del valor de prueba como está dado por el modelo correspondiente, de ser la máxima desviación absoluta, luego se localiza en la última tabla que contiene las desviaciones absolutas, por lo que se obtiene lo siguiente:

D Máxima f fks ear oar= − = .0509

Ahora como Dks .0509 se localiza dentro del intervalo (.0962, .0962), entonces cae en la región de aceptación ⇒H0 se acepta.Conclusión: La información proporciona evidencia estadística no significativa para establecer que una distribución binomial con n 6 y p .45 es una buena descripción del patrón del número de violaciones por condominio en la población de todos éstos en una cierta delegación.

Ejemplo 12.16El departamento de admisión de un centro educativo virtual analiza el tiempo requerido que un aspirante ne-cesita para inscribirse al examen de admisión en una plataforma. Se registran los tiempos en minutos de 164 aspirantes y se cree que el comportamiento de los tiempos sigue una Distribución Normal. Los datos obtenidos en la muestra se indican en la siguiente tabla:

Alfaomegaestadística en el área de las ciencias sociales y administrativas – aragón

12.6 prueba de Kolmogorov–smIrnov 565

Tiempo deinscripciónen minutos

Número deaspirantes

22 8

23 13

24 19

25 26

26 31

27 25

28 19

29 14

30 9

A un nivel de significación del 5%, realice la prueba correspondiente.

Solución

Primeramente se determinan las frecuencias observadas acumuladas y luego las frecuencias observadas acu-muladas relativas foar en una primera tabla.

Tiempo deinscripciónen minutos

Frecuenciaobservada

Frecuenciaobservadaacumulada

Frecuenciaobservadaacumulada

relativa

22 8 8 .0488

23 13 21 .1280

24 19 40 .2439

25 26 66 .4024

26 31 97 .5915

27 25 122 .7439

28 19 141 .8598

29 14 155 .9451

30 9 164 1.0000

Tabla 12.26 Tiempo para inscribirse y frecuencias observadas acumuladas relativas foar que pertenecen al ejemplo 12.16

Para determinar las frecuencias teóricas se tiene una sola alternativa rápida, consistente en usar las tablas de la distribución normal estándar para los parámetros y , que en estos momentos se desconocen, pero se

566 12 IntroduccIón a la estadístIca no paramétrIca

Alfaomega estadística en el área de las ciencias sociales y administrativas – aragón

obtendrán en seguida, ya que la opción analítica requiere una computadora en lugar de la calculadora, así como utilizar paquetería, por ejemplo de Excel, donde todos los valores de la variable y sus probabilidades deben ir con aproximaciones a cuatro decimales significativos.

Para determinar el valor de la media y la desviación estándar poblacionales usaremos los estadísticos, con modelos de estadística descriptiva, ya vistos en los primeros capítulos de este libro, así como la estimación puntual, es decir, nos apoyamos en el concepto de la media, definida como el promedio de todos los valores de la variable, y de la desviación estándar, definida como la raíz positiva del promedio de las desviaciones al cuadrado de los datos hacia la media. Para lo anterior, nos apoyaremos en una tabla donde se compactará la información, que será enunciada en seguida.

Tiempo deinscripciónen minutos

X

Número deAspirantes

fi

fiX fi(x )2

22 8 176 130.5728

23 13 299 120.1480

24 19 456 79.0704

25 26 650 28.1216

26 31 806 0.0496

27 25 675 23.0400

28 19 532 72.9904

29 14 406 122.6624

30 9 270 141.1344

∑fi164 ∑fiX4270 ∑717.7824

Tabla 12.27 Cálculos para obtener el valor de µ con los datos del ejemplo 12.16

Ahora se establece que x = = = ≅∑∑

∑f X

f

f X

ni

i

i 4270164

26 04. ⇒ 26 .04 y para a par t i r de

s =−( )

= ≅∑ f x

ni µ 717 7824

1642 092

.. y por estimación puntual ≅ 2.092, parámetros con los que se calculan las

probabilidades para los valores de la variable con tablas y las operaciones respectivas, como se muestra en seguida:

P X P Z P Z≤( ) = ≤ −

= ≤ −( ) =22

22 26 042 092

1 93.

.. .00268

P 22 X 23 P 1.93 Z 1.45 .0467( ) ( )≤ ≤ = − ≤ ≤ − =

P 23 X 24 P 1.45 Z .97 .0925( ) ( )≤ ≤ = − ≤ ≤ − =

P 24 X 25 P .97 Z .50 .1425( ) ( )≤ ≤ = − ≤ ≤ − =

Alfaomegaestadística en el área de las ciencias sociales y administrativas – aragón

12.6 prueba de Kolmogorov–smIrnov 567

P 25 X 26 P .50 Z .02 .1835( ) ( )≤ ≤ = − ≤ ≤ − =

P X P Z26 27 02 46 1852≤ ≤( ) = − ≤ ≤( ) =. . .

P 27 X 28 P .46 Z .93 .1466( ) ( )≤ ≤ = ≤ ≤ =

P X P Z28 29 93 1 41 0969≤ ≤( ) = ≤ ≤( ) =. . .

P X P Z29 30 1 41 1 89 0499≤ ≤( ) = ≤ ≤( ) =. . .

P X P Z≥( ) = ≥( ) =30 1 89 0294. .

Estas probabilidades se establecen en la siguiente tabla, conjuntamente con sus acumulamientos para obtener las frecuencias teóricas o esperadas relativas acumuladas:

Tiempo deinscripciónen minutos

Frecuenciaesperadarelativa

Frecuenciaesperadarelativa

acumulada

22 .0735 .0735

23 .0925 .1660

24 .1425 .3085

25 .1835 .4920

26 .1852 .6772

27 .1466 .8238

28 .0969 .9207

29 .0499 .9706

30 .0294 1.0000

Tabla 12.28 Tiempo para inscribirse y frecuencias teóricas acumuladas relativas fear que pertenecen al ejemplo 11.26

Al comparar estas frecuencias teóricas con las observadas, se identifica el grado de diferencias que hay entre ellas para así obtener sus desviaciones absolutas, que son las diferencias entre las frecuencias esperadas acu-muladas relativas y las frecuencias observadas acumuladas relativas, es decir, en lenguaje simbólico quedaría así: |fear foar|, como se enuncia en la siguiente tabla.

568 12 IntroduccIón a la estadístIca no paramétrIca

Alfaomega estadística en el área de las ciencias sociales y administrativas – aragón

Tiempo deinscripciónen minutos

Frecuencia observada

Frecuencia observada acumulada

Frecuencia observada acumulada

relativafoar

Frecuencia esperada relativa

Frecuencia esperada relativa

acumulada fear

Desviaciones absolutas

|fear foar|

22 8 8 .0488 .0735 .0735 .0247

23 13 21 .1280 .0925 .1660 .0380

24 19 40 .2439 .1425 .3085 .0646

25 26 66 .4024 .1835 .4920 .0896

26 31 97 .5915 .1852 .6772 .0857

27 25 122 .7439 .1466 .8238 .0799

28 19 141 .8598 .0969 .9207 .0609

29 14 155 .9451 .0499 .9706 .0255

30 9 164 1.0000 .0294 1.0000 0

Tabla 12.29 Tiempo para inscribirse, frecuencias teóricas o esperadas relativas acumuladas fear, frecuencias observadas acumuladas relativas foar y desviaciones absolutas de ellas del ejemplo 12.16

La obtención de los valores críticos para establecer una prueba de dos extremos, con un nivel de significación del 5%, es decir, ⁄ 2 .025, por tablas correspondientes a la prueba de Kolmogorov–Smirnov para una muestra, serán determinados por el cruce de un renglón perteneciente al tamaño de la muestra, en este caso n 164, y una columna con el valor del nivel de significación, en este caso .05, se muestra todo lo descrito en un fragmento de dicha tabla.

Tamaño de muestra

n

Nivel de significación

.10 .05 .01

16 .295 .328 .392

17 .286 .318 .381

18 .278 .309 .371

19 .272 .301 .363

20 .264 .294 .356

25 .24 .27 .32

30 .22 .24 .29

35 .21 .23 .27

Más de 351.22

n

1.36

n

1.63

n

Tabla 12.30 Fragmento de la tabla para obtener valores críticos de la prueba de Kolmogorov – Smirnov para una muestra

Alfaomegaestadística en el área de las ciencias sociales y administrativas – aragón

ejercIcIos de IntroduccIón a la estadístIca no paramétrIca 569

En consecuencia se tiene que D1.36

n

1.36

164.1062C = = =

En estos momentos ya es posible comenzar a dar respuesta a lo solicitado, es decir, la aplicación de la prueba de Kolmogorov – Smirnov para una muestra.

Si se siguen los pasos de toda prueba de hipótesis, se tendrá el algoritmo siguiente:La hipótesis nula: El tiempo requerido por un aspirante para inscribirse virtualmente al examen de admisión está distribuido en forma normal, con parámetros µ ≅ 26.04 y ≅ 2.092.La hipótesis alternativa: La distribución N (26.04, 2.092) no es un buen ajuste del tiempo requerido por un as-pirante para inscribirse virtualmente al examen de admisión.

α/2=.025R.R.

α/2=.025R.R.

-D =-.1062c D =.1062c

R.A.1 − α = 95%

Figura 12.9 Regla de decisión gráfica en unidades de la tabla correspondiente a la prueba de Kolmogorov – Smirnov

Aceptar H si Dks0 1062 1062− ≤ ≤. .

El cálculo del valor de prueba como está dado por el modelo correspondiente como la máxima desviación absoluta; por consiguiente, se localiza en la última tabla que contiene las desviaciones absolutas, de donde:

D Máxima fe foks a ar r= − = .0896

Ahora como Dks .0896 se localiza dentro del intervalo (.1062, .1062), entonces cae en la región de aceptación ⇒H0 se acepta.

Conclusión: La información proporciona evidencia estadística significativa para establecer que la distribución normal, con µ ≅ 26.04 y ≅ 2.098, es un buen ajuste del comportamiento de los tiempos requeridos por aspi-rantes para inscribirse virtualmente al examen de admisión.

Ejercicios de introducción a la estadística no paramétrica

12.1 En una empresa mercantil se ha establecido una nueva política de cobro y se desea verificar si hay una diferencia significativa entre el número de días requeridos para cobrar una cuenta antes y después de que se estableció la nueva política. Utilice un nivel de significación del 5% para los datos obtenidos en un cierto momento, que se encuentran establecidos en la siguiente tabla:

570 12 IntroduccIón a la estadístIca no paramétrIca

Alfaomega estadística en el área de las ciencias sociales y administrativas – aragón

Antes 41 32 29 35 24 33 30 36 47 44 31 41 39 36 32

Después 39 36 35 37 29 34 38 40 46 42 33 40 42 36 40

12.2 En seguida se presentan los índices de calificaciones de 35 estudiantes de contabilidad obtenidos alea-toriamente de una encuesta desarrollada y aplicada por el director de una institución.

2.8 2.7 2.9 2.56 2.92 3.86 2.51 2.76 3.2 3.6 2 3.2

2.93 3 3 3.62 3.18 3.09 2.48 3.12 2.73 2.55 2.1 3.54

3.17 2 3.2 2.28 3 2 2.62 2.91 3.75 2.91 2.64

Una cuestión de interés para el director es determinar si los índices de calificaciones de los estudiantes de contabilidad habían o no cambiado en los últimos 10 años. El índice promedio de calificaciones había sido de 2.705. Considere un nivel de significación del 5%.

12.3 Considerando los datos del ejercicio 12.2 (anterior), que son el índice de las calificaciones de estudiantes de contabilidad, para este nuevo ejercicio se considerará otro grupo de 59 estudiantes, pero de otras materias, cuyos índices de calificaciones se presentan en la siguiente tabla:

2 2.5 3.43 2 3.51 2.9 2.3 2.84 3.32 2.85

2.8 3.53 2.4 2.75 2.36 3.25 3.82 3.61 2.82 2.76

1.83 3 3.08 2.9 3.89 2.64 2.83 2.45 2.81 3

2.66 2.45 3.07 2.82 2.51 3.86 2.89 2.75 2.8 2.6

2.5 2.25 2.8 3.01 2.3 2.85 3.34 3.39 2.5 2.86

2.94 3.2 3.21 3.2 2.64 3 2.69 3.75 3

Utilice las dos muestras para probar si habrá o no diferencias significativas entre los índices de calificaciones de los estudiantes de contabilidad y de los estudiantes de otras materias. Maneje un nivel de significación del 1%.

12.4 Pruebe la hipótesis de que no hay diferencia entre las edades de profesionistas masculinos y femeninos de cierta compañía, con los datos proporcionados en la siguiente tabla. Utilice un nivel de significación del 10%.

Mujeres 34 44 48 34 47 30 35 47 32 35

Hombres 35 31 43 38 26 25 44 35 40 42

12.5 Un vendedor de una compañía, tiene siete clientes que visitar por semana. Examine la distribución de frecuencias observadas del número de ventas que el vendedor realiza por semana en un cierto periodo de tiempo, los datos se indican en la siguiente tabla:

Número de ventas por semana 0 1 2 3 4 5 6 7

Frecuencia del número de ventas 25 30 60 45 40 20 16 14

Alfaomegaestadística en el área de las ciencias sociales y administrativas – aragón

ejercIcIos de IntroduccIón a la estadístIca no paramétrIca 571

Si se establece que sus ventas serán descritas, con una distribución binomial y con 45% de probabilidad de realizar la venta a cada cliente, a un nivel de significancia del 5% pruebe que efectivamente la distri-bución de ventas corresponde a la distribución sugerida.

12.6 En una muestra de un estudio piloto un investigador desea probar la hipótesis de que las mujeres moder-nas piensan que el número de hijos en la familia debe ser pequeño en contraparte con lo que opinan sus madres. Pidió a las participantes madres e hijas en el estudio responder el número de hijos que desearían tener o el que juzgaban ser el número ideal. Las respuestas fueron anónimas para evitar un sesgo en las respuestas al sentirse tal vez obligadas socialmente a dar una respuesta adecuada. Asimismo, para que la muestra fuera aleatoria en su selección se incluyeron personas procedentes de diferentes niveles so-cioeconómicos. A continuación se transcriben las respuestas de las parejas madres-hijas a lo preguntado:

Pareja muestra Tamaño ideal de la familia

Madre 1 4 3 4 2 4 2 3 3 5 5 3 3

Hija 2 3 4 4 1 2 3 1 3 5 2 4 2

¿El investigador concluiría, cuando .03, que madres e hijas tienen esencialmente el mismo ideal tamaño de la familia?

12.7 Una tarea en un área contable, en el pasado, ha requerido en promedio 30 minutos para llevarse a cabo. Un contador ha desarrollado un nuevo método para llevar a cabo la tarea que acelerará el proceso según él. Se obtiene una muestra aleatoria de 15 experimentos con un contador entrenado en el nuevo método. Los resultados obtenidos se presentan en la siguiente tabla:

27.0 27.4 28.8 31.1 27.2 29.0 29.6 28.1

25.9 30.0 31.3 30.2 30.5 27.3 26.7

¿Hay evidencia que sugiera que el tiempo mediano con el nuevo método es significativamente menor de 30 minutos? ¿Qué recomendaría a la gerencia? Considere un nivel de significancia del 5%.

12.8 Una organización pro ayuda a las mujeres desea saber si difieren los salarios mensuales iniciales de hom-bres y mujeres profesionistas al ingresar a una empresa. Se seleccionó para ello una muestra aleatoria de 10 egresados varones con calificación promedio de 8 y otra muestra aleatoria de 9 egresados mujeres con calificación promedio de 8. A cada profesionista se le permitió un total de tres entrevistas con empresas de relaciones comerciales, mercadotecnia o publicidad. Los datos siguientes son las mejores ofertas sa-lariales hechas a esos profesionistas:

Hombresmiles de pesos

14 15 11.8 12.5 17 10.5 13 14.5 14 15.2

Mujeresmiles de pesos

12 9 11.25 13.1 12.75 10.25 10 14.2 11.5

¿Hay alguna evidencia que apoye la aseveración de que a las mujeres profesionistas se les paga igual que a los hombres profesionistas cuando sus aptitudes son similares? Utilice un nivel de significancia del 5%.

572 12 IntroduccIón a la estadístIca no paramétrIca

Alfaomega estadística en el área de las ciencias sociales y administrativas – aragón

12.9 Para aumentar las ganancias, una cadena de tiendas que vende un producto lácteo en centros comerciales obsequia porciones pequeñas del producto en la entrada de los locales los días que la gerencia define como de gran afluencia de clientes y selecciona aleatoriamente los días para regalar esas porciones del producto llamadas muchas veces muestras. En una muestra aleatoria de días, dentro y fuera de la cate-goría de los días en que se debe obsequiar una porción del producto, se registran las ventas del producto en una tienda, las cuales se enuncian en la siguiente tabla:

Ventas en cientos

Días de promoción 18 19 21 18 27 21 20 23 22 15 18 26 17

Días normales 21 17 23 22 17 15 16 23 24 25 26 20

Efectúe una prueba a un nivel de significación del 5% para decidir si regalar porciones pequeñas del producto en la entrada de las tiendas produciría mayores ventas.

12.10 El gerente de una empresa de productos de limpieza personal ha reunido las siguientes estadísticas de sueldos respecto de los ingresos de su equipo de ventas. Por lo anterior, tiene frecuencias observadas y esperadas donde la distribución de los ingresos, que son presentados en la siguiente tabla, se comporta según una distribución normal:

Ingresos000 pesos

fo fe

5 – 10 10 6

11 – 16 21 17

17 – 22 25 32

23 – 28 31 35

29 – 34 20 18

34 – 40 11 13

41 – 46 7 4

A un nivel de significación del 10%, ¿la afirmación del gerente que la distribución de los ingresos de la fuerza de ventas se ajusta a una distribución normal se acepta o se rechaza?

12.11 En dos sucursales de una tienda departamental, que son idénticas físicamente, se analiza el número de demandas en diez meses, seleccionados al azar, por un seguro de gastos médicos de parte de los emplea-dos. La información recopilada se muestra en la siguiente tabla:

Alfaomegaestadística en el área de las ciencias sociales y administrativas – aragón

ejercIcIos de IntroduccIón a la estadístIca no paramétrIca 573

Número de demandas mensualespor un seguro de gastos médicos

Mes Sucursal A Sucursal B

1 170 201

2 164 179

3 140 159

4 184 195

5 174 177

6 142 170

7 191 183

8 169 179

9 161 170

10 200 212

¿Proporcionan los datos evidencia suficiente para establecer una diferencia en el número de demandas para las dos sucursales? Efectúe la prueba correspondiente con un valor de cercano a 0.10

12.12 Supóngase que una empresa comercializadora de productos para el hogar establece que la capacidad media de cierto tipo de producto es de 140 volts por hora. Una agencia independiente de estudios de protección al consumidor desea probar la credibilidad de lo afirmado por la firma y mide la capacidad de una muestra elegida aleatoriamente de 20 productos de un embarque reciente. Los resultados obtenidos se presentan en la siguiente tabla:

138.2 133.5 137.0 140.0 138.3 139.0 144.5 139.1 141.7 137.3

134.1 136.3 141.1 139.2 136.5 135.6 136.5 138.0 140.9 140.6

Pruebe con un nivel de significación del 5%.

12.13 La cantidad en miles de pesos invertida en publicidad, específicamente en cadenas y en estaciones de televisión locales por 10 empresas, se presenta en la siguiente tabla:

Empresa Televisión local

Cadena detelevisión

1 $13 181 $18 359

2 49 259 44 642

3 17940 24 152

4 36860 46 507

5 16 320 27 479

6 26 355 40 791

7 18 960 15 273

8 20893 38 554

9 16 944 15 527

10 11 491 36 685

574 12 IntroduccIón a la estadístIca no paramétrIca

Alfaomega estadística en el área de las ciencias sociales y administrativas – aragón

Use un nivel de significación del 5% y pruebe si los datos indican que los publicistas prefieren uno de los medios televisivos sobre el otro.

12.14 Un gran corporativo comercial contrata a casi todo su personal en dos grandes universidades de la ciudad. En el último año empezaron a administrar una prueba a licenciados en relaciones comerciales (LRC) recién titulados que ingresaban al corporativo, ya que deseaban determinar cuál escuela educaba mejor a sus profesionistas. Con base en una muestra aleatoria de las puntuaciones de 100 puntos posibles, obtenidos en la prueba, ayude al personal del corporativo a averiguar si las escuelas difieren en calidad. Utilice un nivel de significación del 6%. La información de las muestras es la que se presenta en la tabla siguiente:

Puntuaciones de la prueba

Escuela A 92 76 84 73 69 97 90 88 84 87 93

Escuela B 84 97 69 65 99 88 85 89 91 90 87 91 72

12.15 En una empresa de servicios de alimentos a líneas áreas, el jefe del área administrativa examinó los regis-tros de 200 vuelos seleccionados aleatoriamente y determinó la frecuencia con que se pedían alimentos con poco sodio. El número de vuelos en que se pidieron 1, 2, 3, 4 o más comidas con poco sodio fueron, respectivamente, 23, 47, 65, 45 y 20. Con un nivel de significación del .05, ¿el jefe administrativo concluiría con suficiente seguridad que tales peticiones siguen una distribución de Poisson donde 1?

12.16 En un experimento de diferencias por parejas se obtuvieron los datos mostrados en la siguiente tabla:

XA 3.4 4.1 3.9 3.5 3.8 4.3 4.3 2.9 4.0 3.5

XB 3.2 4.1 3.8 3.6 3.4 4.0 4.2 2.5 3.8 3.4

¿Es esta evidencia suficiente para indicar que P (XA XB) es mayor o menor que 0.5?a) Enuncie H0

b) Enuncie H1

c) Pruebe H0 para 0.05.d) Encuentre el valor ℘ para la prueba.

12.17 En un periodo de seis meses, una institución financiera comparó los réditos mensuales porcentuales para dos tipos diferentes de préstamos a corto plazo A y B. Los datos obtenidos se muestran en la tabla siguiente:

Mes PA PB

1 11.4 13.3

2 10.5 9.9

3 10.1 10.5

4 7.2 9.0

5 11.1 12.2

6 6.8 8.2

Alfaomegaestadística en el área de las ciencias sociales y administrativas – aragón

ejercIcIos de IntroduccIón a la estadístIca no paramétrIca 575

¿Los datos proporcionan evidencia suficiente para establecer que las distribuciones de los réditos men-suales para los dos tipos de préstamos difieren en localización? Use un nivel de significación del 10%.

12.18 Para conocer la opinión de los empleados de una empresa sobre dos planes de seguro médico, el depar-tamento de recursos humanos seleccionó al azar a ocho empleados de la nómina. A cada uno de esos empleados de la muestra se le explicó las características de ambos planes de seguro y se le solicitó que calificará cada plan con una escala del 1 al 10, donde 1 indicaba que el plan era totalmente inaceptable y el 10 que es totalmente aceptable. Las respuestas obtenidas aparecen en la siguiente tabla. ¿Indican tales datos que las opiniones de los empleados sobre los planes de seguro difieren en forma sustantiva, use un nivel de significación del 10%?

Plan de seguro

Empleado A B

1 8.0 8.0

2 8.5 7.5

3 8.5 6.0

4 7.0 9.0

5 9.0 7.0

6 7.5 4.0

7 9.5 8.0

8 8.0 5.0

12.19 Se realizó un estudio de mercado para comparar el precio de venta de dos tipos de pantalones. El pri-mero es de material estándar, como la mezclilla, y el segundo es de material sintético, como el poliéster. Se seleccionaron aleatoriamente diez piezas de cada tipo de pantalón, las cuales tuvieron los precios en dólares que se muestran en la siguiente tabla:

MezclillaA

PoliésterB

12.1 15.3

14.0 14.9

14.3 14.4

12.9 13.1

13.5 13.7

14.2 16.7

15.1 15.2

14.8 15.0

13.9 12.9

11.7 13.7

576 12 IntroduccIón a la estadístIca no paramétrIca

Alfaomega estadística en el área de las ciencias sociales y administrativas – aragón

Pruebe la hipótesis nula “no hay diferencia entre las distribuciones de los precios para los dos tipos de pantalón” contra la hipótesis alternativa de que el pantalón de poliéster tiende a ser más caro. Utilice un nivel de significación cercano al 5%.

12.20 Un servicio de consultoría empresarial calcula que por cada delegación que atiende, durante cuatro turnos de seis horas, hay 35% de probabilidad de recibir una llamada de asistencia. La información que se indica en la tabla siguiente es de una muestra seleccionada aleatoriamente por 90 días.

Número de turnos durante los cualesse recibieron llamadas

0 1 2 3 4

Número de días 8 32 30 12 8

A un nivel de significación del 5%, ¿siguen estas llamadas de asistencia una distribución binomial?

12.21 Se realizó un experimento de diferencias por parejas con n 35 pares. El número de veces que XA exceda a XB era de 18. ¿Proporcionan los datos suficiente evidencia estadística para establecer una prueba de un extremo derecho? Use 0.05

12.22 El jefe del área de personal de una empresa comercial comparó el número de accidentes por mes para dos productos diferentes en su manejo de traslado, durante un periodo de doce meses. Los datos obtenidos se enuncian en la tabla siguiente:

Mes

Producto E F M A M J J A S O N D

A 2 1 0 2 2 3 1 2 0 1 3 2

B 0 2 1 1 0 2 1 0 0 1 0 2

¿Proporciona la información evidencia para indicar diferencias en las tasas mensuales de accidentes entre el manejo de traslado de los dos productos? Use un nivel de significancia del 5%.

12.23 Una oficina municipal valúa propiedades y ha instalado un programa de cómputo para esta tarea. Desea comparar la eficacia del programa con valuaciones generadas por sus empleados dedicados a la valuación manual de propiedades. El cociente asignación–venta es la medida usada para obtener con exactitud las asignaciones de todas las oficinas valuadoras. Se seleccionaran 10 propiedades del municipio que recientemente fueron vendidas. Para cada propiedad se calcularon dos cocientes, uno basado en la asig-nación proporcionada por el programa de cómputo y el otro basado en la asignación proporcionada por un valuador de la oficina. Los datos recopilados aparecen en la tabla siguiente:

Alfaomegaestadística en el área de las ciencias sociales y administrativas – aragón

ejercIcIos de IntroduccIón a la estadístIca no paramétrIca 577

Método de Asignación

Propiedad Programa Valuador

1 1.10 0.99

2 0.92 0.82

3 0.96 0.92

4 0.98 0.92

5 1.05 0.98

6 0.90 0.95

7 1.10 0.97

8 1.05 0.95

9 0.95 0.97

10 1.01 0.93

¿Indican los datos que los cocientes asignación–venta promedio son diferentes cuando se usa el progra-ma de cómputo que cuando se usa un valuador para asignar valores a las propiedades en el municipio? Use .10

12.24 Una compañía que vende accesorios para cocinas realizó la misma campaña publicitaria para el producto en grandes almacenes en dos localidades diferentes, A y B. Se eligieron aleatoriamente en cada localidad a diez personas que asistieron a la campaña de publicidad, a quienes se les pidió que calificaran la cam-paña en una escala del 1 al 20 que, respectivamente corresponden de una baja a una alta calificación. En seguida se muestran las veinte calificaciones en una tabla:

Localidad A 18 15 13 11 17 20 5 14 9 12

Localidad B 10 6 15 8 6 10 16 7 17 8

¿Con los datos hay evidencia suficiente para establecer una diferencia en los niveles de calificaciones entre las dos localidades? Utilice un ercano al 5%.

12.25 El encargado de un módulo de operación de servicios de una dependencia gubernamental debe manejar las horas pico, es decir, en las que llegan muchos clientes al mismo tiempo. Se selecciona aleatoriamente un módulo de esta dependencia que está en un centro comercial para recolectar los datos que se presentan en la siguiente tabla, de llegadas por minuto en un horario gubernamental de las 8 a las 14 y de las 16 a las 18 horas cualquier día hábil de la semana.

Número de llegadas 1 2 3 4 5 6 7 8 9 10 11

Frecuencia 5 3 2 4 8 2 6 9 5 4 2

Pruebe si una distribución de Poisson, con una media de seis, describe adecuadamente la información. Use un nivel de significación de .05

578 12 IntroduccIón a la estadístIca no paramétrIca

Alfaomega estadística en el área de las ciencias sociales y administrativas – aragón

12.26 Dos especialistas en economía calificaron 20 proyectos presentados para un concurso bajo una convoca-toria, en una escala del 1 al 10, en correspondencia de un valor menor a mayor. Los datos obtenidos se presentan en la tabla siguiente:

Especialista Especialista

Proyecto A B Proyecto A B

1 6 8 11 5 5

2 4 5 12 4 3

3 7 4 13 4 6

4 8 7 14 9 8

5 4 3 15 9 10

6 2 5 16 6 9

7 7 8 17 8 5

8 9 9 18 4 2

9 7 4 19 3 3

10 2 3 20 8 8

¿Proporcionan los datos evidencia para indicar que uno de los especialistas tiende a otorgar calificaciones más altas que el otro? Pruebe con un nivel de significación cercano al 5%.

12.27 En la siguiente tabla se dan los embarques para el año en curso y del año próximo pasado para seis ex-portadores diferentes, en miles de cajas.

Año

Exportador En curso Pasado

1 4.81 4.27

2 5.03 5.97

3 2.38 2.61

4 4.26 3.96

5 5.14 4.86

6 3.93 3.17

¿Proporciona la información evidencia para establecer un nivel más elevado de exportaciones para este año en comparación con el año pasado? Realice la prueba respectiva con 0.05

12.28 En una institución educativa se aplicaron en un curso de matemáticas dos métodos de enseñanza a dos muestras de 9 y 10 estudiantes seleccionados aleatoriamente. Al término del curso ambos grupos pre-sentaron un mismo examen. Las calificaciones del examen en una base de 100 puntos se presentan en la siguiente tabla:

Alfaomegaestadística en el área de las ciencias sociales y administrativas – aragón

ejercIcIos de IntroduccIón a la estadístIca no paramétrIca 579

Método

A B

95 57

73 71

90 79

67 47

62 86

72 68

75 65

46 87

83 92

77

¿Indican los datos que hay diferencia entre los promedios de las calificaciones finales para los estudiantes que aprendieron por los métodos A y B? Use .05

12.29 Una empresa de venta de bienes raíces comparó la satisfacción de los clientes respecto de las ventas re-cientes para dos vendedores. Durante el último mes, la empresa entrevistó a los comparadores de bienes raíces de cada venta realizada por los dos vendedores, ocho para el vendedor A y siete para el vendedor B. Se les solicitó que dieran el grado de satisfacción, al tratar con el vendedor, en una escala de 1 al 20, consideradas respectivamente de menor a mayor. Las calificaciones se presentan en la tabla siguiente:

Vendedor A 15 13 14 18 20 17 16 20

Vendedor B 11 16 17 10 19 12 15

¿Proporcionan los datos suficiente evidencia para indicar una diferencia entre las calificaciones del nivel de satisfacción de un vendedor a otro? Realice la prueba correspondiente a un de 0.05

12.30 Una dependencia de gobierno realizó un estudio en 250 familias sobre su ingreso anual, en las principales ciudades del país. Los datos recopilados se muestran en la siguiente tabla:

Ingreso anual Familias

Inferiores a 40 100 4

40 100 – 58 700 53

58 700 – 77 300 145

77 300 – 95 900 41

Superiores a 95 900 7

580 12 IntroduccIón a la estadístIca no paramétrIca

Alfaomega estadística en el área de las ciencias sociales y administrativas – aragón

Se determino, por datos históricos, que el ingreso promedio anual real es de 68 000 pesos con una desviación estándar poblacional de 12 400 pesos. La dependencia afirma que el ingreso promedio anual lo describe una distribución normal. A un nivel de significación del 15%, sería aceptada la aseveración de que la distribución del ingreso anual sigue un comportamiento de una distribución normal.

Respuestas de los ejercicios

12.1 n 14 ⇒ binomial; 5%; x número de signos negativos; prueba de extremo derecho; P(X 10) .0899; H0 se acepta. No se ha producido un cambio significativo en el tiempo de cobro.

12.2 Prueba de dos extremos; n 35; RW 446; RW 315; RW 61.05; 5% ⇒ Zc 1.96; Aceptar H0 si 1.96 Zp 1.96; Zp 2.15 ⇒ H0 se rechaza luego H1 se acepta. El índice promedio de calificaciones de los estudiantes de contabilidad ha cambiado en los últimos 10 años

12.3 Prueba de dos extremos; n1 35; n2 59 muestras de tamaño grande; n 94;Sn1 1691.5; Sn2

2773.5; 1% ⇒ Zc 2.58; Aceptar H0 si 2.58 Zp 2.58; Zp .23 ⇒ H0 se acepta. No hay diferencias significativas entre los índices de calificaciones de los estudiantes de contabilidad y los de otras materias.

12.4 Prueba de dos extremos; n1 n2 10 muestras de tamaño grande; R1 Sn1 113.5; U1 41.5; U1 50; U1 13.229; 10% ⇒ ZC 1.645; Aceptar H0 si 1.645 Zp 1.645; Zp .643 ⇒ H0 se acepta. La media de las edades no es significativamente distinta.

12.5 n 250 y .05 α = = ≅..

.051 36

2500860DC por tablas; Rechazar H0 si Dks .0860; como Dks .1436,

entonces H0 se rechaza; por consiguiente, H1 se acepta. La distribución propuesta tiene pocas posibilidades de ajustarse al comportamiento de la información.

12.6 n 10 ⇒ binomial; 3%; x número de signos positivos; Prueba de extremo derecho; P(X 6) .3770; H0 se acepta. El tamaño ideal de la familia, según la opinión de las madres, no es significativamente mayor que el que proponen las hijas.

12.7 Prueba de extremo izquierdo; n 14 y 5% por tablas de Wilcoxon WC 26; Rechazar H0 si Wp WC; Wp W 16; como 16 26 ⇒ H0 se rechaza, luego H1 se acepta. Hay evidencia de que la media es menor que 30.

12.8 Prueba de extremo izquierdo; n1 9; n2 10 muestras de tamaño pequeño; n 19;Sn1 62; Sn2

128; 5% por tablas de suma de rangos de Wilcoxon ⇒ SC 69; Rechazar H0 si Sn1 SC; 62 69 ⇒ H0; luego, H1 se acepta. Hay evidencias de que MM MH

12.9 Prueba de extremo derecho; n1 13; n2 12 muestras de tamaño grande; R1 Sn1 164; U1 83;

5% ⇒ ZC 1.645; U1 78; U1

18.385; con datos originales; US 108.24; rechazar H0 si U1 108.24 ⇒ H0 se acepta. La promoción no ha hecho que las ventas aumenten en forma significativa.

12.10 n 125 y α = = ≅..

.101 22

1251091DC por tablas; Aceptar H0 si Dks .1091; como Dks .064, entonces H0

se acepta. Los datos están bien descritos por una distribución normal.

12.11 Sí, n 10 ⇒ binomial; 10%; x el número de meses para los cuales la cantidad de demandas en la sucursal A excede la cantidad de demandas en la sucursal B; Prueba de extremo izquierdo; P(X 1) .0108; H0 se rechaza. Hay evidencia suficiente para indicar que las distribuciones poblacionales difieren en sus localizaciones relativas. Más bien, las datos sugieren que el número de demandas de cual-quier mes en la sucursal A tiende a ser menor que el número de demandas correspondientes a la sucursal B.

Alfaomegaestadística en el área de las ciencias sociales y administrativas – aragón

respuestas de los ejercIcIos 581

12.12 Prueba de dos extremos; n 19 y 5% por tablas de Wilcoxon WC 46; Rechazar H0 si Wp Wc; Wp W 34; como 34 46 ⇒ H0 se rechaza, luego H1 se acepta. Hay pruebas para creer que la empre-sa exagera, por lo que la agencia de protección debería iniciar alguna medida correctiva en contra de la comercializadora.

12.13 Prueba de extremo derecho; n1 n2 10; Sn1 87; Sn2 123; 5% por tablas de suma de rangos de Wilcoxon ⇒ Scs 128; Rechazar H0 si Sn1

SCS; 87 128 ⇒ H0 se acepta. Se tiene evidencia significativo

de que los publicistas prefieren el medio televisivo de la cadena de TV sobre la televisión local.

12.14 Prueba de dos extremos;n1 11 y n2 13 muestras de tamaño grande; R1 Sn1 134.5 y R2 Sn2

165.5; U1 74.5 y U2 68.5; U2

71.5; U1 17.26; 6% ⇒ ZC 1.88; con datos originales Ui

39.05 y US 103.95; Aceptar H0 si 39.05 U1 o U2 103.95 ⇒ H0 se acepta. No hay diferencia signifi-cativa entre las dos escuelas.

12.15 El valor crítico del extremo superior es de .0962, ya que n 200 y .05 ⇒ DC DnC = = =1 36 1 36

2000962

. .. ≅ .0962 por tablas;

H0 se rechaza si DKS .0962; como DKS .3858, entonces H0 se rechaza; por consiguiente,H1 se acepta. Los datos no están bien descritos por una distribución de Poisson con 1.

12.16 n 9 ⇒ binomial; 5% a) H0: .50. b) H1: .50. c) H0 se rechaza ⇒ H1 se acepta con x número de signos positivos, luego x 8; P(X 8) .0196 y P(X

1) .0196, d) ℘ .0392.

12.17 Prueba de dos extremos; n 6 y 10% por tablas de Wilcoxon WC 2; Rechazar H0 si Wp WC; Wp W 2; como 2 2 ⇒ H0 se rechaza, luego H1 se acepta. Las dos distribuciones de frecuencias relativas poblacionales de los réditos mensuales porcentuales difieren respecto de su ubicación.

12.18 Prueba de dos extremos; n1 n2 8 muestras de tamaño pequeño; sn1 85.5; Sn2

50.5; 10% por tablas de suma de rangos de Wilcoxon ⇒ Scs 51; Scs 85; Sp Sn1 85.5; Rechazar H0 si Sp 51 o Sp 85; 85.5 85 ⇒ H0 se rechaza, luego H1 se acepta. Hay evidencia no significativa para establecer que las opiniones de los empleados sobre los planes de seguro difieren.

12.19 Prueba de extremo izquierdo; n1 n2 10 muestras de tamaño grande; R1 Sn1 85.5 y R2 Sn2

124.5; U1 69.5 y U2 30.5; 5% ⇒ Zcs 1.645; U1 50; U2

13.23; Zp 1.47; Rechazar H0 si Zp 1.645 ⇒ H0 se acepta. No hay suficiente evidencia para indicar que el pantalón de poliéster es más caro que el de mezclilla.

12.20 n 90 y .05 ⇒ DC 1.36

90 ≅ .1434 por tablas; Aceptar H0 si DKS .1434; como DKS .1186, entonces

H0 se acepta. Los datos están bien descritos por una distribución binomial con n 4 y .35

12.21 n 35 ⇒ binomial que se aproxima por la normal estándar; 5%; x el número de veces que XA ex-cede a XB, luego ZC 1.645 y x 18; prueba de extremo derecho H0: .50 y H1: .50; Zp .1692; H0 se acepta.

12.22 Prueba de dos extremos; n 8 y 5% por tablas de Wilcoxon WC 4; Aceptar H0 si Wp WC; Wp W 5, como 5 4 ⇒ H0 se acepta. No hay diferencias.

12.23 Prueba de dos extremos; n1 n2 10 muestras de tamaño pequeño;Sn1 127.5; Sn2

82.5; 10% por tablas de suma de rangos de Wilcoxon ⇒ SCS

82; SCS 128; Sp Sn1

127.5; Aceptar H0 si 82 Sp 128; ⇒ H0 se acepta. Hay evidencia estadística no significativa de que los cocientes asignación-venta

582 12 IntroduccIón a la estadístIca no paramétrIca

Alfaomega estadística en el área de las ciencias sociales y administrativas – aragón

promedio son iguales cuando se usa el programa de cómputo y cuando se usa un valuador para signar valores a las propiedades en el municipio.

12.24 Prueba de dos extremos; n1 n2 10 muestras de tamaño grande; R1 Sn1 125 y R2 Sn2

85; U1 30 y U2 70; U1

50; U1 13.23; 5% ⇒ ZC 1.96; con datos originales Ui 24.07 y US 75.93;

aceptar H0 si 24.07 U1 o U2 75.93 ⇒ H0 se acepta. No hay diferencia en los niveles de calificación entre las dos localidades.

12.25 Valor crítico del extremo superior es de .1923, ya que n 50 y α = = =..

.051 36

501923DC por tablas; H0

se acepta si DKS .1923; como DKS ≅ .1440, entonces H0 se acepta. Los datos están bien descritos por una distribución de Poisson con 6.

12.26 n 17 ⇒ binomial; .05; x el número de veces que EA excede a EB, luego x 8; prueba de extremo derecho H0: ≤ .50 y H1: .50; P( X 8) .6854; H0 se acepta.

12.27 Prueba de extremo derecho; n 6 y .05 por tablas de Wilcoxon WC 2; H0 se acepta si Wp WC; Wp W 7; como 7 2 ⇒ H0, se acepta.

12.28 Prueba de dos extremos; n1 9, n2 10 muestras de tamaño pequeño; Sn1 91; Sn2 99; 5% por

tablas de suma de rangos de Wilcoxon ⇒ Sci 62; Scs

109; Sp Sn1 91; Aceptar H0 si 62 Sp 109;

⇒ H0 se acepta. No hay una diferencia significativa entre los promedios de las calificaciones finales de los estudiantes sujetos a métodos de enseñanza diferentes. También es posible resolver por aproximación de la distribución normal.

12.29 Prueba de dos extremos; n1 8, n2 7 muestras de tamaño pequeño; R1 Sn1 75.5 y R2 Sn2 44.5;

U1 16.5 y U2 39.5; por tablas T de suma de rangos de U Mann Withney y 10% Ti 47 y TS 81; Aceptar H0 si 47 R1 o R2 81 ⇒ H0 se acepta. No hay diferencia entre las calificaciones del nivel de satisfacción de un vendedor a otro.

12.30 n 250 y α = = ≅..

.151 14

2500721DC por tablas; Aceptar H0 si DKS .0721; como DKS .0346, entonces

H0 se acepta. Los ingresos anuales familiares se describen según una distribución normal con parentesis media de $68 000 y desviación estándar de $12 400.

Páginas Web recomendadas

También es de considerar la consulta de este material, escrito y tratado por otros autores, al revisar las siguientes direcciones electrónicas:

http://ecampus.fca.unam.mx/ebook/imprimibles/contaduria/estadistica_2/Unidad_5.pdf

http://ftp.utalca.cl/profesores/gicaza/Apuntes%20PDF/Apuntes%20Cap%2012%20Metodos%20no%20parametricos.pdf

http://biblio3.url.edu.gt/Libros/2012/esta-AE/15.pdf

http://pendientedemigracion.ucm.es/info/socivmyt/paginas/D_departamento/materiales/anali-sis_datosyMultivariable/19nparam_SPSS.pdf

http://academic.uprm.edu/eacuna/miniman11sl.pdf