58
13 13-1 Panorama general 13-2 Prueba del signo 13-3 Prueba de rangos con signo de Wilcoxon para datos apareados 13-4 Prueba de la suma de rangos de Wilcoxon para dos muestras independientes 13-5 Prueba de Kruskal-Wallis 13-6 Correlación de rangos 13-7 Prueba de rachas para detectar aleatoriedad Estadística no paramétrica

No param, M. triola 10ed

Embed Size (px)

Citation preview

13

13-1 Panorama general

13-2 Prueba del signo

13-3 Prueba de rangos con signo de Wilcoxon

para datos apareados

13-4 Prueba de la suma de rangos de Wilcoxon

para dos muestras independientes

13-5 Prueba de Kruskal-Wallis

13-6 Correlación de rangos

13-7 Prueba de rachas para detectar aleatoriedad

Estadística no paramétrica

P R O B L E M A D E L C A P Í T U L O

¿Los estudiantes clasifican a las universidades de la misma manera que el U.S. News and World Report?Cada año, la revista U.S. News and World Report publi-ca una clasificación de universidades con base en esta-dísticos tales como las tasas de admisión, las tasas degraduación, el tamaño de los grupos, la razón entre pro-fesores y estudiantes, los salarios de los profesores y lascalificaciones de los administradores otorgadas por suscompañeros. Los economistas Christopher Avery, MarkGlickman, Caroline Minter Hoxby y Andrew Metrickusaron un método alternativo para analizar la selecciónde universidades de 3240 estudiantes del último año depreparatoria con alto rendimiento escolar. Examinaronlas universidades que ofrecen admisión junto con las uni-versidades que los estudiantes eligen. La tabla 13-1 listael orden de una pequeña muestra de universidades, asícomo también cierto acuerdo entre el orden de preferen-cia de los estudiantes y las calificaciones de la revista,aunque también indica cierto desacuerdo. Por ejemplo, delas ocho universidades consideradas, Harvard ocupó elprimer lugar tanto para los estudiantes como para larevista U.S. News and World Report. Sin embargo, de lasocho universidades incluidas, la Universidad de Pennsyl-vania fue considerada en séptimo lugar por los estudian-tes pero en tercer lugar por la revista.

Consideremos el tema de una correlación entre la cla-sificación de los estudiantes y la clasificación de la revis-

ta. El concepto de correlación se estudió en la sección10-2, donde el coeficiente de correlación lineal r se utili-zó para medir la asociación entre dos variables. Los mé-todos de la sección 10-2 requieren datos apareados, y losdatos de la tabla 13-1 están apareados. Sin embargo,existe una diferencia muy importante: los métodos de lasección 10-2 tienen requisitos como las distribucionesnormales, y los rangos como los que aparecen en la tabla13-1 no satisfacen estos requisitos. Los métodos de lasección 10-2 no se pueden utilizar con los datos mues-trales de la tabla 13-1. En este capítulo se presentan va-rios métodos que se utilizan con datos que no satisfacenel requisito de una distribución normal. En particular,varios métodos de esta sección pueden emplearse condatos muestrales en el formato de rangos, como los de latabla 13-1. En la sección 13-6 se estudiará un métodopara poner a prueba una correlación con datos apareadosque no tienen el formato de rangos. Entonces, seremoscapaces de analizar el grado de acuerdo y desacuerdoentre las clasificaciones de los estudiantes y de la revis-ta, como aparecen en la tabla 13-1. Así, probaremos siexiste una correlación entre las preferencias de los estu-diantes y la clasificación de la revista, y podremos con-testar la siguiente pregunta importante: ¿Los estudiantescoinciden con la revista?

Tabla 13-1 Universidades clasificadas por estudiantes y por U.S. News and World Report

Clasificación según la preferencia Clasificación según la revista Universidad de los estudiantes U.S. News and World Report

Harvard 1 1Yale 2 2Cal. Inst. of Tech. 3 5M.I.T. 4 4Brown 5 7Columbia 6 6U. of Penn. 7 3Notre Dame 8 8

PR

OBLEMA

DE

L

C A PÍTUL

O1

676 Capítulo 13 Estadística no paramétrica

13-1 Panorama generalLos métodos de estadística inferencial presentados en los capítulos 7, 8, 9, 10 y 12se llaman métodos paramétricos porque se basan en el muestreo de una poblacióncon parámetros específicos, como la media m, la desviación estándar s o la pro-porción p. Por lo regular, estos métodos paramétricos deben cumplir con algunascondiciones bastante estrictas, como el requisito de que los datos muestrales pro-vengan de una población distribuida normalmente. Este capítulo describe métodosno paramétricos, los cuales no tienen esos estrictos requisitos.

DefinicionesLas pruebas paramétricas tienen requisitos acerca de la naturaleza o formade las poblaciones implicadas; las pruebas no paramétricas no requieren quelas muestras provengan de poblaciones con distribuciones normales o concualquier otro tipo particular de distribución. En consecuencia, las pruebas dehipótesis no paramétricas suelen llamarse pruebas de distribución libre.

Aunque el término no paramétrica sugiere que la prueba no está basada en unparámetro, existen algunas pruebas no paramétricas que sí dependen de un pará-metro como la mediana. Sin embargo, las pruebas no paramétricas no requieren deuna distribución particular, por lo que algunas veces se les conoce como pruebasde distribución libre. Aunque distribución libre es una descripción más precisa,por lo regular se utiliza el término no paramétrica. A continuación se enuncian lasprincipales ventajas y desventajas de los métodos no paramétricos.

Ventajas de los métodos no paramétricos

1. Los métodos no paramétricos pueden aplicarse a una amplia variedad de si-tuaciones puesto que no tienen los requisitos más estrictos de los métodos pa-ramétricos correspondientes. En particular, los métodos no paramétricos norequieren de poblaciones distribuidas normalmente.

2. A diferencia de los métodos paramétricos, los métodos no paramétricos a me-nudo pueden aplicarse a datos categóricos, como el género de quienes respon-den una encuesta.

3. Los métodos no paramétricos, por lo regular, implican cálculos más sencillosque los métodos paramétricos correspondientes y, por lo tanto, son más fácilesde comprender y aplicar. (Sin embargo, como la tecnología ha simplificadolos cálculos, es probable que la facilidad de los cálculos no sea un factor tanimportante).

Desventajas de los métodos no paramétricos

1. Los métodos no paramétricos tienden a desperdiciar información porquelos datos numéricos exactos suelen reducirse a una forma cualitativa. Porejemplo, en la prueba del signo no paramétrica (descrita en la sección 13-2),las pérdidas de peso de las personas sometidas a una dieta se registran

13-1 Panorama general 677

simplemente como signos negativos; las magnitudes reales de las pérdidasde peso se ignoran.

2. Las pruebas no paramétricas no son tan eficientes como las pruebas paramé-tricas, de manera que con una prueba no paramétrica generalmente necesita-mos evidencia más fuerte (como una muestra más grande o diferencias mayo-res) para rechazar una hipótesis nula.

Cuando se satisfacen los requisitos de distribuciones poblacionales, las prue-bas no paramétricas generalmente son menos eficaces que sus contrapartes para-métricas, pero la reducción en la eficiencia puede compensarse con un tamañomuestral más grande. Por ejemplo, en la sección 13-6 se presentará un conceptollamado correlación de rangos, que tiene una tasa de eficiencia de 0.91 cuando secompara con la correlación lineal presentada en el capítulo 10. Esto significa que,si todo permanece igual, la correlación de rangos no paramétrica requiere 100 ob-servaciones muestrales para obtener los mismos resultados que 91 observacionesmuestrales analizadas por medio de la correlación lineal paramétrica, suponiendoque se satisfacen los requisitos más estrictos para la aplicación del método para-métrico. La tabla 13-2 lista los métodos no paramétricos cubiertos en este capítu-lo, junto con el método paramétrico correspondiente y la tasa de eficiencia. La ta-bla 13-2 indica que varias pruebas no paramétricas tienen tasas de eficiencia porencima de 0.90, por lo que la eficiencia más baja tal vez no sea un factor esencialpara elegir entre los métodos paramétricos y no paramétricos. Sin embargo, pues-to que las pruebas paramétricas tienen tasas de eficiencia más altas que sus contra-partes no paramétricas, generalmente es mejor utilizar las pruebas paramétricascuando sus supuestos requeridos se satisfacen.

RangosLas secciones 13-3 a 13-6 utilizan métodos basados en rangos, que describiremosa continuación.

Tabla 13-2 Eficiencia: Comparación de pruebas paramétricas y no paramétricas

Tasa de eficiencia de unaprueba no paramétrica

Aplicación Prueba paramétrica Prueba no paramétrica con población normal

Datos muestrales apareados Prueba t o prueba z Prueba del signo 0.63Prueba de rangos con signo de Wilcoxon 0.95

Dos muestras independientes Prueba t o prueba z Prueba de la suma de rangos de Wilcoxon 0.95

Varias muestras independientes Análisis de varianza (prueba F) Prueba de Kruskal-Wallis 0.95Correlación Correlación lineal Prueba de correlación de

rangos ordenados 0.91Aleatoriedad Prueba no paramétrica Prueba de rachas Sin bases para comparar

DefiniciónLos datos están ordenados cuando se acomodan de acuerdo con algún criterio, por ejemplo, del más pequeño al más grande o del mejor al peor. Unrango es un número asignado a un elemento muestral individual de acuerdocon su lugar en la lista ordenada. Al primer elemento se le asigna un rango de 1, al segundo elemento se le asigna un rango de 2 y así sucesivamente.

678 Capítulo 13 Estadística no paramétrica

Manejo de rangos empatados: Si ocurre un empate en los rangos, el procedi-miento habitual es calcular la media de los rangos implicados y luego asignar esterango medio a cada uno de los elementos empatados, como en el siguiente ejemplo.

EJEMPLO Los números 4, 5, 5, 5, 10, 11, 12 y 12 tienen rangos dados de 1,3, 3, 3, 5, 6, 7.5 y 7.5, respectivamente. Vea la siguiente tabla y observe el pro-cedimiento para manejar empates.

Datos ordenados Rango preliminar Rango

4 1 1

10 5 5

11 6 6

13-2 Prueba del signoConcepto clave El objetivo principal de esta sección es entender el procedi-miento de la prueba del signo, el cual implica convertir valores de datos en signospositivos y negativos, y luego hacer una prueba para ver si hay una cantidad des-proporcionadamente mayor de uno u otro signo.

7.57.5

7

8f La medida es 7.5.

12

12

333

2

3

4

La medida es 3.

5

5

5

DefiniciónLa prueba del signo es una prueba no paramétrica (de distribución libre) que utiliza signos positivos y negativos para probar diferentes aseveraciones,incluyendo:

1. Aseveraciones que implican datos muestrales apareados

2. Aseveraciones que implican datos nominales

3. Aseveraciones acerca de la mediana de una sola población

Concepto básico de la prueba del signo La idea básica que subyace en la prueba del signo es el análisis de las frecuenciasde los signos positivos y negativos para determinar si son significativamente dife-rentes. Por ejemplo, suponga que probamos un tratamiento diseñado para incre-mentar la probabilidad de que un bebé sea niña. Si se trata a 100 mujeres y 51 deellas tienen niñas, el sentido común sugiere que no existe evidencia suficientepara afirmar que el tratamiento es efectivo, puesto que 51 niñas entre 100 bebésno son significativas. Pero ¿qué sucede con 52 niñas y 48 niños? ¿O con 90 niñasy 10 niños? La prueba del signo nos permite determinar cuándo este tipo de resul-tados son significativos.

2

13-2 Prueba del signo 679

Figura 13-1

Procedimiento de la prueba del signo

No

No

No

StartInicio

¿Los datos muestrales contra-

dicen a H1?

Asigne signos positivos y negativos y descarte cualquier cero.

Permita que n sea igual al número total de signos.

Permita que x sea igual al número del signo menos frecuente.

¿Es n � 25?

Convierta el estadístico de prueba x al estadístico de prueba

z �(x � 0. 5) � (n/2)

�n/2

Obtenga el valor (o valores) crítico(s) z en la tabla A-2 de la manera habitual.

Obtenga el valor crítico en la tabla A-7.

¿El estadístico de prueba es menor que o igual al valor (o valores)

crítico(s)?

No rechace la hipótesis nula. Rechace la hipótesis nula.

Por razones de consistencia y simplicidad, utilizaremos un estadístico deprueba con base en el número de veces que ocurre el signo menos frecuente. En elcuadro adjunto se resumen los supuestos relevantes, la notación, el estadístico deprueba y los valores críticos. La figura 13-1 resume el procedimiento de la pruebadel signo, que se ilustrará con los ejemplos que siguen.

680 Capítulo 13 Estadística no paramétrica

Cuidado: Cuando se aplica la prueba del signo en una prueba de una cola, nece-sitamos ser muy cuidadosos para evitar obtener la conclusión equivocada cuandoun signo ocurre significativamente con más frecuencia que el otro, pero los da-tos muestrales contradicen la hipótesis alternativa. Por ejemplo, suponga que estamosprobando la aseveración de que una técnica de selección del género favorece a los ni-ños, pero obtenemos una muestra de 10 niños y 90 niñas. Con una proporción mues-tral de niños igual a 0.10, los datos contradicen la hipótesis alternativa H1: p � 0.5. Nohay forma de sustentar la aseveración de que p � 0.5 con ninguna proporción muestralmenor que 0.5, por lo que no rechazamos la hipótesis nula y no procedemos con laprueba del signo. La figura 13-1 resume el procedimiento para la prueba del signo eincluye esta revisión: ¿Contradicen los datos muestrales a H1? Si los datos muestralesvan en el sentido opuesto de H1, no rechace la hipótesis nula. Siempre es importantereflexionar acerca de los datos y evitar confiar a ciegas en cálculos o resultadosde computadora.

Aseveraciones que implican datos apareadosCuando se utiliza la prueba del signo con datos que están ordenados en pares,convertimos los datos en bruto a datos con signos positivos y negativos comosigue:

1. Restamos cada valor de la segunda variable del valor correspondiente de laprimera variable.

2. Registramos sólo el signo de la diferencia encontrada en el paso 1. Excluimoslos empates: es decir, excluimos todos los datos apareados en los que ambosvalores son iguales.

Prueba del signo

Requisitos

1. Los datos muestrales se seleccionaron aleatoriamente.

2. No existe el requisito de que los datos muestrales provengan de una poblacióncon una distribución particular, como una distribución normal.

Notación

x � el número de veces que ocurre el signo menos frecuente

n � el número total de signos positivos y negativos combinados

Estadístico de prueba

Para n ≤ 25: x (el número de veces que ocurre el signo menos frecuente)

Para

Valores críticos

1. Para n ≤ 25, los valores críticos x se encuentran en la tabla A-7.

2. Para n > 25, los valores críticos z se encuentran en la tabla A-2.

n . 25: z 5

sx 1 0.5d 2 an

2b

!n

2

Asistencia a clases y calificaciones

En un estudio de 424 estudian-

tes de licenciatura de la Univer-

sidad de Michigan, se encontró

que los estudiantes con los peo-

res registros de asistencia tendían

a obtener las calificaciones más

bajas. (¿Quién se sorprende?).

Aquellos que estuvieron ausen-

tes menos del 10% del tiempo

tendieron a recibir calificacio-

nes de B o superiores. El estudio

también reveló que los estudian-

tes que se sientan al frente en el

salón de clases tienden a obte-

ner calificaciones significativa-

mente mejores.

13-2 Prueba del signo 681

Tabla 13-3 Cosechas de maíz de diferentes semillas

Normales 1903 1935 1910 2496 2108 1961 2060 1444 1612 1316 1511

Secadas 2009 1915 2011 2463 2180 1925 2122 1482 1542 1443 1535en horno

Signo de la 2 1 2 1 2 1 2 2 1 2 2

diferencia

Éste es el concepto clave que subyace en la aplicación de la prueba del signo:

Si dos conjuntos de datos tienen medianas iguales, el número de signospositivos debe ser aproximadamente igual al número de signos negativos.

EJEMPLO ¿El tipo de semilla afecta el crecimiento del maíz? En 1908William Gosset publicó el artículo “The Probable Error of a Mean” bajo el seu-dónimo de “Student” (Biometrika, vol. 6, núm. 1). Él incluyó los datos que selistan en la tabla 13-3 para dos tipos diferentes de semillas de maíz (normales ysecadas en horno), que se utilizaron en parcelas de tierra adyacentes. Los valo-res corresponden a las cosechas de cabezas de maíz (o mazorcas) en libras poracre. Utilice la prueba del signo con un nivel de significancia de 0.05 para pro-bar la aseveración de que no hay diferencia entre las cosechas de las semillasnormales y las de las semillas secadas en horno.

SOLUCIÓNREQUISITO El único requisito es que los datos muestrales se obtengan alazar. No hay un requisito sobre la distribución de la población, como el hechode que los datos muestrales provengan de una población distribuida normal-mente. Con base en el diseño de este experimento, suponemos que los datosmuestrales son aleatorios.

La siguiente es la idea básica: si no existe diferencia entre las cosechas delas semillas normales y las cosechas de las semillas secadas en horno, el núme-ro de signos positivos y negativos debe ser aproximadamente igual. En la tabla13-3 tenemos 7 signos negativos y 4 signos positivos. ¿Son aproximadamenteiguales los números de signos positivos y negativos, o son significativamentediferentes? Seguimos los mismos pasos básicos de prueba de hipótesis, tal co-mo se describieron en la figura 8-9, y aplicamos el procedimiento de la pruebadel signo que se resume la figura 13-1.

Pasos 1, 2 y 3: La hipótesis nula es la aseveración de que no hay diferenciaentre las cosechas de las semillas normales y las cosechas delas semillas secadas en horno, y la hipótesis alternativa es laaseveración de que existe una diferencia.

H0: No existe diferencia (la mediana de las diferencias es iguala 0).

H1: Existe una diferencia (la mediana de las diferencias no esigual a 0).

Paso 4: El nivel de significancia es A � 0.05.

Paso 5: Utilizamos la prueba no paramétrica del signo.continúa

682 Capítulo 13 Estadística no paramétrica

Paso 6: El estadístico de prueba x es el número de veces que se presenta el sig-no menos frecuente. La tabla 13-3 incluye diferencias con 7 signosnegativos y 4 signos positivos. (Si hubiera cualquier diferencia iguala 0, la descartaríamos). Permitimos que x sea igual al menor de 7 y 4,así que x � 4. Además, n � 11 (el número total de signos positivos ynegativos combinados). Nuestra prueba es de dos colas con a � 0.05.Nos remitimos a la tabla A-7, donde se encuentra el valor crítico de 1para n � 11 y a � 0.05 en dos colas. (Véase la figura 13-1).

Paso 7: Con un estadístico de prueba de x � 4 y un valor crítico de 1, no re-chazamos la hipótesis nula de no diferencia. [Véase la nota 2 incluidaen la tabla A-7: “La hipótesis nula se rechaza si el número del signomenos frecuente (x) es menor que o igual al valor en la tabla”. Puestoque x � 4 no es menor que o igual al valor crítico de 1, no rechaza-mos la hipótesis nula].

Paso 8: No hay suficiente evidencia para sustentar el rechazo de la aseveraciónde que la mediana de las diferencias es igual a 0; esto es, no existe sufi-ciente evidencia para justificar el rechazo de la aseveración de que noexiste una diferencia entre las cosechas de las semillas normales y lascosechas de las semillas secadas en horno. Ésta es la misma conclusióna la que se llegaría utilizando la prueba paramétrica t con datos aparea-dos de la sección 9-4, pero los resultados de la prueba del signo nosiempre coinciden con los resultados de la prueba paramétrica.

Aseveraciones que implican datos nominalesEn el capítulo 1 definimos los datos nominales como aquellos que consisten sóloen nombres, etiquetas o categorías. La naturaleza de los datos nominales limita loscálculos posibles, pero podemos identificar la proporción de datos muestrales quepertenecen a una categoría en particular y podemos probar aseveraciones acercade la proporción poblacional p correspondiente. El siguiente ejemplo utiliza datosnominales que consisten en el género (niñas/niños). La prueba del signo se utilizarepresentando a las niñas con signos positivos (�) y a los niños con signos negati-vos (�). (Créanme, esto signos se eligieron arbitrariamente). También observe elprocedimiento para manejar casos en los que n � 25.

EJEMPLO Selección del género El Genetics and IVF Institute realizóun ensayo clínico de sus métodos de selección del género. Para cuando seescribía este libro, los resultados incluían a 325 bebés nacidos de padres queutilizaron el método XSORT para aumentar la probabilidad de concebir una niña,y 295 de esos bebés fueron niñas. Utilice la prueba del signo con un nivel designificancia de 0.05 y pruebe la aseveración de que este método de seleccióndel género no tiene ningún efecto.

SOLUCIÓNREQUISITO El único requisito es que los datos muestrales se seleccionenal azar. Con base en el diseño de este experimento, podemos suponer que losdatos muestrales son aleatorios. Ahora podemos proceder con la prueba delsigno.

Permita que p denote la proporción poblacional de niñas. La aseveraciónde ningún efecto implica que las proporciones de niñas y niños sean iguales a

13-2 Prueba del signo 683

Figura 13-2 Prueba del efecto de un método de selección del género

z � 0z � �1.96 z � 1.96

a/2 � 0.025a/2 � 0.025

Rechazop � 0. 5

Rechazop � 0. 5

No rechazop � 0. 5

Datos muestrales: z � �14.64

0.5, de manera que p � 0.5. Por lo tanto, las hipótesis nula y alternativa pue-den establecerse de la siguiente manera:

H0: p � 0.5 (la proporción de niñas es igual a 0.5)H1:

Si denotamos a las niñas con signo positivo (+) y a los niños con signo negativo(�), tenemos 295 signos positivos y 30 signos negativos. Ahora consulte el pro-cedimiento de prueba del signo que se resume en la figura 13-1. El estadístico deprueba x es el menor de 295 y 30, así que x � 30. Esta prueba implica dos colaspuesto que un número desproporcionadamente alto o bajo de niñas nos llevará arechazar la aseveración de p � 0.5. Los datos muestrales no contradicen la hipó-tesis alternativa puesto que 295 y 30 no son precisamente iguales. (Esto es, losdatos muestrales son consistentes con la hipótesis alternativa de una diferencia).Continuando con el procedimiento de la figura 13-1, notamos que el valor den � 325 es superior a 25, por lo que el estadístico de prueba x se convierte (utili-zando una corrección por continuidad) al estadístico de prueba z como sigue:

Con a � 0.05 en una prueba de dos colas, los valores críticos son z � �1.96.El estadístico de prueba z � �14.64 es menor que �1.96 (véase la figura 13-2),por lo que rechazamos la hipótesis nula de que la proporción de niñas es iguala 0.5. Tenemos evidencia muestral suficiente para justificar el rechazo de laaseveración de que el método de selección del género no tiene efecto alguno(ya que las proporciones de niñas y niños son iguales a 0.5). Parece que estemétodo afecta el género de los bebés.

5s30 1 0.5d 2 a

325

2b2325

2

5 214.64

z 5

sx 1 0.5d 2 an

2b

!n

2

p 2 0.5

684 Capítulo 13 Estadística no paramétrica

Aseveraciones acerca de la mediana de una sola poblaciónEl siguiente ejemplo ilustra el procedimiento para utilizar la prueba del signo alprobar una aseveración acerca de la mediana de una sola población. Vea cómo lossignos positivos y negativos se basan en el valor aseverado de la mediana.

EJEMPLO Temperaturas corporales El conjunto de datos 2 del apéndiceB incluye temperaturas corporales medidas en adultos. Utilice las 106 tempera-turas listadas para las 12:00 a.m. del día 2 con la prueba del signo para probar laaseveración de que la mediana es menor que 98.6°F. El conjunto de datos tiene106 sujetos, 68 sujetos con temperaturas por debajo de 98.6°F, 23 sujetos contemperaturas por arriba de 98.6°F y 15 sujetos con temperaturas iguales a 98.6°F.

SOLUCIÓNREQUISITO El único requisito es que los datos muestrales se seleccionenal azar y, con base en el diseño de este experimento, suponemos que los datosmuestrales son aleatorios. Ahora podemos proceder con la prueba del signo.

La aseveración de que la mediana es menor que 98.6°F es la hipótesis al-ternativa, mientras que la hipótesis nula es la aseveración de que la mediana esigual a 98.6°F.

H0: La mediana es igual a 98.6°F. (mediana � 98.6°F)H1: La mediana es menor que 98.6°F. (mediana < 98.6°F)

Siguiendo el procedimiento descrito en la figura 13-1, descartamos los 15 ceros,utilizamos el signo negativo (�) para denotar cada temperatura que está por deba-jo de 98.6°F y utilizamos el signo positivo (�) para denotar cada temperatura queestá por encima de 98.6°F. Por lo tanto, tenemos 68 signos negativos y 23 signospositivos, entonces n � 91 y x � 23 (el número del signo menos frecuente). Losdatos muestrales no contradicen la hipótesis alternativa, puesto que la mayoría delas 91 temperaturas están por debajo de 98.6°F. (Si los datos muestrales indicaranun conflicto con la hipótesis alternativa, podríamos terminar inmediatamente laprueba concluyendo que no rechazamos la hipótesis nula). El valor de n excedea 25, por lo que convertimos el estadístico de prueba x al estadístico de prueba z:

En esta prueba de una cola con a � 0.05, utilizamos la tabla A-2 para obtenerel valor crítico z de �1.645. En la figura 13-3 podemos ver que el estadísticode prueba z � �4.61 cae dentro de la región crítica; por lo tanto, rechazamosla hipótesis nula. Con base en la evidencia muestral disponible, sustentamos laaseveración de que la mediana de la temperatura corporal de adultos saluda-bles es menor que 98.6°F.

5s23 1 0.5d 2 a

91

2b

!91

2

5 24.61

z 5

sx 1 0.5d 2 an

2b

!n

2

13-2 Prueba del signo 685

z � 0

Rechazo de mediana � 98. 6 �

No rechazo de mediana � 98. 6 �

Datos muestrales: z � �4. 61

z � �1. 645

En esta prueba del signo para la aseveración de que la mediana está por debajode 98.6°F, obtenemos un estadístico de prueba de z � �4.61 con un valor P de0.00000202, pero una prueba paramétrica de la aseveración de que m 98.6°F pro-duce un estadístico de prueba t � �6.611, con un valor P de 0.000000000813. Pues-to que el valor P de la prueba del signo no es tan bajo como el valor P de la pruebaparamétrica, vemos que la prueba del signo no es tan sensible como la prueba para-métrica. Ambas pruebas nos llevan al rechazo de la hipótesis nula, pero la prueba delsigno no considera que los datos muestrales sean tan extremos, en parte porque laprueba del signo utiliza sólo información acerca de la dirección de los datos, ignoran-do las magnitudes de los valores de los datos. En la siguiente sección se estudiará laprueba de rangos con signo de Wilcoxon, que supera con creces esta desventaja.

Fundamentos para el estadístico de prueba que se utiliza cuando n > 25:Cuando se calculan valores críticos para la prueba del signo, utilizamos la ta-bla A-7 sólo para n hasta 25. Cuando n � 25, el estadístico de prueba z sebasa en una aproximación normal a la distribución de probabilidad binomial con

Recuerde que en la sección 6-6 vimos que la aproximación normala la distribución binomial es aceptable cuando np 5 y nq 5. Recuerde tam-bién que en la sección 5-4 vimos que m � np y para distribuciones deprobabilidad binomial. Puesto que esta prueba del signo supone que p � q � 1/2,satisfacemos los prerrequisitos de que np 5 y nq 5 siempre y cuando n 10.Además, con el supuesto de que obtenemos y

por lo tanto

se convierte en

Finalmente, reemplazamos x con x � 0.5 como una corrección por continuidad.Esto es, los valores de x son discretos, pero puesto que estamos utilizando unadistribución de probabilidad continua, un valor discreto como 10 se representarealmente con el intervalo de 9.5 a 10.5. Como x representa el signo menos fre-cuente, actuamos conservadoramente interesándonos sólo por x � 0.5; así obtenemosel estadístico de prueba z, como en la ecuación y en la figura 13-1.

z 5

x 2 an

2b

!n

2

z 5x 2 m

s

!npq 5 !n>4 5 !n>2,m 5 np 5 n>2p 5 q 5 1>2,

s 5 !npq

p 5 q 5 1>2.

Figura 13-3

Prueba de la aseveración de que la mediana es menorque 98.6°F

686 Capítulo 13 Estadística no paramétrica

13-2 DESTREZAS Y CONCEPTOS BÁSICOSConocimientos estadísticos y pensamiento crítico

1. Prueba no paramétrica. ¿Por qué la prueba del signo se considera una prueba “noparamétrica” o una prueba “de distribución libre”?

2. Prueba del signo. ¿Por qué el procedimiento descrito en esta sección se conoce comoprueba “del signo”?

3. Procedimiento de la prueba del signo. Se le asignó la tarea de probar la aseveraciónde que un método de selección del género tiene el efecto de aumentar la probabilidad deque un bebé sea niña, y los datos muestrales consisten en 20 niñas entre 80 bebésrecién nacidos. Sin aplicar el procedimiento formal de la prueba del signo, ¿qué con-cluye usted acerca de la aseveración? ¿Por qué?

4. Eficiencia de la prueba del signo. Remítase a la tabla 13-2 e identifique la eficienciade la prueba del signo. ¿Qué nos indica ese valor acerca de la prueba del signo?

En los ejercicios 5 a 8, suponga que los datos apareados dan por resultado el númerodado de signos cuando el valor de la segunda variable se resta del correspondiente valorde la primera variable. Utilice la prueba del signo con un nivel de significancia de 0.05 ypruebe la hipótesis nula de ninguna diferencia.

5. Signos positivos: 15; signos negativos: 4; empates: 1

6. Signos positivos: 3; signos negativos: 12; empates: 2

Uso de la tecnología

STATDISK Seleccione Analysis de labarra del menú principal, luego seleccioneSign Test. Elija la opción Given Number ofSigns si usted conoce el número de signospositivos y negativos, o seleccione GivenPairs of Values si hay datos apareados en laventana de datos. Después de realizar lasentradas requeridas en el cuadro de diálo-go, los resultados en la pantalla incluirán elestadístico de prueba, el valor crítico y laconclusión.

MINITAB Primero debe crear una co-lumna de valores que representen las diferen-cias entre los datos apareados o el número designos positivos y negativos. (Para más deta-lles véase el manual Minitab Student Labora-tory Manual and Workbook). SeleccioneStat, luego Nonparametrics y después 1-Sample Sign. Haga clic en el botón para TestMedian. Ingrese el valor de la mediana y se-leccione el tipo de prueba, luego haga clic enOK. Minitab dará el valor P. Usted debe re-chazar la hipótesis nula si el valor P es menoro igual que el nivel de significancia. De noser así, no rechace la hipótesis nula.

EXCEL Excel no tiene una función pre-determinada para la prueba del signo, perousted puede utilizar la función BINOM-DIST de Excel para calcular el valor P parauna prueba del signo. Haga clic en fx en labarra del menú principal, luego seleccionela categoría de función Statistical y despuésBINOMDIST. En el cuadro de diálogo, in-grese primero x, luego el número de ensayosn y luego una probabilidad de 0.5. IngreseTRUE en el cuadro para “cumulative”. Elvalor resultante es la probabilidad de obte-ner x o menos éxitos entre n ensayos. Dupli-que este valor para pruebas de dos colas. Elresultado final es el valor P.

También se puede utilizar el comple-mento DDXL al seleccionar Nonparame-tric Tests y luego Sign Test.

TI-83>84 PLUS La calculadora TI-83/84 Plus no tiene una función predetermi-nada para la prueba del signo, pero se puedeutilizar la función binomcdf para calcular elvalor P para una prueba del signo. Oprima2nd, VARS (para obtener el menú DISTR);luego baje el cursor para seleccionarbinomcdf. Complete la entrada de bi-nomcdf (n, p, x) con n para el número total

de signos positivos y negativos, 0.5 para p yel número del signo menos frecuente para x.Ahora oprima ENTER; el resultado será laprobabilidad de obtener x o menos éxitosentre n ensayos. Duplique este valor parapruebas de dos colas. El resultado final es elvalor P; por lo tanto, rechace la hipótesis nu-la si el valor P es menor o igual que el nivelde significancia. De no ser así, no rechace lahipótesis nula. Por ejemplo, vea la siguientepantalla de resultados sobre el primer ejem-plo de esta sección. Con 7 signos negativosy 4 signos positivos, n � 11. La probabili-dad se duplica para obtener un valor P de0.548828125.

TI-83/84 Plus

13-2 Prueba del signo 687

7. Signos positivos: 30; signos negativos: 35; empates: 3

8. Signos positivos: 50; signos negativos: 40; empates: 4

En los ejercicios 9 a 18, utilice la prueba del signo.

9. ¿El viernes 13 es de mala suerte? Investigadores reunieron datos sobre el número deadmisiones hospitalarias resultantes de choques de vehículos, y a continuación sepresentan los resultados de los viernes 6 de un mes y de los siguientes viernes 13 delmismo mes (según datos de “Is Friday the 13th Bad for Your Health?, de Scanlonet al., BMJ, vol. 307, tal como aparece en el recurso de datos en línea Data and StoryLine). Utilice un nivel de significancia de 0.05 para probar la aseveración de que,cuando el día 13 del mes cae en viernes, el número de admisiones hospitalarias porchoques de vehículos no se ve afectado.

Viernes 6: 9 6 11 11 3 5

Viernes 13: 13 12 14 10 4 12

10. Prueba de semillas de maíz. En 1908 William Gosset público al artículo “The Pro-bable Error of a Mean”, bajo el seudónimo de “Student” (Biometrika, vol. 6, núm. 1).Él incluyó la lista que parece abajo, acerca de las cosechas de dos tipos diferentes desemillas (normales y secadas en horno), que se utilizaron en parcelas de tierra adya-centes. Los valores listados son las cosechas de paja en cwt por acre, donde cwt repre-senta 100 libras. Utilice un nivel de significancia de 0.05 y pruebe la aseveración deque no hay diferencia entre las cosechas de los dos tipos de semillas. ¿Parece que al-guna de las semillas es mejor?

Normales 19.25 22.75 23 23 22.5 19.75 24.5 15.5 18 14.25 17

Secadas 25 24 24 28 22.5 19.5 22.25 16 17.25 15.75 17.25en horno

11. Prueba para la diferencia entre estaturas de hombres reportadas y medidas.Como parte de la National Health and Nutrition Examination Survey, realizada por elDepartamento de Salud de Estados Unidos, se obtuvieron las estaturas reportadas ymedidas de varones entre 12 y 16 años de edad. Abajo se listan los resultados mues-trales. ¿Existe evidencia suficiente para sustentar la aseveración de que hay una dife-rencia entre las estaturas reportadas y las estaturas medidas de varones de 12 a 16años de edad? Utilice un nivel de significancia de 0.05.

Estaturas reportadas 68 71 63 70 71 60 65 64 54 63 66 72

Estaturas medidas 67.9 69.9 64.9 68.3 70.3 60.6 64.5 67.0 55.6 74.2 65.0 70.8

12. Estatura de ganadores y de segundos lugares. A continuación se listan las estaturasde candidatos que ganaron las elecciones presidenciales y las estaturas de los candidatosque obtuvieron el segundo número más alto de votos del electorado. Los datos aparecenen orden cronológico, de manera que las estaturas de las dos listas están apareadas. Paralos candidatos que ganaron más de una vez, sólo se incluyen las estaturas de la primeraelección, y no se incluyen elecciones previas a 1900. Una creencia generalizada asegu-ra que los candidatos ganadores tienden a ser más altos que los candidatos perdedorescorrespondientes. Utilice un nivel de significancia de 0.05 para probar esa aseveración.Al parecer, ¿la estatura es un factor importante para ganar la presidencia?

Ganador de la presidencia

71 74.5 74 73 69.5 71.5 75 7270.5 69 74 70 71 72 70 67

Segundo lugar

73 74 68 69.5 72 71 72 71.570 68 71 72 70 72 72 72

13. Prueba para temperatura corporal media de 98.6°F. En una clase de estadística, sepide a una estudiante del curso propedéutico de medicina que desarrolle un proyecto.

688 Capítulo 13 Estadística no paramétrica

Inspirada por las temperaturas corporales del conjunto de datos 2 del apéndice B, ellaplanea reunir sus propios datos muestrales para probar la aseveración de que la tem-peratura corporal media es menor que 98.6°F. Por restricciones de tiempo, se da cuen-ta de que sólo podrá reunir datos de 12 personas. Después de planear con cuidado unprocedimiento para obtener una muestra aleatoria de 12 adultos saludables, ella midesus temperaturas corporales y obtiene los resultados que se listan abajo. Utilice un ni-vel de significancia de 0.05 y pruebe la aseveración de que estas temperaturas corpo-rales provienen de una población con una mediana que es menor que 98.6°F.

97.6 97.5 98.6 98.2 98.0 99.0 98.5 98.1 98.4 97.9 97.9 97.7

14. Prueba para la mediana del peso de monedas de 25 centavos. A continuación se lis-tan los pesos (en gramos) de monedas de 25 centavos, acuñadas después de 1964, selec-cionadas al azar. Se supone que el peso de las monedas tiene una mediana de 5.670 g.Utilice un nivel de significancia de 0.05 para probar la aseveración de que la mediana esigual a 5.670 g. Al parecer, ¿las monedas están acuñadas según las especificaciones?

5.7027 5.7495 5.7050 5.5941 5.7247 5.6114 5.6160 5.5999 5.7790 5.6841

15. Datos nominales: Selección del género de niños. El Genetics and IVF Institute rea-lizó un ensayo clínico del método YSORT, diseñado para incrementar la probabilidadde concebir un niño. Por el tiempo en que se escribía este libro, habían nacido 51 be-bés de padres que utilizaron el método YSORT, y 39 de ellos fueron niños. Utilice losdatos muestrales con un nivel de significancia de 0.01 para probar la aseveración deque, con este método, la probabilidad de que un bebé sea niño es mayor que 0.5. ¿Pa-rece que el método funciona?

16. Datos nominales: Choques de automóviles. En un estudio de 11,000 choques de au-tomóviles, se descubrió que 5720 de ellos ocurrieron a una distancia no mayor de 5millas de casa del conductor (según datos de Progressive Insurance). Utilice un nivelde significancia de 0.01 para probar la aseveración de que más del 50% de los cho-ques de automóviles ocurren a una distancia no mayor de 5 millas de casa del conduc-tor. ¿Los resultados son cuestionables porque se basan en una encuesta financiada poruna compañía de seguros?

17. Datos nominales: Viaje a través de Internet. De 734 usuarios de Internet elegidosal azar, se descubrió que 360 de ellos usan Internet para planear viajes (según datos deuna encuesta Gallup). Utilice un nivel de significancia de 0.01 para probar la asevera-ción de que, de los usuarios de Internet, menos del 50% utiliza este medio para pla-near viajes. ¿Los resultados son importantes para los agentes de viajes?

18. Posposición de la muerte. Una creencia interesante y generalizada asegura que las per-sonas pueden posponer temporalmente su muerte para estar presentes en una festividad oun suceso importante como un cumpleaños. En un estudio de este fenómeno, se registra-ron 6062 muertes la semana previa al Día de Acción de Gracias, y 5938 muertes la sema-na posterior a esa festividad (según datos de “Holidays, Birthdays, and Postponement ofCancer Death”, de Young y Hade, Journal of the American Medical Association, vol.292, núm. 24). Si la gente puede posponer su muerte para después del Día de Acción deGracias, entonces la proporción de muertes la semana anterior debe ser menor que 0.5.Utilice un nivel de significancia de 0.05 para probar la aseveración de que la proporciónde muertes la semana anterior al Día de Acción de Gracias es menor que 0.5. Con base enel resultado, ¿parece haber alguna indicación de que las personas pueden posponer tem-poralmente su muerte para estar presentes el Día de Acción de Gracias?

13-2 MÁS ALLÁ DE LO BÁSICO

19. Procedimientos para manejar empates. En el procedimiento de la prueba del signodescrito en esta sección, excluimos los empates (representados por 0 en vez de un sig-no de � o de �). Un segundo método consiste en tratar a la mitad de los ceros como

13-3 Prueba de rangos con signo de Wilcoxon para datos apareados 689

signos positivos y a la otra mitad como negativos. (Si el número de ceros es impar, ex-cluya uno para que puedan dividirse por igual). Con un tercer método, en pruebas dedos colas, haga la mitad de los ceros positivos y la mitad negativos. En pruebas de unacola haga todos los ceros positivos o negativos; cualquier signo sustenta la hipótesisnula. Suponga que cuando se utiliza la prueba del signo para una aseveración de que elvalor de la mediana es menor que 100, obtenemos 60 valores por debajo de 100, 40 va-lores por encima de 100, y 21 valores iguales a 100. Identifique el estadístico de prue-ba y la conclusión con las tres formas diferentes de manejar empates (con diferenciasde 0). Suponga un nivel de significancia de 0.05 en los tres casos.

20. Cálculo de valores críticos. La tabla A-7 lista valores críticos para alternativas limi-tadas de a. Utilice la tabla de A-1 para añadir una nueva columna en la tabla de A-7(bajando hasta n � 15) que represente un nivel de significancia de 0.03 en una cola ode 0.06 en dos colas. Para cualquier n particular, utilice p � 0.5, puesto que la pruebadel signo requiere el supuesto de que P(signo positivo) � P(signo negativo) � 0.5. Laprobabilidad de x o menos signos del mismo tipo es la suma de las probabilidades delos valores hasta x, inclusive.

21. Error de aproximación normal. La compañía Compulife.com contrató a 18 mujeresentre los últimos 54 empleados nuevos. De los solicitantes, alrededor de la mitad sonmujeres y la otra mitad hombres; todos los aspirantes están calificados. Utilizando unnivel de significancia de 0.01 con la prueba del signo, ¿existe suficiente evidencia paraacusar de favoritismo? ¿La conclusión cambia si se utiliza la distribución binomial envez de la distribución normal aproximada?

Prueba de rangos con signo 13-3 de Wilcoxon para datos apareadosConcepto clave Esta sección se ocupa de la prueba de rangos con signo de Wil-coxon, que se usa con datos muestrales apareados. Esta prueba se utiliza con lahipótesis nula de que la población de diferencias de los datos apareados tiene unamediana igual a cero.

La prueba del signo (sección 13-2) también se puede usar con datos aparea-dos, pero la prueba del signo sólo utiliza los signos de las diferencias. Al utilizar losrangos, la prueba de rangos con signo (o de rangos signados) de Wilcoxon toma encuenta las magnitudes de las diferencias. Puesto que la prueba de rangos con signode Wilcoxon incorpora y utiliza más información que la prueba del signo, tiende aarrojar conclusiones que reflejan mejor la verdadera naturaleza de los datos.

DefiniciónLa prueba de rangos con signo de Wilcoxon es una prueba no paramétrica queutiliza rangos ordenados de datos muestrales que consisten en datos apareados. Seusa para probar la hipótesis nula de que la población de diferencias tiene una me-diana de cero, de manera que las hipótesis nula y alternativa son las siguientes:

H0: Los datos apareados tienen diferencias que provienen de una poblacióncon una mediana igual a cero.

H1: Los datos apareados tienen diferencias que provienen de una poblacióncon una mediana diferente de cero.

(La prueba de rangos con signo de Wilcoxon también puede usarse para probarla aseveración de que una muestra proviene de una población con una medianaespecífica. Véase el ejercicio 13 para esta aplicación).

690 Capítulo 13 Estadística no paramétrica

Prueba de rangos con signo de Wilcoxon

Requisitos

1. Los datos consisten en datos apareados que se seleccionaron aleatoriamente.

2. La población de las diferencias (calculadas a partir de los pares de datos) tieneuna distribución que es aproximadamente simétrica, lo que quiere decir que lamitad izquierda de su histograma es aproximadamente una imagen de espejode la mitad derecha. (No existe el requisito de que los datos tengan una distribu-ción normal).

Notación

El procedimiento para calcular la suma de rangos T se incluye después de este recuadro.

T � la más pequeña de las siguientes dos sumas:

1. La suma de los valores absolutos de los rangos negativos de las diferencias dque no sean cero.

2. La suma de los rangos positivos de las diferencias d que no sean cero.

Estadístico de prueba

Si n ≤ 30, el estadístico de prueba es T.

Si n > 30, el estadístico de prueba es

Valores críticos

1. Si n ≤ 30, el valor crítico T se encuentra en la tabla a A-8.

2. Si n > 30, los valores críticos z se encuentran en la tabla A-2.

z 5

T 2nsn 1 1d

4Bnsn 1 1ds2n 1 1d24

Procedimiento de la prueba de rangos con signo de Wilcoxon

Paso 1: Para cada par de datos, calcule la diferencia d restando el segundo valordel primero. Mantenga los signos, pero descarte cualquier par para elque d � 0.

Paso 2: Ignore los signos de las diferencias, luego acomode las diferencias de lamenor a la mayor y reemplácelas por el valor del rango correspondiente(como se describe en la sección 13-1). Cuando las diferencias tengan elmismo valor numérico, asígneles la media de los rangos implicados enel empate.

Paso 3: Agregue a cada rango el signo de la diferencia de la que provino. Estoes, inserte aquellos signos que se ignoraron en el paso 2.

Paso 4: Calcule la suma de los valores absolutos de los rangos negativos. Tam-bién calcule la suma de los rangos positivos.

Paso 5: Permita que T sea la más pequeña de las dos sumas calculadas en elpaso 4. Podría utilizarse cualquier suma, pero para simplificar el proce-dimiento seleccionamos arbitrariamente la más pequeña de las dos sumas.(Véase la notación para T en el recuadro anterior).

Paso 6: Permita que n sea el número de pares de datos para los que la diferenciad no es 0.

Paso 7: Determine el estadístico de prueba y los valores críticos con base en eltamaño muestral, como se indica en el recuadro anterior.

Brecha de género en las pruebas de fármacos

Un estudio de la relación entre

los ataques cardiacos y las do-

sis administradas de aspirina

incluyó a 22,000 médicos varo-

nes. Este estudio, como muchos

otros, excluyó a las mujeres. La

General Accounting Office cri-

ticó hace poco a los institutos

nacionales de salud por no in-

cluir a ambos sexos en muchos

estudios, ya que los resultados de

pruebas médicas en hombres

no necesariamente se aplican a

las mujeres. Por ejemplo, los

corazones de las mujeres son

diferentes de los de los hombres

en muchos aspectos importan-

tes. Cuando saquemos conclu-

siones con base en resultados

muestrales, debemos ser cui-

dadosos al generalizar las infe-

rencias a una población más

grande que aquella de la cual se

obtuvo la muestra.

13-3 Prueba de rangos con signo de Wilcoxon para datos apareados 691

Tabla 13-4 Cosechas de maíz de diferentes semillas

Normales 1903 1935 1910 2496 2108 1961 2060 1444 1612 1316 1511

Secadas en horno 2009 1915 2011 2463 2180 1925 2122 1482 1542 1443 1535

Diferencias d 2106 20 2101 33 272 36 262 238 70 2127 224

Rangos de 10 1 9 3 8 4 6 5 7 11 2|diferencias|

Rangos con signo 210 1 29 3 28 4 26 25 7 211 22

Paso 8: Cuando plantee la conclusión, rechace la hipótesis nula si los datos mues-trales le llevan a un estadístico de prueba que se ubica en la región crítica,esto es, cuando el estadístico de prueba sea menor o igual que el valor (olos valores) crítico(s). De otra forma, no rechace la hipótesis nula.

EJEMPLO ¿El tipo de semilla afecta el crecimiento del maíz? En1908 William Gosset publicó el artículo “The Probable Error of a Mean” bajoel seudónimo de “Student” (Biometrika, vol. 6, núm. 1). Él incluyó los datosque se listan en la tabla 13-4 para dos tipos diferentes de semillas de maíz (norma-les y secadas en horno), que se utilizaron en parcelas de tierra adyacentes. Losvalores corresponden a las cosechas de cabezas de maíz (o mazorcas) en libraspor acre. Utilice la prueba de rangos con signos de Wilcoxon, con un nivel designificancia de 0.05, para probar la aseveración de que no hay diferencia entrelas cosechas de las semillas normales y de las semillas secadas en horno.

SOLUCIÓNREQUISITOS Debemos tener datos apareados seleccionados al azar. Losdatos están apareados y, dado el diseño de este experimento, es razonable supo-ner que los datos apareados fueron elegidos al azar. Además, el siguiente histo-grama generado por Minitab indica que la distribución de las diferencias esaproximadamente simétrica, tal como se requiere. (Es decir, el lado izquierdode la gráfica es aproximadamente una imagen de espejo del lado derecho. Asimple vista no parecen ser simétricos, pero con sólo 11 valores, la diferenciaentre el lado izquierdo y el lado derecho no es demasiado pronunciada).

continúa

Minitab

692 Capítulo 13 Estadística no paramétrica

Las hipótesis nula y alternativa son como sigue:

H0: Las cosechas de las semillas normales y de las semillas secadas en horno sontales que la mediana de la población de las diferencias es igual a cero.

H1: La mediana de la población de diferencias no es igual a cero.

El nivel de significancia es a � 0.05. Estamos utilizando el procedimiento dela prueba de rangos con signo de Wilcoxon, por lo que el estadístico de pruebase calcula aplicando el procedimiento de ocho pasos presentado con anteriori-dad en esta sección.

Paso 1: En la tabla 13-4 el renglón de diferencias se obtiene calculando estadiferencia para cada par de datos:

d � cosecha de las semillas normales � cosecha de las semillas secadas en horno

Paso 2: Ignorando sus signos, ordenamos los rangos de las diferencias abso-lutas de la menor a la mayor. (Si existiera algún empate en los rangostendríamos que manejarlos asignando la media de los rangos implica-dos a cada uno de los valores empatados. Además, tendríamos quedescartar cualquier diferencia de 0).

Paso 3: El renglón inferior de la tabla 13-4 se crea insertando a cada rango elsigno de la diferencia correspondiente. Si en realidad no existe diferen-cia entre las cosechas de los dos tipos de semillas (como en la hipótesisnula), esperamos que la suma de los rangos positivos sea aproximada-mente igual a la suma de los valores absolutos de los rangos negativos.

Paso 4: Ahora calculamos la suma de los valores absolutos de los rangos ne-gativos y también calculamos la suma de los rangos positivos.

Suma de los valores absolutos de los rangos negativos: 51 (de 10 � 9 � 8 � 6 � 5 � 11 � 2)

Suma de los rangos positivos: 15 (de 1 � 3 1 4 � 7)

Paso 5: Permitiendo que T sea la menor de las dos sumas calculadas en elpaso 4, encontramos que T � 15.

Paso 6: Permitiendo que n sea el número de pares de datos para los que la di-ferencia d no es 0, tenemos n � 11.

Paso 7: Puesto que n � 11, tenemos que n � 30, por lo cual utilizamos un esta-dístico de prueba de T � 15 (y no calculamos un estadístico de pruebaz). Además, puesto que n � 30, utilizamos la tabla de A-8 para encon-trar el valor crítico de 11 (utilizando n � 11 y a � 0.05 en dos colas).

Paso 8: El estadístico de prueba T � 15 no es menor o igual que el valor crí-tico de 11, por lo que no rechazamos la hipótesis nula. Parece que nohay una diferencia entre las cosechas de las semillas normales y delas semillas secadas en horno.

Si utilizamos la prueba del signo con el ejemplo anterior, llegaremos a la mismaconclusión. Aunque la prueba de signo y la prueba de rangos con signo de Wilcoxoncoinciden en este caso en particular, existen otros casos en los que no concuerdan.

Fundamentos: En este ejemplo los rangos sin signo de 1 hasta 11 tienen untotal de 66, de manera que si no existen diferencias significativas, cada uno de losdos totales de rangos con signo debe ser de alrededor de 66 � 2, o 33. Esto es, los

13-3 Prueba de rangos con signo de Wilcoxon para datos apareados 693

Minitab

rangos negativos y los rangos positivos deberían repartirse como 33-33 o algocercano, tal como 31-35. La tabla de valores críticos indica que a un nivel de sig-nificancia de 0.05, con 11 pares de datos, un reparto de 11-55 representa unadesviación significativa de la hipótesis nula, y cualquier reparto que esté más se-parado (como 10-56 o 2-64) también representará una desviación significativa dela hipótesis nula. Por el contrario, repartos como 12-52 no representan desviacionessignificativas de un reparto de 33-33, y no justificarían el rechazo de la hipótesisnula. La prueba de rangos con signo de Wilcoxon está basada en el total del rangomás bajo, por lo que en vez de analizar los dos números que constituyen el repar-to, consideramos sólo el número más bajo.

La suma de todos los rangos es igual a ysi ésta es una suma de rangos a dividirse por igual entre dos categorías (positivoy negativo), cada uno de los dos totales debería estar cerca de que esla mitad de El reconocimiento de este principio nos ayuda a entenderel estadístico de prueba que se usa cuando n > 30. El denominador en esa expre-sión representa una desviación estándar de T y se basa en el principio de que

La prueba de rangos con signo de Wilcoxon puede utilizarse sólo para datosapareados. La siguiente sección describirá una prueba de suma de rangos que puedeaplicarse a dos conjuntos de datos independientes que no están asociados en pares.

12 1 22 1 33 1 # # # 1 n2 5nsn 1 1ds2n 1 1d

6

nsn 1 1d>2.nsn 1 1d>4,

nsn 1 1d>2,1 1 2 1 3 1 c1 n

Uso de la tecnologíaSTATDISK Seleccione Analysis de la

barra del menú principal, luego seleccione

Wilcoxon Tests. Ahora elija Signed-Ran-gos Test y proceda a seleccionar las colum-

nas de datos. Haga clic en Evaluate.

MINITAB Ingrese los datos apareados

en las columnas C1 y C2. Haga clic en Edi-tor, luego en Enable Command Editor e

ingrese el comando LET C3 � C1 � C2.

Oprima la tecla Enter. Seleccione las op-

ciones Stat, Nonparametrics y 1-SampleWilcoxon. Ingrese C3 para la variable y

haga clic en el botón para Test Median. La

pantalla de Minitab incluirá el valor P. Vea

la pantalla de resultados de Minitab para el

ejemplo de esta sección. El valor P de

0.120 es mayor que el nivel de significan-

cia de 0.05, por lo que no se rechaza la hi-

pótesis nula.

EXCEL Excel no está programado para

la prueba de rangos con signo de Wilcoxon,

pero se puede emplear el complemento

DDXL al seleccionar Non-parametricTests y luego Paired Wilcoxon.

TI-83>84 PLUS La calculadora TI-

83/84 Plus no está programada para la

prueba de rangos con signo de Wilcoxon,

pero se puede usar el programa SRTEST

(de Michael Lloyd), el cual se puede des-

cargar del sitio http://www.pearsoneduca-

cion.net/triola. Primero descargue e instale

el programa. (También descargue el progra-

ma ZZRANK, necesario para el programa

SRTEST). Luego, elabore una lista de las

diferencias entre los valores de los datos

apareados. (El primer conjunto de valores

se puede insertar en la lista L1, el segundo

conjunto de valores en la lista L2, y luego

las diferencias se pueden almacenar en la

lista L3 ingresando L1 � L2 → L3, donde

la tecla STO se utiliza para la flecha). Presio-

ne la tecla PRGM y seleccione SRTEST.

Presione la tecla ENTER dos veces. Cuando

aparezca el indicador de DATA�, introduzca

la lista que contiene las diferencias. Presione

ENTER para ver la suma de los rangos po-

sitivos y la suma de los rangos negativos.

Presione ENTER nuevamente para ver la

media y la desviación estándar, y presione

ENTER una vez más para ver la puntua-

ción z. Si n ≤ 30, busque de valor crítico T

en la tabla A-8, pero si n > 30, obtenga los

valores críticos z en la tabla A-2.

694 Capítulo 13 Estadística no paramétrica

13-3 DESTREZAS Y CONCEPTOS BÁSICOSConocimientos estadísticos y pensamiento crítico

1. Prueba de rangos con signo de Wilcoxon. ¿Por qué se utiliza la prueba de rangoscon signo de Wilcoxon para datos apareados en vez de los métodos presentados en lasección 9-4?

2. Prueba de rangos con signo de Wilcoxon y prueba del signo. Tanto la prueba derangos con signo de Wilcoxon como la prueba del signo se pueden utilizar con datosmuestrales apareados. ¿Ambas podrían conducirnos a la misma conclusión? ¿Ambassiempre conducen a la misma conclusión?

3. Prueba de rangos con signo de Wilcoxon. Si tenemos datos muestrales consistentesen datos apareados, podemos comparar los valores utilizando la prueba del signo o laprueba de rangos con signo de Wilcoxon. ¿Qué importante ventaja tiene la prueba derangos con signo de Wilcoxon con respecto a la prueba del signo?

4. Prueba de rangos con signo de Wilcoxon. Un investigador de mercados diseña unexperimento que incluye una encuesta de parejas casadas en centros comerciales ele-gidos al azar. Después de separar a los hombres y a las mujeres, se pregunta a cadauno cuánto gastó en sus compras durante la última hora. Los resultados se analizancon la prueba de rangos con signo de Wilcoxon. ¿Las conclusiones se aplican a la po-blación de parejas casadas de Estados Unidos? ¿Por qué?

Uso de la prueba de rangos con signo de Wilcoxon. En los ejercicios 5 y 6, remítase a losdatos muestrales apareados indicados y utilice la prueba de rangos con signo de Wilcoxonpara probar la aseveración de que los datos apareados tienen diferencias que provienen deuna población con una mediana igual a cero. Utilice un nivel de significancia de 0.05.

5.x 60 55 89 92 78 84 93 87

y 35 27 47 44 39 48 51 54

6.x 90 93 112 97 102 115 148 152 121

y 88 91 115 95 103 116 150 147 119

Uso de la prueba de rangos con signo de Wilcoxon. En los ejercicios 7 a 10, remítase alos datos muestrales para los ejercicios de la sección 13-2. En vez de la prueba del signo,utilice la prueba de rangos con signo de Wilcoxon para probar la aseveración de que losdatos apareados tienen diferencias que provienen de una población con una medianaigual a cero. Use un nivel de significancia de 0.05.

7. Ejercicio 9 8. Ejercicio 10

9. Ejercicio 11 10. Ejercicio 12

Conjuntos de datos del apéndice B. En los ejercicios 11 y 12, utilice la prueba de rangoscon signo de Wilcoxon con los datos del apéndice B.

11. Prueba de la diferencia entre temperaturas pronosticadas y reales. Remítase alconjunto de datos 8 del apéndice B y utilice las temperaturas máximas reales y el pro-nóstico de temperaturas máximas de tres días. ¿Parece existir una diferencia?

12. Prueba para la diferencia entre los tiempos en que se presenta consumo de alcohol yde tabaco. Remítase al conjunto de datos 5 del apéndice B. Utilice sólo aquellas pelícu-las que presentan algún consumo de tabaco o alcohol (es decir, ignore aquellas películascon tiempos de cero para consumo de tabaco y para consumo del alcohol). ¿Parece exis-tir una diferencia?

13-4 Prueba de la suma de rangos de Wilcoxon para dos muestras independientes 695

13-3 MÁS ALLÁ DE LO BÁSICO13. Uso de la prueba de rangos con signo de Wilcoxon para aseveraciones acerca de

una mediana. La prueba de rangos con signo de Wilcoxon puede utilizarse para pro-bar la aseveración de que una muestra proviene de una población con una medianaespecífica. El procedimiento que se utiliza es el mismo que se describió en esta sec-ción, excepto que las diferencias (paso 1) se obtienen restando el valor de la medianahipotética de cada valor. Utilice los datos muestrales que consisten en las 106 tempe-raturas corporales listadas para las 12 a.m. del día 2 en el conjunto de datos 2 delapéndice B. Con un nivel de significancia de 0.05, pruebe la aseveración de que losadultos saludables tienen una mediana de temperatura corporal igual a 98.6°F.

Prueba de la suma de rangos de Wilcoxon para dos muestras

13-4 independientesConcepto clave Esta sección describe la prueba de la suma de rangos de Wil-coxon, que utiliza los rangos de los valores de dos conjuntos independientes dedatos muestrales para probar la hipótesis nula de que las dos poblaciones tienenmedianas iguales.

La prueba de rangos con signo de Wilcoxon (sección 13-3) implica datos apa-reados, pero la prueba de suma de rangos de Wilcoxon de esta sección implicados muestras independientes que no están relacionadas ni asociadas o apareadas.(Para evitar confusiones entre la prueba de suma de rangos de Wilcoxon paramuestras independientes y la prueba de rangos con signo de Wilcoxon para datosapareados, considere el uso de las siglas ISR del Impuesto Sobre la Renta comorecurso mnemotécnico para recordarnos “independiente: suma de rangos”).

DefiniciónLa prueba de la suma de rangos de Wilcoxon es una prueba no paramétricaque utiliza rangos de datos muestrales de dos poblaciones independientes. Seutiliza para probar la hipótesis nula de que las dos muestras independientesprovienen de poblaciones con medianas iguales. La hipótesis alternativa es laaseveración de que las dos poblaciones tienen medianas diferentes.

H0: Las dos muestras provienen de poblaciones con medianas iguales.

H1: Las dos muestras provienen de poblaciones con medianas diferentes.

Concepto básico: La prueba de la suma de rangos de Wilcoxon es equivalen-te a la prueba U de Mann-Whitney (véase el ejercicio 13), que se incluye en al-gunos otros libros de texto y programas de cómputo (como el Minitab). La ideafundamental que subyace en la prueba de la suma de rangos de Wilcoxon es la si-guiente: si dos muestras se obtienen de poblaciones idénticas y los valores indivi-duales se acomodan en rangos como un conjunto combinado de valores, entoncesel rango alto y el bajo deberían caer de manera uniforme entre las dos muestras. Silos rangos bajos se encuentran predominantemente en una muestra y los rangosaltos se encuentran predominantemente en la otra muestra, sospechamos que lasdos poblaciones tienen medianas diferentes.

696 Capítulo 13 Estadística no paramétrica

Procedimiento para calcular el valor del estadístico de prueba

1. Combine temporalmente las dos muestras en una muestra grande, entoncesreemplace cada valor muestral por su rango. (El valor más bajo toma un rangode 1, el siguiente valor más bajo toma un rango de 2, etcétera. Si los valoresestán empatados, asígneles la media de los rangos implicados en el empate.Consulte la sección 13-1 para ver una descripción de los rangos y el procedi-miento para manejar empates).

2. Calcule la suma de los rangos de las dos muestras.

Prueba de la suma de rangos de Wilcoxon

Requisitos

1. Hay dos muestras independientes de datos seleccionados al azar.

2. Cada una de las dos muestras tiene más de 10 valores. (Para muestras con 10valores o menos, en libros de referencia están disponibles tablas especiales, co-mo las CRC Standard Probability and Statistics Tables and Formulae, publica-das por CRC Press).

3. No existe el requisito de que las dos poblaciones tengan una distribución nor-mal o cualquier otra distribución particular.

Notación

n1 � tamaño de la muestra 1

n2 � tamaño de la muestra 2

R1 � suma de rangos de la muestra 1, que se calcula utilizando el procedimientoque se describe a continuación

R2 � suma de rangos de la muestra 2, que se calcula utilizando el procedimientoque se describe a continuación

R � lo mismo que R1 (suma de rangos de la muestra 1)

mR � media de los valores muestrales R que se espera cuando las dos poblacionestienen medianas iguales

sR � desviación estándar de los valores muestrales R que se espera cuando las dospoblaciones tienen medianas iguales

Estadístico de prueba

donde

n1 � tamaño de la muestra a partir de la cual se calcula la suma de rangos R

n2 � tamaño de la otra muestra

R � suma de rangos de la muestra con tamaño n1

Valores críticos: Los valores críticos pueden encontrarse en la tabla A-2 (puestoque el estadístico de prueba está basado en la distribución normal).

sR 5 Bn1n2sn1 1 n2 1 1d12

mR 5n1sn1 1 n2 1 1d

2

z 5R 2 mR

sR

13-4 Prueba de la suma de rangos de Wilcoxon para dos muestras independientes 697

Tabla 13-5Mediciones del IMC

Hombres Mujeres

23.8 (11.5) 19.6 (2.5)23.2 (9) 23.8 (11.5)24.6 (14) 19.6 (2.5)26.2 (17) 29.1 (22)23.5 (10) 25.2 (15.5)24.5 (13) 21.4 (5)21.5 (6) 22.0 (7)31.4 (24) 27.5 (19)26.4 (18) 33.5 (25)22.7 (8) 20.6 (4)27.8 (20) 29.9 (23)28.1 (21) 17.7 (1)25.2 (15.5)

n1 5 13 n2 5 12R1 5 187 R2 5 138

continúa

3. Calcule el valor del estadístico de prueba z como se indicó en el recuadro ante-rior, donde cualquier muestra puede utilizarse como la “muestra 1”. (Si ambostamaños muestrales son mayores que 10, entonces la distribución muestral deR es aproximadamente normal, con media mR y desviación estándar sR, y elestadístico de prueba es como se mostró en el recuadro anterior).

Note que, a diferencia de las pruebas de hipótesis correspondientes en lasección 9-3, la prueba de la suma de rangos de Wilcoxon no requiere poblacionesdistribuidas normalmente. Además, la prueba de la suma de rangos de Wilcoxonpuede utilizarse con datos en el nivel de medición ordinal, como los datos queconsisten en rangos. En contraste, los métodos paramétricos de la sección 9-3 nose pueden utilizar con datos en el nivel de medición ordinal. En la tabla 13-2 nota-mos que la prueba de la suma de rangos de Wilcoxon tiene una tasa de eficienciade 0.95 en comparación con la prueba paramétrica t o con la prueba z. Puesto queesta prueba tiene una alta tasa de eficiencia y requiere cálculos más fáciles, suelepreferirse sobre las pruebas paramétricas descritas en la sección 9-3, aun cuandose satisfaga el requisito de normalidad.

EJEMPLO IMC de hombres y mujeres Remítase al conjunto de datos 1del apéndice B y use únicamente los primeros 13 valores muestrales del índicede masa corporal (IMC) de los hombres y los primeros 12 valores muestralesdel IMC de las mujeres. En la tabla 13-5 se incluyen los valores muestrales delIMC. (Sólo se emplea parte de los valores muestrales disponibles para que loscálculos en este ejemplo sean más fáciles). Utilice un nivel de significancia de0.05 para probar la aseveración de que la mediana del IMC de los hombres esigual a la mediana del IMC de las mujeres.

SOLUCIÓNREQUISITOS La prueba de suma de rangos de Wilcoxon requiere de dosmuestras independientes y aleatorias, cada una con más de 10 valores. Los da-tos muestrales son independientes y aleatorios, y los tamaños muestrales son13 y 12. Los requisitos se satisfacen, así que procedemos con la prueba.

Las hipótesis nula y alternativa son las siguientes:

H0: Los hombres y las mujeres tienen valores del IMC con medianas iguales.

H1: Los hombres y las mujeres tienen valores del IMC con medianas queno son iguales.

Acomode en rangos las 25 mediciones combinadas del IMC, comenzando con unrango de 1 (asignado al valor más bajo de 17.7). Los empates en los rangos semanejan como se describió en la sección 13-1: calcule la media de los rangos im-plicados y asigne este rango medio a cada uno de los valores empatados. (Los va-lores segundo y tercero son ambos de 19.6, por lo que se asigna el rango de 2.5 acada uno de estos valores. Los valores decimoprimero y decimosegundo son am-bos de 23.8, por lo que se asigna el rango de 11.5 a cada uno de estos valores. Losvalores decimoquinto y decimosexto son ambos de 25.2, y se asigna un rango de15.5 a cada uno de ellos). En la tabla 13-5, los rangos correspondientes a los va-lores muestrales individuales se presentan entre paréntesis. R denota la suma delos rangos para la muestra que elegimos como muestra 1. Si elegimos los valoresdel IMC de los hombres, obtenemos

Puesto que existen 13 valores para los hombres, tenemos n1 � 13. Además,

R 5 11.5 1 9 1 14 1 c1 15.5 5 187

698 Capítulo 13 Estadística no paramétrica

n2 � 12, ya que existen 12 valores para las mujeres. Ahora podemos determi-nar los valores de mR, sR y el estadístico de prueba z.

La prueba es de dos colas, puesto que un valor positivo grande de z indicaríaque los rangos más altos se encuentran de forma desproporcionada en la mues-tra 1, y un valor negativo grande de z indicaría que la muestra 1 tuvo una partedesproporcionada de los rangos más bajos. En cualquier caso, tendríamos unafuerte evidencia en contra de la aseveración de que las dos muestras provienende poblaciones con medianas iguales.

La significancia del estadístico de prueba z puede tratarse de la misma for-ma que en los capítulos anteriores. Ahora estamos probando (con a � 0.05) lahipótesis de que las dos poblaciones tienen medianas iguales, de manera quetenemos una prueba de dos colas con valores críticos z de 1.96 y �1.96. El es-tadístico de prueba de z � 0.98 no cae dentro de la región crítica, por lo que norechazamos la hipótesis nula de que los valores del IMC de hombres y mujerestienen medianas iguales. Parece que los valores del IMC de hombres y muje-res son básicamente iguales.

Podemos verificar que, si intercambiamos los dos conjuntos de valoresmuestrales y consideramos que la muestra de los valores del IMC de las muje-res es la primera, R � 138, mR � 156, sR � 18.385 y z � �0.98, así que laconclusión es exactamente la misma.

EJEMPLO IMC de hombres y mujeres El ejemplo anterior utilizó sólo13 de los 40 valores muestrales del IMC de los hombres, listados en el conjun-to de datos 1 del apéndice B, y sólo 12 de los 40 valores muestrales del IMC delas mujeres. ¿Cambian los resultados si se emplean los 40 valores muestralesde los hombres y los 40 valores muestrales de las mujeres? Utilice la prueba desuma de rangos de Wilcoxon.

SOLUCIÓNREQUISITOS Como en el ejemplo anterior, los datos muestrales son inde-pendientes y aleatorios. Además, los tamaños de ambas muestras son mayoresque 10. Los requisitos se satisfacen, así que continuamos con la prueba.

Las hipótesis nula y alternativa son iguales a las del ejemplo anterior. En vezde calcular manualmente las sumas de los rangos, nos remitimos a la pantalla deMinitab que se incluye aquí. En esta pantalla de Minitab, “ETA1” y “ETA2” de-notan la mediana de la primera muestra y la mediana de la segunda muestra, res-pectivamente. Los componentes fundamentales de la pantalla de Minitab son lossiguientes: la suma de rangos para los valores del IMC de los hombres es W �1727.5, el valor P es 0.3032 (o 0.3031 después de un ajuste por los empates).Puesto que el valor P es mayor que el nivel de significancia de 0.05, no rechaza-mos la hipótesis nula. No existe evidencia suficiente para justificar el rechazo dela aseveración de que los hombres y las mujeres tienen valores de IMC con me-dianas iguales. Se sabe que los hombres suelen ser más altos y más pesados quelas mujeres, aunque los datos utilizados aquí sugieren que los valores del IMCson aproximadamente iguales para los hombres y para las mujeres.

z 5R 2 mR

sR5

187 2 169

18.3855 0.98

sR 5Å

n1n2sn1 1 n2 1 1d12

s13ds12ds13 1 12 1 1d12

5 18.385

mR 5n1sn1 1 n2 1 1d

25

13s13 1 12 1 1d2

5 169

13-4 Prueba de la suma de rangos de Wilcoxon para dos muestras independientes 699

13-4 DESTREZAS Y CONCEPTOS BÁSICOSConocimientos estadísticos y pensamiento crítico

1. Prueba de suma de rangos de Wilcoxon. ¿Cuál es la principal diferencia entre la prue-ba de rangos con signo de Wilcoxon y la prueba de la suma de rangos de Wilcoxon?

2. Prueba de suma de rangos de Wilcoxon. El estadístico de prueba de la prueba de lasuma de rangos de Wilcoxon se basa en la suma de rangos R, cuya distribución esaproximadamente normal. ¿La prueba de la suma de rangos de Wilcoxon es una prue-ba paramétrica porque requiere de una distribución normal?

3. Prueba de suma de rangos de Wilcoxon. La prueba de la suma de rangos de Wilco-xon y los métodos de prueba de hipótesis descritos en la sección 9-3 se aplican a dosmuestras independientes. ¿Qué ventaja tiene la prueba de suma de rangos de Wilco-xon sobre la prueba descrita en la sección 9-3?

4. Eficiencia. Remítase a la tabla 13-2 e identifique la eficiencia de la prueba de la sumade rangos de Wilcoxon. ¿Qué nos indica ese valor acerca de la prueba?

Minitab

Uso de la tecnologíaSTATDISK Ingrese los datos en las

columnas de la ventana de datos deStatdisk. Seleccione Analysis de labarra del menú principal, luego selec-cione Wilcoxon Tests, seguido por laopción Rank-Sum Test. Seleccionelas columnas de los datos y luego hagaclic en Evaluate para obtener una pan-talla que incluye las sumas de rangos,el tamaño muestral, el estadístico deprueba, el valor crítico y la conclusión.

MINITAB Primero ingrese los dosconjuntos de datos muestrales en lascolumnas C1 y C2. Luego seleccionelas opciones Stat, Nonparametrics yMann-Whitney, y proceda a ingresarC1 para la primera muestra y C2 parala segunda muestra. El nivel de con-fianza de 95.0 corresponde a un nivelde significancia de a 5 0.05, y el cua-dro “alternate: not equal” se refiere ala hipótesis alternativa, donde “notequal” corresponde a una prueba dehipótesis de dos colas. Minitab da elvalor P y la conclusión.

EXCEL Excel no está programadopara la prueba de la suma de rangos deWilcoxon, pero el complementoDDXL se puede utilizar al seleccionarNonparametric Tests y luego Mann-Whitney Rank Sum.

TI-83>84 PLUS La calculadora TI-83/84 Plus no está programada parala prueba de la suma de rangos de

Wilcoxon, pero se puede utilizar el pro-grama RSTEST. Este programa (di-señado por Michael Lloyd) se puededescargar del sitio http://www.pearso-neducacion.net/Triola. Primero des-cargue e instale el programa. (Tambiéndescargue el programa ZZRANK, ne-cesario para el programa RSTEST).Luego, registre los dos conjuntos dedatos muestrales en forma de lista enL1 y L2. Presione la tecla PRGM yseleccione RSTEST. Presione la teclaENTER dos veces. Cuando aparezcael indicador de GROUP A�, ingreseL1 y presione la tecla ENTER. Cuan-do aparezca el indicador de GROUPB�, ingrese L2 y presione la tecla EN-TER. La segunda suma de rangos sepresentará como el valor de R. Tam-bién aparecerán la media y la desvia-ción estándar basadas en ese valor deR. Presione ENTER nuevamente paraobtener la puntuación z basada en lasegunda suma de rangos.

700 Capítulo 13 Estadística no paramétrica

Identificación de las sumas de rangos. En los ejercicios 5 y 6, utilice un nivel de signifi-cancia de 0.05 con los métodos de esta sección para identificar las sumas de rangos R1 yR2, mR, sR, el estadístico de prueba z, los valores críticos z y luego establezca la conclu-sión sobre una aseveración de medianas iguales.

5.

6.

Uso de la prueba de la suma de rangos de Wilcoxon. En los ejercicios 7 a 12, utilice laprueba de la suma de rangos de Wilcoxon.

7. ¿Los trastornos psiquiátricos severos están relacionados con factores biológicos?Un estudio utilizó tomografía computarizada (TC) por rayos X para reunir datos devolúmenes cerebrales de un grupo de pacientes con trastorno obsesivo-compulsivo yun grupo de control de personas saludables. La lista adjunta presenta los resultadosmuestrales (en mililitros) para volúmenes del hemisferio derecho (según datos de“Neuroanatomical Abnormalities in Obsesive-Compulsive Disorder Detected withQuantitative X-Ray Computed Tomography”, de Luxenberg et al., American Journalof Psychiatry, vol. 145, núm. 9). Utilice un nivel de significancia de 0.01 y pruebela aseveración de que los pacientes obsesivo-compulsivos y las personas saludablestienen la misma mediana de volúmenes cerebrales. Con base en este resultado, ¿pode-mos concluir que el trastorno obsesivo-compulsivo tiene una base biológica?

8. Prueba del efecto de anclaje. Se dio un lapso de 5 segundos a estudiantes de estadís-tica, seleccionados al azar, para estimar el valor de un producto de números; los resul-tados se incluyen en la tabla adjunta. (Vea las Actividades de cooperación en equiposal final del capítulo 3). ¿Parece que las muestras son significativamente diferentes?

Estimados de estudiantes a quienes se pidió calcular 1 3 2 3 3 3 4 3 5 3 6 3 7 3 8

1560 169 5635 25 842 40,320 5000 500 1110 10,000

200 1252 4000 2040 175 856 42,200 49,654 560 800

Estimados de estudiantes a quienes se pidió calcular 8 3 7 3 6 3 5 3 4 3 3 3 2 3 1

100,000 2000 42,000 1500 52,836 2050 428 372 300 225 64,582

23,410 500 1200 400 49,000 4000 1876 3600 354 750 640

9. Prueba de hipótesis de la diferencia de la antigüedad de automóviles y taxis.Cuando el autor visitó Dublín en Irlanda, registró la antigüedad de automóviles y ta-xis seleccionados al azar. A continuación se listan las antigüedades (en años). Utiliceun nivel de significancia de 0.05 para probar la aseveración de que existe una diferen-cia entre la mediana de la antigüedad de un automóvil de Dublín y la mediana de laantigüedad de un taxi de Dublín. Podríamos esperar que los taxis fueran más nuevos,pero, ¿qué sugieren los resultados?

Taxis

8 8 0 3 8 4 3 3 6 11

7 7 6 9 5 10 8 4 3 4

Automóviles

4 0 8 11 14 3 4 4 3 5

8 3 3 7 4 6 6 1 8 2 15

11 4 1 6 1 8

Grupo de control

0.519 0.476 0.413 0.429

0.501 0.402 0.349 0.594

0.334 0.483 0.460 0.445

Pacientes obsesivo-compulsivos

0.308 0.210 0.304 0.344

0.407 0.455 0.287 0.288

0.463 0.334 0.340 0.305

Valores de la muestra 1: 2 7 10 16 20 22 23 26 27 30 33

Valores de la muestra 2: 3 4 11 14 28 35 40 46 47 52 53 60

Valores de la muestra 1: 8 15 27 39 45 62 68 72 77 80 87

Valores de la muestra 2: 3 5 9 11 14 21 33 44 61 70 85

13-4 Prueba de la suma de rangos de Wilcoxon para dos muestras independientes 701

10. Pulsos. Remítase al conjunto de datos 1 del apéndice B, para los pulsos de hombres ymujeres. Utilice únicamente las primeros 13 pulsos de los hombres y únicamente losprimeros 12 pulsos de las mujeres para probar la aseveración de que las dos muestrasde pulsos provienen de poblaciones con la misma mediana. Utilice un nivel de signifi-cancia de 0.05.

11. Conjunto de datos grande del apéndice B: Pulsos. Repita el ejercicio 10 utilizandolos 40 pulsos de los hombres y los 40 pulsos de las mujeres.

12. Conjunto de datos grande del apéndice B: Pesos de peniques. Remítase al conjuntode datos 14 del apéndice B y utilice los pesos de los “peniques de trigo” y los pesos delos peniques acuñados antes de 1983. Utilice un nivel de significancia de 0.05 paraprobar la aseveración de que las dos muestras provienen de poblaciones con la mismamediana.

13-4 MÁS ALLÁ DE LO BÁSICO13. Uso de la prueba U de Mann-Whitney. La prueba U de Mann-Whitney es equiva-

lente a la prueba de la suma de rangos de Wilcoxon para muestras independientes, yaque ambas se aplican a las mismas situaciones y siempre llevan a las mismas conclu-siones. En la prueba U de Mann-Whitney calculamos

donde

Utilice las mediciones del IMC de la tabla 13-5 de esta sección y calcule el estadísticode prueba z para la prueba U de Mann-Whitney y compárelo con el estadístico deprueba z que se calculó utilizando la prueba de la suma de rangos de Wilcoxon.

12. Cálculo de valores críticos. Suponga que tenemos dos tratamientos (A y B) queproducen resultados cuantitativos, y que tenemos sólo dos observaciones del trata-miento A y dos observaciones del tratamiento B. No podemos utilizar el estadísticode prueba descrito en esta sección puesto que ambos tamaños muestrales no exce-den de 10.

a. Complete la tabla adjunta listando los cinco renglones que corresponden a losotros cinco casos y registre las sumas de rangos correspondientes del tratamien-to A.

b. Haga una lista de los valores posibles de R, junto con sus probabilidades corres-pondientes. [Suponga que los renglones de la tabla del inciso a) son igualmenteprobables].

c. ¿Es posible, con un nivel de significancia de 0.10, rechazar la hipótesis nula de queno existe diferencia entre los tratamientos A y B? Explique.

U 5 n1n2 1n1sn1 1 1d

22 R

z 5

U 2n1n2

2

Ån1n2sn1 1 n2 1 1d

12

Rango Suma de rangos 1 2 3 4 del tratamiento A

A A B B 3

702 Capítulo 13 Estadística no paramétrica

13-5 Prueba de Kruskal-WallisConcepto clave En esta sección se describe la prueba de Kruskal-Wallis, queutiliza rangos de datos de tres o más muestras independientes para probar la hipó-tesis nula de que las muestras provienen de poblaciones con medianas iguales.

En la sección 12-2 utilizamos el análisis de varianza de un factor (ANOVA)para probar la hipótesis nula de que tres o más poblaciones tienen la misma media,pero el ANOVA requiere que todas las poblaciones implicadas tengan distribucio-nes normales. La prueba de Kruskal-Wallis no requiere distribuciones normales.

DefiniciónLa prueba de Kruskal-Wallis (también llamada la prueba H) es una pruebano paramétrica que utiliza rangos de datos muestrales de tres o más poblacio-nes independientes. Se utiliza para probar la hipótesis nula de que las mues-tras independientes provienen de poblaciones con medianas iguales; la hipó-tesis alternativa es la aseveración de que las poblaciones tienen medianas queno son iguales.

H0: Las muestras provienen de poblaciones con medianas iguales.

H1: Las muestras provienen de poblaciones con medianas que no son iguales.

Para aplicar la prueba de Kruskal-Wallis, calculamos el estadístico de prueba H,el cual tiene una distribución que puede aproximarse por medio la distribuciónchi cuadrada, siempre y cuando cada muestra tenga al menos cinco observacio-nes. Cuando utilizamos la distribución chi cuadrada en este contexto, el númerode grados de libertad es k 2 1, donde k es el número de muestras. (Para una revi-sión rápida de las características clave de la distribución chi cuadrada, véase lasección 7-5).

Prueba de Kruskal-Wallis

Requisitos

1. Tenemos al menos tres muestras independientes, las cuales se seleccionan al azar.

2. Cada muestra tiene al menos cinco observaciones. (Si las muestras tienen menosde cinco observaciones, remítase a tablas especiales de valores críticos, como lasCRC Standard Probability and Statistics Tables and Formulae, publicadas porCRC Press).

3. No existe el requisito de que las poblaciones tengan una distribución normal oalguna otra distribución particular.

Notación

N � número total de observaciones en todas las muestras combinadas

k � número de muestras

R1 � suma de los rangos de la muestra 1, que se calcula utilizando el procedimientoque se describe a continuación

n1 � número de observaciones de la muestra 1

Para la muestra 2, la suma de los rangos es R2 y el número de observaciones es n2, yse utiliza una notación similar para las otras muestras.

13-5 Prueba de Kruskal-Wallis 703

Estadístico de prueba

Valores críticos

1. La prueba es de cola derecha.

2. gl � k 2 1. (Puesto que el estadístico de prueba H puede aproximarse por mediode una distribución chi cuadrada, utilice la tabla A-4 con k 2 1 grados de liber-tad, donde k es el número de muestras diferentes).

H 512

NsN 1 1d a

R12

n11

R22

n21 # # # 1

R2k

nkb 2 3sN 1 1d

Procedimiento para calcular el valor del estadístico de prueba H

1. Combine temporalmente todas las muestras en una muestra grande y asigne unrango a cada valor muestral. (Ordene los valores del menor al mayor, y en casode empates, asigne a cada observación la media de los rangos implicados).

2. En cada muestra, calcule la suma de los rangos y calcule el tamaño muestral.

3. Calcule H utilizando los resultados del paso 2, con la notación y el estadísticode prueba descritos en el recuadro anterior.

El estadístico de prueba H es básicamente una medida de la varianza de las su-mas de rangos R1, R2, . . . , Rk. Si los rangos están distribuidos de forma equitativaentre los grupos muestrales, entonces H debe ser un número relativamente peque-ño. Si las muestras son muy diferentes, entonces los rangos serán excesivamentebajos en algunos grupos y altos en otros, con el efecto neto de que H será grande.En consecuencia, sólo los valores grandes de H nos llevan al rechazo de la hipóte-sis nula de que las muestras provienen de poblaciones idénticas. La prueba deKruskal-Wallis es, por lo tanto, una prueba de cola derecha.

EJEMPLO Efectos de tratamientos en los pesos de álamos Latabla 13-6 lista los pesos (en kg) de álamos que recibieron tratamientos diferen-tes. En la sección 12-2 utilizamos el análisis de varianza para probar la hipóte-sis nula de que las cuatro muestras de pesos provienen de poblaciones con lamisma media. Ahora usaremos la prueba de Kruskal-Wallis para probar la hi-pótesis nula de que las cuatro muestras provienen de poblaciones con medianasiguales.

SOLUCIÓNREQUISITO La prueba de Kruskal-Wallis requiere de tres o más muestrasaleatorias e independientes, con al menos 5 valores cada una. Las cuatro mues-tras son independientes y aleatorias, y cada una tiene 5 valores. Una vez satis-fechos todos los requisitos, procedemos con la prueba.

Las hipótesis nula y alternativa son las siguientes:

H0: Las poblaciones de los pesos de álamos con los cuatro tratamien-tos tienen medianas iguales.

H1: Las medianas de las cuatro poblaciones no son todas iguales.

continúa

704 Capítulo 13 Estadística no paramétrica

Tabla 13-6 Pesos (en kg) de álamos

Tratamiento

Ninguno Fertilizante Riego Fertilizante y riego

0.15 (8) 1.34 (18) 0.23 (12) 2.03 (19)0.02 (1.5) 0.14 (7) 0.04 (3) 0.27 (13)0.16 (9.5) 0.02 (1.5) 0.34 (14) 0.92 (16)0.37 (15) 0.08 (5.5) 0.16 (9.5) 1.07 (17)0.22 (11) 0.08 (5.5) 0.05 (4) 2.38 (20)

n1 5 5 n2 5 5 n3 5 5 n4 5 5R1 5 45 R2 5 37.5 R3 5 42.5 R4 5 85

Para determinar el valor del estadístico de prueba H, primero tenemos que or-denar en rangos todos los datos. Comenzamos con los valores más bajos de0.02 y 0.02. Como hay un empate entre los valores correspondientes a los rangos1 y 2, asignamos el rango medio de 1.5 a cada uno de los valores empata-dos. En la tabla 13-6 los rangos aparecen entre paréntesis, junto al peso originaldel árbol. Después calculamos el tamaño muestral n y la suma de rangos Rpara cada muestra, los cuales se presentan en la parte inferior de la tabla 13-6.Puesto que el número total de observaciones es 20, tenemos N � 20. Ahora po-demos evaluar el estadístico de prueba de la siguiente manera:

Puesto que cada muestra tiene al menos cinco observaciones, la distribución deH es aproximadamente una distribución chi cuadrada con k 2 1 grados de li-bertad. El número de muestras es k � 4, entonces tenemos 4 2 1 � 3 gradosde libertad. Remítase a la tabla A-4 para encontrar el valor crítico de 7.815, quecorresponde a 3 grados de libertad y a un nivel de significancia de 0.05 (conuna área de 0.05 en la cola derecha).

El estadístico de prueba H � 8.214 está en la región crítica acotada por7.815; por lo tanto, rechazamos la hipótesis nula de medianas iguales. (En lasección 12-2, rechazamos la hipótesis nula de medias iguales).

INTERPRETACIÓN Existe suficiente evidencia para rechazar la aseveración deque la población de los pesos de álamos con los cuatro tratamientos tienen me-dianas iguales. Parece que al menos una de las medianas difiere de las demás.

Fundamentos: El estadístico de prueba H de la prueba de Kruskal-Wallis esla versión con rangos del estadístico de prueba F utilizado en el análisis de varianzaque se estudió en el capítulo 12. Cuando tratamos con rangos R en vez de valoresx originales, muchos componentes están predeterminados. Por ejemplo, la sumade todos los rangos puede expresarse como donde N es el númerototal de valores en todas las muestras combinadas. La expresión

H 512

NsN 1 1d SnisRi 2 R d2

NsN 1 1d>2,

5 8.214

512

20s20 1 1d a

452

51

37.52

51

42.52

51

852

5b 2 3s20 1 1d

H 512

NsN 1 1d a

R21

n11

R22

n21 # # # 1

R2k

nkb 2 3sN 1 1d

13-5 Prueba de Kruskal-Wallis 705

donde

combina varianzas ponderadas de rangos para producir el estadístico de prueba Hque se dio aquí. Esta expresión de H es equivalente en términos algebraicos a laexpresión de H que se dio antes como estadístico de prueba.

Ri 5Ri

ni��y��R 5

SRi

Sni

Uso de la tecnología

STATDISK Ingrese los datos en lascolumnas de la ventana de datos. Se-leccione Analysis de la barra del menúprincipal, luego seleccione Kruskal-Wallis Test y proceda a seleccionar lascolumnas de datos. STATDISK des-plegará en la pantalla la suma de losrangos para cada muestra, el estadísti-co de prueba H, el valor crítico y la

conclusión. Véase la pantalla adjuntade STATDISK para el ejemplo de estasección.

MINITAB Remítase al manual Mi-nitab Student Laboratory Manual andWorkbook para ver el procedimientoque se requiere para utilizar las opcio-nes Stat, Nonparametrics y Krus-kal-Wallis. La idea básica es haceruna lista de todos los datos muestralesen una gran columna, con otra columna

que identifique la muestrapara los valores correspon-dientes. Para los datos de latabla 13-6, ingrese los 20valores en la columna C1 deMinitab. En la columna C2,ingrese cinco números 1seguidos de cinco números2, de cinco números 3 y decinco números 4. Ahora se-leccione Stat, Nonparame-trics y Kruskal-Wallis. Enel cuadro de diálogo, ingre-se C1 para la respuesta, C2para el factor y haga clic enOK. La pantalla de Mini-tab incluye el estadístico deprueba H y el valor P.

EXCEL Excel no está programadopara la prueba de Kruskal-Wallis, perose puede usar el complemento DDXLseleccionando Nonparametric Tests yKruskal-Wallis. Los datos muestralesdeben aparecer en una columna y losnombres de las muestras deben apare-cer en otra columna (Factor).

TI-83>84 PLUS La calculadora TI-83/84 Plus no está programada para laprueba de Kruskal-Wallis, pero se puedeusar el programa KWTEST. Este progra-ma (desarrollado por Michael Lloyd) sedescarga del sitio http://www.pearsone-ducacion.net/Triola. Primero descargue einstale el programa. (También descargueel programa ZZRANK, necesario para elprograma KWTEST). Después, registrela lista de datos muestrales en columnasseparadas de la matriz [A]. Presione latecla PRGM, seleccione KWTEST yluego presione la tecla ENTER. Lacalculadora dará el valor del estadísticode prueba y el número de grados delibertad. (Nota: Si las muestras tienen ta-maños diferentes y uno de los valoresde los datos es cero, añada una constanteadecuada a todos los valores muestralespara evitar la presencia de ceros).

13-5 DESTREZAS Y CONCEPTOS BÁSICOSConocimientos estadísticos y pensamiento crítico

1. Prueba de Kruskal-Wallis. ¿Cuál es la principal ventaja de la prueba de Kruskal-Wallis sobre la prueba del análisis de varianza de un factor?

2. Prueba de Kruskal-Wallis. Si se utiliza la prueba de Kruskal-Wallis y el análisis devarianza de un factor con tres conjuntos de muestras independientes, ¿ambas pruebassiempre conducirán a la misma conclusión?

3. Eficiencia. Remítase a la tabla 13-2 e identifique la eficiencia de la prueba de Krus-kal-Wallis. ¿Qué nos indica ese valor acerca de la prueba?

STATDISK

706 Capítulo 13 Estadística no paramétrica

4. Requisitos. Se seleccionan 50 familias al azar y se aplican pruebas de CI a la madre,al padre y al primogénito. ¿Se puede utilizar la prueba de Kruskal-Wallis para probarla aseveración de que las tres poblaciones de madres, padres y primogénitos tienenpuntuaciones de CI con la misma mediana? ¿Por qué?

Uso de la prueba de Kruskal-Wallis. En los ejercicios 5 a 10, utilice la prueba de Kruskal-Wallis.

5. ¿Afecta el peso de un automóvil las heridas en la cabeza producidas en un cho-que? Se obtuvieron datos de experimentos de choques realizados por la NationalTransportation Safety Administration. Se compraron automóviles nuevos, se impacta-ron contra una barrera fija a 35 mi/h y se registraron las mediciones en un maniquí enel asiento del conductor. Utilice los datos muestrales listados abajo para probar las di-ferencias en las mediciones de heridas en la cabeza (de acuerdo con el Head InjuryCriterion, HIC) en cuatro categorías de peso. ¿Existe evidencia suficiente para con-cluir que las mediciones de heridas en la cabeza para las cuatro categorías de peso deautomóviles no son las mismas? ¿Sugieren los datos que los automóviles más pesadosson más seguros en un choque?

Subcompacto: 681 428 917 898 420

Compacto: 643 655 442 514 525

Mediano: 469 727 525 454 259

Grande: 384 656 602 687 360

6. ¿Afecta el peso de un automóvil las heridas en el pecho producidas en un cho-que? Se obtuvieron datos de experimentos de choques realizados por la NationalTransportation Safety Administration. Se compraron automóviles nuevos y se impac-taron contra una barrera fija a 35 mi/h; abajo se presentan los datos de desaceleracióndel pecho (g). Utilice los datos para probar la hipótesis nula de que las diferentes cate-gorías de peso tienen medianas que no son iguales. ¿Sugieren los datos que los auto-móviles más pesados son más seguros en un choque?

Subcompacto: 55 47 59 49 42

Compacto: 57 57 46 54 51

Mediano: 45 53 49 51 46

Grande: 44 45 39 58 44

7. ¿La energía solar es la misma todos los días? Un alumno del autor vive en una casacon sistema eléctrico solar. A la misma hora de cada día, reúne lecturas de voltaje conun medidor conectado al sistema y los resultados se listan en la tabla al margen. Utili-ce un nivel de significancia de 0.05 y pruebe la aseveración de que las lecturas de vol-taje tienen la misma mediana para los tres diferentes tipos de día. Podríamos esperarque un sistema solar proporcione más energía eléctrica en días soleados que en díasnublados o lluviosos. ¿Podemos concluir que los días soleados dan como resultadomayores cantidades de energía eléctrica?

8. Prueba de diferencias de amplitud craneana en distintas épocas. Los valores ad-juntos son amplitudes máximas medidas de cráneos de hombres egipcios de diferen-tes épocas (según datos de Ancient Races of the Thebaid, de Thomson y Randall-Ma-civer). Los cambios en la forma de la cabeza a través del tiempo sugieren que ocurriómestizaje con poblaciones inmigrantes. Utilice un nivel de significancia de 0.05 ypruebe la aseveración de que las tres muestras provienen de poblaciones idénticas.¿Sugieren los datos un mestizaje de culturas?

9. Ejercicio y estrés. Se realizó un estudio para investigar los efectos del ejercicio sobreel estrés. La siguiente tabla lista lecturas de presión sanguínea sistólica (en mmHg)de sujetos, antes de iniciar 25 minutos de ejercicio aeróbico en bicicleta y antes degenerarles estrés por medio de una prueba de aritmética y otra de expresión verbal(según datos de “Sympathoadrenergic Mechanisms in Reduced Hemodynamic StressResponses after Exercise”, de Kim Brownley et al., Medicine and Science in Sports and

Datos del ejercicio 8

4000 a.C. 1850 a.C. 150 d.C.

131 129 128

138 134 138

125 136 136

129 137 139

132 137 141

135 129 142

132 136 137

134 138 145

138 134 137

Datos del ejercicio 7

Soleado Nublado Lluvioso

13.5 12.7 12.1

13.0 12.5 12.2

13.2 12.6 12.3

13.9 12.7 11.9

13.8 13.0 11.6

14.0 13.0 12.2

13-5 Prueba de Kruskal-Wallis 707

Exercise, vol. 35, núm. 6). Utilice un nivel de significancia de 0.05 para probar la aseve-ración de que los diferentes grupos de sujetos tienen la misma mediana de la presiónsanguínea. Con base en los resultados, ¿se puede considerar que los grupos son mues-tras de la misma población?

Mujer afroam. Hombre afroam. Mujer caucásica Hombre caucásico

117.00 115.67 119.67 124.33

130.67 120.67 106.00 111.00

102.67 133.00 108.33 99.67

93.67 120.33 107.33 128.33

96.33 124.67 117.00 102.00

92.00 118.33 113.33 127.33

10. Prueba de laboratorio de inflamabilidad de ropa de dormir para niños. Se reali-zaron pruebas de inflamabilidad en ropa de dormir para niños. Se utilizó la pruebaVertical Semirestrained, en la cual se quemaron piezas de tela en condiciones contro-ladas. Después de apagar el fuego, se midió y registró la longitud de la porciónquemada. Al margen se presentan los resultados para la misma tela probada en labo-ratorios diferentes. Puesto que se utilizó la misma tela, los diferentes laboratoriosdeberían haber obtenido los mismos resultados. ¿Fue así?

En los ejercicios 11 y 12, use la prueba de Kruskal-Wallis con el conjunto de datos delapéndice B.

11. Conjunto de datos del apéndice B: Pesos de peniques. Remítase al conjunto de da-tos 14 del apéndice B y use los pesos de los “peniques indios”, los “peniques de tri-go”, los peniques acuñados antes de 1983 y los acuñados después de 1983. Utilice unnivel de significancia de 0.05 para probar la aseveración de que la mediana del pesode los peniques es la misma para las cuatro categorías diferentes. Con base en los re-sultados, ¿parece que la máquina que acuña las monedas puede tratar los pesos de lospeniques de la misma forma?

12. Conjunto de datos del apéndice B: ¿Pesan lo mismo los dulces M&M de todos loscolores? Remítase al conjunto de datos 13 del apéndice B. Con un nivel de signifi-cancia de 0.05, pruebe la aseveración de que los pesos correspondientes a la medianade los dulces M&M son iguales para cada una de las seis poblaciones de colores dife-rentes. Si la intención de Mars Inc. es hacer los dulces para que las diferentes pobla-ciones de color sean las mismas, ¿sugieren sus resultados que la compañía tiene unproblema que requiere de una acción correctiva?

13-5 MÁS ALLÁ DE LO BÁSICO13. Corrección del estadístico de prueba H por empates. Al emplear la prueba de

Kruskal-Wallis, existe un factor de corrección que debe aplicarse siempre que existanmuchos empates: divida H entre

Para cada grupo de observaciones empatadas en el conjunto combinado de datosmuestrales, calcule T � t3 � t, donde t es el número de observaciones que están em-patadas en el grupo individual. Calcule t para cada grupo de valores empatados, luegocalcule el valor de T para cada grupo, y después sume los valores T para obtener ST.El número total de observaciones en todas las muestras combinadas es N. Utilice esteprocedimiento para calcular el valor corregido de H para el ejercicio 7. ¿El valor co-rregido de H difiere sustancialmente del valor calculado en el ejercicio 7?

14. Pruebas equivalentes. Demuestre que para el caso de dos muestras, la prueba deKruskal-Wallis es equivalente a la prueba de la suma de rangos de Wilcoxon. Esto

1 2ST

N3 2 N

>>>>

Datos del ejercicio 10

Laboratorio

1 2 3 4 5

2.9 2.7 3.3 3.3 4.1

3.1 3.4 3.3 3.2 4.1

3.1 3.6 3.5 3.4 3.7

3.7 3.2 3.5 2.7 4.2

3.1 4.0 2.8 2.7 3.1

4.2 4.1 2.8 3.3 3.5

3.7 3.8 3.2 2.9 2.8

3.9 3.8 2.8 3.2

3.1 4.3 3.8 2.9

3.0 3.4 3.5

2.9 3.3

708 Capítulo 13 Estadística no paramétrica

puede hacerse demostrando que para el caso de dos muestras, el estadístico de prue-ba H es igual al cuadrado del estadístico de prueba z que se utiliza en la prueba de lasuma de rangos de Wilcoxon. Además, note que con 1 grado de libertad, los valorescríticos de x2 corresponden al cuadrado de la puntuación crítica z.

13-6 Correlación de rangosConcepto clave En esta sección se describe el método no paramétrico de la co-rrelación de rangos, el cual se utiliza con datos apareados para probar una asocia-ción entre dos variables. En el capítulo 10 utilizamos datos muestrales apareadospara calcular valores del coeficiente de correlación lineal r, pero en esta secciónutilizaremos rangos como base para calcular el coeficiente de correlación de ran-gos rs.

DefiniciónLa prueba de correlación de rangos (o prueba de correlación de rangosde Spearman) es una prueba no paramétrica que utiliza rangos de datosmuestrales consistentes en datos apareados. Se utiliza para probar una asocia-ción entre dos variables, por lo que las hipótesis nula y alternativa son las siguientes (donde rs denota el coeficiente de correlación de rangos de la población completa):

H0: rs 5 0 (No existe correlación entre las dos variables).

H1: rs � 0 (Existe una correlación entre las dos variables).

Ventajas: La correlación de rangos tiene las siguientes ventajas sobre los mé-todos paramétricos analizados en el capítulo 10:

1. El método no paramétrico de correlación de rangos puede utilizarse en una varie-dad más amplia de circunstancias que el método paramétrico de correlación lineal.Con la correlación de rangos, podemos analizar datos apareados que sean rangoso puedan convertirse en rangos. Por ejemplo, si dos jueces califican a 30 gimnas-tas, podemos utilizar la correlación de rangos, pero no la correlación lineal. Adiferencia de los métodos paramétricos del capítulo 10, el método de correla-ción de rangos no requiere una distribución normal de cualquier población.

2. La correlación de rangos puede utilizarse para detectar algunas relaciones (notodas) que no son lineales. (Más adelante se dará un ejemplo en esta sección).

Desventaja: Una desventaja de la correlación de rangos es su tasa de eficien-cia de 0.91, como se describe en la sección 13-1. Esta tasa de eficiencia indicaque, con todas las demás circunstancias iguales, el método no paramétrico de co-rrelación de rangos requiere de 100 pares de datos muestrales para tener los mis-mos resultados que sólo 91 pares de observaciones muestrales analizadas a travésdel método paramétrico, suponiendo que los requisitos más estrictos del métodoparamétrico se satisfacen.

Utilizamos la notación rs para el coeficiente de correlación de rangos para noconfundirlo con el coeficiente de correlación lineal r. El subíndice s no tiene nadaque ver con la desviación estándar; se usa en honor de Charles Spearman (1863-1945), quien originó el método de correlación de rangos. De hecho, rs suele lla-marse coeficiente de correlación de rangos de Spearman. El procedimiento dela correlación de rangos se resume en la figura 13-4.

13-6 Correlación de rangos 709

Figura 13-4 Procedimiento de correlación de rangos para probar H0: rs 5 0

No

¿Cualquiera de las variables tiene

empates entre sus rangos?

Calcule los valores críticos

donde z corresponde al nivel de significancia.

rs 5 6Ïn 2 1

z

Complete el cálculo de

obtener el estadístico de prueba.

rs 5 1 2 6Sd 2

n (n2 2 1)

Calcule rs utilizando la fórmula 10-1 con los rangos:

rs 5 nSxy 2 (Sx) (Sy)

Ïn (Sx 2) 2 (Sx)2 Ïn (Sy 2) 2 (Sy)2

Calcule la diferencia d para cada par de rangos, restando el rango menor del rango mayor.

Eleve al cuadrado cada diferencia d y luego calcule la suma de estos cuadrados para obtener S(d 2).

¿Es n # 30?

Encuentre los valores críticos de rs en la tabla A-9.

Si )rs) excede al valor crítico positivo, rechace H0: rs 5 O y concluya que hay una correlación. Si el estadístico de prueba rs es negativo y es menor que el valor crítico negativo, existe una correlación. Si el estadístico de prueba rs está entre los valores críticos positivo y negativo, no hay correlación.

Convierta los datos de la primera muestra a rangos de 1 hasta n y luego haga lo mismo para la segunda muestra.

No

No

StartInicio

¿Los n pares de datos están en forma de rangos?

para

710 Capítulo 13 Estadística no paramétrica

Correlación de rangos

Requisitos

1. Los datos muestrales apareados se seleccionaron aleatoriamente.

2. A diferencia de los métodos paramétricos de la sección 10-2, no existe el requi-sito de que los datos muestrales apareados tengan una distribución normal biva-riada (como se describió en la sección 10-2). No existe el requisito de una distri-bución normal para cualquier población.

Notación

rs 5 coeficiente de correlación de rangos para datos muestrales apareados (rs es unestadístico muestral)

rs 5 coeficiente de correlación de rangos para todos los datos poblacionales (rs esun parámetro poblacional)

n 5 número de pares de datos muestrales

d 5 diferencia entre los rangos de los dos valores dentro de un par

Estadístico de prueba

Sin empates: Después de convertir los datos de cada muestra a rangos, si no existenempates entre los rangos para la primera variable y no existen empates entre los ran-gos para la segunda variable, el valor exacto del estadístico de prueba puede calcu-larse utilizando esta fórmula:

Empates: Después de convertir los datos de cada muestra a rangos, si cualquier va-riable tiene empates entre sus rangos, el valor exacto del estadístico de prueba rspuede calcularse utilizando la fórmula 10-1 con los rangos:

Valores críticos

1. Si n � 30, los valores críticos se encuentran en la tabla A-9.

2. Si n � 30, los valores críticos de rs se calculan utilizando la fórmula 13-1.

Fórmula 13-1 (valores críticos cuando n > 30)

donde el valor de z corresponde al nivel de significancia. (Por ejemplo, si a � 0.05,z � 1.96).

rs 56z2n 2 1

rs 5nSxy 2 sSxdsSyd2nsSx2d 2 sSxd2 2nsSy2d 2 sSyd2

rs 5 1 26Sd 2

nsn2 2 1d

EJEMPLO Clasificación de universidades por estudiantes y elU.S. News and World Report El problema del capítulo incluye las cla-sificaciones de universidades por parte de estudiantes y de la revista

U.S. News and World Report. Esta clasificación está incluida en la tabla 13-7,que también incluye las diferencias d y los cuadrados de las diferencias d2.Calcule el valor del coeficiente de correlación de rangos y utilícelo para de-terminar si existe una correlación entre la clasificación de los estudiantes y laclasificación de la revista. Use un nivel de significancia de 0.05.

PR

OBLEMA

DE

L

C A PÍTUL

O13

13-6 Correlación de rangos 711

Tabla 13-7 Universidades clasificadas por estudiantes y por U.S. News and World Report

Clasificación según Clasificación según DiferenciaUniversidad la preferencia la revista U.S. News d

de los estudiantes and World Report

Harvard 1 1 0 0Yale 2 2 0 0Cal. Inst. of Tech. 3 5 2 4M.I.T. 4 4 0 0Brown 5 7 2 4Columbia 6 6 0 0U. de Penn. 7 3 4 16Notre Dame 8 8 0 0

Total: 24

d 2

SOLUCIÓNREQUISITO El único requisito es que los datos muestrales apareados seanelegidos al azar. Las universidades incluidas se eligieron al azar entre aquellasque estaban disponibles, de manera que procedemos con la prueba.

El coeficiente de correlación lineal r (sección 10-2) no debe utilizarsepuesto que requiere de distribuciones normales, y los datos consisten en rangosque no están distribuidos normalmente. En vez de ello, utilizamos el coeficien-te de correlación de rangos para probar una relación entre los rangos de los es-tudiantes y de la revista.

Las hipótesis nula y alternativa son las siguientes:

H0: rs 5 0H1: rs 0

Siguiendo el procedimiento de la figura a 13-4, los datos están en forma derangos y ninguna de las dos variables tiene empates entre los rangos, por lo queel valor exacto del estadístico de prueba puede calcularse como se indica aba-jo. Utilizamos n � 8 (para 8 pares de datos) y Sd2 � 24 (como se indica en latabla de 13-7) para obtener

Ahora nos remitimos a la tabla de A-9 para determinar que los valores críti-cos son 60.738 (con a � 0.05 y n � 8). Puesto que el estadístico de pruebars � 0.714 no excede al valor crítico de 0.738, no rechazamos la hipótesisnula. No existe suficiente evidencia para sustentar una aseveración de correla-ción entre la clasificación de los estudiantes y la clasificación de la revista. Pa-rece que en lo que se refiere a la clasificación de universidades, los estudiantesy la revista no coinciden. (Si coincidieran, habría una correlación significativa,pero no la hay).

5 1 2144

5045 0.714

rs 5 1 26Sd2

nsn2 2 1d5 1 2

6s24d8s82 2 1d

2

Vínculo directo entre el tabaquismoy el cáncer

Cuando encontramos una corre-lación estadística entre dos va-riables, debemos ser sumamentecuidadosos para evitar el errorde concluir que existe un víncu-lo de causa y efecto. La indus-tria tabacalera ha enfatizado unay otra vez que la correlación noimplica causalidad. Sin embar-go, el doctor David Sidransky,de la John Hopkins Univer-sity, asegura: “Tenemos pruebasmoleculares tan fuertes quepodemos estudiar un caso de cán-cer individual y, potencialmen-te, con base en los patrones decambio genético, determinar sifumar cigarrillos fue la causa deese cáncer”. A partir de sus ha-llazgos, también afirma que“el fumador tuvo una incidenciamucho más alta de mutación, loque se confirmó con el patróntan claro de mutaciones... así queprácticamente encontramos lapistola humeante”. Aunque losmétodos estadísticos no puedenprobar que fumar causa cáncer,con evidencia física como la quepresenta el doctor Sidransky esposible establecer demostracio-nes como ésta.

712 Capítulo 13 Estadística no paramétrica

Tabla 13-8 Puntuaciones de pinball (rangos entre paréntesis)

Númerode juegos 9 (2) 13 (4) 21 (5) 6 (1) 52 (7) 78 (8) 33 (6) 11 (3) 120 (9)

Puntuación 22 (2) 62 (4) 70 (6) 10 (1) 68 (5) 73 (8) 72 (7) 58 (3) 75 (9)d 0 0 1 0 2 0 1 0 0

0 0 1 0 4 0 1 0 0d 2

EJEMPLO Caso de muestra grande Suponga que el ejemplo anterior seamplía para incluir un total de 40 universidades y que se encuentra que el esta-dístico de prueba rs es 0.300. Si el nivel de significancia es a � 0.05, ¿quéconcluye usted acerca de la correlación?

SOLUCIÓN Puesto que existen 40 pares de datos, tenemos n � 40. Como nexcede a 30, calculamos los valores críticos con la fórmula 13-1, en vez de em-plear la tabla A-9. Con a � 0.05 en dos colas, permitimos que z � 1.96 paraobtener

El estadístico de prueba rs � 0.300 no excede al valor crítico de 0.314, por lotanto, no rechazamos la hipótesis nula. No existe suficiente evidencia para sus-tentar la aseveración de una correlación entre los estudiantes y la revista.

El siguiente ejemplo tiene la intención de ilustrar el principio de que la corre-lación de rangos algunas veces se puede utilizar para detectar relaciones que noson lineales.

EJEMPLO Detección de un patrón no lineal Se utiliza una máquina de pin-ball Raiders of the Lost Ark (modelo L-7) para medir el aprendizaje que resultade repetir funciones manuales. Los sujetos se seleccionaron para que fueransimilares en características importantes de edad, género, inteligencia, educación,etcétera. La tabla 13-8 lista los números de juegos que se realizaron y lasúltimas puntuaciones (en millones) de sujetos seleccionados al azar del grupocon características similares. Esperamos que haya una asociación entre el núme-ro de juegos realizados y la puntuación del pinball. ¿Existe suficiente evidenciapara sustentar la aseveración de que existe una asociación como ésta?

SOLUCIÓN Probaremos la hipótesis nula de inexistencia de correlación derangos (rs 5 0).

H0: rs 5 0 (sin correlación)

H1: rs 0 (correlación)

Remítase a la figura 13-4, la cual seguimos para esta solución. Las puntua-ciones originales no son rangos, así que las convertimos a rangos y colocamoslos resultados entre paréntesis en la tabla 13-8. (En la sección 13-1 se describeel procedimiento para convertir puntuaciones en rangos). No hay empates entre

2

rs 561.96240 2 1

5 60.314

13-6 Correlación de rangos 713

los rangos del número de juegos realizados, ni hay empates entre los rangos de laspuntuaciones, de manera que procedemos a calcular las diferencias d y luegolas elevamos al cuadrado. La suma de los valores de d2 es 6. Ahora calculamos

Continuando con la figura 13-4, tenemos n � 9, por lo que respondemos sícuando se pregunta si n � 30. Utilizamos la tabla A-9 para obtener los valorescríticos de �0.700. Finalmente, el estadístico muestral de 0.950 excede a0.700, por lo que concluimos que existe una correlación significativa. Los nú-meros más altos de juegos parecen estar asociados con puntuaciones más altas.Los sujetos parecen aprender mejor el juego al jugar más.

En el ejemplo anterior, si calculamos el coeficiente de correlación lineal r(utilizando la fórmula 9.1) para los datos originales, obtenemos r � 0.586, lo quenos lleva a la conclusión de que no existe evidencia suficiente para sustentar laaseveración de una correlación lineal significativa al nivel 0.05 de significancia.Si examinamos el diagrama de dispersión de Excel, podemos ver que el patrón depuntos no es un patrón de línea recta. Este último ejemplo ilustra una ventaja delmétodo no paramétrico sobre el método paramétrico: con la correlación de rangos,algunas veces podemos detectar relaciones que no son lineales.

5 1 236

7205 0.950

rs 5 1 26Sd2

nsn2 2 1d5 1 2

6s6d9s92 2 1d

Excel

Uso de la tecnología

STATDISK Anote los datos muestralesen las columnas de la ventana de datos.Seleccione Analysis de la barra del menúprincipal, luego elija Rank Correlation. Se-leccione las dos columnas de datos quese incluirán y luego haga clic en Evaluate.Los resultados de STATDISK incluyen el va-lor exacto del estadístico de prueba rs, el valorcrítico y la conclusión.

MINITAB Ingrese los datos apareadosen las columnas C1 y C2. Si los datos toda-vía no son rangos, utilice las opciones Ma-nip y Rank de Minitab para convertir losdatos a rangos, después seleccione Stat, se-guido por Basic Statistics, y luego Correla-tion. Minitab mostrará en la pantalla el valorexacto del estadístico de prueba rs. AunqueMinitab identifica esto como el coeficientede correlación de Pearson descrito en la sec-ción 10-2, en realidad se trata del coeficientede correlación de Spearman descrito en estasección (puesto que está basado en rangos).

EXCEL Excel no tiene una función quecalcule el coeficiente de correlación de ran-gos a partir de valores muestrales originales,pero el valor exacto del estadístico de pruebars se puede calcular como sigue. Primeroreemplace cada uno de los valores muestralesoriginales por su rango correspondiente.Ingrese estos rangos en las columnas A y B.Haga clic en el botón de función fx localiza-do en la barra del menú principal. Seleccionela categoría de función Statistical y el

nombre de la función CORREL, luego hagaclic en OK. En el cuadro de diálogo, ingreseel rango de la celda de los valores para x, co-mo A1:A10. También ingrese el rango de lacelda de los valores para y, como B1:B10.Excel mostrará en la pantalla el valor exactodel coeficiente de correlación de rango rs.También es posible emplear el complementoDDXL al seleccionar Nonparametric Testsy luego Spearman Rank Test.

TI-83>84 PLUS Sí utilizamos una calcu-ladora TI-83/84 Plus o cualquier otra con es-tadísticos para 2 variables, es posible calcularel valor exacto de rs como sigue: 1. reemplacecada valor muestral por su rango correspon-diente, luego 2. calcule el valor del coefi-ciente de correlación lineal r con los mismosprocedimientos utilizados en la sección 10-2.Ingrese los rangos apareados en las listas L1y L2, después oprima STAT y seleccioneTESTS. El uso de la opción LinRegTTest da-rá como resultado varios valores, incluyendoel valor exacto del coeficiente de correlaciónde rangos rs.

714 Capítulo 13 Estadística no paramétrica

13-6 DESTREZAS Y CONCEPTOS BÁSICOSConocimientos estadísticos y pensamiento crítico

1. Correlación de rango. ¿Qué ventaja importante tiene el método de correlación derangos de esta sección sobre el método de correlación lineal de la sección 10-2?

2. Correlación de rango. Si dos jueces clasifican a 25 gimnastas desde 1 hasta 25 sinempates, y sus clasificaciones coinciden perfectamente, ¿cuál es el valor del coefi-ciente de correlación de rangos?

3. Notación. Representamos el estadístico de prueba del coeficiente de correlación derangos con la notación rs, y el parámetro poblacional correspondiente se representapor rs. ¿Por qué se utiliza el subíndice s? ¿El subíndice s representa la misma desvia-ción estándar s que se estudió en la sección 3-3?

4. Eficiencia. Remítase a la tabla 13-2 e identifique la eficiencia de la prueba de correla-ción de rangos. ¿Qué nos indica ese valor acerca de la prueba?

En los ejercicios 5 y 6, dibuje un diagrama de dispersión, calcule el valor de rs y determi-ne si al parecer existe una correlación entre x y y.

5.

6.

Cálculo de valores críticos. En los ejercicios 7 y 8, calcule el valor (o valores) crítico(s) rsutilizando la tabla A-9 o la fórmula 13-1, según sea más apropiado. Suponga que la hipótesis nula es rs � 0, de manera que la prueba es de dos colas. Además, n denota el número de pares de datos.

7. a. n 5 12, a 5 0.05

b. n 5 20, a 5 0.01

c. n 5 60, a 5 0.05

d. n 5 80, a 5 0.01

8. a. n 5 14, a 5 0.05

b. n 5 23, a 5 0.01

c. n 5 120, a 5 0.01

d. n 5 75, a 5 0.05

Prueba para correlación de rangos. En los ejercicios 9 a 16, utilice el coeficiente de co-rrelación de rangos para probar una correlación entre las dos variables. Utilice un nivelde significancia de a � 0.05.

9. Bolsa de Valores y ventas de automóviles. Para una serie reciente de 10 años, se ob-tuvieron los valores máximos anuales del Promedio Industrial Dow Jones (DJIA) ylos números de automóviles (en miles) correspondientes que se vendieron en EstadosUnidos. La siguiente tabla lista los rangos de cada conjunto de valores. Pruebe unacorrelación entre el DJIA y el número de automóviles vendidos.

DJIA máximo 1 2 3 4 5 6 7 8 10 9

Ventas de 2 3 5 10 7 6 4 1 8 9automóviles

x 1 2 3 4 5

y 5 4 3 2 1

x 2 4 1 5 3

y 2 4 1 5 3

13-6 Correlación de rangos 715

10. Manchas solares y puntos del Súper Bowl. Para una serie reciente de 10 años, seobtuvieron el número de manchas solares y los puntos totales anotados en el SúperBowl. La siguiente tabla lista los rangos de cada conjunto de valores. Pruebe una co-rrelación entre el número de manchas solares y los puntos anotados en el Súper Bowl.¿El resultado coincide con lo que se esperaría?

Número de 10 8 5 4 2 1 3 6 7 9manchas solares

Puntos del 8 9 3 10 4 7 6 5 1 2Súper Bowl

11. Correlación entre salario y estrés. La siguiente tabla lista rangos de salario y rangosde estrés de empleos seleccionados al azar (según datos de The Jobs Rated Almanac).¿Parece que el salario se incrementa a medida que se incrementa el estrés?

12. Correlación entre salario y demanda física. El ejercicio 11 incluye rangos aparea-dos de salario y nivel de estrés para 10 empleos seleccionados al azar. Las demandasfísicas de los empleos también se ordenaron por rangos; los rangos de salario y de-manda física se presentan abajo (según datos de The Jobs Rated Almanac). ¿Pareceexistir una relación entre el salario de un empleo y sus demandas físicas?

Salario 2 6 3 5 7 10 9 8 4 1

Demanda física 5 2 3 8 10 9 1 7 6 4

13. Grillos y temperatura. Se estudió la relación entre la temperatura y el número de ve-ces que un grillo chirría en un minuto. Abajo se listan los números de chirridos porminuto y las temperaturas correspondientes en grados Fahrenheit (según datos de TheSong of Insects, de George W. Pierce, Harvard University Press). ¿Existe evidenciasuficiente para concluir que existe una relación entre el número de chirridos por mi-nuto y la temperatura?

Chirridos en 882 1188 1104 864 1200 1032 960 900un minuto

Temperatura (en °F) 69.7 93.3 84.3 76.3 88.6 82.6 71.6 79.6

14. Muertes por vehículos automotores y asesinatos. A continuación se lista el númerode muertes en vehículos automotores (en cientos) y el número de asesinatos (en cien-tos) en Estados Unidos para varios años diferentes. Pruebe una correlación entre esasdos variables.

Muertes en vehículos 435 410 418 425 434 436 434 435 413 430automotores

Asesinatos 247 238 245 233 216 197 182 170 155 156

15. Audiencia y ventas de canciones. En la siguiente tabla se lista el número de impresio-nes de audiencia (en cientos de millones) de canciones y el número de álbumes vendi-dos correspondientes (en cientos de miles). El número de impresiones de audiencia es

Empleo Rango de salario Rango de estrés

Corredor de bolsa 2 2Zoólogo 6 7Ingeniero eléctrico 3 6Director de escuela 5 4Gerente de hotel 7 5Funcionario bancario 10 8Inspector de seguridad laboral 9 9Economista doméstico 8 10Psicólogo 4 3Piloto de aerolínea 1 1

716 Capítulo 13 Estadística no paramétrica

un conteo del número de veces que la gente ha escuchado la canción. La tabla se basaen datos de USA Today. ¿Parece que las ventas del álbum se ven muy afectadas por elnúmero de impresiones de audiencia?

Impresiones 28 13 14 24 20 18 14 24 17de audiencia

Álbumes vendidos 19 7 7 20 6 4 5 25 12

16. Presupuestos y ganancias netas de películas. A continuación se listan los pre-supuestos (en millones de dólares) y las ganancias brutas (en millones de dólares) depelículas seleccionadas al azar (según datos de la Motion Picture Association of Ameri-ca). ¿Al parecer existe una correlación significativa entre el dinero gastado para hacerla película y la cantidad que se recupera en las salas de cine? Además de la cantidaddel presupuesto, identifique otro factor importante que tal vez afecte la cantidad quegana una película.

Presupuesto 62 90 50 35 200 100 90

Ganancia bruta 65 64 48 57 601 146 47

Conjuntos de datos del apéndice B: En los ejercicios 17 y 18, utilice los conjuntos de da-tos del apéndice B para hacer una prueba de correlación de rango con un nivel de signi-ficancia de 0.05.

17. Conjunto de datos del apéndice B: Nocividad de los cigarrillos. Remítase al con-junto de datos 3 del apéndice B.a. Utilice los datos apareados referentes a cantidades de alquitrán y nicotina. Con ba-

se en el resultado, ¿parece existir una correlación significativa entre el alquitrán yla nicotina de los cigarrillos? Si es así, ¿pueden los investigadores reducir sus gas-tos de laboratorio midiendo sólo una de estas dos variables?

b. Utilice los datos apareados referentes a monóxido de carbono y nicotina. Con baseen el resultado, ¿parece existir una correlación significativa entre el monóxido decarbono y la nicotina de los cigarrillos? Si es así, ¿pueden los investigadores redu-cir sus gastos de laboratorio midiendo sólo una de estas dos variables?

c. Suponga que los investigadores quieren desarrollar un método para predecir lacantidad de nicotina y sólo quieren medir algún otro elemento. Entre alquitrán ymonóxido de carbono, ¿cuál es la mejor opción? ¿Por qué?

18. Conjunto de datos del apéndice B: Pronósticos del clima. Remítase al conjunto dedatos 8 del apéndice B.a. Utilice las temperaturas máximas pronosticadas para cinco días y las temperaturas

máximas reales. ¿Existe una correlación? ¿Una correlación significativa implicaque las temperaturas del pronóstico de cinco días son exactas?

b. Utilice las temperaturas máximas pronosticadas para un día y las temperaturas má-ximas reales. ¿Existe una correlación? ¿Una correlación significativa implica quelas temperaturas de pronóstico para un día son exactas?

c. ¿Cómo esperaría usted obtener una correlación más alta con las temperaturas má-ximas reales: con las temperaturas máximas del pronóstico para cinco días o conlas temperaturas máximas del pronóstico para un día? ¿Los resultados de los inci-sos a) y b) son como usted esperaba? Si existe una correlación muy alta entre lastemperaturas de pronóstico y las temperaturas reales, ¿se deduce que las tempera-turas pronosticadas son exactas?

13-6 MÁS ALLÁ DE LO BÁSICO19. Curva de aprendizaje. Un psicólogo diseña una prueba de aprendizaje. Los sujetos

reciben letras que deben memorizar, y sus tiempos de estudio (en segundos) se apareancon el número de letras que logran recordar. Los resultados se listan en la siguiente ta-bla. ¿Hay una correlación entre el tiempo de estudio del número de letras que logran

13-7 Prueba de rachas para detectar aleatoriedad 717

recordar? Además, dibuje un diagrama de dispersión y calcule los resultados obtenidosutilizando el coeficiente de correlación lineal descrito en la sección 10-2. Compare losresultados.

Tiempo 1 25 31 33 36 38 48 55 95 165 300

Letras 1 2 20 36 51 72 74 75 77 78 79

20. Efecto de empates en rs. Remítase al conjunto de datos 5 del apéndice B para lostiempos (en segundos) de consumo de tabaco y consumo de alcohol presentados enpelículas de dibujos animados para niños. Calcule el valor del estadístico de prueba rsutilizando cada una de las dos fórmulas dadas en esta sección (fórmulas 13-1 y 10-1).¿Existe una diferencia sustancial entre los dos resultados? ¿Cuál resultado es mejor?¿La conclusión se ve afectada por la fórmula utilizada?

13-7 Prueba de rachas para detectaraleatoriedad

Concepto clave En esta sección estudiaremos la prueba de rachas para detectaraleatoriedad, la cual puede utilizarse para determinar si los datos muestrales enuna secuencia están en un orden aleatorio. Esta prueba se basa en datos muestralesque tienen dos características y analiza rachas de esas características para determi-nar si las rachas parecen ser el resultado de algún proceso aleatorio, o si las rachassugieren que el orden de los datos no es aleatorio.

DefinicionesUna racha es una secuencia de datos que tienen la misma característica; la se-cuencia es precedida y seguida por datos con una característica diferente o porningún dato en absoluto.

La prueba de rachas utiliza el número de rachas en una secuencia de datosmuestrales para probar la aleatoriedad del orden de los datos.

Principio fundamental de la prueba de rachasEl principio fundamental de la prueba de rachas puede establecerse brevementecomo sigue:

Rechace la aleatoriedad si el número de rachas es muy bajo o muy alto.● Ejemplo: La secuencia de género MMMMMHHHHH no es aleatoria pues-

to que tiene sólo dos rachas, es decir, el número de rachas es muy bajo.● Ejemplo: La secuencia de género MHMHMHMHMH no es aleatoria pues-

to que existen 10 rachas, lo cual se considera un número muy alto.

Los criterios exactos para determinar si un número de rachas es muy alto o muybajo se encuentran en el recuadro de la página 723, que resume los elementos cla-ve de la prueba de rachas para detectar aleatoriedad. Además, el procedimiento dela prueba de rachas para detectar aleatoriedad también se resume en la figura 13-5.

Es importante señalar que la prueba de rachas para detectar aleatoriedad sebasa en el orden en el que se presentan los datos; no está basada en la frecuenciade los datos. Por ejemplo, una secuencia de 3 hombres y 20 mujeres podría pare-cer aleatoria, pero la prueba de rachas no se ocupa del problema de si 3 hombres y20 mujeres constituyen una muestra sesgada (con un número desproporcionada-mente mayor de mujeres).

718 Capítulo 13 Estadística no paramétrica

No

No

No

¿Es n2 � 20?

Calcule el estadístico de prueba

sG �

Calcule

Calcule

z �G � mGsG

2n1n2

n1 � n2mG � � 1

Determine los valores críticos de z a partir de la tabla A-2 como siempre. (Si a � 0.05, los valores críticos son �1.96 y 1.96.)

Rechace la aleatoriedad si el estadístico de prueba es menor o igual que el valor crítico más pequeño, o mayor o igual al valor crítico más grande. De otra forma, no rechace la hipótesis nula de aleatoriedad.

¿Es n1 � 20?

¿Es a � 0.05?

Determine el valor de G, elnúmero de rachas.

Determine el valor de n2, el número de elementos del segundo tipo.

Determine el valor de n1, el número de elementos del primer tipo.

Identifique una secuencia de dos características diferentes.

El estadístico de prueba es G. Utilice la tabla A-10 para obtener los valores críticos..

2n1n2(2n1n2 � n1 � n2)

(n1 � n2)2(n1 � n2 � 1)�

StartInicioFigura 13-5

Prueba de rachas para detectar aleatoriedad

13-7 Prueba de rachas para detectar aleatoriedad 719

Prueba de rachas para detectar aleatoriedad

Requisitos

1. Los datos muestrales están acomodados de acuerdo con algún esquema de or-den, por ejemplo, el orden en el que se obtuvieron los valores muestrales.

2. Cada valor de los datos se puede categorizar en una de dos categorías separadas(como hombre mujer).

Notación

n1 5 número de elementos en la secuencia que tienen una característica particular.(La característica elegida para n1 es arbitraria).

n2 5 número de elementos en la secuencia que tienen la otra característica

G 5 número de rachas

Estadístico de prueba

Para muestras pequeñas y a 5 0.05: Si n1 # 20 y n2 # 20 y el nivel de significan-cia es a 5 0.05, el estadístico de prueba es el número de rachas G. Los valores críti-cos se encuentran en la tabla A-10. He aquí el criterio de decisión:

Rechace la aleatoriedad si el número de rachas G es

● menor o igual al valor crítico más pequeño encontrado en la tabla A-10.

● mayor o igual al valor crítico más grande encontrado en la tabla A-10.

Para muestras grandes o a u 0.05: If n1 > 20 o n2 > 20 o a� 0.05, utilice el esta-dístico de prueba y los valores críticos siguientes.

Estadístico de prueba:

donde

y

Valores críticos de z: Utilice la tabla A-2.

sG 5 B s2n1n2ds2n1n2 2 n1 2 n2dsn1 1 n2d2sn1 1 n2 2 1d

mG 52n1n2

n1 1 n21 1

z 5G 2 mG

sG

>

Rachas de suerte en los deportes

Existe la creencia de que los

atletas suelen tener “rachas de

suerte”, es decir, periodos bre-

ves de éxito extraordinario. El

psicólogo Amos Tversky, de la

Universidad de Stanford, y otros

investigadores utilizaron la esta-

dística para analizar los miles de

tiros de los 76 de Filadelfia en

una temporada completa y la

mitad de otra. Encontraron que

el número de “rachas de suerte”

no difería de lo que se esperaría

en pruebas aleatorias, donde el

resultado de cada prueba es

independiente de cualquier re-

sultado previo. Es decir, la pro-

babilidad de una anotación no

depende de las anotaciones o fa-

llas previas.

EJEMPLO Muestra pequeña: Género de osos A continuación se listan losgéneros de los primeros 10 osos del conjunto de datos 6 del apéndice B. Utiliceun nivel de significancia de 0.05 para probar la aleatoriedad de la secuencia degéneros

M M M M H H M M H H

SOLUCIÓNREQUISITOS Los datos están acomodados en orden, y cada valor estáclasificado en una de dos categorías separadas (macho hembra). Los requisi-tos se satisfacen y podemos proceder con la prueba de rachas para detectaraleatoriedad.

>

continúa

720 Capítulo 13 Estadística no paramétrica

Seguiremos el procedimiento que se resume en la figura 13-5. Se ha identi-ficado la secuencia de dos características (macho y hembra). Ahora debemoscalcular los valores de n1, n2 y el número de rachas G. La secuencia se muestraabajo con espacios que se usan para identificar mejor las rachas separadas.

MMMM HH MM HH(+)+* " " "

1ª racha 2ª racha 3ª racha 4ª racha

Podemos ver que hay 6 machos y 4 hembras, y el número de rachas es 4. Por lotanto, tenemos

n1 5 número total de machos 5 6n2 5 número total de hembras 5 4G 5 número de rachas 5 4

Puesto que n1 # 20 y n2 # 20 y a 5 0.05, el estadístico de prueba es G � 4,y nos remitimos a la tabla A-10 para encontrar los valores críticos de 2 y 9.Puesto que G � 4 no es menor o igual que el valor crítico de 2, ni tampoco esmayor o igual que el valor crítico de 9, no rechazamos la aleatoriedad. Noexiste evidencia suficiente para rechazar la aleatoriedad en la secuencia de gé-neros. Parece que la secuencia de géneros es aleatoria.

EJEMPLO Muestra grande: lluvia en Boston los lunes Remítase a lascantidades de lluvia en Boston que se listan en el conjunto de datos 10 delapéndice B. ¿Existe suficiente evidencia para sustentar la aseveración de que lalluvia de los lunes no es aleatoria? Utilice un nivel de significancia de 0.05.

SOLUCIÓNREQUISITOS Permita que S (para seco) represente los lunes sin lluvia (in-dicados por valores de 0.00), y permita que L represente los lunes con algo delluvia (cualquier valor mayor que 0.00). A continuación se listan las cantidadesde lluvia para los 52 lunes consecutivos. Vemos que los datos están acomoda-dos en orden, y que cada dato está clasificado en una de dos categorías separadas.Los requisitos se satisfacen, así que procedemos con la prueba de rachas paradeterminar aleatoriedad.

S S S S L S L S S L S S L S S S L S S L L L S S S SL S L S L L L S L S S S L S S S L S L S S L S S S L

Las hipótesis nula y alternativa son las siguientes:

H0: La secuencia es aleatoria.

H1: La secuencia no es aleatoria.

El estadístico de prueba se obtiene buscando primero el número de “eses”, elnúmero de “eles” y el número de rachas. Es fácil examinar la secuencia paraencontrar que

n1 5 número de S 5 33

n2 5 número de L 5 19

G 5 número de rachas 5 30

Al seguir el procedimiento de la figura 13-5, contestamos sí a la pregunta “¿Esn1 � 20?”. Por lo tanto, necesitamos evaluar el estadístico de prueba z dado

13-7 Prueba de rachas para detectar aleatoriedad 721

en el recuadro que resume los elementos clave de la prueba de rachas para de-tectar aleatoriedad. Primero debemos evaluar mG y sG. Tenemos

Ahora podemos calcular el estadístico de prueba:

Puesto que el nivel de significancia es a � 0.05 y tenemos una prueba de doscolas, los valores críticos son z � �1.96 y z � 1.96. El estadístico de pruebade z � 1.48 no cae dentro de la región crítica, por lo que no rechazamos la hi-pótesis nula de aleatoriedad. La secuencia dada parece ser aleatoria.

Datos numéricos: Aleatoriedad por arriba o por debajo de la media o de la medianaEn cada uno de los ejemplos anteriores, los datos se ajustan claramente dentro dedos categorías, pero también podemos probar la aleatoriedad por la forma comolos datos numéricos fluctúan por encima o por debajo de una media o mediana.Para probar la aleatoriedad por arriba o por debajo de la mediana, por ejemplo,utilice los datos muestrales para calcular el valor de la mediana, luego reemplacecada valor individual con la letra A si éste se encuentra por arriba de la mediana,y reemplácelo con D si se encuentra por debajo de la mediana. Excluya cualquiervalor que sea igual a la mediana. Es útil escribir las A y las D directamente arribade los números que éstas representan ya que esto hace más sencilla la revisión yademás reduce la posibilidad de tener un número equivocado de letras. Después

z 5G 2 mG

sG5

30 2 25.115

3.3065 1.48

s2ds33ds19d[2s33ds19d 2 33 2 19]

s33 1 19d2s33 1 19 2 1d5 3.306

sG 5Å

s2n1n2ds2n1n2 2 n1 2 n2dsn1 1 n2d2sn1 1 n2 2 1d

mG 52n1n2

n1 1 n21 1 5

2s33ds19d33 1 19

1 1 5 25.115

Uso de la tecnología

STATDISK Primero determine los va-lores n1, n2 y el número de rachas G. Selec-

cione Analysis de la barra del menú princi-pal, luego seleccione Runs Test y proceda aingresar los datos requeridos en el cuadro dediálogo. La pantalla de STATDISK incluiráel estadístico de prueba (G o z, según sea loapropiado), los valores críticos y la conclu-sión.

MINITAB Minitab efectuará una prue-ba de rachas únicamente con una secuenciade datos numéricos, pero vea el manual Mi-nitab Student Laboratory Manual and Work-book para evitar esta restricción. Ingrese losdatos numéricos en la columna C1, luego se-leccione Stat, Nonparametrics y Runs

Test. En el cuadro de diálogo, ingrese C1para la variable, luego elija probar la aleato-riedad por arriba o por debajo de la media, oingrese un valor a utilizar. Haga clic en OK.Los resultados del Minitab incluyen el nú-mero de rachas y el valor P (“la prueba essignificativa a...”).

EXCEL Excel no está programado parala prueba de rachas para detectar aleato-riedad.

TI-83>84 PLUS La calculadora TI-83 84 Plus no está programada para la pruebade rachas para detectar aleatoriedad.

>

722 Capítulo 13 Estadística no paramétrica

de encontrar la secuencia de las letras A y B, procedemos a aplicar la prueba de ra-chas tal como se describió. Los economistas utilizan la prueba de rachas para de-tectar aleatoriedad por arriba y por debajo de la media cuando tratan de identificartendencias o ciclos. Una tendencia económica a la alza contendría una predomi-nancia de D al principio y de A al final, de manera que el número de rachas seríapequeño. En una tendencia a la baja las A dominarían al principio y las D al final,con un número bajo de rachas. Un patrón cíclico produciría una secuencia quecambia sistemáticamente, de manera que el número de rachas tendería a ser gran-de. (Véase el ejercicio 14).

13-7 DESTREZAS Y CONCEPTOS BÁSICOSConocimientos estadísticos y pensamiento crítico

1. Prueba de rachas. Un encuestador realiza una encuesta llenando una página de res-puestas de cada sujeto que entrevista. Luego mezcla las páginas antes de enviarlas pa-ra su análisis. ¿Se puede emplear la prueba de rachas de aleatoriedad para determinarsi los sujetos encuestados fueron seleccionados en una secuencia aleatoria?

2. Prueba de rachas. ¿Qué es una racha?

3. Prueba de rachas. Si una prueba de rachas no lleva a la conclusión de que una mues-tra en particular es aleatoria, ¿podemos concluir que los datos se seleccionaron de unaforma adecuada para fines estadísticos?

4. Muestra sesgada. Después de utilizar la prueba de rachas para determinar aleatorie-dad, se descubre que una secuencia de 20 hombres y 80 mujeres parece ser aleatoria.¿Esto implica que la muestra es representativa de la población de adultos estadouni-denses?

Identificación de rachas y cálculo de valores críticos. En los ejercicios 5 a 8, utilice la secuencia dada para determinar los valores de n1, n2, el número de rachas G y los valores críticos de la tabla A-10; además, utilice esos resultados para determinar si la secuencia parece ser aleatoria.

5. S N N S N N S N N S N N

6. T T T T T F F F F T T T T

7. H H H M M H M M H M M H

8. X Y X X Y Y X X X Y Y Y X X X X Y Y Y Y

Uso de la prueba de rachas para detectar aleatoriedad. En los ejercicios 9 a 18, utilicela prueba de rachas de esta sección para determinar si la secuencia dada es aleatoria.Utilice un nivel de significancia de a � 0.05. (Todos los datos están listados en ordenpor renglón).

9. Géneros de osos. El primer ejemplo de esta sección utilizó los géneros de los prime-ros 10 osos del conjunto de datos 6 del apéndice B. Realice una prueba de rachas paradetectar aleatoriedad utilizando los géneros de los primeros 20 osos del conjunto dedatos 6. A continuación se listan los géneros.

M M M M H H M M H H M M H M H M M H M M

10. Ganadores olímpicos de medallas de oro. Abajo se listan los ganadores de la meda-lla de oro en la carrera de 400 metros planos para hombres, donde E representa a Es-tados Unidos y O a cualquier otro país. Al parecer, ¿los países de los ganadores estánen una secuencia aleatoria?

E E E E O E O O E E E O O

E E E E E O O E E E E E E

13-7 Prueba de rachas para detectar aleatoriedad 723

11. Prueba de la aleatoriedad de las victorias en las series mundiales de béisbol. Prue-be la aseveración de que la secuencia de triunfos en las series mundiales de los equipos dela American League y la National League es aleatoria. Abajo se dan los resultadosde los equipos de las ligas Americana y Nacional representados por A y N, respectiva-mente. ¿Qué sugieren los resultados acerca de las habilidades de las dos ligas?

N A A A N N A A N N N N A A A N A

N A N A A A N A N A A A N A N A

12. Prueba de aleatoriedad de ganadores de elección presidencial. Para una secuenciareciente de elecciones presidenciales, el partido político del ganador se indica con Dpara demócrata y R para republicano. ¿Parece que se eligieron candidatos demócratasy republicanos en una secuencia que es aleatoria?

R R D R D R R R R D D R R R D D D

D D R R D D R R D R R R D D R R

13. Salas de cine: Prueba de aleatoriedad por arriba y por debajo de la mediana. Lastendencias en los negocios y la economía a menudo se analizan con la prueba de ra-chas. A continuación se incluye el número de salas de cine, listadas en orden por ren-glón para cada año, comenzando en 1987 (según datos de la National Association ofTheater Owners). Primero calcule la mediana, luego reemplace cada valor por A si es-tá por arriba de la mediana y por D si está por debajo de la mediana. Después aplique laprueba de rachas a la secuencia resultante de A y D. ¿Qué sugiere el resultado sobrela tendencia en el número de salas de cine?

20,595 21,632 21,907 22,904 23,740 24,344 24,789 25,830 26,995

28,905 31,050 33,418 36,448 35,567 34,490 35,170 35,361

14. Bolsa de Valores: Prueba de aleatoriedad por arriba y por debajo de la mediana.A continuación se listan los puntajes máximos anuales del promedio industrial DowJones para una secuencia de años recientes. Primero calcule la mediana de los valores,luego reemplace cada valor por A si está por encima de la mediana y por D si estápor debajo de la mediana. Después aplique la prueba de rachas a la secuencia resul-tante de A y D. ¿Qué sugiere el resultado acerca del mercado bursátil como una op-ción para invertir?

969 995 943 985 969 842 951 1036 1052 892

882 1015 1000 908 898 1000 1024 1071 1287 1287

1553 1956 2722 2184 2791 3000 3169 3413 3794 3978

5216 6561 8259 9374 11,497 11,723 11,338 10,635 10,454 10,895

15. Muestra grande: Géneros de osos. En el primer ejemplo de esta sección se utiliza-ron los géneros de los primeros 10 osos del conjunto de datos 6 del apéndice B. Reali-ce una prueba de rachas para detectar aleatoriedad utilizando los géneros de todos lososos del conjunto de datos 6.

16. Muestra grande: Lluvia sabatina. En el segundo ejemplo de esta sección se utiliza-ron las cantidades de lluvia de los lunes, listadas en el conjunto de datos 10 del apén-dice B. Utilice las cantidades de lluvia de los sábados para hacer una prueba de laaleatoriedad de los días con precipitación. Considere que un día es seco si la cantidadde precipitación es 0.00. Considere que un día es lluvioso si la cantidad de precipita-ción es cualquier valor mayor que 0.00.

17. Muestra grande: Prueba de aleatoriedad de dígitos impares y pares en el valor pi.Un artículo del New York Times acerca del cálculo de lugares decimales de p señalóque “los matemáticos están bastante seguros de que los dígitos de p son indistinguibles

724 Capítulo 13 Estadística no paramétrica

de cualquier secuencia aleatoria”. A continuación se presentan los primeros 100 luga-res decimales de p. Pruebe la aleatoriedad de dígitos impares (I) y pares (P).

1 4 1 5 9 2 6 5 3 5 8 9 7 9 3 2 3 8 4 6 2 6 4 3 3 8 3 2 7 9 5 0 2 8 8 4 1 9 7 1

6 9 3 9 9 3 7 5 1 0 5 8 2 0 9 7 4 9 4 4 5 9 2 3 0 7 8 1 6 4 0 6 2 8 6 2 0 8 9 9

8 6 2 8 0 3 4 8 2 5 3 4 2 1 1 7 0 6 7 9

18. Muestra grande: Prueba de aleatoriedad de victorias en las series mundiales debéisbol. Pruebe la aseveración de que la secuencia de victorias en series mundiales delos equipos de la American League y de la National League es aleatoria. A continua-ción se presentan resultados recientes, con los equipos de las ligas Americana y Na-cional representados por A y N, respectivamente.

A N A N N N A A A A N A A A A N A N N A A N N A A A A N A N

N A A A A A N A N A N A N A A A A A A A N N A N A N N A A N

N N A N A N A N A A A N N A A N N N N A A A N A N A N A A A

N A N A A A N A N A

13-7 MÁS ALLÁ DE LO BÁSICO19. Cálculo de números críticos de rachas. Al utilizar los elementos A, A, B y B, ¿cuál

es el número mínimo posible de rachas que pueden acomodarse? ¿Cuál es el númeromáximo de rachas? Ahora remítase a la tabla A-10 para encontrar los valores críticosG para n1 � n2 � 2. ¿Qué concluye usted acerca de este caso?

20. Cálculo de valores críticos.a. Utilice todos los elementos A, A, A, B, B, B, B, B, B, y haga una lista de las 84

secuencias diferentes posibles.b. Calcule el número de rachas para cada una de las 84 secuencias.c. Utilice los resultados de los incisos a) y b) para calcular sus propios valores críti-

cos de G.d. Compare sus resultados con los de la tabla A-10.

Repaso

En este capítulo examinamos seis pruebas no paramétricas diferentes para analizar datosmuestrales. Las pruebas no paramétricas también se denominan pruebas de distribuciónlibre porque no requieren que las poblaciones tengan una distribución particular; por ejem-plo, una distribución normal. Sin embargo, las pruebas no paramétricas no son tan eficientescomo las pruebas paramétricas, de manera que generalmente necesitamos una evidenciamás fuerte antes de rechazar la hipótesis nula.

La tabla 13-9 lista las pruebas no paramétricas presentadas en este capítulo, junto consus funciones. La tabla lista además las pruebas paramétricas correspondientes.

Conocimientos estadísticos y pensamiento crítico

1. Prueba no paramétrica. ¿Qué es una prueba no paramétrica?

2. Prueba de distribución libre. ¿Cuál es la diferencia entre una prueba no paramétricay una prueba de distribución libre?

3. Rango. Muchas pruebas no paramétricas se basan en rangos. ¿Qué es un rango?

Ejercicios de repaso 725

4. Eficiencia. Las pruebas no paramétricas no suelen ser tan eficientes como las pruebasparamétricas correspondientes, suponiendo que los requisitos necesarios se satisfa-cen. ¿Qué mide la eficiencia?

Ejercicios de repaso

Uso de pruebas no paramétricas. En los ejercicios 1 a 8, utilice un nivel de significanciade 0.05 con la prueba indicada. Si no se especifica una prueba en particular, utilice la prue-ba no paramétrica adecuada de este capítulo.

1. Medición de la inteligencia en niños. La siguiente tabla lista datos apareados de lostiempos (en segundos) obtenidos de una muestra aleatoria de niños a los que se lesdieron bloques junto con las instrucciones de construir una torre lo más alta posible(según datos de “Tower Building”, de Johnson y Courtney, Child Development, vol.3). Este procedimiento se utiliza para medir la inteligencia en niños. Utilice la pruebadel signo y un nivel de significancia de 0.05 para probar la aseveración de que no haydiferencia entre los tiempos del primero y del segundo ensayo.

Niño A B C D E F G H I J K L M N O

Primer ensayo 30 19 19 23 29 178 42 20 12 39 14 81 17 31 52

Segundo ensayo 30 6 14 8 14 52 14 22 17 8 11 30 14 17 15

2. Medición de la inteligencia en niños. Repita el ejercicio 1 utilizando la prueba derangos con signo de Wilcoxon.

3. Clasificación de escuelas de negocios y de leyes. La revista U.S. News and WorldReport clasificó escuelas de negocios y de leyes; en la siguiente tabla se muestran lasclasificaciones basadas en esos resultados. ¿Existe una correlación entre la clasifica-ción de las escuelas de negocios y la clasificación de las escuelas de leyes?

Universidad Hvd Yale Sfd NYU Chi UPenn BU Ohio Gtwn USC

Negocios 1 6 2 5 4 3 10 8 9 7

Leyes 2 1 3 4 5 6 9 10 7 8

Tabla 13-9 Resumen de pruebas no paramétricas

Prueba no paramétrica Función Prueba paramétrica

Prueba del signo (sección 13-2) Prueba del valor aseverado del promedio Prueba z o prueba tcon una muestra (secciones 8-4, 8-5)

Prueba de las diferencias entre datos apareados Prueba t (sección 9-4)

Prueba del valor aseverado de una proporción Prueba z (sección 8-3)

Prueba de rangos con signo Prueba de las diferencias entre datos apareados Prueba t (sección 9-4)de Wilcoxon (sección 13-3)Prueba de la suma de rangos Prueba de la diferencia entre dos muestras Prueba t o prueba z (sección 9-3)de Wilcoxon (sección 13-4) independientes

Prueba de Kruskal-Wallis Prueba si más de dos poblaciones Análisis de varianza (sección 12-2)(sección 13-5) independientes tienen la misma mediana

Correlación de rangos Prueba de la relación entre dos variables Correlación lineal (sección 10-2)(sección 13-6)

Prueba de rachas (sección 13-7) Prueba de la aleatoriedad de datos muestrales (No hay prueba paramétrica)

726 Capítulo 13 Estadística no paramétrica

4. Clasificación de escuelas de medicina. La revista U.S. News and World Reportclasificó escuelas de investigación médica y presentó una lista con las calificaciones co-rrespondientes “promedio” en la prueba MCAT. La siguiente tabla se basa en esosresultados. ¿Existe una correlación entre la clasificación y la calificación promedio enla prueba MCAT?

Universidad Hvd NYU Yale Chi USC Ohio BU Utah

Clasificación 1 4 2 3 5 6 7 8

MCAT 11.3 11.0 11.4 10.3 10.8 10.5 9.5 9.6

5. Prueba de discriminación por género. La compañía de contabilidad Axipon aseguraque contrata empleados sin discriminación por género. De los 40 empleados reciéncontratados, 15 son mujeres. Aproximadamente la mitad de los solicitantes son hom-bres y la mitad mujeres, todos bien calificados. ¿Existe evidencia suficiente para acu-sarla de discriminar en favor de los hombres?

6. ¿Las personas que beben cerveza y las que beben licor tienen diferentes nivelesde CAS? Los datos muestrales de la siguiente lista indican los niveles de CAS (con-centración de alcohol en sangre) en el momento del arresto de personas seleccionadasal azar por los delitos de conducir en estado de ebriedad (CEE) o conducir bajo la in-fluencia del alcohol (CIA). Los datos están clasificados según el tipo de bebida con-sumida (según datos del Departamento de Justicia de Estados Unidos). Pruebe laaseveración de que los bebedores de cerveza y los bebedores de licor tienen los mis-mos niveles de CAS. Con base en estos resultados, ¿parece que ambos grupos sonigualmente peligrosos, o existe un grupo más peligroso que el otro?

Cerveza Licor

0.129 0.146 0.148 0.152 0.220 0.225 0.185 0.182

0.154 0.155 0.187 0.212 0.253 0.241 0.227 0.205

0.203 0.190 0.164 0.165 0.247 0.224 0.226 0.234

0.190 0.257

7. ¿Es aleatoria la lotería? A continuación se presentan los primeros dígitos seleccio-nados de 40 tomas consecutivas de la urna del juego de lotería Win 4 del estado deNueva York. ¿Los dígitos impares y pares parecen haberse tomado en una secuenciaaleatoria?

9 7 0 7 5 5 1 9 0 0 8 7 6 0 1 6 7 2 4 7

5 5 5 2 0 4 4 9 9 0 5 3 3 1 9 2 5 6 8 2

8. ¿El peso de un automóvil afecta las heridas en la pierna durante un choque? Seobtuvieron datos de experimentos de choques de automóviles realizados por la Natio-nal Transportation Safety Administration. Se adquirieron automóviles nuevos, se hi-cieron chocar contra una barrera fija a 35 mi/h y se registraron las mediciones con unmaniquí en el asiento del conductor. Utilice los datos muestrales listados abajo paraprobar las diferencias en las mediciones de carga (en libras) del fémur izquierdo entrelas cuatro categorías de peso. ¿Existe evidencia suficiente para concluir que las medi-ciones de heridas en la pierna para las cuatro categorías de peso de automóviles noson las mismas? ¿Sugieren los datos que los automóviles más pesados son más segu-ros en un choque?

Subcompacto: 595 1063 885 519 422

Compacto: 1051 1193 946 984 584

Mediano: 629 1686 880 181 645

Grande: 1085 971 996 804 1376

Actividades de cooperación en equipo 727

Ejercicios de repaso acumulativo

En los ejercicios 1 a 8, use los datos de la siguiente tabla. Los valores se basan en un diagra-ma de dispersión que está incluido en “An SAT Coaching Program That Works”, de JackKaplan, Chance, vol. 15, núm. 1. Los valores son calificaciones de estudiantes en la pruebade matemáticas SAT, antes y después de tomar el curso de preparación para la prueba SAT.

Antes 460 470 490 490 510 510 600 620 610

Después 480 510 500 610 590 630 630 660 690

1. Cálculo de estadísticos. Calcule la media, la mediana, el rango, la desviación están-dar y la varianza de las calificaciones previas al curso.

2. Gráfica. Construya un diagrama de dispersión. ¿Al parecer existe una correlación en-tre las calificaciones antes y después del curso?

3. Correlación lineal. Haga una prueba de correlación lineal entre las calificaciones an-tes y después del curso. Si hay una correlación lineal, ¿eso significa que el curso depreparación es eficaz? ¿Por qué?

4. Correlación de rango. Use la correlación de rango para probar una correlación entrelas calificaciones antes y después del curso.

5. Datos apareados. Utilice una prueba t para probar la aseveración de que la diferenciamedia entre las calificaciones antes y después del curso es igual a cero.

6. Prueba del signo. Utilice la prueba del signo para probar la aseveración de que noexiste diferencia entre las calificaciones antes y después del curso.

7. Prueba de rangos con signo de Wilcoxon. Utilice la prueba de rangos con signo deWilcoxon para probar la aseveración de que no existe diferencia entre las calificacio-nes antes y después del curso.

8. Eficiencia de prueba. ¿Cuál de los ejercicios anteriores produce los resultados másútiles para determinar si el curso de preparación es eficaz? ¿Al parecer el curso depreparación es eficaz? ¿Por qué?

Actividades de cooperación en equipo1. Actividad en clase Utilice el orden de los asientos en

su clase y aplique la prueba de rachas para determinarsi los estudiantes se acomodan aleatoriamente de acuer-do con el género. Después de registrar el orden deasientos, se puede hacer el análisis en subgrupos de treso cuatro estudiantes.

2. Actividad en clase Formen grupos de 8 a 12 perso-nas. Para cada miembro del grupo, midan su estatura ymidan la envergadura de sus brazos. Para medir la enver-gadura de los brazos, el sujeto debe ponerse de piecon los brazos extendidos, como las alas de un avión.Es fácil marcar la altura y la envergadura de los brazosen un pizarrón y luego medir las distancias ahí. Dividalas siguientes tareas en subgrupos de tres o cuatro per-sonas.

a. Utilice la correlación de rangos con los datos mues-trales apareados para determinar si existe una correla-ción entre la estatura y la envergadura de los brazos.

b. Utilice la prueba del signo para probar la diferenciaentre las dos variables.

c. Utilice la prueba de rangos con signo de Wilcoxonpara probar la diferencia entre las dos variables.

3. Actividad en clase Realice la actividad 2 utilizandoel pulso en vez de la envergadura de los brazos. Mida lospulsos contando el número de latidos cardiacos en unminuto.

4. Actividad fuera de clase Formen grupos de tres o cuatroestudiantes. Investiguen la relación entre dos variablesreuniendo sus propios datos muestrales apareados y utili-

728 Capítulo 13 Estadística no paramétrica

zando los métodos de la sección 13-6 para determinar siexiste una correlación significativa. Temas sugeridos:● ¿Existe una relación entre el sabor y el costo de mar-

cas diferentes de galletas con chispas de chocolate(o bebidas de cola)? (El sabor puede medirse en al-guna escala numérica, como es de 1 a 10).

● ¿Existe una relación entre los salarios de los jugado-res profesionales de béisbol (o básquetbol, o fútbol)y sus logros por temporada?

● Tasas versus pesos: ¿Existe una relación entre las ta-sas de consumo de combustible de los automóviles ylos pesos de los automóviles?

● ¿Existe una relación entre la longitud de los pies delos hombres (o de las mujeres) y su estatura?

● ¿Existe una relación entre el promedio de las califi-caciones de los estudiantes y la cantidad de tiempoque ven televisión?

● ¿Existe una relación entre la estatura de los padres(o de las madres) y las estaturas de sus hijos (o hijas)primogénitos?

5. Actividad fuera de clase Vea el proyecto “De los datosa la decisión”, relacionado con el análisis del sorteo de1970 utilizado para reclutar hombres en el ejército esta-dounidense. Puesto que los resultados de 1970 generaronpreocupación por la aleatoriedad al seleccionar nú-meros prioritarios, diseñe un nuevo procedimiento paragenerar los 366 números prioritarios. Utilice su proce-dimiento para generar los 366 números y pruebe sus re-sultados utilizando las técnicas que se sugieren en losincisos a), b) y c) del proyecto “De los datos a la deci-sión”. ¿Cómo se comparan sus resultados con los obte-nidos en 1970? ¿Su procedimiento de selección aleatoriaparece ser mejor que el que se usó en 1970? Escriba

un reporte que describa con claridad el proceso que di-señó. También incluya su análisis y conclusiones.

6. Actividad fuera de clase Formen grupos de tres o cua-tro personas. Encuesten a estudiantes, pidiéndoles queidentifiquen su área de estudios y su género. Para cadasujeto entrevistado, determine la exactitud de la hora ensu reloj. Primero ajuste su propio reloj a la hora correc-ta utilizando una fuente precisa y confiable (del tipo“Al escuchar el tono, la hora es...”). Para los relojes queestén adelantados, registre tiempos positivos; para losrelojes que estén atrasados, registre tiempos negativos.Utilice los datos muestrales para responder estas pre-guntas:● Al parecer, ¿ambos géneros tienen los mismos

errores?● Al parecer, ¿las diferentes áreas de estudio tienen los

mismos errores?

7. Actividad en clase Formen grupos de 8 a 12 personas.Para cada miembro del grupo, midan su estatura y la al-tura de su ombligo, que es la altura desde el piso hastael ombligo. Utilice el coeficiente de correlación de ran-gos para determinar si existe una correlación entre laestatura y la altura del ombligo.

8. Actividad en clase Formen grupos de tres o cuatro per-sonas. El apéndice B incluye muchos conjuntos de da-tos que todavía no pueden resolverse por medio de losmétodos de este capítulo. Revise el apéndice B y busquelas variables de interés, luego investigue empleando losmétodos apropiados de estadística no paramétrica. Enun-cie sus conclusiones y trate de identificar aplicacionesprácticas.

Proyecto tecnológico

En el pasado ha habido intentos por identificar o establecercontacto con vida inteligente extraterrestre, los cuales inclu-yen esfuerzos para enviar mensajes de radio llevando infor-mación acerca de nosotros, los terrícolas. El doctor FrankDrake, de la Universidad Cornell, elaboró un mensaje de ra-dio de este tipo, que podría ser transmitido en series de pulsosy silencios. Se puede pensar en los pulsos y silencios comoceros y unos. A continuación se lista un mensaje consistenteen 77 ceros y unos. Si factorizamos 77 en los números primos7 y 11, y luego hacemos una cuadrícula de 11 17 y pone-mos un punto en aquellas posiciones correspondientes a unpulso o 1, podemos obtener una imagen sencilla de algo.

Suponga que la secuencia de 77 unos y ceros se envía comoun mensaje de radio que es interceptado por vida extraterres-tre con una inteligencia suficiente para estudiar este libro. Siel mensaje de radio se prueba utilizando los métodos de estecapítulo, ¿la secuencia aparecerá como un “ruido aleatorio” ose identificará como un patrón que no es aleatorio? Construyala imagen representada por los dígitos e identifíquela.

0 0 1 1 1 0 0 0 0 1 1 1 0 0 0 0 0 1 0 0 0 1 1 1 1 1 1 1 0 0 1 1 1 0 0 0 0 1 1 1 0 00 0 1 1 1 0 0 0 1 0 0 0 1 0 1 0 0 0 0 1 01 0 0 0 0 1 0 1 0 0 0 0 1 0

De los datos a la decisión 729

De los datos a la decisiónPensamiento crítico: ¿Fue aleatorio el sorteo?

En 1970 se realizó un sorteo para deter-minar quién sería reclutado en el ejércitoestadounidense. Las 366 fechas del año secolocaron en cápsulas individuales. Prime-ro, las 31 cápsulas de enero se ubicaron enuna caja; luego se añadieron las 29 cápsulasde febrero y se mezclaron los dos meses.Después, se agregaron las 31 cápsulas demarzo y se mezclaron los tres meses. Esteprocedimiento continuó hasta que se inclu-yeron todos los meses. La primera cápsulaseleccionada fue el 14 de septiembre, por lotanto los hombres que nacieron en esa fechafueron reclutados primero. La lista adjuntamuestra las 366 fechas en el orden de su se-lección.

Análisis de los resultados

a. Utilice la prueba de rachas para probar laaleatoriedad de la secuencia por arriba ypor debajo de la mediana de 183.5.

b. Utilice la prueba de Kruskal-Wallis paraprobar la aseveración de que los 12 me-ses tuvieron números prioritarios obteni-dos de la misma población.

c. Calcule las 12 medias mensuales. Luegoregistre esas 12 medias en una gráfica.(En el eje horizontal liste los 12 meses, yel eje vertical debe ir de 100 hasta 260).Observe cualquier patrón que sugiera quelos números prioritarios originales nofueron seleccionados aleatoriamente.

d. Con base en los resultados de los incisosa), b) y c), decida si este sorteo en par-ticular fue justo. Escriba una asevera-ción sustentando su postura de que fue

justo, o explicando por qué cree que nofue justo. Si usted decide que este sor-teo no fue justo, describa un procedi-miento para seleccionar los númerosque habrían sido justos.

Ene: 305 159 251 215 101 224 306 199 194 325 329 221 318 238 017 121235 140 058 280 186 337 118 059 052 092 355 077 349 164 211

Feb: 086 144 297 210 214 347 091 181 338 216 150 068 152 004 089 212189 292 025 302 363 290 057 236 179 365 205 299 285

Mar: 108 029 267 275 293 139 122 213 317 323 136 300 259 354 169 166033 332 200 239 334 265 256 258 343 170 268 223 362 217 030

Abr: 032 271 083 081 269 253 147 312 219 218 014 346 124 231 273 148260 090 336 345 062 316 252 002 351 340 074 262 191 208

May: 330 298 040 276 364 155 035 321 197 065 037 133 295 178 130 055112 278 075 183 250 326 319 031 361 357 296 308 226 103 313

Jun: 249 228 301 020 028 110 085 366 335 206 134 272 069 356 180 274073 341 104 360 060 247 109 358 137 022 064 222 353 209

Jul: 093 350 115 279 188 327 050 013 277 284 248 015 042 331 322 120098 190 227 187 027 153 172 023 067 303 289 088 270 287 193

Ago: 111 045 261 145 054 114 168 048 106 021 324 142 307 198 102 044154 141 311 344 291 339 116 036 286 245 352 167 061 333 011

Sep: 225 161 049 232 082 006 008 184 263 071 158 242 175 001 113 207255 246 177 063 204 160 119 195 149 018 233 257 151 315

Oct: 359 125 244 202 024 087 234 283 342 220 237 072 138 294 171 254288 005 241 192 243 117 201 196 176 007 264 094 229 038 079

Nov: 019 034 348 266 310 076 051 097 080 282 046 066 126 127 131 107143 146 203 185 156 009 182 230 132 309 047 281 099 174

Dic: 129 328 157 165 056 010 012 105 043 041 039 314 163 026 320 096304 128 240 135 070 053 162 095 084 173 078 123 016 003 100

730 Capítulo 13 Estadística no paramétrica

Pruebas no paramétricas

En este capítulo se estudiaron métodos de prue-

ba de hipótesis de carácter no paramétrico o de

distribución libre. Los métodos no paramétricos

le permiten probar hipótesis sin hacer suposi-

ciones al respecto de la distribución poblacional

subyacente que se está muestreando. Para conti-

nuar su trabajo con este importante tipo de mé-

todos estadísticos de prueba, visite el sitio de

Internet de Estadística Elemental:

http://www.pearsoneducacion.net/triola

Proyecto de Internet

La estadística en el trabajo 731

La estadística en el trabajo¿Cuál es su trabajo en Lycos?

Realizo reportes de tráfico de las activi-dades en nuestro sitio cada semana, loscuales son revisados por nuestros equi-pos de trabajo de producción y gerentes.Ellos ven qué aumenta, qué disminuyey toman decisiones referentes al gastode los recursos.

Mis reportes analizan básicamente lastendencias en los sitios y permiten hacerproyecciones acerca de dónde estaremosdentro de un año o en cualquier otro pe-riodo.

¿Qué conceptos de estadística utiliza?

Análisis de regresión y valores de R cua-drada.

¿De qué manera utiliza la estadísticaen su trabajo?

Para determinar qué es lo que funciona ylo que no funciona para nuestros usua-rios. Para determinar la eficacia de lascampañas de publicidad y para crearproyectos de crecimiento futuro.

Por favor, describa un ejemplo específico e ilustre la manera en que la aplicación de la estadísticapermitió mejorar un producto o unservicio.

Al final de nuestro último año fiscal, nues-tro director ejecutivo, Bob Davis, presentóa la compañía una meta promedio diariade visitantes del sitio que debía lograrseal final del siguiente año fiscal. Utilizandolos datos de visitantes de dos años ante-riores, hice una proyección que mostró

en donde estaríamos al final del siguienteaño fiscal si las cosas permanecían esta-bles. El uso de un valor de R cuadrada ledio a estas gráficas el impulso que necesi-taban para ser eficaces. Actualicé las grá-ficas cada semana y las presenté al equipode gerencia de producción. Los datosles ayudaron a comprender qué reajus-tes debían hacer a sus productos, y cadasemana se acercaron más y más a susmetas. Cuando Bob presentó por prime-ra vez la meta de visitantes, todos pensa-mos que se había vuelto loco, pero estoyfeliz de decir que al final del siguiente añofiscal alcanzaremos nuestra meta o al me-nos un 98% de ella. Sin la representaciónque realicé, la gerencia de producción nohubiera sabido en dónde enfocar su ener-gía y sus recursos. Puesto que forman unequipo eficiente, hemos alcanzado nues-tra meta inalcanzable.

¿El uso que usted hace de la probabilidad y la estadística está aumentando, disminuyendo o permanece estable?

Conforme Lycos se vuelve más compleja,ellos (la gerencia) esperan reportes cadavez más elaborados, de manera que estáen aumento.

¿Considera que los solicitantes deempleo que tienen algunos estudiosde estadística son evaluados de for-ma más favorable?

Definitivamente, y no sólo en lo que res-pecta a los reportes de Lycos, sino tambiénen marketing y finanzas.

Angela Gillespi

Analista de tráfico, Lycos.com

Como analista de tráfico para

Lycos, Inc., Angela realiza

reportes sobre mediciones

amplias y menores de tráfico. Ella

hace un seguimiento de los

cambios en las tendencias y los

patrones de comportamiento del

uso del sitio de Internet, con el

fin de mejorarlo incrementando

su alcance y “adhesividad”

(también llamada stickiness, la

cantidad de tiempo que las

personas permanecen conectadas

a un sitio Web en particular).

“Quienes solicitan empleo deben tener conocimientos fundamentales de estadística y sobre sus implicaciones en el mundo de los negocios”.