14
PRUEBAS NO PARAMÉTRICAS Módulo IV

PRUEBAS NO PARAMÉTRICAS

  • Upload
    others

  • View
    29

  • Download
    0

Embed Size (px)

Citation preview

Page 1: PRUEBAS NO PARAMÉTRICAS

PRUEBAS NO PARAMÉTRICAS

Módulo IV

Page 2: PRUEBAS NO PARAMÉTRICAS

ÍNDICE

MÓDULO IV: PRUEBAS NO PARAMÉTRICAS Pág.

I. PRUEBA SIGNO - RANGO DE WILCOXON……………………… 3

II. PRUEBA DE MANN WHITNEY…………………………………….. 6

III. PRUEBA DE KRUSKAL-WALLIS PARA COMPARAR MÁS DE

DOS GRUPOS INDEPENDIENTES………………………………. 8

IV. COEFICIENTE DE CORRELACIÓN DE SPEARMAN………….. 9

Page 3: PRUEBAS NO PARAMÉTRICAS

3

MÓDULO IV

PRUEBAS NO PARAMÉTRICAS

Las pruebas de significación estadística pueden clasificarse en:

Paramétricas: Contrastan hipótesis sobre parámetros. Ejemplos: Pruebas t, z y

ANOVA.

No paramétricas: Contrastan hipótesis que no son afirmaciones sobre parámetros y no

dependen de la forma de la distribución poblacional; por este hecho, se denominan

también pruebas de distribución libre. Ejemplos: Prueba signo rango de Wilcoxon,

prueba suma de rangos de Wilcoxon, prueba 2 de Mc Nemar, etc.

A continuación desarrollaremos dos pruebas no paramétricas muy utilizadas:

I. PRUEBA SIGNO - RANGO DE WILCOXON

Se usa para:

1. Comparar dos muestras relacionadas; es decir, para analizar datos obtenidos

mediante el diseño antes-después (cuando cada sujeto sirve como su propio control) o

el diseño pareado (cuando el investigador selecciona pares de sujetos y uno de cada

par, en forma aleatoria, es asignado a uno de dos tratamientos). Pueden existir

además otras formas de obtener dos muestras relacionadas.

2. Cuando la variable es:

a) Cuantitativa medida en escala ordinal.

b) Cuantitativa medida en escala de intervalo o de razón, pero las diferencias (di) de

los pares de datos no se distribuyen normalmente. En este caso, se usa en lugar

de la prueba t de Student para dos muestras relacionadas o “t pareada”.

Ejemplo:

Los datos corresponden a una muestra de 8 pacientes varones de 45 a 55 años de edad.

Son lecturas de colesterol total tomadas tras 12 horas de ayuno y repetida una hora

Page 4: PRUEBAS NO PARAMÉTRICAS

4

después de comer. ¿Hubo un incremento significativo de los niveles de colesterol después

de la comida?

Solución:

a) Hipótesis

H0: No hubo incremento significativo de colesterol total después de la comida.

H1: Hubo incremento significativo de colesterol total después de la comida.

b) Cálculo del contraste T:

T = 33,5 (ó T = 2,5)

c) Cálculo de zT

Con:

T

TT

TT

σ

μTz:Luego

24

1)1)(2nn(nσ

4

1)n(nμ

En este caso n = 8 (ya que no hubo ninguna di= 0)

17,214,7

185,33:

14,724

)17)(9(818

4

)9(8

T

TT

zLuego

Paciente Ayuno Después di

(D-A)

Rango

|di|

de rangos

+ -

1 180 185 5 1 1

2 210 225 15 4 4

3 195 215 20 5 5

4 220 245 25 6 6

5 210 200 -10 2,5 2,5

6 190 220 30 7 7

7 225 235 10 2,5 2,5

8 215 250 35 8 8

33,5 2,5

Page 5: PRUEBAS NO PARAMÉTRICAS

5

d) Valor de p:

p = 1 – 0,9850

p = 0,015

e) Decisión y Conclusión:

Decisión: Siendo p = 0,015 (< 0,05), se rechaza H0.

Conclusión: Hubo incremento, estadísticamente significativo, de los valores de colesterol

después de la comida (p = 0,015).

Page 6: PRUEBAS NO PARAMÉTRICAS

6

II. PRUEBA DE MANN WHITNEY

Se usa para:

1. Comparar dos poblaciones independientes.

2. Cuando la variable es:

a) Cuantitativa medida en escala ordinal.

b) Cuantitativa medida en escala de intervalo o de razón, pero la variable en una o

en las dos poblaciones no tiene distribución normal. En este caso, se usa en lugar

de la prueba t Student para dos muestras independientes.

Ejemplo:

Se tomó una muestra de 10 universitarias y otra de 10 universitarios para determinar si las

mujeres tenían actitud más positiva que los varones frente a la Iglesia católica. Los

puntajes en un cuestionario de actitudes fueron:( mayor puntaje, actitud más positiva).

¿La población de universitarias, tiene actitud más positiva que los universitarios frente a la

Iglesia católica?

Solución:

a) Hipótesis:

H0: mediana de puntajes de las mujeres mediana de varones.

H1: mediana de puntajes de las mujeres > mediana de varones.

Mujeres R1 Varones R2

25 17 20 11

28 20 15 4

26 18 16 5

20 11 12 2

18 7 19 8,5

24 16 23 15

22 14 11 1

20 11 13 3

21 13 17 6

19 8,5 27 19

n1 =10 135,5 n2 =10 74,5

Page 7: PRUEBAS NO PARAMÉTRICAS

7

En otros términos:

H0: Las mujeres no tienen actitudes más positivas que los varones frente a la Iglesia

Católica.

H1: Las mujeres tienen actitudes más positivas que los varones frente a la Iglesia

Católica.

b) Suma de rangos (W)

W = suma de rangos.

W = 74,5

c) Cálculo de zW

31,223,13

1055,74

:

23,1312

)1(

1052

)21(10

2

)1(

2121

1

211

W

W

WW

W

W

z

WzLuego

nnnn

menortamañon

nnn

d) Valor de p

Siendo la prueba unilateral:

p = 0,0104

e) Decisión y Conclusión:

Decisión: Siendo p = 0,0104 ( < 0,05), se rechaza la hipótesis nula.

Conclusión: Las mujeres tienen actitudes más positivas que los varones frente a la Iglesia

Católica (p = 0,0104).

Page 8: PRUEBAS NO PARAMÉTRICAS

8

III. PRUEBA DE KRUSKAL-WALLIS PARA COMPARAR MÁS DE DOS GRUPOS

INDEPENDIENTES

La prueba de Kruskal-Wallis, es una alternativa a la prueba F del análisis de varianza para

diseños de clasificación simple. En este caso se comparan varios grupos pero usando la

mediana de cada uno de ellos, en lugar de las medias. Ho: La mediana de las k

poblaciones consideradas son iguales y Ha: Al menos una de las poblaciones tiene

mediana distinta a las otras.

Donde, n es el total de datos.

Si hay empates en los datos entonces, se aplica la siguiente modificación a H.

Se puede mostrar que si los tamaños de cada grupo son mayores que 5 entonces, H se

distribuye como una Ji-Cuadrado con, k-1 grados de libertad. Luego, la hipótesis nula se

rechaza si H > Ji-Cuadrado con, k-1.

Page 9: PRUEBAS NO PARAMÉTRICAS

9

IV. COEFICIENTE DE CORRELACIÓN DE SPEARMAN

El coeficiente de correlación muestral puede verse seriamente afectado por las

observaciones extremas. Además, los contrastes basados en recurren para su validez al

supuesto de la normalidad. Puede obtenerse una medida de la correlación en la que no

influyen seriamente los val ores extremos y en la que pueden basarse contrastes validos

de distribuciones poblacionales muy generales utilizando los puestos en ordenaciones. El

contraste resultante será en ese caso no param6trico.

Este coeficiente es el equivalente no paramétrico del Coeficiente de correlación que vimos

anteriormente, al que también se le llama Coeficiente de Pearson. Al igual que el

coeficiente de correlación, el Coeficiente de Spearman puede tomar valores entre -1.0 y

1.0, un valor de -1.0 indica una correlación negativa perfecta y un valor de 1.0 indica una

correlación positiva perfecta.

Pasos para calcular el Coeficiente de Spearman

1. Definir la hipótesis nula, por ejem. “No hay relación entre los dos juegos de datos”.

2. Calcular el rango (Rank) para ambos juegos de datos del mayor al menor verificando

empates.

3. Substraer los rangos para obtener la diferencia d.

4. Elevar la diferencia d al cuadrado.

5. Sumar los valores de d al cuadrado para obtener Σd2.

6. Usarla fórmula:

Donde n es el número de rangos.

Ejemplo:

En un estudio de la relación entre la edad y los resultados del electroencefalograma /EEG),

se recopilaron datos en 20 personas con edades entre 20 y 60 años. La Tabla No 3

muestra las edades y un valor de rendimiento del EEG particular para cada una de esas 20

Page 10: PRUEBAS NO PARAMÉTRICAS

10

personas. Los investigadores pretenden saber si es posible concluir que este rendimiento

del EEG particular tiene relación inversa con la edad a un nivel de significancia α=0.05.

Solución:

1. Formulación de hipótesis:

Prueba unilateral izquierda

Ho: El rendimiento del EEG y la edad son mutuamente independientes.

H1: Existe una tendencia del rendimiento del EEG a disminuir con la edad.

2. Nivel de significancia: α=0.05

3. Estadística de prueba:

Page 11: PRUEBAS NO PARAMÉTRICAS

11

4. Establecimiento de los criterios de decisión.

La hipótesis nula Ho se rechaza en la prueba unilateral izquierda en el nivel de

significación α=0.05 si rs es menor que rs* para α=0.05 y n=20.

En la tabla P observamos que para α=0.05 y n=20, - rs* =- 0.3789

5. Cálculos:

Pasos para calcular el valor de rs:

a) Clasificar por jerarquía los valores de X desde 1 hasta 20. Clasificar por jerarquía

los valores de Y desde 1 hasta 20

b) Calcular di, para cada pareja de observaciones, restando la jerarquía de Yi de la

jerarquía de Xi. Ver Tabla No 4.

c) Elevar al cuadrado cada di y calcular, la suma de los valores elevados al cuadrado.

Page 12: PRUEBAS NO PARAMÉTRICAS

12

Se calcula el valor de:

6. Decisión:

Como r2 = - 0.76 0.3789, se rechaza Ho. Lo que quiere decir que las Variables se

encuentran inversamente relacionadas.

Page 13: PRUEBAS NO PARAMÉTRICAS

13

Page 14: PRUEBAS NO PARAMÉTRICAS

14