30
Unidad 4: Pruebas de bondad de ajuste y pruebas no paramétricas Unidad 5: Regresión lineal simple y

pruebas de bondad

Embed Size (px)

DESCRIPTION

pruebas no parametricas

Citation preview

Page 1: pruebas de bondad

Unidad 4: Pruebas de bondad de

ajuste y pruebas no paramétricas

Unidad 5: Regresión lineal

simple y múltiple.

Page 2: pruebas de bondad

Introducción:Una manera de definir la estadística es considerándola una serie ordenada de métodos que se ocupan de la recolección, organización, presentación, análisis e interpretación de datos numéricos.1 Se acostumbra dividirla, según el propósito que se persigue, en: descriptiva e inferencial. La estadística descriptiva se utiliza para describir la frecuencia y distribución de las características (o variables) del objeto en estudio, en tanto que la estadística inferencial se ocupa del proceso metódico para obtener conclusiones válidas de una muestra, con respecto a la población, de manera tal que se le pueda considerar representativa de ella. Para entender cuándo y cómo se usa una o la otra, es preciso entender y definir algunos conceptos básicos de la estadística.

Se describen las pruebas no paramétricas resaltando su fundamento y las indicaciones para su empleo cuando se trata de una sola muestra (Ji cuadrada, binomial, de rachas, Kolmogorov-Smirnov), de dos muestras con datos independientes (U de MannWhitney, Kolmogorov-Smirnov, Moses, o de las rachas de Wald-Wolfowitz), de dos muestras con datos pareados (T de Wilcoxon, del signo, McNemar), de varias muestras con datos independientes (H de Kruskal-Wallis, de la mediana) y de varias muestras con datos pareados (Ji cuadrada de Friedman, W de Kendall, Q de Cochran).

Page 3: pruebas de bondad

Desarrollo:ContenidoUnidad IV: pruebas de bondad de ajustes y pruebas no paramétricas...................................3

4.1.- Bondad de ajuste....................................................................................................................3

4.1.1.- Análisis ji- cuadrada....................................................................................................3

4.1.2.- Prueba de independencia..........................................................................................4

4.1.3.- Prueba de la bondad de ajuste................................................................................5

4.1.4.-Tablas de contingencia................................................................................................5

4.2.- Pruebas no paramétricas..................................................................................................7

4.2.1.- Escala de medición.....................................................................................................8

4.2.2.- Prueba de rangos con signo de Wilcoxon para la mediana..................................9

4.2.3.- Prueba de rangos con signo de Wilcoxon para la diferencia entre 2 medianas (2 poblciones independientes).............................................................................................10

4.2.4.- Prubas de rangos con signos de Wilcoxon para la diferencia de 2 medianas (2 poblaciones dependientes, datos pareados).....................................................................11

4.2.5.- Prueba de las corridas..............................................................................................12

4.3.- Métodos estadísticos contra no paramétricos..............................................................12

4.4.- Pruebas para verificar la normalidad en un grupo de datos.......................................13

4.4.1.- Prueba de Kolmogorov – Smirnov..........................................................................14

4.4.2.- Prueba Anderson – Darling......................................................................................15

4.4.3.- Prueba de Ryan – Joiner..........................................................................................16

4.4.4.- Prueba de Shappiro – Wilk......................................................................................17

BIBLIOGRAFIA..............................................................................................................................19

Page 4: pruebas de bondad

Unidad IV: pruebas de bondad de ajustes y pruebas no paramétricas Competencias a desarrollar

- Identificar y aplicar los conceptos de las pruebas de bondad ajuste.- Establecer cuál es la metodología aplicable a una prueba de bondad de

ajuste.- Identificar y aplicar los conceptos de una prueba no paramétrica.

Temas de investigación conceptual

4.1.- Bondad de ajusteEstas pruebas permiten verificar que la población de la cual proviene una muestra tiene una distribución especificada o supuesta. Sea X: variable aleatoria poblacional f0(x) la distribución (o densidad) de probabilidad especificada o supuesta para X Se desea probar la hipótesis: Ho: f(x) = f0(x) En contraste con la hipótesis alterna: Ha: f(x) no= f0(x) (negación de Ho)

4.1.1.- Análisis ji- cuadrada Esta prueba es aplicable para variables aleatorias discretas o continuas.Sea una muestra aleatoria de tamaño n tomada de una población con una distribución especificada f0(x) que es de interés verificar. Suponer que las observaciones de la muestra están agrupadas en k clases, siendo oi la cantidad de observaciones en cada clase i = 1, 2, ..., k. Con el modelo especificado f0(x) se puede calcular la probabilidad pi que un dato cualquiera Pertenezca a una clase i. Con este valor de probabilidad se puede encontrar la frecuencia esperada ei para la clase i, es decir, la cantidad de datos que según el modelo especificado deberían estar incluidos en la clase i:

ei = pi n, i = 1, 2, ..., k

Tenemos entonces dos valores de frecuencia para cada clase i oi: frecuencia observada (corresponde a los datos de la muestra) ei: frecuencia esperada (corresponde al modelo propuesto)

Page 5: pruebas de bondad

La teoría estadística demuestra que la siguiente variable es apropiada para realizar una prueba de bondad de ajuste: Dado un nivel de significancia α se define un valor crítico 2χα para el rechazo de la hipótesis propuesta Ho: f(x) = f0(x). Si las frecuencias observadas no difieren significativamente de las frecuencias esperadas calculadas con el modelo propuesto, entonces el valor de estadístico de prueba χ2 será cercano a cero, pero si estas diferencias son significativas, entonces el valor del estadístico χ2 estará en la región de rechazo de Ho.

4.1.2.- Prueba de independencia El objetivo es verificar si existe una dependencia entre las variables cualitativas que definen filas y columnas, es decir, si para todo i = 1, ..., k  y  j = 1, .., m se verifica que la probabilidad del resultado correspondiente a la combinación Ai ∩ Bj  es el producto de las probabilidades marginales correspondientes. P(Ai) es la probabilidad del resultado i para la variable fila y P(Bj) la del resultado j para la variable columna.P(Ai ∩ Bj) = P(Ai) · P(Bj)Utilizaremos generalmente la notación más simplificada:P(Ai ∩ Bj) = pij

P(Ai) = pi·

P(Bj) = p·j

Los valores de pi· y p·j se estimarán, a partir de los valores observados en la tabla de contingencia, por ni·/N  y n·j/N respectivamente.Hipótesis nula de independencia: para toda combinación de resultados de las variables fila y columna (i, j).H0: pij = pi· p·j                  para todo      i = 1, ..., k    j = 1, .., mLa hipótesis alternativa, que implica dependencia, se puede formular diciendo que alguna de las igualdades de la hipótesis nula es falsa.Los valores observados son nij. Los valores esperados bajo la hipótesis nula de independencia se calculan de la manera siguiente:eij = N · pij = N · pi· · p·j = N · (ni·/N ) · (n·j/N ) = (ni· · n·j )/NEl estadístico de contraste se calcula de la manera habitual:

La distribución asintótica bajo la hipótesis nula es una χ2 con (k − 1) · (m − 1) grados de libertad. Los grados de libertad pueden entenderse, de manera intuitiva, entendiendo que el número de parámetros que se estiman son (k − 1) y (m − 1),

Page 6: pruebas de bondad

ya que queda fijada la probabilidad de la última clase de cada característica una vez estimadas las restantes. Por tanto, aplicando la fórmula para los grados de libertad se obtiene:grados de libertad = número de clases − número de parámetros estimados − 1grados de libertad = k · m − (k − 1) − (m − 1) − 1 = (k − 1) · (m − 1)El criterio de decisión es el mismo que en el caso general:Rechazamos la hipótesis nula si

donde el último término es el valor crítico asociado con una distribución χ2, con (k − 1) · (m − 1) grados de libertad, tal que deja a su derecha una probabilidad igual a α.La condición de validez es que las frecuencias esperadas eij sean mayores que 5.

4.1.3.- Prueba de la bondad de ajusteUna extensión de la prueba sobre la proporción binomial ocurre cuando una realización puede clasificarse en k posibles categorías en vez de dos (éxito y fracaso). Esto puede ocurrir en la elección de un individuo de un partido político (tricolor, amarillo, azul, otro), en el tipo de delito por el cual un individuo es recluido (un delito de violencia, un delito de cuello blanco, otro), por mencionar algunos ejemplos.

Supóngase que en una muestra en particular se observa que ocurre un conjunto de eventos posibles E1, E2, E3, …, Ek (véase la tabla), con frecuencias o1, o2, o3, …, ok, denominadas frecuencias observadas, y que de acuerdo con las reglas de probabilidad, se espera que ocurran con frecuencias e1, e2, e3, …, ek, llamdas frecuencias esperadas. En un escenario como el descrito arriba se desea saber si las frecuencias observadas difieren significativamente de las frecuencias esperadas.

Evento E1 E2 E3 … Ek

Frecuencia observada o1 o2 o3 … ok

Frecuencias esperadas

e1 e2 e3 … ek

Page 7: pruebas de bondad

El estadístico proporciona una medida de la discrepancia existente entre la frecuencia observada y la frecuencia esperada, que está dada por

(1)

Donde, se la frecuencia total es n,

. (2)

La hipótesis nula que se desea probar es

H0: p1=p10,…pk = pk0

Contra

Ha: al menos una pj ≠ pj0 para j=1,…,k,

Donde pj0 es la proporción correspondiente a la j-ésima categoría.

Nótese que bajo H0 ej = n pj0.

Bajo la hipótesis nula, el estadístico (ji-cuadrado) se distribuye

aproximadamente (k-1) y entonces se rechaza H0 al nivel de significancia α si

excede el valor critico .

4.1.4.-Tablas de contingencia

Es un medio particular de representar simultáneamente dos carácteres observados en una misma población, si son discretos o continuos reagrupados en

clases. Los dos carácteres son   e  , el tamaño de la muestra es  . Las

Page 8: pruebas de bondad

modalidades o clases de   se escribirán , las de  ,  . Se denota

 el efectivo conjunto de   y   : es el número de individuos para los

cuales   toma el valor   e   el valor  ,

 

el efectivo marginal de   : es el número de individuos para los cuales   toma el

valor  ,

 el efectivo marginal de   : es el número de individuos

para los cuales   toma el valor  .

Se representan estos valores en una tabla de doble entrada, llamada tabla de contingencia:

Cada fila y cada columna corresponden a una submuestra particular. La fila de índice   

Page 9: pruebas de bondad

es la distribución en  , de los individuos para los cuales el carácter   toma el

valor  . La columna de índice   es la distribución sobre  , de los individuos

para los cuales el carácter   toma el valor  . Dividiendo las filas y las columnas por sus sumas, obtenemos en cada una, distribuciones empíricas formadas por frecuencias

condicionales. Para    y  , las denotaremos:

   y

4.2.- Pruebas no paramétricas

La mayor parte de los procedimientos de prueba de hipótesis que se presentan en las unidades anteriores se basan en la suposición de que las muestras aleatorias se seleccionan de poblaciones normales. Afortunadamente, la mayor parte de estas pruebas aún son confiables cuando experimentamos ligeras desviaciones de la normalidad, en particular cuando el tamaño de la muestra es grande. Tradicionalmente, estos procedimientos de prueba se denominan métodos paramétricos. En esta sección se consideran varios procedimientos de prueba alternativos, llamados no paramétricos ó métodos de distribución libre, que a menudo no suponen conocimiento de ninguna clase acerca de las distribuciones de las poblaciones fundamentales, excepto que éstas son continuas.

Los procedimientos no paramétricos o de distribución libre se usan con mayor frecuencia por los analistas de datos. Existen muchas aplicaciones en la ciencia y la ingeniería donde los datos se reportan no como valores de un continuo sino mas bien en una escala ordinal tal que es bastante natural asignar rangos a los datos.

Un ejemplo donde se aplica una prueba no paramétrica es el siguiente, dos jueces deben clasificar cinco marcas de cerveza de mucha demanda mediante la asignación de un grado de 1 a la marca que se considera que tiene la mejor calidad global, un grado 2 a la segunda mejor, etcétera. Se puede utilizar entonces una prueba no paramétrica para determinar donde existe algún acuerdo entre los dos jueces.

Se debe señalar que hay varias desventajas asociadas con las pruebas no paramétricas. En primer lugar, no utilizan la información que proporciona la muestra, y por ello una prueba no paramétrica será menos eficiente que el procedimiento paramétrico correspondiente, cuando se pueden aplicar ambos

Page 10: pruebas de bondad

métodos. En consecuencia, para lograr la misma potencia, una prueba no paramétrica requerirá la correspondiente prueba no paramétrica.

Como se indicó antes, ligeras divergencias de la normalidad tienen como resultado desviaciones menores del ideal para las pruebas paramétricas estándar. Esto es cierto en particular para la prueba t y la prueba F. En el caso de la prueba t y la prueba F, el valor P citado puede ser ligeramente erróneo si existe una violación moderada de la suposición de normalidad.

En resumen, si se puede aplicar una prueba paramétrica y una no paramétrica al mismo conjunto de datos, debemos aplicar la técnica paramétrica más eficiente. Sin embargo, se debe reconocer que las suposiciones de normalidad a menudo no se pueden justificar, y que no siempre se tienen mediciones cuantitativas.

4.2.1.- Escala de medición

Las variables de las escalas nominal y ordinal se denominan también categóricas, por otra parte las variables de escala de intervalo o de razón se denominan variables numéricas. Con los valores de las variables categóricas no tiene sentido o no se puede efectuar operaciones aritméticas. Con las variables numéricas sí.

La escala nominal sólo permite asignar un nombre al elemento medido. Esto la convierte en la menos informativa de las escalas de medición.

La escala ordinal, además de las propiedades de la escala nominal, permite establecer un orden entre los elementos medidos. 

Page 11: pruebas de bondad

La escala de intervalo, además de todas las propiedades de la escala ordinal, hace que tenga sentido calcular diferencias entre las mediciones.

Finalmente, la escala de razón permite, además de lo de las otras escalas, comparar mediciones mediante un cociente.

4.2.2.- Prueba de rangos con signo de Wilcoxon para la medianaDebido que se supone que la distribución subyacente es simétrica = así que se expresa la hipótesis de interés en términos de en vez de *.

Suposición: X1, X2,… Xn es una muestra aleatoria de una distribución de probabilidad continua y simétrica con media y mediana ()

Cuando el valor supuesto de es 0 las diferencias absolutas X1=0 …Xn=n se deben clasificar de menor a mayor

Hipótesis nula: H0: µ=µ0

Valor del estadístico de prueba

S+= las suma de los rangos relacionados con (xi - µ0) positivas.

Hipótesis alternativa Región de rechazo para la prueba de nivel Ha: > 0 S+ ≥ C1

Ha: > 0 S+ C2 [donde C2 = n(n + 1)/2 - C1]Ha: 0 Ya sea S+ ≥ C o S+ n(n + 1)/2 - C1

Donde los valores críticos C1. Cuando los valores críticos satisfacen P(S+ ≥ C1) ≈ y p(S+ ≥ C) ≈ /2 cuando H0 es verdadera.

Page 12: pruebas de bondad

4.2.3.- Prueba de rangos con signo de Wilcoxon para la diferencia entre 2 medianas (2 poblciones independientes)

La prueba de los rangos con signo de Wilcoxon es una prueba no paramétrica para comparar la mediana de dos muestras relacionadas y determinar si existen diferencias entre ellas. Se utiliza como alternativa a laprueba t de Student cuando no se puede suponer la normalidad de dichas muestras. Debe su nombre a Frank Wilcoxon, que la publicó en 1945.1 Es una prueba no paramétrica de comparación de dos muestras relacionadas, debe cumplir las siguientes características:

• Es libre de curva, no necesita una distribución específica • Nivel ordinal de la variable dependiente • Se utiliza para comparar dos mediciones de rangos (medianas) y determinar que la diferencia no se deba al azar (que la diferencia sea estadísticamente significativa).

Se utiliza cuando la variable subyacente es continua pero no se presupone ningún tipo de distribución particular.

Suponga que se dispone de n pares de observaciones, denominadas  . El

objetivo del test es comprobar si puede dictaminarse que los valores   e   son o

no iguales.

La hipótesis nula es  :  . Retrotrayendo dicha hipótesis a los valores   

originales, ésta vendría a decir que son en cierto sentido del mismo tamaño.

Para verificar la hipótesis, en primer lugar, se ordenan los valores

absolutos   y se les asigna su rango  . Entonces, el estadístico de

la prueba de los signos de Wilcoxon,  , es

es decir, la suma de los rangos   correspondientes a los valores

positivos de  .

La distribución del estadístico   puede consultarse en tablas para determinar si

se acepta o no la hipótesis nula.

En ocasiones, esta prueba se usa para comparar las diferencias entre dos

muestras de datos tomados antes y después del tratamiento, cuyo valor central se

Page 13: pruebas de bondad

espera que sea cero. Las diferencias iguales a cero son eliminadas y el valor

absoluto de las desviaciones con respecto al valor central son ordenadas de

menor a mayor. A los datos idénticos se les asigna el lugar medio en la serie. La

suma de los rangos se hace por separado para los signos positivos y los

negativos. S representa la menor de esas dos sumas. Comparamos S con el valor

proporcionado por las tablas estadísticas al efecto para determinar si rechazamos

o no la hipótesis nula, según el nivel de significación elegido.

4.2.4.- Pruebas de rangos con signos de Wilcoxon para la diferencia de 2 medianas (2 poblaciones dependientes, datos pareados)Es útil para probar la aseveración de que una muestra proviene de una población con una mediana específica.Se emplea para grupos correlacionados (datos apareados) y cuyos datos no siguen una distribución normalEsta prueba toma en cuenta la magnitud como la dirección de los puntajes de diferenciaPuede emplearse en lugar de la prueba t para grupos dependientes cuando no se tiene certeza de la distribución de la muestra y no se tiene datos sobre la poblaciónEs una prueba no pará métrica que utiliza rangos ordenados de datos muéstrales consistentes en datos apareados. Se usa para probar las diferencias en las distribuciones poblacionales y se basa en los siguientes supuestos:Los datos consisten en datos apareados que se seleccionan aleatoriamente. La podemos emplear para evaluar si dos grupos dependientes tienen distribuciones similares. La distribución de las diferencias tiene una distribución que es aproximadamente simétrica. Los datos dentro de cada pareja deben ser por lo menos de mediciones ordinales.Para calcular Tobt hay que ordenar por rangos de puntaje de diferencia.Suposiciones y pasos a considerar:

1. Los datos se ordenan de acuerdo a un criterio, por ejemplo del más pequeño al más grande, o del mayor a menor, etc.

2. El rango es el número que se asigna a un elemento muestral individual de acuerdo con su orden en la lista ordenada

Page 14: pruebas de bondad

3. Se descartan todas las diferencias iguales a cero y se ordenan y etiquetan las diferencias absolutas restantes, desde la mínima hasta la máxima.

4. Cuando las diferencias son iguales se les asigna la clasificación media a sus posiciones ordenadas en el conjunto combinado de datos

5. La idea básica que está detrás de la prueba del signo es el análisis de las frecuencias de los signos positivos y negativos para determinar si son significativamente diferentes

6. Emplearemos el estadístico de prueba con base en el número de veces que ocurre el signo menos frecuente.

4.2.5.- Prueba de las corridasLas pruebas de las corridas, que se basan en el orden en el que se obtienen las observaciones muestrales, es una técnica útil para probar la hipótesis nula H0 de que las observaciones en realidad se extraen al azar.

Para ilustrar las pruebas de corridas. Supongamos que se encuestan 12 personas

para saber si utilizan cierto producto. Se cuestionara seriamente la supuesta

aleatoriabilidad de la muestra si las 12 personas fueran del mismo sexo.

Designaremos un hombre y una mujer con los símbolos M y F, respectivamente, y

registraremos los resultados de acuerdo con su sexo en el orden en que ocurren.

Subsecuencia típica para el experimento podría ser

M M F F F M F F M M M M

Donde agrupamos las subsecuencias de símbolos similares. Tales agrupamientos

se llaman corridas.

Definición: una corrida es una subsecuencia de uno o más símbolos idénticos que

representan una propiedad común de los datos.

4.3.- Métodos estadísticos contra no paramétricos

EL CASO DE DOS MUESTRAS: Las pruebas estadísticas de dos muestras se usan

cuando el investigador desea establecer la diferencia entre dos tratamientos o si un

tratamiento es mejor que otro. Por ejemplo adiestramiento, uso de psicofármaco, en

Page 15: pruebas de bondad

cada caso el grupo que ha sufrido el tratamiento es comparado con el que no lo ha

experimentado o que ha sufrido un tratamiento diferente.

En la comparación de estos grupos, a veces se observan diferencias significativas que

no son el resultado del tratamiento, por ejemplo, en el estudio de los trabajadores que

se someten a un entrenamiento diferente para determinar cuál es el mejor para elevar

su calificación, puede ser que la diferencia no se deba, realmente, a uno u otro

tratamiento, sino que uno de los grupos estaba más motivado por elevar rápidamente

su calificación y, de esta forma, no se refleja verdaderamente la efectividad del

procedimiento de enseñanza.

Una forma de eliminar esta dificultad, es usar MUESTRAS RELACIONADAS estas

se pueden lograr: Cuando el propio sujeto es su propio control. Con parejas de

sujetos en las que se asignan los miembros de cada pareja, a las dos condiciones.

La técnica paramétrica usual para analizar datos provenientes de dos muestras

relacionadas es aplicar la prueba t a los puntajes, estos se pueden obtener de los

dos puntajes de cada pareja igualada o de los puntajes de cada sujeto bajo las dos

condiciones. Éstas pruebas determinan la medida en dije las diferencias de las

muestras indican, de forma convincente, una diferencia en el proceso aplicado en

ellos.

En el caso de dos MUESTRAS INDEPENDIENTES, ellas pueden obtenerse:

Tomando al azar sujetos de dos poblaciones. Asignando al azar ambos tratamientos

a miembros de algunas muestras de orígenes arbitrarios. No es necesario que la

muestra sea del mismo tamaño.

En este caso, la prueba t es la técnica paramétrica indicada para analizar los datos

de las dos muestras independientes.

Page 16: pruebas de bondad

4.4.- Pruebas para verificar la normalidad en un grupo de datos

Un caso específico de ajuste a una distribución teórica es la correspondiente a la distribución normal. Este contraste se realiza para comprobar si se verifica la hipótesis de normalidad necesaria para que el resultado de algunos análisis sea fiable, como por ejemplo para el ANOVA.

Para comprobar la hipótesis nula de que la muestra ha sido extraída de una población con distribución de probabilidad normal se puede realizar un estudio gráfico y/o analítico.

4.4.1.- Prueba de Kolmogorov – SmirnovLa prueba de bondad de ajuste de Kolmogorov-Smirnov es una alternativa para probar que una muestra “proviene” de una distribución continua (normal). Esta prueba se basa en la comparación entre la función distribución acumulada de una distribución teórica con la función distribución acumulada de la muestra.   Si las funciones de distribución acumulada teórica y muestral no son significativamente diferentes, entonces decimos que la muestra proviene de la distribución cuya función distribución acumulada es Ft(x). Sin embargo, si las diferencias entre las funciones distribución acumuladas son muy grandes como para que no sean debidas solamente al azar, rechazamos Ho

Los pasos a seguir en la prueba de bondad de ajuste de Kolmogorov-Smirnov son los siguientes: Plantear la hipótesis: Ho: Fm(X)=Ft(X) para todo X E R; Ha: Fm(X)=Ft(X), por lo menos para un X. 

Calcular todos los valores Fm(X) de la muestra X1,X2,….,Xn. 

Determinar la desviación máxima, que está dada por el supremo de los valores absolutos de las diferencias entre los valores de la función acumulada teórica y de la muestra. 

Escoger un nivel de significación 

De acuerdo al resultado se toma la decisión 

Las suposiciones en la prueba de bondad de ajuste de Kolmogorov-Smirnov son:1. Muestras Aleatorias

2. La población deber ser continua en la variable observada

Page 17: pruebas de bondad

3. La prueba no es validad si se tiene que estimar uno o más parámetros usando los datos de la muestra.

TABLA DE KOLMOGOROV-SMIRNOV

4.4.2.- Prueba Anderson – DarlingLa prueba de Anderson-Darling es usada para probar si una muestra viene de una distribución especifica. Esta prueba es una modificación de la prueba de Kolmogorov- Smirnov donde se le da más peso a las colas de la distribución que la prueba de Kolmogorov-Smirnov.

En estadística, la prueba de Anderson-Darling es una prueba no paramétrica sobre si los datos de una muestra provienen de una distribución específica. La fórmula para el estadístico determina si los datos (observar que los datos se deben ordenar) vienen de una distribución con función acumulativa  F.

Page 18: pruebas de bondad

Donde:

n es el número de datos

f(x): es la función de distribución de probabilidad teórica

FS(X): es la función de distribución empírica.

Para definir la regla de rechazo para esta prueba es necesario, también, obtener el estadístico ajustado para luego compararlo con los valores críticos de la tabla de Anderson- Darling

Una vez obtenido el estadístico ajustado, la regla de rechazo se realiza análogamente a la utilizada en la prueba de K-S.

El estadístico de la prueba se puede entonces comparar contra las distribuciones del estadístico de prueba (dependiendo que F se utiliza) para determinar el P- valor.

Page 19: pruebas de bondad

4.4.3.- Prueba de Ryan – JoinerLa prueba de ryan – joiner es usada para probar si una muestra viene de muestra especifica. Esta prueba es una modificación de la prueba de Kolmogorck – Smirnov donde se da más paso a las colas de la distribución que la prueba de Kolmogorck – Smirnov.

Es una prueba no paramétrica donde sobre si los datos de una muestra proviene de una distribución especifica la fórmula para el estadístico determina si los datos (observar que los datos se deben ordenar) vienen de una distribución con acumulativa F.

Formulas:

A2=−N−S

Donde el estadístico de prueba para la prueba de Anderson – Darling:

4.4.4.- Prueba de Shappiro – Wilk

Mide el ajuste de la muestra a una recta, al dibujarla en papel probabilístico normal. Este tipo de representación también lo proporcionan algunos programas de estadística, de tal manera que nos permite además apreciar el ajuste o desajuste de forma visual:

Page 20: pruebas de bondad

En escala probabilística normal se representa en el eje horizontal, para cada valor observado en nuestros datos, la función de distribución o probabilidad acumulada observada, y en el eje vertical la prevista por el modelo de distribución normal. Si el ajuste es bueno, los puntos se deben distribuir aproximadamente según una recta a 45º. En la imagen vemos que en este ejemplo existe cierta discrepancia.

En cualquier caso siempre es adecuado efectuar una representación gráfica de tipo histograma de los datos, y comparar el valor de la media y la mediana, así como evaluar el coeficiente de asimetría y apuntamiento, además de llevar a cabo una representación en escala probabilística de la distribución de probabilidad esperada versus observada, como la de la figura.

Cuando la muestra es como máximo de tamaño 50 se puede contrastar la normalidad con la prueba de shapiro Shapiro-Wilk. Para efectuarla se calcula la media y la varianza muestral, S2, y se ordenan las observaciones de menor a mayor. A continuación se calculan las diferencias entre: el primero y el último; el segundo y el penúltimo; el tercero y el antepenúltimo, etc. y se corrigen con unos coeficientes tabulados por Shapiro y Wilk. El estadístico de prueba es:

Page 21: pruebas de bondad

donde D es la suma de las diferencias corregidas.

Se rechazará la hipótesis nula de normalidad si el estadístico W es menor que el valor crítico proporcionado por la tabla elaborada por los autores para el tamaño muestral y el nivel de significación dado.

Page 22: pruebas de bondad

CONCLUSIONES:

Cuando se usan variables cuantitativas continuas y la media aritmética y desviación estándar de las muestras tienden a tener una distribución normal, con varianzas similares (homogeneidad), y el tamaño de las muestras es suficiente (mayor a 30 casos) se deben utilizar las pruebas estadísticas paramétricas. En caso de que no se cumplan estos requisitos, y sobre todo cuando la normalidad de las distribuciones de la variable en estudio esté en duda y el tamaño de la muestra sea menor a once casos, el empleo de las pruebas no paramétricas está indicado. Cuando una o varias muestras es menor a 11 casos, la potencia estadística de las pruebas paramétricas y no paramétricas es similar; a medida que aumenta el tamaño de las muestras las pruebas paramétricas aumentan su potencia, por lo que las pruebas no paramétricas están indicadas cuando la muestra sea menor de once o bien cuando hay una muestra mayor pero no se cumplen los requisitos de aplicabilidad de las pruebas paramétricas.

Page 23: pruebas de bondad

BIBLIOGRAFIA

Marqués dos Santos, María José; Estadística Básica: un enfoque no paramétrico, Universidad Nacional Autónoma de México, Facultad de Estudios Superiores ZaragozaLlinás Solano, Humberto; Estadística inferencial, Ediciones Uninorte, 2006

Est. Básica p Admón. - Berenson, Levine

Probabilidad y Estadística Aplicadas a la Ingeniería (Montgomery - Runger) - 2º Edición [Cap 1 - 8]