Prueba de la bondad del ajuste

Objetivos :

María Isabel [email protected]

Prueba de la Bondad del Ajuste

Comprender la utilidad de la Estadística No Paramétrica para corroborar la bondad de las diferentes distribuciones de variables poblacionales usadas en el ámbito educativo.

Comprender el significado , la utilidad y la interpretación de la prueba Chi-cuadrado para validar los procedimientos de la Inferencia Estadística

Comprender la utilidad de la Estadística No Paramétrica para corroborar la bondad de las diferentes distribuciones de variables poblacionales usadas en el ámbito educativo.

Comprender el significado , la utilidad y la interpretación de la prueba Chi-cuadrado para validar los procedimientos de la Inferencia Estadística

Cómo se distribuyen las variables de una población


Prueba de la Bondad del Ajuste2

Introducción

Cuando se realizan investigaciones, con frecuencia es importante obtener información a través de una muestra sobre la forma como se distribuyen los datos de una población.

Algunos estudios producen resultados sobre los que no podemos afirmar que se distribuyen Normalmente, es decir con forma acampanada concentrados sobre la media.

En estos casos debemos emplear técnicas no paramétricas que se utilizan ampliamente en las aplicaciones de las ciencias sociales, cuando no se puede asumir a priori que los datos de una muestra se ajusten a una distribución normal.

Cuando se realizan investigaciones, con frecuencia es importante obtener información a través de una muestra sobre la forma como se distribuyen los datos de una población.

Algunos estudios producen resultados sobre los que no podemos afirmar que se distribuyen Normalmente, es decir con forma acampanada concentrados sobre la media.

En estos casos debemos emplear técnicas no paramétricas que se utilizan ampliamente en las aplicaciones de las ciencias sociales, cuando no se puede asumir a priori que los datos de una muestra se ajusten a una distribución normal.

Ahora nos ocuparemos del problema de verificar

si de un conjunto de datos se puede afirmar que

proviene de una determinada distribución

¿ ?



Estadística No Paramétrica

La estadística no paramétrica es una rama de la estadística que estudia las pruebas y modelos estadísticos cuya distribución subyacente no se ajusta a los llamados criterios paramétricos.

Algunos experimentos producen respuestas que no son cuantificables, es decir generan mediciones que pueden ordenarse, pero la posición de la respuesta en una escala de medición es arbitraria.

Por ejemplo, suponga que desea evaluar y comparar las habilidades de cinco profesores de educación física, o las características de atención de los alumnos de una clase…

Las pruebas no paramétricas no asumen ningún parámetro de distribución de las variables muestrales.

La estadística no paramétrica es una rama de la estadística que estudia las pruebas y modelos estadísticos cuya distribución subyacente no se ajusta a los llamados criterios paramétricos.

Algunos experimentos producen respuestas que no son cuantificables, es decir generan mediciones que pueden ordenarse, pero la posición de la respuesta en una escala de medición es arbitraria.

Por ejemplo, suponga que desea evaluar y comparar las habilidades de cinco profesores de educación física, o las características de atención de los alumnos de una clase…

Las pruebas no paramétricas no asumen ningún parámetro de distribución de las variables muestrales.

Las pruebas paramétricas asumen los parámetros de la de la variable (media y

varianza) y un tipo de distribución normal

Las pruebas no paramétricas no asumen

ningún parámetro de distribución de las

variables muestrales.



Prueba de la Bondad del Ajuste

Para resolver este problema utilizaremos unas pruebas estadísticas que reciben el nombre general de "Pruebas de Bondad de Ajuste" y específicamente estudiaremos la prueba Chi - Cuadrado (ji dos) aunque existen otras pruebas :

binomial, de Anderson-Darling, de Fisher, etc.

Estas no serán objeto de estudio por ahora.

El cálculo de estas pruebas, es sencillo, desde el punto de vista manual y matemático, sin embargo y siguiendo con nuestra práctica, facilita el trabajo hacerlo con la hoja de calculo de Excel pues lo importante es descargarnos la tarea de cálculo matemático y dedicarnos a la interpretación de resultados y toma de decisiones.

Para resolver este problema utilizaremos unas pruebas estadísticas que reciben el nombre general de "Pruebas de Bondad de Ajuste" y específicamente estudiaremos la prueba Chi - Cuadrado (ji dos) aunque existen otras pruebas :

binomial, de Anderson-Darling, de Fisher, etc.

Estas no serán objeto de estudio por ahora.

El cálculo de estas pruebas, es sencillo, desde el punto de vista manual y matemático, sin embargo y siguiendo con nuestra práctica, facilita el trabajo hacerlo con la hoja de calculo de Excel pues lo importante es descargarnos la tarea de cálculo matemático y dedicarnos a la interpretación de resultados y toma de decisiones.

Profundiza esta información en la Web

PRUEBA DE FISHER

Es la prueba estadística de elección cuando la prueba de chi.cuadrado no puede ser empleada por tamaño muestral insuficiente.

http://tgrajales.net/chicuadrada.pdf






Prueba de Chi-cuadrado (X2)

La prueba de Chi- Cuadrado es considerada como una prueba no paramétrica que mide la discrepancia (bondad de ajuste) entre una distribución observada a partir de la muestra y otra teórica que se supone debe seguir esa muestra, indicando en qué medida las diferencias existentes entre ambas, de haberlas, se deben al azar en el contraste de hipótesis.

Esta prueba se basa en la hipótesis nula (H0) de que no hay diferencias significativas entre

la distribución muestral y la teórica. Mientras que la hipótesis alternativa (H1) siempre se

enuncia como que los datos no siguen la distribución supuesta.

La prueba de Chi- Cuadrado es considerada como una prueba no paramétrica que mide la discrepancia (bondad de ajuste) entre una distribución observada a partir de la muestra y otra teórica que se supone debe seguir esa muestra, indicando en qué medida las diferencias existentes entre ambas, de haberlas, se deben al azar en el contraste de hipótesis.

Esta prueba se basa en la hipótesis nula (H0) de que no hay diferencias significativas entre

la distribución muestral y la teórica. Mientras que la hipótesis alternativa (H1) siempre se

enuncia como que los datos no siguen la distribución supuesta.

H0: La distribución de la

probabilidad es NormalH0 : f( x, θ) = F0 (x, θ)

H1: La distribución de la

probabilidad NO es NormalH1 : f( x, θ) ≠ F0 (x, θ)



Naturaleza de la prueba de Chi-cuadrado

Clases Frecuencias observadas

(foi)

Frecuencias esperadas en

base a H0 (fei)

(foi – fei) 2

___________fei

1 fo1 fe1(fo1 – fe1) 2 / fe1

2 fo2 fe2 (fo2 – fe2) 2 / fe2

3 fo3 fe3 (fo3 – fe3) 2 / fe3

: : : :

K fok fek (fok – fek) 2 / fek

Total n n X2 = Σ(foi – fei) 2 / fei

La estructura básica de la prueba para la bondad del ajuste se muestra en la siguiente tabla



Estadístico de Prueba

El estadístico de prueba está definido como la sumatoria de los residuos expresados en términos de las frecuencias esperadas para cada una de las clases:

X2 = Σi=1 hasta K (foi - fei)2 / fei

donde:

• foi = Total de valores que caen en el intervalo i.

• fei = Número esperado de valores en el intervalo i.

• k = Número de intervalos de clase en que se distribuyen las observaciones.

Formulación de Hipótesis:

• H0: f(x,q) = fo (x, q)

• H1: f(x,q) ≠ fo (x,q)

• Donde fo (x,q) es la distribución que se supone sigue la

muestra aleatoria. La hipótesis alternativa siempre se enuncia como que los datos no siguen la distribución supuesta.

• Aceptar H0 si no existe diferencia significativa entre la distribución de la frecuencia observada en la muestra y la distribución teórica de la población.

El estadístico de prueba está definido como la sumatoria de los residuos expresados en términos de las frecuencias esperadas para cada una de las clases:

X2 = Σi=1 hasta K (foi - fei)2 / fei

donde:

• foi = Total de valores que caen en el intervalo i.

• fei = Número esperado de valores en el intervalo i.

• k = Número de intervalos de clase en que se distribuyen las observaciones.

Formulación de Hipótesis:

• H0: f(x,q) = fo (x, q)

• H1: f(x,q) ≠ fo (x,q)

• Donde fo (x,q) es la distribución que se supone sigue la

muestra aleatoria. La hipótesis alternativa siempre se enuncia como que los datos no siguen la distribución supuesta.

• Aceptar H0 si no existe diferencia significativa entre la distribución de la frecuencia observada en la muestra y la distribución teórica de la población.

La prueba se basa en qué tan buen ajuste se tiene entre la

frecuencia de ocurrencia de las observaciones en una muestra observada y las

frecuencias esperadas que se obtienen a partir de la

distribución hipotética.



Estadístico de Prueba

Interpretación: cuanto mayor sea el valor de X2, menos verosímil es que la hipótesis H0

sea correcta. De la misma forma, cuanto más se aproxima a cero el valor de Chi-cuadrado, más ajustadas están ambas distribuciones.

Si X2 =0 La frecuencia teórica y observada concuerdan exactamente. Si X2 >0 Mientras mayor es la diferencia mayor es la discrepancia.

Debemos comparar el valor calculado, con el observado para determinar si dicha variación es aleatoria.

En la práctica :Si Ho. = 0 no existe diferencia significativa entre la distribución de la frecuencia Observada y la distribución Teórica específicamente con los mismos parámetros.

Interpretación: cuanto mayor sea el valor de X2, menos verosímil es que la hipótesis H0

sea correcta. De la misma forma, cuanto más se aproxima a cero el valor de Chi-cuadrado, más ajustadas están ambas distribuciones.

Si X2 =0 La frecuencia teórica y observada concuerdan exactamente. Si X2 >0 Mientras mayor es la diferencia mayor es la discrepancia.

Debemos comparar el valor calculado, con el observado para determinar si dicha variación es aleatoria.

En la práctica :Si Ho. = 0 no existe diferencia significativa entre la distribución de la frecuencia Observada y la distribución Teórica específicamente con los mismos parámetros.



Consideraciones

Muestra

• La muestra es aleatoria simple de una población

• El tamaño de la muestra es razonablemente grande (n ≥ 20)

• Para esta prueba es necesario agrupar o distribuir las observaciones de la muestra en intervalos de clase, preferiblemente del mismo tamaño.

Naturaleza de los datos a analizar

• Se hacen conteos con números reales.

• Por ejemplo, si tratamos de investigar la distribución que siguen los errores de ortografía cometidos por los alumnos en un dictado, podríamos pensar en una distribución de Poisson, así que en principio no consideraríamos una distribución normal.

La prueba se basa en la comparación de las frecuencias observadas• Por lo tanto la forma que tome el histograma de

frecuencia es quizás la mejor indicación del tipo de distribución a considerar.

• Es decir, se quiere determinar si las frecuencias observadas en la muestra están lo suficientemente cerca de las frecuencias esperadas bajo la hipótesis nula.

Ordenar las observaciones

• El número de intervalos de clase debe ser por lo menos cinco.

• El número esperado de observaciones en cada intervalo debe ser mayor o igual a cinco; en caso contrario, deberían agruparse varios intervalos para lograr esto.

Para formular la hipótesis nula deberán tenerse en cuenta los siguientes aspectos



Ejemplo

Se realizo una encuesta en la universidad y se les pregunto a los estudiantes si estarían o no de acuerdo en sustituir por completo la modalidad presencial por la modalidad de estudio a distancia y se obtuvieron los siguientes datos:

Se realizo una encuesta en la universidad y se les pregunto a los estudiantes si estarían o no de acuerdo en sustituir por completo la modalidad presencial por la modalidad de estudio a distancia y se obtuvieron los siguientes datos:

Hombres (Real) Mujeres (Real) Descripción

58 35 Están de acuerdo

11 25 Neutrales

10 23 No están de acuerdo

Hombres (Esperado) Mujeres (Esperado) Descripción

45,35 47,65 Están de acuerdo

17,56 18,44 Neutrales

16,09 16,91 No están de acuerdo

Se desea comprobar si la probabilidad de que las

tendencias de la muestra sean iguales a las tendencias esperadas

en la población

H0: fo – fe= 0H1: fo – fe≠ 0

PRUEBA.CHI 0,000308 Se aproxima a 0

Acepto H0, los datos de la muestra se comportan muy parecido a los

esperados PRUEBA.CHI se calcula con Excel:

devuelve el valor de la distribución chi cuadrado (χ2) para la estadística y los

grados de libertad apropiados.



Prueba de Chi Cuadrado con SPSS

Revisa este video para entender cómo se aplica la prueba

http://bioestadistico.com/index.php?Itemid=86&id=53&option=com_content&view=article








Lista de Referencias

Sandoval, A. (s/f), Estadística II, Escuela de Ciencias Contable Económico Administrativas de la Universidad Panamericana. Grupo Editorial Iberoamérica. México.

Mendenhall, Willian. (1978), Estadística para Administradores y Economía. Universidad Nacional Autónoma de México. Grupo Editorial Iberoamérica. México.

Navarro, A. (2000), Estadística Aplicada al área económica y empresarial. Ediciones de la Universidad Ezequiel Zamora. Colección Docencia Universitaria. Barinas, Venezuela

Tarjeta de referencia rápida: Funciones estadísticas de Excel

http://support.microsoft.com/kb/828296/es

Sandoval, A. (s/f), Estadística II, Escuela de Ciencias Contable Económico Administrativas de la Universidad Panamericana. Grupo Editorial Iberoamérica. México.

Mendenhall, Willian. (1978), Estadística para Administradores y Economía. Universidad Nacional Autónoma de México. Grupo Editorial Iberoamérica. México.

Navarro, A. (2000), Estadística Aplicada al área económica y empresarial. Ediciones de la Universidad Ezequiel Zamora. Colección Docencia Universitaria. Barinas, Venezuela

Tarjeta de referencia rápida: Funciones estadísticas de Excel




Education

Prueba de la bondad del ajuste