Upload
maria-isabel-bautista
View
49.975
Download
2
Embed Size (px)
DESCRIPTION
Comprender la utilidad de la Estadística No Paramétrica. Interpretación de la prueba Chi-cuadrado
Citation preview
Objetivos :
María Isabel [email protected]
Prueba de la Bondad del Ajuste
Comprender la utilidad de la Estadística No Paramétrica para corroborar la bondad de las diferentes distribuciones de variables poblacionales usadas en el ámbito educativo.
Comprender el significado , la utilidad y la interpretación de la prueba Chi-cuadrado para validar los procedimientos de la Inferencia Estadística
Comprender la utilidad de la Estadística No Paramétrica para corroborar la bondad de las diferentes distribuciones de variables poblacionales usadas en el ámbito educativo.
Comprender el significado , la utilidad y la interpretación de la prueba Chi-cuadrado para validar los procedimientos de la Inferencia Estadística
Cómo se distribuyen las variables de una población
María Isabel [email protected]
Prueba de la Bondad del Ajuste2
Introducción
Cuando se realizan investigaciones, con frecuencia es importante obtener información a través de una muestra sobre la forma como se distribuyen los datos de una población.
Algunos estudios producen resultados sobre los que no podemos afirmar que se distribuyen Normalmente, es decir con forma acampanada concentrados sobre la media.
En estos casos debemos emplear técnicas no paramétricas que se utilizan ampliamente en las aplicaciones de las ciencias sociales, cuando no se puede asumir a priori que los datos de una muestra se ajusten a una distribución normal.
Cuando se realizan investigaciones, con frecuencia es importante obtener información a través de una muestra sobre la forma como se distribuyen los datos de una población.
Algunos estudios producen resultados sobre los que no podemos afirmar que se distribuyen Normalmente, es decir con forma acampanada concentrados sobre la media.
En estos casos debemos emplear técnicas no paramétricas que se utilizan ampliamente en las aplicaciones de las ciencias sociales, cuando no se puede asumir a priori que los datos de una muestra se ajusten a una distribución normal.
Ahora nos ocuparemos del problema de verificar
si de un conjunto de datos se puede afirmar que
proviene de una determinada distribución
¿ ?
María Isabel [email protected]
Prueba de la Bondad del Ajuste3
Estadística No Paramétrica
La estadística no paramétrica es una rama de la estadística que estudia las pruebas y modelos estadísticos cuya distribución subyacente no se ajusta a los llamados criterios paramétricos.
Algunos experimentos producen respuestas que no son cuantificables, es decir generan mediciones que pueden ordenarse, pero la posición de la respuesta en una escala de medición es arbitraria.
Por ejemplo, suponga que desea evaluar y comparar las habilidades de cinco profesores de educación física, o las características de atención de los alumnos de una clase…
Las pruebas no paramétricas no asumen ningún parámetro de distribución de las variables muestrales.
La estadística no paramétrica es una rama de la estadística que estudia las pruebas y modelos estadísticos cuya distribución subyacente no se ajusta a los llamados criterios paramétricos.
Algunos experimentos producen respuestas que no son cuantificables, es decir generan mediciones que pueden ordenarse, pero la posición de la respuesta en una escala de medición es arbitraria.
Por ejemplo, suponga que desea evaluar y comparar las habilidades de cinco profesores de educación física, o las características de atención de los alumnos de una clase…
Las pruebas no paramétricas no asumen ningún parámetro de distribución de las variables muestrales.
Las pruebas paramétricas asumen los parámetros de la de la variable (media y
varianza) y un tipo de distribución normal
Las pruebas no paramétricas no asumen
ningún parámetro de distribución de las
variables muestrales.
María Isabel [email protected]
Prueba de la Bondad del Ajuste4
Prueba de la Bondad del Ajuste
Para resolver este problema utilizaremos unas pruebas estadísticas que reciben el nombre general de "Pruebas de Bondad de Ajuste" y específicamente estudiaremos la prueba Chi - Cuadrado (ji dos) aunque existen otras pruebas :
binomial, de Anderson-Darling, de Fisher, etc.
Estas no serán objeto de estudio por ahora.
El cálculo de estas pruebas, es sencillo, desde el punto de vista manual y matemático, sin embargo y siguiendo con nuestra práctica, facilita el trabajo hacerlo con la hoja de calculo de Excel pues lo importante es descargarnos la tarea de cálculo matemático y dedicarnos a la interpretación de resultados y toma de decisiones.
Para resolver este problema utilizaremos unas pruebas estadísticas que reciben el nombre general de "Pruebas de Bondad de Ajuste" y específicamente estudiaremos la prueba Chi - Cuadrado (ji dos) aunque existen otras pruebas :
binomial, de Anderson-Darling, de Fisher, etc.
Estas no serán objeto de estudio por ahora.
El cálculo de estas pruebas, es sencillo, desde el punto de vista manual y matemático, sin embargo y siguiendo con nuestra práctica, facilita el trabajo hacerlo con la hoja de calculo de Excel pues lo importante es descargarnos la tarea de cálculo matemático y dedicarnos a la interpretación de resultados y toma de decisiones.
Profundiza esta información en la Web
PRUEBA DE FISHER
Es la prueba estadística de elección cuando la prueba de chi.cuadrado no puede ser empleada por tamaño muestral insuficiente.
María Isabel [email protected]
Prueba de la Bondad del Ajuste5
Prueba de Chi-cuadrado (X2)
La prueba de Chi- Cuadrado es considerada como una prueba no paramétrica que mide la discrepancia (bondad de ajuste) entre una distribución observada a partir de la muestra y otra teórica que se supone debe seguir esa muestra, indicando en qué medida las diferencias existentes entre ambas, de haberlas, se deben al azar en el contraste de hipótesis.
Esta prueba se basa en la hipótesis nula (H0) de que no hay diferencias significativas entre
la distribución muestral y la teórica. Mientras que la hipótesis alternativa (H1) siempre se
enuncia como que los datos no siguen la distribución supuesta.
La prueba de Chi- Cuadrado es considerada como una prueba no paramétrica que mide la discrepancia (bondad de ajuste) entre una distribución observada a partir de la muestra y otra teórica que se supone debe seguir esa muestra, indicando en qué medida las diferencias existentes entre ambas, de haberlas, se deben al azar en el contraste de hipótesis.
Esta prueba se basa en la hipótesis nula (H0) de que no hay diferencias significativas entre
la distribución muestral y la teórica. Mientras que la hipótesis alternativa (H1) siempre se
enuncia como que los datos no siguen la distribución supuesta.
H0: La distribución de la
probabilidad es NormalH0 : f( x, θ) = F0 (x, θ)
H1: La distribución de la
probabilidad NO es NormalH1 : f( x, θ) ≠ F0 (x, θ)
María Isabel [email protected]
Prueba de la Bondad del Ajuste6
Naturaleza de la prueba de Chi-cuadrado
Clases Frecuencias observadas
(foi)
Frecuencias esperadas en
base a H0 (fei)
(foi – fei) 2
___________fei
1 fo1 fe1(fo1 – fe1) 2 / fe1
2 fo2 fe2 (fo2 – fe2) 2 / fe2
3 fo3 fe3 (fo3 – fe3) 2 / fe3
: : : :
K fok fek (fok – fek) 2 / fek
Total n n X2 = Σ(foi – fei) 2 / fei
La estructura básica de la prueba para la bondad del ajuste se muestra en la siguiente tabla
María Isabel [email protected]
Prueba de la Bondad del Ajuste7
Estadístico de Prueba
El estadístico de prueba está definido como la sumatoria de los residuos expresados en términos de las frecuencias esperadas para cada una de las clases:
X2 = Σi=1 hasta K (foi - fei)2 / fei
donde:
• foi = Total de valores que caen en el intervalo i.
• fei = Número esperado de valores en el intervalo i.
• k = Número de intervalos de clase en que se distribuyen las observaciones.
Formulación de Hipótesis:
• H0: f(x,q) = fo (x, q)
• H1: f(x,q) ≠ fo (x,q)
• Donde fo (x,q) es la distribución que se supone sigue la
muestra aleatoria. La hipótesis alternativa siempre se enuncia como que los datos no siguen la distribución supuesta.
• Aceptar H0 si no existe diferencia significativa entre la distribución de la frecuencia observada en la muestra y la distribución teórica de la población.
El estadístico de prueba está definido como la sumatoria de los residuos expresados en términos de las frecuencias esperadas para cada una de las clases:
X2 = Σi=1 hasta K (foi - fei)2 / fei
donde:
• foi = Total de valores que caen en el intervalo i.
• fei = Número esperado de valores en el intervalo i.
• k = Número de intervalos de clase en que se distribuyen las observaciones.
Formulación de Hipótesis:
• H0: f(x,q) = fo (x, q)
• H1: f(x,q) ≠ fo (x,q)
• Donde fo (x,q) es la distribución que se supone sigue la
muestra aleatoria. La hipótesis alternativa siempre se enuncia como que los datos no siguen la distribución supuesta.
• Aceptar H0 si no existe diferencia significativa entre la distribución de la frecuencia observada en la muestra y la distribución teórica de la población.
La prueba se basa en qué tan buen ajuste se tiene entre la
frecuencia de ocurrencia de las observaciones en una muestra observada y las
frecuencias esperadas que se obtienen a partir de la
distribución hipotética.
María Isabel [email protected]
Prueba de la Bondad del Ajuste8
Estadístico de Prueba
Interpretación: cuanto mayor sea el valor de X2, menos verosímil es que la hipótesis H0
sea correcta. De la misma forma, cuanto más se aproxima a cero el valor de Chi-cuadrado, más ajustadas están ambas distribuciones.
Si X2 =0 La frecuencia teórica y observada concuerdan exactamente. Si X2 >0 Mientras mayor es la diferencia mayor es la discrepancia.
Debemos comparar el valor calculado, con el observado para determinar si dicha variación es aleatoria.
En la práctica :Si Ho. = 0 no existe diferencia significativa entre la distribución de la frecuencia Observada y la distribución Teórica específicamente con los mismos parámetros.
Interpretación: cuanto mayor sea el valor de X2, menos verosímil es que la hipótesis H0
sea correcta. De la misma forma, cuanto más se aproxima a cero el valor de Chi-cuadrado, más ajustadas están ambas distribuciones.
Si X2 =0 La frecuencia teórica y observada concuerdan exactamente. Si X2 >0 Mientras mayor es la diferencia mayor es la discrepancia.
Debemos comparar el valor calculado, con el observado para determinar si dicha variación es aleatoria.
En la práctica :Si Ho. = 0 no existe diferencia significativa entre la distribución de la frecuencia Observada y la distribución Teórica específicamente con los mismos parámetros.
María Isabel [email protected]
Prueba de la Bondad del Ajuste9
Consideraciones
Muestra
• La muestra es aleatoria simple de una población
• El tamaño de la muestra es razonablemente grande (n ≥ 20)
• Para esta prueba es necesario agrupar o distribuir las observaciones de la muestra en intervalos de clase, preferiblemente del mismo tamaño.
Naturaleza de los datos a analizar
• Se hacen conteos con números reales.
• Por ejemplo, si tratamos de investigar la distribución que siguen los errores de ortografía cometidos por los alumnos en un dictado, podríamos pensar en una distribución de Poisson, así que en principio no consideraríamos una distribución normal.
La prueba se basa en la comparación de las frecuencias observadas• Por lo tanto la forma que tome el histograma de
frecuencia es quizás la mejor indicación del tipo de distribución a considerar.
• Es decir, se quiere determinar si las frecuencias observadas en la muestra están lo suficientemente cerca de las frecuencias esperadas bajo la hipótesis nula.
Ordenar las observaciones
• El número de intervalos de clase debe ser por lo menos cinco.
• El número esperado de observaciones en cada intervalo debe ser mayor o igual a cinco; en caso contrario, deberían agruparse varios intervalos para lograr esto.
Para formular la hipótesis nula deberán tenerse en cuenta los siguientes aspectos
María Isabel [email protected]
Prueba de la Bondad del Ajuste10
Ejemplo
Se realizo una encuesta en la universidad y se les pregunto a los estudiantes si estarían o no de acuerdo en sustituir por completo la modalidad presencial por la modalidad de estudio a distancia y se obtuvieron los siguientes datos:
Se realizo una encuesta en la universidad y se les pregunto a los estudiantes si estarían o no de acuerdo en sustituir por completo la modalidad presencial por la modalidad de estudio a distancia y se obtuvieron los siguientes datos:
Hombres (Real) Mujeres (Real) Descripción
58 35 Están de acuerdo
11 25 Neutrales
10 23 No están de acuerdo
Hombres (Esperado) Mujeres (Esperado) Descripción
45,35 47,65 Están de acuerdo
17,56 18,44 Neutrales
16,09 16,91 No están de acuerdo
Se desea comprobar si la probabilidad de que las
tendencias de la muestra sean iguales a las tendencias esperadas
en la población
H0: fo – fe= 0H1: fo – fe≠ 0
PRUEBA.CHI 0,000308 Se aproxima a 0
Acepto H0, los datos de la muestra se comportan muy parecido a los
esperados PRUEBA.CHI se calcula con Excel:
devuelve el valor de la distribución chi cuadrado (χ2) para la estadística y los
grados de libertad apropiados.
María Isabel [email protected]
Prueba de la Bondad del Ajuste11
Prueba de Chi Cuadrado con SPSS
Revisa este video para entender cómo se aplica la prueba
María Isabel [email protected]
Prueba de la Bondad del Ajuste12
Lista de Referencias
Sandoval, A. (s/f), Estadística II, Escuela de Ciencias Contable Económico Administrativas de la Universidad Panamericana. Grupo Editorial Iberoamérica. México.
Mendenhall, Willian. (1978), Estadística para Administradores y Economía. Universidad Nacional Autónoma de México. Grupo Editorial Iberoamérica. México.
Navarro, A. (2000), Estadística Aplicada al área económica y empresarial. Ediciones de la Universidad Ezequiel Zamora. Colección Docencia Universitaria. Barinas, Venezuela
Tarjeta de referencia rápida: Funciones estadísticas de Excel
http://support.microsoft.com/kb/828296/es
Sandoval, A. (s/f), Estadística II, Escuela de Ciencias Contable Económico Administrativas de la Universidad Panamericana. Grupo Editorial Iberoamérica. México.
Mendenhall, Willian. (1978), Estadística para Administradores y Economía. Universidad Nacional Autónoma de México. Grupo Editorial Iberoamérica. México.
Navarro, A. (2000), Estadística Aplicada al área económica y empresarial. Ediciones de la Universidad Ezequiel Zamora. Colección Docencia Universitaria. Barinas, Venezuela
Tarjeta de referencia rápida: Funciones estadísticas de Excel
http://support.microsoft.com/kb/828296/es