Prueba de hipótesis

Prueba de hipótesis

Aplicación de prueba de hipótesisAl realizar pruebas de hipótesis, se parte de un

valor supuesto (hipotético) en parámetro poblacional. Después de recolectar una muestra aleatoria, se compara la estadística muestral, así como la media (x), con el parámetro hipotético, se compara con una supuesta media poblacional (). Después se acepta o se rechaza el valor hipotético, según proceda. Se rechaza el valor hipotético sólo si el resultado muestral resulta muy poco probable cuando la hipótesis es cierta.

Etapa1 Planear la hipótesis nula y la hipótesis alternativa.

La hipótesis nula (H0) es el valor hipotético del parámetro que se compra con el resultado muestral resulta muy poco probable cuando la hipótesis es cierta.

Etapa 2Especificar el nivel de significancia que se va a

utilizar. El nivel de significancia del 5%, entonces se rechaza la hipótesis nula solamente si el resultado muestral es tan diferente del valor hipotético que una diferencia de esa magnitud o mayor, pudiera ocurrir aleatoria mente con una probabilidad de 1.05 o menos.

Etapa 3Elegir la estadística de prueba. La estadística de

prueba puede ser la estadística muestral (el estimador no segado del parámetro que se prueba) o una versión transformada de esa estadística muestral. Por ejemplo, para probar el valor hipotético de una media poblacional, se toma la media de una muestra aleatoria de esa distribución normal, entonces es común que se transforme la media en un valor z el cual, a su vez, sirve como estadística de prueba.

Etapa 4Establecer el valor o valores críticos de la

estadística de prueba. Habiendo especificado la hipótesis nula, el nivel de significancia y la estadística de prueba que se van a utilizar, se produce a establecer el o los valores críticos de estadística de prueba. Puede haber uno o más de esos valores, dependiendo de si se va a realizar una prueba de uno o dos extremos.

Etapa 5Determinar el valor real de la estadística de prueba.

Por ejemplo, al probar un valor hipotético de la media poblacional, se toma una muestra aleatoria y se determina el valor de la media muestral. Si el valor crítico que se establece es un valor de z, entonces se transforma la media muestral en un valor de z.

Etapa 6 Tomar la decisión. Se compara el valor observado de la estadística muestral

con el valor (o valores) críticos de la estadística de prueba. Después se acepta o se rechaza la hipótesis nula. Si se rechaza ésta, se acepta la alternativa; a su vez, esta decisión tendrá efecto sobre otras decisiones de los administradores operativos, como por ejemplo, mantener o no un estándar de desempeño o cuál de dos estrategias de mercadotecnia utilizar.

La distribución apropiada de la prueba estadística se divide en dos regiones: una región de rechazo y una de no rechazo. Si la prueba estadística cae en esta última región no se puede rechazar la hipótesis nula y se llega a la conclusión de que el proceso funciona correctamente.

Al tomar la decisión con respecto a la hipótesis nula, se debe determinar el valor crítico en la distribución estadística que divide la región del rechazo (en la cual la hipótesis nula no se puede rechazar) de la región de rechazo. A hora bien el valor crítico depende del tamaño de la región de rechazo.

PASOS DE LA PRUEBA DE HIPÓTESISExpresar la hipótesis nulaExpresar la hipótesis alternativaEspecificar el nivel de significancíaDeterminar el tamaño de la muestraEstablecer los valores críticos que establecen las regiones de

rechazo de las de no rechazo.Determinar la prueba estadística.Coleccionar los datos y calcular el valor de la muestra de la prueba

estadística apropiada.Determinar si la prueba estadística ha sido en la zona de rechazo a

una de no rechazo.Determinar la decisión estadística.Expresar la decisión estadística en términos del problema.

CONCEPTOS BÁSICOS PARA EL PROCEDIMIENTO DE PRUEBAS DE HIPÓTESIS.

Hipótesis Estadística:Al intentar alcanzar una decisión, es útil hacer

hipótesis (o conjeturas) sobre la población aplicada.Tales hipótesis, que pueden ser o no ciertas, se

llaman hipótesis estadísticas.Son, en general, enunciados acerca de las

distribuciones de probabilidad de las poblaciones.

Hipótesis Nula.En muchos casos formulamos una hipótesis estadística con el único

propósito de rechazarla o invalidarla. Así, si queremos decidir si una moneda está trucada, formulamos la hipótesis de que la moneda es buena (o sea p = 0,5, donde p es la probabilidad de cara).

Analógicamente, si deseamos decidir si un procedimiento es mejor que otro, formulamos la hipótesis de que no hay diferencia entre ellos (o sea. Que cualquier diferencia observada se debe simplemente a fluctuaciones en el muestreo de la misma población). Tales hipótesis se suelen llamar hipótesis nula y se denotan por Ho.

Para todo tipo de investigación en la que tenemos dos o más grupos, se establecerá una hipótesis nula.

La hipótesis nula es aquella que nos dice que no existen diferencias significativas entre los grupos.

Hipótesis Alternativa.Toda hipótesis que difiere de una dada se llamará una hipótesis

alternativa. Por ejemplo: Si una hipótesis es p = 0,5, hipótesis alternativa podrían ser p = 0,7, p " 0,5 ó p > 0,5.

Una hipótesis alternativa a la hipótesis nula se denotará por H1.

Al responder a un problema, es muy conveniente proponer otras hipótesis en que aparezcan variables independientes distintas de las primeras que formulamos. Por tanto, para no perder tiempo en búsquedas inútiles, es necesario hallar diferentes hipótesis alternativas como respuesta a un mismo problema y elegir entre ellas cuáles y en qué orden vamos a tratar su comprobación.

Errores Tipo I y Tipo II

UMSNH - FIE

El procedimiento anterior puede llevarnos a una de dos conclusiones erróneas:

Error Tipo I.- Se rechaza H0 cuando ésta es verdadera

En el ejemplo se cometerá un error de tipo I cuando m=50, pero x para la muestra considerada cae en la región críticaY se cometerá un error de tipo II cuando m 50 pero x para la muestra considerada cae en la región de aceptación

Error Tipo II.- Se acepta H0 cuando ésta es falsa_

_

Condición realDecisión

H0 verdadera H0 falsa

Rechazar H0 Error Tipo I ok

Aceptar H0 ok Error Tipo II

Error Tipo IA la probabilidad de cometer un error de Tipo I se denota por a, y se le llama el nivel o tamaño de significancia de la prueba es decir

a = P(error Tipo I)= P(rechazar H0 | H0 es verdadera)

Ejemplo: Calcular a para el ejemplo de la rapidez de combustión para una muestra de N=10 datos, suponiendo que la desviación estándar de la rapidez de combustión es s=2.5 cm/seg. _Solución: en este caso a = P( x caiga en la región crítica | m=50), es decir:

a = P( x < 48.5) + P( x > 51.5)Recordando que La distribución de x es Normal con media =50 m y desviación estándar s/N =0.79, por lo tanto, usando

Matlab:

_ __

Error Tipo I

UMSNH - FIE

Es claro que a se puede reducir de dos maneras:- Aumentando la región de aceptación- Aumentando el tamaño de la muestra

Ejemplo: recalcular a del ejemplo anterior para a) los nuevos límites de la región de aceptación 48 y 52. b) Para N=16 con los límites originales c) con ambas modificaciones

Solución:a) a = normcdf(48,50,0.79) + (1-normcdf(52,50,0.79)) =

0.0114b) a = normcdf(48.5,50,0.625)+(1-normcdf(51.5,50,0.625)) =

0.0164c) a = normcdf(48,50,0.625)+(1-normcdf(52,50,0.625)) = 0.0014

Error tipo IIPara evaluar un experimento de prueba de hipótesis también se requiere calcular la probabilidad del error de Tipo II, denotada por b, es decir

b = P(error Tipo II) = P(aceptar H0 | H0 es falsa)

Sin embargo, no es posible calcular b si no se tiene una hipótesis alternativa específica, es decir, un valor particular del parámetro bajo prueba en lugar de un rango de valores

Por ejemplo, supongamos que es importante rechazar H0 si la rapidez promedio de combustión m es mayor que 52 cm/seg o menor que 48 cm/seg. Dada la simetría sólo se requiere evaluar la probabilidad de aceptar H0: m=50 cuando el valor verdadero es m=52.

Error tipo II

45 46 47 48 49 50 51 52 53 54 550

0.1

0.2

0.3

0.4

0.5

0.6

0.7

H0: m=50

H1: m=52

Usando Matlab: b = normcdf(51.5,52,0.79) - normcdf(48.5,52,0.79) = 0.2643

De acuerdo a la figura: b = P(48.5 x 51.5 | m=52)_

Error tipo II

Usando Matlab: b = normcdf(51.5,50.5,0.79) - normcdf(48.5,50.5,0.79) = 0.8923

La probabilidad de obtener un error de tipo II aumenta muy rápido a medida que el valor verdadero m tiende al valor hipotético, por ejemplo, si suponemos que m=50.5, y recalculamos b, obtenemos

b también depende del tamaño de la muestra, por ejemplo, si N=16 obtenemos en el ejemplo cuando m=52: s=0.625, por lo tanto b = normcdf(51.5,52,0.625) - normcdf(48.5,52,0.625) = 0.2119

Es decir, b disminuye cuando N aumenta, excepto si el valor real de m está muy cerca del hipotético

Conclusiones Fuerte y Débil

Es por eso que el rechazo de H0 siempre se considera como una Conclusión Fuerte. (los datos aportan fuerte evidencia de que H0 es falsa)

Como uno puede elegir los valores críticos del intervalo de aceptación uno controla el valor de a. Uno puede entonces controlar la probabilidad de rechazar de manera errónea H0.

La decisión de aceptar H0 se considera una Conclusión Débil, a menos que se sepa que b es considerablemente pequeño.

Por esto en lugar de decir “se acepta H0” se prefiere decir “incapaz de rechazar H0”, es decir, no se ha encontrado evidencia suficiente para rechazar H0. O sea, no quiere decir que exista gran evidencia de que H0 sea cierta sino que no hay gran evidencia de que sea falsa.

Hipótesis Unilaterales

H0: m=50 cm/segH1: m<50 cm/seg

En el ejemplo supongamos que si la rapidez media de combustión es menor que 50 cm/seg se desea demostrar esto con una conslusión fuerte. ¿cómo deben plantearse las hipótesis?

Nótese que aunque H0 está planteada como una igualdad, se sobre-entiende que incluye cualquier valor de m no especificado por H1, es decir, la incapacidad de rechazar H0 no significa que m=50, sino que no se tiene evidencia fuerte que apoye a H1, es decir, pudiera ser que m=50 o que m>50


Ejemplo: Un embotellador de refresco desea estar seguro de que las botellas que usa tienen en promedio un valor que supera el mínimo de présión de estallamiento de 200 psi. El embotellador puede formular una prueba de hipótesis de dos maneras:

Con el planteamiento (1) Como el rechazo de H0 es una conclusión fuerte, esto obliga al fabricante a demostrar (aportar evidencia) de que las botellas soportan mayor presión que 200 psi

H0: m=200 psi H0: m=200 psiH1: m>200 psi H1: m<200 psi

(1) (2)

Con el planteamiento (2) si se rechaza H0 se concluye que las botellas no soportan los 200 psi, es decir, se concluye que las botellas son satisfactorias a menos que halla evidencia fuerte en sentido contrario

¿cuál planteamiento es el correcto?


Es decir, en la Hipótesis alternativa se debe poner la proposición sobre la cual es importante llegar a una conclusión fuerte:

H0: m=200 psi H0: m=200 psiH1: m>200 psi H1: m<200 psi

(1) (2)

Pruebas unilaterales para la mediaMuestra GrandeEn este caso (n>30) se asume distribución

normalPara pruebas de hipótesis acerca de la media

de una población se emplea el estadígrafo z

Se determina si la desviación del valor numérico en estudio es lo suficiente para justificar el rechazo de la hipótesis nula

/

Xz

n

La probabilidades 0.05 y 0.01 de cometer error tipo I están relacionadas con un valor de z de –1.645 y –2.33 respectivamente

Luego se debe rechazar H0 si el valor de z es menor a –1.645 o –2.33 dependiendo del nivel de significancia

El valor z establece el límite de la región de rechazo denominada valor crítico

0-1.645 2.33

a=0.05 a=0.01

X n

z

Rechazar H0 Rechazar H0

Resumen de pruebas unilaterales sobre media de una población. Si n30

0 0

0

0 0

0

:

:

; / /

Rechazar H si

a

H

H

X Xz z

n s n

z z

0 0

0

0 0

0

:

:

; / /

Rechazar H si

a

H

H

X Xz z

n s n

z z

Valor pEs el valor de probabilidad de obtener un

resultado de la muestra que sea al menos tan improbable como lo que se observa

Este valor corresponde al valor de la probabilidad asignada al z calculado a partir del valor numérico sometido a la prueba de hipótesis

Si p es menor al nivel de significancia predefinido se debe rechazar H0

Muestra PequeñaEn este caso (n < 30) se asume que la

población tiene una distribución normalCon distribución t se pueden hacer inferencias

acerca de la media de la población

Para este estadígrafo se debe considerar los grados de libertad asociados al tamaño de la muestra (n-1) para definir el valor crítico que llevará al rechazo de H0. Por las características de la tabla resulta complicado calcular el valor de p por lo que se expresa en intervalos

0

/

Xt

s n

Pruebas bilaterales para la mediaMuestra grandeLa diferencia de esta prueba con respecto a las

unilaterales está en que la región de rechazo está ubicada simultáneamente en ambas colas

En las pruebas bilaterales de hipótesis siempre se determina la región de rechazo colocando un área de probabilidad igual a a/2 en cada cola de distribución

Para este caso el valor de z para un nivel de significancia de 0.05 corresponderá a 1.96

z-z

a/2=0.025

0-1.96 1.96

a/2=0.025

Resumen de pruebas bilaterales sobre media de una población. Si n30

0 0

0

0 0

0 / 2 / 2

:

:

; / /

Rechazar H si

a

H

H

X Xz z

n s n

z z z z

Valor pEn una prueba bilateral se determina el p

duplicando el área en la colaEsta multiplicación busca comparar el valor

de p directamente con a y poder mantener la misma regla de rechazo

Muestra pequeñaCon una prueba bilateral y un nivel de

significancia a definido se debe considerar al estadígrafo t /2a para determinar el área de probabilidad asociado a los grados de libertad de la muestra

Relación entre estimación por intervalo y prueba de hipótesisEn la determinación del intervalo de confianza

para medias se empleo un coeficiente definido por 1-a , como una forma de definir si nuestros promedios muestrales contenían al parámetro poblacional

Ahora para una prueba bilateral de hipótesis se puede rechazar H0 si el intervalo de confianza para la media de la población no abarca el promedio poblacional

/ 2X zn

Prueba de hipótesis y toma de decisionesSiempre que se emplee una prueba de

hipótesis en la toma de decisiones estará involucrada una acción

El no emprender acciones cuando “no se rechaza H0” está dado por el riesgo de cometer error tipo II

Para disminuir esta incertidumbre se debe calcular este error. Otra forma descrita tiene relación con el tamaño de la muestra a estudiar

REALIZADA POR :JOSE ANGEL HUERTA ROSALDO 4201

Education

Prueba de hipótesis