VII PRUEBA DE HIPOTESIS

Embed Size (px)

Citation preview

PRUEBA DE HIPOTESISUNIDAD para modificar el Haga clic5 estilo de subttulo del patrn

Prueba de Hiptesis.Muchos problemas de ingeniera, ciencia, y administracin, requieren que se tome una decisin entre aceptar o rechazar una proposicin sobre algn parmetro. Esta proposicin recibe el nombre de hiptesis. Este es uno de los aspectos ms tiles de la inferencia estadstica, puesto que muchos tipos de problemas de toma de decisiones, pruebas o experimentos en el mundo de la ingeniera, pueden formularse como problemas de prueba de hiptesis.

Prueba de HiptesisUna hiptesis estadstica es una proposicin o supuesto sobre los parmetros de una o ms poblaciones.

Suponga que se tiene inters en la rapidez de combustin de un agente propulsor slido utilizado en los sistemas de salida de emergencia para la tripulacin de aeronaves. El inters se centra sobre la rapidez de combustin promedio. De manera especfica, el inters recae en decir si la rapidez de combustin promedio es o no 50 cm/s. Esto puede expresarse de manera formal como: Ho; = 50 cm/s H1; 50 cm/s La proposicin Ho; = 50 cm/s, se conoce como hiptesis nula , mientras que la proposicin H1; 50 cm/s, recibe el nombre de hiptesis alternativa. Puesto que la hiptesis alternativa especifica valores de que pueden ser mayores o menores que 50 cm/s, tambin se conoce como hiptesis alternativa bilateral. En algunas situaciones, lo que se desea es formular una hiptesis alternativa unilateral, como en: Ho; = 50 cm/s H1; < 50 cm/s Ho; = 50 cm/s H1; > 50 cm/s

Prueba de HiptesisEs importante recordar que las hiptesis siempre son proposiciones sobre la poblacin o distribucin bajo estudio, no proposiciones sobre la muestra. Por lo general, el valor del parmetro de la poblacin especificado en la hiptesis nula se determina en una de tres maneras diferentes: 1. Puede ser resultado de la experiencia pasada o del conocimiento del proceso, entonces el objetivo de la prueba de hiptesis usualmente es determinar si ha cambiado el valor del parmetro. 2. Puede obtenerse a partir de alguna teora o modelo que se relaciona con el proceso bajo estudio. En este caso, el objetivo de la prueba de hiptesis es verificar la teora o modelo. 3. Cuando el valor del parmetro proviene de consideraciones externas, tales como las especificaciones de diseo o ingeniera, o de obligaciones contractuales. En esta situacin, el objetivo usual de la prueba de hiptesis es probar el cumplimiento de las especificaciones.

Un procedimiento que conduce a una decisin sobre una hiptesis en particular recibe el nombre de prueba de hiptesis. Los procedimientos de prueba de hiptesis dependen del empleo de la informacin contenida en la muestra aleatoria de la poblacin de inters. Si esta informacin es consistente con la hiptesis, se concluye que sta es verdadera; sin embargo si esta informacin es inconsistente con la hiptesis, se concluye que esta es falsa. Debe hacerse hincapi en que la verdad o falsedad de una hiptesis en particular nunca puede conocerse con certidumbre, a menos que pueda examinarse a toda la poblacin. Usualmente esto es imposible en muchas situaciones prcticas. Por tanto, es necesario desarrollar un procedimiento de prueba de hiptesis teniendo en cuenta la probabilidad de llegar a una conclusin equivocada.

La hiptesis nula, representada por Ho, es la afirmacin sobre una o ms caractersticas de poblaciones que al inicio se supone cierta (es decir, la creencia a priori). La hiptesis alternativa, representada por H1, es la afirmacin contradictoria a Ho, y sta es la hiptesis del investigador. La hiptesis nula se rechaza en favor de la hiptesis alternativa, slo si la evidencia muestral sugiere que Ho es falsa. Si la muestra no contradice decididamente a Ho, se contina creyendo en la validez de la hiptesis nula. Entonces, las dos conclusiones posibles de un anlisis por prueba de hiptesis son rechazar Ho o no rechazar Ho.

Para ilustrar los conceptos generales, considere el problema de la rapidez de combustin del agente propulsor presentado con anterioridad. La hiptesis nula es que la rapidez promedio de combustin es 50 cm/s, mientras que la hiptesis alternativa es que sta no es igual a 50 cm/s. Esto es, se desea probar: Ho; = 50 cm/s H1; 50 cm/s Supngase que se realiza una prueba sobre una muestra de 10 especimenes, y que se observa cual es la rapidez de combustin promedio muestral. La media muestral es un estimador de la media verdadera de la poblacin. Un valor de la media muestral x que este prximo al valor hipottico = 50 cm/s es una evidencia de que el verdadero valor de la media es realmente 50 cm/s; esto es, tal evidencia apoya la hiptesis nula Ho. Por otra parte, una media muestral muy diferente de 50 cm/s constituye una evidencia que apoya la hiptesis alternativa H1. Por tanto, en este caso, la media muestral es el estadstico de prueba.

La media muestral puede tomar muchos valores diferentes. Supngase que si 48.5 x 51.5, entonces no se rechaza la hiptesis nula Ho; = 50 cm/s, y que si x 51.5, entonces se acepta la hiptesis alternativa H1; 50 cm/s. Los valores de x que son menores que 48.5 o mayores que 51.5 constituyen la regin crtica de la prueba, mientras que todos los valores que estn en el intervalo 48.5 x 51.5 forman la regin de aceptacin. Las fronteras entre las regiones crtica y de aceptacin reciben el nombre de valores crticos. La costumbre es establecer conclusiones con respecto a la hiptesis nula Ho. Por tanto, se rechaza Ho en favor de H1 si el estadstico de prueba cae en la regin crtica, de lo contrario, no se rechaza Ho.

Este procedimiento de decisin puede conducir a una de dos conclusiones errneas. Por ejemplo, es posible que el valor verdadero de la rapidez promedio de combustin del agente propulsor sea igual a 50 cm/s. Sin embargo, para todos los especimenes bajo prueba, bien puede observarse un valor del estadstico de prueba x que cae en la regin crtica. En este caso, la hiptesis nula Ho ser rechazada en favor de la alternativa H1cuando, de hecho, Ho en realidad es verdadera. Este tipo de conclusin equivocada se conoce como error tipo I.

ERROR TIPO IEl error tipo I se define como el rechazo de la hiptesis nula Ho cuando sta es verdadera. Tambin es conocido como nivel de significancia.

Si tuviramos un nivel de confianza del 95% entonces el nivel de significancia sera del 5%. Anlogamente si se tiene un nivel de confianza del 90% entonces el nivel de significancia sera del 10%. Ahora supngase que la verdadera rapidez promedio de combustin es diferente de 50 cm/s, aunque la media muestral x caiga dentro de la regin de aceptacin. En este caso se acepta Ho cuando sta es falsa. Este tipo de conclusin recibe el nombre de error tipo II.

ERROR TIPO IIEl error tipo II error se define como la aceptacin de la hiptesis nula cuando sta es falsa.

ERRORESPor tanto, al probar cualquier hiptesis estadstica, existen cuatro situaciones diferentes que determinan si la decisin final es correcta o errnea.

1. Los errores tipo I y tipo II estn relacionados. Una disminucin en la probabilidad de uno por lo general tiene como resultado un aumento en la probabilidad del otro. 2. El tamao de la regin crtica, y por tanto la probabilidad de cometer un error tipo I, siempre se puede reducir al ajustar el o los valores crticos. 3. Un aumento en el tamao muestral n reducir y de forma simultnea. 4. Si la hiptesis nula es falsa, es un mximo cuando el valor real del parmetro se aproxima al hipottico. Entre ms grande sea la distancia entre el valor real y el valor hipottico, ser menor .

PASOS PARA ESTABLECER UN ENSAYO DE HIPOTESIS INDEPENDIENTEMENTE DE LA DISTRIBUCION QUE SE ESTE TRATANDO1. Interpretar correctamente hacia que distribucin muestral se ajustan los datos del enunciado. 2. Interpretar correctamente los datos del enunciado diferenciando los parmetros de los estadsticos. As mismo se debe determinar en este punto informacin implcita como el tipo de muestreo y si la poblacin es finita o infinita. 3. Establecer simultneamente el ensayo de hiptesis y el planteamiento grfico del problema. El ensayo de hiptesis est en funcin de parmetros ya que se quiere evaluar el universo de donde proviene la muestra. En este punto se determina el tipo de ensayo (unilateral o bilateral). 4. Establecer la regla de decisin. Esta se puede establecer en funcin del valor crtico, el cual se obtiene dependiendo del valor de (Error tipo I o nivel de significancia) o en funcin del estadstico lmite de la distribucin muestral. Cada una de las hiptesis deber ser argumentada correctamente para tomar la decisin, la cual estar en funcin de la hiptesis nula o Ho. 5. Calcular el estadstico real, y situarlo para tomar la decisin. 6. Justificar la toma de decisin y concluir.

Tipos de EnsayoSe pueden presentar tres tipos de ensayo de hiptesis que son: Unilateral Derecho Unilateral Izquierdo Bilateral

Dependiendo de la evaluacin que se quiera hacer se seleccionar el tipo de ensayo.

EjemploUna muestra aleatoria de 100 muertes registradas en Estados Unidos el ao pasado muestra una vida promedio de 71.8 aos. Suponga una desviacin estndar poblacional de 8.9 aos, esto parece indicar que la vida media hoy en da es mayor que 70 aos? Utilice un nivel de significancia de 0.05.

Solucin1. Se trata de una distribucin muestral de medias con desviacin estndar conocida. 2. Datos: = 70 aos = 8.9 aos x = 71.8 aos n = 100 = 0.05 3. Ensayo de hiptesis Ho; = 70 aos. H1; > 70 aos.

Solucin5. Clculos:

6. Justificacin y decisin. Como 2.02 >1.645 se rechaza Ho y se concluye con un nivel de significancia del 0.05 que la vida media hoy en da es mayor que 70 aos.

Existe otra manera de resolver este ejercicio, tomando la decisin en base al estadstico real, en este caso la media de la muestra. De la formula de la distribucin muestral de medias se despeja la media de la muestra:

Regla de decisin: Si R x 71.46 No se rechaza Ho Si R x > 71.46 Se rechaza Ho Como la media de la muestral es de 71.8 aos y es mayor al valor de la media muestral lmite de 71.46 por lo tanto se rechaza Ho y se llega a la misma conclusin.

EjemploUna empresa elctrica fabrica focos que tienen una duracin que se distribuye de forma aproximadamente normal con una media de 800 horas y una desviacin estndar de 40 horas. Si una muestra aleatoria de 30 focos tiene una duracin promedio de 788 horas, muestran los datos suficiente evidencia para decir que la duracin media ha cambiado? Utilice un nivel de significancia del 0.04.

Solucin1. Se trata de una distribucin muestral de medias con desviacin estndar conocida. 2. Datos: = 800 horas = 40 horas x = 788 horas n = 30 = 0.04 3. Ensayo de hiptesis Ho; = 800 horas H1; 800 horas

Solucinn n

4. Regla de Decisin: Si 2.052 ZR 2.052 No se rechaza Ho Si ZR < -2.052 si ZR > 2.052 Se rechaza Ho 5. Clculos:

6. Justificacin y decisin: Como 2.052 -1.643 2.052 por lo tanto, no se rechaza Ho y se concluye con un nivel de significancia del 0.04 que la duracin media de los focos no ha cambiado.

Solucin por el otro mtodo:

EjemploUna muestra aleatoria de 64 bolsas de palomitas de maz pesan, en promedio 5.23 onzas con una desviacin estndar de 0.24 onzas. Pruebe la hiptesis de que = 5.5 onzas contra al hiptesis alternativa, < 5.5 onzas en el nivel de significancia de 0.05.

Solucin1. Se trata de una distribucin muestral de medias con desviacin estndar desconocida, pero como el tamao de muestra es mayor a 30 se puede tomar la desviacin muestral como un estimador puntual para la poblacional. 2. Datos: = 5.5 onzas s = 0.24 onzas x = 5.23 onzas n = 64 = 0.05 3. Ensayo de hiptesis Ho; = 5.5 onzas H1; < 5.5 onzas

n n

4. Regla de decisin: Si ZR -1.645 No se rechaza Ho Si ZR < -1.645 Se rechaza Ho 5. Clculos:

6. Justificacin y decisin: Como 9 < -1.645 por lo tanto se rechaza Ho y se concluye con un nivel de significancia del 0.05 que las bolsas de palomitas pesan en promedio menos de 5.5 onzas.

Solucin por el otro mtodo:

EjemploUn constructor afirma que se instalan bombas de calor en 70% de todas las casas que se construyen hoy en da en la ciudad de Richmond. Estara de acuerdo con esta afirmacin si una investigacin de casas nuevas en esta ciudad muestra que 8 de 15 tienen instaladas bombas de calor? Utilice un nivel de significancia de 0.10.

Solucin1. Se trata de una distribucin muestral de proporciones. 2. Datos: P = 0.70 p = 8/15 = 0.5333 n = 15 = 0.10 3. Ensayo de hiptesis Ho; P = 0.70 H1; P 0.70

Solucin por el otro mtodo:

EjemploUn fabricante de semiconductores produce controladores que se emplean en aplicaciones de motores automovilsticos. El cliente requiere que la fraccin de controladores defectuosos en uno de los pasos de manufactura crticos no sea mayor que 0.05, y que el fabricante demuestre esta caracterstica del proceso de fabricacin con este nivel de calidad, utilizando = 0.05. El fabricante de semiconductores toma una muestra aleatoria de 200 dispositivos y encuentra que cuatro de ellos son defectuosos. El fabricante puede demostrar al cliente la calidad del proceso?

Solucin1. Se trata de una distribucin muestral de proporciones. 2. Datos: P = 0.05 p = 4/200 = 0.02 n = 200 = 0.05 3. Ensayo de hiptesis Ho; P = 0.05 H1; P < 0.05

Uso de valores P para la toma de decisionesAl probar hiptesis en las que la estadstica de prueba es discreta, la regin crtica se puede elegir de forma arbitraria y determinar su tamao. Si es demasiado grande, se puede reducir al hacer un ajuste en el valor crtico. Puede ser necesario aumentar el tamao de la muestra para compensar la disminucin que ocurre de manera automtica en la potencia de la prueba (probabilidad de rechazar Ho dado que una alternativa especfica es verdadera).

Uso de valores P para la toma de decisionesPor generaciones enteras de anlisis estadstico, se ha hecho costumbre elegir un nivel de significancia de 0.05 0.01 y seleccionar la regin crtica en consecuencia. Entonces, por supuesto, el rechazo o no rechazo estricto de Ho depender de esa regin crtica. En la estadstica aplicada los usuarios han adoptado de forma extensa la aproximacin del valor P. La aproximacin se disea para dar al usuario una alternativa a la simple conclusin de rechazo o no rechazo.

Uso de valores P para la toma de decisiones La aproximacin del valor P como ayuda en la toma de decisiones es bastante natural pues casi todos los paquetes de computadora que proporcionan el clculo de prueba de hiptesis entregan valores de P junto con valores de la estadstica de la prueba apropiada.

Uso de valores P para la toma de decisiones

Un valor P es el nivel (de significancia) ms bajo en el que el valor observado de la estadstica de prueba es significativo. El valor P es el nivel de significancia ms pequeo que conduce al rechazo de la hiptesis nula Ho. El valor P es el mnimo nivel de significancia en el cual Ho sera rechazada cuando se utiliza un procedimiento de prueba especificado con un conjunto dado de informacin. Una vez que el valor de P se haya determinado, la conclusin en cualquier nivel particular resulta de comparar el valor P con : 1. Valor P < rechazar Ho al nivel . 2. Valor P No rechazar Ho al nivel .

EjemploCalcular el valor de P para el primer ejemplo de ensayo de hiptesis en donde se quera probar que la edad media de los habitantes de Estados Unidos es superior a 70 aos.

EjemploSe afirma que un automvil se maneja en promedio ms de 20,000 kilmetros por ao. Para probar esta afirmacin, se pide a una muestra de 100 propietarios de automviles que lleven un registro de los kilmetros que viajen. Est de acuerdo con esta afirmacin si la muestra aleatoria tiene un promedio de 23,500 kilmetros y una desviacin estndar de 3900 kilmetros? Utilice un valor P para su conclusin.

SolucinEn este ejercicio no nos manejan ningn valor de , por lo que se proceder a plantear el ensayo y luego calcular z para poder conocer el valor de P y llegar a una conclusin.

EjemploSe estudia la fraccin de circuitos integrados defectuosos producidos en un proceso de fotolitografa. Para ello se somete a prueba una muestra de 300 circuitos, en la que 13 son defectuosos. Utilice los datos para probar Ho: P=0.05 contra H1: P 0.05. Utilice un valor de P para su conclusin.

Solucin

ERROR TIPO II Al evaluar un procedimiento de prueba de hiptesis, tambin es importante examinar la probabilidad del error tipo II, el cual se denota por . Esto es, = P(error tipo II) = P(aceptar Ho/ Ho es falsa) Para calcular se debe tener una hiptesis alternativa especfica; esto es, debe tenerse un valor particular del parmetro. Por ejemplo, supngase que es importante rechazar la hiptesis nula Ho: = 50 cada vez que la rapidez promedio de combustin es mayor que 52 cm/s o menor que 48 cm/s. Para ello, puede calcularse la probabilidad de un error tipo II para los valores = 52 y = 48, y utilizar este resultado para averiguar algo con respecto a la forma en que se desempear la prueba. De manera especfica, cmo trabajar el procedimiento de prueba si se desea detectar, esto es, rechazar Ho, para un valor medio de = 52 = 48? Dada la simetra, slo es necesario evaluar uno de los dos casos, esto es, encontrar la probabilidad de aceptar la hiptesis nula Ho: = 50 cuando el valor verdadero es = 52.

Para poder comprender mejor el clculo del error tipo II se delimitar el rea de la regin de aceptacin con dos lneas ya que es bilateral y se evaluar la probabilidad de caer en esa rea cuando la media tiene un valor de 52 y de 48.

Como se puede observar en cada calculo del valor se tuvieron que evaluar los dos valores de z. En el primer calculo de se tiene un valor de z=-4.43, esto quiere decir que no existe rea del lado izquierdo del 48.5, por lo que slo ser el rea que corresponda a la z=-0.63. Lo mismo pasa con el segundo clculo de . Como las medias de 52 y 48 son equidistantes del 50 por este motivo los valores del error tipo II son los mismos. En caso que no estn equidistantes se tienen que calcular por separado y calcular los valores correspondientes de z porque en ocasiones se tiene un rea que no est dentro de la regin de aceptacin, la cual no se tiene que tomar en cuenta para evaluar al error tipo II. A continuacin se proceder a generar algunas curvas caractersticas de operacin para evaluar al error tipo II, entre ms se aleja el valor verdadero de la media de la media de la hiptesis nula, menor es la probabilidad del error tipo II para un tamao de muestra y nivel de significancia dadas. A medida que el tamao de la muestra aumenta la probabilidad de cometer el error tipo II disminuye.

EjemploGenerar una curva caracterstica de operacin para el ejercicio nmero 1 de la seccin de ensayo de hiptesis con las siguientes medias supuestas: = 70.5, 71, 71.5, 72, 72.5, 73, 73.5, y 74.

Curva de operacinEn la mayora de los libros de estadstica existen las curvas caractersticas de operacin para diferentes tamaos de muestra y stas se proporcionan tanto para = 0.05 como para = 0.01 (son las ms comunes). Para poder utilizar las curvas se define un parmetro llamado d, que estandariza para cualquier valor de y :

En este momentoa) b)

El departamento de personal de una gran corporacin querra estimar los gastos mdicos por familia de sus empleados, a fin de determinar la factibilidad de proporcionarles un plan de seguro mdico. Una muestra aleatoria de 10 empleados, de una poblacin de 500, mostr los gastos mdicos familiares siguientes en un ao: $11,000 36,200 24,600 8,500 51,000 20,800 17,300 42,500 31,600 17,900 Estime un intervalo de confianza de 90% de los gastos mdicos promedio. El gerente de la corporacin considera que si el promedio de gastos anuales es mayor que $30,000. se proporcionar el plan de seguro dental. Con un nivel de confianza del 95%, se vern beneficiados los empleados? Un Lic. en Administracin es gerente de un hotel de veraneo. Tomo una muestra aleatoria de 27 meses (pocas de verano) y obtuvo la siguiente informacin sobre el nmero de huspedes:

3.

a) b)

Construya un intervalo que tenga una probabilidad de 0.95 de contener la verdadera media (poblacional). Ayude al gerente a estimar el nmero mnimo y mximo de huspedes para el prximo verano (3 meses).