76
ESTADISTICA Y PROBABILIDADES Tema: Pruebas de hipótesis . Pruebas de hipótesis 1

Pruebas de hipótesis 1

  • Upload
    raulin2

  • View
    233

  • Download
    5

Embed Size (px)

DESCRIPTION

introducciony ejemplos de prueba de hipotisis

Citation preview

Page 1: Pruebas de hipótesis 1

ESTADISTICA Y PROBABILIDADES

Tema: Pruebas de hipótesis

. Pruebas de hipótesis 1

Page 2: Pruebas de hipótesis 1

Objetivos del tema

• Conocer el proceso para contrastar hipótesis y su relación conel método científico.

• Diferenciar entre hipótesis nula y alternativa

• Nivel de significación

• Significación

• Toma de decisiones, tipos de error y cuantificación del error.

. Pruebas de hipótesis 2

Page 3: Pruebas de hipótesis 1

Contrastando una hipótesis

años20X. Pruebas de hipótesis 3

Creo que la edadmedia es 40 años...

Sondemasiados...

¡Grandiferencia!

Rechazo lahipótesis

Muestraaleatoria

Page 4: Pruebas de hipótesis 1

¿Qué es una hipótesis?

• Una creencia sobre la población,principalmente sus parámetros:– Media– Varianza– Proporción/Tasa

• OJO: Si queremos contrastarla,debe establecerse antes delanálisis.

. Pruebas de hipótesis 4

Creo que el porcentajede enfermos será el

5%

Page 5: Pruebas de hipótesis 1

Identificación de hipótesis• Hipótesis nula Ho

– La que contrastamos

– Los datos pueden refutarla

– No debería ser rechazada sin una buenarazón.

• Hipótesis. Alternativa H1– Niega a H0

– Los datos pueden mostrar evidencia afavor

– No debería ser aceptada sin una granevidencia a favor.

. Pruebas de hipótesis 5

:H

:H

1

00.5p

0.5p

,,

Page 6: Pruebas de hipótesis 1

a) HipótesisSe debe formular el supuesto valor del parámetro de la población antes de empezar el

muestreo. La suposición que se desea probar, se denomina hipótesis nula y serepresenta por H0. Si se rechaza la hipótesis nula, la conclusión que debemosaceptar se llama hipótesis alternativa y se simboliza por H1.

Supongamos que se quiere probar la hipótesis de que el promedio de calificación de losalumnos de cierta Universidad es de 8.5, entonces:

H0 : = 8.5 Establece que la media de la población es igual a 8.5

La hipótesis alternativa se puede interpretar de tres maneras:

H1 : 8.5 Establece que la media de la población no es igual a 8.5.H1 : 8.5 Establece que la media de la población es mayor que 8.5.H1 : 8.5 Establece que la media de la población es menor que 8.5.

La prueba de hipótesis tiene como finalidad emitir un juicio sobre la diferencia queexiste entre el valor calculado del estadístico muestral y el parámetro supuesto de lapoblación. No consiste en poner en duda el valor calculado del estadístico muestral.

Después de formular las hipótesis nula y alternativa, se debe decidir el criterio que se vaa aplicar para aceptar o rechazar la primera.

Page 7: Pruebas de hipótesis 1

¿Quién es H0?

0.5p

. Pruebas de hipótesis 7

• Problema: ¿La osteoporosis está relacionada con elgénero?

• Solución:

– Traducir a lenguaje estadístico:

– Establecer su opuesto:

– Seleccionar la hipótesis nula0.5p

0 : 0.5H p

Page 8: Pruebas de hipótesis 1

¿Quién es H0?

6

. Pruebas de hipótesis 8

• Problema: ¿El colesterol medio para la dietamediterránea es 6 mmol/l?

• Solución:

– Traducir a lenguaje estadístico:

– Establecer su opuesto:

– Seleccionar la hipótesis nula6

6:0 H

Page 9: Pruebas de hipótesis 1

Razonamiento básico

4020X

. Pruebas de hipótesis 9

Si supongo que H0 es cierta...

... el resultado del experimento sería improbable.Sin embargo ocurrió.

¿qué hace uncientífico cuandosu teoría nocoincide con suspredicciones?

Page 10: Pruebas de hipótesis 1

Razonamiento básico

4020X

. Pruebas de hipótesis 10

Si supongo que H0 es cierta...

... el resultado del experimento sería improbable.Sin embargo ocurrió.

Rechazo que H0sea cierta.

Page 11: Pruebas de hipótesis 1

Razonamiento básico

4038X

. Pruebas de hipótesis 11

Si supongo que H0 es cierta...

... el resultado del experimento es coherente.

• No hay evidencia contra H0

•No se rechaza H0

•El experimento no esconcluyente

•El contraste no es significativo

¿Si una teoríahace prediccionescon éxito, quedaprobado que escierta?

Page 12: Pruebas de hipótesis 1

b) Nivel de significancia

Supongamos que la media de calificaciones de unejemplo anterior de 8.5, se expresa con un nivel deconfianza del 95%, entonces el nivel de significanciaserá de 0.05, es decir: = 1 – 0.95Entonces: = 0.05 Que representa el nivel de

significancia.Se puede comprender mejor observando la gráfica

siguiente:

Page 13: Pruebas de hipótesis 1
Page 14: Pruebas de hipótesis 1

El nivel de significancia está repartido en laszonas de rechazo, 0.025 + 0.025 = 0.05,significa que existe una diferencia significativaentre el estadístico de la muestra y el supuestoparámetro de la población, es decir, que si estose demuestra, se rechaza la hipótesis nula H0de que el promedio de la población sea de 8.5y se acepta la hipótesis alternativa H1.

Entonces se concluiría que el promedio de lascalificaciones de la población, no es de 8.5,puede ser diferente, mayor o menor de 8.5.

El nivel de significancia representa la zona derechazo de la hipótesis nula y el nivel deconfianza de la zona de aceptación.

Page 15: Pruebas de hipótesis 1

c) Selección de un nivel de significancia

No hay un nivel de significancia que seaoficial o universal con el cual probar lashipótesis. Pero la elección del criteriomínimo de una probabilidad aceptable,o nivel de significancia, es asimismo elriesgo que se corre de rechazar unahipótesis nula aunque sea verdadera.Cuando más alto sea el nivel designificancia que utilizamos al probaruna hipótesis, mayores probabilidadeshabrá de rechazar una hipótesis nulaque sea verdadera.

Page 16: Pruebas de hipótesis 1

Región crítica y nivel de significaciónRegión crítica• Valores ‘improbables’ si...• Es conocida antes de realizar el

experimento: resultadosexperimentales que refutarían H0

Nivel de significación: α• Número pequeño: 1% , 5%• Fijado de antemano por el

investigador• Es la probabilidad de rechazar H0cuando es cierta

. Pruebas de hipótesis 16

No rechazo H0

Reg. Crit.Reg. Crit.

α=0.05

Η0: µ=40

Page 17: Pruebas de hipótesis 1

Contrastes: unilateral y bilateral

. Pruebas de hipótesis 17

La posición de la región crítica depende de la hipótesis alternativa

Unilateral Unilateral

Bilateral

H1: µ < 40 H1: µ>40

H1: µ 40

Page 18: Pruebas de hipótesis 1

Significación: p

. Pruebas de hipótesis 18

H0: µ = 40

α

Page 19: Pruebas de hipótesis 1

Significación: p

. Pruebas de hipótesis 1943X

No se rechazaH0: µ = 40

H0: µ = 40 α

Page 20: Pruebas de hipótesis 1

Significación: p

. Pruebas de hipótesis 2043X

No se rechazaH0: µ =40

Es la probabilidad que tendría una región crítica que comenzase exactamente en el valordel estadístico obtenido de la muestra.Es la probabilidad de tener una muestra que discrepe aún más que la nuestra de H0.Es la probabilidad de que por puro azar obtengamos una muestra “más extraña” que laobtenida.p es conocido después de realizar el experimento aleatorioEl contraste es no significativo cuando p>α

P

P

α

α

Page 21: Pruebas de hipótesis 1

Significación : p

. Pruebas de hipótesis 21

α

50X

Se rechaza H0: µ =40

Se acepta H1: µ >40

Page 22: Pruebas de hipótesis 1

Significación : p

. Pruebas de hipótesis 22

50X

Se rechaza H0: µ =40

Se acepta H1: µ >40

El contraste es estadísticamente significativo cuando p < αEs decir, si el resultado experimental discrepa más de “lo tolerado” a priori.

Page 23: Pruebas de hipótesis 1

Resumen: α, p y criterio de rechazo

• Sobre α– Es número pequeño,

preelegido al diseñar elexperimento

– Conocido α sabemostodo sobre la regióncrítica

• Sobre p– Es conocido tras realizar

el experimento

– Conocido p sabemostodo sobre el resultadodel experimento

. Pruebas de hipótesis 23

Sobre el criterio de rechazo El contraste es significativo si p menor que α

Page 24: Pruebas de hipótesis 1

Resumen: α, p y criterio de rechazo

. Pruebas de hipótesis 24

Sobre el criterio de rechazo Contraste significativo = p menor que α

Estadísticos de contrastea

259753,500462319,500

-2,317,021

U de Mann-WhitneyW de WilcoxonZSig. asintót. (bilateral)

Edad delencuestado

Variable de agrupación: Sexo del encuestadoa.

Page 25: Pruebas de hipótesis 1

Ejemplo

• Problema: ¿Está sesgada la moneda?

. Pruebas de hipótesis 25

:H

:H

1

0prob cruz 0.5

prob cruz 0.5

Experimento: Lanzar la moneda repetidamente:

P=0.5 P=0.25 P=0.125 P=0.0625 P=0.03 P=0.015

Page 26: Pruebas de hipótesis 1

Riesgos al tomar decisiones

• H0: Hipótesis nula– Es inocente

• H1: Hipótesis alternativa– Es culpable

. Pruebas de hipótesis 26

Ejemplo 1: Se juzga a un individuo por la presunta comisión de un delito

Los datos pueden refutarla

La que se acepta si laspruebas no indican locontrario

Rechazarla por error tienegraves consecuencias

No debería ser aceptada sin unagran evidencia a favor.

Rechazarla por error tieneconsecuencias consideradasmenos graves que la anterior

Page 27: Pruebas de hipótesis 1

Riesgos al contrastar hipótesis

• H0: Hipótesis nula– (Ej.1) Es inocente– (Ej.2) El nuevo tratamiento no tiene efecto– (Ej.3) No hay nada que destacar

• H1: Hipótesis alternativa– (Ej.1) Es culpable– (Ej.2) El nuevo tratamiento es útil– (Ej. 3) Hay una situación anormal

. Pruebas de hipótesis 27

Ejemplo 2: Se cree que un nuevo tratamiento ofrece buenos resultadosEjemplo 3: Parece que hay una incidencia de enfermedad más alta de lo normal

No especulativa

Especulativa

Page 28: Pruebas de hipótesis 1

d) Errores de tipo I y IISi se rechaza una hipótesis nula que sea verdadera es un error

de tipo I, y su probabilidad se representa con . Si se aceptauna hipótesis nula que sea falsa se llama error de tipo II, ysu probabilidad se representa con . La probabilidad decometer uno de estos errores se reduce si se aumenta laprobabilidad de incurrir en otro tipo de error. A fin deconseguir una baja, habremos de conformarnos con una alta. Para sortear esto en situaciones personales yprofesionales, los encargados de tomar decisiones eligen elnivel apropiado de significancia examinando los costos ocastigos que conllevan a ambos tipos de error.

Por ejemplo: supóngase que el cometer un error de tipo Iimplica el tiempo y el trabajo de reelaborar un lote desustancias químicas que debería haber sido aceptado. Encambio, el incurrir en un error de tipo II significa correr elriesgo de que se envenene un grupo entero de usuarios dela sustancia. La gerencia de esta compañía preferiría el errorde tipo I al de tipo II y, en consecuencia, establecería nivelesmuy elevados de significancia en sus pruebas paraconseguir bajas.

Page 29: Pruebas de hipótesis 1

Tipos de error al tomar unadecisión

RealidadInocente Culpable

veredicto Inocente OK Error

Menos grave

Culpable Error

Muy grave

OK

. Pruebas de hipótesis 29

Page 30: Pruebas de hipótesis 1

Tipos de error al contrastarhipótesis

Realidad

H0 cierta H0 FalsaNo Rechazo H0 Correcto

El tratamiento notiene efecto y así sedecide.

Error de tipo IIEl tratamiento si tiene efectopero no lo percibimos.

Probabilidad β

Rechazo H0

Acepto H1

Error de tipoIEl tratamiento notiene efecto pero sedecide que sí.

Probabilidad α

CorrectoEl tratamiento tiene efecto yel experimento lo confirma.

. Pruebas de hipótesis 30

Page 31: Pruebas de hipótesis 1

No se puede tener todo

• Para un tamaño muestral fijo, no se pueden reducir a la vezambos tipos de error.

• Para reducir β, hay que aumentar el tamaño muestral.

. Pruebas de hipótesis 31

α

β

Recordad lo quepasaba con

sensibilidad yespecificidad

Page 32: Pruebas de hipótesis 1

e) Pasos para seleccionar la distribucióncorrecta

1.- Se define el nivel de significancia a usar.2.- Determinar la distribución adecuada de

probabilidad: puede ser la distribuciónnormal o la distribución t. Las reglas paraelegir la distribución apropiada al efectuarpruebas de las medias son:

a. Si la muestra tomada es mayor de 30(muestras grandes), debe elegirse ladistribución normal (Z).

b. Si la muestra tomada es igual o menor que30 (muestras pequeñas), debe elegirse ladistribución t.

Page 33: Pruebas de hipótesis 1

PRUEBA DE HIPÓTESIS DE LAS MEDIAS DEMUESTRAS GRANDES

Realizaremos algunos ejemplos,en diferentes condicionescuando se conocen lasdesviaciones estándar de lapoblación.

Page 34: Pruebas de hipótesis 1

a) Prueba de dos extremos para lasmedias

Es cuando el nivel de significancia(zona de rechazo) abarca los dosextremos o colas de la campana deGauss.

Page 35: Pruebas de hipótesis 1

Ejemplo 1.-El fabricante de una llanta especial para camiones

afirma que la duración media de la parterodante de agarre es de 60,000 mi. Ladesviación estándar de los millajes es de 5,000mi. Una empresa de transportes compró 48llantas y halló que la duración media para susvehículos fue de 59,500 mi. ¿Es la experienciadistinta de la expresada por el fabricante alnivel de significación de 0.05?

= 60,000 mi = 5,000 mi

Datos: n = 48 llantas= 59,500 mi = 0.05x

Page 36: Pruebas de hipótesis 1

Solución:

Las hipótesis se expresan de la siguiente manera:

H0 : = 60,000 mi La duración de las llantas es de 60,000 millasH1 : 60,000 mi La duración de las llantas es distinta a 60,000

millas

Primero, vamos a calcular el error estándar de la media y para elloemplearemos la expresión del error estándar:

nx

Sustituyendo valores en ella, se tiene:

mixxx 69.7219282.6

000,5

48

000,5

Page 37: Pruebas de hipótesis 1

En el siguiente paso vamos a obtener el valor de “Z” y para ello vamos aapoyarnos en la gráfica siguiente:

Page 38: Pruebas de hipótesis 1

Recurrimos a las tablas de la distribución normal y en ellaslocalizamos 0.475, que se ubica en un valor de Z = 1.96

En el tercer paso, vamos a determinar los límites superiore inferior de confianza para el intervalo de la mediapoblacional ya que se trata de una prueba de dosextremos. Para ello aplicaremos la expresión siguiente:

x

Sustituyendo valores en ella, se tiene:

Lc = 60,000 1.96 (721.69)Ls = 60,000 + 1,414.51 Ls = 61,414.51 millas.Li = 60,000 – 1,414.51 Li = 58,585.49 millas

Entonces la media de la población fluctúa entre58,585.49 y 61,414.51 millas en un nivel deconfianza del 95%.

xZLc H 0

Page 39: Pruebas de hipótesis 1

Regresemos a la gráfica anterior para ubicar los límites deconfianza y la media muestral. Con ello analizaremos sise acepta la hipótesis nula además de verificar si esverdadera o falsa.

Page 40: Pruebas de hipótesis 1

La media muestral se ubica dentro de la zona deaceptación, por lo que podemos decir que la hipótesisnula es verdadera, pero vamos a verificar estáaseveración por medio de la expresión siguiente:

x

xZ

__693.069.721

000,60500,59

XZ

Z

Entonces la media muestral se ubica en -0.693 yse confirma que cae en la zona de aceptación.Concluimos que la duración media de lasllantas es muy cercana a la que afirma elfabricante de 60,000 millas, con un nivel designificancia de 0.05.

x

Page 41: Pruebas de hipótesis 1

b) Prueba de un extremo para las medias

En este caso, el nivel de significancia (zona derechazo) sólo abarca un extremo o cola de lacampana de Gauss.

Page 42: Pruebas de hipótesis 1

Ejemplo 2.-

Una cadena de restaurantes afirma que el tiempomedio de espera de clientes por atender estádistribuido normalmente con una media de 3minutos y una desviación estándar de 1 minuto. Sudepartamento de aseguramiento de la calidad hallóen una muestra de 50 clientes en un ciertoestablecimiento que el tiempo medio de espera erade 2.75 minutos. Al nivel de significación de 0.05,¿Es dicho tiempo menor de 3 minutos?

= 3 minutos. = 1minutos.

Datos: n = 50 clientes.= 2.75 minutos. = 0.05x

Page 43: Pruebas de hipótesis 1

Representemos estos datos en la campana de Gauss:

Las hipótesis son:

Ho : = 3 El tiempo promedio de espera es de 3 minutos.

H1 : 3 El tiempo promedio de espera es menor de 3 minutos.

Page 44: Pruebas de hipótesis 1

Primero calculemos el error estándar de la media:

Ahora determinemos el valor de Z, ya que tenemos una muestra mayor de 30:Como = 0.05 y es una prueba de hipótesis para un extremo, en este caso, el

extremo izquierdo, entonces, el nivel de significancia está contenido eneste extremo, por lo que el nivel de confianza es 0.5 – 0.05 = 0.45 .

Buscando en las tablas de la distribución normal 0.45, encontramos que: Z=1.64

El límite izquierdo del intervalo de confianza será:

Li = 3 – 1.64 (0.1414)Li = 3 – 0.2319Li = 2.768

Gráficamente esto se representa así:

1414.007.7

1

50

1 xxx

x

Page 45: Pruebas de hipótesis 1
Page 46: Pruebas de hipótesis 1

La media muestral 2.75, se localiza en la zona derechazo, por lo que se puede establecer que serechaza la hipótesis nula y se acepta la alternativa.

Comprobemos con :

x

xZ

xZZZ 77.11414.0

25.0

1414.0

375.2

Como podemos observar 1.77 está localizadomás hacia la izquierda del límite deconfianza 1.64.

Podemos concluir que el tiempo medio deespera de clientes por atender en esteestablecimiento es menor de 3 minutos.

Page 47: Pruebas de hipótesis 1

Ahora realizaremos un ejemplo cuando sedesconoce la desviación estándar de lapoblación.

Page 48: Pruebas de hipótesis 1

Ejemplo 3.-Una cadena grande de tiendas de autoservicio, expide su

propia tarjeta de crédito. El gerente de crédito deseaaveriguar si el saldo insoluto medio mensuales mayorque 400 dólares. El nivel de significación se fija en0.05. Una revisión aleatoria de 172 saldos insolutosreveló que la media muestral 407 dólares y ladesviación estándar de la muestra es 38 dólares.¿Debería concluir ese funcionario de la mediapoblacional es mayor que 400 dólares, o es razonablesuponer que la diferencia de 7 dólares (obtenida de407- 400 = 7) se debe al azar?

= 400 dólares.n = 172 saldos insolutos.

Datos: = 407 dólares.s = = 38 dólares (desviación estándar

estimada). = 0.05

Page 49: Pruebas de hipótesis 1

Las hipótesis son:Ho : = 400 dólares.H1 : 400 dólares.Debido a que la hipótesis alternativa

nos indica un sentido a la derechade la media, debemos aplicar unaprueba de una cola. Veamos lagráfica:

Page 50: Pruebas de hipótesis 1
Page 51: Pruebas de hipótesis 1

Si calculamos el error estándar estimados, tenemos que:

nx

ˆˆ

897.2ˆ115.13

38ˆ172

38ˆ xxx

Si leemos en las tablas de la distribuciónnormal 0.45, encontramos que: Z = 1.64

Determinando el límite superior del intervalode confianza, se tiene:

Ls = 400 + 1.64 (2.897)Ls = 404.75 dólares.Gráficamente esto ocurre:

Page 52: Pruebas de hipótesis 1
Page 53: Pruebas de hipótesis 1

Comprobando con:

x

xZ

ˆ

xZZZ ̂416.2897.2

7

897.2

400407

Con esto comprobamos que el valor de lamedia muestral, cae dentro de la zona derechazo, por lo que se rechaza lahipótesis nula y se acepta la alternativa.

Con esto el gerente de crédito debeconcluir que el saldo insoluto mediomensuales es mayor que 400 dólares.

Page 54: Pruebas de hipótesis 1

PRUEBAS DE HIPOTESIS DE LAS MEDIASDE MUESTRAS PEQUEÑAS.

Page 55: Pruebas de hipótesis 1

a) Prueba de dos extremos para medias

Mediante el siguiente ejemploexplicaremos el razonamiento aseguir para demostrar una pruebade hipótesis de dos extremos conuna muestra menor a 30, en dondeaplicaremos la distribución t.

Page 56: Pruebas de hipótesis 1

Ejemplo 1.-Un especialista en personal que labora en una gran

corporación, está reclutando un vasto número deempleados para un trabajo en el extranjero. Durante larealización de pruebas, la gerencia pregunta cómomarchan las cosas y el especialista contesta: “Bien, creoque la puntuación promedio en el test de actitudes será90”. Cuando la gerencia revisa 20 de los resultados de laprueba, averigua que la puntuación media es 84 y ladesviación estándar de esta puntuación es 11. Si lagerencia quiere probar la hipótesis del especialista enpersonal en el nivel de significancia de 0.10, ¿cuál será elprocedimiento a que recurra?

= 90’’n = 20

Datos: = 84s = = 11 = 0.10

x

Page 57: Pruebas de hipótesis 1

Las hipótesis son:Ho: = 90’’H1 : 90’’El error estándar estimado de la media será:

46.2ˆ472.4

11ˆ20

11ˆˆˆ xxxn

x

En la tabla t de Student se localiza = 0.10 y gl = 20 – 1, osea gl = 19 y se encuentra que: t = 1.729

Con estos datos ya podemos determinar los limites superiore inferior del intervalo de confianza, mediante laexpresión:

xtLc ˆLc = 90” 1.729 (2.46) Ls = 90” + 4.246 Ls = 94.25”Li = 90” – 1.729 (2.46) Li = 90” – 4.246 Li = 85.75”

Gráficamente esto sucede:

Page 58: Pruebas de hipótesis 1

Como la media muestral cae en la zona de rechazo, entonces serechaza la hipótesis nula y se acepta la hipótesis alternativa.

Concluimos que la gerencia tiene suficientes evidencias parademostrar que el especialista está equivocado, que lapuntuación media no es 90.

Page 59: Pruebas de hipótesis 1

b) Prueba de un extremo para medias

Para este caso, ya sabemos que el nivel designificancia (zona de rechazo) sólo abarca unextremo o cola de la campana de Gauss.

Page 60: Pruebas de hipótesis 1

Ejemplo 2.-

Una persona tomó una muestra aleatoria de 7casas en un suburbio muy elegante de una granciudad y encontró que el valor promedioestimado del mercado era de $560,000, conuna desviación estándar de $49,000. Pruebe lahipótesis de que, para todas las casas del área,el valor medio estimado es de $600,000, contrala alternativa de que sea menor que $600,000.Use el nivel de significancia de 0.05.

n = 7 casas= $560,000

Datos: s = = $49,000 = $600,000 = 0.05

Page 61: Pruebas de hipótesis 1

Las hipótesis son:Ho : = $600,000H1 : $600,000Calculando el error estimado de la muestra, se tiene que:

52.518,18$ˆ646.2

000,49ˆ7

000,49ˆˆˆ xxxn

x

Sabemos que el nivel de significancia es de 0.05, para unacola, por lo que se supone, que si fuera una prueba parados colas, cada una tendría 0.05, es decir, el nivel designificancia = 0.10. Por lo tanto 0.10 es el valor quedebemos localizar en la tabla correspondiente de ladistribución t de Student, con 6 grados de libertad (7 – 1).

Encontramos entonces que t = 1.943Con estos datos, ya podemos determinar el límite inferior del

intervalo de confianza en donde se encuentra laverdadera media de la población.

xtLi ˆ

Li = 600,000 – 1.943 (18,518.52) Li = $564,018.52

En la campana de Gauss:

Page 62: Pruebas de hipótesis 1
Page 63: Pruebas de hipótesis 1

Como la media muestral cae la zona de rechazo, entoncesse rechaza la hipótesis nula y se acepta la hipótesisalternativa.

Comprobando lo anterior, se tiene que:

Podemos concluir que el valor medio estimadodel valor de todas las casas es menor de$600,000.

xZZZ 16.252.518,18

000,40

52.518,18

000,600000,560

Page 64: Pruebas de hipótesis 1

PRUEBA DE HIPOTESIS PARAPROPORCIONES

a) Prueba de dos extremos para proporciones.La prueba de hipótesis para proporciones, tiene

algunas variantes en la demostración de lashipótesis respecto a la prueba de hipótesis demedias, variantes que se irán explicandoconforme se vayan aplicando.

Page 65: Pruebas de hipótesis 1

Ejemplo 1.-Una compañía que está evaluando la promovibilidad de sus

empleados; es decir, está determinando la proporción deaquellos cuya habilidad, preparación y experiencia en lasupervisión los clasifica para un ascenso a niveles superioresde la jerarquía. El director de recursos humanos le dice alpresidente que el 80%,o sea el 0.8, de los empleados son“promovibles”. El presidente crea un comité especial paravalorar la promovibilidad de todo el personal. El comité realizaentrevistas en profundidad con 150 empleados y en su juiciose da cuenta que sólo el 70% de la muestra llena los requisitosde la promoción. El presidente quiere probar, en un nivel designificancia de 0.05, la hipótesis de que 0.8 de los empleadospueden ser promovidos.

p = 0.8q = 0.2

Datos: n = 150= 0.7= 0.3

= 0.05pq

Page 66: Pruebas de hipótesis 1

Las hipótesis son:Ho : p = 0.8 80% de los empleados son promovibles.H1 : p 0.8 La proporción de empleados promovibles no

es 80%.Primero calculamos el error estándar de la proporción,

mediante la siguiente expresión:

n

qp HH 00

Sustituyendo valores:

0327.00010666.0150

)2)(.8(. ppp

Page 67: Pruebas de hipótesis 1

En este caso, la compañía quiere saber si la verdaderaproporción es mayor o menor que la supuestaproporción. Por consiguiente, es apropiada una pruebade dos extremos para una proporción. El nivel designificancia corresponde a las dos regionessombreadas, cada una de las cuales contiene 0.025 delárea. La región de aceptación de 0.95 se ilustra comodos áreas de 0.475 cada una. Puesto que la muestra esmayor que 30, podemos recurrir la distribución normal.Basándonos en la tabla de ésta distribución, podemoscalcular que el valor correspondiente de Z para 0.475del área bajo la curva es 1.96 . Por tanto, los limites dela región de aceptación son:

Lc = PH0 ZLc = 0.8 1.96(0.0327)

Ls = 0.8 + 0.06409 Ls = 0.8641Li = 0.8 – 0.06409 Li = 0.7359

Viéndolo en la campana de Gauss:

Page 68: Pruebas de hipótesis 1
Page 69: Pruebas de hipótesis 1

La probabilidad de la muestra = 0.7, selocaliza en la zona de rechazo, por lo quese rechaza la hipótesis nula y se aceptala alternativa. Vamos a demostrarlo:

p

pZZZ 058.30327.0

1.0

0327.0

8.07.0

Podemos concluir que existe unadiferencia significativa entre la supuestaproporción de empleados promoviblescomunicada por el director de recursoshumanos y la observada en la muestra,la proporción de toda la compañía no esdel 80%.

Page 70: Pruebas de hipótesis 1

b) Prueba de un extremo paraproporciones

Ejemplo 2.- Un artículo reciente en el periódicoReforma reportó que un empleado estádisponible sólo para que uno de tres egresadosuniversitarios con grado. Las principales razonesaportadas fueron que existe unasobreabundancia de graduados de universidad yuna economía débil. Suponga que una encuestacon 200 graduados recientes de la institución deusted, revela que 80 estudiantes tenían empleo.Al nivel de significancia de 0.02, ¿se puedeconcluir que una proporción mayor deestudiantes egresados tienen trabajo?

p = 0.8q = 0.2

Datos: n = 150= 0.7= 0.3

= 0.05

pq

Page 71: Pruebas de hipótesis 1

Las hipótesis son:Ho : p = 0.3333H1 : p 0.3333Calcularemos primero el error estándar de la proporción:

n

qpp HoHo

Sustituyendo valores:

0333.00011.2002222.0

200)6667.0()3333.0(

pppp

Page 72: Pruebas de hipótesis 1

En este caso, se quiere saber si la verdadera proporción es mayorque la supuesta proporción. Por consiguiente, es apropiadauna prueba de un extremo para una proporción. El nivel designificancia corresponde a la región derecha de rechazo. Laregión de aceptación de 0.98 se ilustra como un área de 0.5 yotra de 0.48 como la muestra es mayor de 30, podemosrecurrir a la distribución normal. Basándonos en la tabla de deesta distribución el valor correspondiente de Z, para 0.48 delárea bajo la curva es 2.05, por tanto, el límite de la región deaceptación es:

Ls = 0.3333 + 2.05 (0.0333) Ls = 0.3333 + 0.068265 Ls =0.4016

Como = 0.4, y es menor que 0.4016, se localiza en la zona deaceptación, entonces, se acepta la hipótesis nula.

Demostrando lo anterior se tiene:

p

p

ppZ

pZZZ 003.20333.0

0667.0

0333.0

3333.04.0

En la campana de Gauss:

Page 73: Pruebas de hipótesis 1

Concluimos que no es mayor la proporción deestudiantes egresados que tienen trabajo.

Page 74: Pruebas de hipótesis 1

C) Prueba de hipótesis para proporciones de muestraspequeñas.

Si usamos la distribución t para una prueba hipótesis para proporciones enmuestras pequeñas, de dos colas, seguimos el mismo procedimiento quese utilizó en la prueba para medias de muestras pequeñas.

Lo mismo sucede si se trata de una prueba de un extremo, recordando que,para obtener el valor apropiado de t en un nivel de significancia de 0.05con 10 grados de libertad, buscaremos en la tabla de la distribución t bajola columna 0.10, frente al renglón 10 grados de libertad. Esto es verdadporque la columna 0.10 del área bajo la curva contenida en ambosextremos combinados; por ello también representa 0.05 del área bajo lacurva contenida en cada uno de los extremos. Por esta razón en lugar debuscar en la columna 0.05, se busca 0.10.

Page 75: Pruebas de hipótesis 1

Conclusiones• Las hipótesis no se plantean después de observar los datos.

• En ciencia, las hipótesis nula y alternativa no tienen el mismo papel:

– H0 : Hipótesis científicamente más simple.– H1 : El peso de la prueba recae en ella.

• α debe ser pequeño

• Rechazar una hipótesis consiste en observar si p < α

• Rechazar una hipótesis no prueba que sea falsa. Podemos cometer error de tipo I

• No rechazar una hipótesis no prueba que sea cierta. Podemos cometer error de tipo II

• Si decidimos rechazar una hipótesis debemos mostrar la probabilidad de equivocarnos.

. Pruebas de hipótesis 75

Page 76: Pruebas de hipótesis 1

¿Qué hemos visto?• Hipótesis

– Nula– Alternativa

• Nivel de significación– α– Probabilidad de error de tipo I

• Significación, p.– Criterio de aceptación / rechazo.

• Tipos de error– Tipo I– Tipo II

. Pruebas de hipótesis 76