14
9 Tests de hiptesis En la seccin anterior hemos visto como estimar un parÆmetro desconocido mediante un intervalo de conanza. En muchas ocasiones, el propsito de una investigacin es determinar si es verdadera o no, alguna hiptesis sobre algœn parÆmetro. Los mØtodos que se utilizan para esto se llaman pruebas o tests de hiptesis. Una hiptesis estadstica es una expresin acerca del valor de una o varias caractersticas o parÆmetros de la poblacin. Comenzaremos viendo algunos test de hiptesis acerca de la media de una poblacin. 9.1 Tests para una media Ejemplo 9.1 Se realizan 6 mediciones de una misma muestra con una tØc- nica cuyo un error de medicin tiene =0:08mg=ml: Se quiere saber si el verdadero valor del especimen que estÆ midiendo es mayor que 1:22g=ml Las 6 mediciones se pueden considerar una muestra aleatoria X 1 ;X 2 ; ::; X 6 donde cada v.a. tiene distribucin N(; 0:08 2 ) y es el verdadero valor del especimen medido. Se debe entonces vericar si > 1:22; o si 6 1:22, Østa œltima es la llamada hiptesis nula (H 0 ). La hiptesis que deseamos probar la llamaremos hiptesis alternativa (H A ): Para simplicar por el momento usaremos = 1:22 como hiptesis nula. Esto queda expresado: H 0 : = 0 H A : > 0 en este caso H 0 : =1:22 H A : > 1:22 Debemos notar que al decidirnos por una de las dos hiptesis, podemos cometer dos tipos de errores diferentes. Podemos equivocarnos al concluir que > 1:22 cuando en realidad no lo es (error de tipo I : rechazar H 0 cuando es verdadera), o concluir que =1:22, cuando en realidad es mayor que 1:22 (error de tipo II : aceptar H 0 cuando es falsa). Recordemos que nunca conocemos cuÆnto vale , y slo podemos hacer inferencias, basadas en la muestra, acerca de su valor. 66

9 Tests de hipótesis - UNLP

  • Upload
    others

  • View
    5

  • Download
    0

Embed Size (px)

Citation preview

Page 1: 9 Tests de hipótesis - UNLP

9 Tests de hipótesis

En la sección anterior hemos visto como estimar un parámetro desconocidomediante un intervalo de con�anza. En muchas ocasiones, el propósito deuna investigación es determinar si es verdadera o no, alguna hipótesis sobrealgún parámetro. Los métodos que se utilizan para esto se llaman pruebas otests de hipótesis.Una hipótesis estadística es una expresión acerca del valor de una o varias

características o parámetros de la población. Comenzaremos viendo algunostest de hipótesis acerca de la media de una población.

9.1 Tests para una media

Ejemplo 9.1 Se realizan 6 mediciones de una misma muestra con una téc-nica cuyo un error de medición tiene � = 0:08mg=ml: Se quiere saber si elverdadero valor del especimen que está midiendo es mayor que 1:22g=ml

Las 6 mediciones se pueden considerar una muestra aleatoriaX1; X2; ::; X6

donde cada v.a. tiene distribución N(�; 0:082) y � es el verdadero valor delespecimen medido.Se debe entonces veri�car si � > 1:22; o si � 6 1:22, ésta última es la

llamada hipótesis nula (H0). La hipótesis que deseamos probar la llamaremoshipótesis alternativa (HA): Para simpli�car por el momento usaremos � =1:22 como hipótesis nula. Esto queda expresado:

H0 : � = �0 HA : � > �0

en este casoH0 : � = 1:22 HA : � > 1:22

Debemos notar que al decidirnos por una de las dos hipótesis, podemoscometer dos tipos de errores diferentes. Podemos equivocarnos al concluirque � > 1:22 cuando en realidad no lo es (error de tipo I : rechazarH0 cuandoes verdadera), o concluir que � = 1:22, cuando en realidad � es mayor que1:22 (error de tipo II : aceptar H0 cuando es falsa). Recordemos que nuncaconocemos cuánto vale �, y sólo podemos hacer inferencias, basadas en lamuestra, acerca de su valor.

66

Page 2: 9 Tests de hipótesis - UNLP

Los procedimientos que vamos a ver, nos permiten acotar la probabilidadde cometer un error de tipo I, por eso es importante saber cuál debe ser lahipótesis nula y cuál la alternativa.Lo más natural será calcular el promedio de las 6 mediciones x y com-

pararlo con el valor �0, ya que sabemos que X es un estimador de �; si xresulta mucho más grande que �0; tendremos motivos para pensar que enrealidad � > �0 (cuánto más grande sea x; mayor será la evidencia contraH0 : � = �0 a favor de HA : � > �0). Debemos decidir cuándo consider-aremos que x es lo su�cientemente �mayor que �0 �como para rechazar lahipótesis nula. Para esto debemos considerar un estadístico con distribuciónconocida cuando H0 es verdadera y de�nir una zona de rechazo. Usaremosel estadístico de prueba:

Z =

�X � �0

��=pn

=

�X � 1:22

�0:08=

p6

que tiene distribución N(0; 1) cuando � = �0 :Se puede establecer una regla de decisión como la siguiente: rechazar H0

cuando el valor del estadístico de prueba es mayor que 1:65; de este modo nosaseguramos que P (error de tipo I ) = P

�p6�X � 1:22

�=0:08 > 1:65

�= 0:05:

En general la regla es:

rechazar H0 : � = �0 a favor de HA : � > �0; cuandopn (x� �0)�

> z�

entonces P (error de tipo I ) = PH0�pn�X � �0

�=� > z�

�= �, este valor �

se llama nivel de signi�cación. Al �jar un nivel de signi�cación � = 0:05;nos aseguramos que la probabilidad de cometer error de tipo I, no puede sermayor que 0.05. Se llama zona de rechazo, a la región que queda a la derechadel valor z�.

En nuestro ejemplo, se hicieron 6 repeticiones, y se obtuvo x = 1:28; reem-plazando X por x = 1:28; el estadístico de prueba toma el valor

p6(1:28 �

1:22)=0:08 = 1:84: Como este valor cae en la zona de rechazo, podemos rec-hazar la hipótesis nula con nivel 0:05. Esto signi�ca que podemos a�rmar queel verdadero valor del especimen medido es mayor que 1.22 y la probabilidadde equivocarnos al hacer esta a�rmación es a lo sumo 0:05

También podemos razonar de esta manera: si fuera � = 1:22, ¿cuál es laprobabilidad de obtener una media muestral tan grande o más que el valor

67

Page 3: 9 Tests de hipótesis - UNLP

1:28?, o lo que es equivalente, ¿cuál es la probabilidad de que el estadísticode prueba alcanzara un valor mayor o igual que 1:84?.Esta probabilidad puede calcularse ya que el estadístico de prueba tiene

distribuciónN(0; 1) cuando � = 1:22 y es PH0�p6�X � 1:22

�=0:08 > 1:84

�=

1 � �(1:84) = 1 � 0:9671 = 0:0329. Esto es lo que se llama el �valor-p�,cuánto menor sea este p; más evidencia tengo contra H0: En nuestro ejem-plo, p = 0:0329 es una probabilidad bastante pequeña, podemos rechazar H0y a�rmar la alternativa, es decir que � > 1:22Otra manera de expresar la regla de decisión, es decir que se rechaza H0,

cuando el �valor-p� es menor que �: En realidad el �valor-p� es el menornivel de signi�cación (el más exigente) para el cual se puede rechazar H0 conlos valores observados.En este caso �valor-p�= 0:0329, esto signi�ca que podemos rechazar H0

hasta con un nivel 0:0329

Tratemos de resumir los principales conceptos que hemos visto hasta aquí.

� En un procedimiento de test de hipótesis tenemos siempre dos hipótesispara contrastar. En investigaciones cientí�cas la hipótesis alternativa(HA) suele llamarse "hipótesis del investigador" y la hipótesis nula(H0) representa lo contrario, que no hay diferencias. En el ejemploanalizado, la hipótesis nula era H0 : � = �0 y la hipótesis alternativa esHA : � > �0. En otros ejemplos la hipótesis alternativa también podríaser HA : � < �0 o HA : � 6= �0: La igualdad siempre está en H0:

� Un procedimiento de test de hipótesis está determinado por un estadís-tico de prueba que debe tener una distribución conocida e independi-ente del parámetro sobre el cual estamos haciendo inferencias. Dadoese estadístico de prueba, se de�ne una zona de rechazo y una regla dedecisión. Dicha regla puede de�nirse como: "se rechazará H0 cuando elvalor del estadístico de prueba cae en la zona de rechazo". En el ejem-plo, la zona de rechazo eran los valores a la derecha de z�. Siempre quela hipótesis alternativa es de la forma HA : � > �0 la zona de rechazoson los valores a la derecha de un punto crítico; en el caso HA : � < �0la zona de rechazo son los valores a la izquierda de un punto crítico;y en el caso HA : � 6= �0 la zona de rechazo es bilateral, es decir estáformada por la unión de valores a la derecha y a la izquierda de dospuntos críticos.

68

Page 4: 9 Tests de hipótesis - UNLP

� Al tomar una decisión, ya sea aceptar o rechazar H0 podemos cometerun error, hay entonces dos tipos de errores:

�Error de tipo I : rechazar H0 cuando es verdadera

�Error de tipo II : aceptar H0 cuando es falsa

� Se denomina nivel de signi�cación del test a la probabilidad de cometerun error de tipo I, � = P (error de tipo I ) . Este nivel de signi�caciónse �ja "a priori" y luego se determina cual debe ser la zona de rechazo,para que el nivel de signi�cación sea el deseado. El área de la zona derechazo es igual al nivel de signi�cación (�) elegido.

� Se de�ne el valor-p como la probabilidad de que el estadístico de pruebatome un valor "tan extremo" como el obtenido, si fuera cierta la hipóte-sis nula. O también puede de�nirse como el menor nivel de signi�caciónpara el cual se puede rechazar la hipótesis nula con los valores obser-vados. Estas dos de�niciones son equivalentes. Es importante observarque, el p-valor y el nivel de signi�cación son cosas diferentes, el valor-pdepende de los valores observados, mientras que el nivel de signi�caciónse de�ne a priori.

Veamos otro ejemplo.

Ejemplo 9.2 Se sabe que la distribución del perímetro cefálico de reciénnacidos de sexo masculino, es normal con media � = 36 cm y desviacióntípica � = 1:97 cm. Se han observado los perímetros cefálicos de 10 re-cién nacidos cuyas madres consumieron drogas durante el embarazo, y seha obtenido x = 34:5 cm. ¿Se puede inferir en base a estos datos, que lamedia del perímetro cefálico de los niños cuyas madres consumieron drogasdurante el embarazo es menor que la de la población general? Suponemosque la distribución en estos niños también es normal y con el mismo �:

Podemos enunciar el problema como sigue:

H0 : � = �0 HA : � < �0

o sea:H0 : � = 36 HA : � < 36

69

Page 5: 9 Tests de hipótesis - UNLP

usaremos el mismo estadístico de prueba, que en este caso es:

Z =

�X � �0

��=pn

=

�X � 36

�1:97=

pn

ahora, la regla de decisión es:

rechazar H0 : � = �0 a favor de HA : � < �0; cuandopn (x� �0)�

< �z�

la zona de rechazo es el área a la izquierda de �z�: Si deseamos un nivel designi�cación � = 0:01, usamos el valor �z0:01 = �2:326Con los datos del ejemplo, al reemplazar X por x = 34:5, el valor que

toma el estadístico es:p10(34:5 � 36)=1:97 = �2:41, este valor cae en la

zona de rechazo, de modo que podemos rechazar H0 a nivel � = 0:01. Esdecir, podemos a�rmar que la media del perímetro cefálico de los niños cuyasmadres consumieron drogas durante el embarazo es menor que la mediade la población general. También se dice que el resultado es signi�cativoal 1%; también podríamos calcular el �valor-p�= P (Z < �2:41) = 0:008,(recordemos que esto signi�ca que podemos rechazar H0 aun con ese nivel, odecir que es signi�cativo al 0.8%)

Los dos ejemplos que hemos visto son tests unilaterales, porque la alter-nativa sólo puede ocurrir en una dirección.En estos tests hemos usado siempre H0 : � = �0 para cualquiera de las

dos alternativas, en realidad los test unilaterales que hemos de�nido y losque de�neremos más adelente, también sirven cuando la hipótesis nula esH0 : � � �0 contra la alternativa HA : � > �0; y cuando la la hipótesis nulaes H0 : � � �0 contra la alternativa HA : � < �0.Veamos ahora un ejemplo donde la alternativa puede ser � > �0 o � < �0.

Ejemplo 9.3 En un estudio de niños con hipotiroidismo congénito (HC), semidió talla a un grupo de 13 niños con HC de sexo masculino y 6 mses deedad, y se obtuvo x = 67:16: Se desea saber si el valor medio de la talla delos niños con HC di�ere del valor medio de la población general. Se sabe quela distribución de tallas para niños sanos de esa edad, es normal con media68.2 cm y desviación típica 2.34 cm. En este caso se puede suponer que ladistribución de tallas de los niños con HC también es normal con la mismadesviación típica.

70

Page 6: 9 Tests de hipótesis - UNLP

En este caso no hay una hipótesis a priori de que las tallas de los niñoscon HC son mayores o menores que las de la población general (�0 = 68:2),es por eso que la alternativa debe ser HA : � 6= �0:Decimos que este es un test bilateral, en general el problema se expresa:

H0 : � = �0 HA : � 6= �0

que en nuestro caso es:

H0 : � = 68:2 HA : � 6= 68:2

Usaremos el mismo estadístico de prueba que en los ejemplos anteriores:

Z =

�X � �0

��=pn

=

�X � 68:2

�2:34=

pn

pero ahora parece razonable rechazar H0, cuando x sea mucho mas grande omucho más pequeño que 68.2, dicho de otro modo, cuando la distancia entre xy 68.2 sea grande. Esto signi�ca que una vez que evaluemos Z reemplazandoX por x, deberemos considerar su valor absoluto.La regla de decisión es:

rechazar H0 : � = �0 a favor de HA : � 6= �0; cuandopn jx� �0j�

> z�=2

es importante observar que la zona de rechazo es la región a la derecha dez�=2 y la región a la izquierda de �z�=2, es una región bilateral; como siempre,si � = �0; el área total de la zona de rechazo es �. Si elegimos un nivel designi�cación � = 0:05 tenemos z0:025 = 1:96; entonces se rechaza H0 cuandoel estadístico tome un valor superior a 1.96 o inferior a -1.96. Con los datosdel ejemplo tenemos

p13 (67:16� 68:2) =2:34 = �1:60; este valor no está en

la zona de rechazo, y por lo tanto no podemos a�rmar, a nivel 0.05, que lastallas de los niños de 6 meses con HC di�eran, en promedio, de las de lapoblación general. También podemos calcular el �valor-p�, que ahora es

PH0

�p13��X � 68:2�� =2:34 > 1:60� = P (jZj > 1:60) =

= P (Z > 1:60) + P (Z < �1:60) == 2 (1� �(1:60)) = 0:11

este �valor-p�no brinda su�ciente evidencia para rechazar H0

71

Page 7: 9 Tests de hipótesis - UNLP

¿Cuándo se considera que hay su�ciente evidencia para rechazar la hipóte-sis nula?. Esto depende de la situación; pero en la mayoría de las aplicaciones,se considera que un valor-p � 0:05 es su�ciente evidencia. Esto equivale aelegir un nivel de signi�cación � = 0:05:

Si el test da no signi�cativo, esto no debe tomarse como una demostraciónde que � = �0; sino sólo de que no hay su�ciente evidencia en contra. Estopuede deberse a una muestra demasiado pequeña. Con el mismo x; si envez de n = 13 fuera n = 30; tendríamos Z = �2:43, que cae en la zona derechazo para un nivel 0.05, (es signi�cativo al 5%), más aun el �valor-p�es0.015

Se debe observar que los test bilaterales son más conservadores que losunilaterales, para un mismo valor del estadístico de prueba, el valor-p esmayor para un test bilateral que para un test unilateral.

Podemos resumir lo que hemos visto sobre test para la media �, cuando lamuestra X1; X2; :::; Xn proviene de una distribución normal con � conocido.

Hipótesis nula: H0 : � = �0Valor de estadístico de prueba: z =

pn (x� �0) =�

Hipótesis alternativa Región de rechazo para un nivel �HA : � > �0 z > z�HA : � < �0 z < �z�HA : � 6= �0 z > z�=2 o z < �z�=2

Realice los ejercicios de 1 a 5

Cuando la distribución de los datos es normal, pero desconocemos el valorde �, no podemos usar el mismo estadístico de prueba que en el caso anterior.Recordemos lo que vimos al construir intervalos de con�anza, en este casousamos un estadístico con distribución de Student.Cuando � = �0, el estadístico

T =

�X � �0

�S=pn

tiene distribución de Student con n� 1grados de libertad

Usaremos entonces este estadístico de prueba, del mismo modo que antesusamos el Z.

Ejemplo 9.4 Se desea estudiar si el nivel de aluminio en la sangre en lapoblación de niños que reciben antiácidos con aluminio, di�ere de la población

72

Page 8: 9 Tests de hipótesis - UNLP

general de niños que no reciben estos antiácidos. La distribución de los nive-les de aluminio en sangre es aproximadamente normal; además el nivel mediode aluminio en sangre en la población de niños que no reciben antiácidos esde 4:13 �g=l: Se seleccionó una muestra de diez niños que reciben este tipode antiácidos, y se obtuvo x = 37:20 �g=l y s = 7:13 �g=l

Igual que en el ejemplo 9.3, se tiene un valor de referencia �0 = 4:13, yse quiere decidir si la media verdadera � de la distribución di�ere de �0:Podemos enunciar el problema como:

H0 : � = �0 HA : � 6= �0

Se puede de�nir la regla de decisión del siguiente modo:

rechazar H0 : � = �0 a favor de HA : � 6= �0; cuandopn jx� �0js

> t�=2

donde t�=2 se busca en la tabla de Student para n� 1 grados de libertad. Sideseamos un nivel de signi�cación � = 0:05, el valor crítico para 9 grados delibertad es t0:025 = 2:262. Esto signi�ca que la zona de rechazo es el área ala derecha de 2:262 y el área a la izquierda de �2:262.Reemplazando por los valores de la media muestral x = 37:20: y la

desviación típica muestral s = 7:13; calculamos el valor del estadístico yobtenemos t =

p10 (37:20� 4:13) =7:13 = 14:67: Este valor cae en la zona

de rechazo, podemos a�rmar que el nivel medio de aluminio en sangre deesta población es diferente de 4.13.En este caso el valor del estadístico es mucho mayor que el valor crítico

t0:025 = 2:262, si hubiéramos elegido un nivel de signi�cación � = 0:001, elvalor crítico sería t0:0005 = 4:781, y también rechazaríamos H0 con este nivelde signi�cación. No podemos calcular exactamente el valor-p, pero podemosa�rmar que p < 0:001.

Ejemplo 9.5 Consideremos ahora la situación de una droga antihiperten-siva. Se debe mostrar evidencia de que la presión sistólica media de losindividuos que reciben esta droga es menor que la de los que reciben la drogaestándar. Se sabe por investigaciones previas que estos últimos tienen unapresión sistólica cuya distribución es normal con media de 130 mm Hg; ypuede suponerse que para los individuos tratados con la nueva droga la dis-tribución también es normal con media � desconocida. Se desea probar que

73

Page 9: 9 Tests de hipótesis - UNLP

esta media � es menor que el valor �0 = 130: Se seleccionan 26 individuoscon hipertensión, se les administra la nueva droga, y se obtiene una mediamuestral de x = 121:5 mm Hg y una desviación s = 19.2.

Este es un test unilateral. Podemos plantearlo como:

H0 : � = �0 HA : � < �0

o también como:H0 : � � �0 HA : � < �0

para las dos situaciones, planteamos la regla de decisión:

rechazar H0 : � = �0 a favor de HA : � < �0; cuandopn (x� �0)s

< �t�

calculamos el valor del estadístico t =p26 (121:5� 130) =19:2 = �2:257; el

valor crítico es t0:05 = 1.708, entonces como el valor del estadístico es menorque �1:708 se rechaza la hipótesis nula. Podemos ver en la tabla para 25grados de libertad que el valor crítico correspondiente a � = 0:025 es 2.060 yel correpondiente a � = 0:01 es 2.485. Esto signi�ca que si elegimos un nivelde signi�cación � = 0:025 podemos rechazar H0, pero no podríamos hacerlocon nivel � = 0:01: El valor-p está entre 0.01 y 0.025, podemos a�rmar quep < 0:025.

Podemos resumir los diferentes test para la media �, cuando la muestraX1; X2; :::; Xn proviene de una distribución normal con � desconocido comosigue:.

Hipótesis nula: H0 : � = �0Valor del estadístico de prueba: t =

pn (x� �0) =s

Hipótesis alternativa Región de rechazo para un nivel �HA : � > �0 t > t�HA : � < �0 t < �t�HA : � 6= �0 t > t�=2 o t < �t�=2

Realice los ejercicios 6 y 7

Del mismo modo que en la construcción de un intervalo de con�anza,cuando no conocemos la distribución de los datos, si la muestra es su�cien-temente grande, podemos utilizar el teorema del límite central.

74

Page 10: 9 Tests de hipótesis - UNLP

Ejemplo 9.6 Consideremos los datos del ejemplo 8.3, supongamos que sesabe que la concentración media de zinc en el hígado de esa especie de peces,que viven en una área libre de contaminación es de 8.2 �g=g, pero se de-sconoce la forma de esa distribución. ¿Se puede a�rmar, en base a estosdatos, que los peces examinados tienen niveles de zinc mayores que ese valoresperado?

El problema puede plantearse como:

H0 : � = �0 HA : � > �0

y en este caso, como n es grande, podemos aplicar el resultado del teoremadel límite central y usar el estadístico

Z =

�X � �0

�S=pn

ya que, según ese teorema, cuando � = �0 tiene una distribución aproxi-madamente N(0; 1).Entonces podemos de�nir, como siempre, una regla de decisión:

rechazar H0 : � = �0 a favor de HA : � > �0; cuandopn (x� �0)s

> z�

con los datos del ejemplo, x = 9:15 �g=g y s = 1:27 �g=g, reemplazando enel estadístico, obtenemos un valor

p56 (9:15� 8:2) =1:27 = 5:59, vemos en la

tabla de la distribución normal que el valor-p = P (Z > 5:59) < 0:0001, estosigni�ca que hay muy fuerte evidencia para rechazar H0; y se puede rechazarcon cualquier nivel de signi�cación razonable.

Podemos resumir el caso test para la media de una distribución descono-cida, cuando n es grande:

Hipótesis nula: H0 : � = �0Valor del estadístico de prueba: z =

pn (x� �0) =s

Hipótesis alternativa Región de rechazo para un nivel � (aproximado)HA : � > �0 z > z�HA : � < �0 z < �z�HA : � 6= �0 z > z�=2 o z < �z�=2

En este caso el nivel es aproximado, porque no conocemos la distribuciónexacta del estadístico de prueba, sino que estamos utilizando una aproxi-mación.

75

Page 11: 9 Tests de hipótesis - UNLP

Práctica 6

1. Para cada una de las siguientes aseveraciones, diga si es una legítimahipótesis estadística y por qué: (a) H : � > 100 (b) H : x = 45(c) H : s � 0:2 (d) H : � < 18 (e) H : � � 0:01 (donde � es elparámetro de una distribución exponencial)

2. Denotemos por � el verdadero promedio de radiactividad. El valor 5pCi/L (picocuries por litro) se considera como valor de corte entre aguasegura y no segura. ¿Recomendaría usted probar H0 : � 6 5 versusHA : � > 5 o H0 : � = 5 versus HA : � < 5? Explique su razonamiento.(Sugerencia: considere las consecuencias de error de tipo I y tipo IIpara cada posibilidad)

3. La distribución de presiones arteriales diastólicas para la población demujeres diabéticas con edades entre 30 y 34 años se supone normalcon media desconocida y desviación típica � = 9:1 mmHg. Se deseaconocer si la presión diastólica media de esta población es diferente dela de la población general de mujeres de esa edad, �0 = 74:4 mmHg.

(a) Enuncie las hipótesis nula y alternativa y plantee el test corre-spondiente.

(b) Se elige una muestra de diez mujeres diabéticas, cuya presióndiastólica es x = 82 mmHg, cuál es su conclusión con nivel� = 0:05?

(c) Calcule el valor-p

4. Se ha determinado el punto de fusión de 16 muestras de cierta marcade aceite vegetal hidrogenado, resultando x = 94:32. suponga que elpunto de fusión es una v. a. cuya distribución es normal con � = 1:20

(a) ¿Brindan estos datos evidencia para a�rmar que la media delpunto de fusión es menor que 95?

(b) Calcule el p-valor

(c) ¿Cuál sería su conclusión usando un nivel 0:01?

76

Page 12: 9 Tests de hipótesis - UNLP

5. Considerando los datos del ejercicio 7 de la Práctica 5, se desea probarque el nivel medio de hemoglobina de los niños expuestos a niveles altosde plomo es inferior al de la población general, �0 = 11:59 g=100ml.¿Cuál es el menor nivel de signi�cación para el cuál se puede hacer esaa�rmación?¿Cuál es su conclusión?

6. Considerando los datos del ejercicio 9 de la Práctica 5, si se sabe queel valor real del suero es 245,

(a) ¿Se puede a�rmar con nivel � = 0:05; que el procedimiento deanálisis está dando un error sistemático?

(b) De una acotación del valor-p

7. Un artículo reporta los siguientes valores para �ujo térmico del suelode 8 terrenos cubiertos por polvo de carbón:

34.7 35.4 34.7 32.5 28.0 18.4 24.9 37.7

La media de �ujo térmico del suelo para terrenos cubiertos sólo conpasto es 29.0 Si se supone que la diistribción de �ujo térmico es normal,¿sugier la información que el polvo de arbón es e�caz para aumentarla media de �ujo térmico sobre la del pasto?

(a) Establezca y pruebe las hipótesis pertinentes usando � = 0:05.

(b) Acote el p-valor

(c) Si la distribución de �ujo térmico no fuera normal, podría usar elprocedimiento anterior?

8. La ingesta de cinc recomendada para mayores de 50 años es de 15mg=dia. Se seleccionó una muestra de115 hombres entre 65 y 74 añospara los que se determinó la ingesta diaria de cinc y se obtuvo x = 11:3y s = 6:43. No se puede a�rmar nada sobre la distribuciónde la ingestade cinc en la población.

(a) ¿Puede a�rmarse con nivel 0:05 que el promedio de la ingestadiaria de cinc en la población de hombres entre 65 y 74 años esinferior a la recomendación?

(b) Calcule aproximadamente el valor-p

77

Page 13: 9 Tests de hipótesis - UNLP

9. En una investigación de la toxina producida por cierta serpiente ve-nenosa, un investigador preparó 32 frascos diferentes, cada uno con 1g de la toxina, y luego determinó la cantidad de antitoxina necesariapara neutralizar la toxina. Se encontró que la cantidad promedio mues-tral de antitoxina necesaria fue de 1.89 mg, y la desviación estándarmuestral fue de 0.42 mg. Otra investigación anterior indicaba que el ve-radero promedio de cantidad neutralizante era de 1.75 mg/g d toxina.¿Contradice la nueva información el valor sugerido por el investigadoranterior?

10. Se piensa que la incidencia de cierto tipo de defecto de cromosomas enla población de hombres adultos en un país es de 1 en 80. Una muestraaleatoria de 600 individuos de poblacones penales de ese país revela que12 tenían tales defectos. ¿Se puede concluir que la tasa de incidenciade ese defecto en los prisioneros dei�ere de la tasa presupuesta paratoda la población de hombres adultos?

(a) Establezca y pruebe las hipótesis pertinentes usando � = 0:05.¿Qué tipo de error puede cometerse al llegar a una conclusión?

(b) Calcule el valor p. Con base a este valor p, se podría rechazat H0al nivel de signi�cación 0.20?

11. Denotemos por p a la proporción de votantes que están a favor delcandidato A contra el candidato B, en cierta elección. Considere quese desea probarH0 : p = 0:5 versusHA : p 6= 0:5 con base a una muestraaleatoria de 25 votantes. Denotemos por X al número de votantes enla muestra que está a favor del candidato A y representemos con x elvalor observado de X

(a) ¿Cuál de las siguientes regiones de rechazo es más adecuada ypor qué? R1 = fx : x � 7 o x � 18g R2 = fx : x � 8gR3 = fx : x � 17g

(b) En el contexto de la situación de este problema, describa cualesson los errores tipo I y tipo II

(c) ¿Cuál es la distribución de probabilidad del estadístico de pruebaX cuandoH0 es verdadera? Utilícela para calcular la probabilidadde error de tipo I.

78

Page 14: 9 Tests de hipótesis - UNLP

(d) Calcule la probabilidad de error de tipo II cuando p = 0:3, cuandop = 0:4 y cuando p = 0:7

(e) ¿Qué se concluye si 6 de los 25 entrevistados elige al candidato A?

12. La calibración de una báscula debe veri�carse al pesar 25 veces unespecímen de prueba de 10kg. Supongamos que los resultados de difer-entes pesadas son independientes entre si y que el peso en cada intentoes una v. a. con distribución normal con � = 0:2kg. Denotemos por �el verdadero promedio de lectura de peso de la báscula. (si la básculaestá bien calibrada ese debe ser el verdadero valor del especímen quese está pesando)

(a) ¿Cuáles hipótesis deben probarse?

(b) Según el protocolo de control de calibración, la báscula debe reca-librarse cuando x � 10:1032 o x � 9:8968: ¿Cuál es la probabil-idad de que la recalibración se realice cuando en realidad no esnecesaria?

(c) ¿Cuál es la probabilidad de que no se considere necesaria la reca-libración cuando de hecho � = 10:1? ¿Cuándo � = 9:8?

(d) Sea z = (x� 10) =(�=pn): ¿Para qué valor c, es la región de

rechazo de la parte (b) equivalente a la región bilateral jzj > c?(e) Vuelva a expresar el procedimiento de prueba de la parte (b) en

términos del estadístico de prueba Z =�X � 10

�=(�=

pn)

13. Con los datos del ejercicio 4,

(a) ¿cuál es la probabilidad de no poder probar que la media delpunto de fusión es menor que 95 cuando en realidad es 94? ¿cómose llama este tipo de error?

(b) ¿Qué debería hacerse para que la probabilidad calculada en a)fuera menor que 0.10?

79