8
UNIVERSIDAD NACIONAL DE COLOMBIA SEDE MEDELLÍN ESCUELA DE ESTADÍSTICA SEGUNDO TRABAJO Pruebas de Hipótesis (15%) SEM. 01 – 2015 Grupo 5 Nombre Completo Cinthya Mariam Peña Rua D. I. 1’152.203.380 La base de datos con la que le corresponde trabajar, se obtiene como una muestra aleatoria de una gran base de datos. La base original corresponde a la información de 200 estudiantes de la Universidad Nacional Sede Medellín. Dicha base contiene las variables: GENERO (HOMBRE o MUJER), ESTATURA (en cm. del estudiante), EDAD (en años), PAPA (obtenido en el semestre anterior), ESTRATO y TRAB (trabaja SI o NO). Cada pareja debe generar una base de datos, que corresponderá a una muestra de tamaño 60 de la base original. Los datos originales están en el archivo: “base.txt”, el cual está disponible en Moodle. Para hacerlo debe seguir los siguientes pasos: # Procedimiento para generar archivo de datos para el trabajo # Primero leer el archivo de datos. uno <- read.table(file.choose(), header=T) # Copiar el siguiente código en R genera <- function(cedula){ set.seed(cedula) data <- uno[sample(1:200,60),] data } # Para crear la base de datos con la cual trabajara, debe ejecutar la siguiente línea:

Segundo Trabajo R (Estadítica UNAL med)

Embed Size (px)

DESCRIPTION

Estadística I unal

Citation preview

Page 1: Segundo Trabajo R (Estadítica UNAL med)

UNIVERSIDAD NACIONAL DE COLOMBIA SEDE MEDELLÍNESCUELA DE ESTADÍSTICA

SEGUNDO TRABAJO Pruebas de Hipótesis (15%)

SEM. 01 – 2015 Grupo 5

Nombre Completo Cinthya Mariam Peña Rua D. I. 1’152.203.380

La base de datos con la que le corresponde trabajar, se obtiene como una muestra aleatoria de una gran base de datos. La base original corresponde a la información de 200 estudiantes de la Universidad Nacional Sede Medellín. Dicha base contiene las variables: GENERO (HOMBRE o MUJER), ESTATURA (en cm. del estudiante), EDAD (en años), PAPA (obtenido en el semestre anterior), ESTRATO y TRAB (trabaja SI o NO).

Cada pareja debe generar una base de datos, que corresponderá a una muestra de tamaño 60 de la base original. Los datos originales están en el archivo: “base.txt”, el cual está disponible en Moodle. Para hacerlo debe seguir los siguientes pasos:

# Procedimiento para generar archivo de datos para el trabajo# Primero leer el archivo de datos.

uno <- read.table(file.choose(), header=T)

# Copiar el siguiente código en R

genera <- function(cedula){set.seed(cedula)data <- uno[sample(1:200,60),]data}

# Para crear la base de datos con la cual trabajara, debe ejecutar la siguiente línea:

datos <- genera(1152203380)

# cedula representa el número de cedula de uno de los dos integrantes. En el trabajo debe indicar cuál número de cédula usó.

Page 2: Segundo Trabajo R (Estadítica UNAL med)

Con la base ya creada debe resolver las siguientes preguntas:

1. Se tiene la creencia de que la Estatura media de los estudiantes es inferior a 170 cms. ¿Es esto cierto? Justifique su respuesta.Solución:

Las hipótesis a probar son:H0: Las Estaturas se distribuyen Normalmente vsHa: Las Estaturas no se distribuyen Normalmente.Usando el Test de Shapiro-Wilks se tiene:

El Valor p indica que no se puede rechazar H0 y por lo tanto la evidencia muestral es acorde con que las estaturas se distribuyen normalmente.

De acuerdo con el resultado obtenido, se procede a realizar Prueba de Hipótesis para la media de una población Normal con O2X desconocida donde el estadístico de prueba es:

Y la región de rechazo para los valores de p son:

Las hipótesis a probar son:H0: UX = 170Ha: UX <170

El resultado mostrado indica que hay suficiente evidencia para afirmar que la estatura media es inferior a 170 cms, (Esto se concluye porque el valor p es 0.009274, es decir, el error que se comete al rechazar H0 con la información recopilada asumiendo que fuera cierta es muy pequeño y debe rechazarse.

Page 3: Segundo Trabajo R (Estadítica UNAL med)

2. ¿Puede afirmarse que el PAPA promedio de las mujeres es superior al de los Hombres? Justifique su respuesta

Las hipótesis a probar son:H0: Las Estaturas se distribuyen Normalmente vsHa: Las Estaturas no se distribuyen Normalmente.Usando el Test de Shapiro-Wilks se tiene:

Ambas pruebas indican que la distribución de la variable “PAPA” es Normal, sin importar el Género. Puesto que el valor P > 0.05 para ambos casos, no se rechaza la hipótesis nula Ho en ninguno de los casos.

Sean UX y O2X la media y varianza poblacionales del papa para los hombres y sea UY y O2Y la media y varianza poblacionales del papa para las Mujeres.

Las hipótesis a probar son:H0 : UX - UY = 0 Ha : UX - UY > 0

Debido a que se tiene un Valor P grande (P > 0.05), no se puede rechazar H0 y se concluye que la información está más acorde con asumir que las varianzas poblacionales de ambas muestras son iguales, es decir, O2X= O2Y, para cuyo caso el estadístico de prueba es:

Page 4: Segundo Trabajo R (Estadítica UNAL med)

Debido a que se tiene un Valor P grande, no se rechaza H0 y se concluye que la información muestral apoya la afirmación de que el PAPA promedio de las mujeres es superior al de los Hombres. Como se muestra a continuación:

3. ¿Se puede afirmar que el porcentaje de personas que trabajan es inferior al 30%? Justifique su respuesta.

Para este caso, el estadístico de prueba es:

Page 5: Segundo Trabajo R (Estadítica UNAL med)

Las hipótesis a probar son:H0 : p = 0,7Ha : p < 0,7

Zc=(1,2698)^(1/2)=1,126854Vp=(P(Z<1,126854)= 0.870762

Este Valor P indica que la Hipótesis nula No puede ser rechazada y concluir que el porcentaje de estudiantes que No trabajan superior o igual al 70 %.Por tanto, puede afirmarse que el porcentaje de personas que trabajan es inferior al 30%.

4. ¿Puede afirmarse que la distribución de estudiantes por estrato es la que se muestra en la siguiente tabla?

Para el caso, el estadístico de prueba es:

H0 : p1 = 0.05; p2 = 0.15; p3 = 0.38; p4 = 0.28; p5 = 0.08; p6 = 0.06Ha : Alguna de las proporciones ha cambiado

Estrato 1 2 3 4 5 6Proporción 0.05 0.15 0.38 0.28 0.08 0.06

Page 6: Segundo Trabajo R (Estadítica UNAL med)

El Valor P indica que no se puede rechazar H0, por lo que se asume que las proporciones por estratos NO han cambiado.

Consideraciones sobre el trabajo.

1. Para la solución de cada pregunta se deben plantear todas las hipótesis de interés, definir claramente los parámetros a ser utilizados y probar los supuestos que se requieran. Finalmente la conclusión debe hacerse SOLO usando el valor P.

2. El trabajo debe contener máximo 7 páginas incluyendo estas dos páginas de instrucciones.

3. El trabajo debe ser entregado impreso al profesor el día 26 de mayo hasta las 5:00 p.m.

4. La solución a las preguntas deben hacerse SOLO en R (con comando o usando R-Commander).