16
ESTADÍSTICA I Práctico: Unidad 1 – Estadística Descriptiva Mariano Lanza y Carlos Maggi 1. En los siguientes ejemplos, determinar: a) Cuál es la/s variable/s en estudio y de qué tipo son cada una de ellas (discreta, continua, cualitativa, cuantitativa). b) Cuál es la muestra y cuál es la población de la que proviene. 1.1 En el boletín del Instituto de Oceanografía se publicó un trabajo sobre el crecimiento de la dorada en el Mar Menor. El mismo estaba basado en la observación de 135 ejemplares de dicha especie. 1.2 En el vivero se midió la altura de ocho abedules a las tres semanas de darle un determinado fertilizante. 1.3 Se capturaron 30 truchas hembras y se las pesó, luego se determinó el número de huevos que contenían. 1.4 Se realizo una muestra de 30 cerdos tomados de diferentes establecimientos elegidos al azar para determinar la presencia de Triquinosis. 1.5 Se telefoneó a 10 localidades de la comarca andina para informarse sobre el número de enfermos de Hepatitis. 1.6 Se analizaron los saldos de 200 cuentas corrientes de empresas en el Banco R. 1.7 Se realizó un estudio del nivel de ingresos de la población de Bariloche en base a una muestra aleatoria de 5000 residentes. 2. En cada uno de los siguientes estudios decir cuál es la variable en estudio, clasificarla y dar una idea posible de tabulación de la información obtenida 2.1 Se comparó la ganancia de peso de cuatro grupos de cerdos sometidos a tres dietas diferentes y a una dieta normal (control). 2.2 Determinación del número de infectados por muestra. Cada muestra tiene 5 individuos y en total se tienen 100 muestras. 1

385080965.TP01 Estadística Descriptiva

Embed Size (px)

DESCRIPTION

Estadistica Descriptiva

Citation preview

Page 1: 385080965.TP01 Estadística Descriptiva

ESTADÍSTICA I

Práctico: Unidad 1 – Estadística Descriptiva Mariano Lanza y Carlos Maggi

1. En los siguientes ejemplos, determinar:a) Cuál es la/s variable/s en estudio y de qué tipo son cada una de ellas (discreta,

continua, cualitativa, cuantitativa).b) Cuál es la muestra y cuál es la población de la que proviene.

1.1 En el boletín del Instituto de Oceanografía se publicó un trabajo sobre el crecimiento de la dorada en el Mar Menor. El mismo estaba basado en la observación de 135 ejemplares de dicha especie.

1.2 En el vivero se midió la altura de ocho abedules a las tres semanas de darle un determinado fertilizante.

1.3 Se capturaron 30 truchas hembras y se las pesó, luego se determinó el número de huevos que contenían.

1.4 Se realizo una muestra de 30 cerdos tomados de diferentes establecimientos elegidos al azar para determinar la presencia de Triquinosis.

1.5 Se telefoneó a 10 localidades de la comarca andina para informarse sobre el número de enfermos de Hepatitis.

1.6 Se analizaron los saldos de 200 cuentas corrientes de empresas en el Banco R.1.7 Se realizó un estudio del nivel de ingresos de la población de Bariloche en base

a una muestra aleatoria de 5000 residentes.

2. En cada uno de los siguientes estudios decir cuál es la variable en estudio, clasificarla y dar una idea posible de tabulación de la información obtenida

2.1 Se comparó la ganancia de peso de cuatro grupos de cerdos sometidos a tres dietas diferentes y a una dieta normal (control).

2.2 Determinación del número de infectados por muestra. Cada muestra tiene 5 individuos y en total se tienen 100 muestras.

2.3 Relación entre la cantidad de inscriptos y egresados por año en los últimos diez años en una determinada Universidad Nacional.

2.4 Determinación de la fecundidad diaria de dos muestras de 25 hembras de Desophila Melanogaster cada una, estando dada la fecundidad por el número de huevos depositados por hembra y por día durante los primeros 14 días de vida. Cada una de las muestras pertenece a las cepas SS y NS respectivamente.

2.5 Relación entre el ancho y el largo del caparazón de una muestra de tortugas.

3. Una empresa dedicada a la actividad turística está planeando realizar un proyecto de inversión en San Carlos de Bariloche y solicita su asesoramiento para obtener información sobre la situación hotelera de dicho municipio en el año 2009 (Tabla eoh-2009_Bariloche.xls).

Para ello desea saber:a) El valor medio mensual y la varianza de establecimientos hoteleros de 1 y 2

estrellas.b)El valor medio mensual y la varianza de establecimientos “para-hoteleros”.

1

Page 2: 385080965.TP01 Estadística Descriptiva

Para las categorías anteriores (“establecimientos hoteleros de 1 y 2 estrellas” y “para-hoteleros”):c) Determinar el valor medio mensual de plazas disponibles por establecimiento.d)Determinar el valor medio mensual de plazas ocupadas por establecimiento. e) A su vez, la empresa interesada desea saber los siguientes datos:

Porcentaje de Ocupación de las Habitaciones o

Unidades en Establecimientos Hoteleros de 1 y 2

Estrellas

Cantidad de Meses (frecuencia absoluta)

Frecuencia Relativa

[0 – 25)[25 – 50)[50 – 75)[75 -100)

En base a la tabla anterior:f) Realizar el histograma y el polígono de frecuencias.g) Calcular la media, mediana, modo y desvío.h)Determinar el intervalo de las categoríasi) Dado que es un/a excelente conocedor/a de la materia, particularmente de “estadística

descriptiva” ¿cómo sugeriría agrupar los datos de la tabla anterior? Represente dicha tabla teniendo en cuenta que deseamos presentar los datos en 3 clases.

En base a la tabla del acápite (i): j) Realizar el histograma, el polígono de frecuencias y la ojiva.k)Calcular la media, mediana, modo y desvío.l) Determinar la amplitud de variación de la distribuciónm) Definir el tipo de asimetría que presenta la distribución.n) Definir el tipo de Curtosis que presenta la distribución.o) Calcular el valor del percentil 60.p) Calcular el valor del decil 8.q)Calcular el valor del 1º cuartil.

4. Una consultoría ha realizado una pequeña encuesta acerca del tipo de conexión a Internet que posee un grupo de 100 personas, cuyas respuestas han sido las siguientes:

Adsl Inalámbrica Telefónica Cable modem42 30 16 12

a) Realice el histograma de frecuencias absolutas simples y relativas.b) ¿Qué proporción de usuarios utiliza Adsl o Inalámbrica?

5. En una empresa de Servicios Informáticos se obtuvieron los siguientes valores, que representan las edades de 10 empleados de la misma:

29 56 34 27 32 26 31 32 28 58

a) Calcular las medidas de centralización (media aritmética, mediana y moda)b) ¿Cuál de las tres medidas es la menos representativa de los datos? ¿Por qué?c) Calcular el desvío típico (o estándar) y la varianza

2

Page 3: 385080965.TP01 Estadística Descriptiva

d) Interpretar el significado del desvío en el problema.

6. Los datos siguientes corresponden al número de ordenadores portátiles vendidos trimestralmente por distintas tiendas informáticas de una franquicia:

12 18 35 35 36 36 37 37 38 38 38 3838 39 39 39 39 40 40 41 41 42 42 47

a) Realice una tabla simple de frecuencias

b) Determine el numero medio, modal y mediano del numero de portátiles vendidos trimestralmente por una tienda de esta franquicia. Interprete cada una.

c) La franquicia quiere premiar al 25% de las tiendas que mas ventas tengan en portátiles. ¿Cuál será el número de portátiles a vender por una tienda para beneficiarse de este premio?

d) Calcule el coeficiente de variación e interprete el resultado.

7. Se ha controlado la capacidad en Gb. de 50 PCs, obteniéndose los siguientes resultados:

a) Hallar la media aritmética.NOTA: Al cargar la planilla, emplear una columna para los límites inferiores y otra para los superiores, a fin de poder usarlos para los cálculos necesarios.b) Hallar el desvío y la varianza.c) Construir el histograma de frecuencias.d) ¿Qué porcentaje de PC’s tienen una capacidad inferior a 61 Gb?e) ¿Qué porcentaje de PC’s tienen una capacidad superior a 40 Gb?f) ¿Qué porcentaje de PC’s tienen una capacidad entre 41 y 80 Gb?

8. Las siguientes medidas corresponden a los tiempos de respuesta en un sistema Cliente/Servidor para 50 peticiones de datos:

Tiempo (segundos)

a) Confeccionar la tabla de frecuencias absolutas, relativas, acumuladas y relativas acumuladas.

b) Calcular la media, mediana y moda.c) Histograma de frecuencias.d) Histograma de frecuencias relativas.e) Ojiva creciente.

Capacidad (Gb) NúmeroDe 1 a 20 6De 21 a 40 10De 41 a 60 20De 61 a 80 9De 81 a 100 5

1,56 1,59 1,63 1,62 1,47 1,57 1,60 1,54 1,56 1,651,61 1,59 1,51 1,62 1,50 1,62 1,59 1,62 1,54 1,621,53 1,49 1,57 1,54 1,68 1,52 1,62 1,59 1,49 1,531,59 1,58 1,57 1,47 1,65 1,53 1,59 1,56 1,54 1,641,55 1,59 1,53 1,56 1,58 1,52 1,63 1,56 1,62 1,53

3

Page 4: 385080965.TP01 Estadística Descriptiva

f) Ojiva decreciente.g) Ojiva creciente porcentual.h) Ojiva decreciente porcentual.

9. La siguiente información corresponde a la cantidad de infracciones de tránsito diarias durante 30 días en S. C. de Bariloche.

7, 5, 8, 6, 7, 4, 3, 6, 7, 9, 10, 6, 7, 5, 9, 4, 7, 5, 8, 9, 7, 6, 8, 5, 8, 7, 7, 8, 8, 6

a) Indique unidad estadística. Defina la variable en estudio, tipo y campo de variación.

b) Construya la tabla de frecuencia.c) Grafique las distribuciones halladas.d) Calcule analíticamente la media, modo y mediana. Interprete.e) Calcule e interprete el intervalo ; . Donde s(x) es el desvío

típico.f) Calcule e interprete el Q1

10. La fabricación de arandelas de distinto diámetro presenta la siguiente distribución diaria:

Diámetro en mm Cantidad de Arandelas[5;10) 500[10;15) 1200[15; 20) 1500[20;25) 2000[25;30) 1800[30;35) 600[35;40) 400

a) Calcular la media aritmética.b) Calcular la mediana y el modo.c) Calcular la varianza y desviación típica.

11. Los siguientes datos corresponden al salario mensual (en $) de un grupo de 50 obreros:

153 134 146 138 132 137 143 125 145 145123 131 148 122 138 120 144 139 138 124131 142 135 146 137 126 138 136 141 143132 134 152 137 142 117 137 144 128 137141 148 128 151 138 136 138 140 133 132

a) Calcular las medidas de centralización.b) ¿Cuál de las tres medidas es la menos representativa de los datos? ¿Por qué?c) Calcular el desvío estándar y la varianza.d) Calcule Q1 y Q3. Interprete el intervalo [Q1 ; Q3]e) Calcule el salario promedio mensual de los trabajadores suponiendo un aumento

de $30 en el sueldo de cada uno de ellos. f) Ídem al punto anterior suponiendo un aumento del 25% sobre los sueldos

originales.g) Si otro grupo de obreros tiene un sueldo mensual promedio de 120$ y un desvío

típico de 9$. Cuál de los dos grupos es más homogéneo. ¿Por qué?

4

Page 5: 385080965.TP01 Estadística Descriptiva

h) Realice el cuadro de frecuencias, pero agrupando los datos según los criterios vistos.

i) Para los datos agrupados, calcular la media, mediana y moda.j) Grafique el Histograma para las frecuencias simples de los datos agrupados.

12. Un odontólogo atendió la siguiente cantidad de pacientes diarios durante los últimos 10 días:

18 11 15 14 9 20 17 14 12 16

a) Definir unidad estadística y la variable en estudio. b) Calcular e interpretar: el modo, la mediana y la media.c) Calcular: la variancia y el desvío estándar.

13. Los siguientes datos representan el número de bovinos que nacieron vivos en 30 estancias de Chubut:

20 21 22 23 21 24 23 24 22 22 22 23 21 23 2223 23 22 24 24 25 25 23 21 25 20 20 24 22 23

a) Indique unidad estadística. Defina la variable en estudio, tipo y campo de variación.b) Construir la tabla de frecuencias. Representar.c) Calcular e interpretar: el modo, la mediana, la media.d) Calcular: la variancia y el desvío estándar.e) Determine el tipo de asimetría de la distribución.

14. Una empresa de taxis registró los siguientes kilometrajes recorridos por sus 8 automóviles para cubrir viajes, en la sucursal de la zona A, durante el último mes:

5516 7820 3010 8294 5232 5780 6548 4500

El titular de la empresa opina que el rendimiento de dicha sucursal es algo irregular y que podría ser optimizado lanzando una campaña publicitaria en dicha zona. Para comparar se basa en los registros de la sucursal B, que el mes pasado arrojó un promedio de 7600 km y un desvío estándar de 1200 km.

a) Indique cuál de las dos sucursales tiene kilometraje más homogéneos y si la opinión del titular es aceptable.

15. En un estudio realizado en una colonia de vacaciones se registró el ingreso diario de turistas en un período. Los datos fueron ordenados en la siguiente tabla:

N0 turistas 50-55 55-60 60-65 65-70 70-75 75-80 80-85N0 de días 4 6 18 13 8 6 5

a) En cuántos días se registró un ingreso de cómo máximo 75 turistas?b) En qué porcentaje de días se registró un ingreso superior a 65 turistas?c) Calcule el promedio y el desvío estándar. d) Calcule la mediana. Interprete.e) Calcule el intervalo [Q1; Q3]. Interprete.f) Calcule el modo. Interprete.

5

Page 6: 385080965.TP01 Estadística Descriptiva

g) Cuál es el valor de la variable superado por el 20% de las observaciones.h) Determine el tipo de asimetría de la distribución.

16. - De una muestra hecha a 50 familias, se sabe que 5 de ellas tiene un solo hijo, que 8 de ellas tiene a lo sumo un hijo, que 8 de ellas tiene por lo menos 5 hijos, que ninguna de ellas tiene m ás de 6 hijos, que el 12% de ellas tiene 5 hijos, que 33 familias tiene menos de 4 hijos, que el 38% tiene no más de 2hijos, Construya la tabla de frecuencia.

17. Representar mediante un diagrama de caja la siguiente información que corresponde a pulsaciones cardíacas de 42 personas participantes de un programa de entrenamiento:

52 56 60 60 92 7869 60 60 60 76 7664 64 64 64 78 7864 64 66 66 80 8466 66 66 72 88 7872 72 72 72 78 8472 72 72 78 80 80

18. Analice, en los siguientes casos, la variación conjunta de las componentes de las variables bidimensionales a través del coeficiente “covarianza” y correlación.

Espesor de la cáscara de naranjas y contenido de jugo de las mismas (en cm3)

a) Construya la tabla de desvíos y productos de desvíosb) Calcule la covarianza por definición. Interprete.c) Grafique los datos en un diagrama de dispersión.d) Confeccione la tabla de contingencia para los datos

19. La siguiente tabla corresponde al salario de los empleados de una agencia de viajes y la cantidad de años que lleva en servicio.

a) Defina la unidad estadística, la variable en studio y el tipo y campo de variación.b) Confecciner la tabala de contingenciac) Calcular la covarianza.

Salario \ Antigüedad [0 – 5) [5 – 10) [10 – 15) [15 – 20) [20 o más

[300 – 400) 10 9 3 2 1

[400 – 500) 6 12 13 6 2

[500 – 600) 1 5 12 5 3

[600 o más 2 3 2 2 1

Orden observ.(i) 1 2 3 4 5 6 7 8 9 10Espesor (X en mm) 7 6 5 6 5 6 4 3 2 2Jugo ( Y en cm3) 2 3 4 5 5 5 6 6 7 9

6

Page 7: 385080965.TP01 Estadística Descriptiva

20. Los siguientes diagramas de caja corresponden la resistencia a la compresión de cuatro diferentes técnicas de mezclado en la elaboración de hormigón. a) Analice el diagrama de cada técnica y describa cada una de ellas. Tenga en cuenta:

posición, dispersión y simetría. Utilice los diagramas para comparar las técnicas

entre síb) Indique las similitudes y diferencias que observa en las diferentes técnicas de

mezclado. Los siguientes diagramas de caja corresponden el efecto de las burbujas de aire sobre la resistencia del asfalto. Las burbujas se controlan en tres niveles: bajo, medio y alto. a) Ídem inciso a) del ejercicio anterior. b) Ídem inciso b) del ejercicio anterior.

7

Page 8: 385080965.TP01 Estadística Descriptiva

EJERCICIOS OPCIONALES

1. Se desea saber sobre la intensidad con que trabaja una estación de comunicación. Para ello se realizó una muestra aleatoria, donde se obtuvieron los siguientes datos expresados como bytes/minuto :

56 58 53 74 2747 40 101 57 7251 67 31 52 2144 49 27 63 43

En función de ello se dese saber:a) El valor medio de bytes/minuto. b) La mediana c) El rango de variabilidad d) La varianza y coeficiente de variación

2. De los datos del ejercicio anterior:a) confeccione la siguiente tabla de frecuencias

IntervalosFrecuencia Absoluta

fi

Frecuencia Absoluta

acumuladafac

Frecuencia Relativafi en %

Frecuencia relativa

Acumulada fac en %

[ 20 - 34 ][ 35 - 49 ]

[ 50 - 64 ]

[ 65 - 79 ]

[ 80 - 94 ]

[ 95 - 109 ]

b) Realice el Histograma y el polígono de frecuencias para los datos agrupados. c) Completar el siguiente cuadro:

IntervalosValor medio del

intervalo(xmi)

Frecuencia Absoluta

fi

(xmi)* fi

Frecuencia relativa

Acumuladafac en %

[ 20 - 34 ][ 35 - 49 ][ 50 - 64 ][ 65 - 79 ][ 80 - 94 ][ 95 - 109 ]

d) Obtener la media muestral para los daos agrupados:e) Calcular la varianza muestral para datos agrupadosf) Determinar el intervalo que contiene la mediana: g) Obtener la Mediana para los datos agrupados: h) Determinar el intervalo modal (aquel que contiene el modo): i) Obtener el modo: j) ¿Cuál es el valor del tercer cuartil?k) ¿Cuál es el valor del séptimo decil?l) ¿Cuál es el valor del percentil 60?

8

Page 9: 385080965.TP01 Estadística Descriptiva

3. Una empresa desea analizar el amperaje máximo que soporta un tipo de resistencia que es suministrada por un proveedor. Para ello se sometieron a prueba diez unidades cuyos resultados arrojaron lo siguiente:

1,87 A 1,52 A 2 A 1,55 A 1,85 A1,71 A 1,68 A 1,78 A 1,56 A 1,6 A

Obtener:a) Calcular la media muestralb) Calcular la medianac) Obtener la varianzad) Calcular el coeficiente de variación.

4. De los datos del ejercicio anterior, a) completar el siguiente cuadro:

IntervalosFrecuencia Absoluta

fi

Frecuencia Absoluta

acumuladafac

Frecuencia Relativafi en %

Frecuencia Acumulada

Relativa fac en %

[ 1,5A - 1,6A )[ 1,6A - 1,7A )[ 1,7A - 1,8A )[ 1,8A - 1,9A )[ 1,9A - 2 A )[ 2 A - 2,1A )

Para los datos agrupados, obtener:b) La media muestral: c) La varianza muestral: d) Determinar el intervalo que contiene la mediana: e) Obtener la Mediana.

5. Se realizó un examen parcial a 44 alumnos cuyos resultados se exponen en el siguiente cuadro de frecuencias. a) Rellenar las columnas vacías b) Calcular la media, mediana y modo

Nota (X)

Cantidad de

alumnos (fi)

1 22 53 74 145 66 57 28 09 210 1

9

Page 10: 385080965.TP01 Estadística Descriptiva

Suma

Donde: x = Nota de Examen; fi = frecuencia absoluta

= media poblacional c) Calcular la varianza, el desvío y el coeficiente de variación.d) Calcular la asimetría mediante el coeficiente Pearson y tipificar la mismae) ¿Cuál es el valor del segundo cuartil?f) ¿Cuál es el valor del sexto decil?g) ¿Cuál es el valor del percentil 75?

6. Se desea comparar el impacto en la emisión de dióxido de azufre (SO2) entre dos procesos productivos. Para ello se realizaron muestras de aire en cada proceso, obteniéndose los siguientes datos (en ppm):

Proceso A Proceso B12,88 13,8710,99 11,7214,75 12,678,23 10,67

10,57 6,1810,11 3,2213,15 5,8212,91 24,7411,34 6,2415,97 18,33

Los resúmenes estadísticos en ambos proceso son los siguientes:

Proceso A Proceso B 

Media 12,09 Media 11,35Error típico 0,73 Error típico 2,07Mediana 12,11 Mediana 11,20Desviación estándar 2,30 Desviación estándar 6,55Varianza de la muestra 5,28 Varianza de la muestra 42,92Curtosis -0,23 Curtosis 0,55Coeficiente de asimetría 0,10 Coeficiente de asimetría 0,88Rango 7,75 Rango 21,52Mínimo 8,23 Mínimo 3,22Máximo 15,97 Máximo 24,74Suma 120,90 Suma 113,47Cuenta 10,00 Cuenta 10,00Cuartil 1 10,67 Cuartil 1 6,20Cuartil 3 13,09 Cuartil 3 13,57

En base a la información disponible realizar los diagrama de caja de cada proceso.

7. Una empresa de colectivos urbanos registró la cantidad de pasajeros transportados durante 50 viajes; con el siguiente resultado:

10

Page 11: 385080965.TP01 Estadística Descriptiva

55 54 55 55 54 53 55 52 53 5354 52 55 57 55 56 56 56 55 5652 55 53 58 56 59 55 55 53 5554 54 54 56 55 54 55 54 53 5453 55 53 53 54 56 57 53 54 55

a) Calcular las medidas de centralización (media, mediana y moda).b) ¿Cuál de las tres medidas es la menos representativa de los datos? ¿Por qué?c) Calcular el desvío estándar y la varianza.d) Interpretar el significado del desvío en el problema.e) Calcular las frecuencias simples y relativas f) Calcular las frecuencias acumuladas simples y relativas g) Realizar el histograma y polígono de frecuencias para las frecuencias relativas.

8. Un avión realiza un viaje entre dos ciudades en un tiempo promedio de 3 hs con un desvío estándar de 0.5 hs. Un tren realiza el mismo trayecto con un promedio de 24 hs. con un desvío estándar de 1.2 hs. ¿Cuál de los dos medios de transporte es más puntual?.

9. La tabla siguiente muestra el gasto semanal en fotocopias (en centavos) de 70 secundarios del mismo colegio.

15 210 350 525 50 210 360 550 100 215 370 550 110 215 380 575115 215 400 600 115 220 410 600 115 220 410 650 120 225 430 700 125245 455 700 140 250 475 730 140 250 480 760 150 275 500 800 150 280 500 900 165 280 500 1000 175 285 510 1000 185 300 510 1190 200300 520 200 325 520

a) Calcular media, desvío estándar, cuartiles y el rango intercuartílico.b) Construir un diagrama de cajas.c) Hacer un histograma de los datos.

10. Una empresa fracciona azúcar en bolsas y sachets. Las bolsas tienen un peso promedio de 50 Kg. con un desvío estándar de 0.5 kg.; y los sachets tiene un peso promedio de 5 gs. con un desvío de 0.9 gs. Cuál de los dos procesos es más variable?.

11. Los datos de una muestra de sueldos anuales de profesores y médicos de cierta ciudad dan los siguientes resultados: para los profesores un promedio de 1600$ y un desvío estándar de 200$; y para los médicos un promedio de 2300$ y un desvío estándar de 400$. Cuales son los sueldos que tienen más variabilidad.?

12. Si la media y la desviación estándar calculadas de una muestra grande cuya distribución es aproximadamente simétrica son 10 y 3 respectivamente; use la regla empírica para responder lo siguiente:a) ¿Qué porcentaje de las mediciones se encuentran entre 7 y 10 inclusive?b) ¿Qué porcentaje de las mediciones son mayores que 16?c) ¿Y menores que cuatro?

11