Upload
yohana-bonilla-gutierrez
View
86.368
Download
5
Embed Size (px)
DESCRIPTION
Solución a problemas típicos de estadística descriptiva usando hojas de cálculo de Excel.
Citation preview
Yohana Bonilla G. Página 1
TALLER No 1 ESTADISTICA DESCRIPTIVA
1. Dada la lista de puntuaciones en una prueba de Sistemas en los siguientes datos y utilizando un intervalo
de clase de 5, establecer una distribución de frecuencia. Empezar el intervalo inferior de clase con una
puntuación de 35. Graficar las distribuciones absolutas y acumuladas. Encontrar la Media, Mediana,
Moda, la Desviación Estándar, coeficientes de: Variación, de Asimetría y Curtosis.
59 48 53 47 57 64 62 62 65 57 57 81 83
48 65 76 53 61 60 37 51 51 63 81 60 77
71 57 82 66 54 47 61 76 50 57 58 52 57
40 53 66 71 61 61 55 73 50 70 59 50 59
69 67 66 47 56 60 43 54 47 81 76 69
Solución:
a. Tabla de distribución de Frecuencias para los datos agrupados
Intervalo Frecuencia (absoluta)
f
35-39 1
40-44 2
45-49 6
50-54 11
55-59 12
60-64 11
65-69 8
70-74 4
75-79 4
80-84 5
b. Distribuciones de frecuencia absoluta y acumulada
Intervalos Frecuencia f
Frecuencia acumulada FI
35-39 1 1
40-44 2 3
45-49 6 9
50-54 11 20
55-59 12 32
60-64 11 43
65-69 8 51
70-74 4 55
75-79 4 59
80-84 5 64
y mayor... 0
Yohana Bonilla G. Página 2
Gráfico: Distribución de frecuencia absoluta.
Gráfico: Distribución de frecuencia acumulada.
c. Media :
60,453 Mediana: 59,5 Moda: 57
Desviación estándar s:
Coeficiente de variación:
1 2
6
11 12
11
8
4 4 5
0 0
2
4
6
8
10
12
14
35-39 40-44 45-49 50-54 55-59 60-64 65-69 70-74 75-79 80-84 y mayor...
Fre
cue
nci
a
Intervalos
Distribución de frecuencia absoluta Frecuencia
1 3
9
20
32
43
51 55
59 64
0
10
20
30
40
50
60
70
35-39 40-44 45-49 50-54 55-59 60-64 65-69 70-74 75-79 80-84
Fre
cue
nci
a ac
um
ula
da
Intervalos
Distribución de frecuencia acumulada
Frecuencia acumulada
d. Asimetría:
0,29252031
Curtosis:
-0,36653649
Yohana Bonilla G. Página 3
Coeficiente de asimetría:
En este caso tenemos Asimetría positiva de los datos.
Curtosis:
2. Dada una lista de puntuaciones, cada una de las cuales es el porcentaje de palabras consideradas
agradables por una persona (Coeficientes de Afectividad) entre 64 palabras, elaborar una distribución de
frecuencia haciendo la mejor elección de intervalo de clase y límite de clase.
43 62 52 48 46 65 43 48 52 51 57 48 48
38 42 44 46 43 35 42 45 45 44 46 40 40
47 52 38 51 45 38 51 40 46 45 54 55 41
50 59 42 39 56 44 43 47 51 43 50 34 40
53 42 31 44 51 43 48 41 43 48 41 55
Calcule la media aritmética, la mediana y la moda
Calcule la desviación estándar y los coeficientes de: Variación, Asimetría y Curtosis
Solución:
a. Empezaremos por presentar los datos ordenados de menor a mayor en una tabla:
Tabla de datos ordenados menor a mayor, (64 datos)
No. Datos No. Datos
1 31 33 45
2 34 34 46
3 35 35 46
4 38 36 46
5 38 37 46
6 38 38 47
7 39 39 47
8 40 40 48
9 40 41 48
10 40 42 48
11 40 43 48
12 41 44 48
13 41 45 48
14 41 46 50
15 42 47 50
16 42 48 51
17 42 49 51
Yohana Bonilla G. Página 4
18 42 50 51
19 43 51 51
20 43 52 51
21 43 53 52
22 43 54 52
23 43 55 52
24 43 56 53
25 43 57 54
26 44 58 55
27 44 59 55
28 44 60 56
29 44 61 57
30 45 62 59
31 45 63 62
32 45 64 65
Si se tienen N datos u observaciones podemos usar la fórmula de Sturges que propone tomar como número k
de intervalos el valor:
En este caso N=64
Tomaremos 7 intervalos.
Para determinar la amplitud o intervalo de clase que llamaremos a sabemos que:
Para nuestros datos:
Con k=7 y la amplitud a=5 generamos la siguiente distribución de frecuencias:
Intervalo Frecuencia
1. 31-35 3
2. 36-40 8
3. 41-45 22
4. 46-50 14
5. 51-55 12
6. 56-60 3
7. 61-65 2
Yohana Bonilla G. Página 5
Y graficamos la distribución a partir de la tabla anterior:
b.
Media
46,15625
Mediana
45
Moda
43
c.
Desviación estándar
6,508160323
Asimetría
0,473309993
Curtosis
0,553124035
3. Representar un polígono de frecuencia y un histograma para la distribución de puntuaciones de aptitud
para la química de un curso de primer año.
Sacar conclusiones referentes a estos datos según se presenten los gráficos y además, graficar las
frecuencias relativas acumuladas.
Puntuaciones Frecuencias
90 – 94 4
85 – 89 10
80 – 84 14
75 – 79 19
70 – 74 32
65 – 69 31
3
8
22
14 12
3 2
0
5
10
15
20
25
31-35 36-40 41-45 46-50 51-55 56-60 61-65
Fre
cue
nci
a
Intervalo
Distribución de frecuencia absoluta
Frecuencia
Yohana Bonilla G. Página 6
60 – 64 40
55 – 59 28
50 – 54 29
45 – 49 21
40 – 44 18
35 – 39 10
30 – 34 6
25 – 29 1
20 – 24 3
Calcule la media aritmética, la mediana y la moda
Calcule la desviación estándar y los coeficientes de: Variación, Asimetría y Curtosis
Solución:
a. Total de datos N=266
Puntuaciones Frecuencias
Frecuencia
acumulada
(Fi)
Frecuencia
relativa
acumulada=Fi/N
20 – 24 3 3 0,0113
25 – 29 1 4 0,0150
30 – 34 6 10 0,0376
35 – 39 10 20 0,0752
40 – 44 18 38 0,1429
45 – 49 21 59 0,2218
50 – 54 29 88 0,3308
55 – 59 28 116 0,4361
60 – 64 40 156 0,5865
65 – 69 31 187 0,7030
70 – 74 32 219 0,8233
75 – 79 19 238 0,8947
80 – 84 14 252 0,9474
85 – 89 10 262 0,9850
90 – 94 4 266 1,0000
Total de datos
N 266
Yohana Bonilla G. Página 7
3 1
6 10
18 21
29 28
40
31 32
19
14 10
4
0
5
10
15
20
25
30
35
40
45
20 – 24 25 – 29 30 – 34 35 – 39 40 – 44 45 – 49 50 – 54 55 – 59 60 – 64 65 – 69 70 – 74 75 – 79 80 – 84 85 – 89 90 – 94
Fre
cue
nci
as
Puntuaciones
Histograma
Frecuencias (f)
3 1
6
10
18 21
29
28
40
31 32
19
14
10
4 0
5
10
15
20
25
30
35
40
45
20 – 24 25 – 29 30 – 34 35 – 39 40 – 44 45 – 49 50 – 54 55 – 59 60 – 64 65 – 69 70 – 74 75 – 79 80 – 84 85 – 89 90 – 94
Fre
cue
nci
as
Puntuaciones
Polígono de frecuencias
Frecuencias …
Yohana Bonilla G. Página 8
b.
Media aritmética para datos agrupados:
es la frecuencia de cada clase.
es el punto medio de cada clase.
es el número total de datos igual a la suma de las frecuencias de todas las clases.
Para calcularla usamos la siguiente tabla:
Puntuaciones
(Clase) Frecuencias
(f)
Punto
medio
(M)
f.M
20 – 24 3 22 66
25 – 29 1 27 27
30 – 34 6 32 192
35 – 39 10 37 370
40 – 44 18 42 756
45 – 49 21 47 987
50 – 54 29 52 1508
55 – 59 28 57 1596
60 – 64 40 62 2480
65 – 69 31 67 2077
70 – 74 32 72 2304
75 – 79 19 77 1463
0,0113 0,0150 0,0376 0,0752
0,1429
0,2218
0,3308
0,4361
0,5865
0,7030
0,8233 0,8947
0,9474 0,9850 1,0000
0,0000
0,1000
0,2000
0,3000
0,4000
0,5000
0,6000
0,7000
0,8000
0,9000
1,0000
20 – 24 25 – 29 30 – 34 35 – 39 40 – 44 45 – 49 50 – 54 55 – 59 60 – 64 65 – 69 70 – 74 75 – 79 80 – 84 85 – 89 90 – 94
Frec
uen
cia
rela
tiva
acu
mu
lad
a
Puntuaciones
Frecuencia relativa acumulada
Frecuencia relativa …
Yohana Bonilla G. Página 9
80 – 84 14 82 1148
85 – 89 10 87 870
90 – 94 4 92 368
Totales 266 16212
Mediana para datos agrupados:
Para calcular la mediana usamos la tabla de frecuencias acumuladas.
La clase mediana es la clase cuya frecuencia es mayor o igual que N/2.
Donde N siempre denota el número de datos o suma de frecuencias absolutas.
La mediana puede determinarse entonces como:
En donde:
es el límite inferior de la clase de la mediana.
es la frecuencia acumulada de la clase anterior a la clase mediana
es la frecuencia absoluta de la clase mediana.
es la amplitud o Intervalo de Clase.
Yohana Bonilla G. Página 10
Tabla para calcular la mediana
Moda para datos agrupados:
Moda para datos agrupados:
Ya que por definición la moda es la observación que ocurre con mayor frecuencia, se hallará en la
clase que tenga la mayor frecuencia, llamada la clase modal.
Para estimar la moda en el caso de datos agrupados, se utiliza la fórmula:
En donde:
es el límite inferior de la clase modal.
es la diferencia entre la frecuencia de la clase modal y la clase anterior.
es la diferencia entre la frecuencia de la clase modal y la clase siguiente.
es el intervalo de clase.
De la tabla inmediatamente anterior usada para calcular la Mediana, tenemos que
Puntuaciones Frecuencias
Frecuencia
acumulada
(Fi)
20 – 24 3 3
25 – 29 1 4
30 – 34 6 10
35 – 39 10 20
40 – 44 18 38
45 – 49 21 59
50 – 54 29 88
55 – 59 28 116
60 – 64 40 156
65 – 69 31 187
70 – 74 32 219
75 – 79 19 238
80 – 84 14 252
85 – 89 10 262
90 – 94 4 266
Total de datos
N 266
Clase mediana:
frecuencia acumulada 156
Lmed= 60
F=116
fmed= 40
a=5
Yohana Bonilla G. Página 11
c. Desviación estándar para los datos agrupados:
Usamos los resultados anteriores obtenidos para y y los puntos medios :
Puntuaciones
(Clase)
Frecuencias
(f)
Punto
medio
(M)
f.M^2
20 – 24 3 22 1452
25 – 29 1 27 729
30 – 34 6 32 6144
35 – 39 10 37 13690
40 – 44 18 42 31752
45 – 49 21 47 46389
50 – 54 29 52 78416
55 – 59 28 57 90972
60 – 64 40 62 153760
65 – 69 31 67 139159
70 – 74 32 72 165888
75 – 79 19 77 112651
80 – 84 14 82 94136
85 – 89 10 87 75690
90 – 94 4 92 33856
Totales 266 1044684
Coeficiente de variación CV:
Asimetría:
La asimetría puede medirse mediante el Coeficiente de Karl Pearson
En este caso la distribución será asimétrica negativa.
Yohana Bonilla G. Página 12
Curtosis:
Para datos agrupados en intervalos se emplea la siguiente fórmula:
4. Para decidir acerca del número de mostradores de servicio que serán necesarios en las tiendas que se
construirán en el futuro, una cadena de supermercados quería obtener información sobre el tiempo (en
minutos) requerido para atender a los clientes. Para obtener información acerca de la distribución de los
tiempos de atención a los clientes, se obtuvo una muestra de 60 clientes y se anotó el tiempo empleado en
atender a cada uno de ellos.
3.6 1.9 2.1 0.3 0.8 0.2 1.0 1.4 1.8 1.6 1.1 1.8
0.3 1.1 0.5 1.2 0.6 1.1 0.8 1.7 1.4 0.2 1.3 3.1
0.4 2.3 1.8 4.5 0.9 0.7 0.6 2.8 2.5 1.1 0.4 1.2
0.4 1.3 0.8 1.3 1.1 1.2 0.8 1.0 0.9 0.7 3.1 1.7
1.1 2.2 1.6 1.9 5.2 0.5 1.8 0.3 1.1 0.6 0.7 0.6
Construya un histograma de frecuencias relativas para estos datos.
Qué fracción de los tiempos de atención es menor o igual que un minuto?
Calcule la media aritmética, la mediana y la moda
Calcule la desviación estándar y los coeficientes de: Variación, Asimetría y Curtosis
Solución:
a. Presentamos los datos ordenados de menor a mayor:
Tabla de datos de tiempo de atención.
No. Datos No. Datos No. Datos
1 0,20 21 0,80 41 1,60
2 0,20 22 0,90 42 1,60
3 0,30 23 0,90 43 1,70
4 0,30 24 1,00 44 1,70
5 0,30 25 1,00 45 1,80
6 0,40 26 1,10 46 1,80
7 0,40 27 1,10 47 1,80
8 0,40 28 1,10 48 1,80
9 0,50 29 1,10 49 1,90
10 0,50 30 1,10 50 1,90
11 0,60 31 1,10 51 2,10
12 0,60 32 1,10 52 2,20
13 0,60 33 1,20 53 2,30
14 0,60 34 1,20 54 2,50
15 0,70 35 1,20 55 2,80
16 0,70 36 1,30 56 3,10
17 0,70 37 1,30 57 3,10
18 0,80 38 1,30 58 3,60
Yohana Bonilla G. Página 13
19 0,80 39 1,40 59 4,50
20 0,80 40 1,40 60 5,20
Los dividimos en 8 intervalos de clase 7:
Clase Frecuencia
f Frecuencia
relativa=f/N=f/60
0,2-0,8 21 0,350
0,9-1,5 19 0,317
1,6-2,2 12 0,200
2,3-2,9 3 0,050
3,0-3,6 3 0,050
3,7-4,3 0 0,000
4,4-5,0 1 0,017
5,1-5,7 1 0,017
Total 60
b. De la Tabla de datos de tiempo de atención es claro que hay 25 datos de tiempo, menores o iguales
a un minuto.
Por lo tanto la fracción de los tiempos de atención menor o igual que un minuto es:
0,350 0,317
0,200
0,050 0,050
0,000 0,017 0,017
0,000
0,050
0,100
0,150
0,200
0,250
0,300
0,350
0,400
0,2-0,8 0,9-1,5 1,6-2,2 2,3-2,9 3,0-3,6 3,7-4,3 4,4-5 5,1-5,7
Fre
cue
nci
a re
lati
va
Clase
Frecuencia relativa
Frecuencia relativa
Yohana Bonilla G. Página 14
c. Media aritmética
Mediana: 1,10
Moda: 1,10
d. Desviación estándar:
Coeficiente de variación:
Asimetría:
Curtosis:
5. En la siguiente tabla se muestra el tiempo transcurrido (en meses) entre la aparición de una enfermedad y
su recurrencia, para 50 pacientes.
2.1 4.4 2.7 32.3 9.9 9.0 2.0 6.6 3.9 1.6 14.7 9.6 16.7 7.4
8.2 19.2 6.9 4.3 3.3 1.2 4.1 18.4 0.2 6.1 13.5 7.4 0.2 8.3
0.3 1.3 14.1 1.0 2.4 2.4 18.0 1.6 3.5 11.4 18.0 26.7 3.7 12.6
23.1 5.6 0.4 8.7 24.0 1.4 8.2 5.8
Construya un polígono de frecuencias relativas para estos datos.
Obtenga la fracción de los tiempos de recurrencia menores o iguales que 10.
Calcule la media aritmética, la mediana y la moda
Calcule la desviación estándar y los coeficientes de: Variación, Asimetría y Curtosis
Solución:
a.
Yohana Bonilla G. Página 15
Tabla de Datos ordenados de menor a mayor
No. Datos No. Datos
1 0,2 26 6,6
2 0,2 27 6,9
3 0,3 28 7,4
4 0,4 29 7,4
5 1,0 30 8,2
6 1,2 31 8,2
7 1,3 32 8,3
8 1,4 33 8,7
9 1,6 34 9,0
10 1,6 35 9,6
11 2,0 36 9,9
12 2,1 37 11,4
13 2,4 38 12,6
14 2,4 39 13,5
15 2,7 40 14,1
16 3,3 41 14,7
17 3,5 42 16,7
18 3,7 43 18,0
19 3,9 44 18,0
20 4,1 45 18,4
21 4,3 46 19,2
22 4,4 47 23,1
23 5,6 48 24,0
24 5,8 49 26,7
25 6,1 50 32,3
En amarillo: tiempos de recurrencia menores o iguales que 10, total=36.
Datos agrupados en intervalos de clase 5:
Clases Frecuencia Frecuencia relativa
Yohana Bonilla G. Página 16
0,1-5,0 22 0,44
5,1-10,0 14 0,28
10,1-15,0 5 0,10
15,1-20,0 5 0,10
20,1-25,0 2 0,04
25,1-30,0 1 0,02
30,1-35,0 1 0,02
Total 50
Polígono de frecuencias relativas:
b. Fracción de los tiempos de recurrencia menores o iguales que 10:
c. Media:
Mediana: 6,35
Moda: 0,2
6. Veintiocho solicitantes interesados en trabajar para un programa de construcción de viviendas de interés
social, rindieron un examen diseñado para medir su aptitud para las obras civiles. Los resultados fueron
los siguientes:
79 97 86 76 93 87 98 68 84 88 81 91 86 87
70 94 77 92 66 85 63 68 98 88 46 72 59 79
0,44
0,28
0,10 0,10
0,04 0,02 0,02
0,00
0,05
0,10
0,15
0,20
0,25
0,30
0,35
0,40
0,45
0,50
0,1-5,0 5,1-10,0 10,1-15,0 15,1-20,0 20,1-25,0 25,1-30,0 30,1-35,0
Fre
cue
nci
a re
lati
va
Clases
Frecuencia relativa
Frecuencia relativa
Yohana Bonilla G. Página 17
Construya un polígono y un histograma de frecuencias relativas para estas puntuaciones. (Use
intervalos de clase de ancho 9, empezando en 44.5).
Calcule la media aritmética, la mediana y la moda
Calcule la desviación estándar y los coeficientes de: Variación, Asimetría y Curtosis.
Solución:
a.
Histograma de frecuencias relativas
Polígono de frecuencias relativas
0,036 0,036
0,179 0,179
0,321
0,250
0,000
0,050
0,100
0,150
0,200
0,250
0,300
0,350
44,5-53,4 53,5-62,4 62,5-71,4 71,5-80,4 80,5-89,4 89,5-98,4
Fre
cue
nci
a re
lati
va
Clases
Frecuencia relativa=f/28
Frecuencia relativa=f/28
Clases Frecuencia
f Frecuencia
relativa=f/28
44,5-53,4 1 0,036
53,5-62,4 1 0,036
62,5-71,4 5 0,179
71,5-80,4 5 0,179
80,5-89,4 9 0,321
89,5-98,4 7 0,250
Total 28
Yohana Bonilla G. Página 18
b. Media:
Mediana: 84,5
Moda: 68
c. Desviación estándar:
Coeficiente de variación:
Coeficiente de asimetría:
Curtosis:
7. Una empresa de ventas lleva registros sobre la inversión en publicidad, expresada en términos del
porcentaje de los gastos totales; estos se presentan a continuación:
2.6 3.6 3.1 2.6 2.7 3.9 2.4 2.7 2.5 2.3 4.0 3.2 2.5 1.7
0.3 3.1 2.6 1.3 4.3 1.5 2.8 1.8 4.2 3.5 2.4 2.2 3.4 3.7
0.8 2.3 1.9 4.5 1.2 2.2 2.2 3.0 2.1 1.8 2.9 3.8 3.5 1.6
3.2 4.4 1.4 0.7 2.8 3.3 0.5 2.3
Solución:
0,036 0,036
0,179 0,179
0,321
0,250
0,000
0,050
0,100
0,150
0,200
0,250
0,300
0,350
44,5-53,4 53,5-62,4 62,5-71,4 71,5-80,4 80,5-89,4 89,5-98,4
Fre
cue
nci
a re
lati
va
Clases
Polígono de frecuencias relativas
Frecuencia …
Yohana Bonilla G. Página 19
a. Agrupar la información en intervalos de clase y construya una tabla de frecuencias completa.
Usamos la fórmula de Sturges para determinar el número de intervalos:
En este caso N=50
Y el intervalo de clase a
Puesto que hemos ordenado los datos de menor a mayor en la siguiente tabla:
No. Datos No. Datos
1 0,3 26 2,6
2 0,5 27 2,6
3 0,7 28 2,7
4 0,8 29 2,7
5 1,2 30 2,8
6 1,3 31 2,8
7 1,4 32 2,9
8 1,5 33 3
9 1,6 34 3,1
10 1,7 35 3,1
11 1,8 36 3,2
12 1,8 37 3,2
13 1,9 38 3,3
14 2,1 39 3,4
15 2,2 40 3,5
16 2,2 41 3,5
17 2,2 42 3,6
18 2,3 43 3,7
19 2,3 44 3,8
20 2,3 45 3,9
21 2,4 46 4
22 2,4 47 4,2
23 2,5 48 4,3
24 2,5 49 4,4
25 2,6 50 4,5
En amarillo: 33 datos inferiores a 3.1
Yohana Bonilla G. Página 20
Tomamos el intervalo de clase: 0,6 y agrupamos los datos en una tabla de frecuencias, empezando en 0,3:
Tabla de frecuencias
Clase Frecuencia
f Frecuencia acumulada
Frecuencia relativa
Frecuencia acumulada relativa=(frecuencia acumulada)/50
0,3-0,8 4 4 0,08 0,08
0,9-1,4 3 7 0,14 0,14
1,5-2,0 6 13 0,26 0,26
2,1-2,6 14 27 0,54 0,54
2,7-3,2 10 37 0,74 0,74
3,3-3,8 7 44 0,88 0,88
3,9-4,4 5 49 0,98 0,98
4,5-5,0 1 50 1 1
Total 50
b. Graficar el histograma y el polígono de frecuencias.
Con las frecuencias absolutas f de la Tabla de frecuencias anterior construimos el histograma y el polígono
de frecuencias:
4 3
6
14
10
7
5
1
0
2
4
6
8
10
12
14
16
0,3-0,8 0,9-1,4 1,5-2,0 2,1-2,6 2,7-3,2 3,3-3,8 3,9-4,4 4,56-5,0
Fre
cue
nci
a
Clase
Histograma
Frecuencia
Yohana Bonilla G. Página 21
c. Calcular el porcentaje de registros que son inferiores a 3.1%
A partir de la tabla de frecuencias:
Usamos la tabla de frecuencias acumulada. En este caso el porcentaje de registros inferiores a 3,1% estaría
determinado por la frecuencia 27, previa a la clase 2,7-3,2
Por conteo directo de la muestra bruta, viendo la tabla.
Usando la gráfica:
Sumamos las frecuencias absolutas antes de la clase: 2,7-3,2
d. Estime el porcentaje de registros que son mayores que 1.5 pero menores de 3.5.
De la tabla obtenemos directamente esta información:
Del dato 9 al 39, tenemos la condición buscada, por lo tanto
e. Calcule la media aritmética, la mediana y la moda
Media:
Mediana: 2,6
Moda: 2,2
4 3
6
14
10
7
5
1 0
2
4
6
8
10
12
14
16
0,3-0,8 0,9-1,4 1,5-2,0 2,1-2,6 2,7-3,2 3,3-3,8 3,9-4,4 4,56-5,0
Fre
cue
nci
a
Clase
Polígono de frecuencias
Frecuencia
Yohana Bonilla G. Página 22
f. Calcule la desviación estándar y los coeficientes de: Variación, Asimetría y Curtosis.
Desviación estándar
Variación:
Asimetría:
Curtosis: