Upload
artemio-villegas
View
314
Download
1
Embed Size (px)
DESCRIPTION
Estudiamos lo que son los datos agrupados así como las distintas distribuciones de frecuencia. También anexamos el trazado de las representaciones graficas tanto para datos agrupados como para datos sin agrupar según el tipo de variable que se maneje.
Citation preview
Estadística y Probabilidad I
Distribuciones de Frecuencia y
Representaciones Graficas
Ciclo escolar 2014-2015
Datos sueltos.
• Se les llama datos sueltos a los datos recolectados que no han sido organizados numéricamente.
• Un ejemplo es el conjunto de las estaturas de 100 estudiantes hombres, obtenidas del registro universitario, que esta ordenado en forma alfabética.
Ordenación.
• Una ordenación es un conjunto de datos numéricos en orden creciente o decreciente de magnitud. A la diferencia entre el número mayor y el menor se le conoce como rango de los datos.
• Por ejemplo, si la estatura mayor de los estudiantes es 74 pulg y la menor es 60, el rango es 74-60=14 pulg.
Actividad. • En una ciudad costera, un sábado de agosto, se midió con radar de velocidad en
kilómetros por hora, de 50 motocicletas que pasaron frente a un paso de nivel . Los datos están en la siguiente tabla:
Ordena estos datos de menor a mayor y encuentra: • La velocidad mas baja. • La velocidad mas alta • El rango. • Las cinco velocidades mas altas • Las cinco Velocidades mas bajas
90 85 110 80 75 120 105 100 103 98
96 89 135 108 125 130 120 102 97 86
132 128 115 142 106 102 95 89 96 107
121 132 126 128 134 138 139 110 123 108
102 98 92 90 128 135 138 143 109 133
75 80 85 86 89 89 90 90 92 95
96 96 97 98 98 100 102 102 102 103
105 106 107 108 108 109 110 110 115 120
120 121 123 125 126 128 128 128 130 132
132 133 134 135 135 138 138 139 142 143
Distribuciones de frecuencia.
• Si se reúnen grandes cantidades de datos sueltos es útil distribuirlos en clases o categorías, y determinar el número de individuos que pertenecen a cada categoría, a lo que se le llama frecuencia de clase.
• A una disposición tabular de los datos por clase, con sus correspondientes frecuencias de clase, se le conoce como distribución de frecuencias o tabla de frecuencias.
Distribuciones de frecuencia
• La siguiente tabla es una distribución de frecuencias de las estaturas de 100 estudiantes hombres de cierta universidad.
Estatura (pulg)
Numero de estudiantes
60-62 5
63-65 18
66-68 42
69-71 27
72-74 8
Total 100
Distribuciones de frecuencia.
• A los datos así ordenados y reunidos en clases, como la anterior distribución de frecuencias, se les llama datos agrupados.
• Aunque el proceso de agrupamiento generalmente quita detalles originales de los datos, es muy ventajosa, pues proporciona una visión amplia y clara además de que se obtienen relaciones evidentes.
Elementos de una distribución de frecuencias.
• El símbolo que define una categoría, como el 60-62 de la tabla, se llama intervalo de clase o clase.
• El número de clases es la cantidad de clases (renglones que tiene nuestra distribución de frecuencias).
• A los números 60 y 62 se les conoce como límites de clase; el numero mas pequeño (60) es el límite inferior de clase, mientras que el número mas grande (62) es el límite superior de clase.
Estatura (pulg) Numero de estudiantes
60-62 5
63-65 18
66-68 42
69-71 27
72-74 8
Total 100
Elementos de una distribución de frecuencias.
• Las fronteras de clase son parte de la tolerancia que se permite dentro de una clase. Por lo que el valor 62.8 pertenece a la clase 60-62, y no a la 63-65. Usualmente la frontera inferior de clase corresponde con el límite inferior (60). Y la frontera superior de clase coincide con el límite inferior de la siguiente clase.
• A la diferencia entre las fronteras de clase inferior y superior se le conoce como amplitud, tamaño o longitud de clase. En ocasiones ocurre que no todas las clases tienen el mismo tamaño.
• La marca de clase, es el punto medio entre las fronteras de clase.
Estatura (pulg) Numero de estudiantes
60-62 5
63-65 18
66-68 42
69-71 27
72-74 8
Total 100
Actividad En la tabla se muestra una Distribución de Frecuencia de los salarios semanales de 65 empleados de la empresa P&R. Determinar de esa tabla: • El limite inferior de la sexta clase. • El limite superior de la cuarta clase. • La marca de clase de la tercera clase. • Las fronteras de clase del quinto intervalo. • La anchura del quinto intervalo de clase. • La frecuencia de la tercera clase. • El intervalo de clase con máxima frecuencia (se llama intervalo de
clase modal, a su frecuencia es la frecuencia de clase modal). • El porcentaje de empleados que cobran menos de $280.00 a la
semana. • El porcentaje de empleados que cobran menos de $300.00 pero al
menos $260.00 a la semana.
SalariosNumero de
empleados
$250.00-$259.99 8
$260.00-$269.99 10
$270.00-$279.99 16
$280.00-$289.99 14
$290.00-$299.99 10
$300.00-$309.99 5
$310.00-$319.99 2
Total 65
Reglas para construir distribuciones de frecuencia (de igual tamaño).
• Determinar el mayor y el menor de los datos sueltos con el fin de especificar el rango.
• Dividir el rango en un numero adecuado de intervalos. Suelen tomarse de 5 a 20 intervalos de clase, según los datos.
• Determinar el numero de observaciones que corresponden a cada intervalo de clase; es decir; hallar las frecuencias de clase. Si tenemos datos sueltos es mejor hacerlo con una hoja de recuentos o registros de marcas.
Hoja de recuento y otras tablas de frecuencia.
• Las siguientes calificaciones corresponden a las calificaciones de un examen obtenidas en la universidad. Realice una Distribución de Frecuencias con tamaño de clase 5. También realice una distribución de frecuencias relativas, una de frecuencias acumuladas y una de frecuencias acumuladas relativa.
95 57 76 93 86 80 89
76 76 63 74 94 96 77
65 79 60 56 72 82 70
67 79 71 77 52 76 68
72 88 84 70 83 93 76
82 96 87 69 89 77 81
87 65 77 72 56 78 78
58 54 82 82 66 73 79
86 81 63 46 62 99 93
82 92 75 76 90 74 67
95 57 76 93 86 80 89
76 76 63 74 94 96 77
65 79 60 56 72 82 70
67 79 71 77 52 76 68
72 88 84 70 83 93 76
82 96 87 69 89 77 81
87 65 77 72 56 78 78
58 54 82 82 66 73 79
86 81 63 46 62 99 93
82 92 75 76 90 74 67
Dato Máximo= Dato Mínimo= Rango=
99 46 99-46=53
1
2
4
4
7
9
16
10
7
6
4
Intervalo de
claseConteo Frecuencia
45-49
50-54
55-59
60-64
65-69
70-74
75-79
80-84
85-89
90-94
95-99
Hoja de recuento y otras tablas de frecuencia.
• La frecuencia relativa de una clase, es su frecuencia dividida por la frecuencia total de todas las clases, en ocasiones se expresa como un porcentaje.
• La frecuencia total de todos los valores menores que la frontera de clase superior de un intervalo de clase dado se llama frecuencia acumulada hasta ese intervalo de clase inclusive. Se acostumbra poner en la tabla las palabras “menor que”.
• La frecuencia acumulada relativa, es la frecuencia acumulada dividida por la frecuencia total.
Hoja de recuento y otras tablas de frecuencia.
Hoja de recuento y otras tablas de frecuencia.
Intervalo de
claseFrecuencia
Frecuencia
relativa
45-49
50-54
55-59
60-64
65-69
70-74
75-79
80-84
85-89
90-94
95-99
CalificaciónFrecuencia
acumulada
Frecuencia
acumulada
relativa
menor que 50
menor que 55
menor que 60
menor que 65
menor que 70
menor que 75
menor que 80
menor que 85
menor que 90
menor que 95
menor que 100
1
2
4
4
7
9
16
10
7
6
4
0.0143
0.0286
0.0571
0.0571
0.1000
0.1286
0.2286
0.1429
0.1000
0.0857
0.0571
1
3
7
11
18
27
43
53
60
66
70
0.0143
0.0429
0.1000
0.1571
0.2571
0.3857
0.6143
0.7571
0.8571
0.9429
1.0000
Actividad • Las calificaciones finales en matemáticas de 80
estudiantes figuran en la tabla. Realice una distribución de frecuencias con anchura 10, una distribución de frecuencia relativas, una de frecuencia acumulada y una de frecuencia acumulada relativa.
68 84 75 82 68 90 62 88 76 93
73 79 88 73 60 93 71 59 85 75
61 65 75 87 74 62 95 78 63 72
66 78 82 75 94 77 69 74 68 60
96 78 89 61 75 95 60 79 83 71
79 62 67 97 78 85 76 65 71 75
65 80 73 57 88 78 62 76 53 74
86 67 73 81 72 63 76 75 85 77
34 181 180 106 93 32 72 50 193 191
118 98 39 142 84 115 83 154 153 170
98 138 187 191 65 108 108 80 44 31
58 127 56 51 159 153 74 198 118 194
34 39 143 86 142 45 61 147 53 113
175 173 157 143 95 163 79 32 31 25
189 59 89 24 145 31 162 52 39 88
61 23 89 82 173 120 148 151 164 57
101 155 151 40 147 131 39 46 68 101
72 131 151 140 30 179 153 101 40 152
165 100 164 99 59 118 110 26 100 170
197 194 174 50 122 145 32 141 25 187
Gráficos
• Un grafico es una representación de la relación entre variables.
• Muchos tipos de gráficos aparecen en la Estadística, según la naturaleza de los datos involucrados y el propósito del grafico. Entre ellos citemos los gráficos de barras, circulares, etc. Estos gráficos se refieren a veces como diagramas. Hablaremos por tanto, de diagramas de barras, circulares, etc.
Tipos de Gráficos, según el tipo de variable.
• Para variables cualitativas: • Diagramas de barras o rectangulares. • Diagramas circulares, pastel o por sectores. • Pictogramas.
• Para variables cuantitativas – Datos sin agrupar
• Diagramas de barras. • Diagrama de línea o poligonal. • Pictogramas.
– Datos agrupados • Histogramas. • Polígonos de frecuencia. • Polígonos de frecuencias acumuladas u Ojivas.
Graficas para Datos Agrupados
• Un histograma consiste en un conjunto de rectángulos de tienen sus bases en el eje X horizontal, sus centros en las marcas de clases. – Si todos los intervalos son del mismo tamaño, las alturas de los
rectángulos son proporcionales a las frecuencias de clase.
• Un polígono de frecuencias es una grafica de línea de las frecuencias de clase dibujada con respecto a la marca de clase. Puede obtenerse uniendo los puntos medios de las partes superiores de los rectángulos del histograma.
• Un grafico que recoja las frecuencias acumuladas por debajo de cualquiera de las fronteras de clase superiores respecto de dicha frontera se llama un polígono de frecuencias acumuladas u ojiva.
Estatura (pulg)Frecuencia
acumulada
menor que 63 5
menor que 66 23
menor que 69 65
menor que 72 92
menor que 75 100
Estaturas de 100 estudiantes
hombres de la universidad xyz
Estatura (pulg)Número de
estudiantes
60-62 5
63-65 18
66-68 42
69-71 27
72-74 8
Total 100
Actividad
• La tabla muestra una distribución de frecuencias de los salarios semanales de 65 empleados de la empresa P&R. De acuerdo a esta tabla, elabore: – Un histograma – Un Polígono de
frecuencias – Una Ojiva
SalariosNumero de
empleados
$250.00-$259.99 8
$260.00-$269.99 10
$270.00-$279.99 16
$280.00-$289.99 14
$290.00-$299.99 10
$300.00-$309.99 5
$310.00-$319.99 2
Total 65
Diagramas de barras.
• Se utilizan para representar los caracteres cualitativos y cuantitativos discretos.
• Es un grafico dibujado usando barras rectangulares para mostrar que tan grande es cada valor.
• Las barras pueden ser verticales u horizontales.
• Es posible comparar dos o mas valores y observar con precisión múltiples datos.
Elementos de una grafica de barras • En una grafica de barras no pueden faltar…
Titulo
Etiquetas o leyendas
Graduación
Modalidad o graduación
Fuente (cuando la hay)
Actividad
• Identifique que elementos faltan en estas graficas
Diagramas de barras. • Todas las barras deben ser del mismo ancho para no confundir al
lector. • Debe haber un espacio entre las barras que representen datos
distintos, y estos espacios deben tener la misma medida. • Se deben incluir las escalas y algunas indicaciones para que ayuden
a la lectura de las gráficas. • Los ejes de las gráficas se deben identificar en forma clara. • Se deben incluir dentro del cuerpo de la gráfica, o debajo, todo tipo
de "claves" para la interpretación de las gráficas. • Es recomendable que el título de la gráfica aparezca debajo del
cuerpo de la grafica. • Las notas de pie de página, o sobre fuentes, cuando sean
necesarias, se deben colocar hasta la parte inferior de la grafica después del título.
• Si se quieren representar varios datos, es agradable el uso de colores o texturas que identifiquen una representación de otra. También hay que agregar una notación que nos de a entender lo que representan cada una de dichas texturas o colores.
Ejemplos de graficas múltiples
Actividad • Realice graficas de barras de las siguientes
tablas, incluya los datos que hagan falta.
Continente
Area
(millones de
millas
cuadradas)
Africa 11.7
Asia 10.4
Europa 1.9
America de Norte 9.4
Oceania 3.3
America del Sur 6.9
Union Sovietica 7.9
Fuente: Naciones Unidas
Nota: Europa excluye Turquia, que se incluye en Asia
Año
Relacion
entre
divorcios y
bodas
1900 0.079
1910 0.088
1920 0.134
1930 0.174
1940 0.165
1950 0.231
1960 0.258
1970 0.328
1980 0.491
Fuente: U.S. Department of Health
and Human Services.
Ventas de productos en dos tiendas que obtuvieron
a lo largo del primer semestre del año
TIENDA Enero Febrero Marzo Abril Mayo Junio
A 800 600 700 900 1100 1000
B 700 500 600 1000 900 1200
La siguiente tabla muestra el numero de celemines (medidas de volumen
equivalente a 4.6275 litros) de trigo y de maiz producidos en la granja PQR.
AñoNúmeros de celemines de maiz
(al celemín 5 mas cercano
Números de celemines de trigo (al
celemín 5 mas cercano)
1987 200 75
1988 185 90
1989 225 100
1990 250 85
1991 240 80
1992 195 100
1993 210 110
1994 225 105
1995 250 95
1996 230 110
1997 235 100
Actividad: Realice un diagrama de barras dobles de cada una de las
siguientes tablas.
Diagrama por Sectores
• Son gráficos en los que cada modalidad se le asigna un sector circular de área proporcional a la frecuencia que representan. Se utiliza cuando el carácter es cualitativo.
• Para su construcción se divide el circulo en sectores circulares de ángulos proporcionales a las frecuencias absolutas de cada valor de la variable. Para calcular los grados de cada sector la frecuencia relativa se multiplica por 360°.
• Cada sector representa un porcentaje de los datos para los cual hay que realizar los cálculos respectivos.
360360 Total
ffrGrados
100100 Total
ffrPorcentaje
Pictogramas
• Según la RAE (Real Academia Española): Signo de la escritura de figuras y símbolos.
• En estadística: Son imágenes que sirven para representar el comportamiento o la distribución de los datos cuantitativos y cualitativos de una población utilizando símbolos de tamaño proporcional al dato representado.
• Una posibilidad es que el grafico sea analógico, por ejemplo, la cantidad de hectáreas de trigo colectadas en el año puede representarse con una espiga.
Actividad
Realice un grafica por sectores de los siguientes datos.
Realice un pictograma de los siguientes datos.
Gran LagoÁrea (en millas
cuadradas)
Michigan 22342
Superior 20557
Huron 8800
Erie 5033
Ontario 3446
Total 60178
Fuente: U.S. Bureau of Census
Areas de los cinco grandes lagos
bajo las jurisdicion de Estados
Unidos
Colonias No de casas
A 120
B 80
C 60
D 100
Total 360
Casas construidas en cuatro
colonias de una ciudad
Grafica Lineal • Los gráficos de líneas son una buena solución para
representar gráficamente datos cuantitativos. • Resultan especialmente útiles para expresar los cambios
que se producen en los valores entre las distintas categorías de datos.
• El formato que deben presentar los datos para crear un gráfico de líneas es el mismo que requieren los gráficos de barras.