Upload
independent
View
0
Download
0
Embed Size (px)
Citation preview
Notación de Sumatoria
El símbolo del lado indica la suma de todos los Xi desde i=1 hasta i=N.
N
iiX
1
Notación de Sumatoria
Es decir:
Propiedades:
N
iNi XXXX
121 ...
N
innii YXYXYXYX
12211 ...
N
ii
N
ini XaaXaXaXaX
1121 ...
Medidas de tendencia central para datos no agrupados: La Media La Media Aritmética: la media de un conjunto
N de números X1, X2,X3,…,XN se denota X (o “X barra”) y se define por:
NX
N
X
NXXXXX
N
ii
N 1321 ...
Medidas de tendencia central para datos no agrupados: La Media Ejemplo: Tenemos los siguientes números: 19, 80, 21, 74, 66 La media se calcula:
525
2605
6674218019 x
Medidas de tendencia central para datos no agrupados: La Media Calcular la media para los siguientes
números: 70, 98, 54, 97, 26 El resultado es
695
3455
2697549870 x
Medidas de tendencia central para datos no agrupados: La Media La Media Aritmética Ponderada: A veces se
asocia a los números X1, X2,…, XN ciertos factores de peso (o pesos) w1, w2,…, wN, dependiendo de la influencia asignada a cada número. En tal caso,
N
ii
N
iii
N
NN
w
Xw
wwwXwXwXwX
1
1
21
2211
......
Medidas de tendencia central para datos no agrupados: La Media Ejemplo: Calcule el promedio de las siguientes notas: 5,6 coef. 2; 3,5 coef. 1; 6,4 coef. 1 y 5,2
coef.2
Otra manera de resolver este problema es calculando un ponderador, que se define:
25.56
5.312112
2*2.51*4.61*5.32*6.5
x
N
ii
ii
w
wponderador
1
Medidas de tendencia central para datos no agrupados: La Media En este caso, los ponderadores son: 2/6=0.333 1/6=0.167 entonces, se calcula
25.5333.0*2.5167.*4.6167.0*5.3333.0*6.5
*1
x
Xponderadorxn
iii
Medidas de tendencia central para datos no agrupados: Proporciones Cuando se trabaja con datos de carácter
cualitativo, no se puede obtener media, sino que proporciones, lo cual indica la frecuencia relativa que posee un atributo en un conjunto de datos. Se obtiene así:
individuos de totalCantidad Natributo elpresentan que individuos de Cantidad
proporción
i
i
fNfp
Medidas de tendencia central para datos no agrupados: Proporciones
El valor p está entre 0 y 1. Para una interpretación más sencilla se suele multiplicar por 100 y se obtiene el porcentaje de ocurrencia del fenómeno.
Medidas de tendencia central para datos no agrupados: Proporciones Por ejemplo, se puede calcular la proporción
de respuestas buenas que los alumnos tienen en un ítem. De hecho, esta es una medida de dificultad del ítem. Mientras más cercano a 1, más fácil es el item.
Se calcula: Total de alumnos : 560 Alumnos que respondieron bien el ítem: 375
67.0560375 p
Medidas de tendencia central para datos no agrupados: Proporciones Ejercicio: Calcular el porcentaje que
representa cada uno de estos grupos:
¿Con cuál de las tendencias políticas Ud. se identifica o simpatiza más?...
(Encuesta CEP dic. 2006)
Sector frecuencia
Alianza 278Concertación de partidos por la democracia 468Pacto juntos podemos (Partidos Comunista, Humanista y otros) 110
Otros 7
Ninguna de ellas 594
No sabe 24
No contesta 24
Medidas de tendencia central para datos no agrupados: ProporcionesSector frecuencia %Alianza 278 18.5%Concertación de partidos por la
democracia 468 31.1%Pacto juntos podemos (Partidos
Comunista, Humanista y otros) 110 7.3%
Otros 7 0.5%Ninguna de ellas 594 39.5%No sabe 24 1.6%No contesta 24 1.6%Total 1505
Medidas de tendencia central para datos no agrupados: La Mediana La Mediana: la mediana de un conjunto de
números ordenados en magnitud es el valor central o la media de los dos valores centrales.
Cuando hay un número impar de observaciones, es la observación (N+1)/2:
21: NXMediana
Medidas de tendencia central para datos no agrupados: La Mediana
Ejemplo: Si tenemos el siguiente conjunto de datos: 344, 190, 399, 473, 170, 363, 43, 671, 75,
421, 702, 846, 74, 652, 216, 304, 390, 457, 652, 700, 636, 934, 77, 444, 238, 78, 429,65, 927
para obtener la mediana, primero debemos ordenarlos:
43, 65, 74, 75, 77, 78, 170, 190, 216, 238, 304, 344, 363, 390, 399, 421, 429, 444, 457, 473, 636, 652, 652, 671, 700, 702, 846, 927, 934.
Medidas de tendencia central para datos no agrupados: La Mediana
una vez ordenados, se deben contar: 43, 65, 74, 75, 77, 78, 170, 190, 216, 238, 304,
344, 363, 390, 399, 421, 429, 444, 457, 473, 636, 652, 652, 671, 700, 702, 846, 927, 934.
Son 29 observaciones. Entonces, la observación del medio es la
número 15 (ya que (29+1)/2=15). Y esa observación es 399.
Medidas de tendencia central para datos no agrupados: La Mediana
Obtener la mediana para los siguientes datos: 0, 7, 15, 18, 24, 44, 45, 49, 50, 68, 70, 75, 86,
88, 93, 97, 99. el número de observaciones es 17, por lo que el
valor mediano va a ser el noveno, es decir: Me=50.
Medidas de tendencia central para datos no agrupados: La Mediana Cuando N es impar se calcula el promedio
entre los dos valores del medio:
21
22
NN XXMediana
Medidas de tendencia central para datos no agrupados: La Mediana Ejemplo: 2, 4, 9, 16, 29, 45, 60, 65, 67, 68 Aquí hay 10 observaciones, luego, se debe
obtener el promedio de las que están “en el medio”.
Es decir las obs. 5 y la 6.
372
742
4529 Me
Medidas de tendencia central para datos no agrupados: La Mediana Ejercicio: Obtener la mediana de: 3, 19, 33, 38, 40, 40, 45, 50, 55, 58, 74, 98 hay 12 obs., por lo que a mediana está
entre los datos 6 y 7, es decir
5.422
852
4540 Me
Medidas de tendencia central para datos no agrupados: La Moda
La Moda: la moda de un conjunto de números es el valor que ocurre con mayor frecuencia; es decir, el valor más frecuente. La moda puede no existir e incluso no ser única.
La distribución con una sola moda se llama unimodal y con dos es bimodal.
Medidas de tendencia central para datos no agrupados: La Moda
Ejemplo: determinar la moda de los siguientes datos:
10, 19, 21, 21, 32, 47, 47, 47, 71, 71, 73, 84, 89, 98
Dado que el valor que más se repite es el 47, Moda = 47
Medidas de tendencia central para datos no agrupados: La Moda
Ejercicio, determinar la moda de los siguientes datos:
15, 23, 25, 30, 30, 41, 67, 78, 78, 79, 81, 84, 87, 89, 99.
Moda = 30 y 78.11, 14, 21, 36, 38, 39, 41, 42, 43, 48, 51, 65, 72,
95 En este caso, la moda no existe.
Medidas de tendencia central para datos agrupados: La Media
Media aritmética para datos agrupados: Cuando se cuenta con datos agrupados en una distribución de frecuencia, todos los valores que caen dentro de un intervalo de clase dado se consideran igual a la marca de clase, o punto medio del intervalo.
Medidas de tendencia central para datos agrupados: La Media Con Xj como marca de la clase j y fj como
frecuencia de la misma, se tiene que:
Nótese que se asume que hay M clases
N
XfX
M
jjj
1
Medidas de tendencia central para datos agrupados: La Media Ejemplo: A partir de la
siguiente tabla de distribución de frecuencia, encuentre la media.
LI LS Marca fi fr0 150 75 285 0.012
150 300 225 5850 0.244300 450 375 4655 0.194450 600 525 7382 0.308600 750 675 856 0.036750 900 825 4948 0.206
N 23976
Medidas de tendencia central para datos agrupados: La Media
Se puede hacer de dos maneras. Ambas provienen de la definición de promedio ponderado.
La primera suma las frecuencias multiplicadas por su marca y se divide por N.
La segunda simplemente suma la multiplicación de las marcas por las frecuencias relativas.
Medidas de tendencia central para datos agrupados: La Media
LI LS Marca fi fr M*fi0 150 75 285 0.012 21375
150 300 225 5850 0.244 1316250300 450 375 4655 0.194 1745625450 600 525 7382 0.308 3875550600 750 675 856 0.036 577800750 900 825 4948 0.206 4082100
N 23976 11618700
Medidas de tendencia central para datos agrupados: La Media
LI LS Marca fi fr marca*fr0 150 75 285 0.012 0.892
150 300 225 5850 0.244 54.899300 450 375 4655 0.194 72.807450 600 525 7382 0.308 161.643600 750 675 856 0.036 24.099750 900 825 4948 0.206 170.258
N 23976 484.60
Medidas de tendencia central para datos agrupados: La Mediana La mediana se obtiene por interpolación y
está dada por:
mediana clase la de Ancho Amediana clase la de Frecuencia
mediana la a inferiores clases las de sfrecuencia las de Suma
total)a(frecuenci datos de Número mediana) la a contiene que (la mediana clase la deinferior Frontera
2
1
1
1
1
mediana
mediana
f
fa
NL
Af
afN
LMediana
Medidas de tendencia central para datos agrupados: La Mediana
Es una interpolación debido a que en esta fórmula está implícito el supuesto de que los datos se distribuyen de manera lineal en el intervalo.
Medidas de tendencia central para datos agrupados: La Mediana Ejemplo
LI LS Marca fi fa0 150 75 285 285
150 300 225 5850 6135300 450 375 4655 10790450 600 525 7382 18172600 750 675 856 19028750 900 825 4948 23976
N 23976
Medidas de tendencia central para datos agrupados: La Mediana Lo primero que se debe hacer es determinar
la clase donde está la mediana. Lo anterior se realiza dividiendo N por 2, es
decir: 23976/2=11988 A continuación se debe encontrar la clase
mediana, la cual es la que tiene la frecuencia acumulada mayor a la observación mediana.
En este caso:
Medidas de tendencia central para datos agrupados: La Mediana Ejemplo
LI LS Marca fi fa0 150 75 285 285
150 300 225 5850 6135300 450 375 4655 10790450 600 525 7382 18172600 750 675 856 19028750 900 825 4948 23976
N 23976
Medidas de tendencia central para datos agrupados: La Mediana Luego se debe aplicar la fórmula:
150*
7382
107902
23976
450Mediana
Límite Inferior de la frecuencia mediana
N
Frecuencia acumulada anterior a la frec. mediana
Ancho del Intervalo
Frecuencia Mediana
Medidas de tendencia central para datos agrupados: La Mediana
323.474323.24450
150*162.0450
150*73821198450
150*7382
1079011988450
150*7382
107902
23976
450
MedianaMedianaMediana
Mediana
Mediana
Mediana