View
8
Download
2
Category
Preview:
Citation preview
EstadísticaPLH 406
Medidas de tendencia central
Francisco Henríquez
Henriquez.fco@gmail.com
www.freewebs.com/fcohenriquez/estadistica.htm
Notación de Sumatoria
El símbolo del lado indica la suma de todos los Xi desde i=1 hasta i=N.
N
iiX
1
Notación de Sumatoria
Es decir:
Propiedades:
N
iNi XXXX
121 ...
N
innii YXYXYXYX
12211 ...
N
ii
N
ini XaaXaXaXaX
1121 ...
Notación de Sumatoria
Propiedades:
n
ii
n
ii
n
ii
n
iiii ZcYbXacZbYaX
1111
Medidas de tendencia central para datos no agrupados: La Media
La Media Aritmética: la media de un conjunto N de números X1, X2,X3,…,XN se denota X (o “X barra”) y se define por:
N
X
N
X
NXXXX
X
N
ii
N 1321 ...
Medidas de tendencia central para datos no agrupados: La Media
Ejemplo: Tenemos los siguientes números: 19, 80, 21, 74, 66 La media se calcula:
525
2605
6674218019 x
Medidas de tendencia central para datos no agrupados: La Media
Calcular la media para los siguientes números: 70, 98, 54, 97, 26 El resultado es
695
3455
2697549870 x
Medidas de tendencia central para datos no agrupados: La Media La Media Aritmética Ponderada: A veces se asocia a
los números X1, X2,…, XN ciertos factores de peso (o pesos) w1, w2,…, wN, dependiendo de la influencia asignada a cada número. En tal caso,
N
ii
N
iii
N
NN
w
Xw
www
XwXwXwX
1
1
21
2211
...
...
Medidas de tendencia central para datos no agrupados: La Media
Ejemplo: Calcule el promedio de las siguientes notas: 5,6 coef. 2; 3,5 coef. 1; 6,4 coef. 1 y 5,2 coef.2
Otra manera de resolver este problema es calculando un ponderador, que se define:
25.56
5.312112
2*2.51*4.61*5.32*6.5
x
N
ii
ii
w
wponderador
1
Medidas de tendencia central para datos no agrupados: La Media
En este caso, los ponderadores son: 2/6=0.333 1/6=0.167 entonces, se calcula
25.5333.0*2.5167.*4.6167.0*5.3333.0*6.5
*1
x
Xponderadorxn
iii
Medidas de tendencia central para datos no agrupados: Proporciones Cuando se trabaja con datos de carácter
cualitativo, no se puede obtener media, sino que proporciones, lo cual indica la frecuencia relativa que posee un atributo en un conjunto de datos. Se obtiene así:
individuos de totalCantidad N
atributo elpresentan que individuos de Cantidad
proporción
i
i
fNf
p
Medidas de tendencia central para datos no agrupados: Proporciones El valor p está entre 0 y 1. Para una
interpretación más sencilla se suele multiplicar por 100 y se obtiene el porcentaje de ocurrencia del fenómeno.
Medidas de tendencia central para datos no agrupados: Proporciones Por ejemplo, se puede calcular la proporción de
respuestas buenas que los alumnos tienen en un ítem. De hecho, esta es una medida de dificultad del ítem. Mientras más cercano a 1, más fácil es el item.
Se calcula: Total de alumnos : 560 Alumnos que respondieron bien el ítem: 375
67.0560375 p
Medidas de tendencia central para datos no agrupados: Proporciones Ejercicio: Calcular el porcentaje que
representa cada uno de estos grupos:
¿Con cuál de las tendencias políticas Ud. se identifica o simpatiza más?...
(Encuesta CEP dic. 2006)
Sector frecuencia
Alianza 278
Concertación de partidos por la democracia 468
Pacto juntos podemos (Partidos Comunista, Humanista y otros) 110
Otros 7
Ninguna de ellas 594
No sabe 24
No contesta 24
Medidas de tendencia central para datos no agrupados: ProporcionesSector frecuencia %
Alianza 278 18.5%
Concertación de partidos por la democracia 468 31.1%
Pacto juntos podemos (Partidos Comunista, Humanista y otros) 110 7.3%
Otros 7 0.5%
Ninguna de ellas 594 39.5%
No sabe 24 1.6%
No contesta 24 1.6%
Total 1505
Medidas de tendencia central para datos no agrupados: La Mediana La Mediana: la mediana de un conjunto de números
ordenados en magnitud es el valor central o la media de los dos valores centrales.
Cuando hay un número impar de observaciones, es la observación (N+1)/2:
2
1: NXMediana
Medidas de tendencia central para datos no agrupados: La Mediana
Ejemplo: Si tenemos el siguiente conjunto de datos: 344, 190, 399, 473, 170, 363, 43, 671, 75, 421, 702,
846, 74, 652, 216, 304, 390, 457, 652, 700, 636, 934, 77, 444, 238, 78, 429,65, 927
para obtener la mediana, primero debemos ordenarlos:
43, 65, 74, 75, 77, 78, 170, 190, 216, 238, 304, 344, 363, 390, 399, 421, 429, 444, 457, 473, 636, 652, 652, 671, 700, 702, 846, 927, 934.
Medidas de tendencia central para datos no agrupados: La Mediana
una vez ordenados, se deben contar: 43, 65, 74, 75, 77, 78, 170, 190, 216, 238,
304, 344, 363, 390, 399, 421, 429, 444, 457, 473, 636, 652, 652, 671, 700, 702, 846, 927, 934.
Son 29 observaciones. Entonces, la observación del medio es la
número 15 (ya que (29+1)/2=15). Y esa observación es 399.
Medidas de tendencia central para datos no agrupados: La Mediana
Obtener la mediana para los siguientes datos:
0, 7, 15, 18, 24, 44, 45, 49, 50, 68, 70, 75, 86, 88, 93, 97, 99.
el número de observaciones es 17, por lo que el valor mediano va a ser el noveno, es decir:
Me=50.
Medidas de tendencia central para datos no agrupados: La Mediana Cuando N es impar se calcula el promedio entre los
dos valores del medio:
2
122
NN XX
Mediana
Medidas de tendencia central para datos no agrupados: La Mediana
Ejemplo: 2, 4, 9, 16, 29, 45, 60, 65, 67, 68 Aquí hay 10 observaciones, luego, se debe
obtener el promedio de las que están “en el medio”.
Es decir las obs. 5 y la 6.
372
742
4529 Me
Medidas de tendencia central para datos no agrupados: La Mediana
Ejercicio: Obtener la mediana de: 3, 19, 33, 38, 40, 40, 45, 50, 55, 58, 74, 98 hay 12 obs., por lo que a mediana está entre los
datos 6 y 7, es decir
5.422
852
4540 Me
Medidas de tendencia central para datos no agrupados: La Moda
La Moda: la moda de un conjunto de números es el valor que ocurre con mayor frecuencia; es decir, el valor más frecuente. La moda puede no existir e incluso no ser única.
La distribución con una sola moda se llama unimodal y con dos es bimodal.
Medidas de tendencia central para datos no agrupados: La Moda
Ejemplo: determinar la moda de los siguientes datos:
10, 19, 21, 21, 32, 47, 47, 47, 71, 71, 73, 84, 89, 98
Dado que el valor que más se repite es el 47, Moda = 47
Medidas de tendencia central para datos no agrupados: La Moda
Ejercicio, determinar la moda de los siguientes datos:
15, 23, 25, 30, 30, 41, 67, 78, 78, 79, 81, 84, 87, 89, 99.
Moda = 30 y 78. 11, 14, 21, 36, 38, 39, 41, 42, 43, 48, 51, 65,
72, 95 En este caso, la moda no existe.
Medidas de tendencia central para datos agrupados: La Media
Media aritmética para datos agrupados: Cuando se cuenta con datos agrupados en una distribución de frecuencia, todos los valores que caen dentro de un intervalo de clase dado se consideran igual a la marca de clase, o punto medio del intervalo.
Medidas de tendencia central para datos agrupados: La Media
Con Xj como marca de la clase j y fj como frecuencia de la misma, se tiene que:
Nótese que se asume que hay M clases
N
Xf
X
M
jjj
1
Medidas de tendencia central para datos agrupados: La Media
Ejemplo: A partir de la
siguiente tabla de distribución de frecuencia, encuentre la media.
LI LS Marca fi fr
0 150 75 285 0.012
150 300 225 5850 0.244
300 450 375 4655 0.194
450 600 525 7382 0.308
600 750 675 856 0.036
750 900 825 4948 0.206
N 23976
Medidas de tendencia central para datos agrupados: La Media
Se puede hacer de dos maneras. Ambas provienen de la definición de promedio ponderado.
La primera suma las frecuencias multiplicadas por su marca y se divide por N.
La segunda simplemente suma la multiplicación de las marcas por las frecuencias relativas.
Medidas de tendencia central para datos agrupados: La Media
LI LS Marca fi fr M*fi
0 150 75 285 0.012 21375
150 300 225 5850 0.244 1316250
300 450 375 4655 0.194 1745625
450 600 525 7382 0.308 3875550
600 750 675 856 0.036 577800
750 900 825 4948 0.206 4082100
N 23976 11618700
Medidas de tendencia central para datos agrupados: La Media
60.48423976
11618700 x
Medidas de tendencia central para datos agrupados: La Media
LI LS Marca fi fr marca*fr
0 150 75 285 0.012 0.892
150 300 225 5850 0.244 54.899
300 450 375 4655 0.194 72.807
450 600 525 7382 0.308 161.643
600 750 675 856 0.036 24.099
750 900 825 4948 0.206 170.258
N 23976 484.60
Medidas de tendencia central para datos agrupados: La Mediana
La mediana se obtiene por interpolación y está dada por:
mediana clase la de Ancho A
mediana clase la de Frecuencia
mediana la a inferiores clases las de sfrecuencia las de Suma
total)a(frecuenci datos de Número
mediana) la a contiene que (la mediana clase la deinferior Frontera
2
1
1
1
1
mediana
mediana
f
fa
N
L
Af
afN
LMediana
Medidas de tendencia central para datos agrupados: La Mediana
Es una interpolación debido a que en esta fórmula está implícito el supuesto de que los datos se distribuyen de manera lineal en el intervalo.
Medidas de tendencia central para datos agrupados: La Mediana Ejemplo
LI LS Marca fi fa
0 150 75 285 285
150 300 225 5850 6135
300 450 375 4655 10790
450 600 525 7382 18172
600 750 675 856 19028
750 900 825 4948 23976
N 23976
Medidas de tendencia central para datos agrupados: La Mediana
Lo primero que se debe hacer es determinar la clase donde está la mediana.
Lo anterior se realiza dividiendo N por 2, es decir:
23976/2=11988 A continuación se debe encontrar la clase
mediana, la cual es la que tiene la frecuencia acumulada mayor a la observación mediana.
En este caso:
Medidas de tendencia central para datos agrupados: La Mediana Ejemplo
LI LS Marca fi fa
0 150 75 285 285
150 300 225 5850 6135
300 450 375 4655 10790
450 600 525 7382 18172
600 750 675 856 19028
750 900 825 4948 23976
N 23976
Medidas de tendencia central para datos agrupados: La Mediana
Luego se debe aplicar la fórmula:
150*
7382
107902
23976
450Mediana
Límite Inferior de la frecuencia mediana
N
Frecuencia acumulada anterior a la frec. mediana
Ancho del Intervalo
Frecuencia Mediana
Medidas de tendencia central para datos agrupados: La Mediana
323.474
323.24450
150*162.0450
150*73821198
450
150*7382
1079011988450
150*7382
107902
23976
450
Mediana
Mediana
Mediana
Mediana
Mediana
Mediana
Medidas de tendencia central para datos agrupados: La Moda
La moda, para datos agrupados es simplemente la marca de la clase con mayor frecuencia.
LI LS Marca fi
0 150 75 285
150 300 225 5850
300 450 375 4655
450 600 525 7382
600 750 675 856
750 900 825 4948
En este caso, la moda es:Moda = 525
Recommended