Upload
lenin-mogrovejo
View
893
Download
2
Embed Size (px)
Citation preview
¿QUÉ ES LA DISPERSIÓN?
La dispersión es la variación en un conjunto de datos
que proporciona información adicional y permite juzgar
la confiabilidad de la medida de tendencia central.
MEDIDAS DE TENDENCIA CENTRAL :
Media, mediana, moda
MEDIDAS DE FORMA
Asimetria y curtosis
MEDIDAS DE POSICIÓN :
Deciles, cuartiles, percentiles
MEDIDAS DE DISPERSIÓN :
Desviación estándar, varianza, coeficiente de variación
CLASIFICACIÓN
Las medidas de resumen más importantes se
clasifican en tres grupos:
MEDIDAS DE FORMA
ASIMETRIA CURTOSIS
0,5000
0,4500
0,4000
0,3500
0,3000
0,2500
0,2000
0,1500
Q1 Q2 Q3 Q40,1000
0,0500
0,0000
0 1 2 3 4 5 6 7
Rango
ASIMETRIA:la curva que forman los valores de la serie presenta la misma
forma a izquierda
aritmética).
y derecha de un valor central (media
(g1 = 0): Se acepta que la distribución es Simétrica, es decir, existe
aproximadamente la misma cantidad de valores a los dos lados de la media.
(g1 > 0): La curva es asimétricamente positiva por lo que los valores se
tienden a reunir más en la parte izquierda que en la derecha de la media.
(g1 < 0): La curva es asimétricamente negativa por lo que los valores se
tienden a reunir más en la parte derecha de la media.
CURTOSIS :
analiza el grado de concentración que presentan losvalores alrededor de la zona central de la distribución.
Para detectar tanto asimetría como curtosis, es útil dibujarel histograma. Además, para asimetría se comparan lasmedidas de posición, Media, Mediana y moda.
Media, Mediana y Moda
Si una distribución es simétrica, la media,
mediana y modo coinciden
• Si una distribución
medidas difieren.
no es simétrica, las tres
Asimetría hacia la derecha
(asimetría positiva)
Asimetría hacia la izquierda
(asimetría negativa)
Media Media ModoModo
Mediana Mediana 7
RENDIMIENTO
NO ADECUADO
Asimetría hacia la derecha
(asimetría positiva)
RENDIMIENTO
ADECUADO
Asimetría hacia la izquierda
(asimetría negativa)
Media Media ModoModo
Mediana Mediana 8
CURTOSIS
(g2
(g2
(g2
=
>
<
0)
0)
0)
la
la
la
distribución
distribución
distribución
es
es
es
Mesocúrtica: (± 0.5 aprox.)
Leptocúrtica
Platicúrtica
Medidas deApuntamiento
(Curtosis o Kurtosis)
Leptocúrtica: Cuando la distribución de
frecuencias es más apuntada que la normal.
Medidas deApuntamiento
(Curtosis o Kurtosis)
Mesocúrtica: Cuando la distribución de frecuencias
apuntada como la normal.
es tan
Medidas deApuntamiento
(Curtosis o Kurtosis)
Platicúrtica: Cuando la distribución de
es menos apuntada que la normal.
frecuencias
Asimetría Positiva
Mo < Me < X
Simetría
Mo = Me = X
Asimetría Negativa
Mo > Me > X
MEDIDAS DE POSICIÓN
CUARTILES: permiten dividir un conjunto de datos en 4
partes iguales.
DECILES:
conjunto de
son muy parecidos a los cuartiles; pero dividen al
datos en 10 partes iguales
PERCENTILES: también se lo conoce como centil, y
permite dividir un conjunto de datos en 100 partes iguales.
MEDIDAS DE DISPERSIÓN
Las medidas de dispersión nos permiten conocer si los
valores en general están cerca o alejados de los valores
centrales, muestran la variabilidad de una distribución
de datos, indicando por medio de un número si las
diferentes puntuaciones de una variable están muy
alejadas de la medida de tendencia central.
MEDIDAS DE DISPERSIÓN
RANGO (AMPLITUD DE VARIACIÓN): Es la diferencia
entre el valor máximo y el mínimo en nuestros datos, esta
medida de dispersión aunque
general es muy poco usada.
es la más fácil de obtener, en lo
Dispersión:Amplitud Total
Amplitud Total = Valor Mayor – Valor Menor
VARIANZA
La varianza esta basada en las desviaciones con respecto a la
media.
VARIANZA:
desviaciones
Esta varianza
Es el promedio de los cuadrados de las
de cada observación con respecto de la media.
es cero si todas las observaciones son iguales.
Existen dos tipos de varianza.
•Varianza poblacional.
•Varianza muestral.
VARIANZAPOBLACIONAL: Varianza de toda la población.
Es el valor medio de
elevadas al cuadrado.
Su fórmula es:
las desviaciones con respecto a la media,
El
1.
2.
proceso para calcular la varianza poblacional es el siguiente:
Calcular la media aritmética.
Comprobar ٤(X-u) = 0, por cada número se resta la media
poblacional y se realiza la sumatoria.
Calcular (X-u) 23.
4. Obtener varianza.
VARIANZA MUESTRAL:
población.
Su fórmula es:
varianza de una muestra de la
La varianza muestral es el valor medio de las
con respecto a la media, elevadas al cuadrado.
desviaciones
El
1.
2.
3.
proceso para calcularla es el siguiente:
X 2Calcular
X 2Calcular ٤X y ٤
Reemplazar en la fórmula.
EJEMPLO DE DISPERSIÓN
8 cms.
Aquí tenemos 9 rectángulos cuya altura es de 8 centímetros (y todos
tienen la misma base).
¿Existe alguna variación respecto de su altura entre estos rectángulos?
¿Cuál es el promedio de la altura de estos rectángulos?
8 + 8 + 8 + 8 + 8 + 8 + 8 + 8 + 8 72
9= = 8
9
EJEMPLO DE DISPERSIÓN
10 cms
6 cms
8 cms.
El quinto rectángulo y el octavo rectángulo en un acto de rebeldía cambiaron su
altura. El quinto rectángulo, ahora de color rojo, mide 10 centímetros, y el
octavo rectángulo, de color azul, mide 6 centímetros?
¿Cuál es el nuevo promedio de estos 9 rectángulos?
8 + 8 + 8 + 8 + 10 + 8 + 8 + 6 + 8 72
9= = 8
9
... ¡el mismo promedio! Pero... ¿ha habido variación?
EJEMPLO DE DISPERSIÓN
10 cms
6 cms
8 cms.
El rectángulo rojo tiene +2 centímetros sobre el promedio, y el rectángulo azul
tiene –2 centímetros bajo el promedio. Los otros rectángulos tienen cero
diferencia respecto del promedio.
Si sumamos estas diferencias de la altura respecto del promedio, tenemos
0 + 0 + 0 + 0 + 2 + 0 + 0 – 2 + 0 = 0
Este valor nos parece indicar que ¡no ha habido variabilidad! Y sin embargo,
ante nuestros ojos, sabemos que hay variación.
EJEMPLO DE DISPERSIÓN
10 cms
6 cms
8 cms.
Una forma de eliminar los signos menos de aquellas diferencias que sean
negativas, esto es de aquellos mediciones que estén bajo el promedio, es
elevar al cuadrado todas las diferencias, y luego sumar...
02 + 02 + 02 + 02 + 22 + 02 + 02 + (– 2)2 + 02 = 8
Y este resultado repartirlo entre todos los rectángulos, es decir lo dividimos por
el número de rectángulos que es 9
802 + 02 + 02 + 02 + 22 + 02 + 02 + (– 2)2 + 02 = = 0,899 9
EJEMPLO DE DISPERSIÓN
10 cms
6 cms
8 cms.
Se dice entonces que la varianza fue de 0,89
Observemos que las unidades involucradas en el cálculo de la varianza están al
cuadrado. En rigor la varianza es de 0,89 centímetros cuadrados. De manera
que se define
0,89 0,943
La raíz cuadrada de la varianza se llama desviación estándar
EJEMPLO DE DISPERSIÓN
10 cms
6 cms
8 cms.
Que la desviación estándar haya sido de 0,943 significa que en promedio la
altura de los rectángulos variaron (ya sea aumentando, ya sea disminuyendo) en
0,943 centímetros.
Es claro que esta situación es “en promedio”, puesto que sabemos que los
causantes de la variación fueron los rectángulos quinto y octavo. Esta
variación hace repartir la “culpa” a todos los demás rectángulos que se
“portaron bien”.
La desviación estándar mide la dispersión de los datos respecto del
promedio
EJEMPLO DE DISPERSIÓN
10 cms
8 cms. 8 cms.8 cms. 8 cms. 8 cms.7 cms.
6 cms4 cms
¿Cuál es la varianza y la desviación estándar de las alturas de los rectángulos?
En primer lugar debemos calcular el promedio
8 + 4 + 8 + 8 + 10 + 8 + 7 + 6 + 8= 7,44
9
Luego debemos calcular la varianza
EJEMPLO DE DISPERSIÓN
10 cms
8 cms. 8 cms. 8 cms. 8 cms. 8 cms.7 cms.
6 cms4 cms
-
0,440,560,56 2,56 -
1,440,56
-
3,440,560,56
7,44
Promedio
0,562 + (-3,44)2 + 0,562 + 0,562 + 2,562 + 0,562 + (-0,44)2 + (-1,44)2 + 0,562 22,2224=
99
= 2,469Este es el valor de la varianza
EJEMPLO DE DISPERSIÓN10 cms
8 cms. 8 cms. 8 cms. 8 cms. 8 cms.7 cms.
6 cms4 cms
7,44
Promedio
Si la varianza fue de 2,469, entonces la desviación estándar es de...
2, 469 1,57
Lo que significa que, en promedio, los rectángulos se desviaron más o
(más arriba o más abajo) en 1,57 centímetros.
menos
DESVIACIÓN
Es la medida de dispersión mas utilizada, también se la
cuadrada de laconoce como desviación típica, y es la raíz
varianza.
Esta medida pretende conseguir que la medida de dispersión
se exprese en las mismas unidades que los datos u
observaciones, al igual que la varianza existen dos tipos:
•Desviación estándar poblacional
•Desviación estándar muestral.
DESVIACIÓN ESTÁNDAR POBLACIONAL: Para
toda la población o datos, es la raíz cuadrada de la
varianza poblacional.
DESVIACIÓN ESTÁNDAR MUESTRAL: Es un
estimado de la desviación estándar poblacional. Es la raíz
cuadrada de varianza muestral, su fórmula es:
Muchas gracias
Lenin H.Cari MogrovejoCel. [email protected][email protected]