19

Click here to load reader

Medidas de dispersion_prof hector

Embed Size (px)

Citation preview

Page 1: Medidas de dispersion_prof hector

Medidas de Dispersión

Prof. Héctor Quintero

Page 2: Medidas de dispersion_prof hector

Una medida de dispersión permite cuantificar el grado de dispersión de los datos con respecto a alguna medida de tendencia central.

Al interpretar una medida de dispersión es importante tener en cuenta lo siguiente: a menor valor obtenido menos variabilidad de los datos y a mayor valor obtenido más variabilidad entre los datos.

Page 3: Medidas de dispersion_prof hector

Medidas de dispersión

Absolutas:

Rango o amplitud.

Rango intercuartilar.

Desviación semi_intercuartilar.

Desviación media

Varianza.

Desviación típica.

Relativas:

Coeficiente de variación.

Page 4: Medidas de dispersion_prof hector

Las medidas de dispersión absolutas se expresan usando la unidad de medición de la variable.

Ejemplo:

Si se trata de estaturas se pueden expresar en metros, centímetros, etc.

Si se trata del peso de un grupo de niños, estás pueden expresarse en kilogramos.

Si se trata de mediciones de glicemia, triglicéridos o colesterol, los valores se pueden expresar en mg/dl.

Las medidas de dispersión relativas no se expresan en las unidades de medición de la variable. Por ejemplo, el coeficiente de variación se expresa como una proporción.

Page 5: Medidas de dispersion_prof hector

Medidas de dispersión absolutas.

Page 6: Medidas de dispersion_prof hector

Las medidas de dispersión absolutas que serán estudiadas acá son:

1. Rango o amplitud.

2. Varianza.

3. Desviación típica.

Page 7: Medidas de dispersion_prof hector

Amplitud o Rango

Amplitud o rango: Se define como la diferencia entre el valor máximo y el valor mínimo del conjunto de datos.

Amplitud o rango = Valor máximo – Valor mínimo.

Esta medida de dispersión se puede calcular si la variable está medida en la escala de intervalo o la escala de razón.

Ejemplo 1: Calcular e interpretar el rango del siguiente conjunto de estaturas (en metros): 1,74; 1,76; 1,74; 1,75; 1,75; 1,77.

Rango = Máximo – Mínimo = 1,77 mtrs – 1,74 mtrs = 0,03 mtrsEsto nos indica que la diferencia entre la estatura del sujeto más alto y el más bajo es igual 0,03 metros (3 cm)

Page 8: Medidas de dispersion_prof hector

Ejemplo 2: Para cada uno de los siguientes conjuntos calcule el rango o amplitud. Compare los valores obtenidos ¿Qué puede concluir?

Conjunto 1: 10 10 10 10 10 10 10 10 15

Conjunto 2: 10 11 11 11 11 11 15 12 12

Conjunto 3: 6 6 5 6 6 7 7 8 10 9 9 8

Page 9: Medidas de dispersion_prof hector

Amplitud o Rango.

Ventajas:Es de fácil cálculo e interpretación.

Desventajas:1. No aporta información de la variabilidad de los datos con

respecto a alguna medida de tendencia central.2. No aporta información de la variabilidad de los datos en

el centro de la distribución.3. Se ve muy influenciada por valores extremos de la

distribución.

Page 10: Medidas de dispersion_prof hector

Varianza

Varianza: Se define como el cociente de la suma de las desviaciones cuadráticas de los valores de la variable con respecto a la media aritmética entre el total de casos.

( )n

xxVarianza

n

ii∑

=

−= 1

2

La definición anterior corresponde a la varianza muestral sesgada y se denota como S2, donde n representa al tamaño de la muestra.

La varianza poblacional es denotada por: σ2.

Page 11: Medidas de dispersion_prof hector

Varianza sesgada e insesgada.

La varianza muestral sesgada se obtiene dividiendo la suma de las desviaciones cuadráticas de los valores con respecto a la media entre el tamaño de la muestra (n). Esta es denotada por S2.

( )n

xxS

n

ii∑

=

−= 1

2

2

La varianza muestral insesgada se obtiene dividiendo la suma de las desviaciones cuadráticas de los valores con respecto a la media entre el tamaño de la muestra menos uno (n-1). Esta es denotada por Ŝ2.

( )1

ˆ 1

2

2

−=

∑=

n

xxS

n

ii

Page 12: Medidas de dispersion_prof hector

Desviación típica

Desviación típica: se define como la raíz cuadrada de la varianza.

Varianza típicaDesviación =

Notación:

S: denota la desviación típica muestral (de los datos de una muestra)

σ : denota la desviación típica poblacional (de los datos de la población)

Page 13: Medidas de dispersion_prof hector

Importancia de la desviación típica.

•Es la medida de dispersión más usada para describir un conjunto de datos.

•Su cálculo toma en cuenta a todos los datos.

•Aporta información de la variabilidad de los datos con respecto a la media aritmética.

•Es de gran utilidad en la inferencia estadística debido a sus propiedades algebraicas.

Page 14: Medidas de dispersion_prof hector

Criterios para interpretar la desviación típica.

Asumiendo que la distribución de los datos es simétrica y unimodal, se puede afirmar que:

•El 68,26% de los datos se encuentran en el intervalo con límites inferior y superior igual a , respectivamente.

•El 95,45% de los datos se encuentran en el intervalo con límites inferior y superior igual a , respectivamente

•El 99,73% de los datos se encuentran en el intervalo con límites inferior y superior igual a , respectivamente

SxSx +− y

SxSx 2y 2 +−

SxSx 3y 3 +−

xSx − Sx +

68,26%95,45%

Sx 2+Sx 2−

Page 15: Medidas de dispersion_prof hector

Medidas de dispersión relativas

Coeficiente de variación

Page 16: Medidas de dispersion_prof hector

Coeficiente de variación (C.V)

Coeficiente de variación: Se denota como C.V. y se define como el resultado de dividir la desviación típica por la media aritmética.

Este estadístico debe usarse si la variable está medida en la escala de razón.

Ejemplo 5: Suponga que la distribución de los pesos de un grupo de mujeres tiene una media igual a 65 kgrs. y una desviación típica igual a 2 kgrs. El coeficiente de variación para este conjunto de datos es igual a:

031,0..

031,0kgrs. 65

kgrs. 2..

=

===

VC

x

SVC

Page 17: Medidas de dispersion_prof hector

Criterios para comparar la variabilidad de los datos de dos o más distribuciones

Si la media aritmética de las distribuciones es la misma o parecida (1) y, además, las variables están expresadas en la misma unidad de medida (2), entonces se comparan los valores de la varianza o la desviación típica de las distribuciones.

En caso de no cumplirse alguna de las condiciones anteriores se calcula y compara el valor del coeficiente de variación de cada una de las distribuciones.

En cualquier caso, aquella distribución que presente el valor más pequeño, al calcular la medida de dispersión adecuada, será la más homogénea, es decir, la que presente menos variabilidad entre los datos.

Page 18: Medidas de dispersion_prof hector

Ejemplo 3: Suponga que la nota promedio obtenida en matemáticas por los alumnos de la sección A es igual a 14 puntos y la desviación típica es de 1,5 puntos. Suponga que la nota media de este grupo en Inglés es 13,8 puntos con una desviación típica igual a 1 punto. ¿En cuál asignatura la media aritmética representa mejor al conjunto de notas?

Respuesta:

La media aritmética representa mejor al conjunto más homogéneo, aquel cuyos datos están menos dispersos con respecto a la media.

En el caso propuesto, la variable involucrada es la misma (notas) y la media aritmética de los conjuntos es muy parecida (13,8 ptos ≈14 ptos). Se compara la desviación típica de ambos conjuntos y se concluye que la distribución de las notas de Inglés es la más homogénea.

Page 19: Medidas de dispersion_prof hector