Upload
wplata
View
1.650
Download
0
Embed Size (px)
Citation preview
SPSS aplicado a la Estadística Descriptiva
INSTITUTO NACIONAL DE ESTADÍSTICAS Y CENSOS CAMPUS VIRTUAL
Instructores:
Wendy Plata Alarcón, Ing. [email protected]
Kleber Villa Tello, Ing. [email protected]
Módulo 4
Frase del Módulo
“Somos lo que hacemos día a día. De modo que la excelencia no es un acto, sino un hábito”
Aristóteles
Agenda
Estadísticos de Posición 1
Medidas de Tendencia Central 2
Medidas de Dispersión 3
Estadísticos de Forma 4
Clasificación de Estadísticos
Posición Dividen un conjunto ordenado de datos en grupos con la misma cantidad de individuos.
Cuantiles, percentiles, cuartiles, deciles,...
Centralización Indican valores con respecto a los que los datos parecen agruparse.
Media, mediana y moda
Dispersión Indican la mayor o menor concentración de los datos con respecto a las medidas de
centralización. Desviación típica, coeficiente de variación, rango, varianza
Forma Asimetría o Sesgo Apuntamiento o Curtosis
5
6
Simbología
• n: tamaño de la muestra • Xi: i-ésima observación • X(i) : i-ésima observación tal que X(1) X(2) X(3) … X(n)
• Por ejemplo si se tienen las siguientes observaciones 3 4 5 8 7 4 1 • X1=3 X2=4 X3=5 X4=8 X5=7 X6=4 X7=1 • X(1)=1 X(2)=3 X(3)=4 X(4)=4 X(5)=5 X(6)=7 X(7)=8
7
Estadísticos de Posición
• Se define el cuantil de orden a como un valor de la variable por debajo del cual se encuentra una frecuencia acumulada a.
• Casos particulares son los percentiles, cuartiles, deciles
(… viene) Estadísticos de Posición
Percentil de orden i = cuantil de orden i/100 El i% de los elementos de la muestra toman valores menores o iguales a Pi, denominado
percentil i; i=1,2, … , 99
Cuartiles: Divide los elementos de la muestra en 4 grupos con frecuencias similares. Q1=Primer cuartil = Percentil 25 = Cuantil 0,25
Q2=Segundo cuartil = Percentil 50 = Cuantil 0,5 = Mediana
Q3=Tercer cuartil = Percentil 75 = cuantil 0,75
Deciles: Divide los elementos de la muestra en 10 grupos con frecuencias similares. Di: i-ésimo decil
Medidas de Tendencia Central • Media (‘mean’) Es la media aritmética (promedio) de los datos
contenidos en la muestra. Se la obtiene sumando todas las observaciones y dividiendo para el tamaño de la muestra.
• Mediana (‘median’) Es un valor que divide a las observaciones
ordenadas en forma ascendente en dos grupos con el mismo número de individuos (percentil 50, segundo cuartil).
• Moda (‘mode’) Es el/los valor/es donde la distribución de frecuencia
alcanza un máximo, es decir, el valor observado que más se repite.
n
X
x
n
i
i 1
2
1
~nXxSi n es impar Si n es par
2
~1
22
nn XX
x
Medidas de Dispersión
• Amplitud o Rango (‘range’): Diferencia entre el valor máximo X(n) y el
mínimo X(1).
Rango= X(n) - X(1)
• Rango intercuartil (‘interquartile range’):
– Es la distancia entre primer y tercer cuartil.
• RI=Rango intercuartil = Q3 – Q1
Medidas de Dispersión
i
i xxn
S 22 )(1
1
• Varianza S2 (‘Variance’): Mide el promedio de las desviaciones (al cuadrado) de las observaciones con respecto a la media.
• Desviación estándar (‘standard deviation’) Es la raíz cuadrada de la
varianza.
2SS
Estadísticos de Forma
• Asimetría o Sesgo – Si la Asimetría es positiva, decimos
que la distribución de los datos está sesgada hacia la izquierda.
– Si la Asimetría es negativa,
decimos que la distribución de los datos está sesgada hacia la derecha.
– Si la Asimetría es cero, decimos
que la distribución de los datos es simétrica.
Estadísticos de Forma
• Apuntamiento o Curtosis La curtosis nos indica el grado de apuntamiento (aplastamiento) de una
distribución con respecto a la distribución normal o gaussiana. Es adimensional.
Platicúrtica (aplanada): curtosis < 0 Mesocúrtica (como la normal): curtosis = 0 Leptocúrtica (apuntada): curtosis > 0
Estadísticos de Forma
Aplanada
0.0 0.2 0.4 0.6 0.8 1.0
0.0
0.5
1.0
1.5
2.0
0.0 0.2 0.4 0.6 0.8 1.0
x s
57 %
Apuntada
-2 -1 0 1 20.
00.
20.
40.
60.
8-2 -1 0 1 2
x s
82 %
Apuntada como la normal
-3 -2 -1 0 1 2 30
.00
.10
.20
.3-3 -2 -1 0 1 2 3
x s
68 %
Referencias Bibliográficas
• Zurita, G. (2008) Probabilidad y Estadística: Fundamentos y Aplicaciones; Edición Escuela Superior Politécnica del Litoral, Instituto de Ciencias Matemáticas, Guayaquil-Ecuador
• Barón, F., Téllez, F. (2004) Apuntes de Bioestadística; Universidad de Málaga