View
20
Download
0
Category
Preview:
Citation preview
Descriptiva de una variableDescriptiva para varias variables
Repaso Estadística DescriptivaGrado en Fisioterapia, 2010/11
Jesús Montanero Fernández
Cátedra de BioestadísticaUniversidad de Extremadura
13 de octubre de 2010
Jesús Montanero Fernández Repaso Estadística Descriptiva
Descriptiva de una variableDescriptiva para varias variables
Índice
1 Descriptiva de una variable
2 Descriptiva para varias variablesRegresión-CorrelaciónTablas de contingenciaComparación de grupos o tratamientos
Jesús Montanero Fernández Repaso Estadística Descriptiva
Descriptiva de una variableDescriptiva para varias variables
Índice
1 Descriptiva de una variable
2 Descriptiva para varias variablesRegresión-CorrelaciónTablas de contingenciaComparación de grupos o tratamientos
Jesús Montanero Fernández Repaso Estadística Descriptiva
Descriptiva de una variableDescriptiva para varias variables
¿De qué trata?
Descripción conjunto concreto de datos (sin generalizar)Clasificación Tablas de frecuenciaRepresentación GráficosResumen Valores típicos
Jesús Montanero Fernández Repaso Estadística Descriptiva
Descriptiva de una variableDescriptiva para varias variables
Tipos de variables ¿?
Según SPSSCualitativas (factores)
Nominales: Grupo sanguíneoOrdinales: Grado enfermedad
Cuantitativas o de escala : Temperatura, estatura, glucemia,no hijos...
Jesús Montanero Fernández Repaso Estadística Descriptiva
Descriptiva de una variableDescriptiva para varias variables
Problemas estadísticos: relación
Tipos de relacionesCualitativa (factor)↔ Cuantitativa (Comparación degrupos o tratamientos)Cuantitativa↔ Cuantitativa (Regresión)Cualitativa (factor)↔ Cuanlitativa (Tablas decontingencia)
Jesús Montanero Fernández Repaso Estadística Descriptiva
Descriptiva de una variableDescriptiva para varias variables
Gráficos
Tipos de variables según gráficoCualitativas Diagrama sectoresCuantitativas discretas Diagrama barrasCuantitativas continuas Histograma
*Nota: estudiaremos ahora una sola variable
Jesús Montanero Fernández Repaso Estadística Descriptiva
Descriptiva de una variableDescriptiva para varias variables
Variable cualitativa: diagrama de sectores
Grupo fi pi
0 2892 0,458A 2625 0,416B 570 0,090
AB 226 0,036Total 6313 1
Jesús Montanero Fernández Repaso Estadística Descriptiva
Descriptiva de una variableDescriptiva para varias variables
Figura: Grupo sanguíneo
Jesús Montanero Fernández Repaso Estadística Descriptiva
Descriptiva de una variableDescriptiva para varias variables
Variable cuantitativa discreta: diagrama de barras
Edad alumnos titulación universitaria
Edad fi pi
18 6 0.2419 5 0.2020 3 0.1221 3 0.1222 3 0.1223 3 0.1224 2 0.08
Total 25 1
Jesús Montanero Fernández Repaso Estadística Descriptiva
Descriptiva de una variableDescriptiva para varias variables
18 19 20 21 22 23 24
Edad
Fre
quen
cia
01
23
45
6
Jesús Montanero Fernández Repaso Estadística Descriptiva
Descriptiva de una variableDescriptiva para varias variables
Variable cuantitativa continua
Glucemia n=100: Diagrama de barras
71.43061 76.69276 78.97109 80.0199 80.63695 81.29456 82.48693 82.96681 83.49599 84.3332 85.12535 86.0123 86.63882 87.17015 87.55771 88.70981 89.46449 90.48297 91.60582 93.09123
cero
Fre
quen
cy
0.0
0.2
0.4
0.6
0.8
1.0
Agrupar datos por intervalos
Jesús Montanero Fernández Repaso Estadística Descriptiva
Descriptiva de una variableDescriptiva para varias variables
Histograma
Glucemia k=6
Datos$cero
freq
uenc
y
70 75 80 85 90 95 100
05
1015
2025
3035
Jesús Montanero Fernández Repaso Estadística Descriptiva
Descriptiva de una variableDescriptiva para varias variables
Otros gráficos para variables continuas
Tallo-hoja
Jesús Montanero Fernández Repaso Estadística Descriptiva
Descriptiva de una variableDescriptiva para varias variables
Diagrama de caja o box-plot
Figura: Concentración ozono
Jesús Montanero Fernández Repaso Estadística Descriptiva
Descriptiva de una variableDescriptiva para varias variables
Valores típicos
Resumir numéricamente la informaciónMedidas de centralizaciónMedidas de dispersión
Jesús Montanero Fernández Repaso Estadística Descriptiva
Descriptiva de una variableDescriptiva para varias variables
Medidas de centralización
Centro de los datos, número más representativoMedia aritmética (centro de gravedad):
x =
∑ni=1 xi
n
Mediana (orden): dato que queda en medio una vezordenados de menor a mayor.
Jesús Montanero Fernández Repaso Estadística Descriptiva
Descriptiva de una variableDescriptiva para varias variables
La mediana es robusta: no se ve influenciada por la presencia devalores extremos
Ansiedad n=20
Datos$ham
freq
uenc
y
8 10 12 14 16 18 20
02
46
810
12
Jesús Montanero Fernández Repaso Estadística Descriptiva
Descriptiva de una variableDescriptiva para varias variables
Otro caso de sesgo n=350
Salario empleados de una banco (USA)
47500,037500,0
27500,017500,0
7500,0
300
200
100
0
Jesús Montanero Fernández Repaso Estadística Descriptiva
Descriptiva de una variableDescriptiva para varias variables
Distribución normal: media
Datos$cero
freq
uenc
y
70 75 80 85 90 95 100
05
1015
2025
3035
Jesús Montanero Fernández Repaso Estadística Descriptiva
Descriptiva de una variableDescriptiva para varias variables
Medidas de dispersión
Variabilidad de los datosVarizanza desviación típicaAmplitud (o rango) intercuartil
Jesús Montanero Fernández Repaso Estadística Descriptiva
Descriptiva de una variableDescriptiva para varias variables
Resumen de la información
Centralización-dispersión¿media-desv. típica o mediana-rango inter.?
Jesús Montanero Fernández Repaso Estadística Descriptiva
Descriptiva de una variableDescriptiva para varias variables
media-desviación típicaResumen perfectamente la información si la distribución de losdatos sigue un modelo normal
x± s 68%x± 2s 95%x± 3s 99%
Podemos construir la distribución partiendo exclusivamente dex y s.
Datos$cero
freq
uenc
y
70 75 80 85 90 95 100
05
1015
2025
3035
Jesús Montanero Fernández Repaso Estadística Descriptiva
Descriptiva de una variableDescriptiva para varias variables
mediana-rango intercuartilEn aquellas situaciones en que la media sea poco representativa:fuerte sesgo + valores extremos.
Salario empleados de una banco (USA)
47500,037500,0
27500,017500,0
7500,0
300
200
100
0
Jesús Montanero Fernández Repaso Estadística Descriptiva
Descriptiva de una variableDescriptiva para varias variables
mediana-rango intercuartilEn aquellas situaciones en que la media sea poco representativa:fuerte sesgo + valores extremos.
Salario empleados de una banco (USA)
47500,037500,0
27500,017500,0
7500,0
300
200
100
0
Jesús Montanero Fernández Repaso Estadística Descriptiva
Descriptiva de una variableDescriptiva para varias variables
Regresión-CorrelaciónTablas de contingenciaComparación de grupos o tratamientos
Problemas estadísticos: relación
Tipos de relacionesCuantitativa↔ Cuantitativa (Regresión-correlación)Cualitativa (factor)↔ Cualitativa (Tablas de contingencia)Cualitativa (factor)→ Cuantitativa (Comparación degrupos o tratamientos)Cualitativa (factor)← Cuantitativa (Reg logística, etc)
Temas 2,3 y 4 según programa
Jesús Montanero Fernández Repaso Estadística Descriptiva
Descriptiva de una variableDescriptiva para varias variables
Regresión-CorrelaciónTablas de contingenciaComparación de grupos o tratamientos
Relación entre dos variables cuantitativas
Peso-altura
X =peso(kg) 80 45 63 94 24 75 56 ...Y =altura(cm) 174 152 160 183 102 183 148 ...
Jesús Montanero Fernández Repaso Estadística Descriptiva
Descriptiva de una variableDescriptiva para varias variables
Regresión-CorrelaciónTablas de contingenciaComparación de grupos o tratamientos
Gráfico
Diagrama de dispersión
-
6
X
Y
|10
|20
|30
|40
|50
|60
|70
|80
|90
|100
100−
110−
120−
130−
140−
150−
160−
170−
180−
190−
200−
qq q
q
q
qqqq
q
Jesús Montanero Fernández Repaso Estadística Descriptiva
Descriptiva de una variableDescriptiva para varias variables
Regresión-CorrelaciónTablas de contingenciaComparación de grupos o tratamientos
Otro ejemplo
Longitud cabeza
9,0008,7008,4008,1007,800
An
ch
ura
ca
be
za
5,200
5,100
5,000
4,900
4,800
4,700
4,600
4,500
Página 1
Jesús Montanero Fernández Repaso Estadística Descriptiva
Descriptiva de una variableDescriptiva para varias variables
Regresión-CorrelaciónTablas de contingenciaComparación de grupos o tratamientos
Estudiamos inicialmente relaciones lineales
Concentración de hormona paratiroidea (mug/ml)
5,004,003,002,001,000,00
Co
nc
en
tra
ció
n d
e c
alc
io (
mg
/10
0m
l)11,00
10,00
9,00
8,00
7,00
6,00
5,00
Página 1
Jesús Montanero Fernández Repaso Estadística Descriptiva
Descriptiva de una variableDescriptiva para varias variables
Regresión-CorrelaciónTablas de contingenciaComparación de grupos o tratamientos
Valores típicos
Dos tiposDe las variables por separados.Referentes a la relación entre las variables
Jesús Montanero Fernández Repaso Estadística Descriptiva
Descriptiva de una variableDescriptiva para varias variables
Regresión-CorrelaciónTablas de contingenciaComparación de grupos o tratamientos
Variables por separado
x, sx, y, sy, y, . . .
Jesús Montanero Fernández Repaso Estadística Descriptiva
Descriptiva de una variableDescriptiva para varias variables
Regresión-CorrelaciónTablas de contingenciaComparación de grupos o tratamientos
Referentes a la relación entre las variables: Covarianza→ r
sxy =
∑ni=1(xi − x)(yi − y)
n− 1
− sx · sy ≤ sxy ≤ + sx · sy .
Jesús Montanero Fernández Repaso Estadística Descriptiva
Descriptiva de una variableDescriptiva para varias variables
Regresión-CorrelaciónTablas de contingenciaComparación de grupos o tratamientos
Interpretación gráfica covarianza
-
6
X
Y
q q q q q q q
-
6
X
Y
q qq
qqqq
-
6
X
Y q q q q q q q
Jesús Montanero Fernández Repaso Estadística Descriptiva
Descriptiva de una variableDescriptiva para varias variables
Regresión-CorrelaciónTablas de contingenciaComparación de grupos o tratamientos
Interpretación gráfica
−630,71 ≤ sxy ≤ +630,71 sxy = 577,86
Peso
10080604020
Alt
ura
200
175
150
125
100
Página 1
Jesús Montanero Fernández Repaso Estadística Descriptiva
Descriptiva de una variableDescriptiva para varias variables
Regresión-CorrelaciónTablas de contingenciaComparación de grupos o tratamientos
Longitud cabeza
9,0008,7008,4008,1007,800
An
ch
ura
ca
be
za
5,200
5,100
5,000
4,900
4,800
4,700
4,600
4,500
Página 1
Jesús Montanero Fernández Repaso Estadística Descriptiva
Descriptiva de una variableDescriptiva para varias variables
Regresión-CorrelaciónTablas de contingenciaComparación de grupos o tratamientos
Covarianza próxima a cero
x
8,006,004,002,00
y8,00
7,00
6,00
5,00
4,00
3,00
2,00
1,00
Página 1
Jesús Montanero Fernández Repaso Estadística Descriptiva
Descriptiva de una variableDescriptiva para varias variables
Regresión-CorrelaciónTablas de contingenciaComparación de grupos o tratamientos
Covarianza negativa
Concentración de hormona paratiroidea (mug/ml)
5,004,003,002,001,000,00
Co
nc
en
tra
ció
n d
e c
alc
io (
mg
/10
0m
l)11,00
10,00
9,00
8,00
7,00
6,00
5,00
Página 1
Jesús Montanero Fernández Repaso Estadística Descriptiva
Descriptiva de una variableDescriptiva para varias variables
Regresión-CorrelaciónTablas de contingenciaComparación de grupos o tratamientos
Coeficiente de correlación lineal r
Medida adimensional del grado de correlación
− sx · sy ≤ sxy ≤ + sx · sy .
r =sxy
sx · sy
−1 ≤ r ≤ 1
Jesús Montanero Fernández Repaso Estadística Descriptiva
Descriptiva de una variableDescriptiva para varias variables
Regresión-CorrelaciónTablas de contingenciaComparación de grupos o tratamientos
r = 0,91
-
6
X
Y
|10
|20
|30
|40
|50
|60
|70
|80
|90
|100
100−
110−
120−
130−
140−
150−
160−
170−
180−
190−
200−
qq q
q
q
qqqq
q
Jesús Montanero Fernández Repaso Estadística Descriptiva
Descriptiva de una variableDescriptiva para varias variables
Regresión-CorrelaciónTablas de contingenciaComparación de grupos o tratamientos
r = 0,625
an
ch
5,200
5,000
4,800
4,600
longt
9,0008,7008,4008,1007,800
Página 1
Jesús Montanero Fernández Repaso Estadística Descriptiva
Descriptiva de una variableDescriptiva para varias variables
Regresión-CorrelaciónTablas de contingenciaComparación de grupos o tratamientos
r = −0,97
Concentración de hormona paratiroidea (mug/ml)
5,004,003,002,001,000,00
Co
nc
en
tra
ció
n d
e c
alc
io (
mg
/10
0m
l)11,00
10,00
9,00
8,00
7,00
6,00
5,00
Página 1
Jesús Montanero Fernández Repaso Estadística Descriptiva
Descriptiva de una variableDescriptiva para varias variables
Regresión-CorrelaciónTablas de contingenciaComparación de grupos o tratamientos
Recta de regresión lineal
y = a + b · x y = 89,11 + 1,10xPredicciones: x = 62kg→ y = 89,11 + 1,10 · 60 = 155,11cm
Peso
10080604020
Alt
ura
200
175
150
125
100
Página 1
Jesús Montanero Fernández Repaso Estadística Descriptiva
Descriptiva de una variableDescriptiva para varias variables
Regresión-CorrelaciónTablas de contingenciaComparación de grupos o tratamientos
Regresión múltiple
¿Pueden introducirse más variables explicativas en la ecuación?
y = a + b1x1 + b2x2 + b3x3
Jesús Montanero Fernández Repaso Estadística Descriptiva
Descriptiva de una variableDescriptiva para varias variables
Regresión-CorrelaciónTablas de contingenciaComparación de grupos o tratamientos
Varianza residual
Mide el error cometido por la recta de regresión
s2y←x =
1n−2
∑ni=1[yi − (a + bxi)]
2 = 1335,32/10
xi yi (a + bxi) [yi − (a + bxi)]2
80 174 176.80 7.8645 152 138.44 183.9463 160 158.17 3.3694 183 192.15 83.7024 102 115.42 180.0575 183 171.32 136.3756 148 150.50 6.2352 152 146.11 34.6961 166 155.98 100.4834 140 126.38 185.5121 98 112.12 199.6678 160 174.61 213.47
1335.32
Jesús Montanero Fernández Repaso Estadística Descriptiva
Descriptiva de una variableDescriptiva para varias variables
Regresión-CorrelaciónTablas de contingenciaComparación de grupos o tratamientos
Coeficiciente de determinación r2
s2y←x
s2y
= 1− r2xy
1− r2xy indica la proporción de la variabilidad total de Y no
explicada por la regresión.r2
xy expresa lo contrario.
Jesús Montanero Fernández Repaso Estadística Descriptiva
Descriptiva de una variableDescriptiva para varias variables
Regresión-CorrelaciónTablas de contingenciaComparación de grupos o tratamientos
r2 = 0,82
Peso
10080604020
Alt
ura
200
175
150
125
100
Página 1
Jesús Montanero Fernández Repaso Estadística Descriptiva
Descriptiva de una variableDescriptiva para varias variables
Regresión-CorrelaciónTablas de contingenciaComparación de grupos o tratamientos
r2 ' 0
x
8,006,004,002,00
y
8,00
7,00
6,00
5,00
4,00
3,00
2,00
1,00
Página 1
Jesús Montanero Fernández Repaso Estadística Descriptiva
Descriptiva de una variableDescriptiva para varias variables
Regresión-CorrelaciónTablas de contingenciaComparación de grupos o tratamientos
r2 = 0,39
Longitud cabeza
9,0008,7008,4008,1007,800
An
ch
ura
ca
be
za
5,200
5,100
5,000
4,900
4,800
4,700
4,600
4,500
Página 1
Jesús Montanero Fernández Repaso Estadística Descriptiva
Descriptiva de una variableDescriptiva para varias variables
Regresión-CorrelaciónTablas de contingenciaComparación de grupos o tratamientos
Regresión no lineal
Edad días-Peso embrión: Transformar variables
Edad embrión
16141210
Pe
so
Em
bri
ón
3.000
2.000
1.000
0
Página 1
Jesús Montanero Fernández Repaso Estadística Descriptiva
Descriptiva de una variableDescriptiva para varias variables
Regresión-CorrelaciónTablas de contingenciaComparación de grupos o tratamientos
Relación entre variables cualitativas
nivel contaminación - salud árbolesCloroplastos
SO2
(3× 3) Alto Medio Bajo TotalAlto 3 4 13 20
Medio 5 10 5 20Bajo 7 11 2 20Total 15 25 20 60
Jesús Montanero Fernández Repaso Estadística Descriptiva
Descriptiva de una variableDescriptiva para varias variables
Regresión-CorrelaciónTablas de contingenciaComparación de grupos o tratamientos
Vacunación-hepatitisVacunación
Hepatitis
(2× 2) Sí No TotalSí 11 70 81No 538 464 1002Total 549 534 1083
Jesús Montanero Fernández Repaso Estadística Descriptiva
Descriptiva de una variableDescriptiva para varias variables
Regresión-CorrelaciónTablas de contingenciaComparación de grupos o tratamientos
Gráfico
Barras agrupadas
Nivel de SO2
SO2 bajoSO2 medioSO2 alto
Re
cu
en
to
12,5
10,0
7,5
5,0
2,5
0,0
Gráfico de barras
Cloroplatos bajo
Cloroplastos medio
Cloroplastos alto
Nivel de cloroplastos
Página 1
Jesús Montanero Fernández Repaso Estadística Descriptiva
Descriptiva de una variableDescriptiva para varias variables
Regresión-CorrelaciónTablas de contingenciaComparación de grupos o tratamientos
Medidas del grado de dependencia
Observados vs Esperados independencia: distancia χ2
χ2exp =
∑i,j
(Oij − Eij)2
Eij
0 ≤ χ2exp ≤ +∞
Coeficiente de contingencia de Pearson C
C =
√χ2
exp
χ2exp + n
0 ≤ C ≤
√q− 1
q, q = min{no filas, no colunas}
Jesús Montanero Fernández Repaso Estadística Descriptiva
Descriptiva de una variableDescriptiva para varias variables
Regresión-CorrelaciónTablas de contingenciaComparación de grupos o tratamientos
Ejemplo: cloropastosTabla 3× 3. Por lo tanto,
0 ≤ C ≤√
23= 0,816
En este caso concreto,
C = 0,444
Grado de asociación medio
Jesús Montanero Fernández Repaso Estadística Descriptiva
Descriptiva de una variableDescriptiva para varias variables
Regresión-CorrelaciónTablas de contingenciaComparación de grupos o tratamientos
Independencia C = 0Cloroplastos
SO2
(3× 3) Alto Medio Bajo TotalAlto 5 8.3 6.7 20
Medio 5 8.3 6.7 20Bajo 5 8.3 6.7 20Total 15 25 20 60
Jesús Montanero Fernández Repaso Estadística Descriptiva
Descriptiva de una variableDescriptiva para varias variables
Regresión-CorrelaciónTablas de contingenciaComparación de grupos o tratamientos
Máxima dependencia C = 0, 816Los valores observados deberían ser éstos:
Cloroplastos
SO2
(3× 3) Alto Medio Bajo TotalAlto 0 0 20 20
Medio 0 20 0 20Bajo 20 0 0 20Total 20 20 20 60
Jesús Montanero Fernández Repaso Estadística Descriptiva
Descriptiva de una variableDescriptiva para varias variables
Regresión-CorrelaciónTablas de contingenciaComparación de grupos o tratamientos
Cualitativa→ cuantitativa
Grupo
Viven con otras personasViven solos
Pu
ntu
ació
n d
e an
sied
ad d
e H
amilt
on
20,00
18,00
16,00
14,00
12,00
10,00
8,00
5
Página 1
¿Influye el estilo de vida en la ansiedad?
Jesús Montanero Fernández Repaso Estadística Descriptiva
Descriptiva de una variableDescriptiva para varias variables
Regresión-CorrelaciónTablas de contingenciaComparación de grupos o tratamientos
¿Influye la acidosis en la glucemia?
Tipo de acidosis
Acidosis MixtaAcidosis MetabólicaAcidosis RespiratoriaControl
Niv
el d
e g
luce
mia
en
el c
ord
ón
um
bili
cal
100,000
90,000
80,000
70,000
60,000
50,000
40,000
Página 1
Jesús Montanero Fernández Repaso Estadística Descriptiva
Descriptiva de una variableDescriptiva para varias variables
Regresión-CorrelaciónTablas de contingenciaComparación de grupos o tratamientos
Contrastes de hipótesis
H0 : µ1 = µ2 = µ3 = µ4
Parámetros poblacionalesµ denota la media poblacional de una variable cuantitativa
Parámetros muestralesNosotros sólo contamos con los valores típicos (x,s, etc) de unamuestra de cada población.
Jesús Montanero Fernández Repaso Estadística Descriptiva
Descriptiva de una variableDescriptiva para varias variables
Regresión-CorrelaciónTablas de contingenciaComparación de grupos o tratamientos
Inferencia Estadística
En general, ¿cómo generalizar conclusiones a partir de unamuestra?
Jesús Montanero Fernández Repaso Estadística Descriptiva
Recommended