Upload
duongdung
View
217
Download
0
Embed Size (px)
Citation preview
Bioestadistica II
2014
FACULTAD DE CIENCIAS EXACTAS, FÍSICAS Y NATURALES.
UNIVERSIDAD NACIONAL DE CÓRDOBA.
http://estadisticaybiometria.wordpress.com
MANOVA:
Análisis Multivariado de la Varianza
Repaso: ANOVA
Objetivo del ANOVA:
H0: 1=...=a= 0H1: Al menos un tratamiento tiene efecto no nulo
oH0: µ1=...=µa
H1: Al menos un tratamiento tiene una media distinta
¿Hay diferencias significativas entre lasmedias
de los tratamientos?
¿SUPUESTOS?
EJEMPLO…
1 respuesta cuantitativa 1 explicativa cualitativa o factor
Repaso: ANOVA
ANOVA : variable Largo de sepalo
VersicolorVirginica
Setosa
ANOVA
Iris SepalLen
Setosa 5,10
Setosa 4,90
Setosa 5,40
Setosa 4,60
… …
Versicolor 6,60
Versicolor 5,20
Versicolor 6,10
Versicolor 5,60
Versicolor 6,70
…. …
Virginica 5,80
Virginica 6,80
Virginica 6,20
Virginica 5,90
Variable N R² R² Aj CV
SepalLen 150 0,62 0,61 8,81
Cuadro de Análisis de la Varianza (SC tipo III)
F.V. SC gl CM F p-valor
Modelo. 63,21 2 31,61 119,26 <0,0001
Iris 63,21 2 31,61 119,26 <0,0001
Error 38,96 147 0,27
Total 102,17 149
Test:Tukey Alfa=0,05 DMS=0,24166
Error: 0,2650 gl: 147
Iris Medias n E.E.
Virginica 6,59 50 0,07 A
Versicolor 5,94 50 0,07 B
Setosa 5,01 50 0,07 C Medias con una letra común no son significativamente diferentes (p > 0,05)
Setosa Versicolor Virginica
Iris
0,00
2,00
4,00
6,00
8,00
Se
pa
lLe
n
Largo de sepalo
MANOVA
Iris SepalLen PetalLen
Setosa 5,10 1,40
Setosa 4,90 1,40
Setosa 4,70 1,30
Setosa 4,60 1,50
Setosa 5,00 1,40
Setosa 5,40 1,70
Setosa 4,60 1,40
.. .. ..
Versicolor 7,00 4,70
Versicolor 6,40 4,50
Versicolor 6,90 4,90
Versicolor 5,50 4,00
.. .. ..
Virginica 7,90 6,40
Virginica 6,40 5,60
Virginica 6,30 5,10
Virginica 6,10 5,60
p respuestas cuantitativas 1 explicativa cualitativa o factor
Ejemplo: Agregamos una variable: Largo de Pétalo
SepalLen-Setosa SepalLen-Versicolor SepalLen-Virginica
0,00 1,60 3,20 4,80 6,40 8,00
PetalLen
4,0
5,0
6,0
7,0
8,0
Se
pa
lLe
n-V
irg
inic
a
2525
SepalLen-Setosa SepalLen-Versicolor SepalLen-Virginica
SepalLen-Setosa SepalLen-Versicolor SepalLen-Virginica
0,00 1,60 3,20 4,80 6,40 8,00
PetalLen
4,0
5,0
6,0
7,0
8,0
Se
pa
lLe
n-V
irg
inic
a
SepalLen-Setosa SepalLen-Versicolor SepalLen-Virginica
0,00 2,00 4,00 6,00 8,00
PetalLen
4,00
5,00
6,00
7,00
8,00
Se
pa
lLe
n
Centroide
Corrige la redundancia (Relacion entre las VDs*)Minimiza la varianza dentro de grupos y maximiza la variabilidad entre grupos
http://www.datavis.ca/gallery/animation/manova/
T = H + E
DENTRO
ENTRE
MANOVA
¿Qué pregunta podemos contestar con un MANOVA?
¿Hay diferencias significativas entre losvectores promedio
de los tratamientos?
¿Se requieren supuestos para que los resultados de un MANOVA sean válidos?
En lugar de tener una media (o un efecto) por tratamiento, tenemos vectores medios
MANOVA: Largo de Sépalo
Ancho de Sépalo
Largo de Pétalo
Ancho de Pétalo
H0 : µ1= µ2 = ,…, = µa
µ1 es el vector de medias de las variables en el tratamiento 1
Iris SepalLen SepalWid PetalLen PetalWid
Setosa 5,10 3,50 1,40 0,20
Setosa 4,90 3,00 1,40 0,20
Setosa 4,70 3,20 1,30 0,20
Setosa 4,60 3,10 1,50 0,20
Setosa 5,00 3,60 1,40 0,20
Setosa 5,40 3,90 1,70 0,40
Setosa 4,60 3,40 1,40 0,30
.. .. .. .. ..
Versicolor 7,00 3,20 4,70 1,40
Versicolor 6,40 3,20 4,50 1,50
Versicolor 6,90 3,10 4,90 1,50
Versicolor 5,50 2,30 4,00 1,30
.. .. .. .. ..
Virginica 7,90 3,80 6,40 2,00
Virginica 6,40 2,80 5,60 2,20
Virginica 6,30 2,80 5,10 1,50
Virginica 6,10 2,60 5,60 1,40
Total (T)= Entre clases (B) + Intra clases (W)
T = H + E
MANOVA
λ de Wilks: det(E)/det(H+E)
Traza de Pillai: traza de (H(H+E) -1)
Traza de Hottelling-Lawley: traza (H E) -1
Raiz máxima de Roy: mayor autovalor de E-1 E
Todos se basan en propiedades de la matriz inv(E)H y cuantifican la relación entre la variabilidad entre y dentro de grupos en sentido multivariado, por lo que su distribución aproximada es la distribución F
Si los grupos de variables tienen medias significativamente diferentes, ¿en qué variables difieren?
Comparaciones múltiples de Tukey (univariado) :::> HOTELLING (multivariado
Intervalos de Bonferroni (univariado) :::> HOTELLING corregida (multivariado)
.
Normalidad Multivariada.
Homogeneidad de las matriz de covarianza.
Independencia
Linealidad
Box's M test
Distancia de Mahalanobis Test
Graficos de dispersion
Diseño
DESVENTAJAS DEL MANOVA
Outliers :
Como en ANOVA, MANOVA es sensible a los puntos
extremos .
Esto influye en el error Tipo 1.
Multicolinealidad y Singularidad:
Alta correlacion entre DVs.
Una VD es combinacion lineal de otra/s VD/s
Esto es redundancia: corregir el modelo.
1.Sensible a los datos faltantes.