Análisis Factoria l - cms.dm.uba.ar

Preview:

Citation preview

Análisis Factorial

Análisis Factorial

•  Objetivos:

– Describir la variabilidad en conuntos de variables numéricas altamente relacionadas.

– Método alternativo a PCA. – Descubrir variables latentes (factores). – Obtener una representación gráfica de los

datos (variables). – Gráficar relaciones entre variables

observadas.

Analisis Factorial: El modelo

x1

x2

xp

µ1

µ2

µp

u1

u2

up

… = + +

λ11

… λ1m

λp1

… λpm

f1

fm

Factores

Observaciones

Errores Medias

Matriz de Cargas

Cualquier parecido con una regresión es pura coincidencia

No observable Observable

Individuo Variable

Propiedades del modelo

varianza común

Varianza propia

Observaciones normales

La Matriz de Carga es la Matriz de Cov. entre Variables y Factores

Identificabilidad

Solo está Identificado el espacio generado por las columnas de

Posibles soluciones

No correlacionados

Rotación elegida

Cantiad máxima de factores

VARIMAX

Ejemplo: Vestimenta

… 8 Marcas

10 Variables

176 Datos

22 Personas

Análisis descriptivo

Matriz de Correlaciones

Maximum Likelihood Varimax

Varianza propia

Loadings

Proporción variabilidad explicada

Varianza común

Gráfico factorial

Variables

Diagrama Factorial

Factores

Variables

Cargas

Mapping

Mapping Multi-Dimensional Scaling

•  Técnica estadística que, partiendo de nociones de similitud relativas entre objetovs, permite el posicionamiento en el plano (mapeo) de los objetos de interes.

Relacion entre posicion y distancia (caso métrico)

M

x

y

z

M

x

yz

Relacion entre posicion y distancia (caso NO métrico)

M

x

yz

= 3

= 1

= 1 ?

Los datos Matriz de disimilaridades (D) entre los objetos C1 a Cn C1 … Cl Ci Cj … Cn

C1 0 … Cl 0 D(Cl,Ci) D(Cl,Cj)

Ci D(Cl,Ci)

0 D(Ci,Cj)

Cj

… D(Cl,Cj)

D(Ci,Cj)

0 …

… Cn 0

Dadas las coordenadas de los objetos en algun espacio de dimensión grande, centramos los datos

buscamos que minimizen

El Método Clásico (métrico)

Función de STRESS

Dadas las disimilaridades para todo I≠ j buscamos que minimizen

El Método General (métrico)

Sammon

O bien

LS

Dadas las disimilaridades para todo I≠ j buscamos que minimizen

El Método No Métrico

No metrico

Función monótona creciente

Ejemplo: Destinos turísticos