46
L’Analisi Fattoriale (PCA) con SPSS Cristina Zogmaister

LAnalisi Fattoriale (PCA) con SPSS Cristina Zogmaister

Embed Size (px)

Citation preview

Page 1: LAnalisi Fattoriale (PCA) con SPSS Cristina Zogmaister

L’Analisi Fattoriale (PCA) con SPSS

Cristina Zogmaister

Page 2: LAnalisi Fattoriale (PCA) con SPSS Cristina Zogmaister

Aprire lib/psico/corsi/zogmaister Trascinare SECONDA LEZIONE nel vostro

spazio Lanciare SPSS PASW 18 Aprire dal vostro spazio il file

customer_satisfaction.sav

Page 3: LAnalisi Fattoriale (PCA) con SPSS Cristina Zogmaister

L’Analisi Fattoriale è un processo iterativoPassi preliminari

• Selezionare e misurare un insieme di variabili

• verificare l’adeguatezza delle variabili – es. normalità delle distribuzioni, presenza di outlier, linearità delle relazioni, rapporto tra nr. di variabili e nr. di fattori attesi, rapporto tra nr. di variabili e nr. di soggetti.

Page 4: LAnalisi Fattoriale (PCA) con SPSS Cristina Zogmaister

L’Analisi Fattoriale è un processo iterativoAnalisi fattoriale (processo iterativo)

1. Eseguire una prima analisi fattoriale2. Determinare il numero di fattori3. Eseguire la rotazione

a) prima obliqua, b) poi eventualmente ortogonale

4. Interpretare i risultati e dare un nome ai fattori

Il criterio che guida l’AF è l’interpretabilità Una buona AF ‘ha senso’, una cattiva AF ‘non ha

senso’

Page 5: LAnalisi Fattoriale (PCA) con SPSS Cristina Zogmaister

L’Analisi Fattoriale è un processo iterativo

Passi successivi: verificare la struttura fattoriale (replicabilità), stabilire la validità di costrutto dei fattori

(correlazioni con altre variabili; effetto delle manipolazioni sui punteggi fattoriali)

Page 6: LAnalisi Fattoriale (PCA) con SPSS Cristina Zogmaister

File dati: customer_satisfaction.sav Intervista a 200 clienti di un ristorante Obiettivo: capire quali sono gli aspetti che

determinano il livello di soddisfazione nei confronti del ristorante

Ipotesi di partenza: 4 aspetti Qualità del cibo Qualità del servizio (cortesia del personale) Ambiente Prezzo

Page 7: LAnalisi Fattoriale (PCA) con SPSS Cristina Zogmaister

Il questionario

12 domande relative ai quattro aspetti ipotizzati alla base della soddisfazione dei clienti (x1 – x12) Qualità del cibo Qualità del servizio (cortesia del personale) Ambiente Prezzo

3 domande sulla soddisfazione (d1 – d3)

3 domande sociodemografiche

Page 8: LAnalisi Fattoriale (PCA) con SPSS Cristina Zogmaister

E’ possibile riassumere le risposte relative alla soddisfazione nelle 4 dimensioni ipotizzate? Sono rispettati i prerequisiti per un’analisi fattoriale?

Ampiezza del campione idealmente 300 casi o più, ma dipende da numero di fattori, forza

delle relazioni tra le variabili Adeguato numero di variabili

Almeno 3 per ogni fattore (meglio di più) Ci sono outlier univariati (e multivariati)? Le variabili sono distribuite normalmente?

Se le variabili non sono normali, la soluzione è meno chiara (e non si possono applicare test statistici che implicano la normalità)

Le relazioni tra le coppie di variabili sono lineari? La matrice è fattorializzabile?

correlazioni bivariate sufficientemente elevate (>|.30|) test di Bartlett (troppo sensibile)

Page 9: LAnalisi Fattoriale (PCA) con SPSS Cristina Zogmaister

L’analisi fattoriale

Analizza Riduzione dimensione

Fattoriale

Page 10: LAnalisi Fattoriale (PCA) con SPSS Cristina Zogmaister

Scegliamo le variabili su cui vogliamo operare la PCA (x1 – x12)

Page 11: LAnalisi Fattoriale (PCA) con SPSS Cristina Zogmaister

Indicazioni di base

Chiediamo la matrice delle correlazioni Metodo di estrazione: PCA Numero di fattori (per il momento non lo

conosciamo) Scree plot

Page 12: LAnalisi Fattoriale (PCA) con SPSS Cristina Zogmaister
Page 13: LAnalisi Fattoriale (PCA) con SPSS Cristina Zogmaister

Default: criterio mineigen

Default: PCA

Page 14: LAnalisi Fattoriale (PCA) con SPSS Cristina Zogmaister

Esaminiamo l’output

Matrice di correlazioni iniziali: diversi r>|.30|

Page 15: LAnalisi Fattoriale (PCA) con SPSS Cristina Zogmaister

Comunalità

È la somma dei quadrati delle correlazioni della variabile con i fattori. Indica quanta della varianza della variabile è spiegata dai fattori

Page 16: LAnalisi Fattoriale (PCA) con SPSS Cristina Zogmaister

Varianza totale spiegataLa varianza totale spiegata dai fattori (prima della rotazione)

3.159 / 12 = .26325 = 25%

Mineigen

Page 17: LAnalisi Fattoriale (PCA) con SPSS Cristina Zogmaister

Scree plot

Sia lo scree plot, sia il criterio mineigen suggeriscono la presenza di 4 componenti

Page 18: LAnalisi Fattoriale (PCA) con SPSS Cristina Zogmaister

Matrice delle componentiMatrice di correlazione tra le componenti e le variabili.

Tutti e quattro i fattori sono correlati in maniera sostanziale (r>|.32|) con molte variabili e le variabili sono correlate con più fattori.

La soluzione non è chiara (perché non è stata fatta la rotazione)

Page 19: LAnalisi Fattoriale (PCA) con SPSS Cristina Zogmaister

Eseguiamo la rotazione

Ortogonale o obliqua?

Prima obliqua, se non ci sono correlazioni sostanziali passiamo a una rotazione ortogonale.

Page 20: LAnalisi Fattoriale (PCA) con SPSS Cristina Zogmaister
Page 21: LAnalisi Fattoriale (PCA) con SPSS Cristina Zogmaister

Matrice di correlazione tra le componenti (in fondo all’output)

Page 22: LAnalisi Fattoriale (PCA) con SPSS Cristina Zogmaister

Rotazione ortogonale (varimax) Varianza totale spiegata:

una nuova parte della tabella indica la varianza spiegata dai fattori dopo la rotazione

La varianza totale non cambia rispetto a prima della rotazione, ma è suddivisa in maniera diversa tra i fattori

Page 23: LAnalisi Fattoriale (PCA) con SPSS Cristina Zogmaister

Matrice delle componenti ruotata

Più chiara!!!

Ogni variabile ha saturazioni importanti su una sola componente.

Page 24: LAnalisi Fattoriale (PCA) con SPSS Cristina Zogmaister

Interpretiamo le componenti

1 = ?

2 = ?

3 = ?

4 = ?

Page 25: LAnalisi Fattoriale (PCA) con SPSS Cristina Zogmaister

Report dell’analisi

E’ stata condotta l’analisi delle componenti principali. Un primo esame dello screeplot suggeriva la presenza di 4 componenti. Anche il criterio Mineigen suggeriva una soluzione a 4 componenti. Questa numerosità corrispondeva a quella che era stata precedentemente ipotizzata in fase di costruzione del questionario.

Le analisi successive hanno confermato la presenza di 4 componenti, non correlate. Con una rotazione obliqua (criterio oblimin) emergeva una correlazione massima tra le componenti di r = |.167|, perciò è stata condotta una rotazione ortogonale (criterio varimax).

La soluzione a quattro componenti spiega il 75% della varianza osservata nelle variabili.

Le quattro componenti sono interpretate come: qualità del cibo, qualità del servizio, ambiente, prezzo.

La matrice delle componenti ruotate è presentata in Tab. 1.

Page 26: LAnalisi Fattoriale (PCA) con SPSS Cristina Zogmaister

Domanda n. 2: Le domande sulla soddisfazione (d1, d2, d3) possono essere riassunte in un unico punteggio? (la scala è monofattoriale?) Svolgete la PCA e provate a dare una

risposta.

Page 27: LAnalisi Fattoriale (PCA) con SPSS Cristina Zogmaister

Risposta

La PCA ha confermato la presenza di un unico fattore sottostante alle domande relative alla soddisfazione. I tre item sono altamente correlati tra di loro (correlazione minima r = .81) e un’unica componente spiega il 90 % della varianza.

Page 28: LAnalisi Fattoriale (PCA) con SPSS Cristina Zogmaister

Domanda n. 3Legame tra le 4 componenti e la soddisfazione Calcolo dei punteggi nei fattori

Punteggio fattoriale Punteggio sommato

Page 29: LAnalisi Fattoriale (PCA) con SPSS Cristina Zogmaister

Calcolo dei punteggi fattoriali Conduciamo l’analisi fattoriale

Estrazione: PCA Nr. componenti: 4 Rotazione: Varimax Calcolo dei punteggi fattoriali

Page 30: LAnalisi Fattoriale (PCA) con SPSS Cristina Zogmaister
Page 31: LAnalisi Fattoriale (PCA) con SPSS Cristina Zogmaister
Page 32: LAnalisi Fattoriale (PCA) con SPSS Cristina Zogmaister

Date etichette appropriate

Page 33: LAnalisi Fattoriale (PCA) con SPSS Cristina Zogmaister

Calcolare il punteggio fattoriale per la soddisfazione Correlazione tra i quattro fattori di valutazione

e il fattore di soddisfazione

Page 34: LAnalisi Fattoriale (PCA) con SPSS Cristina Zogmaister

Calcoliamo i punteggi sommati

s.cibo = x1 + x4 + x9s.personale = x6 + x11 + x12.s.ambiente = x2 + x7 + x8.s.prezzo = x3 + x 5 + x10.s.Sodd = d1 + d2 + d3.

Page 35: LAnalisi Fattoriale (PCA) con SPSS Cristina Zogmaister

Correlazioni

Tra punteggi fattoriali e punteggi sommati: sono molto alte

Tra punteggi sommati e soddisfazione: rivelano gli stessi legami già visti in precedenza.

Page 36: LAnalisi Fattoriale (PCA) con SPSS Cristina Zogmaister

Ora da soli: file personalità.sav A 459 persone è stato somministrato un questionario di self-report di

personalità

Dovevano valutare quanto si sentivano descritti da ciascuno di 44 diversi aggettivi

Ipotesi: 5 componenti (big five) Energia Amicalità Coscienziosità Stabilità emotiva Apertura mentale

Quante sono le componenti?Sono ortogonali o oblique?Corrispondono alle 5 componenti ipotizzate?

Page 37: LAnalisi Fattoriale (PCA) con SPSS Cristina Zogmaister

Quante sono le componenti?

Page 38: LAnalisi Fattoriale (PCA) con SPSS Cristina Zogmaister

Mineigen: 10

Page 39: LAnalisi Fattoriale (PCA) con SPSS Cristina Zogmaister

Quante sono le componenti?

Mineigen: massimo 10 Scree plot: 5 Attesa teorica: 5

Partiamo da 5 componenti, vediamo se la soluzione è interpretabile

Page 40: LAnalisi Fattoriale (PCA) con SPSS Cristina Zogmaister

Le componenti sono correlate? (Rotazione oblimin)No

Page 41: LAnalisi Fattoriale (PCA) con SPSS Cristina Zogmaister

Rotazione Varimax – prima componentecoscienziosità

Page 42: LAnalisi Fattoriale (PCA) con SPSS Cristina Zogmaister

Seconda componente: energia

Page 43: LAnalisi Fattoriale (PCA) con SPSS Cristina Zogmaister

Terza componente: (in)stabilità emotiva

Page 44: LAnalisi Fattoriale (PCA) con SPSS Cristina Zogmaister

Quarta componente: (mancanza di) amicalità

Page 45: LAnalisi Fattoriale (PCA) con SPSS Cristina Zogmaister

Quinta componente: apertura mentale

Page 46: LAnalisi Fattoriale (PCA) con SPSS Cristina Zogmaister

Da soli: BimbiCompetenze.sav 177 bambini della scuola per l’infanzia. Batteria di 10 test

Questi punteggi possono essere ridotti a un numero inferiore di dimensioni?

Quante? Quali? Sono correlate tra di loro? Quale percentuale di varianza osservata viene spiegata

complessivamente, quale percentuale di varianza viene spiegata da ciascuna dimensione?

Ci sono variabili pure? Quali?

Suggerimenti per migliorare la batteria di test?