Upload
others
View
5
Download
0
Embed Size (px)
Citation preview
1
Metodi ricerca
comunicazione
XI - ANALISI FATTORIALE e
ACP
1
XI - ANALISI FATTORIALE E A. DELLE COMPONENTI
PRINCIPALI: INTRODUZIONE
Metodi ricerca
comunicazione
XI - ANALISI FATTORIALE e
ACP
2
PREMESSA
2
Metodi ricerca
comunicazione
XI - ANALISI FATTORIALE e
ACP
3
1) LE RELAZIONI SEMANTICHE FRA
VARIABILI CARDINALI
La correlazione statistica fra variabili stima la loro prossimitàsemantica
Z è più correlato a X (= è piùprossimo semanticamente �condivide parte dell’estensione semantica) di quanto lo sia YW non è correlato con Y, X, Z (= non ha alcuna area semantica in comune con loro)
Metodi ricerca
comunicazione
XI - ANALISI FATTORIALE e
ACP
4
costruzione di un indice:
• occorre coprire più
possibile la dimensione semantica dell’indice,
cercando indicatori
prossimi (“congrui”) ed
escludendo quelli
estranei
QUINDI:
• Definizione semantica dell’indice � ricerca di
indicatori “congrui”.
INDICE YXZ
3
Metodi ricerca
comunicazione
XI - ANALISI FATTORIALE e
ACP
5
• Altre volte si può presupporre che se piùvariabili sono correlate fra loro (= sono semanticamente vicine) ciò accade perché hanno elementi semantici comuni = sono tutte indicatori di una dimensione latente
che deve essere ricercata, esplicitata (e poi tradotta in una variabile-indice)
QUINDI
• indicatori � dimensione latente � indice
“fattore”“componente”
Metodi ricerca
comunicazione
XI - ANALISI FATTORIALE e
ACP
6
Variabili correlate
a “grappoli”.
Ogni grappolo può
essere concepito
come un gruppo di
indicatori di una
dimensione latente
4
Metodi ricerca
comunicazione
XI - ANALISI FATTORIALE e
ACP
7
2) LA CORRELAZIONERELAZIONE FRA DUE VARIABILI CARDINALI RAPPRESENTATA MEDIANTE DIAGRAMMA A DISPERSIONE
=
Assi cartesiani: ogni asse è una variabile, ogni punto è un caso
Assi cartesiani: ogni asse è una variabile, ogni punto è un caso
Y
0 X
RELAZIONE MONOTONICA E TENDENZIALMENTE LINERARE = X cresce insieme ad Y ( monotonicità) con tasso tendenzialmente costante (linearità).
Pro-memoria
Metodi ricerca
comunicazione
XI - ANALISI FATTORIALE e
ACP
8
Il coefficiente di correlazione
r di Pearson
Il coefficiente di correlazione r (va da 0 a ±1) misura quanto i punti si distribuiscono linearmente � quanto è stretta la relazione fra X ed Y.
Associazione
più intensaAssociazione
meno intensa
Pro-memoria
5
Metodi ricerca
comunicazione
XI - ANALISI FATTORIALE e
ACP
9
CONFRONTABILITA’ DI r PER VARIABILI DIVERSE: MATRICE DI CORRELAZIONE UMBRIA: MATRICE DI CORRELAZIONE FRA ALCUNE VARIABILI (Unità di analisi = Comuni)
INCRNAT INVECC VECCH INDVARDEM INDRED NONDIPL ALFAB ANALFAB
ALANALF
INCRNAT 1
INVECC -0,479 1
VECCH -0,346 0,825 1
INDVARDEM 0,321 -0,518 -0,404 1
INDRED 0,381 -0,518 -0,205 0,254 1
NONDIPL -0,224 0,359 0,168 -0,282 -0,709 1
ALFAB -0,166 0,209 -0,121 -0,291 -0,500 0,414 1
ANALFAB 0,015 0,144 -0,028 -0,139 -0,392 0,442 0,467 1
ALANALF -0,139 0,215 -0,111 -0,285 -0,526 0,466 0,976 0,649 1
Pro-memoria
Metodi ricerca
comunicazione
XI - ANALISI FATTORIALE e
ACP
10
L’ANALISI FATTORIALE
6
Metodi ricerca
comunicazione
XI - ANALISI FATTORIALE e
ACP
11
1. FUNZIONI
1) Costruzione di un INDICE con var. cardinali come indicatori; 2) Dato un insieme di indicatori che si ritiene possano riferirsi a PIU’ DI UNA
DIMENSIONE (antropologica, psicologica, sociologica, …) SUDDIVIDERE L’INSIEME degli indicatori in modo che: - alcuni indicatori vengano attribuiti esclusivamente / prevalentemente ad una dimensione;
- altri indicatori ad un’altra dimensione;
- etc.
EVENTUALMENTE: 3) Far emergere dimensioni concettuali inizialmente IMPREVISTE da chi ha
selezionato quel paniere di indicatori per rilevare un certo arco di dimensioni.
Metodi ricerca
comunicazione
XI - ANALISI FATTORIALE e
ACP
12
2. OBIETTIVIIn stretta connessione con queste funzioni si trovano 2 obiettivi/approcci:
a)SINGLE F.A.:
Il ricercatore ha idee chiare sulla proprietà da rilevare empiricamente attraverso UN indice. Egli vuole solo avere elementi empiricamente basati per graduare la validità degli indicatori � il ricercatore punta ad estrarre un solo fattore-indice = la SFA serve alla funzione 1: v. slide precedente);
% pop. attiva nel
terziario % laureati % lettori
quotidiani ↓
INDICE di modernizzazione
7
Metodi ricerca
comunicazione
XI - ANALISI FATTORIALE e
ACP
13
b) MULTIPLE F.A. : serve alla funzione 2) = suddivisione degli indicatori in più grappoli. Ciascun grappolo viene attribuito ad un fattore.
FATTORE = principio latente di organizzazione e di coerenza fra indicatori (soggiacente p. es. alle risposte degli intervistati). E’a un livello più generale �può essere più interessante dei singoli indicatori
Fatt 1 Fatt 2 Fatt 3
Ind 1 Ind 2 Ind 3 Ind 4 Ind 5 Ind 6 Ind 7 Ind 8 Ind 9 Ind 10
Metodi ricerca
comunicazione
XI - ANALISI FATTORIALE e
ACP
14
NB: SFA e MFA = obiettivi ex ante: i risultati
possono contraddire gli obiettivi
.
Da una SFA può � più dimensioni
concettuali ben distinte e con sostanza semantica, di cui alcune o tutte erano
impreviste: vedi funzione 3);
Da una MFA � una sola dimensione
rilevante
8
Metodi ricerca
comunicazione
XI - ANALISI FATTORIALE e
ACP
15
SINGLE FACTOR ANALYSIS
Metodi ricerca
comunicazione
XI - ANALISI FATTORIALE e
ACP
16
Obiettivo a)COSTRUZIONE DI UN INDICE
In base ad una valutazione semantica, il ricercatore ritiene che alcunevariabili siano indicatori di un’unica dimensione concettuale.
C
a b c d
a, b, c e d rappresentano semanticamente parte dell’estensione di C
Pro-memoria
9
Metodi ricerca
comunicazione
XI - ANALISI FATTORIALE e
ACP
17
1) Indice additivo
1) INDICE ADDITIVO � Si ritiene equivalente il contributo semantico di
ciascun indicatore all’indice. Indicatore
a
Indicatore b
Indicatore c
Indicatore d
INDICE C
Pro-memoria
Metodi ricerca
comunicazione
XI - ANALISI FATTORIALE e
ACP
18
a) Frasi contro-scalate: Molto
d’accordo Abbastanza d’accordo
Poco d’accordo
Per nulla d’accordo
Lavorare il minimo e portare a casa lo questione di volontà e voglia di lavorare � � � �
Questi pian piano ci spremono come limoni e
quando saremo ben spremuti ci manderanno
via.
�
�
�
�
I capi qui usano gli operai come pedine, li
spostano da una parte all’altra senza rispettare
i bisogni degli operai, li stressano.
�
�
�
�
Nell’UTE ti riconoscono i meriti quando lavori
bene.
�
�
�
�
Quando lavoro nello stabilimento faccio il mio
4 2 1 0
10
Metodi ricerca
comunicazione
XI - ANALISI FATTORIALE e
ACP
19
Limiti di un indice additivo
• NON VI E’ SELEZIONE DI INDICATORI � non si prevede di scartare alcun indicatore.
• Equivalenza semantica � SI SOMMANO per ciascun caso i punteggi ottenuti � posizione di ciascun caso sull’indice.
• soluzione banale e ingiustificata � i legami semantici indicatori - proprietà indicata spesso sono diversi (v. figura slide 8);
• non vi è alcun controllo empirico che ciascuna variabile sia davvero indicatore di quella proprietà indicata.
Metodi ricerca
comunicazione
XI - ANALISI FATTORIALE e
ACP
20
2) Items analysis
VERSIONE RUDIMENTALE:
svolge la stessa funzione dell’AF, ma senza algebra matriciale = èun’AF “a occhio” = matrice di correlazione fra le variabili scelte dal ricercatore come indicatori �si eliminano gli indicatori che risultano meno congruenti (sulla base delle correlazioni binarie) con l’insieme degli altri indicatori � si costruisce un indice additivocon gli indicatori superstiti.
VERSIONE “PART-WHOLE”
si calcola un indice meramente additivo � si correla ciascun indicatore con l’indice additivo �si eliminano gli indicatori con bassa correlazione � si ricalcolal’indice additivo solo in base agli indicatori superstiti.
11
Metodi ricerca
comunicazione
XI - ANALISI FATTORIALE e
ACP
21
3) Analisi fattoriale
• Fine ‘800: F. Galton: è il primo ad usare test mentali.
• Presuppone che le capacità rilevate nei test, cioè tutti gli “indicatori”adottati, derivino da una sola dimensione, un unico “fattore G.I.”(General Intelligence) , cioè un fattore intellettivo generale. Difficoltà� mancanza di tecniche di analisi dei dati
• C. Spearman aggiunge le sue competenze di algebra matriciale che consentono la soluzione tecnica al problema di rilevare il “fattore G.I” � contributo fondamentale alla SFA
• SUCCESSIVAMENTE lo sviluppo delle varie discipline e dell’analisi dei dati e la diffusione – negli ultimi decenni – dei calcolatori hanno determinato il moltiplicarsi delle possibilità offerte dall’AF.
Metodi ricerca
comunicazione
XI - ANALISI FATTORIALE e
ACP
22
PROCEDURA DELLA S.F.A.
1. Sottoporre il paniere di indicatori ad analisi algebriche � calcolo dei factor loadings.
2. Scartare gli indicatori meno correlati con la dimensione generale (“fattore”), cioè quelli con factor loadings piùbassi.
I factor loadings sono gli
equivalenti dei coefficienti
di correlazione fra 2 variabili; ma
in AF la correlazione è fra
variabile e fattore: vedi dopo.
12
Metodi ricerca
comunicazione
XI - ANALISI FATTORIALE e
ACP
23
Per stabilire la soglia sotto la quale si trovano gli indicatori da scartare occorre considerare anche l’insieme dei f.l.
VALUTAZIONE CONTESTUALE DEI F.L.:
E non viene eliminatoE viene eliminato
0,20E0,20E
0,26
0,24
0,23
0,22
A
B
C
D
0,56
0,54
0,48
0,39
A
B
C
D
FACTOR L.INDICATORIFACTOR L.INDICATORI
Esempio 2:Esempio 1:
Metodi ricerca
comunicazione
XI - ANALISI FATTORIALE e
ACP
24
3. Ponderare il peso degli indicatori superstiti con coefficienti sensibili al grado di vicinanza semantica di ciascun indicatore alla proprietà indicata (= sensibili alla validità).
C
a b c d
d è l’indicatore
più valido;
b è il meno
valido
13
Metodi ricerca
comunicazione
XI - ANALISI FATTORIALE e
ACP
25
MA: un factor loading:
i. stima la validità = la parte indicante che però ogni indicatore condivide con altri indicatori;
ii. risente anche della vicinanza agli altri indicatori � utilizzare il factor loading direttamente come coefficiente di ponderazione sarebbe come costruire un edificio utilizzando più volte gli stessi mattoni = costruire l’indice sfruttando piùvolte lo stesso materiale semantico = ridondanza.
Metodi ricerca
comunicazione
XI - ANALISI FATTORIALE e
ACP
26
ALLORA:
4. Occorre depurare i f.l., stimando il contributo netto di ciascun indicatore all’indice (= usare 1 sola volta ciascun mattone).
Attraverso una procedura che equivale a una regressione multipla, è possibile utilizzare (gli equivalenti dei “beta weights”, cioè) i factor score coefficients = coefficienti che moltiplicheranno il punteggio standardizzato di ciascun individuo su ciascun indicatore nell’equazione finale che costruisce l’indice.
14
Metodi ricerca
comunicazione
XI - ANALISI FATTORIALE e
ACP
27
Ossia: In base ai f.s.c., è possibile ponderare per ciascun caso il punteggio su ciascun indicatore � sommare i punteggi così ottenuti � punteggio di quel caso sull’indice � ripetere la stessa procedura per ciascun altro caso � nuovo vettore-colonna con i punteggi di tutti i casi sull’indice.
INDxi = S1V1i + S2V2i + SmVmi
MATRICE C x V FACTOR SCORE COEFFICIENTS (S)
i V1 V2 … Vm S1 - 0,05
Tizio -0,89 - 0,25 … 2,20 S2 0,77
Caio 2,50 0,01 … - 0,93 Sm 0,32
CALCOLO DEI PUNTEGGI DI CIASCUN CASO SULL’INDICE: PUNTEGGIO SULL’INDICE
Ponderazione
V1 Ponderazione
V2 Ponderazione
… Ponderazione
Vm
Punteggio Tizio =
(- 0,05) (-0,89) +
(0,77) (-0,25) +
…… +
(0,32) (2,20)
Punteggio Caio =
(- 0,05) (2,50) +
(0,77) (-0,01) +
…… +
(0,32) (0,93)
Metodi ricerca
comunicazione
XI - ANALISI FATTORIALE e
ACP
28
Vantaggi:• Stima validità degli indicatori
• Esclusione indicatori troppo poco validi;
• Ponderazione degli indicatori superstiti in
base al diverso grado di validità;
• Standardizzazione dei punteggi ponderati;
somma dei punteggi così trattati
= INDICE
15
Metodi ricerca
comunicazione
XI - ANALISI FATTORIALE e
ACP
29
ESCLUSIONE INDICATORI SI’ NO
SI’
Multiple AF
Single AF
P
ON
DE
RA
ZIO
NE
NO
Items analysis
Indici additivi (in genere)
Metodi ricerca
comunicazione
XI - ANALISI FATTORIALE e
ACP
30
MULTIPLE FACTOR ANALYSIS= individuazione di più dimensioni
semantiche
16
Metodi ricerca
comunicazione
XI - ANALISI FATTORIALE e
ACP
31
Il ricercatore ritiene che sottostanti alcuni indicatori ci siano PIU’ dimensioni significative, più concetti generali (= “fattori”) (cfr SFA: 1 fattore, 1 indice) C1 C2 C3
var1 var2 var3 var4 var5 var6
C1, C2, C3 = concetti generali, dimensioni latenti Var = variabili legate ai concetti generali da legami semantici = rapporti di indicazione.
Metodi ricerca
comunicazione
XI - ANALISI FATTORIALE e
ACP
32
PROCEDURA DELLA M.F.A.1. La matrice di correlazione fra variabili è sottoposta ad
una complessa elaborazione algebrico-matriciale , fino a
giungere ad una MATRICE FATTORI PER VARIABILI
MATRICE FATTORI PER VARIABILI
Fattore1 Fattore 2 Fattore n Variabile 1 Variabile 2 0,32 Variabile 3 Variabile n
Ogni cella contiene un factor loading = quantificazione del legame di rappresentanza semantica che la variabile in riga ha con i fattori in colonna = stima della validità di ciascuna variabile rispetto a ciascun fattore. Per ciascun fattore il ricercatore seleziona le variabili che hanno ottenuto factor loadings più alti.
17
Metodi ricerca
comunicazione
XI - ANALISI FATTORIALE e
ACP
33
Scomposizione dell’insieme delle variabili:
• alcune vengono attribuite al Fattore 1 (che rileva la dimensione concettuale C1);
• altre vengono attribuite la Fattore 2 (che rileva la dimensione concettuale C2);
• etc.
Esempio: DISTANZA DA CIASCUN PARTITO (factor loadings) Fattore 1 Fattore 2
AN - 0,77 0,04 CCD - 0,55 0,64 CDU - 0,38 0,70
FI - 0,72 0,13 Lega Nord - 0,02 0,22 Patto Segni 0,18 0,56
PPI 0,22 0,64 PDS 0,86 0,23 RC 0,76 0,09
Riformatori 0,15 0,34 Verdi 0,36 0,14
Fattore 1 = sinistra-destra Fattore 2 = centro cattolico
Metodi ricerca
comunicazione
XI - ANALISI FATTORIALE e
ACP
34
EMERSIONE DI DIMENSIONI INIZIALMENTE NON
PREVISTE
18
Metodi ricerca
comunicazione
XI - ANALISI FATTORIALE e
ACP
35
Esempio (Tullio Altan-Marradi 1974): INDICATORE ETICHETTA
Esistenza soprannaturale 4 Riti come base della religione 8 Religione garantisce ordine e pace 14 Importanza persone di fiducia per giudizi personali 17 Affermazioni autorità ecclesiale sono vere e giuste 19 Chiesa è grande madre che dà sicurezza 22 Verità principi di fede 25 La gente non sa cosa è meglio per se stessa 27 No a lavoro fuori casa per donne 34 Affidarsi a esperienze di altri 35 Importanza imparare presto obbedienza ad autorità 36
ATTESE RICERCATORE: 17 19 22 14 34 4? Fattore Fattore deferenza 25 Fatt. tradizionalismo Conservatorismo Laico liberismo econ. 36 35 27 8
ANALISI FATTORIALE: 36
22 Fattore 1 4
19 8
Metodi ricerca
comunicazione
XI - ANALISI FATTORIALE e
ACP
36
F.
loadings INDICATORI SUPERSTITI F.
score c. 0,72 Chiesa è grande madre che dà sicurezza 0,24 0,70 Esistenza soprannaturale 0,22 0,68 Affermazioni autorità ecclesiale sono vere e giuste 0,21 0,67 Verità principi di fede 0,20 0,48 Riti come base della religione 0,15 0,54 Religione garantisce ordine e pace 0,14 0,28 Importanza imparare presto obbedienza ad autorità 0,07
CONCETTUALIZZAZIONE: il ricercatore deve cercare di capire quale concetto generale sia rilevato attraverso quel particolare indice costruito secondo quella procedura, in base a quei f.loadings e f.score coefficients.
NON religiosità: non vengono considerati alcuni aspetti della religiosità (etica, carità, impegno sociale…);
NON tradizionalismo religioso: ritualismo (8) e quietismo (14) sono in posizioni marginali;
MA dimensione più rassicurante, consolatoria della religione: sia sul piano affettivo (v. Chiesa-madre rassicurante); sia “ “ cognitivo (v. verità dell’autorità e verità dei dogmi) = FIDEISMO (“fideis”)
19
Metodi ricerca
comunicazione
XI - ANALISI FATTORIALE e
ACP
37
RAPPRESENTAZIONI GRAFICHE
Metodi ricerca
comunicazione
XI - ANALISI FATTORIALE e
ACP
38
Spesso è molto efficace riprodurre entro uno spazio cartesiano i factor loadings di ciascuna variabile su due fattori � individuazione di indici
20
Metodi ricerca
comunicazione
XI - ANALISI FATTORIALE e
ACP
39
Rappresentazione della posizione di ciascun caso rispetto a due indici elaborati mediante AF
Ero
Taa
LomM ar Ven
FvgUmb
Pie
Tos
Sar
Laz
Bas
A br
Lig
M ol
Cam
PugCal
Sic
-2,5
2,5
-2,0 2,0
Benes sere materiale
Ben
esse
re i
mm
ater
iale
Metodi ricerca
comunicazione
XI - ANALISI FATTORIALE e
ACP
40
ALCUNE DIFFERENZE FRA ANALISI FATTORIALE (AF) E
ANALISI DELLE COMPONENTI PRINCIPALI (ACP)
21
Metodi ricerca
comunicazione
XI - ANALISI FATTORIALE e
ACP
41
• AF = insieme di tecniche di estrazione dei fattori, fra le quali c’è l’ACP;
• SECONDO ALCUNI: AF serve per controllare ipotesi su struttura delle correlazioni fra variabili; se le ipotesi vengono confermate � inferenza dal campione alla popolazione. ACP invece èpiù esplorativa;
• COMUNQUE non ci sono vistose differenze fra i risultati dell’AF e quelli dell’ACP.