46
Univerzitet u Nixu Prirodno-matematiqki fakultet Departman za matematiku Faktorska analiza i primene Master rad Mentor: Prof. Dr Aleksandar Nasti Student: Milica Stefanovi Nix, 2018.

Faktorska analiza i primene · 1.2. Kovarijansna struktura ortogonalnog faktorskog modela 9 Rexenje: Koristei faktorski model (1.1), dobijamo sledee X1 −µ1 = l11F1 +ϵ1 X2 −µ2

  • Upload
    others

  • View
    11

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Faktorska analiza i primene · 1.2. Kovarijansna struktura ortogonalnog faktorskog modela 9 Rexenje: Koristei faktorski model (1.1), dobijamo sledee X1 −µ1 = l11F1 +ϵ1 X2 −µ2

Univerzitet u Nixu

Prirodno-matematiqki fakultet

Departman za matematiku

Faktorska analiza i primene

Master rad

Mentor:Prof. Dr Aleksandar Nasti�

Student:Milica Stefanovi�

Nix, 2018.

Page 2: Faktorska analiza i primene · 1.2. Kovarijansna struktura ortogonalnog faktorskog modela 9 Rexenje: Koristei faktorski model (1.1), dobijamo sledee X1 −µ1 = l11F1 +ϵ1 X2 −µ2
Page 3: Faktorska analiza i primene · 1.2. Kovarijansna struktura ortogonalnog faktorskog modela 9 Rexenje: Koristei faktorski model (1.1), dobijamo sledee X1 −µ1 = l11F1 +ϵ1 X2 −µ2

SADR�AJ

1 Faktorska analiza 51.1 Ortogonalni faktorski model . . . . . . . . . . . . . . . . . . . . . 51.2 Kovarijansna struktura ortogonalnog faktorskog modela . . . . . . . 71.3 Metodi ocenjivanja . . . . . . . . . . . . . . . . . . . . . . . . . . . 11

1.3.1 Metod glavnih komponenti . . . . . . . . . . . . . . . . . . . 111.3.2 Ocena faktorskog modela primenom metoda glavnih komponenti 141.3.3 Modifikovani metod glavnih komponenti- Metod glavnih fak-

tora . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 171.3.4 Metod maksimalne verodostojnosti . . . . . . . . . . . . . . 181.3.5 Testiranje hipoteze o broju zajedniqkih faktora . . . . . . . 20

1.4 Faktorska rotacija . . . . . . . . . . . . . . . . . . . . . . . . . . 211.4.1 Ortogonalna faktorska rotacija . . . . . . . . . . . . . . . 211.4.2 Kosa rotacija . . . . . . . . . . . . . . . . . . . . . . . . . 24

1.5 Faktorski skorovi . . . . . . . . . . . . . . . . . . . . . . . . . . . 241.5.1 Ocena faktorskih skorova metodom ponderisanih najmanjih

kvadrata . . . . . . . . . . . . . . . . . . . . . . . . . . . . 251.5.2 Ocena faktorskih skorova regresionim metodom . . . . . . . 27

2 Primena faktorske analize 29

3

Page 4: Faktorska analiza i primene · 1.2. Kovarijansna struktura ortogonalnog faktorskog modela 9 Rexenje: Koristei faktorski model (1.1), dobijamo sledee X1 −µ1 = l11F1 +ϵ1 X2 −µ2

UvodPoqetak razvoja faktorske analize vezuje se za rad Karla Pirsona, Qarlsa

Spirmana i drugih nauqnika koji su pokuxavali da definixu i mere in-teligenciju, tako da su faktorsku analizu prevashodno razvijali nauqnicikoji su izuqavali psihometriju. Kako u to vreme jox uvek nije bilo dovoljnorazvijenih raqunara, razvoj faktorske analize kao statistiqkog metoda bioje usporen. Razvojem mo�nijih raqunara su se nastavila istra�ivanja vezanaza faktorsku analizu.

Zadatak faktorske analize je da opixe, ako je to mogu�e, kovarijansu vixepromenljivih pomo�u nekoliko fundamentalnih, ali neopa�ivih, sluqajnihveliqina koje �emo zvati faktorima. Pretpostavimo da sluqajne promenljivemo�emo grupisati prema njihovim korelacijama, tako da su sve promenljive ujednoj grupi me�usobno jako korelisane, ali su slabo korelisane sa promenlji-vama u drugim grupama. Tada mo�emo pretpostaviti da za svaku grupu postojijedinstven faktor koji utiqe na tu grupu i koji je odgovoran za postoje�ukorelacju. Na primer, u svojim istra�ivanjima Spirman je, kao faktorkoji je odgovoran za korelaciju rezultata testova iz francuskog, engleskog,matematike i muziqkog, predlo�io ”inteligenciju”. U drugoj grupi Spir-manovog istra�ivanja, u kojoj su bili rezultati testiranja fiziqke sprem-nosti, pretpostavio je da postoji neki drugi faktor koji je odgovoran zakorelacije izme�u rezultata. Zadatak faktorske analize je da ovakve pret-postavke potvrdi.

Faktorska analiza se mo�e smatrati nastavkom analize glavnih kompo-nenti, s obzirom da obe imaju za cilj aproksimaciju kovarijansne matrice.Me�utim, faktorski model aproksimacije kovarijansne matrice se smatraslo�enijim, s obzirom da je potrebno da podaci budu konzistentni sa opisanomkovarijansnom strukturom.

U ovom radu je najpre uveden pojam ortogonalnog faktorskog modela, zatimsu, kao modeli ocenjivanja faktorskog modela, opisani metod glavnih kompo-nenti, metod glavnih faktora i metod maksimalne verodostojnosti. Tako�e,obra�eni su i faktorska rotacija i faktorski skorovi, kao karakteristikefaktorske analize koje olakxavaju interpretaciju faktorske analize.

Zahvaljujem se svom mentoru prof. dr Aleksandru Nasti�u na podrxci ipomo� prilikom izradi master rada.

Page 5: Faktorska analiza i primene · 1.2. Kovarijansna struktura ortogonalnog faktorskog modela 9 Rexenje: Koristei faktorski model (1.1), dobijamo sledee X1 −µ1 = l11F1 +ϵ1 X2 −µ2

Deo 1

Faktorska analiza

1.1 Ortogonalni faktorski model

Vixedimenzionalna sluqajna promenljiva tj. sluqajni vektor predstavljavektor qije su komponente jednodimenzionalne sluqajne promenljive. Tada jematematiqko oqekivanje sluqajnog vektora vektor qije su komponente matema-tiqka oqekivanja sluqajnih promenljivih koje su komponente tog sluqajnog vek-tora, dok kovarijansnu matricu tog sluqajnog vektora predstavlja simetriqnakvadratna matrica qiji su elementi kovarijanse komponenti tog sluqajnogvektora, odnosno ako je data p-dimenzionalna sluqajna promenljivaX = (X1, X2, . . . , Xp)

′, tada je

E (X) = (E (X1) ,E (X2) , . . . ,E (Xp))′

i

Σ =

cov(X1, X1) cov(X1, X2) · · · cov(X1, Xp)cov(X2, X1) cov(X2, X2) · · · cov(X2, Xp)

......

. . ....

cov(Xp, X1) cov(Xp, X2) · · · cov(Xp, Xp)

.Neka je dat p-dimenzionalni sluqajni vektor X, koji predstavlja sluqajne

vrednosti posmatranog obele�ja, qije je matematiqko oqekivanje µ i kovari-jansna matrica Σ. U modelu faktorske analize pretpostavljamo da je vektorX linearno zavisan od neopa�ivih sluqajnih promenljivih F1, F2, . . . , Fm, kojese nazivaju zajedniqki faktori, i p dodatnih izvora varijacije ϵ1, ϵ2, . . . , ϵp,koji se nazivaju grexke, ili specifiqni faktori. U razvijenom obliku, fak-

5

Page 6: Faktorska analiza i primene · 1.2. Kovarijansna struktura ortogonalnog faktorskog modela 9 Rexenje: Koristei faktorski model (1.1), dobijamo sledee X1 −µ1 = l11F1 +ϵ1 X2 −µ2

6 1. Faktorska analiza

torski model je zadat na slede�i naqin

X1 − µ1 = l11F1 + l12F2 + · · ·+ l1mFm + ϵ1

X2 − µ2 = l21F1 + l22F2 + · · ·+ l2mFm + ϵ2...

Xp − µp = lp1F1 + lp2F2 + · · ·+ lpmFm + ϵp

(1.1)

ili, u matriqnom zapisu,

X− µ(p×1)

= L(p×m)

F(m×1)

+ ϵ(p×1)

(1.2)

gde je

X′ = (X1, X2, . . . , Xp) ,

µ′= (µ1, µ2, . . . , µp) ,

F′ = (F1, F2, . . . , Fm) ,

ϵ′ = (ϵ1, ϵ2, . . . , ϵp)

i

L =

l11 l12 · · · l1ml21 l22 · · · l2m...

.... . .

...lp1 lp2 · · · lpm

.

Elementi matrice L, tj. li,j nazivaju se optere�enja i-te promenljive Xi

na j-tom zajedniqkom faktoru Fj, i = 1, p, j = 1,m pa se matrica L nazivamatrica faktorskih optere�enja. Primetimo da je i-ti specifiqni faktorϵi povezan samo sa i-tom realizacijom Xi, xto znaqi da specifiqni faktoriutiqu samo na pojedinaqne realizacije. Razlike X1 − µ1, X2 − µ2, . . . , Xp − µp

su izra�ene pomo�u p +m sluqajnih promenljivih F1, F2, . . . , Fm, ϵ1, ϵ2, . . . , ϵpkoje su neopa�ive (latentne) sluqajne promenljive.

Pored ovoliko neopa�ivih komponenti, vrlo je texko direktno odreditifaktorski model iz opservacija X1, X2, . . . , Xp, ali uz neke dodatne pret-postavke o faktorskim vektorima F i ϵ, model implicira odre�ene kovar-ijansne veze, koje mogu biti proverene.

Pretpostavimo da va�i

Page 7: Faktorska analiza i primene · 1.2. Kovarijansna struktura ortogonalnog faktorskog modela 9 Rexenje: Koristei faktorski model (1.1), dobijamo sledee X1 −µ1 = l11F1 +ϵ1 X2 −µ2

1.2. Kovarijansna struktura ortogonalnog faktorskog modela 7

E(F) = 0(m×1)

, Cov(F,F) = E[FF′] = I(m×m)

, E(ϵ) = 0(p×1)

,

Cov(ϵ, ϵ) = E[ϵϵ′] = Ψ(p×p)

=

ψ1 0 · · · 00 ψ2 · · · 0...

.... . .

...0 0 · · · ψp

(1.3)

i da su F i ϵ nezavisne sluqajne promenljive, tj.

Cov(ϵ,F) = E(ϵF ′) = 0(p×m)

.

Ove pretpostavke i relacija (1.2) formiraju ortogonalni faktorski model sam zajedniqkih faktora.

1.2 Kovarijansna struktura ortogonalnog faktorskogmodela

Jedan od zadataka ortogonalnog faktorskog modela jeste da objasni ko-varijansnu strukturu opservacija X. Iz modela, na osnovu (1.2), imamo dava�i

(X− µ)(X− µ)′ = (LF+ ϵ)(LF+ ϵ)′

= (LF+ ϵ)((LF)′ + ϵ′)

= LF(LF)′ + ϵ(LF)′ + LFϵ′ + ϵϵ′

(1.4)

pa �e va�iti i

Σ = Cov(X,X) = E(X− µ)(X− µ)′

= LE(FF′)L′ + E(ϵF′)L′ + LE(Fϵ′) + E(ϵϵ′)

= LL′+Ψ

(1.5)

odakle �e va�iti da je

Var(Xi) = l2i1 + · · ·+ l2im + ψi ,

Cov(Xi, Xk) = l2i1l2k1 + · · ·+ l2iml

2km.

(1.6)

Tako�e, zbog nezavisnosti promenljivih va�i�e Cov(ϵ, F ) = E(ϵ, F′) = 0,

a zbog (1.2) va�i�e

(X− µ)F′= (LF+ ϵ)F

′= LFF

′+ ϵF

′(1.7)

Page 8: Faktorska analiza i primene · 1.2. Kovarijansna struktura ortogonalnog faktorskog modela 9 Rexenje: Koristei faktorski model (1.1), dobijamo sledee X1 −µ1 = l11F1 +ϵ1 X2 −µ2

8 1. Faktorska analiza

iCov(X,F) = E(X− µ)F

′= LE(FF

′) + E(ϵF

′) = L. (1.8)

tj.Cov(Xi, Fj) = lij. (1.9)

Treba naglasiti da je faktorski model definisan sa (1.2) linearan uodnosu na zajedniqke faktore i da izvedeni zakljuqci o kovarijansnoj struk-turi (1.6) va�e pod tim uslovom. Pretpostavka o linearosti je inherentna uformulaciji tradicionalnog faktorskog modela. Na osnovu (1.6) prime�ujemoda se varijansa i-te sluqajne promenljive Xi, i = 1, n, V ar(Xi) = σii sastojiiz dva dela. Deo varijanse na koji utiqu zajedniqki faktori, u oznaci h2i

h2i = l2i1 + · · ·+ l2im (1.10)

naziva se komunalitet, dok deo varijanse na koji utiqu specifiqni faktori,qija je oznaka ψi, nazivamo specifiqna varijansa. Dakle, va�i da je

σii = h2i + ψi, i = 1, n.

Dakle, i-ti komunalitet je suma kvadrata optere�enja i-te promenljive na mzajedniqkih faktora.

Iz dosadaxnje analize ortogonalnog faktorskog modela mo�emo zakljuqitida se p+p(p−1)/2 = p(p+1)/2 varijansi i kovarijansi za X mo�e predstavitipomo�u pm faktorskih optere�enja lij i p specifiqnih varijansi ψi. Ako jem = p, na osnovu analize glavnih komponenti (xto �e kasnije biti detaljnijeobjaxnjeno), nalazimo da se svaka kovarijansna matrica mo�e predstaviti kaoproizvod matrica faktorskih optere�enja, tj. Σ = LL′, xto znaqi da matricasprecifiqnih varijansi mo�e biti nula matrica. Me�utim, faktorska anal-iza je najkorisnija ako je m malo u odnosu na p. U ovom sluqaju faktorskimodel daje jednostavno objaxnjenje kovarijansne matrice za X pomo�u manjegbroja parametara od p(p + 1)/2 parametara iz Σ. Me�utim, ve�ina kovari-jansnih matrica ne mogu biti predstavljene u obliku LL′ + Ψ kada je brojfaktora m mnogo manji od p.

Primer 1.1. Odrediti kovarijansnu strukturu ortogonalnog faktorskog mod-ela za p = 3 i m = 1, ako je data kovarijansna matrica

Σ =

1 0, 9 0, 70, 9 1 0, 40, 7 0, 4 1

Page 9: Faktorska analiza i primene · 1.2. Kovarijansna struktura ortogonalnog faktorskog modela 9 Rexenje: Koristei faktorski model (1.1), dobijamo sledee X1 −µ1 = l11F1 +ϵ1 X2 −µ2

1.2. Kovarijansna struktura ortogonalnog faktorskog modela 9

Rexenje: Koriste�i faktorski model (1.1), dobijamo slede�e

X1 − µ1 = l11F1 + ϵ1

X2 − µ2 = l21F1 + ϵ2

X3 − µ3 = l31F1 + ϵ3

Zadatak je da odredimo kovarijansnu strukturu oblika Σ = LL′+ Ψ, pa

koriste�i (1.6) nalazimo da je

1 = l211 + ψ1 0, 9 = l11l21 0, 7 = l11l31

1 = l221 + ψ2 0, 4 = l21l31

1 = l231 + ψ3

a zatim iz jednaqina

0, 7 = l11l31

0, 4 = l21l31

dobijamo da je

l21 =0, 4

0, 7l11.

Zamenom l21 u jednaqini 0, 9 = l11l21 dobijamo da je l211 = 1, 575, tj. da jel11 = ±1, 2549. Tako�e, ako odredimo i ostale tra�ene vrednosti kao rexenjedobijamo

Σ =

1 0, 9 0, 70, 9 1 0, 40, 7 0, 4 1

=

1, 25490, 71720, 5578

[1, 2549 0, 7172 0, 5578

]+

−0, 5748 0 00 0, 4857 00 0 0, 6889

Kako je ψ1 = −0, 5748 < 0 to ovo jedinstveno rexenje ne mo�emo tretirati

kao model faktorske analize, xto znaqi da jedinstveno rexenje ne dovodi ido taqnog rexenja. �

Kada je m > 1 postoji nejednoznaqnost razlaganja kovarijacione matrice,xto �emo pokazati na slede�i naqin: Neka je T ortogonalna matrica dimen-zija m × m, tj. va�i da je TT′ = T′T = I, tada jednaqina (1.2) mo�e bitizapisana

X− µ = LF+ ϵ = LTT′F+ ϵ = L∗F∗ + ϵ (1.11)

Page 10: Faktorska analiza i primene · 1.2. Kovarijansna struktura ortogonalnog faktorskog modela 9 Rexenje: Koristei faktorski model (1.1), dobijamo sledee X1 −µ1 = l11F1 +ϵ1 X2 −µ2

10 1. Faktorska analiza

gde jeL∗ = LT i F∗ = T

′F.

Kako va�i da jeE(F∗) = T

′E(F) = 0

iCov(F∗,F∗) = T

′Cov(F)T = T

′T = I

(m×m)(1.12)

nije mogu�e da se na osnovu opservacija X uoqi razlika izme�u matricaopetere�enja L i L∗. Prema tome, faktori F i F∗ = T

′F �e imati iste

statistiqke karakteristike, a iako se optere�enja L i L∗ u opxtem sluqajurazlikuju, ona generixu istu kovarijansnu matricu Σ, tj.

Σ = LL′+Ψ = LTT

′L

′+Ψ = (L∗)(L∗)′ +Ψ. (1.13)

Ovom nejednoznaqnox�u faktorskog modela se bavi faktorska rotacija, oqemu �e kasnije biti reqi. Dakle, ako je L matrica faktorskih optere�enjai T ortogonalna matrica, tada je

L∗ = LT (1.14)

tako�e matrica faktorskih optere�enja, i va�i da i L i L∗ daju istu re-prezentaciju faktorskog modela. Na komunalitete, kao dijagonalne elementematrica LL′ = (L∗)(L∗)′, tako�e ne utiqe izbor matrice T. Sa numeriqkogstanovixta, nejednoznaqnost faktorskog modela je i ote�avaju�a okolnost,jer treba odrediti dekomopoziciju Σ = LL

′+ Ψ, tj. treba odrediti ma-

trice L i Ψ, a nijedna numeriqka metoda ne mo�e direktno rexiti ovajproblem pored toliko mogu�ih rexenja. Jedan od naqina je da se nametnuneka ograniqenja, kako bi se, u najboljem sluqaju, dobilo jedinstveno rexenje.Zatim na dobijeno rexenje mo�emo primeniti bilo koju od tehnika koja nammo�e olakxati interpretaciju faktorskog modela. Me�utim, name�e se za-datak odre�ivanja organiqenja koja �emo iskoristiti. Najqex�a ograniqenjakoja se koriste jesu da matrice

L′Ψ−1L i L

′D−1L

budu dijagonalne, gde je D dijagonalna matrica qiji su elementi dijago-nalni elementi matrice Σ. Kako matrica L sadr�i pm parametara, a ma-trica Ψ sadr�i p parametara, to ukupno treba oceniti pm + p parametara.Ograniqenja koja smo uveli nam name�u 1

2(m(m+1)) uslova, pa je broj stepeni

slobode za model sa m zajedniqkih faktora jednak razlici broja parametaramatrice Σ pre ograniqenja i broja parametara matrice Σ sa ograniqenjima,tj.

d =1

2p(p+ 1)− (pm+ p− 1

2(m(m+ 1)))

=1

2(p−m)2 − 1

2(p+m).

Page 11: Faktorska analiza i primene · 1.2. Kovarijansna struktura ortogonalnog faktorskog modela 9 Rexenje: Koristei faktorski model (1.1), dobijamo sledee X1 −µ1 = l11F1 +ϵ1 X2 −µ2

1.3. Metodi ocenjivanja 11

Ako je d < 0 tada je model neodre�en (broj zajedniqkih faktora m je znaqajnove�i u odnosu na p), ako je d = 0 postoji jedinstveno rexenje modela. Ako jed > 0, tj. ima vixe jednaqina nego parametara, tada taqno rexenje ne pos-toji, ve� se aproksimira i ovo je sluqaj koji je najinteresantniji za primenufaktorske analize.

1.3 Metodi ocenjivanja

Posmatrajmo uzorak X1, . . . ,Xn od n opservacija, u opxtem sluqaju, p ko-reliranih promenljivih. Nax zadatak je da proverimo da li ortogonalanfaktorski model, opisan sa (1.2), pomo�u malog broja faktora dobro opisujepopulaciju. To utvr�ujemo ispitivanjem da li kovarijansna struktura imaosobine (1.6). Obele�i�emo sa S uzoraqku kovarijansnu matricu, koja pred-stavlja ocenu kovarijansne matrice Σ. Ako su elementi van glavne dijagonaleuzoraqke korelacione matrice S male vrednosti, odnosno ako su elementiuzoraqke korelacione matrice R blizu nule, posmatrane promenljive nisu ukorelaciji, pa faktorska analaiza ovde nije naroqito korisna i tada speci-fiqni faktori imaju dominantnu ulogu, dok je zadatak faktorske analizeda ispita va�ne zajedniqke faktore. Ako kovarijansna matrica Σ znaqajnoodstupa od dijagonalne matrice, onda faktorski model mo�e biti prime/-njen, a prvi korak je oceniti faktorska optere�enja lij i specifiqne varijanseψi. Za ocenu parametara se najqex�e primenjuju metod glavnih komponenti imetod maksimlane verodostojnosti. Rexenja dobijena nekim od metoda moguse rotirati i na taj naqin pojednostaviti interpretacija faktora, a o tome�e kasnije biti vixe reqi.

1.3.1 Metod glavnih komponenti

Neka je data kvadratna simetriqna matrica A(a×a)

. Tada seA mo�e prikazati

kao linearna kombinacija svojih sopstvenih vektora γi i sopstvenih vred-nosti λi, i = 1, a, kao

A =a∑

i=1

λiγiγ′i.

Ova linarna kombinacija poznata je kao spektralna dekompozicija matrice A.

Razmotrimo sada p−dimenzionalnu sluqajnu veliqinu U(p×1)

sa kovari-

jansnom matricom Σ1 i neka su λ1 ≥ λ2 · · · ≥ λp sopstvene vrednosti matrice

Page 12: Faktorska analiza i primene · 1.2. Kovarijansna struktura ortogonalnog faktorskog modela 9 Rexenje: Koristei faktorski model (1.1), dobijamo sledee X1 −µ1 = l11F1 +ϵ1 X2 −µ2

12 1. Faktorska analiza

Σ1, a γ1, γ2, . . . , γp odgovaraju�i sopstveni vektori matrice Σ1. Tada va�i daje

Σ1 =a∑

i=1

λiγiγ′i , γ′iΣ1γi = λi , γ′iΣ1γj = 0, i = j.

Sluqajna promenljiva koja se dobija pomo�u transformacije

Yi = γ′iU i = 1, . . . , p.

naziva se i-ta glavna komponenta sluqajne promenljive U. Opisani postu-pak predstavlja metod razlaganja kovarijansne matrice koji se naziva metodglavnih komponenti. Ako sa Y oznaqimo vektor novih sluqajnih promenljivihi sa G ortogonalnu matricu qije su kolone jednake γ1, γ2, . . . , γp, tada va�ida je Y=G’U.

Spektralna dekompozicija kovarijansne matrice nam tako�e omogu�avajedno razlaganje kovarijansne matrice Σ. Neka su γ1, . . . , γp sopstveni vek-tori kovarijansne matrice Σ i λ1, . . . , λp odgovaraju�e sopstvene vrednosti,takve da va�i λ1 ≥ λ2 ≥ · · · ≥ λp ≥ 0. Tada je

Σ = λ1γ1γ′

1 + λ2γ2γ′

2 + · · ·+ λpγpγ′

p

=[√

λ1γ1...

√λ2γ2

... · · · ...√λpγp

]

√λ1γ

′1

. . .√λ2γ

′2

. . ..... . .√λpγ

′p

.

(1.15)

Ovakvo razlaganje kovarijansne matrice odgovara strukturi faktorskogmodela koji ima jednak broj faktora i promenljivih, tj. m = p, a specifiqnevarijanse ψi = 0, za svako i = 1, p. Tada, na osnovu (1.15), j-ta kolona matricefaktorskih optere�enja L ima vrednost

√λjγj, odnosno mo�emo pisati

Σ(p×p)

= L(p×p)

L′

(p×p)+ 0

(p×p)= LL

′. (1.16)

Iako je reprezentacija kovarijansne matrice Σ data sa (1.15) taqna, ovajoblik nije mnogo koristan, jer ukljuquje isti broj faktora i promenljivih i

Page 13: Faktorska analiza i primene · 1.2. Kovarijansna struktura ortogonalnog faktorskog modela 9 Rexenje: Koristei faktorski model (1.1), dobijamo sledee X1 −µ1 = l11F1 +ϵ1 X2 −µ2

1.3. Metodi ocenjivanja 13

ne dozvoljava varijaciju sprecifiqnih faktora ϵ u ortogonalnom faktorskommodelu. Mi tra�imo model koji �e objasniti kovarijansnu strukturu pomo�umanjeg broja zajedniqkih faktora. Jedan od naqina da to postignemo je da akosu p−m sopstvenih vrednosti dovoljno male zanemarmo uticaj ovih faktora,odnosno da zanemarimo uticaj λm+1γm+1γ

′m+1+ · · ·+λpγpγ

′p na Σ u (1.15). Tada

dobijamo aproksimaciju

Σ =[√

λ1γ1...

√λ2γ2

... · · · ...√λmγm

]

√λ1γ

′1

. . .√λ2γ

′2

. . ..... . .√λmγ

′m

= L

(p×m)L

′.

(m×p)(1.17)

Ovakva reprezentacija pretpostavlja da su specifiqni faktori ϵ ortogo-nalnog faktorskog modela manje va�nosti, pa mogu biti izostavljeni u faktor-izaciji kovarijansne matrice Σ. Ako ho�emo da ponovo ukljuqimo specifiqnefaktore u model, za njihove varijanse mo�emo uzeti dijagonalne elementematrice Σ − LL

′, gde je LL

′definisano sa (1.17). Ponovnim ukljuqivanjem

sprecifiqnih faktora nalazimo da �e aproksimacija matrice Σ biti

Σ = LL′+Ψ

=[√

λ1γ1...

√λ2γ2

... · · · ...√λmγm

]

√λ1γ

′1

. . .√λ2γ

′2

. . ..... . .√λmγ

′m

+

ψ1 0 · · · 00 ψ2 · · · 0...

.... . .

...0 0 · · · ψp

(1.18)

gde je ψi = σii −∑m

j=1 l2ij za i = 1, 2, . . . , p. Da bismo primenili ovaj postu-

pak na uzorak X1, . . . ,Xn preporuqljivo je da prvo centriramo opservacijeoduzimanjem uzoraqke sredine X, odnosno

Xj −X =

Xj1

Xj2...Xjp

X1

X2...Xp

=

Xj1 −X1

Xj2 −X2...

Xjp −Xp

, j = 1, n, (1.19)

Page 14: Faktorska analiza i primene · 1.2. Kovarijansna struktura ortogonalnog faktorskog modela 9 Rexenje: Koristei faktorski model (1.1), dobijamo sledee X1 −µ1 = l11F1 +ϵ1 X2 −µ2

14 1. Faktorska analiza

a centrirane opservacije �e imati istu uzoraqku kovarijansnu matricu Skao i originalne opservacije. Tako�e, mo�e se desiti da su promenljive me-�usobno ne proporcionalne (tj. vrednosti za neke promenljive su velike, doksu za ostale male) pa se preporuquje rad sa standardizovanim promenljivama

Zj =

(Xj1−X1)√

S11

(Xj2−X2)√S22...

(Xjp−Xp)√Spp

j = 1, n, (1.20)

qija uzoraqka kovarijansna matrica predstavlja uzoraqku korelacionu ma-tricu R opservacija X1, . . . , Xn. Standardizacijom se izbegava mogu�nostda promenljiva sa velikom varijansom neopravdano utiqe na odre�ivanje fak-torskih optere�enja. Reprezentacija (1.18), kada se primeni na uzoraqku ko-varijansnu matricu S ili uzoraqku korelacionu matricu R, je poznata kaorexenje dobijeno metodom glavnih komponenti, jer se faktorska optere�enjadobijaju kao skalirani koeficijenti prvih m uzoraqkih glavnih komponenti.

1.3.2 Ocena faktorskog modela primenom metoda glavnih kompo-nenti

Glavne komponente faktorske analize uzoraqke kovarijansne matrice S suodre�ene ure�enim parovima (λ1, γ1), (λ2, γ2), . . . , (λp, γp), gde je

λ1 ≥ λ2 ≥ · · · ≥ λp

.Neka jem ≤ p broj zajedniqkih faktora. Tada je ocena matrice faktorskih

optere�enja L data sa

L =[√

λ1γ1...

√λ2γ2

... · · · ...√λmγm

]. (1.21)

Ocene specifiqnih varijansi dobijamo kao dijagonalne elemente matrice

S− LL′, tako da je

Ψ =

ψ1 0 · · · 0

0 ψ2 · · · 0...

.... . .

...0 0 · · · ψp

gde je ψi = sii −m∑j=1

ψ2ij. (1.22)

Page 15: Faktorska analiza i primene · 1.2. Kovarijansna struktura ortogonalnog faktorskog modela 9 Rexenje: Koristei faktorski model (1.1), dobijamo sledee X1 −µ1 = l11F1 +ϵ1 X2 −µ2

1.3. Metodi ocenjivanja 15

Ocene komunaliteta su

h2i = l2i1 + l2i2 + · · ·+ l2im. (1.23)

Faktorski model uzoraqke korelacione matriceR, odre�en metodom glavnihkomonenti je analogan prethodnom, uz zamenu kovarijansne matrice S korela-cionom matricom R.

Primenom metoda glavnih komonenti za ocenu faktorskog modela ocenjenaoptere�enja za dati faktor se ne menjaju sa pove�anjem broja faktora. Na

primer, ako je m = 1, L =[√

λ1γ1

], a ako je m = 2, L =

[√λ1γ1

...√λ2γ2

],

gde su(λ1, γ1

)i(λ2, γ2

)prva dva sopstvena vrednost-sopstveni vektor para

za S (odnosno za R). Prema definiciji ψi, dijagonalni elementi matrice S

su jednaki dijagonalnim elementima matrice LL′

+ Ψ. Me�utim, elementivan glavne dijagonale matrice S uglavnom nisu odre�eni sa LL

′+ Ψ, pa se

postavlja zadatak odre�ivanja broja zajedniqkih faktora m.Ako broj zajedniqkih faktora nije odre�en kvalitativnim saznanjima onda

broj zajedniqkih faktora mo�e biti ocenjen pomo�u ocena sopstvenih vred-nosti. Razmotrimo rezidualnu matricu

S− (LL′

+ Ψ). (1.24)

Dijagonalni elementi su jednaki nuli, a ako su i ostali elementi dovoljnomali mo�emo subjektivno odrediti broj zajedniqkih faktora m tako da modelbude odgovaraju�i.

Mala vrednost sume kvadrata zanemarenih sopstvenih vrednosti impli-cira malu vrednost sume kvadrata grexaka aproksimacije. U idealnom sluqajuudeo prvih nekoliko faktora u uzoraqkoj varijansi promeljivih treba da budexto ve�i . Udeo prvog zajedniqkog faktora u uzoraqkoj varijansi sii je l2i1.Udeo prvog zajedniqkog faktora u totalu uzoraqke varijanse, s11 + s22 + · · ·+spp = tr(S) je

l211 + l221 + · · ·+ l2p1 =

(√λ1γ1

)′ (√λ1γ1

)= λ1

s obzirom da sopstveni vektor γ1 ima jediniqnu du�inu. U opxtem sluqajuva�i�e

Odnos udelaj-tog faktora i

uzoraqke varijanse

=

λj

s11+s22+···+spp, za faktorsku analizu matrice S

λj

p, za faktorsku analizu matrice R

(1.25)

Page 16: Faktorska analiza i primene · 1.2. Kovarijansna struktura ortogonalnog faktorskog modela 9 Rexenje: Koristei faktorski model (1.1), dobijamo sledee X1 −µ1 = l11F1 +ϵ1 X2 −µ2

16 1. Faktorska analiza

Kriterijum (1.25) se qesto upotrebljava kao heuristika (pravilo) za izraquna-vanje odgovaraju�eg broja zajedniqkih faktora. Broj zajedniqkih faktorasadr�anih u modelu pove�avamo dok ne dostignemo odgovaraju�i odnos totalauzoraqke varijanse. Jox jedan kriterijum za odre�ivanje broja zajedniqkihfaktora (koji je najzastupljeniji u kompjuterskom softveru) jeste da je mjednak broju sopstvenih vrednosti korelacione matrice R koji su ve�i od 1ako je uzoraqka korelaciona matrica faktorisana (ako se faktorska analizaprimenjuje na korelacionu matricu), ili jednak broju pozitivnih sopstvenihvrednosti kovarijansne matrice S ako je uzoraqka kovarijansna matrica fak-torisana. Tako�e se smatra da treba te�iti xto manjem broju faktora uko-liko taj broj daje dobru interpretaciju podataka i reprezentaciju za S iliR.

Primer 1.1. Za datu uzoraqku kovarijansnu matricu oceniti faktorski modelprimenom metoda glavnih komponenti

S =

15 8 3 168 10 1 103 1 6 216 10 2 24

Rexenje: Najpre treba oceniti broj zajedniqkih faktora. Vektor sop-

stvenih vrednosti za datu matricu S je

Λ′

=[41, 833463 15, 632012 4, 820126 2, 714399

]a matrica sopstvenih vektora za datu matricu S je

γ =

−0, 5599971 −0, 002245895 −0, 09226693 0, 82333776−0, 3733790 0, 079391155 0, 91176422 −0, 15156250−0, 1357700 −0, 986219421 0, 01475192 −0, 09338166−0, 7270199 0, 145131850 −0, 39994399 −0, 53890965

Prime�ujemo da prve dve sopstvene vrednosti imaju najve�i udeo u raspodeliuzoraqke varijanse, pa mo�emo uzeti da je broj zajedniqkih faktora jed-nak m = 2. Koriste�i (1.21) nalazimo da je ocena matrice faktorskihoptere�enja oblika

L =

−3, 6219934 −0, 008879671−2, 4149701 0, 313891500−0, 8781441 −3, 899249157−4, 7022770 0, 573812714

.

Page 17: Faktorska analiza i primene · 1.2. Kovarijansna struktura ortogonalnog faktorskog modela 9 Rexenje: Koristei faktorski model (1.1), dobijamo sledee X1 −µ1 = l11F1 +ϵ1 X2 −µ2

1.3. Metodi ocenjivanja 17

Ocene specifiqnih varijansi nalazimo kao dijagonalne elemente matrice

S− LL′

, pa je Ψ oblika

Ψ = S− LL′

=

1, 88108506 0 0 0

0 4, 06939153 0 00 0 0, 02471887 00 0 0 1, 55932976

,dok je rezidualna matrica oblika

S− LL′

− Ψ =

0 −2, 62530355 −2, 096341 −2, 90760608

−4, 8136100 0 −3, 966142 −5, 60536489−0, 2399752 0, 07853044 0 0, 08344283−2, 5858508 −3, 09530312 −1, 451168 0

.�

1.3.3 Modifikovani metod glavnih komponenti- Metod glavnihfaktora

Modifikovani metod glavnih komponenti �emo razmatrati u terminimafaktorske analize korelacione matrice R, dok je postupak za kovarijansnumatricu S analogan. Pomo�u m zajedniqkih faktora su odre�eni elementivan glavne dijagonale matrice R, dok su elementi glavne dijagonale odre�enipomo�u m zajedniqkih faktora i specifiqnih varijansi, tj.

ρii = 1 = h2i + ψi

Ako udeo specifiqnog faktora ψi zanemarimo, odnosno ako stavimo da jeh2i = 1, i = 1, n, dobi�emo matricu R−Ψ = LL

′.

Pretpostavimo da su nam poznate poqetne ocene specifiqnih varijansiψ∗i . Tada zamenom dijagonalnih elemenata matrice R sa h∗2i = 1 − ψ∗

i , dobi-jamo korelacionu matricu zajedniqkih faktora, koju �emo zvati redukovanauzoraqka korelaciona matrica, oblika

Rr =

h∗21 r12 · · · r1pr12 h∗22 · · · r2p...

.... . .

...r1p r2p · · · h∗2p

.Sada matricu Rr razla�emo u ortogonalni faktorski model, tj.

Rr = Lr∗Lr

∗′ (1.26)

Page 18: Faktorska analiza i primene · 1.2. Kovarijansna struktura ortogonalnog faktorskog modela 9 Rexenje: Koristei faktorski model (1.1), dobijamo sledee X1 −µ1 = l11F1 +ϵ1 X2 −µ2

18 1. Faktorska analiza

gde je L∗r = [l∗ij] matrica ocenjenih faktorskih optere�enja.Za metod glavnih faktora koriste se ocene

Lr∗ =

[√λ∗1γ

∗1

...√λ∗2γ

∗2

... · · · · · ·√λ∗mγ

∗m

](1.27)

ψ∗i = 1−

m∑j=1

l∗2ij , i = 1,m (1.28)

gde su (λ∗i , γ∗i ), i = 1,m ure�eni parovi m najve�ih sopstvenih vrednosti i

sopstvenih vektora izraqunati pomo�u R. Tada komunalitete ponovo mo�emooceniti sa

h∗2i =m∑j=1

l∗2ij i = 1,m. (1.29)

Rexenje dobijeno metodom glavnih faktora mo�e biti odre�eno itera-tivnim postupkom, kada komunalitete ocenjene sa (1.29) upotrebimo kao po-qetne ocene za slede�i korak. Postupak ponavljamo sve dok promene u ocenamakomunaliteta ne budu zanemarive.

Sliqno kao i kod analize glavnih komponenti, ocene sopstvenih vred-nosti se mogu iskoristiti za odre�ivanje broja zajedniqkih faktora koje �emozadr�ati. Me�utim, neke sopstvene vrednosti mogu biti negativne, u zavis-nosti od poqetnih vrednosti ocenjenih komunaliteta. U najboljem sluqaju,broj zajedniqkih faktora treba odrediti tako da bude jednak rangu reduko-vane korelacione matrice, koji nije uvek precizno izraqunat iz Rr , pa suneke pretpostavke neophodne.

Za izbor poqetnih ocena specifiqnih varijansi ima vixe naqina, a na-jqex�i naqin (kada se radi sa korelacionom matricom) je ψ∗

i = 1rii

, gde je rii

i-ti dijagonalni element matrice R−1. Ocene poqetnih komunaliteta su tadajednake

h∗2i = 1− ψ∗i = 1− 1

riii = 1,m (1.30)

xto se poklapa sa kvadratom koeficijenta korelacije izme�u Xi i ostalihp − 1 promenljivih. Ovo poklapanje sa koreficijentom korelacije znaqi dah∗2i mo�e biti izraqunat i kada R nije punog ranga. Prilikom faktorisanjakovarijansne matrice S, za poqetne vrednosti specifiqne varijanse se uzimavrednost sii dijagonalni element matrice S−1.

1.3.4 Metod maksimalne verodostojnosti

Ako pretpostavimo da zajedniqki faktori F i specifiqni faktori ϵ imajunormalnu raspodelu, tada mo�emo na�i ocene maksimalne verodostojnosti za

Page 19: Faktorska analiza i primene · 1.2. Kovarijansna struktura ortogonalnog faktorskog modela 9 Rexenje: Koristei faktorski model (1.1), dobijamo sledee X1 −µ1 = l11F1 +ϵ1 X2 −µ2

1.3. Metodi ocenjivanja 19

faktorska optere�enja i specifiqne varijanse. Ako Fj i ϵj , j = 1, · · · , n,imaju normalnu raspodelu tada �e i Xj − µ = LFj + ϵj imati normalnuraspodelu, a funkcija verodostojnosti �e biti oblika

L(µ,Σ) = (2π)−np2 ∥Σ∥−

n2 e−

12tr[Σ−1(

∑nj=1(Xj−X)(Xj−X)′+n(X−µ)(X−µ)′)]

= (2π)−(n−1)p

2 ∥Σ∥−(n−1)

2 e−12tr[Σ−1(

∑nj=1(Xj−X)(Xj−X)′)]·(2π)−

p2 ∥Σ∥−

12 e−

n2 (X−µ)′Σ−1(X−µ)

(1.31)xto zavisi od L i Ψ, s obzirom da je Σ = LL′ + Ψ. Ovaj model i daljenije odgovaraju�i zbog nejednoznaqnosti matrice faktorskih optere�enja L.Preporuquje se da se L definixe tako da bude zadovoljen uslov jedinstvenosti

L′Ψ−1L = ∆, ∆ je dijagonalna matrica. (1.32)

Ocene faktorskih optere�enja L i specifiqnih varijansi Ψ metodom mak-simalne verodostojnosti dobijaju se maksimizacijom (1.31). Ocene komu-naliteta dobijene metodom maksimalne verodostojnosti su

hi2= li1

2+ li2

2+ · · ·+ ˆli,m

2, , i = 1, p (1.33)

tako da je Udeo j-tog faktorau uzoraqkojvarijansi

=li1

2+ li2

2+ · · ·+ ˆli,m

2

s11 + s22 + · · ·+ spp. (1.34)

Ako standardizujemo promenljive tako da je Z = V−1/2(X − µ), tada kovari-jansna matrica R promenljivih Z ima reprezentaciju

R = V− 12ΣV− 1

2 =(V− 1

2L)(

V− 12L

)′

+V− 12ΨV− 1

2 . (1.35)

Prema tome, korelaciona matrica R se mo�e faktorisati analogno (1.6),matrica optere�enja kovarijansne matrice ρ bi�e Lz = V

12L, dok je matrica

specifiqnih varijansi Ψz = V− 12ΨV− 1

2 , dok je ocena maksimalne verodostoj-nosti matrice R

R = (V− 1

2 L)(V− 1

2 L)′+ V

− 12 ΨV

− 12 = LzLz + Ψ

z (1.36)

gde su V− 1

2 i L ocene maksimalne verodostojnosti za V− 12 i L respektivno.

Kao posledicu faktorizacije (1.36), kada se metod maksimalne verodosto-jnosti odnosi na korelacionu matricu, koristimo

h2i = l2i1 + l2i2 + · · ·+ l2im, i = 1, 2, . . . , p (1.37)

Page 20: Faktorska analiza i primene · 1.2. Kovarijansna struktura ortogonalnog faktorskog modela 9 Rexenje: Koristei faktorski model (1.1), dobijamo sledee X1 −µ1 = l11F1 +ϵ1 X2 −µ2

20 1. Faktorska analiza

za ocenu maksimalne verodostojnosti komunaliteta, i tada mo�emo izraqunatii odnos Udeo j-tog faktora

u standardizovanojuzoraqkoj varijansi

=l2i1 + l2i2 + · · ·+ l2im

p. (1.38)

1.3.5 Testiranje hipoteze o broju zajedniqkih faktora

Pod pretpostavkom o normalnoj raspodeli populacije mo�emo testiratiadekvatnost faktorskog modela. Dakle, ako je Σ = LL

′+ Ψ, onda mo�emo

testirati nultu hipotezu

H0 : Σ(p×p)

= L(p×m)

L(m×p)

+ Ψ(p×p)

(1.39)

protiv

H1 : Σ je bilo koja pozitivno definitna matrica.

Ako Σ nije specifiqne forme, funkcija maksimalne verodostojosti je jednaka

∥Sn∥−n2 e−

np2 , (1.40)

gde je Sn uzoraqka korvarijansna matrica. Ako je nulta hipoteza taqna Σ jeoblika (1.39), i tada je funkcija maksimalne verodostojnosti jednaka∥∥∥Σ∥∥∥ e− 1

2tr[Σ

−1(∑n

j=1(Xj−X)(Xj−X)′)]=

∥∥∥LL′+ Ψ

∥∥∥−n2e− 1

2ntr

[(LL

′+Ψ)

−1Sn

](1.41)

gde je µ ocena maksimalne verodostojnosti za X, Σ ocena maksimalne vero-dostojnosti za Σ, a L i Ψ ocene maksimalne verodostojnosti za L i Ψ redom.Koriste�i dobijene rezultate nalazimo da je ocena maksimalne verodosto-jnosti za testiranje hipoteze H0

1 data sa

−2lnΛ = −2ln

[maksimalna verodostojnost ako va�i H0

maksimalna verodostojnost ako ne va�i H0

]

= −2ln

∥∥∥Σ∥∥∥∥Sn∥

−n2

+ n[tr(Σ

−1Sn

)− p

] (1.42)

1Kada je obim uzorka n veliki mo�e se pokazati da tada

−2lnΛ : χ2ν−ν0

,

gde su ν i ν0 dimenzije parametarskih prostora Θ i Θ0 redom.

Page 21: Faktorska analiza i primene · 1.2. Kovarijansna struktura ortogonalnog faktorskog modela 9 Rexenje: Koristei faktorski model (1.1), dobijamo sledee X1 −µ1 = l11F1 +ϵ1 X2 −µ2

1.4. Faktorska rotacija 21

pri qemu je broj stepeni slobode jednak

1

2p(p+ 1)− [p(m+ 1)− 1

2m(m− 1)] =

1

2[(p−m)2 − p−m] . (1.43)

Ukolko je tr(Σ

−1)−p = 0, tada va�i da je Σ = LL

′+Ψ ocena maksimalne

verodostojnosti za Σ = LL′ +Ψ, odakle sledi da je

−2 lnΛ = n ln

∥∥∥Σ∥∥∥∥Sn∥

. (1.44)

Engleski nauqnik Moris Stivenson Bartlet je pokazao da se χ2 aproksi-macija raspodele statistike −2lnλ mo�e poboljxati tako xto �emo umesto nu (1.44) koristiti (n−1− (2p+4m+5)/6). Koriste�i Bartletovu korekciju,odbaci�emo nultu hipotezu H0 sa pragom znaqajnosti α ako je

(n− 1− (2p+ 4m+ 5) /6) ln

∥∥∥LL′+ Ψ

∥∥∥∥Sn∥

> χ2[(p−m)2−p−m]/2(α) (1.45)

pri qemu pretpostavljamo da su n i n− p veliki brojevi. Kako broj stepenislobode 1

2[(p−m)2 − p−m] mora biti pozitivan broj, mora va�iti

m<1

2(2p+ 1−

√8p+ 1) (1.46)

da bi mogla da se primeni test statistika (1.45). Dakle, u ovom testuispituje se adekvatnost faktorskog modela sa m zajedniqkih faktora upore-

�uju�i generalizovane varijanse∥∥∥LL

′+ Ψ

∥∥∥ i ∥Sn∥. Ako je n veliki broj, a

m mali u odnosu na p, nulta hipoteza H0 se qesto odbacuje, xto znaqi da nisusvi fakori uraqunati, mada se mo�e desiti i da Σ dobro aproksimira Sn,tako da pove�avanje broja zajedniqkih faktora ne bi pru�nove informacije,iako ti faktori mogu biti znaqajni.

1.4 Faktorska rotacija

1.4.1 Ortogonalna faktorska rotacija

Nejednoznaqnost faktorskog modela smo spomenuli prilikom definisanjaortogonalnog faktorskog modela, odnosno pokazali smo da faktorski model

Page 22: Faktorska analiza i primene · 1.2. Kovarijansna struktura ortogonalnog faktorskog modela 9 Rexenje: Koristei faktorski model (1.1), dobijamo sledee X1 −µ1 = l11F1 +ϵ1 X2 −µ2

22 1. Faktorska analiza

ima vixe reprezentacija koje imaju iste statistiqke osobine. Ova nejed-noznaqnost faktorskog modela je posledica nejednoznaqnosti reprezentacijekovarijansne matrice (videti (1.13) i (1.14)). U geometrijskom smislu, or-togonalna transformacija odgovara rotaciji koordinatnih osa, pri qemu onezadr�avaju me�usobnu ortogonalnost, zbog qega se i ortogonalna transfor-macija matrice faktorskih optere�enja (s obzirom da ona implicira i ortog-onalnu transformaciju faktorske matrice) naziva i ortogonalna faktorskarotacija, ili kra�e faktorska rotacija. Tako�e, postoji mogu�nost neortog-onalne transformacije faktora koja se zove neortogonalna rotacija faktora,a u literaturi se sre�e naziv kosa rotacija. Dakle, ako je L

(p×m)-matrica

ocenjenih faktorskih optere�enja (dobijena nekim od metoda- metodom glavnihkomonenti, metodom maksimalne verodostojnosti,...) onda je

L∗= LT gde je TT′ = T′T = I (1.47)

p × m matrica ”rotiranih” optere�enja. Tako�e, ocena kovarijansne (ilikorelacione) matrice ostaje nepromenjena, tj.

Σ = LL′+ Ψ = LTT

′L

′+ Ψ = L

∗L

∗′ + Ψ. (1.48)

Iz prethodnog rezultata zakljuqujemo da �e i rezidualna matrica

Sn − LL′ − Ψ = Sn − L

∗L

∗′ − Ψ,

ostati nepromenjena, kao i ocene komunaliteta h2i i specifiqnih varijansiψi. Matematiqki gledano, svejedno je koji oblik matrice optere�enja se pos-matra.

Postupak rotacije faktora, bez obzira na tip rotacije, primenjujemo ucilju dobijanja matrice faktorskih optere�enja koja �e olakxati interpreta-ciju faktora. Za izbor ugla za koji �emo rotirati matricu optere�enja sekoristi vixe kriterijuma, a najqex�e korix�eni je poznat pod nazivom jed-nostavna struktura. Motiv za korix�enje faktorske rotacije je vrlo sliqanmotivu nauqnika koji izoxtrava fokus mikroskopa da bi imao jasniju slikuposmtranog predmeta, kako bi lakxe uoqio detalje i pravilnosti. U idealnomsluqaju, faktorskom rotacijom te�imo da svaka promenljiva oqitava visokuvrednost jednog faktora, dok su vrednosti te promenljive za ostale faktorezanemarljive. Ovakvu jednostavnu strukturu nije jednostavno posti�i, alipredstavlja model kojem treba te�iti.

Razmotrimo sada grafiqku i analitiqku metodu za odre�ivanje faktorskerotacije koja �e dovesti faktorski model do jednostavne strukture. Pret-postavimo da je m = 2, tj. razmatramo 2 zajedniqka faktora, tada trans-formacija do jednostavne strukture mo�e biti odre�ena grafiqkom metodom.

Page 23: Faktorska analiza i primene · 1.2. Kovarijansna struktura ortogonalnog faktorskog modela 9 Rexenje: Koristei faktorski model (1.1), dobijamo sledee X1 −µ1 = l11F1 +ϵ1 X2 −µ2

1.4. Faktorska rotacija 23

Nekorelisani zajedniqki faktori se smatraju jediniqnim vektorima koji odgo-varaju koordinatnim osama. U datom koordinatnom sistemu mo�emo posma-

trati ure�ene parove faktorskih optere�enja(li1, li2

)koji odgovaraju promen-

ljivama. Koordinatne ose mogu biti rotirane za dati ugao ϕ, a vrednosti fak-torskih optere�enja u novom koordinatnom sistemu mo�emo odrediti pomo�u

L∗

(p×2)= L

(p×2)T

(2×2)(1.49)

gde je

T =

[cosϕ sinϕ− sinϕ cosϕ

], za rotaciju u smeru kazaljke na satu

T =

[cosϕ − sinϕsinϕ cosϕ

],

za rotaciju u smeru suprotnomod smera kazaljke na satu

(1.50)

Postupak opisan sa (1.49) se zapravo retko koristi, s obzirom da se uovom sluqaju problem identifikacije lako rexava vizuelno, odnosno lako seuoqava koje optere�enje odgovara kojem faktoru. U sluqaju kada je m > 2,grafiqka (vizuelna) metoda nije preporuqljiva, ve� treba odrediti vred-nosti rotiranih faktorskih optere�enja da bi se na pravilan naqin inter-pretirali podaci.

Xto se tiqe analitiqke metode za dobijanje jednostavne strukture, na-jqex�e korix�eni metod jeste Kaiserov metod, poznat i pod nazivom varimaks

kriterijum. Neka su l∗ij =l∗ij

hi, gde je hi =

√h2i i h

2i ocena komunaliteta. Tada se

varimaks kriterijumom bira ortogonalna matrica T, tako da se maksimiziraizraz

V =1

p

m∑j=1

p∑i=1

l∗4ij −

(∑pi=1 l

∗2ij

)2

p

. (1.51)

Prelazak na koeficijente l∗ij ima za cilj da promenljive sa malim komu-nalitetima imaju relativno ve�u ulogu u formiranju jednostavne strukture.Nakon xto se odredi matrica T, optere�enja l∗ij se mno�e sa hi tako da jestvarna vrednost komunaliteta oquvana. Maksimiziranje izraza V odgovara”proxirenju” kvadrata optere�enja na svaki faktor koliko je to mogu�e. Zatose nadamo da �emo na�i xto vixe velikih i zanemarljivih koeficijenata ukolonama matrice rotiranih optere�enja L

∗.

Postoje softverski paketi pomo�u kojih se mo�e maksimizirati matricaV i odrediti varimaks rotacija. Varimaks rotacije faktorskih optere�enjadobijene razliqtim metodama se u opxtem sluqaju ne�e poklapati. Tako�e,

Page 24: Faktorska analiza i primene · 1.2. Kovarijansna struktura ortogonalnog faktorskog modela 9 Rexenje: Koristei faktorski model (1.1), dobijamo sledee X1 −µ1 = l11F1 +ϵ1 X2 −µ2

24 1. Faktorska analiza

oblik rotiranih optere�enja mo�e se znaqajno promeniti ako su dodatni za-jedniqki faktori ukljuqeni u rotaciju. Ako dominantan faktor postoji on�e u opxtem sluqaju biti neuoqljiv u ortogonalnim rotacijama, ali njegauvek mo�emo fiksirati dok ostale faktore rotiramo. Faktorska rotacijaoptere�enja se naroqito preporuqjuje za optere�enja dobijena metodom mak-simalne verodostojnosti, poxto su poqetne vrednosti uzete tako da zadovolje

uslov da L′Ψ

−1L bude dijagonalna matrica. Ovaj uslov je pogodan u raqunske

svrhe, ali ne i za interpretaciju faktora.

1.4.2 Kosa rotacija

Ortogonalna faktorska rotacija je pogodna za faktroske modele za kojese pretpostavlja da su faktori me�usobno nezavisni. Me�utim, mo�e se pri-meniti i rotacija koja nije ortogonalna i koja se zove kosa rotacija.

Ako za koordinatne ose uzmemo m zajedniqkih faktora, tada taqka qije

su koordinate(li1, li2, . . . , lim

)predstavlja poziciju i-te promenljive u fak-

torskom prostoru. Pod pretpostavkom da su promenljive grupisane u neprekla-paju�e klastere, ortogonalna rotacija koja dovodi do jednostavne strukturejeste rigidna rotacija sistema, nakon koje su koordinatne ose maksimalnoblizu klasterima. Kosom rotacijom do jednostavne strukture dolazimo neri-gidnom rotacijom sistema (ose vixe ne moraju biti me�usobno ortogonalne),tako da u novom sistemu ose prolaze kroz klastere, ili su maksimalno blizunjih. Kosom rotacijom se te�i da se svaka promenljiva objasni minimalnimbrojem faktora, a u idelanom sluqaju to je jednim faktorom.

1.5 Faktorski skorovi

Pored ocenjenih parametara faktorskog modela vrlo qesto su od znaqajai ocene vrednosti faktora, koji se zovu faktorski skorovi. Ove veliqine seqesto koriste u dijagnostiqke svrhe kao i poqetne vrednosti za dalju analizu.Faktorske skrove mo�emo shvatiti kao ocene vrednosti neopa�ivog sluqajnogfaktorskog vektora Fj , j = 1, 2, . . . , n, odnosno faktorski skor je fj j-ta real-izovana vrednost faktora Fj.

Kako je broj neopa�ivih veliqina Fj(m×1)

i ϵj(p×1)

ve�i od broja opa�ivih

veliqina Xj, j = 1, n, to proces ocenjivanja mo�e biti komplikovan. Da bise izbegle potexko�e pribegava se heuristiqkim pristupima. Navex�emodva pristupa za ocenjivanje faktorskih skorova, metod ponderisanih najman-jih kvadrata i regresioni metod. Ono xto je zajedniqko za oba metoda je

Page 25: Faktorska analiza i primene · 1.2. Kovarijansna struktura ortogonalnog faktorskog modela 9 Rexenje: Koristei faktorski model (1.1), dobijamo sledee X1 −µ1 = l11F1 +ϵ1 X2 −µ2

1.5. Faktorski skorovi 25

da oba metoda koriste ocene faktorskih optere�enja lij i specifiqnih vari-jansi ψi kao taqne vrednosti i koriste linearne transformacije original-nih podataka, uglavnom centrirane ili standardizovane vrednosti. Tako�e,za faktorska optere�enja se qex�e uzimaju vrednosti rotiranih optere�enja.Postupak za ocenjivanje faktorskih skorova je isti bez obzira da li se ko-riste rotirana optere�enja ili originalne vrednosti.

1.5.1 Ocena faktorskih skorova metodomponderisanih najmanjih kvadrata

Neka je µ matematiqko oqekivanje posmatranog sluqajnog vektora X, Lmatrica faktorskih optere�enja i Ψ vektor specifiqnih varijansi za fak-torski model

X(p×1)

− µ(p×1)

= L(p×m)

F(m×1)

+ ϵ(p×1)

.

Posmatra�emo vektor specifiqnih faktora ϵ′ = (ϵ1, . . . , ϵp) kao grexke. Kakose specifiqni faktori ϵ′ = ϵ1, . . . , ϵp smatraju grexkama, to u V ar(ϵi) = ψi, i =1, p mo�e biti odstupanja, pa je Bartlet predlo�io da se koristi metod pon-derisanih najmanjih kvadrata za ocenjivanje vrednosti zajedniqkih faktora.Suma kvadrata grexaka ponderisanih reciproqnom vrednox�u njihovih var-ijansi je

p∑i=1

ϵ2iψi

= ϵ′Ψ−1ϵ = (X− µ−Lf)′ Ψ−1 (X− µ−Lf) . (1.52)

Bartlet predla�e da se ocena f faktorskih skorova F izabere tako da izraz(1.52) ima minimalnu vrednost. Ovo je ispunjeno ako je vrednost

f =(L′Ψ

−1L)−1

L′Ψ−1 (X− µ) . (1.53)

Primenjuju�i (1.53), ukoliko za vrednosti L,Ψ i µ uzmemo njihove ocene L, Ψi µ = X, tada se kao ocena faktroskog skora fj dobija

fj =(L

′Ψ

−1L)−1

L′Ψ

−1 (Xj −X

). (1.54)

Ako su L i Ψ odre�eni metodom maksimalne verodostojnosti, ove ocene moraju

zadovoljiti uslov jedinstvenosti, tj. da je L′Ψ

−1L = ∆ dijagonalna matrica.

Prema tome, na osnovu prethodnog i iz (1.54) va�i�e

fj = ∆−1L

′Ψ

−1 (Xj −X

), j = 1, n. (1.55)

Page 26: Faktorska analiza i primene · 1.2. Kovarijansna struktura ortogonalnog faktorskog modela 9 Rexenje: Koristei faktorski model (1.1), dobijamo sledee X1 −µ1 = l11F1 +ϵ1 X2 −µ2

26 1. Faktorska analiza

Ukoliko se na faktore razla�e korelaciona matrica tada se ocena fak-torskih skorova odre�uje na slede�i naqin:

fj =(L′

zΨ−1z Lz

)−1

L′zΨ

−1z Zj

= ∆−1j L′

zΨ−1z Zj j = 1, n,

(1.56)

gde je Zj = D− 12

(Xj −X

), D-uzoraqka kovarijansna matrica i va�i da je

ρ = LzL′z + Ψz. Ako se pri odre�ivanju faktorskih skorova koriste roti-

rana optere�enja L∗= LT , tada va�i da su odgovaraju�i faktorski skorovi

jednakif∗j = T′fj , j = 1, n.

Ako se faktorska optere�enja ocenjuju metodom glavnih komponenti onda sefaktorski skorovi mogu oceniti i standardnim metodom najmanjih kvadrata(dakle ne mora ponderisanim metodom najmanjih kvadrata), poxto su u tomsluqaju specificne varijanse ψi me�usobno jednake ili pribli�no jednake.Faktorski skorovi se tada ocenjuju na slede�i naqin:

fj =(L

′L)−1

L′ (Xj −X)

)odnosno

fj =(L′

zLz

)−1

L′zZj , j = 1, n

za standardizovane podatke. Koriste�i rezultat (1.21) nalazimo da je

fj =

1√λ1

e′1

(Xj −X

)1√λ2

e′2

(Xj −X

)...

1√λm

e′m

(Xj −X

)

. (1.57)

Za ovako dobijene ocene faktorskih skorova va�i�e da je

1

n

n∑j=1

fj = 0 (uzoraqka sredina)

i1

n− 1

n∑j=1

fjf′j = I (uzoraqka kovarijansa)

i tada se ocene faktorskih skorova fj poklapaju sa prvih m glavnih kompo-nenati sluqajnog vektora Xj.

Page 27: Faktorska analiza i primene · 1.2. Kovarijansna struktura ortogonalnog faktorskog modela 9 Rexenje: Koristei faktorski model (1.1), dobijamo sledee X1 −µ1 = l11F1 +ϵ1 X2 −µ2

1.5. Faktorski skorovi 27

1.5.2 Ocena faktorskih skorova regresionim metodom

Za ocenjivanje faktorskih skorova primenom regresionog metoda va�i�e,sliqno kao za metod najmanjih kvadrata, da su matrica optere�enja L i speci-fiqne varijanse Ψ poznate. Ako u faktorskom modelu X−µ = LF+ϵ faktoriF i specifiqni faktori (tj. grexke) ϵ imaju normalnu raspodelu odre�enusa (1.3), tada linearna kombinacija X − µ = LF + ϵ ima Np (0,LL

′ +Ψ)raspodelu, dok je zajedniqka raspodela za (X− µ) i F : Nm+p (0,Σ

∗), gde je

Σ∗(m+p)×(m+p)

=

Σ = LL′(p×p)

+Ψ L(p×m)

L′(m×p)

I(m×m)

(1.58)

i 0 je (m+ p)× 1 nula vektor, a uslovna raspodela za F|X je vixedimenzion-lana normalana raspodela sa parametrima

E (F|X) = L′Σ−1 (X− µ) = L′ (LL′ +Ψ)−1

(X− µ) (1.59)

iCov (F,F|X) = I− L′Σ−1L = I− L′ (LL′ +Ψ)

−1L. (1.60)

Uslovno matematiqko oqekivnje E(F|X) predstavlja regresioni model za-jedniqkih faktora F u odnosu na sluqajni vektor X, a veliqine L′ (LL′ +Ψ)

−1

u (1.60) su regresioni koeficijenti. Ocenjivanjem regresionih koeficije-nata oceni�emo i faktorske skorove, koji �e odgovarati vrednosti uslovnogmatematiqkog oqekivanja u regresionoj analizi. Prema tome, koriste�i dativektor Xj i ocene L i Ψ mo�emo oceniti j-ti faktorski skor pomo�u

fj = L′Σ

−1 (Xj −X

)= L

′ (LL

′+ Ψ

)−1 (Xj −X

), j = 1, n. (1.61)

Izraqunavanje fj pomo�u (1.61) mo�e se pojednostaviti koriste�i identitet

L′ (LL

′+ Ψ

)−1

=

(I+ L

′Ψ

−1L

(m×m)

)−1

L′

(m×p)Ψ

−1

(p×p). (1.62)

Ovaj identitet nam omogu�ava da upore�ujemo ocene faktorskih skorovadobijenih regresionim metodom i metodom najmanjih kvadrata. Ako ocene fak-

torskih skorova dobijene regresionim metodom obele�imo sa fR

j , a metodom

najmanjih kvadrata obele�imo sa fLS

j , mo�emo primetiti da za njih va�irelacija

fLS

j =(L

′Ψ

−1L)−1 (

I+ L′Ψ

−1L)f

R

j =

(I+

(L

′Ψ

−1L)−1

)f

R

j . (1.63)

Page 28: Faktorska analiza i primene · 1.2. Kovarijansna struktura ortogonalnog faktorskog modela 9 Rexenje: Koristei faktorski model (1.1), dobijamo sledee X1 −µ1 = l11F1 +ϵ1 X2 −µ2

28 1. Faktorska analiza

Ako su ocene L i Ψ dobijene metodom maksimalne verodostojnosti , onda

je(L

′Ψ

−1L)−1

= ∆−1

i ako su elementi ove dijagonalne matrice blizu nule,

onda �e ova dva metoda dati pribli�no iste ocene faktorskih skorova. Dabi se smanjio efekat eventualnog pogrexnog izraqunavanja broja faktora,faktorski skorovi se mogu ocenjivati korix�enjem vrednosti uzoraqke ko-varijansne matrice S, umesto ocene kovarijansne matrice Σ. U tom sluqajuva�i�e slede�e:

fj = L′S−1

(Xj −X

), j = 1, n, (1.64)

ili, u sluqaju korelacione matrice

fj = L′zR

−1Zj , j = 1, n (1.65)

gde je Zj = D− 12

(Xj −X

), D-uzoraqka kovarijansna matrica i va�i da je

ρ = LzL′z + Ψz. Tako�e, ako se pri odre�ivanju faktorskih skorova koriste

rotirana optere�enja L∗ = LT , tada va�i da su odgovaraju�i faktorskiskorovi jednaki f∗

j = T′fj , j = 1, n.Odnos izme�u rezultata dobijenih ovim metodima se mo�e opisati pomo�u

uzoraqkog koeficijenta korelacije dobijenih ocena za faktorske skorove, aova dva metoda su me�usobno ravnopravna. U faktorskoj analizi je qestapretpostavka o normalnoj raspodeli promenljivih, mada ona u sluqaju ve-likog broja promenljivih nije opravdana. Tako�e, ni faktorski skorovi ne-maju nu�no normalnu raspodelu. Preporuquje se grafiqka analiza ocena fak-torskih skorova pre nego xto se one upotrebe za dalju analizu, jer se na ovajnaqin mogu otkriti autlajeri ili odsustvo normalne raspodele.

Page 29: Faktorska analiza i primene · 1.2. Kovarijansna struktura ortogonalnog faktorskog modela 9 Rexenje: Koristei faktorski model (1.1), dobijamo sledee X1 −µ1 = l11F1 +ϵ1 X2 −µ2

Deo 2

Primena faktorske analize

Primer 2.1. Upore�ivane su karakteristike 100 pravih i 100 la�nih novqan-ica starih xvajcarskih franaka. Ocenjivane su slede�e karakteristike:X1 : du�ina novqaniceX2 : xirina novqanice sa leve straneX3 : xirina novqanice sa desne straneX4 : rastojanje unutraxnjeg okvira od donje ivice novqaniceX5 : rastojanje unutraxnjeg okvira od gornje ivice novqaniceX6 : du�ina dijagonale novqanice

Ako je data korelaciona matrica dobijenih podataka, ispitati kolikofaktora je mogu�e izdvojiti primenom analize glavnih faktora.

R =

1, 0000 0, 2313 0, 1518 −0, 1898 −0, 0613 0, 19430, 2313 1, 0000 0, 7433 0, 4138 0, 3623 −0, 50320, 1518 0, 7433 1, 0000 0, 4868 0, 4007 −0, 5165−0, 1898 0, 4138 0, 4868 1, 0000 0, 1419 −0, 6230−0, 0613 0, 3623 0, 4007 0, 1419 1, 0000 −0, 59400, 1943 −0, 5032 −0, 5165 −0, 6230 −0, 5940 1, 0000

Rexenje: Kako je broj promenljivih p = 6, ukoliko uzmemo da je m = 3

dobijamo da va�i

d =1

2(6− 3)2 − 1

2(6 + 3) = 4, 5− 4, 5 = 0

xto bi imalo za posledicu da postoji taqno rexenje ortogonalnog faktorskogmodela, a iz primera (1.1.) vidimo da to nije uvek i tra�eno rexenje. Uovakvim situacijama se preporuquje da se pokuxa da se na�e rexenje fak-torskog modela sa manjim brojem faktora, pa �emo uzeti da je m = 2.

Kako komunaliteti h2j , j = 1, 6 opisuju uticaj zajedniqkih faktora na vari-

jansu promenljivih, to za poqetnu ocenu komunaliteta mo�emo uzeti h2j =

29

Page 30: Faktorska analiza i primene · 1.2. Kovarijansna struktura ortogonalnog faktorskog modela 9 Rexenje: Koristei faktorski model (1.1), dobijamo sledee X1 −µ1 = l11F1 +ϵ1 X2 −µ2

30 2. Primena faktorske analize

maxi¬j,i=1,6

∣∣ρXj ,Xi

∣∣. Ocena komunaliteta za novqanice bi�e

h2 =(h21, . . . , h

26

)′= (0, 2313; 0, 7433; 0, 7433; 0, 6230; 0, 5940; 0, 6230)′ .

Ocene specifiqnih varijansi ψjj, j = 1, 6 su tada jednake

ψjj =(ψ11, . . . , ψ66

)′= (0, 7687; 0, 2567; 0, 2567; 0, 3770; 0, 4060; 0, 3770)′

pa je redukovana korelaciona matrica jednaka

R−diag(Ψ) =

0, 2313 0, 2313 0, 1518 − 0, 1898 − 0, 0613 0, 19430, 2313 0, 7433 0, 7433 0, 4138 0, 3623 − 0, 50320, 1518 0, 7433 0, 7433 0, 4868 0, 4007 − 0, 5165− 0, 1898 0, 4138 0, 4868 0, 6230 0, 1419 − 0, 6230− 0, 0613 0, 3623 0, 4007 0, 1419 0, 5940 − 0, 59400, 1943 − 0, 5032 − 0, 5165 − 0, 6230 0, 5940 0, 6230

Odgovaraju�e sopstvene vrednosti za matricu R = diag(Ψ) su jednake

Λ = (2, 6214; 0, 7232; 0, 4765; 0, 0054; 0, 0845; 0, 1841)′ .

U ovom koraku mo�e se desiti da neke sopstvene vrednosti budu negativne, iprilikom rada faktorske analize na raqunaru treba uzeti u obzir verovatno�uda redukovana korelaciona matrica ne bude pozitivno definitna.

Matrica sopstvenih vektora redukovane koralcione matrice je

G =

− 0, 0011 − 0, 6225 0, 0488 − 0, 1397 0, 7663 0, 05820, 4832 − 0, 4510 − 0, 0727 − 0, 5783 − 0, 4575 − 0, 11850, 5019 − 0, 3314 − 0, 1077 0, 7670 − 0, 1328 0, 14380, 3974 0, 3489 − 0, 6039 − 0, 0434 0, 3510 − 0, 48020, 3543 0, 1661 0, 7768 0, 0604 0, 1328 − 0, 4714− 0, 4807 − 0, 3872 − 0, 1125 0, 2285 − 0, 2123 − 0, 7135

.

Kako je m = 2 to je ocena matrice faktorskih optere�enja L jednaka

L =

− 0, 0011 − 0, 62250, 4832 − 0, 45100, 5019 − 0, 33140, 3974 0, 34890, 3543 0, 1661− 0, 4807 − 0, 3872

[√

2, 6214 00

√0, 7232

]=

− 0, 0018 − 0, 52940, 7824 − 0, 38350, 8127 − 0, 28190, 6435 0, 29670, 5736 0, 1412− 0, 7783 − 0, 3293

.

Page 31: Faktorska analiza i primene · 1.2. Kovarijansna struktura ortogonalnog faktorskog modela 9 Rexenje: Koristei faktorski model (1.1), dobijamo sledee X1 −µ1 = l11F1 +ϵ1 X2 −µ2

31

Dakle, dobili smo ocenu jednog razlaganja korelacione matrice R = LL′ +ψ. Sada mo�emo primeniti faktorsku analizu na ocenu R, i ovaj postupakmo�emo primenjivati sve dok ne dobijemo zadovoljavaju�e rezultate, odnosnodok se ne postigne tra�ena taqnost rezultata.

Tabela 2.1.

U tabeli 2.1. su date finalne ocene, dobijene ponavljanem opisanog po-supka nekoliko puta.

Slede�i korak u faktorskoj analizi bi bila faktorska rotacija, radilakxe interpretacije faktora.

Na slici 2.2. su prikazani faktori pre i posle rotacije respektivno, zaocene prikazane u tabeli 2.1. . Rotacija je ra�ena za ugao od 5π/12. Fak-torskom rotacijom, koja se dobija mno�enjem matrice ocene faktorskih optere�enjamatricom

G =

[cosθ sinθ−sinθ cos θ

]gde je θ = 5π/12 menjaju se samo vrednosti faktorskih optere�enja i njihovainterpretacija. Prema slici 2.2., uoqavamo da je jedan faktor pozitivnokorelisan sa osobinama X1, X2 i X4, dok je drugi faktor pozitivno korelisansa osobinama X2, X3, X4 i X5, dok je negativnokorelisan sa osobinom X6.

Page 32: Faktorska analiza i primene · 1.2. Kovarijansna struktura ortogonalnog faktorskog modela 9 Rexenje: Koristei faktorski model (1.1), dobijamo sledee X1 −µ1 = l11F1 +ϵ1 X2 −µ2

32 2. Primena faktorske analize

Slika 2.2.

Primer 2.2. Neka su dostupni podaci koji predstavljaju analizu uzroka smrt-nih sluqajeva u SAD za 1985. godinu. Podaci su klasifikovani u sedamkategorija, za svaku od 50 dr�ava SAD-a. Kategorije su slede�e:X1 : saobra�ajne nesre�eX2 : kardiovaskularne bolestiX3 : rakX4 : plu�ne bolesti (bez raka plu�a i pneumonije)X5 : pneumonijaX6 : dijabetesX7 : bolesti jetre.

Primeniti faktorsku analizu na ove podatke. Da li postoji kategorijakoja nije znaqajna za faktorsku analizu i koja bi mogla da se izostavi?

Rexenje: Kako je broj promenljivih p = 7, ukoliko uzmemo da je m = 4 dobi-jamo da va�i

d =1

2(7− 4)2 − 1

2(7 + 4) = 4, 5− 5, 5 = −1

Page 33: Faktorska analiza i primene · 1.2. Kovarijansna struktura ortogonalnog faktorskog modela 9 Rexenje: Koristei faktorski model (1.1), dobijamo sledee X1 −µ1 = l11F1 +ϵ1 X2 −µ2

33

odnosno da je d < 0, pa bi model bio neodre�en. Uzmimo da je m = 3, tadadobijamo da va�i

d =1

2(7− 3)2 − 1

2(7 + 3) = 8− 5 = 3,

pa se opredeljujemo da broj zajedniqkih faktora bude m = 3. Rezultat fak-torske analize dat je u tabeli 2.3. i grafiqkom prikazu podataka na slici2.4. .

Tabela 2.3.

Faktorska analiza ra�ena je primenom metoda maksimalne verodostojnostii varimaks rotacije. Na osnovu rezultata prime�ujemo da faktorski modeldobro opisuje podatke, s obzirom da samo kategorije ”saobra�ajne nesre�e” i”plu�ne bolesti” imaju manje vrednosti komunaliteta. Na osnovu grafiqkogprikaza podataka prime�ujemo da prvi faktor mo�e objasniti uzorke smr-ti koji su u vezi sa kardiovaskularnim bolestima, rakom i dijabetesom,drugi faktor mo�e objasniti pneumoniju i bolesti jetre, dok tre�i fak-tor se povezuje sa svim uzrocima sem sa nesre�nim sluqajevima i dijabete-som. Adekvatnost ovog faktorskog modela ispita�emo testiranjem hipoteze obroju zajedniqkih faktora, koriste�i i Bartletovu korekciju. Dakle, nultahipoteza bi glasila H0 : m = 3. Za rezultat testa se dobija 3,66, dokje granica kritiqne oblasti χ2

0,95;3 = 7, 81, pa nultu hipotezu ne odbijamo,odnosno korix�eni faktorski model je adekvatan za date podatke.

Page 34: Faktorska analiza i primene · 1.2. Kovarijansna struktura ortogonalnog faktorskog modela 9 Rexenje: Koristei faktorski model (1.1), dobijamo sledee X1 −µ1 = l11F1 +ϵ1 X2 −µ2

34 2. Primena faktorske analize

Slika 2.4.

Primer 2.3. Neka su dati podaci koji predstavljaju prijavljen broj krimin-lanih radnji 1985.godine u 50 dr�ava SAD-a, klasifikovanih u 7 katergorija(X3 −X9):X1 : Dr�avaX2 : Broj stanovnika 1985.godineX3 : Broj ubistavaX4 : Broj silovanjaX5 : Broj pljaqkiX6 : Broj fiziqkih napadaX7 : Broj provalaX8 : Broj razbojnixtava

Page 35: Faktorska analiza i primene · 1.2. Kovarijansna struktura ortogonalnog faktorskog modela 9 Rexenje: Koristei faktorski model (1.1), dobijamo sledee X1 −µ1 = l11F1 +ϵ1 X2 −µ2

35

X9 : Broj ukradenih automobilaX10 : Broj regiona u SADX11 : Broj dr�ava u SAD

Primeniti faktorsku analizu na ove podatke i izraqunati faktorske sko-rove.

Rexenje: Kako imamo podatke o prijavljenim kriminalnim radnjama za50 dr�ava, klasifikovanih u 7 kategorija, to za broj zajedniqkih faktoramo�emo uzeti m = 3. Ocene faktorskih optere�enja data u tabeli 2.5. sudobijena primenom metoda maksimalne verodostojnosti i varimaks rotacije.

Tabela 2.5.

Testiranjem hipoteze o adekvatnosti modela za 3 zajedniqka faktora do-bijamo da je p-vrednost jednaka 0,8257, pa se nulta hipoteza H0 : m = 3 neodbija, odnosno model je adekvatan.

Prvi faktor se mo�e smatrati uopxtenim faktorom kriminaliteta, drugifaktor ima pozitivan uticaj na broj opljaqkanih ku�a, a negativan na uticajna nasilnije kriminalne radnje kao xto su ubistva i fiziqki napadi. Tre�ifaktor ima uticaj na pljaqku i kra�u automobila.

Da bi smo opisali razlike izme�u dr�ava u SAD-u treba oceniti vred-nosti faktorskih skorova za pojedinaqne opservacije. Najqex�e korix�eniregresioni metod se zansniva na zajedniqkoj raspodeli za (X − µ) i F. Za-jedniqka kovarijansna matrica za (X− µ) i F je

V ar

([X− µ

F

])=

[LL

′+Ψ L

L′

Im

]=

[Σ L

L′Im

].

U praksi se umesto Σ,L i µ koriste njihove ocene, odakle dobijamo zaocene faktorskih skorova

Page 36: Faktorska analiza i primene · 1.2. Kovarijansna struktura ortogonalnog faktorskog modela 9 Rexenje: Koristei faktorski model (1.1), dobijamo sledee X1 −µ1 = l11F1 +ϵ1 X2 −µ2

36 2. Primena faktorske analize

fj = L′S−1(Xi −X). (2.1)

Faktorske skorove mo�emo raqunati i koriste�i uzoraqku korelacionumatricu R umesto uzoraqke kovarijansne matrice S, i u tom sluqaju korstimostandardizovane vrednosti opservacija, a ocene faktorskih skorova se dobi-jaju na slede�i naqin:

fi = L′R

−1(zi).

Ocenjeni faktorski skorovi su prikazani na slici 2.6. .

Slika 2.6.

Mo�emo primetiti da prvi faktor, opxti faktor kriminaliteta, ima naj-ve�i uticaj u Kaliforniji, Arizoni i Floridi, drugi faktorski skor suger-ixe da drugi faktor, koji povezuje ubistvo i razbojnixtvo, ima najve�i uti-caj u Severnoj Karolini, dok tre�i faktor ima najve�i uticaj u Masaqusetsu

Page 37: Faktorska analiza i primene · 1.2. Kovarijansna struktura ortogonalnog faktorskog modela 9 Rexenje: Koristei faktorski model (1.1), dobijamo sledee X1 −µ1 = l11F1 +ϵ1 X2 −µ2

37

i Njujorku.

Primer 2.4. Ispitivana je evolucija vokabulara uqenika tokom xkolovanja.Eksperiment je ra�en na uzorku od 64 uqenika, od 8-11 razreda Laboratori-jske xkole Univerziteta u Qikagu. Primenom faktorske analize utvrditi dali je evolucija vokabulara povezana sa razredom uqenika.

Rexenje: Podaci sadr�e rezultate testiranja 64 uqenika od osmog do jedanae-stog razreda. Svaki uqenik je tokom svakog razreda bio testiran. Diskusijompo broju stepeni slobode odluqujemo se da broj zajedniqkih faktora budem = 1. Testiranjem hipoteze o adekvatnosti broja zajedniqkih faktora,H0 : m = 1, dobijamo da je vrednost test statistike 1,6101, xto je manjeod granice kritiqne oblasti χ2

0,95;2 = 5, 9915, pa zakljuqujemo da je broj za-jedniqkih faktora adekvatan. Primenom metoda maksimalne verodostojnostidobijeni su rezultati prikazani u tabeli 2.7. (s obzirom da je broj zajed-niqkih faktora m = 1, faktorska rotacija nije potrebna).

Tabela 2.7.

Na osnovu dobijenih rezultata mo�emo zakljuqiti da je nivo znanja voka-bulara uticao na rezultate dobijene u svim razredima.

Ocene faktorskih skorova prikazane su na slici 2.8., pri qemu su na ho-rizontalnoj osi predstavljene vrednosti faktorskih skorova, dok vertikalnaosa nema znaqenje, ve� su rezulati tako prikazani da bi bili vidljivi. Mo�emoprimetiti da su najbolji rezultat postigli 36. i 38. opservacija, dok naj-slabiji rezultat ima 5. ispitanik.

Page 38: Faktorska analiza i primene · 1.2. Kovarijansna struktura ortogonalnog faktorskog modela 9 Rexenje: Koristei faktorski model (1.1), dobijamo sledee X1 −µ1 = l11F1 +ϵ1 X2 −µ2

38 2. Primena faktorske analize

Slika 2.8.

Primer 2.5. Neka su dostupni podaci o nacionalnim rekordima u 8 atlet-skih disciplina za 55 dr�ava. Analizirati date podatke. Da li je mogu�euoqiti neke pravilnosti u ovim podacima?

Rexenje: Dostupni su nam podaci o nacionalnim rekordima za osam atlet-skih disciplina u 55 dr�ava. Kako je broj promenljivih p = 8, ukolikouzmemo da je m = 4 dobijamo da va�i

d =1

2(8− 4)2 − 1

2(8 + 4) = 8− 6 = 2.

Za m = 3 dobijamo da je broj stepeni slobode

d =1

2(8− 3)2 − 1

2(8 + 3) = 12, 5− 5, 5 = 7.

Kako je u oba sluqaja d > 0, odluqi�emo se da broj zajedniqkih faktorabude m = 3, a zatim testirati adekvatnost faktorskog modela za ovako iz-abrani broj zajedniqkih faktora m = 3. Primenjuju�i rezultate dobijenemetodom maksimalne verodostojnosti, mo�emo testirati adekvatnost modelatestiraju�i hipotezu H0 : m = 3. Za vrednost test statistike dobija se7,5207, xto je manje od granice kritiqne oblasti χ2

0,75;7 = 14, 0671, xto znaqida je model sa 3 zajedniqka faktora adekvatan.

Rezultati dobijeni metodom maksimalne verodostojnosti i varimaks rotaci-jom prikazani su u tabeli 2.9. i na slici 2.10..

Page 39: Faktorska analiza i primene · 1.2. Kovarijansna struktura ortogonalnog faktorskog modela 9 Rexenje: Koristei faktorski model (1.1), dobijamo sledee X1 −µ1 = l11F1 +ϵ1 X2 −µ2

39

Tabela 2.9.

Mo�emo primetiti iz komunaliteta i specifiqnih varijansi da ova trifaktora dobro objaxanjavaju sve podatke sem rekorde za 200m. Prvi faktorima jak uticaj na rekorde na 100m i 200m, drugi faktor ima jaqi uticaju disciplinama na ve�oj udaljenosti, dok tre�i faktor ima ve�i uticaj udisciplinama sa srednjom udaljenox�u i na 100m. Treba ista�i da u ovomprimeru ve�i brojevi ukazuju na loxije vreme, odnosno da su u atleticibolje nacije koje imaju kra�a vremena u posmatranim trkama. Ocenjivanjemfaktorskih skorova mo�emo dobiti listu dr�ava pore�anih po uspexnostipo svakom faktoru, xto je prikazano u tabeli 2.11..

Page 40: Faktorska analiza i primene · 1.2. Kovarijansna struktura ortogonalnog faktorskog modela 9 Rexenje: Koristei faktorski model (1.1), dobijamo sledee X1 −µ1 = l11F1 +ϵ1 X2 −µ2

40 2. Primena faktorske analize

Slika 2.10.

Dakle, mo�emo uoqiti da najbolje sprintere imaju Italija, Kolumbija,SAD, Rusija, dok u disciplinama sa ve�om udaljenox�u najbolje rezultateimaju Portugal, Novi Zeland, Irska, Holandija i Kenija. Najbolja vremenau disciplinama na srednjom udaljenox�u imaju Velika Britanija, Bermuda,Dominikanska Republika, Tajland i SAD. Mo�e se primetiti da u dr�avamau kojima jak uticaj imaju tre�i ili drugi faktor, istovremeno slabiji uticajima prvi faktor, na primer u Dominikanskoj Republici, Holandiji i Keniji.

Page 41: Faktorska analiza i primene · 1.2. Kovarijansna struktura ortogonalnog faktorskog modela 9 Rexenje: Koristei faktorski model (1.1), dobijamo sledee X1 −µ1 = l11F1 +ϵ1 X2 −µ2

41

Tabela 2.11.

Page 42: Faktorska analiza i primene · 1.2. Kovarijansna struktura ortogonalnog faktorskog modela 9 Rexenje: Koristei faktorski model (1.1), dobijamo sledee X1 −µ1 = l11F1 +ϵ1 X2 −µ2

ZAKLjUQAK

U primeni faktorske analize potrebno je doneti nekoliko odluka, a jednaod najva�nijih jeste odluka o broju zajedniqkih faktora. Odluka o broju za-jedniqkih faktora je najqex�e bazirana na osnovu kombinacije rezultata ra-zlaganja uzoraqke kovarijansne matrice, znanja o predmetu prouqavanja kao ismislenosti dobijenih rezultata. Prilikom izbora modela faktorske rotaci-je preporuquje se da se proba sa vixe modela, i ako je faktorski model dotog trenutka bio dobar onda bi trebalo da svaki model faktorske rotacijepotvrdi to rexenje.

Faktorska analiza ima veliku primenu u bihejvioralnom i socijalnomprouqavanju, gde je uobiqajno da se ponaxanje posmatranog objekta obajxnj-ava neopa�ivim karakteristikama. Faktorska analiza daje jednu ili vixemogu�nosti za objaxnjavanje ovakvih problema.

Ipak, faktorska analiza se smatra subjektivnom analizom. Na primerimaprikazanim u radu, faktorska analiza daje smislena objaxnjenja, me�utim upraksi se qesto nailazi i na manje korisne modele prilikom primene fak-torske analize, ali to ne umanjuje njenu korisnost. Za sada ne postoje pouz-dani modeli za ocenu kvaliteta faktorske analize, i ovo polje daje ideje zadalja istra�ivanja.

Page 43: Faktorska analiza i primene · 1.2. Kovarijansna struktura ortogonalnog faktorskog modela 9 Rexenje: Koristei faktorski model (1.1), dobijamo sledee X1 −µ1 = l11F1 +ϵ1 X2 −µ2
Page 44: Faktorska analiza i primene · 1.2. Kovarijansna struktura ortogonalnog faktorskog modela 9 Rexenje: Koristei faktorski model (1.1), dobijamo sledee X1 −µ1 = l11F1 +ϵ1 X2 −µ2

44 2. Primena faktorske analize

Page 45: Faktorska analiza i primene · 1.2. Kovarijansna struktura ortogonalnog faktorskog modela 9 Rexenje: Koristei faktorski model (1.1), dobijamo sledee X1 −µ1 = l11F1 +ϵ1 X2 −µ2

Literatura

[1] Richard A. Johnson, Applied Multivariate Statistical Analysis, ”Pearson Ed-ucation” New York, 2007.

[2] Wolfgang Hrdle, Lopold Simar, Applied Multivariate Statistical Analysis,”Springer” New York, 2007.

[3] Wolfgang Hardle, Zdenek Hlavka, Multivariate Statistics: Exercises and So-lutions, ”Springer” New York, 2007.

[4] Zlatko J. Kovaqi�, Multivarijaciona analiza, Beograd, 1994.

[5] www.wikipedia.org

45

Page 46: Faktorska analiza i primene · 1.2. Kovarijansna struktura ortogonalnog faktorskog modela 9 Rexenje: Koristei faktorski model (1.1), dobijamo sledee X1 −µ1 = l11F1 +ϵ1 X2 −µ2

Biografija

Milica Stefanovi� je ro�ena 22.07.1990. u Nixu. Osnovnu xkolu ”De-sanka Maksimovi�” u Qokotu je zavrxila 2005. godine sa odliqnim uspehom.Gimanziju ”Bora Stankovi�” u Nixu, prirodno matematiqki smer, je zavrx-ila 2009. godine, tako�e sa odliqnim uspehom.

Osnovne akademske studije je upisala 2009. godine na departmanu zamatematiku Prirodno-matematiqkog fakulteta u Nixu, koje je zavrxila 2013.godine. Iste godine je upisala master akademske studije na Prirodno-mate-matiqkom fakultetu u Nixu, na smeru Primenjena matematika, modul Matem-atika u finansijama.