Upload
truongdang
View
231
Download
2
Embed Size (px)
Citation preview
MULTIVARIATNA ANALIZA VARIANCE
PREDSTAVITEV
MIHA KOČEVAR
KRATEK UVOD� t test – ali prihajata aritmetični sredini dveh skupin iz iste
distribucije?
� Hottelingov T2 – ali prihajata vektorja aritmetičnih sredin iz iste vzorčne distribucije?
� ANOVA – ali prihajajo aritmetične sredine dveh ali več skupin iz iste distribucije?
� MANOVA – ali prihajajo vektorji aritmetičnih sredin dveh ali več skupin iste vzorčne distribucije?
Zakaj namesto (M)ANOVA-e ne uporabimo več primerjav med dvema skupinama?
� s povečevanjem števila t testov (T2), povečujemo tudi verjetnost naključno dobljenih pomembnih razlik,
� zakon t testa (T2) velja za naključne vzorce,� s povečevanjem števila skupin se izračunavanje vseh
možnih parov izredno zavleče,� z upoštevanjem samo dveh (vektorjev) aritmetičnih
sredin, izgubimo na natančnosti, ki je vsebovana v variabiliteti vseh skupin in ne samo tistih, ki ju izračunavamo.
Kaj je Hottelingov T2?
� Je statistični postopek, ki omogoča izračun razlik med dvema skupinama glede na eno variato, ki je sestavljena iz večih odvisnih variabel na način, da ti dve skupini razlikuje v največji možni meri.
� C = kompozit oz. vrednost variate za respondenta� Wi = utež za odvisno variablo i� Yi = vrednost odvisne variable i
1 1 2 2 n nC W Y W Y W Y= + + +…
MANOVA� Nadgradnja Hottelingovega T2
� Razumevanje teorije vzorčenja� Vzorčimo opazovanja in ne vrednosti� Objekt opazovanja ima več atributov� MANOVA – vzorčimo opazovanja in pri tem ignoriramo prav
vse atribute razen tistih (dveh ali več), za katere smo zainteresirani – odvisne spremenljivke
� Nadgradnja diskriminantne analize� Tri ali več odvisnih spremenljivk� Izračun največjega karakterističnega korena gcr� Prikaže tudi katera kategorija ima večji vpliv na pojav razlik
Situacije v katerih uporabimo MANOVA-o
� Kontrola eksperimentalne napake� Merjenje vpliva več neodvisnih
spremenljivk na kombinacijo več odvisnih spremenljivk� Eksperimentalni načrt
Korak 1: Raziskovalni problem
� Tip raziskovalnega problema� Multipla univariatna vprašanja
� Odvisne variable analiziramo ločeno, vendar pa zahtevamo splošno kontrolo nad obsegom eksperimentalne napake
� Strukturirana multivariatna vprašanja� Pri obravnavi uporabljamo dve ali več odvisnih spremenljivk, ki
so specifično povezane – ponovljene meritve� Intrinzična multivariatna vprašanja
� Zajema set odvisnih meritev, za katere nas v osnovi zanima, kako razlikujejo med skupinami kot celota
� Izbira odvisnih spremenljivk� Neustrezna izbira vodi v “zmotne” razlike� Oceniti moramo vse aspekte raziskovalnega vprašanja in
zagotoviti uporabo MANOVA-e v pravilni in ustrezni obliki
Korak 2: Raziskovalno načrtovanje
� Določimo velikost vzorca� Priporočeno je najmanj 20 opazovanj na celico. � Skrajni minimum – število opazovanj v celici naj
bo večje od števila odvisnih spremenljivk� Faktorski dizajn – dve ali več smeri
� Izbor neodvisnih spremenljivk glede na vrsto eksperimenta
� Post hoc uporaba blok faktorja, namenjena segmentaciji respondentov in zmanjševanju MSWizvora variance
� Uporaba kovariat – MANCOVA →
MANCOVA
� Cilji uporabe kovariat� Eliminacija neke sistematične napake izven kontrole, ki jo ima
raziskovalec� Z obzirom na razlike v odzivih, ki so posledica edinstvenih
karakteristik respondentov� Eliminacija vseh efektov, ki vplivajo zgolj na del respondentov
ali pa variirajo med respondenti� Izbor kovariat
� Efektivna kovariata visoko korelira z odvisnimi spremenljivkami in ni v korelaciji z neodvisnimi
� Pravilo palca – kovariat naj bo manj kot:
� Pogoji za uporabo MANCOVA-e:� Kovariata mora biti v nekem odnosu z odvisno spremenljivko� Kovariata mora imeti homogen regresijski efekt� Kovariata mora biti na metričnem nivoju
(0.10 ) ( 1)vzorca skupinN N× − −
Korak 3: Predpostavke
� Neodvisnost� Kršitve
� Efekt vrstnega reda (serialna korelacija)� Prisotnost skupne izkušnje� Vpliv zunanjih in nemerjenih efektov
� Rešitve� Kombiniranje rezultatov udeležencev znotraj skupin in
analiza skupinskega povprečja� Uvedba blok faktorja ali kovariantne analize� V obeh primerih moramo uporabiti strožje stopnje
pomembnosti (0.01 ali nižje)
Korak 3: Predpostavke
� Enakost matrik varianc-kovarianc� Testiramo elemente kovariančnih matrik
vseh odvisnih variabel� Kršitev ima majhen efekt pri izenačenih
skupinah (Nmax/Nmin < 1,5)� Hipotezo o enakosti kovarianc testiramo z
Boxovim testom – občutljiv na odklone od normalnosti
Korak 3: Predpostavke
� Normalnost� Domneva se multivariatna normalnost� Nimamo testa s katerim bi jo izmerili� Zadovoljimo se z univariatno normalnostjo
vseh odvisnih spremenljivk� Odstopanja od normalnosti imajo majhen
efekt pri velikih vzorcih
Korak 3: Predpostavke
� Linearnost in multikolinearnost� Lahko ju ugotavljamo le pri odvisnih
spremenljivkah in kovariatah� Iščemo nelinearne odnose� Visoka kolinearnost med odvisnimi
spremenljivkami pomeni visoko redundantnost
� Občutljivost na zunanje vplive� MANOVA je še posebej občutljiva na zunanje
vplive in njihovo delovanje na α napako
Korak 4: Ocenjevanje MANOVA-e
� Kriteriji za ocenitev multivariatnih razlik� Uporabimo meritev, ki bo najbolj imuna na kršitve domnev in hkrati
poseduje največjo statistično moč� Royev gcr
� Meri razlike na prvem kanoničnem korenu� Prednosti v moči in natančnosti� Slabo se obnese, če moramo testirati vse dimenzije in je najbolj podvržen
kršitvam domnev� Wilksova lambda (ali U)
� Upošteva vse diskriminantne funkcije� Je najpogosteje naveden kriterij
� Hotellingov ostanek (trace)� Upošteva vse diskriminantne funkcije
� Pillaijev kriterij� Upošteva vse diskriminantne funkcije� Robusten in primeren za uporabo pri manjšem vzorcu, neenakih celicah ali
pri kršeni homogenosti (ko)varianc
Korak 4: Ocenjevanje MANOVA-e
� Statistična moč multivariatnih testov� Je verjetnost, da bo statistični test identificiral efekte postopka, ki v
resnici obstajajo� Stopnje moči statističnih kriterijev bazirajo na:
� α stopnji� Velikosti efekta statističnega postopka� Velikosti vzorca skupin
� Povečevanje moči� Večanje vzorca v skupinah� Pomembna vloga efekta veličine (effect size)
� Uporaba moči pri planiranju in analizi� Na podlagi predhodnih raziskav in z razumnim presojanjem ocenimo
efekt veličine in določimo ustrezno velik vzorec
→
Korak 4: Ocenjevanje MANOVA-e
� Statistična moč multivariatnih testov� Izračun stopnje moči
� V analizi uporabljamo računalniške programe� V pripravi uporabljamo tabele:
→
Korak 4: Ocenjevanje MANOVA-e
� Statistična moč multivariatnih testov� Vpliv multikolinearnosti odvisnih
spremenljivk na statistično moč� Delitev variabel po efektu veličine na močne in
šibke� Največjo moč dosežemo pri koreliranih parih
� Močna-močna ali šibka-šibka variabla� Korelacija mora biti visoka in negativna
� Kombinacija močne in šibke variable� Korelacija mora biti visoka, ne glede na smer
Korak 5: Interpretacija rezultatov
� Interpretacija efektov kovatriat� Ocenitev katere odvisne spremenljivke
poudarjajo razlike med skupinami� Identifikacija skupin, ki odstopajo na
posameznih odvisnih variablah ali na celotni kovariati
Evaluacija kovariat
� Vpliv ocenjujemo skozi obliko regresijskeenačbe
� Če imajo kovariate teoretično ozadje, potem nam rezultati predstavljajo objektivno bazo za potrditev ali zavrnitev predlaganih odnosov
� Eliminiramo kovariate z majhnim pomenom� Preverimo vpliv kovariat na statistične teste
Ocenjevanje odvisne variable
� Katera od odvisnih spremenljivk največ doprinese k splošnim razlikam
� Uporabimo proceduro post hoc ali a priori testov� Največkrat uporabimo univariatne teste� Narašča verjetnost α napake� Načelo Bonferronijeve neenakosti
� Uporabimo postopno analizo (stepdown analysis)� Preučujemo ali določena variabla vsebuje edinstveno
(nekorelirano) informacijo� Pomembno je zaporedje testiranj
Odkrivanje razlik med skupinami
� Post hoc metode� Preiskujemo med katerima dvema skupinama
prihaja do pomembnih razlik� Izvede se vse možne primerjave parov skupin� Veliko meritev in zaostrovanje kriterija α napake
pomeni nizko moč testov� Metode
� Scheffejeva metoda� HSD� LSD� Duncanov test� Newman-Kuelsov test
Odkrivanje razlik med skupinami
� A priori ali planirane primerjave� Vnaprej določimo katere skupine bomo preverjali� Število primerjav je manjše, kot pri post hoc testu, zato ima
metoda večjo moč� Obstaja nevarnost izpuščanja pomembnih razlik med pari
skupin� A priori primerjave največkrat določamo na konceptualni
osnovi in jih ne uporabljamo v eksploratorne namene� Skupine za primerjavo določamo s pomočjo kontrasta C� C = W1G1 + W2G2 + ... + WkGk
� C = vrednost kontrasta� W = uteži� G = aritmetične sredine skupin
Korak 6: Validacija rezultatov
� Pogosto raziskujemo v neeksperimentalnih situacijah (survey in eksploratorne raziskave)� Zmožnost validacije v teh primerih temelji na lastnosti
eksperimentalnih pogojev, da jih lahko ponovimo� Poleg zahteve po primerljivosti skupin in podatkov, moramo
zadostiti pogoju naključnega vzorčenja v posamezno skupino� V survey in eksploratornih raziskavah so udeleženci pogojeni
s pripadnostjo eni od skupin zaradi svojih lastnosti in ne zaradi naključnega vzorčenja
� V neeksperimentalnih pogojih validiramo rezultate s ponovitvami raziskav
PRIMER
Korak 1: Raziskovalni problem
Naša analiza bo usmerjena v raziskovanje vpliva medikamentozne terapije (X14) in vpliva psihološke obravnave (X13), na dve odvisni spremenljivki, in sicer na rezultat Beckove samoocenjevalne lestvice depresivnosti (X9) in na rezultat čeklistesimptomov depresivnosti za svojce (X10). Pri obeh vprašalnikih pomeni višji rezultat blažjo stopnjo depresivnosti. Tip raziskovalnega problema je torej intrinzični multivariatni.
PRIMER
Korak 2: Raziskovalni načrt
� 3x2 faktorski dizajn� tri stopnje na X14 (placebo, zdravilo A ter
zdravilo B)� dve stopnji na X13 (kognitivna terapija in
klinična psihoterapija)
� Število udeležencev v skupini je 16-18� Zadovoljimo minimalni kriterij� Statistična moč je majhna
PRIMER
Korak 3: Predpostavke
� Homogenost varianc� Sprejmemo hipotezo o enakosti varianc-kovarianc
na podlagi rezultatov
PRIMER
Korak 4: Ocenjevanje pomembnosti razlik med skupinami
� Grafično preverjanje razlik med skupinami
25
30
35
40
45
50
55
60
65
1 2 3 4 5 6skupina
Beckova
lestvica
3.5
4
4.5
5
5.5
6
6.5
1 2 3 4 5 6skupina
ceklista
simptomov
PRIMER
Korak 4: Ocenjevanje pomembnosti razlik med skupinami
� Preverjanje efekta interakcije� Iz rezultatov analize lahko zaključimo, da interakcijski
efekt ni pomemben
PRIMER
Korak 4: Ocenjevanje pomembnosti razlik med skupinami
� Grafično preverjanje efekta interakcije
Beckova lestvica čeklista simptomov
30
40
50
60
placebo zdravilo A zdravilo B
kognitivna
klinična
3,5
4
4,5
5
5,5
6
placebo zdravilo A zdravilo B
kognitivnaklinična
PRIMER
Korak 4: Ocenjevanje pomembnosti razlik med skupinami
� Analiza glavnih efektov� Psihološka terapija
� Medikamentozna terapija
PRIMER
Korak 4: Ocenjevanje pomembnosti razlik med skupinami
� Efekt psihološke obravnave ni pomemben� Upoštevajmo majhen vzorec� Moč je majhna
� Efekt medikamentozne terapije je pomemben� Moč je velika
� Vpliv veličine je 8-10 krat večji pri medikamentozni terapiji, v primerjavi s psihološko terapijo� Možnost praktične evaluacije pomembnosti
posameznih glavnih efektov� Medikamentozna terapija ima dominantni efekt, efekt
psihološka terapije pa je le majhen
PRIMER
Korak 5: Interpretacija rezultatov
� Post hoc analize med skupinami ni priporočljivo izvajati zaradi majhnega vzorca v skupinah in velikega števila primerjav, kar rezultira v nizki statistični moči posameznega testa
� Razlike moramo preučiti v smislu praktične in ne statistične pomembnosti
� Če lahko formuliramo primerjave med skupinami, potem lahko planirane primerjave izvedemo direktno med analizo
PRIMER
Korak 5: Interpretacija rezultatov
� Izvedemo primerjave na odvisnih spremenljivkah� Univariatni testi
� Postopna analiza
To je vse o MANOVA-i
� A ni še konec �
Še pet minut za MacAnovo
MacAnova
� Razvoj MacAnove se je začel leta 1987, ko si je Gary W. Oehlert zastavil cilj, izdelati brezplačen statistični program za uporabo v šoli.
� Danes je MacAnova brezplačen, nekomercialen in interaktiven statistični program
MacAnova
� Kljub svojemu imenu MacAnova ni samo še en program za Macintosh računalnike in prav tako ni namenjen samo analizi variance
� MacAnova deluje v okoljih Windows, Macintosh, DOS in Motif (Linux + Unix)
� MacAnova ima veliko zmožnosti, toda njena moč se skriva v analizi variance in sorodnih modelih, analizi časovnih vrst ter v uni in multi-variatnih eksploratornih statistikah
MacAnova
� Brezplačno verzijo MacAnove si lahko snamete z naslednjega naslova:� http://www.stat.umn.edu/macanova/macanova.home.html
KONEC
Hvala za pozornost