PREDSTAVITEV VARIANCE MULTIVARIATNA ANALIZApsy.ff.uni-lj.si/Katedre/PM/Studij/MANOVA_PPT.pdf · analiza skupinskega povpre ... Interpretacija rezultatov Interpretacija efektov kovatriat

MULTIVARIATNA ANALIZA VARIANCE

PREDSTAVITEV

MIHA KOČEVAR

KRATEK UVOD� t test – ali prihajata aritmetični sredini dveh skupin iz iste

distribucije?

� Hottelingov T2 – ali prihajata vektorja aritmetičnih sredin iz iste vzorčne distribucije?

� ANOVA – ali prihajajo aritmetične sredine dveh ali več skupin iz iste distribucije?

� MANOVA – ali prihajajo vektorji aritmetičnih sredin dveh ali več skupin iste vzorčne distribucije?

Zakaj namesto (M)ANOVA-e ne uporabimo več primerjav med dvema skupinama?

� s povečevanjem števila t testov (T2), povečujemo tudi verjetnost naključno dobljenih pomembnih razlik,

� zakon t testa (T2) velja za naključne vzorce,� s povečevanjem števila skupin se izračunavanje vseh

možnih parov izredno zavleče,� z upoštevanjem samo dveh (vektorjev) aritmetičnih

sredin, izgubimo na natančnosti, ki je vsebovana v variabiliteti vseh skupin in ne samo tistih, ki ju izračunavamo.

Kaj je Hottelingov T2?

� Je statistični postopek, ki omogoča izračun razlik med dvema skupinama glede na eno variato, ki je sestavljena iz večih odvisnih variabel na način, da ti dve skupini razlikuje v največji možni meri.

� C = kompozit oz. vrednost variate za respondenta� Wi = utež za odvisno variablo i� Yi = vrednost odvisne variable i

1 1 2 2 n nC W Y W Y W Y= + + +…

MANOVA� Nadgradnja Hottelingovega T2

� Razumevanje teorije vzorčenja� Vzorčimo opazovanja in ne vrednosti� Objekt opazovanja ima več atributov� MANOVA – vzorčimo opazovanja in pri tem ignoriramo prav

vse atribute razen tistih (dveh ali več), za katere smo zainteresirani – odvisne spremenljivke

� Nadgradnja diskriminantne analize� Tri ali več odvisnih spremenljivk� Izračun največjega karakterističnega korena gcr� Prikaže tudi katera kategorija ima večji vpliv na pojav razlik

Situacije v katerih uporabimo MANOVA-o

� Kontrola eksperimentalne napake� Merjenje vpliva več neodvisnih

spremenljivk na kombinacijo več odvisnih spremenljivk� Eksperimentalni načrt

Korak 1: Raziskovalni problem

� Tip raziskovalnega problema� Multipla univariatna vprašanja

� Odvisne variable analiziramo ločeno, vendar pa zahtevamo splošno kontrolo nad obsegom eksperimentalne napake

� Strukturirana multivariatna vprašanja� Pri obravnavi uporabljamo dve ali več odvisnih spremenljivk, ki

so specifično povezane – ponovljene meritve� Intrinzična multivariatna vprašanja

� Zajema set odvisnih meritev, za katere nas v osnovi zanima, kako razlikujejo med skupinami kot celota

� Izbira odvisnih spremenljivk� Neustrezna izbira vodi v “zmotne” razlike� Oceniti moramo vse aspekte raziskovalnega vprašanja in

zagotoviti uporabo MANOVA-e v pravilni in ustrezni obliki

Korak 2: Raziskovalno načrtovanje

� Določimo velikost vzorca� Priporočeno je najmanj 20 opazovanj na celico. � Skrajni minimum – število opazovanj v celici naj

bo večje od števila odvisnih spremenljivk� Faktorski dizajn – dve ali več smeri

� Izbor neodvisnih spremenljivk glede na vrsto eksperimenta

� Post hoc uporaba blok faktorja, namenjena segmentaciji respondentov in zmanjševanju MSWizvora variance

� Uporaba kovariat – MANCOVA →

MANCOVA

� Cilji uporabe kovariat� Eliminacija neke sistematične napake izven kontrole, ki jo ima

raziskovalec� Z obzirom na razlike v odzivih, ki so posledica edinstvenih

karakteristik respondentov� Eliminacija vseh efektov, ki vplivajo zgolj na del respondentov

ali pa variirajo med respondenti� Izbor kovariat

� Efektivna kovariata visoko korelira z odvisnimi spremenljivkami in ni v korelaciji z neodvisnimi

� Pravilo palca – kovariat naj bo manj kot:

� Pogoji za uporabo MANCOVA-e:� Kovariata mora biti v nekem odnosu z odvisno spremenljivko� Kovariata mora imeti homogen regresijski efekt� Kovariata mora biti na metričnem nivoju

(0.10 ) ( 1)vzorca skupinN N× − −

Korak 3: Predpostavke

� Neodvisnost� Kršitve

� Efekt vrstnega reda (serialna korelacija)� Prisotnost skupne izkušnje� Vpliv zunanjih in nemerjenih efektov

� Rešitve� Kombiniranje rezultatov udeležencev znotraj skupin in

analiza skupinskega povprečja� Uvedba blok faktorja ali kovariantne analize� V obeh primerih moramo uporabiti strožje stopnje

pomembnosti (0.01 ali nižje)


� Enakost matrik varianc-kovarianc� Testiramo elemente kovariančnih matrik

vseh odvisnih variabel� Kršitev ima majhen efekt pri izenačenih

skupinah (Nmax/Nmin < 1,5)� Hipotezo o enakosti kovarianc testiramo z

Boxovim testom – občutljiv na odklone od normalnosti


� Normalnost� Domneva se multivariatna normalnost� Nimamo testa s katerim bi jo izmerili� Zadovoljimo se z univariatno normalnostjo

vseh odvisnih spremenljivk� Odstopanja od normalnosti imajo majhen

efekt pri velikih vzorcih


� Linearnost in multikolinearnost� Lahko ju ugotavljamo le pri odvisnih

spremenljivkah in kovariatah� Iščemo nelinearne odnose� Visoka kolinearnost med odvisnimi

spremenljivkami pomeni visoko redundantnost

� Občutljivost na zunanje vplive� MANOVA je še posebej občutljiva na zunanje

vplive in njihovo delovanje na α napako

Korak 4: Ocenjevanje MANOVA-e

� Kriteriji za ocenitev multivariatnih razlik� Uporabimo meritev, ki bo najbolj imuna na kršitve domnev in hkrati

poseduje največjo statistično moč� Royev gcr

� Meri razlike na prvem kanoničnem korenu� Prednosti v moči in natančnosti� Slabo se obnese, če moramo testirati vse dimenzije in je najbolj podvržen

kršitvam domnev� Wilksova lambda (ali U)

� Upošteva vse diskriminantne funkcije� Je najpogosteje naveden kriterij

� Hotellingov ostanek (trace)� Upošteva vse diskriminantne funkcije

� Pillaijev kriterij� Upošteva vse diskriminantne funkcije� Robusten in primeren za uporabo pri manjšem vzorcu, neenakih celicah ali

pri kršeni homogenosti (ko)varianc


� Statistična moč multivariatnih testov� Je verjetnost, da bo statistični test identificiral efekte postopka, ki v

resnici obstajajo� Stopnje moči statističnih kriterijev bazirajo na:

� α stopnji� Velikosti efekta statističnega postopka� Velikosti vzorca skupin

� Povečevanje moči� Večanje vzorca v skupinah� Pomembna vloga efekta veličine (effect size)

� Uporaba moči pri planiranju in analizi� Na podlagi predhodnih raziskav in z razumnim presojanjem ocenimo

efekt veličine in določimo ustrezno velik vzorec

→


� Statistična moč multivariatnih testov� Izračun stopnje moči

� V analizi uporabljamo računalniške programe� V pripravi uporabljamo tabele:

→


� Statistična moč multivariatnih testov� Vpliv multikolinearnosti odvisnih

spremenljivk na statistično moč� Delitev variabel po efektu veličine na močne in

šibke� Največjo moč dosežemo pri koreliranih parih

� Močna-močna ali šibka-šibka variabla� Korelacija mora biti visoka in negativna

� Kombinacija močne in šibke variable� Korelacija mora biti visoka, ne glede na smer

Korak 5: Interpretacija rezultatov

� Interpretacija efektov kovatriat� Ocenitev katere odvisne spremenljivke

poudarjajo razlike med skupinami� Identifikacija skupin, ki odstopajo na

posameznih odvisnih variablah ali na celotni kovariati

Evaluacija kovariat

� Vpliv ocenjujemo skozi obliko regresijskeenačbe

� Če imajo kovariate teoretično ozadje, potem nam rezultati predstavljajo objektivno bazo za potrditev ali zavrnitev predlaganih odnosov

� Eliminiramo kovariate z majhnim pomenom� Preverimo vpliv kovariat na statistične teste

Ocenjevanje odvisne variable

� Katera od odvisnih spremenljivk največ doprinese k splošnim razlikam

� Uporabimo proceduro post hoc ali a priori testov� Največkrat uporabimo univariatne teste� Narašča verjetnost α napake� Načelo Bonferronijeve neenakosti

� Uporabimo postopno analizo (stepdown analysis)� Preučujemo ali določena variabla vsebuje edinstveno

(nekorelirano) informacijo� Pomembno je zaporedje testiranj

Odkrivanje razlik med skupinami

� Post hoc metode� Preiskujemo med katerima dvema skupinama

prihaja do pomembnih razlik� Izvede se vse možne primerjave parov skupin� Veliko meritev in zaostrovanje kriterija α napake

pomeni nizko moč testov� Metode

� Scheffejeva metoda� HSD� LSD� Duncanov test� Newman-Kuelsov test

Odkrivanje razlik med skupinami

� A priori ali planirane primerjave� Vnaprej določimo katere skupine bomo preverjali� Število primerjav je manjše, kot pri post hoc testu, zato ima

metoda večjo moč� Obstaja nevarnost izpuščanja pomembnih razlik med pari

skupin� A priori primerjave največkrat določamo na konceptualni

osnovi in jih ne uporabljamo v eksploratorne namene� Skupine za primerjavo določamo s pomočjo kontrasta C� C = W1G1 + W2G2 + ... + WkGk

� C = vrednost kontrasta� W = uteži� G = aritmetične sredine skupin

Korak 6: Validacija rezultatov

� Pogosto raziskujemo v neeksperimentalnih situacijah (survey in eksploratorne raziskave)� Zmožnost validacije v teh primerih temelji na lastnosti

eksperimentalnih pogojev, da jih lahko ponovimo� Poleg zahteve po primerljivosti skupin in podatkov, moramo

zadostiti pogoju naključnega vzorčenja v posamezno skupino� V survey in eksploratornih raziskavah so udeleženci pogojeni

s pripadnostjo eni od skupin zaradi svojih lastnosti in ne zaradi naključnega vzorčenja

� V neeksperimentalnih pogojih validiramo rezultate s ponovitvami raziskav

PRIMER

Korak 1: Raziskovalni problem

Naša analiza bo usmerjena v raziskovanje vpliva medikamentozne terapije (X14) in vpliva psihološke obravnave (X13), na dve odvisni spremenljivki, in sicer na rezultat Beckove samoocenjevalne lestvice depresivnosti (X9) in na rezultat čeklistesimptomov depresivnosti za svojce (X10). Pri obeh vprašalnikih pomeni višji rezultat blažjo stopnjo depresivnosti. Tip raziskovalnega problema je torej intrinzični multivariatni.

PRIMER

Korak 2: Raziskovalni načrt

� 3x2 faktorski dizajn� tri stopnje na X14 (placebo, zdravilo A ter

zdravilo B)� dve stopnji na X13 (kognitivna terapija in

klinična psihoterapija)

� Število udeležencev v skupini je 16-18� Zadovoljimo minimalni kriterij� Statistična moč je majhna

PRIMER


� Homogenost varianc� Sprejmemo hipotezo o enakosti varianc-kovarianc

na podlagi rezultatov

PRIMER

Korak 4: Ocenjevanje pomembnosti razlik med skupinami

� Grafično preverjanje razlik med skupinami

25

30

35

40

45

50

55

60

65

1 2 3 4 5 6skupina

Beckova

lestvica

3.5

4

4.5

5

5.5

6

6.5

1 2 3 4 5 6skupina

ceklista

simptomov

PRIMER


� Preverjanje efekta interakcije� Iz rezultatov analize lahko zaključimo, da interakcijski

efekt ni pomemben

PRIMER


� Grafično preverjanje efekta interakcije

Beckova lestvica čeklista simptomov

30

40

50

60

placebo zdravilo A zdravilo B

kognitivna

klinična

3,5

4

4,5

5

5,5

6

placebo zdravilo A zdravilo B

kognitivnaklinična

PRIMER


� Analiza glavnih efektov� Psihološka terapija

� Medikamentozna terapija

PRIMER


� Efekt psihološke obravnave ni pomemben� Upoštevajmo majhen vzorec� Moč je majhna

� Efekt medikamentozne terapije je pomemben� Moč je velika

� Vpliv veličine je 8-10 krat večji pri medikamentozni terapiji, v primerjavi s psihološko terapijo� Možnost praktične evaluacije pomembnosti

posameznih glavnih efektov� Medikamentozna terapija ima dominantni efekt, efekt

psihološka terapije pa je le majhen

PRIMER


� Post hoc analize med skupinami ni priporočljivo izvajati zaradi majhnega vzorca v skupinah in velikega števila primerjav, kar rezultira v nizki statistični moči posameznega testa

� Razlike moramo preučiti v smislu praktične in ne statistične pomembnosti

� Če lahko formuliramo primerjave med skupinami, potem lahko planirane primerjave izvedemo direktno med analizo

PRIMER


� Izvedemo primerjave na odvisnih spremenljivkah� Univariatni testi

� Postopna analiza

To je vse o MANOVA-i

� A ni še konec �

Še pet minut za MacAnovo

MacAnova

� Razvoj MacAnove se je začel leta 1987, ko si je Gary W. Oehlert zastavil cilj, izdelati brezplačen statistični program za uporabo v šoli.

� Danes je MacAnova brezplačen, nekomercialen in interaktiven statistični program

MacAnova

� Kljub svojemu imenu MacAnova ni samo še en program za Macintosh računalnike in prav tako ni namenjen samo analizi variance

� MacAnova deluje v okoljih Windows, Macintosh, DOS in Motif (Linux + Unix)

� MacAnova ima veliko zmožnosti, toda njena moč se skriva v analizi variance in sorodnih modelih, analizi časovnih vrst ter v uni in multi-variatnih eksploratornih statistikah

MacAnova

� Brezplačno verzijo MacAnove si lahko snamete z naslednjega naslova:� http://www.stat.umn.edu/macanova/macanova.home.html

KONEC

Hvala za pozornost

Documents

PREDSTAVITEV VARIANCE MULTIVARIATNA ANALIZApsy.ff.uni-lj.si/Katedre/PM/Studij/MANOVA_PPT.pdf · analiza skupinskega povpre ... Interpretacija rezultatov Interpretacija efektov kovatriat