Neparametrijski testovi (1)

Embed Size (px)

Citation preview

  • 8/13/2019 Neparametrijski testovi (1)

    1/29

    Izbor z neparametrijskih testova

    1 1 PARAMETRIJSKA I NEPARAMETRIJSKA STATISTIKA

    K ao Sto znam o, znata n dio testova koje smo d o sad a spominjali , zahtijeva nor-malnu raspodjelu rezultata u populaciji. U praksi, medutim, Eesto nailazimo nasituacije kad nam niSta nije poznato o distribuciji populacije, ili Eak znamo dapopulacija nije norm alna. To je n pr. sluEaj kad je vjero jatnost pojavljivanja nekogdogad aja vr lo mala P 0, l o ) , pa dobivamo tzv. Poissonovu distr ibuciju, i li kadposto ji d onja ili gornja gran ica preko koje rezultati ne m ogu iCi. Na prim jer, u jed-nom vrlo lakom tes tu zn an ja veCina Ce ispitanika postiCi mak sima lan re zu lta t, pa Cei krivulja biti asi m etri tna , a jednako Ce tak o biti i kod jednog pretegkog tes ta , gdjeCe veCina postiCi min im alan b ro j bodova . U prvom slutaju gornju granicu pred-stavlja maksimalan broj bodova, a u drugom sluEaju donju granicu predstavljanula bodova.

    Nadalje, Eest je sl u ta j u neltim druStvenim znan ostim a (np r. sociologiji) d a seneke pojave distr ibuiraju upravo suprotno od normalne raspodjele. To je npr.sl u ta j s a stavo vim a koji Eesto da ju tzv. U-raspodjelu , t j . najveCe frekvencijenalaze se n a ekstremnim vrijednostima apscise.

    svim tim slutaje vim a ne mo iem o primijenit i neke m etode koje smo do sadaspominjali.Jed nak o tako ne m oie m o veCi bro j do sad a poznatih statistiEkih raEuna primi-jeniti ako rezultati nisu izrazeni mjernim jedinicama nego kvalitetama ( zdrav ,boles tan , mlad , s tar , i td .) . One metode koje se s lu ie mjerljivim podacima,

    koji se distr ibuiraju normalno nazivaju se parametrijskim metodama. Napro-tiv, one metode kod kojih nije vaino je li populacija normalno distribuirana, akatkada Eak rezultati uopCe nisu izraieni u mjernim jedinicama, nego u frekven-cijama nekih kvaliteta, naziva se neparametrzjskim metodama (katkad ih nazi-vaju i s tat ist ik a slobodna od distr ibucije ) . Medu takvim m etod am a mi smo veCspom injali izratun avan je centila, koeficijenta rang-korelacije, hi-kvadrat te st a i dr.Neparametrijske se metode upo trebljavaju prema tome prvenstveno kod podata ka

  • 8/13/2019 Neparametrijski testovi (1)

    2/29

    322 21 I ZBOR IZ NEP R METRIJSKIHTESTOVA

    izraienih nominalnim i ordinalnim skalama, a parametrijske metode kod rezultataizraienih intervalnim i omjernim skalama (o skalama vidi poglavlje 19).

    Razumljivo je da je neparametrijske metode dopuSteno i moguCe primijenitii pri obradi podataka koji su izraieni intervalnim i omjernim skalama (npr. mimoiemo izraeunati ranpkorelaciju izmedu teiine i visine), ali bi takav postupakbio neracionalan, jer na ta j naCin namjerno gubimo niz informacija (npr. kod rang-korelacije, gdje registriramo samo rang, a ne i razlike izmedu pojedinaca), i pre-cizniji postupak zamjenjujemo aproksimativnim postupkom: ako rangovi u objevarijable korespondiraju, onda Ce rang-korelacija iznositi 1, ali da smo raeunalikoeficijent korelacije r , on bi bio manji od 1.

    Zbog toga sta tis titar i kaiu da je snaga ( power ) neparametrijskih testovamanja od snage parametrijskih testova. Snagu tes ta moiemo definirati kaovjerojatnost odbacivanja nul-hipoteze, ako je t a hipoteza zaista pogresna. Drugimrijeeima, snaga tes ta sastoji se u njegovoj sposobnosti da otkrije neku razliku, akotu razlika zaista postoji. Dakle, ako izmedu dvije populacije postoji razlika, to CemoobiCno preciznije i uspjeSnije ustanoviti pomoCu parametrijskih nego neparametrij-skih testova.

    To, doduSe, ne mora uvijek biti tako, jer se moie dogoditi da iz nekih formal-nih razloga parametrijski test zakaie , tj . njime ne uspijemo dokazati neSto Stoje inaEe potpuno evidentno i logiCno. Na primjer, ako imamo dva niza podatakaod istih ispitanika i svi su podaci drugoga mjerenja po brojeanoj vrijednosti veCiod korespondentnih podataka prvog mjerenja, primjena metode diferencije (vidipoglavlje 9.8) veCinom Ce potvrditi da je razlika statistieki znaCajna. Ali ako sujedan ili dva rezultata u drugoj seriji mjerenja vrlo aberantni (tj. vrlo razliCiti odkorespondentnih rezulta ta prve serije mjerenja), moie se dogoditi da metodomdiferencije ako je sada prosjeena razlika izmedu prve i druge seerije mjerenjajoS i veCa nego u prvom s luE( ~~u neCemo uspjeti odbacit i nul-hipotezu (jer sepoveCao varijabilitet rezultata, pa je time i standardna pogreSka razlike postalaveCa). Naprotiv, primjenom neparametrijskih testova razlika Ce biti potvrdena us-prkos pojedinatnim aberantnim rezultatima Sto je zapravo i logitnije, jer su t irezultati aberantni u istom smjeru u kojem odstupaju drugi rezultati.

    Da bi se izbjegli odredeni nesporazumi u vezi s pojavom da se kod mnogihneparametrijskih testova Cesto susreCemo s nama poznatim z-vrijednostima (dakles pojmom poznatim iz normalne raspodjele), treba reCi da je neparametrijska statis-tika slobodna od bilo kakve pretpostavke o distribuciji populacije, ali nije, nara-vno, slobodna od pretpostavke o obliku otekivane varijacije i distribucije uzoraka.Kao Sto znamo, ako uzorci nisu odveC mali, od bilo kako distribuirane populacijeuzorci aritmetiekih sredina distribuirat Ce se uglavnom po normalnoj raspodjelii otuda z vrijednosti i u neparamctrijskoj statistici.

    Osim vet do sada spomenutih, izloiit Cemo jog neke najpoznatije neparametrij-ske testove. Kako razlieiti autori nekima od njih daju razlieite nazive, uz neketestove oznaCit Cemo ta razlit ita imena.

  • 8/13/2019 Neparametrijski testovi (1)

    3/29

    21 2 DVA N E Z V I SN UZORKA 323

    21 2 DVA NEZAVISNA UZORK21.2.1. Test homogenog n iza R u n tes t , Wald- Wol fowi tzov tes t )Uzmimo da jedan istraiivaE ieli ispitati da li djeca koja su frustrirana pokazujua.gresivno ponasanje; on u tu svrhu izvede ovaj eksperiment. Skupinu od 20

    djece sluEajnim izborom podijeli u dvije skupine po 10 od kojih eksperimentalnuskupinu (E) podvrgne postupcima koji dovode do frustracije (oduzimanje igrataka,ometanje u igri i dr .) , dok je u kontrolnoj skupini (K) dopuSteno da se igra u posvenormalnim prilikama. Tada su djeca stavljena zajedno u jednu prostoriju, a jedanuvjeibani opaiaC rangira ih prerna stupnju agresivnosti koji ona u igri pokazuju(npr. od najslabije prema najvedoj agresivnosti).

    Uzmimo nekoliko primjera, tj. nekoliko razliEitih mogukih situacija uz pomoCkojih Cemo protumaEiti smisao testa homogenog niza.1. Ako su sva djeca eksperimentalne grupe agresivnija od djece kontrolneskupine, opaiaE bi ih rangirao ovako (rang najmanje agresivno dijete; K

    kontrolna skupina, E eksperimentalna skupina):Rang 2 3 4 5 6 7 8 9 10 12 13 14 15 16 17 18 19 2D i j e t e K K K K K K K K K K E E E E E E E E E E .

    2. Kad bi frustracija dovela do toga da neka djeca postanu pojatano agresivna,a neka povutena i plasljiva, onda bi rang mogao izgledati ovako:Rang 2 4 5 6 7 8 9 10 12 13 14 15 16 17 18 19 20D i j e t e E E E E E K K K K K K K K K K E E E E E .

    3. Ako frustra.cija nije dovela ni do kakve promjene u agresivnosti, ne bismomogli otekivati pojavljivanje nikakvih pravilnosti, pa bi rang prema tome bioslutajan, na primjer ovakav:Rang 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20D i j e t e K E E K K K E E K E K E E E K K E K K E .

    Ako svaku skupinu jednakih znakova nazovemo homogenim nizom, pa te nizovezbrojimo u naSa tri primjera, dobivamo u prvom sluEaju dva niza, u drugom sluEajut r i niza, a u trekem slutaju dvanaest nizova (i jedan znak raCuna se u niz ). Ako unekoj listi postoji N t lanow, m od jedne a od druge vrste, ne moie biti manje od2 niza, niti vise od N nizova. Da bismo dobili 2 niza,, moraju svi Elanovi iste vrstebiti zajedno (naS prvi primjer), a da bi dobili N nizova, morali bi se Elanovi obaniza pravilno izmjenjivati: K, E , K, E , K, E itd. (to naravno samo onda ako su obaniza jednako velika ili se razlikuju samo za 1). N i za jednu od te dvije kombinacijenzje mnogo vjerojatno da i se dogodila sluEajno. Prema tome, ako ustanovimo daje broj nizova vrlo mali ili vrlo uelik, pretpostavit Cemo da je to uzrokovano neEimdrugim, a ne pukim slutajem. U praksi kad ielimo test irati pripadaju li obauzorka istoj populaciji obicno nas zanima samo to je li broj nizova m a n j i odonoga koji bismo joS mogli otekivati sluEajno. Da bismo ustanovili koliko nizovamoiemo smatrat i sta ti st ick znaEajno premalim brojem, sluiimo se tablicom M u

  • 8/13/2019 Neparametrijski testovi (1)

    4/29

    324 21 IZ OR IZ N E P A R A M E T R I J S K I H TESTOV

    Dodatku . U to j tablici m je b ro j Elanova jedne, a n je b ro j Elanova druge grup e; usamoj tablici nalaze se graniEne vrijednosti broja nizova. Svaki broj nizova koji jem a n j i o d b ro ja koji oEitamo u tablici, ili jednak kao ta j broj , mogao bi se s luta jnodogoditi samo u 5% ili manje slutajeva, ako zapravo ne bi postojala razlika meduuzorcima. Dakle, svaki broj nizova jednak ili manji od broja u tablici znatajan jena razini od 5%. U naSem sluCaju mi tablicu M Eitamo pod m 10 i n 10, idobivamo broj 6. Prem a tome, u prvom primjeru (2 niza) i u drugom primjeru 3niza) mo iem o odbacit i nul-hipotezu i zakljuti t i da obje skupine ne prip adaju u istupopulaciju, pa d a se zato po agresivnosti frustrirana djeca razlikuju od nefrustriranedjece. Nap rotiv, u treCem primjeru 12 nizova) ne m oie m o odbac iti nul- hipotezu.Test homogenog niza mo iem o naravno upotri jebit i i kad su rezultati izraieni uintervalnoj skali. Na primjer, ako smo u grupi A (m 4) i grupi B ( n 5) dobiliove rezultate: Grupa A: 12 16 8 10Grupa B: 6 3 4,

    mo iem o ih po rangu p oredati ovako:4 6 6 8 10 12 16B B B B A A B A A .

    U ovom sluCaju imamo 4 niza, a iz tablice M uz m 4 i n 5 Eitamo broj2. Prem a tome , prihvac amo nul-hipotezu, tj. zakljuEujemo d a se t a dva uzorka nerazlikuju statistiEki znaEajno.

    Ako su m ili n veCi od 20, test homogenog niza raEuna se ovako: Najprije trebaizr atu na ti teoretsku, t j . pravu ari tmetieku sredinu nizova prema formuli:

    i nakon tog a sta nd ard nu devijaciju niza prem a formuli:

    Ako smo, na primjer, imali uzorak od u kupno 100 podataka, i to 40 podata ka jednei 60 p oda,ta ka drug e vrste, t e sm o naSli 39 nizova, dobivamo ove vrijednosti:

    Tada izraEunamo vrijednost zDobiveni br oj nizova n i z a

    S n i z a

  • 8/13/2019 Neparametrijski testovi (1)

    5/29

    21 2 DVA NEZ VISN UZORKA 325

    39 49U naSem slu taju t o iznosi: z -2,lO.4,77Ako je iznos dobivenog z (bez obzira na predznak) veCi od 1,654, moiemo odba-

    citi nul-hipotezu i smatrati da oba uzorka ne pripadaju istoj populaciji. (Razlikaje znaCajna na razini od 5 .)

    Ako se dogodi da su dva (ili vise rezultata iz suprotn ih grupa jednaki i d a prematome zauzimaju isti rang, nasta ju kod ovog testa odredene teSkoCe: ako su to dvarezultata, moiemo ih poredati AB i BA, a ako tri rezultata zauzimaju isti rang,moiemo ih poredati: ABA, AAB i BAA. Raspored tih rezultata zacijelo Ce utjecatina broj nizova. U takvim slutajevima preporutuje se izratunati z za svaku od t ihkombinacija: ako je z u svim sluta jevima znatajan, onda takvi zajednitki rangovi nepredstavljaju problem. Ali ako neke kombinacije daju znatajni , a neke neznatajn i z,preporutuje se odrediti vjerojatnost za svaki z, i izraCunati p r o s j e t n u vjerojatnost,pa tek na temelju tako dobivene vrijednosti odluEiti hoCemo li prihvatiti ili odbacitinul-hipotezu.

    Test homogenog niza ko uzorak nije vrlo mali moguCuje odbacivanje nul-hipoteze ako se oba uzorka medusobno razlikuju u bilo ko je m pogledu: u centralnojtendenciji, u varijabilnosti, u simetritnosti i dr. Ako nas upravo zanima razlikujuli se uzorci samo po svom medi janu bolje je upotrijebiti medijan test.

    Kao Sto smo vet rekli, i suuiie vel ik broj nizova moie biti "sumnjiv". Naime,pokuSajte uzeti 10 crvenih i 10 crnih liarata, i dobro ih izmijeSajte, te ustanovitekoliko ste nizova dobili. Ako pokus ponovite nekoliko desetaka puta, lako Cete usta-noviti da ste najCeSCe dobivali otprilike 9-13 nizova, a manje ili vise od toga veCrjede. Prakti tk i gotovo uopCe ni,je se moglo oEekivati da Cete dobiti 19 ili Cak 20nizova, jer (kod 20 nizova) to bi znatilo da bi dvadeset karata moralo ovako bitiporedano: crna, crvena, crna, crvena, crna, crvena, crna, crvena, itd. , joS dvanaestputa A to je jerujem da Cete se sloiiti otovo nemogute.

    Svojedobno sam uCinio takav pokus i u 1000 mijeSanja 10 crnih i 10 crvenihkarata dobio sam prilitno simetritnu distribuciju nizova, slitnu normalnoj distribu-ciji, pri Eemu je najmanji broj dobivenih nizova iznosio 4 (dobiven je jedanput u

    OOO), a najveCi bro j nizova 17 (dobiven dvaput). Deset nizova dobiveno je 166puta, nizova 178 pu ta i 12 nizova 17 puta. Ti su rezultati prikazani na slici21.1.

    GledajuCi distribuciju na slici, jasno je ujedno kako su nastale tablice zaoCitavanje preveliltog ili premalog broja nizova, tj. onog broja Cija je vjerojatnostslu tajnoy pojavljivanja manja od 5 ili 1%. (NaSa tablica M u Dodatku je samoza lijevu stranu distribucije, tj. za dokazivanje da oba uzorka n e pripadaju istojpopulaciji.)

    Kao Sto smo kod hi-kvadrat tes ta rekli d a odveC mali hi-kvadrat moEe bitisumnjiv, jer je njegovo s l u t a j n o pojavljivanje malo vjerojatno, tako i kod testaniza prevelik broj nizova nije baS vrlo vjerojatan, pa ako netko eleCi dokazatida se uzorci ne razlikuju, tj . da pripadaju istoj populaciji avede prevelik brojnizova, moiemo posumnjati u istinitost podataka.

  • 8/13/2019 Neparametrijski testovi (1)

    6/29

    3 6 I Z B O R I Z N E P R M E T R I J S K I H TESTOV

    BROJ NIZOVASlika 21 1 Rezultat pokusa pri kojem je 1000 puta bilo pomijeSano 10 crnih i

    10 crvenih karata te je promatran broj nizova nakon svakog mijeSanja

    21 2 2 Medzjan testTo je vrlo jednostavan test koji se zapravo svodi na hi-kvadrat test a kojimispitujemo pripadaju li dva lizorka populaciji s istim medijanom. U parametrijskoj

  • 8/13/2019 Neparametrijski testovi (1)

    7/29

    21 2 DV NEZAVISNA UZORKA 327

    statistici njemu djelomitno odgovara t-test, kojim ispitujemo znatajnost razlikaizmedu dvije aritme tieke sredine.Uzmimo d a smo n a dva uzorka (koji mogu po veliEini biti jednaki ili razlititi)dobili u nekom mjerenju ove rezultate , koje sm o zbog preglednosti poredali premaveliEini:Uzorak I 8 9 9 10 10 10 12 13 15 17 17 18 19 19 21 23 24 25 26 28

    28 29 31 31;Uzorak I 3 7 7 10 12 16 19 22 24 27 30 32

    Princip medijan testa sastoji se u tome da nademo centralnu vrijednost ( t j .medijan) iz svih rezultata zajedn o i d a ih unesemo u 2 2 tablicu . BuduCi d a unagern primjeru imamo ukupno 41 rezultat, medijan je dvadeset prvi rezultat povelitini (o izratunava nju me dijana vidi poglavlje 4.3.1), a t o je 17. Ako sve rezultatekoji su iznad med ijana, ozn atim o oznakom plus , a rezulta te n a medijanu ili ispodnjega oznakom min us , dobivamo:

    Unesemo li frekvencije tih rezulta ta u tablicu , dobivamo:

    Iz ove tablice sad a izrat un am o hi-kvadrat test , vodeCi raCuna o svim pravilimakoja vrijede za hi-livadrat, pa stoga u ovom sl ut aj u moramo (jer se radi o 2 2tablici) upotri,jebiti Yatesovu korek turu. Izratu narii hi-kvadrat iznosi 0,258, p a z atoprihvaCamo hipotezu d a se mcdijani oba ju uzoraka statis t i tki zn ata jno ne razlikuju.Ako je uku pan broj rez ultata para n, medijan je ari tm etitka sredina izmedu dvarezultata koji se nalaze u sredini niza svih rezultata poredanih po veliCini. U tomslu ta ju Ce na m sv i rezultati b iti ili iznad ili ispod m edijana, a niti jedan n a samommedijanu.21.2.3. Test sum ranyova Wzlcoxonov T-test, Mann- Whitneyev U- test )

    T a j je tes t donekle sl itan testu homogenih nizova, ali on koristi vise informacija(tj. lioristi rangove, a ne samo podjelu u dvije kategorije) i zato se moie sma-tr at i bolj im i snain ij im . Kao i medijan testom, testom sume rangova testiramopripa daju l i dva uzorka u populaciju s istim m edijanom.

  • 8/13/2019 Neparametrijski testovi (1)

    8/29

    328 21 IZBOR IZ NEPARAMETRIJSKIH TESTOVA

    Uzmimo da imamo dvije skupine ispitanika od kojih smo prvoj skupini Nl 9davali neki vitaminski preparat, a drugoj skupini N 2 8 nismo. U ostalim fak-torima obje su skupine naravno sliFne. Zanima nas pokazuje li vitaminska grupabolje opCe zdravstveno stanje

    Ispitanici obiju skupina oznaEeni su slovima:

    Eksperimentalna Kontrolnaskupina skupina

    JB KC LD ME NFG PH RI

    Postupak se sastoji u tome d a uzmemo sve ispitanike zajedno i da ih rangiramoprema opCem zdravstvenom stanju, s tim da rang 1 dam0 najzdravijem ispitaniku.Uzmimo da smo dobili ovaj rezultat:Rangovi RangoviRang Ispitanik eksp. grupe kontr. grupe

  • 8/13/2019 Neparametrijski testovi (1)

    9/29

    21.2. DV N E Z V I S N UZORK 329

    Za obje skupine posebno zbrojimo rangove. Zbog kontrole dobro je provjeritisumu rangova formulom:

    Nakon toga izraEunamo izraz:

    vgdje Ti na t i bilo koju od suma rangova, a i naEi broj ispitanika u skupini izkoje sm o uzeli z PodsjeCamo Eitaoca d a znak I znaEi d a se uzima u obzir apso-lut na vrijednost izraza, pa, prem a tom e, brojnik te formule govori d a izraz tr eb asmanjiti za 2; ako je izraz u zagrad i pozitivan, oduz et Cemo 2, a ako je neg ativan,matematiFki Cemo pribrojiti 2.)Izratunarno l i z za eksperimentalnu skupinu, dobivamo:

    Dobit Cemo isti rezultat ako z izraEunamo za kontrolnu gru pu:

    Ako je b roj ispitanika u svakoj skupini barem 8, tad a izratu nan i z daje normalnudistribuciju s aritmetiEkom sredinom 0 i s tan dard nom devijacijom 1 j . i z ra tunanavrijednost nije niSta drug o nego nam a vet dobro pozna ta z-vrijednost (p a, prematom e, i t-vrijed nost). BuduCi d a jedino rezulta te koji su veCi od 1,96 m oie m o sma-tra ti statistiEki zna tajnim (na razini znacajnosti od 5 %) , zakljutujemo d a je nagz premalen, p a p rema tom e prihvakamo nul-hipotezu: nismo dokazali d a se t a dvauzorka stat istit ki znaEajno razlikuju. (To je dvosmjerni tes t. Za jednosmjernitest granitna vrijednost z bila bi ako znam o ,64.)

    Znatno je jednostavnije testirati znaCajnost razlike medu uzorcima uz pomoCtablice N u Dodatku. Ako su uzorci manji od 8, tablicu moramo upotrijebiti.Mectutim, upotreba tablice zahtijeva jedan dodatni ratun koji Cemo ukratko ras-tumaEiti. K ad znaCajnost oCitavamo s tablice, tre ba uz eti u obzir sam o manji uzo-rak , t j . njegovu sumu rangova. No, medu tim, njegova bi su m a rangova bila dr uk ti ja(veCa i l i manja) da smo rezultate rangirali obratnim redom. Zato tu drugu sumurangova treb a prethodno izratun ati , i to prema formuli:U naSem primjeru dobivamo:

    Za tablicu se uzima manja od t e dvije sum e rangova TI. BuduCi da nag prvi TIiznosi 78,5, dru gi T iznosi 65,5, u daljnji postup ak uzimam o br oj 65,5. U tablici,

  • 8/13/2019 Neparametrijski testovi (1)

    10/29

    33 21 ~ Z O RZ N E P A R A M E T R I JS K I H TESTOVA

    na sjeciStu broja N manjeg uzorka), s brojem N veCeg uzorka), Eitamo 51, StoznaCi da manja suma rangova manjeg uzorka smije biti najviSe 51. Kako je naSasuma veCa (65,5> 51), zakljutujemo da ne moiemo odbaciti nul-hipotezu aklezakljuCak je isti kao i ratunanjem z-vrijednosti.Kao Sto smo iz naSeg primjera vidjeli, jednakim rezultatima daje se zajedniekirang (o izratunavanju zajedniekog ranga vidi str. 200). Ako imamo mnogo za-jednitkih rangova, u raEun testa sume rangova treba unijeti odredenu korekturu,tako da formula za z glasi:

    gdje OF T ) oEekivana suma rangova i a N l +N2n (nT = 12 ) gdje je n broj rez~iltata oji Cine zajednieki rang.OEekivana suma rangova raEuna se prema formuli:

    Mi u nagem primjeru imamo dva puta po dva rezultata koji su vezani zajedniEkimrangom (rezultati M F i ON), pa nag CT iznosi:

    IzraCunamo li naS primjer s tom korekturom, dobivamo:

    Kako se vidi, zbog malog broja zajednitkih ranogva, u ovom se slutaju z nijepromijenio.

    21.2.4. Siegel-Tukeyev testSiegel-Tukeyev test pogodan je jedino za testiranje znatajnosti razlika u varija-

    bzlitetu (to svojstvo ima i test homogerlog niza). Po upotrijebljenim formulama onje jednak upravo opisanom testu sume rangova, ali se razlikuje po nutinu rangi-mnjn rezultata. Dok smo u testu sume rangova rangirali rezultate na standardan,uobiCajen naCin, ovd,je je rangiranje malo neobitno, Sto Ce se vidjeti iz primjera.

    Uzmimo da imamo dva uzorka s ovim rezultatima:

  • 8/13/2019 Neparametrijski testovi (1)

    11/29

    21 2 DVA NEZAVISNA UZO RKA

    Uzorak I: 25 5 14 19 0 17 15 8 8UzoralcII: 12 16 6 13 13 3 10 10 11

    Rezultate Cemo rangirati tako da Cemo rang 1dati najniiem rezultatu, rangove2 i 3 n jvidim rezultatima, rangove 4 i 5 iduCim najniiim rezultatima, 6 i 7 iduCimnajvigim, itd. Pritom Cemo, kao i u testu sume rangova, biljeiiti pripadnost uzorku.U nagem slucaju, dakle, imamo:

    Rezultat: 3 5 6 8 8 10 10 11 12 13 13 14Uzorak: I I1 I I1 I I I1 I1 I1 I1 I1 I1 IRang: 1 5 8 9 12 13 16 17 18 15 14 11Rezultat: 15 16 17 19 25Uzorak: 1 1 1 1 1 1Rang: 10 7 6 3 2.

    Ako je totalni broj rangova neparan ne uzima se srednji rezultat u daljnjemraFunu.

    Ako se obje populacije ne razliltuju u varijabilitetu nul- hipoteza), sume ran-gova jednog i drugog uzorka bit Ce slicne. Naprotiv, ako se populacije u varija-bilitetu razlikuju, uzorak iz populacije s veCim varijabilitetom tendirat Ce ekstre-mima selcvence rangova, i stoga Ce biti oznaEen niiim rangovima. Naprotiv, uzorakiz populacije s manjim varijabilitetom, tendirat Ce prema sredini sekvence rangova,i zato Ce biti oznaEen viSim rangovima. Dakle, uzorak s veCom varijacijom imat Cemanju sumu rangova. To se lako moie dokazati na jednom ekstremnom primjeru:

    Rezultati uzorka I: 1 2 3 15 20 25Rezultati uzorla 11: 4 5 6 7 10 12

    Rezultati: ~1 2 3 4 5 6 7 10 12 15 20 25Uzorak: I I I I1 I1 I1 I1 I1 I1 I I IRang: 1 4 5 8 9 1 2 1 1 1 0 7 6 3 2Suma rangova uzorka I = 21Suma rarigova uzorka I1 = 57

    Kako se vidi, uzorak I, s veCom varijacijom, ima znatajno niiu sumu rangova.U nagem primjeru suma rangova uzorka I TI iznosi 59, a suma rangova uzorka

    I1 T2)znosi 112.

    Dalje raEunamo jednako kao u testu sume rangova, tj. primijenimo formulu21.4): 12Tj N i N + 1) l 2

  • 8/13/2019 Neparametrijski testovi (1)

    12/29

    332 k 21. IZBOR Z N E P A R A M E T R I J S K I H TESTOV

    Ako u formulu umjesto T i uvrstimo vrijednosti prvog uzorla, dobivamo:

    (D a smo u formulu uzeli Tz dobili bismo isti rez ultat.)Dakle, uzorci se statistieki z n a t a j n o razlikuju po varijabilitetu P< 0 ,05 ) .Ako u rezultatima ima zajedniEkzh rangoua valja u pam tit,i ovo:a ) Ako se zajednieki ( vezani ) rangovi nalaze samo unuta r istog uzorka, t o neCeutjecati na sum u rangova T, pa je zato svejedno kojem od ist ih r ezulta ta dam 0viSi, kojem niii rang.b) Ako posto je vezani rangovi izmedu oba uzorka, potrebno je u postupkuizraeunavanja rangova, kao i u formuli za izraeunavanje z, provesti nekeprom jene, k oje Cemo uk ratk o opisa ti posluiivSi se prim jerom iz jednog eksper-imenta.U jednom laboratorijskom pokusu ispitanici, ispitani u dvije razlitite eksperi-me ntalne situacije, dali su ove rezulta te (rezultati su poredani prem a veliEini):

    Rezultat: 1,5 3,2 3,4 3,6 4,4 4,4 5,2 5,2 5,4 5,4 5,6 5,6 5,8Uzorak: 2 2 1 2 1 2 1 2 1 1 2Rang: 1 4 5 8 ? 3 3 1 5 2 1 2 4 25

    10,5 10,5 14,5 14,5 18,5 18,5 22,5 22,5R ez ul ta t: 6,2 6,2 6,2 6, 4 6,6 7,O 7 ,2 7,6 7 ,6 8,O 8,O 8,O 8 ,8

    zorak: 2 2 2 2 2 2 1Ran g: 28 29 32 3 3 36 36 35 34 31 O 27 29 23

    9,7 29,7 29,7 32,5 32,5 27,7 27,7 27,7

    Rez ultat: 9,O 9,2 9,6 9,8 9,8 10,2 10,2 10,2 11,O 11,2 14,6Uzorak: 2 2 2 2 2 2 2Rang: 22 19 18 J l? 11 10 6 3 2

    14,s 14,5 9 ,3 9 ,3 9,3P ri rangiranju u poFetku Cemo postupit i prema stand ardn om postupku akoje t o utinjen o i u ovom primjeru j. redom Cemo nap isati rezultate i rangira tiih n a opisan n at in , ne vodeCi, zasad, ra tu na kod vezanih rangova koji smo uzorak

    stavili prije a koji kasnije. U prim jeru su vezani rezultati p odcrta ni.BuduCi d a ulcupno imam o nepara n b roj rez ultata (37), srednji rezultat neCemodal.je uzimati u obzir (srednji rezultat je 7,O).Sada Cemo vezanim rezultatima dati i vezane rangove. Ti su rangovi ispisani

    ispod vezanih re zultata .

  • 8/13/2019 Neparametrijski testovi (1)

    13/29

    21 3 DVA ZAVlSNA UZORKA

    Su m a rangova Tl 332,6T 333,5.Sa da tr eb a izraCunati izraze S1 i 5 pri Cemu:

    S su m a onih kvadriranih rangova koji su tvorili vezane rangove,S2 suma kvadriranih vezanih rangova.U nagem p rim jeru, dakle, dobivamo:S1 g2 122 13 1 6 ~ 17 202 212 242 28 29 322 342+

    +312 302 27 262 15 1 4 ~ 2 l o 2 72 10 118;

    Formula za izraeunavanje z takod er se mijenja, tj . m ijenja se njezin nazivnik ion a s ada glasi : 12z N i N 111 - 2z

    Uv rstim o li naSe vrijednosti u t u formulu, dobivarno:

    Ka ko se vidi, razliku u v arijabilitetu ne moSemo sm at ra ti statistiEki znaEajnom.21 3 DVA ZAVISNA UZORKA

    Kao i kod parametrijskih testova, i kod neparametrijskih testova metode sunest0 drukCije ako radim o s a zauisnim uzorcima, dakle ili dva p u ta s i s tom skupinomispitanika ili s dvije skupine ispitanika, u kojim a svaki ispitanik jedne skupine im asvoj par u drug oj skupini .21.3.1. Tes t predznaka (Sign tes t )Uzmim o d a je izveden eksp eriment s 15 pari jednojajCanih blizanaca. Eksperi-men t se sasto jao u tom e d a je jedan Elan svakog par a blizanaca bio h ranjen prvih 8mjeseci od m ajke, dok je drugi Clan pa ra ve t od d rugog tjed na h ranjen n a boCicu.

    Kad je svaki par blizanaca imao 5 godina, izvrSen je zdravstveni pregled razvoja.Nul-hipoteza koju tr eb a testira ti je ova: nema razlike u tjelesnom razvoju izmedublizanaca othran jenih o d ma jki i onih othran jenih n a boEicu osim, dakako, razlikakoje m oiem o pripisati s luEaju).

  • 8/13/2019 Neparametrijski testovi (1)

    14/29

    334 21 I Z B O R 1 2 N E P A R A M E T R I J S K I H T E S T O V A

    Postupak testa predznaka sastoji se u tome da Cemo svakom p a n kod kojegje bolje razvijen od majke othranjeni blizanac dati predznak (oznaku) "plus", asvakom paru gdje je bolje razvijen na boEicu othranjeni blizanac predznak "minus".Parove u kojima nismo naSli nikakvu razliku oznaEit Cemo s "nulom" neCemoih kasnije uzeti 11 ra t un Time Ce se N, tj. broj parova, smanjiti. Dakle, u testupredznaka N broj p ar ow koji se razlikuju. (Ako imamo mnogo parova bez razlike,test predznaka se ne moie upotrijebiti )

    Uzmimo da smo kod naSih 15 pari blizanaca dobili ovaj rezultat:Parovi B C D E F G H I J K L M N ' oPredznak - -

    Kako se vidi, u od 15 pari bio je bolje razvijen blizanac koji je othranjenod majke, a u 4 para bio je bolje razvijen blizanac othranjen na boEicu. Dakle, uraEunu imamo 4 minusa i 11 plusova. Daljnji postupak radimo s manjzm od t a dvabroja, dakle s brojem 4. U tablici O u Dodatku uz N 15 (15 parova) nalazimobrojeve 2, 3, 3 i 4. Ti brojevi znaEe granitne vrijednosti, tj . najveCi dopuSten brojrazlila koji joS moiemo dopustiti uz razinu znacajnosti od 1%, 5%, 10% i 25%. Nagbroj razlika je 4, Sto pokazuje da bi se takva razlika mogla i slutajno dogoditi u25% sluEajeva. Tablica je medutim "dvosmjerna", tj. ratuna razlike u bilo kojemsmjeru, a mi srrio u ovom sluEaju vet od poCetka zainteresirani hoCe li blizanci koje jeothrani la majka biti kasnije bolje razvijeni, pa prema tome moiemo razliku testirati"jednosmjernim" testom. U tom slliEaju treba vjerojatnost u tablici "raspoloviti",tj . podijeliti s 2. Dakle, u naSem primjeru dobivamo da bi se ta razlika (u tomsmjeru) mogla sluEajno dogoditi u 12,5% sluEajeva Sto je naravno joS uvijeknedovoljno, jer ne ielimo iCi na razine znatajnosti, koje su veCe od P 0,05, dakleu tablici titati pod 10%).

    Evo jog jednog primjera za test predznaka:Na treningu koSarke imali smo 10 ispitanika, kojima smo izmjerili koliko su

    puta od 50 bacanja lopte pogodili "koS". Nakon toga sve smo ispitanike podvrgnulinapornoj igri koja ih je umorila i ponovno im izmjerili broj pogodaka u 50 bacanja.Zanima nas je li umor smanjio (jednosmjerni test ) preciznost pogodaka.

    Pretpostavimo da smo dobili ove rezultate:Ispitanici A . B C D E F G H I JBroj pogodaka kodprvog mjerenja 15 19 31 36 10 11 19 15 10 16Broj pogodala koddrugog mjerenja 17 20 16 8 10 6 7 8 12 8Predznak - 0Oznatimo li poveCanje broja pogodaka s , smanjenje broja pogodaka s -

    a nepromijenjeni rezultat s 0, dobivamo 3 plusa, 6 minusa i jednu nulu. Nula seizbacu,je iz raEuna te tako broj parova postaje N 9. Od brojeva 3 i 6 broj 3 je

  • 8/13/2019 Neparametrijski testovi (1)

    15/29

    21 3 DV Z VISN U Z O R K

    manji, i zato u tablici 0 kod N 9 Eitamo 0 1,1, 2. Iz toga zakljuCujemo da bi narazini znatajnosti od 5% (Eitamo pod lo%, jer nas zanima smjer razlike ) naS manjibroj morao iznositi najviSe 1. BuduCi da mi imamo 3, zakljuEujemo da razlika nijestatistiCki znacajna.

    U ovorn i u prijaSnjem primjeru mogli smo uociti jedan bitan nedostatak testapredznaka: on ne uzima u obzir velzEznu razlike, nego samo njezin smjer. Konkretno,u prvom naSem primjeru moglo se dogoditi kod 11parova blizanaca da je od majkeothranjeni blizanac bio znatno bolje razvijen od svog para, a kod 4 preostala para daje n a boEicu othranjeni blizanac bio samo neznatno bolje razvijen. Za test predznakato je, na ialost, "svejedno". Zato za taj test neki statistitari (Senders) kaiu da jet o vrlo prikladan postupak Stednje vremena kada su razlike velike, i vrlo koristaninstrument da bi se aproksimativno ustanovilo "odakle vjetar puSen, tj . postoji liuopCe neki fenomen ili ne. Ali lad nam je potrebna veCa preciznost, gdje ielimoiskoristiti i ostale podatke koje imamo, a t o su veltEzne pojedinih razlika, mnogo jeprikladniji Wilcoxonov test.

    21.3.2. Wilcoxonov test ekvzvalentnih purovaTaj test zahtijeva mjerene vrijednosti (dakle intervalnu ili omjernu skalu). Pos-

    tupak se sastoji u tome d a izratunamo razlike (d) izmedu oba Elana u svakom paru.Ako razlike nema, ona je 0, i ta j se par ispuSta iz daljnje obrade. Razlike mogu bitipozitivne i negativne. Te se razlike mngiraju i to bez obzira nu predznak. Najmanjarazlikadobiva rang 1 iduCa rang 2 itd. Ako su dvije ili vise razlika jednake velitine,dobivaju zajednieki rang. Nakon toga svakom se rangu daje onaj isti predznakkoji je imala i razlika: ako je razlika pozitivna, i rang je pozitivan, a ako je razlikanegativna, i rang je negativan.

    Pod pretpostavkom nul-hipoteze (tj. da nema razlike medu uzorcima) postojatCe tendencija d a suma pozitivnih i suma negativnih rangova budu jednake ili sliEne.Ako postaji znaEajna razlika u sumi, to veC govori u prilog odbacivanja nul-hipoteze.Iz tablice moiemo oCitati koliko najviSe smije iznositi manja suma rangova (T) uzodredeni broj parova (N).

    Primjer 1:Uzmimo d a imamo u nekom ispitivanju ovih 10 parova rezultata:Parovi A B C D E F G H I JRezultat jednogElana para 15 19 31 36 10 11 19 15 10 16Rezultat drugogElana para 19 30 26 8 10 6 17 13 22 8Razlike (d) -4 -11 5 28 0 5 2 2 -12 8Rang razlika 3 -7 4,5 9 4,5 1,5 1,5 -8 6.IzraEunali smo razlike l i t e razlike rangirali od najmanje do najveCe (bez obzira

  • 8/13/2019 Neparametrijski testovi (1)

    16/29

    336 21 IZ OR I Z N E P A R A M E T R I J S K I H TESTOV

    n a pred znak ), a rangov ima sm o dali isti predznak koji je im ala i razlika.Su m a negativnih rang ova iznosi 18 (zapravo -18, ali buduCi da je va in a sam oveliCina broja, sada moiemo predznak izostaviti). Suma pozitivnih rangova iznosi

    27. M anja su ma rangova T 18. N 9 (jer smo jedan par odbacili). Tablica Pu Dodatku pokazuje da bi na razini znaEajnosti od 5 (u dvosmjernom testu)m an ja su m a rangova smjela iznositi najviSe 6. BuduCi da je naS T 18, za-kljuEujemo d a razliku ne m oiem o sm atr ati statist ieki znatajno m.Ako nas unaprijed zanima smjer razlike, ravna t demo se u tablici prem a raziniznae ajnos ti oznaEenoj za jednosmjerni tes t. EkstrapolirajuCi naS T 18 n a razi-nu P / 2 0 ,0 5 (Sto u tablici nije navedeno), m oie m o sa sigurnoSCu zakljuEiti d a bii u to m sluEaju naS T bio prevelik.Primjer :PokuS ajmo naS primjer s bgcanjem lopte (drugi primjer iz Tes ta predznaka, st r.334) obraditi W ilcoxonovim testom :

    B C D E F G H I J15 19 31 36 10 11 19 15 10 1617 20 16 8 10 6 7 8 12 8Razlike (d) 2 1 -15 -28 0 -5 -12 -7 2 -8Rang razlike 2,5 1 -8 -9 -4 -7 -5 2 , 5 - 6 .

    Sum a negativnih rangova 39.Sum a pozitivnih rangova 6.T 6.N 9.Iz tablice P moBemo ust ano viti da je razlika izmedu ob a uzorka u dvosmjer-nom testu znatajna n a razini od 5%, odnosno d a je u jednosmjernom testu(koji smijemo upo trijebiti jer nas je zan imalo sam o je li umor smanjio preciznost

    u gadanju) razlika znaCajna na razini od 2,5%.K ao Sto se iz ovog prim jera oCito vidi, snaga Wilcoxonova tes ta zna tno jeveCa od snage T es ta predz naka , jer smo Wilcoxonovim test om dokazali postojanjejedne razlike koju nismo mogli dokazati Testom predznaka.N a p o m e n a . T aj sm o primjer mogli joS preciznije ob raditi param etrijskimtestom , koji smo nazvali m eto da diferencije (vidi str . 15 1). D a smo to utinil i ,dobili bismo:

    dif -7s 9 , 4 9

    Za 9 stupnje va slobode t a je razlika znaEajna na razini koja je neSto ma nja od5%. Kako se vidi, usprkos tome Sto za neparametrijske testove vrijedi pravilo dasu man je snaini od parame tri jskih, neki od njih daju rezultate koji su vrlo bliskirezultatima Sto bismo ih dobili parametrijskim testom.

  • 8/13/2019 Neparametrijski testovi (1)

    17/29

    21 4 VISE NEZAVISNIH U Z O R K 337

    Ako je uzorak velik (veCi od 25), T ima pribliZno normalnu raspodjelu, te semoBe izracunati z koji glasi:

    BuduCi da se radi o normalnoj raspodjeli, kod dvosmjernoga testa dovoljna jevrijednost z od 1,96 da bismo na razini znatajnosti od 5 mogli smatrati da jerazlika znaEajna, odnosno z od 1,64 da bismo kod jednosmjernog testa razlikumogli smatrati znaEajnom.

    21 4 VISE NEZAVISNIH UZORAKA

    21.4.1. ProSzreni medgan testAko imamo viSe nezavisnih skupina pa ielimo testirati pripadaju li one ili ne

    pripadaju populaciji s istim medijanom, moiemo se posluZiti Proiirenim medijantestom na sliEan naEin kao Sto smo to uEinili kod dva uzorka.

    Postupak se sastoji u tome da nademo medijan svih rezultata i da rezultate,koji su iznad medijana, oznaEimo s plus , a one ispod medijana s minus . Ako jebroj rezultata neparan, medijan postaje jedan ili vise postojeCih rezultata; u tomslu taju i rezultati koji predstavljaju medijan dobivaju oznaku minus . Rezultatise nakon toga uvrste u 2 . 1 ~ablicu k broj uzoraka) i izratuna se hi-kvadrat test.

    Primjer. Na 4 nezavisna uzorka dobili smo ove rezultate (zbog preglednosti onisu poredani prema velicini):

    I 8 12 13 14 20 21 25 33 43 45 47I1 10 15 19 25 30 38 40 45 47 48 51 54 55

    I11 16 16 17 21 29 33 44 45 46 53 62 67IV 22 41 49 54 59 60 65 69 71 75.Kako imamo 46 rezultata, medijan je sredina izmedu 23. i 24. rezultata (tj.

    izmedu vrijednosti 41 i 43) , i iznosi 42.OznaEimo li u svakom uzorku rezultate vet prema tome padaju li ispod ili iznad

    medijana, dobivamo:

    Te rezultate unesemo u tablicu:

  • 8/13/2019 Neparametrijski testovi (1)

    18/29

    338 21 IZBOR IZ NEPARAMETRIJSKIH TESTOVA

    IznadmedijanaIspodmedijana

    OEekivane frekvencije za svaku Eeliju iznose u ovom slutaju polovicu brojaslutajeva u toj grupi. Ali ako je medijan jedan od rezultata, onda obje desne sumeu tablici nisu jednaki brojevi, pa oCekivane frekvencije t reba izraEunatz prema stan-dardnom postupku. OCekivana frekvencija svake Celije je suma reda . suma stupca,podijeljeno ukupnom sumom). Tako dobivamo ovaj hi-kvadrat raFun:

    Broj stupnjeva slobode je 2 1) 4 1) 3 GraniEna vrijednost X 2 iznosi 7,815.BuduCi da je naS dobiveni X 2 manji, prihvakamo nul-hipotezu i zakljutujemo da nemoiemo smatrati da ti uzorci pripadaju populacijama s razlititim medijanom.

    N a p o m e n a. Za ProSireni medijan test vrijede pri izracunavanju hi-kvadrata ista pravila koja smo spomenuli na str. 268 u vezi s dopuStenim bro-jem Celija, u kojima je oeekivana frekvencija manja od 5 Toga se pravila doduSene pridriavaju svi autori.)

    21.4.2. Kruskal Wallisov testTaj test zapravo predstavlja test analize varijance, samo se umjesto brojtanih

    mjernih podataka sluii rangovima. On donekle predstavlja prosireni test sume ran-gova.

    Postupak se kod tog tes ta moie saieti u ovih nekoliko operacija1 Svi se rezultati rangiraju, i to tako da najniii rezultat dobije rang 1.Uzmemo li u raEun naS prijaSnji primjer iz ProSirenog medijan testa, imamo

    ovu situaciju:

  • 8/13/2019 Neparametrijski testovi (1)

    19/29

    2 1 4 V I S E NEZAVISNIH [JZORAKA 339

    2. IzraEunamo sume rangova u svakom uzorku z).roj rezultata u svakomuzorku oznaEit Cemo s N i . Dobivene brojeve korisno je k ontrolirati: s um a Ti mo r aiznositi:

    I . uzorakRezul ta t Rang8 1

    12 313 414 520 1121 12,525 15,533 19,543 2445 2 747 30,5

    U naSem primjeru dobivamo:

    3 . IzraCunamo izraz H prema formuli:

    11 uzorakRezul ta t Rang10 215 619 1025 15,530 1838 2 140 2245 2747 30,548 3251 3454 36,555 38

    gdje je:12 TiH = N N 1 ) C 3 N

    111 uzorakRezul ta t Rang16 7,516 7,517 921 12,529 1733 19,544 2545 2 746 2953 3562 4 167 43

    Ti = su m a rangova u jednom uzorkuN = ukupan b ro j opa ian jai broj opa ian ja u jednom uzorku.Ako kvadriramo svaki i rezultat podijelimo korespondentnim N i , dobivamo:

    IV. uzorakRezul ta t Rang22 144 1 2349 3354 36,559 3960 4065 4269 4471 4575 46

  • 8/13/2019 Neparametrijski testovi (1)

    20/29

    340 21. IZBOR IZ NEPARAMETRIJSK IH TESTOV

    Zbrojimo li sve te vrijednosti, dobivamo:

    Uvrstimo li vrijednosti u formulu (21.10), dobivamo:

    4 Ako su uzorci dovoljno veliki (kod ovog se raEuna smatra d a su uzorci dovoljnoveliki ako svaki uzorak sadrgi viSe od 5 rezultata), H ima jednaku distribuciju kaoi hi-kvadrat, pa zato moiemo znatajnost otitati iz X tablice uz k 1 stupnjevaslobode ( k broj grupa).BuduCi da naS broj stupnjeva slobode iznosi 3, a granitna vrijednost X 2 7,815,morali bismo zakljutiti da se uzorci statistitki znatajno razlikuju, tj. da ne pripadajuistoj populaciji.

    Kao Sto se vidi, dok medijan testom nismo dokazali da uzorci pripadaju ra-zlititim populacijama, Kruskal-Wallisovim testom smo to dokazali. BuduCi daKruskal-Wallisov test koristi vise informacija od medijan testa (rangove umjestojednostavnu podjelu rezulta ta u dvije skupine), on je snainiji od medijan testa.

    Ako imamo veCi broj zajednitkih rangova, a H je neSto ispod graniceznaeajnosti, treba upotrijebiti drugu, korigiranu, formulu za izratunavanje H, uCTkojoj formulu (21 lo) dijelimo s 1 N(N 1 :

    gdje je T n(n I), a n broj rezultata koji Cine zajednitki rang.Taj ratun treba posebno utiniti za su zajednitke rangove: na primjer, ako

    imamo dva pu ta po 2 vezana ranga, dva puta po vezana ranga i po jedanput4, 5, 7 i 10 vezanih rangova, onda Ce vrijednost T iznositi:

  • 8/13/2019 Neparametrijski testovi (1)

    21/29

    21 5 V I S E Z VISNlH U Z O R K 34

    Taj Ce postupalt lieSto povec ati vrijednost H.U riagem slutaju tu ltoreltturu ne treba upotrijebiti, jer je 1. vrijednost H vetionalto veCa od granilne vrijednosti, i 2. zbog relativno malog broja zajedniEkihrangova ltorlatari rezultat bio bi samo neznatno promijenjen (moida tek u drugoj

    decimali)Kada broj mjerenja u pojedinim uzorcima r~i.jedovoljno velilt (dakle kad segrupe sastoje od 5 ili rnarlje rezultata, H se ne moie interpretirati kao X i u tusvrhu postoje posebr~e ablice iz kojili se moie otit avati vjerojatnost. Te se tablice111ogu naCi u neltiln prirutnicima neparanietrijskih metoda.21 5 VISE ZAVISNIH UZORAKA

    21.5.1. Friedmanov tes tAlto na dstoj grupi ispitanika vr5imo mjerenje u razlzFitim uvjetima, onda su

    rezulta ti dobiveni 11 svakorn od tih uvjeta u korelaciji s ostalim rezultatima, pa sezbog toga vise ne moiemo sluiit,i Krusltal-\Vallisovim testom.

    U tom slueaju Friedmanov test dvostrulte analize varijance rangova pred-stavlja vrlo korisrlu i upotrebljivu rr~et~oduojoj u parametri,jsltoj statistici odgo-vara dvostrulta analiza varijance , a koja se upotrebljava, izmedu ostaloga, i pritestiranju razliln. izmedu aritnietilltih sredina vise zavisnih uzoraka.

    Post,upalt Fried~na,novaesta sastoji se u tome da se rezult,ati najprije razvrstajuu tahlicu s N redova i c kolona. Redovi odgovaraju pojedinim ispitanicima (iligrupama ispitanika), a kolone predst,avlja,ju eksperimentalne uvjete. Rezultatisvakonl redu (daltle za svaltog ispitanika posebno) pretvore se u rangove. U slucajujednakih rezulta ta, dobivamo nara.vno zajedniEke rangove, ali to prema Fried-manu e utjeee na vrijedtlost testa.Rangovi sc u svakoj koloni (elcsperirrientalnoj situaciji) zbrojc T). Kada nebi bilo razlika u rezultati~namedu uzorcima iz razlititih eksperimentalnih uvjeta(t j. l a d bi svi uzorci bili iz iste populacije),.sume ra,ngova tendirale bi slicnimvrijcdriostima. Alto se t e sume znaCajno razliltuju, moiemo odbaciti nul-hipotezu.Da bismo izrnjerili relativnu velicinu tih razlika, zbrojit Cemo kvadrirane s u m erangova (suma rangova Ti , i nakon toga Cemo izralunati:

    Alco su broj ispitanika N) i broj eksperirnentalriih uvjeta dovoljno veliki, izraz Xima pribliino jetlnaku dist,ribilciju la o i hi-kvadrat sa k stupnjeva slobode, pastoga znalajnost ocitavamo iz t,ablice granitnih vrijednosti hi-ltvadrata.

    Primjer . Jcdan ,jc istraiiva? ispitivao kako na radni ulinak utjeEe vise odmorai je li u tolcu rada raciorialriije uzeti jedan dulji odmor ili vise ltraCih odmora.IZ:I1jerio e ulcupan radni ulinalt kod ra,da od 4 minute bez odmora (eksperimentalnasituacija a ), kod rada od 111cupno3 minut,e s jednim odmorom od 60 sek u sredinirada (eksperinientalna situa.cija b ) ltod rada od ukupno 3 minute s 2 odmoraod po 30 sek u toku rada (eksperimentalna situacija c ) i kod rada od ukupno 3

  • 8/13/2019 Neparametrijski testovi (1)

    22/29

    342 21 IZBOR Z NEP R METRIJSKIH TESTOV

    minute s 3 odmora od po 20 sek (eksperimentalna situacija d ). Na ukupno 11ispitanika dobio je ove rezultate, koje je za svakoy is pitan ika posebno pretvorio urangove (rang je ue svaki rezultat oznaEen u zagradi):EKSPERIMENTALNE SITUACIJE

    Ispitanici a b c d1 991 (4) 1157 (3) 12 32 (1) 121 7 (2 )2 1139 (2) 105 5 (4) 105 7 (3) 1173 (1)3 762 (4) 775 (3) 931 (1) 890 (2)4 1074 (4) 1121 (3) 122 0 (2) 1260 (1)5 544 (4) 596 (3) 655 (2) 671 (1)6 765 (2) 728 (3) 840 (1) 637 (4)7 904 (1) 839 (2) 746 (4) 774 (3)8 862 (4) 916 (2) 881 (3) 157 (1)9 725 (4 )) 886 (3) 925 (2) 992 (1)10 107 9 (2) 894 (4) 1130 (1) 100 9 (3)11 833 (3) 844 (3) 890 (2) 963 1)

    i 35 33 22 20Zbog kontrole treba izraEunati sumu rangova:

    Izratunamo li zbroj kvadriranih suma rangova, dobivamo:

    Uvrstimo li dobivene vrijednosti u formulu (20.11), dobivamo:

    Uz (k 1) 3 stupnja slobodc, graniCna vrijednost X iznosi 7,815. BuduCi daje 9 ,44 7 ,815 , zakljutujemo da uzorci n e pripnduju istoj populaciji, i da se zatostatistiEki znatajno razlikuju.Ako su N i k mali, postoje posebne tablice za otitavanje znatajnosti izraza X Bna razini znaeajnosti od 5 i 1 . Tablica R u Dodatku da je vjerojatnosti povezaneuz razlieite X : za sluCajeve ltada je k 3 i kada je k 4.

  • 8/13/2019 Neparametrijski testovi (1)

    23/29

    21 5 VIS E Z VISNIH U ZOR K 343

    Ka d bismo, na prim jer, mjereCi 6 ispitanilca u ekspe rimen talne situacije dobiliX 4,30, zakljueili bismo d a ne m oiemo odbaciti nul-hipotezu (t j . d a ne mo iem odokazati da se uzorci znaEajno razlikuju), jer iz tablice se vidi da bi na raziniznaeajnosti od P 0 ,0 5 graniCna vrijednost X morala iznositi barem 6,4.

    Zanimljivo je d a Friedmanov test ako koristi jedino rangove, a ne stvarn eizmjerene vrijednosti m a gotovo jednaku snagu kao i analiza varijance zavisnihuzoraka. IzraCunamo li primjer s pretho dne stra nice uz pomoC analize varijancezavisnih rezulta ta dob it demo F 3,6 9, Sto je zna tajno na razini P < 0,05.

    Za ilustraciju gotovo jednalte snage Friedmanova tes ta i param etrijskog Ftesta riavodimo rezultate 56 nezavisnih analiza, u kojima je Friedman usporedioznaEajnost dobivenu F tes tom i Friedmanovim testom (vidi tablicu 21.1).

    TABLICA 21.1.

    21.5.2. Cochranov Q test

    Vjerojatnostr

    VeCa od 0,05Izmedu 0,05 i 0,01Ma nja od 0 ,01Ukupno

    Ako na istoj skupini ispitanika (ili na razliCitim skupinama, ali one morajubiti nieE ovan rn, t.j svaki ispitanik u svako j skup ini m or a irnati svog dvojnika udrugirn s ku pin am a koji mu je u svim relevantriirn fak torim a veoma slit an) vrSimomjerenje u razlieitim uvjetima (kao Sto je npr. bio sluEaj u Friedmanovu testu upoglavlju 21.5.1.) ali su rez ulta ti ispitariika dihotomni t j . svrstani u samo dvijekategorije (pao-proSao, zdrav -bolestan , i sl.), on da je za testiranje posto je li razlikeizmedu pojedinih sitliacija pogodan Cochranov Q test . Tim testom zapravo setestira razlilia izmedu proporcija neke larakteristike u razli t it im u vjetima.

    Pretp ostav imo d a je 20 stud enata polagalo t r i ispita, i d a smo na svakom ispituregistrirali je li student proSao ili pao, pa nas zanima postoji li razlika u propor-ciji uspjeibosti polaganja tih ispita. Na donjoj tablici pokazani su rezultati +proSao. pao):

    LKa ko se iz tablice v idi, slaganje je vrlo veliko.

    Ukupno

    3091756

    Vjerojatnost FVeCa od

    0,052840

    32

    Izmedu0,05 i 0,Ol

    2

    4

    hlan ja od0,Ol

    046

    20

  • 8/13/2019 Neparametrijski testovi (1)

    24/29

    344 21. I Z B O R IZ N E P A R A M E T R I J SK I H T E S T O V A

    Studenti Ispiti XR X ib c+ + + 3 9

    2 + + 2 43 + 14 0 05 + + 2 4+ + 2 47 + 1 18 + 1 19 + 110 + + 2 411 + + 2 4

    12 + + 2 413 + +14 +15 + + + 3 C6 +17 +18 + + 2 419 + + 2 420 + + 2 4

    Suma 17 9 7 33 65Post,upak za izratunavanje moie se podijeliti u tri nkoraka :1. Nadi sumu svakog eltsperimentalnog uvjeta (sitna.cije) (dakle EX1, EX2,C X itd. U naSem slucaju to su ove sume: EX1 17, EX2 9, EX3 7.2. Sumiraj rezultate svaltog ispitanika u svim eksperimentalnim uvjet,ima

    (situacijama), tj. izratunaj sumu za svalti r e (EX R) tu sumu kvadriraj EX:).3. Sumiraj oba stupca tj. sumiraj stupac EXR i stupac EX^ ^.Fornlula za Q gla,si:

    Pri Eemu k broj situacija (eksperirnentalnih uvjeta)U naSem slucaju daltle imamo:

    Q test distribuira se pribliino kao i hi-kvadrat test, sa stupnjevima slobode k 1,pa u naSern slutaju iniamo 2 stupnja slohode. GraniCna vrijednost hi-ltvadrata (uzrlivo znaeajnosti od 5 ) izriosi 5,99. BuduCi d a je dobiveni Q veCi, odbacujemo

  • 8/13/2019 Neparametrijski testovi (1)

    25/29

    21 5 VISE ZAVISNIH UZORAKA 345

    nul-hipotezu i zakljutujemo da se rezultati ispita statistieki znaEajno razlikuju (Tonam dakako niSta ne h i e kako takav rezultat valja interpretirati:moida je razlogra.zlikama u teiini predmeta, moida u razlititoj strogosti pojedinih nastavnika,moida u manjem interesu studenata za neki predmet, itd. Vjerojatno se CitalacsjeCa d a smo ve t u ovoj kn,jizi spomeriuli da je ono Sto statistitki raEun pokaieveorna zanimljivo, ali da on ne poltazuje ono Sto je Eesto bitno: vrlo je zanimlji\~oznati d a se uspjeh ova tri ispita razlikuje, ali bitno bi bilo znati zaSto se razlikuje )

    Kao Sto iz ovog pr i~ njer a idimo, test nam litno kao i analiza varijancedaje podata,k da rezultati razlieitih ispitivanih uvjeta ne pripadaju istoj populaciji,ali narn ne liaie koji se rezultati rnedu sobom statistiCki znatajrio razlikuju. Akobi nas t o posebno zanimalo, mogli bismo (iako je t o samo aproksimativna metoda)po dvije situacije medusobno testirati testom dvaju zavisnih uzoraka sliEnog tipa,a t o je test predznaka. (Vidi str . 333).

    21.5.3. Fergusonov test ~monotonije rendnU riovi,je vrijeme Ferguson je razradio neparametrijske postupke za testi-

    ranje trenda u cltsperimentima tipa opisanog kod Friedmanova testa. (Postoje iparamet,ri,jski estovi trenda, ali oni u ovom prirutniku nisu spomenuti.) Nas, naime,moi e zanimati ne sarno to da li se ek~per iment~alneituacije stat ist itki znaCajno raz-liltuju, vrC i to postoji li odrederla pravilnost u porastu (ili padu) rezultata od jedneeltsperinlentalne situacije do druge. Tako bi, primjerice, u maloprije obradenomprinljeru uz pomoC X te sta bilo posve logiC110 otekivati da u sluCaju da brojodmora inla utjecaja na radni uCinak a j ut,jecaj bude t o veCi,Sto je veCi broj1ira.Cih odmora u toku radnog vremena. Friedmanov test ne daje narn moguCnostda odgovorimo i ria to pitanje trenda.

    E'ergusono~~,est prikazat Cemo ultratko, i to sarno za sluCajeve kada nema za-,jedniEkih rangova, jer u takvim slutajevirna (Sto je inaCe u eksperimentima ovogtipa vrlo rijet,lto) ra tunanje je znat~ io ompliciranije. Zbog istog razloga nismoprilmzali Fergusonov test monotonije trenda za nezavisne rezultate atunanjeje znatno kompliciranije. U vezi s tim problcmima upuCujemo Citaoce na knjigu:Ferguson, "Statistical Analysis in Psychology and Education", 2 izdanje, McGraw-Hill, 1966.

    Posluiit Cemo se naSim rezultatima, obradenim u Riedmanovu testu, a metoduCemo iznijeti u 5 "koraka":

    1. Rangiraju se rezultati svalcog ispitanika posebno, za sve eksperimentalnesituacije.

    Kao $to znamo, t o je ve t u nagern prirnjeru uEinjeno.2 Za svalcog ispitanila izratuna se izraz S, koji se ratuna ovako: usporedi se

    svaki rang sa svaltim (dakle imamo N(N 1)/2 usporedbi rangova za svaltog ispi-ta nil ~a); lio je par rangova, koji se usporectuje, u "prirodnom" redu (npr. 1,4),zabiljezi se 1, a alto je red izvrnut (npr. 4,1), zabiljeii se -1. Rezultati se zasvakog ispitanika zbroje.

  • 8/13/2019 Neparametrijski testovi (1)

    26/29

    346 21. IZBOR IZ NEPARA.VIETRIJSKIH TESTOVA

    Na donjoj tablici dan je prikaz rangow i vrijednosti S za svakog ispitanika.Ispitanici

    23456789

    1 011

    Rangovi4 3 1 2' 2 4 3 14 3 1 24 3 2 14 3 2 12 3 1 41 2 4 34 2 3 14 3 2 12 4 1 34 3 2 1

    Minusi Plusovi12+100

    +45+1030 -6

    Suma svih S = -32Pokazat Cemo racunanje S za prva da ispitanika: .spztunzkpar 4 : 3 + - 1

    4 : 1 + - 14 2 -1 Ukupno ispitanik 1:3 1 - 1 - 5 + 1 = - 4 .3 : 2 + - 11 : 2 + + 1

    spi tunikpar 2 : 4 + + 12 : 3 - + + 12 1 1 Ukupno ispitanik 2:4 : 3 + - 1 - 4 + 2 = - 2 .4 : 1 - -13 : 1 + - 1

    3 . Zbroje se sve vrijednosti S da bi se dobio izraz CS. U nagem sluEaju C S =-32.

    4. IzraEuna se izraz g; to je varijanca distribucije uzoraka S prema formuli:

    pri emu je = broj eksperimentalnih situacija, i dobiveni se izraz pomnoii s Nbroj ispita,nilm) lta,ko bi se dobila varijanca distribucije izraza CS. Drugi korijeniz toga izraza jc staridard~ia evijacija izraza CS.Da,ltle, u naSem primjeru imamo:

  • 8/13/2019 Neparametrijski testovi (1)

    27/29

    21 5 VISE Z VISNIH UZORAKA 347

    5. Izraz ICSl- 1podijeli s izrazom TCSi tako se dobije odstup anje u terminimanorrnalne distribucije, dakle z

    Alco je z veCi od 1,96 (z a razinu znaEajnosti od 5 ), ili veCi od 2 58 (za razinuznaEajnosti od I % ) , odb acit Cemo nul-hipotezu.Dakle, u naSem sluEaju zakljutujemo da naSi rezultati pok zuju statist i tkiznaEajan trend P 0,Ol) .

    1. Donja dva niza podataln . (Xi Y ) potjeEu iz dva uzorka. Testirajtetes tom niza posto ji li medu njima statist itki znaEajna razlika.Y

    2. Dvije skupine ispitanika postigle su na jednom testu raEunanja overezultate:

    Tes tirajte m edijan testom pripadaju li ob a uzorka isto j populaciji.

  • 8/13/2019 Neparametrijski testovi (1)

    28/29

    348 21 I Z B O R IZ N E P R M E T R I J S K I H TESTOV

    Da li se vrijerrie dresure izmedu obje te grupe statistiCki znatajnorazlikuje? Za provjeru upotrijebite tes t sume rangova .

    4 Nelre nove pilule protiv dcbljanja iskuhne su na 15 ljudi tijekom 3tjedna. Navederie su r1,jihove t,eiine prije i poslije zavrsene terapije . Uzporno6 testa predznaka provjerit,e jesu li pilule imale efekta.

    3 Jedan je dreser dresirao 20 lavova za neku totku. Lavovi su bili podi-je1,jeni u dvije grupe: grupa A bila je nagradivana u toku dresure, agrupa B nije. Dolje su prikazani dani potrebni za svakog lava da nauEitoCku:

    Prije Poslije

    A

    5 Deset tiplarica-potetnica na prvoj stranici pisanja ucinile su od 10 do22 pogreSlre (stupac X); na drugoj stranici ueinile su 4 18 pogresaka(stupac Y .TVfoic li se razlila srnatrati statistielti znatajnom? Upotri-jebitc Wilcoxonov test elcvivalentnih parova , a tnko er i t-test( metoda diferencije ), i izvedite iz rezultata zakljutalc.

    78 95 82 69 111 65 73 84 92 110121 132 101 79 94 88 102 93 98 127

  • 8/13/2019 Neparametrijski testovi (1)

    29/29

    21 5 VIS E ZAVISNIH UZ OR AK A

    6. Na donje tr i skupine podataka primjenom Kruskal-Wallisova testaprovjerite pripadaju li uzorci istoj populaciji.Rezultati se odnose na vrijeme reagiranja (u minutama) laboratorij-skih miSeva na neki preparat.

    Skupine A B C

    7 Osmorica ispitanika ispitivana su u 4 eksperimentalne situacije:ispitivana je kolitina upamtenog materijala nakon 4 razlitito dugepauze. Rezultat i su dolje prikazani (broj u tablici oznatuje kolitinuupamtenog materijala)

    Vremenski intervaliIspit. I I I11 IV

    Postoji li statistitki znatajna razlika izmedu kolitine upamtenog ma-terijala u te 4 eksperimentalne situacije? Upotrijebite Friedmanovtest .

    8. Moie li se za rezultate iz 7 zadatka tvrditi da postoji neki trend sobzirom na eksperimentalne situacije? Upotrijebite Fergusonov testmonotonije trenda