11
ZaSto statistika? "StatistiEki naEin mi5ljerija jednog Ce dana za svakodrievni iivot gradana postati jed- nako neophodan kao znanje Eitanja i pisanja." H. G. Wells (1866-1946) Ako se upitearno " Sto je statistika", moie nam pomodi misao jednog statistitara na podrutju medicine (Mainland), koji kaie: "Nijedna definicija ne znati mnogo talto dugo dok nismo proutili ono na Eemu radimo - a tada je svaka definicija gotovo nep~t~rebna." A buduki da ima vise od 100 definicija statistike, zaista je bolje da se i ne pokuSavamo upuStati u to da je definiramo. Uostalom, i bez defiriicije, manje-vise ipalt svi zna,rno Sto po prilici orla znaEi: obra.da brojtanil-i podataka radi jasnijeg priltazivanja. (S ovim "jasnije" mnogi se od vas zasigurno ne slaiu!) Kao Sto Ce se lasnije iz teksta ove knjige vidjeti, poEeci statistitke nletodologije nastali su iz potpuno praktitnih poticaja i problcrna svaltodnevnog iivota (tj. iz problema na koje su nailazili profesionalni kockari i hazarderi!). No ltada su se maternatitari ozbiljno zainteresirali za te probleme, i kada su razradili statistiku lao granu prirnijenjene ma.tematilte, statistila je postala teSko dostupna Covjeltu, lcoji ni.je bio ili po profesiji ili po svom "hobiju" matematiCa,r. lLIoida je to uzrok Cirljenice da se u razlititim druStvenirn i prirodniin zrianostima statistika joS prije 70-80 godina talto malo primjenjivala. (Jedino jedan njezin dio - a taj je upravo i najrnanje povezan sa statistitkom metodologijom - u~latrag nekoliko stoljeda poznat je u znanosti i u javnosti: to su bili razliCiti statistitki pregledi broja rodenih i urnrlih, broja oboljelih od neke bolesti i sl.) Tako se, na prirnjer, u prirni.jenjenoj psihologiji stat,istika prvi put pojavljuje olto 1920. godine, kada su postavljene neke hipoteze o nastanku nesreka, pa je predloieno da se te hipoteze provjere tako Sto bi se usporedivalo ono Sto se pod vidoiri tih hipoteza moie otekivati s onini Sto se zapravo dogada. No, ti prvi pokusaji "prodora" statistike u svakod~lev~lu praksu i u primijenjenu znanost,, ostali su u poCetku bez veCeg odjeka, i tek za Drugoga svjetskog rata, usporedno s "eksplozivnim" porastom znanstvenih spozrlaja na razlititim priro-

ZaSto statistika? - zaf.biol.pmf.unizg.hrzaf.biol.pmf.unizg.hr/behaviour/Zasto statistika.pdf · djeteta medu drugom djecom. Ili, prilikom klasifikacijskih ispita za upis na neki

  • Upload
    others

  • View
    36

  • Download
    2

Embed Size (px)

Citation preview

Page 1: ZaSto statistika? - zaf.biol.pmf.unizg.hrzaf.biol.pmf.unizg.hr/behaviour/Zasto statistika.pdf · djeteta medu drugom djecom. Ili, prilikom klasifikacijskih ispita za upis na neki

ZaSto statistika?

"StatistiEki naEin mi5ljerija jednog Ce dana za svakodrievni iivot gradana postati jed- nako neophodan kao znanje Eitanja i pisanja."

H. G. Wells (1866-1946)

Ako se upitearno " Sto je statistika", moie nam pomodi misao jednog statistitara na podrutju medicine (Mainland), koji kaie: "Nijedna definicija ne znati mnogo talto dugo dok nismo proutili ono na Eemu radimo - a tada je svaka definicija gotovo nep~t~rebna." A buduki da ima vise od 100 definicija statistike, zaista je bolje da se i ne pokuSavamo upuStati u to da je definiramo. Uostalom, i bez defiriicije, manje-vise ipalt svi zna,rno Sto po prilici orla znaEi: obra.da brojtanil-i podataka radi jasnijeg priltazivanja. (S ovim "jasnije" mnogi se od vas zasigurno ne slaiu!)

Kao Sto Ce se lasnije iz teksta ove knjige vidjeti, poEeci statistitke nletodologije nastali su iz potpuno praktitnih poticaja i problcrna svaltodnevnog iivota (tj. iz problema na koje su nailazili profesionalni kockari i hazarderi!). No ltada su se maternatitari ozbiljno zainteresirali za te probleme, i kada su razradili statistiku l a o granu prirnijenjene ma.tematilte, statistila je postala teSko dostupna Covjeltu, lcoji ni.je bio ili po profesiji ili po svom "hobiju" matematiCa,r. lLIoida je to uzrok Cirljenice da se u razlititim druStvenirn i prirodniin zrianostima statistika joS prije 70-80 godina talto malo primjenjivala. (Jedino jedan njezin dio - a taj je upravo i najrnanje povezan sa statistitkom metodologijom - u~latrag nekoliko stoljeda poznat je u znanosti i u javnosti: to su bili razliCiti statistitki pregledi broja rodenih i urnrlih, broja oboljelih od neke bolesti i sl.)

Tako se, na prirnjer, u prirni.jenjenoj psihologiji stat,istika prvi put pojavljuje olto 1920. godine, kada su postavljene neke hipoteze o nastanku nesreka, pa je predloieno da se te hipoteze provjere tako Sto bi se usporedivalo ono Sto se pod vidoiri tih hipoteza moie otekivati s onini Sto se zapravo dogada.

No, ti prvi pokusaji "prodora" statistike u svakod~lev~lu praksu i u primijenjenu znanost,, ostali su u poCetku bez veCeg odjeka, i tek za Drugoga svjetskog rata, usporedno s "eksplozivnim" porastom znanstvenih spozrlaja na razlititim priro-

Page 2: ZaSto statistika? - zaf.biol.pmf.unizg.hrzaf.biol.pmf.unizg.hr/behaviour/Zasto statistika.pdf · djeteta medu drugom djecom. Ili, prilikom klasifikacijskih ispita za upis na neki

dnim i druStvenim podrutjima naglo prodire i statistiCki natin miSl,jenja, kako u primjenu znanstvenih disciplina, t,ako i u naCin razmiSljanja u problemima bio- logije, ekonomije, poljoprivrede, psihologije, sociologije, tehnike, vojnih znanosti, prometa., trgovine i prodaje, Sporta - pa Eak i lingvistike, knjiievnosti i drugih podrucja znanosti.

StatistiCka rrletodologija postala je u suvremenom iivotu donekle Cak i dio "opdeg obrazovanja" i "opde kulture", jer je, na primjer, teSko zaniisliti danas Eovjeka bilo koje s truke, ako posjeduje vise, a pogotovu visoko obrazovanje, da mu ne hi bili poznati, primjerice, pojmovi "aritmetitke sredine", "korelacijel', "varija- biliteta" i tome slitno.

Dakle, svaki je Eovjek danas - kao Sto je to proroEanski predvidio H. G. Wells, kojega smo citirali kao mot0 ovog poglavlja - izloien situacijama u kojima mu je potrebrio poznavanje nekih osnovnih statistiEkih pojmova, a pogotovu statistitkog "natina miSljenjall.

Za suvremenog Eovjeka, koji se bavi znans tven im radom, postoje - mogli bismo redi - Eetiri "razine", na lcojima on treba statistiku:

1. Poznavanjc statistike potrebno je zbog praLenja s t r u t n e i znans tvene litera- ture.

2. Poznavanje sta,tistike potrebno je pri obradi rezultata, prikupljenih is- traiiva.njem ili eksperirnentom, radi deskripcije z analize tih rezultata.

3. Pozna.vanje statistike potrebno je u znanstvenom radu radi zakl jut ivanja iz konkretnog slutaja na "opCi zalcon".

4.'Poznavanje statistilce potrebno je pri planiranju istraiivanja i eksperimenata. Razmotrimo neke primjere za svaku od navedenih "razinal'! Ad 1. PraCenje literature. Driimo da za ovo podrueje uopCe nije potrebno

dokazivati potrebu osnovnoga statistiekog obrazovanja, jer je malone svaki struEnjak Eesto bio u takvoj situaciji da nije mogao razumjeti neke osnovne rezul- tate istraiivanja iz svoje struke, objavljene u razliEitim struEnim i znanstveriim Casopisima: t i su rezultati sve EeSCe izneseni u vrlo skraCenom obliku, ali zato uz pomoC niza statistitkih termina i simbola.

Ad 2. Stut is t iku radi deskripcije i analize. PodruCjem opisivanja konkretnih rezultata, dobivenih prilikom nekog ispit,ivanja ili mjerenja, bavi se tzv. "deskrip- tivna" statistika. Njezina je zadaCa - Sto se dade zakljuEiti iz naziva - da opiSe podatke, i to na ta j nakin da ih sredi z s a i m e , kako, bi bili Sto pregledniji. Bez takvog sredivanja mnogi podaci bili bi nepregledni, pa se stoga tako Cesto i dogada da potetnik s velilcim elanom i marljivoSCu skupi mrioStvo podataka prilikom nekog istra,Eivanja, a rialton toga ne zna pravo Sto da s njima poEne - te oni Eesto ostaju u ladici!

Tako, na primjer, antropologa ili lijetnika moie zanimati visina djece odredenog spola i dobi, ali l ad izvrSi mjerenja nekoliko stotina ili tisuda djece, iz mase pos- tojedih podataka. ne moie se vidjeti praktiEki niSta tako dugo dok se ti podaci ne srede i "saimu" kako bi ih se moglo graficki prikazati, ili dok se ne izraEuna barem aritimetiFlca sredina, kao jedna od vrijednosti koja "prezentira" te rezultate, tj. koja nam jednini brojem daje ono Sto je izvrSenim mjerenjem za t u skupinu " najtipitnije" .

Page 3: ZaSto statistika? - zaf.biol.pmf.unizg.hrzaf.biol.pmf.unizg.hr/behaviour/Zasto statistika.pdf · djeteta medu drugom djecom. Ili, prilikom klasifikacijskih ispita za upis na neki

Ili, jedan kliniEar moie biti zainteresiran za varijabilitet inkubacije za neku odredenu bolest. ProsjeE.no trajanje inkubacije moida mu je poznato, ali njega moida upravo zanima s koliko velikim varijacijama u inkubaciji moie raEunati. Drugim rijeCima, moie li ltod neke bolesti, kod koje inkubacija u prosjeku traje, recimo, oko 10 dana, biti siguran da do oboljenja neCe doti, ako je od momenta moguCe zaraze pro510 mjesec dana. (Tako je poznato da za tetanus inkubacija moie trajati vrlo dugo.) KliniEar Ce osnovnu informaciju te vrste dobiti iz jedne druge "reprezentativne" vrijednosti, npr. iz tzv. "standardne devijacije", koja pokazuje u kojem se rasponu mogu otekivati rezultati.

Psihologa ili fiziologa moie zanimati da li pod utjecajem djelovanja alkohola dolazi kod Eovjeka do povekanja varijabikiteta vremena reagiranja, pri Cemu moida prosjetno vrijeme reagiranja ostaje nepromijenjeno. I te podatke dobit Ce, naravno, na isti naEin, tj. traieCi neku mjeru varijabiliteta, rezultata.

Vrlo se Cesto u praksi pojavi pitanje relativnog poloiaja pojedinog rezultata medu sv in~ ostalirn rezulta,tima. Na primjer, ako poliklinitki IijeEnik saopCi nekom roditelju da je njegovo dijete "vrlo visoko za svoje godine", to je doduSe tome roditelju korisna informacija, ali nije dovoljno precizna, jer roditelja zanima toean podatak. No kada bi mu ta j lijetnik rekao da je njegovo dijete toliko visoko da medu drugom Skolskom djecom istih godina i spola ima samo 2% djece koja su rastom visa, orida t a informacija predstavlja vet vrlo detaljan opis poloiaja tog djeteta medu drugom djecom. Ili, prilikom klasifikacijskih ispita za upis na neki fakultet primjenjuje se moida nekoliko testova znanja. Nekako je uobitajeno da se rezultati svih testova zbroje i suma bodova svih testova predstavlja konaCan rezultat tog studenta. Je li t o posve ispravno? Saznat Cemo da nije. Naime, ako netko, pretpostavimo, dobije 70 bodova u testu, u kojem ispitanici po rezultatima variraju od 10 do 110, ta j mu dobiveni rezultat znaCi manje nego kada bi rezultati varirali od 40 do 80. U ovom, kao i u prijaSnjem pri~njeru, potrebno .je, dakle, toEno odrediti poloZaj svakog rezultata medu ostalim rezultatima, tj. potrebno je znati "koliko vrijedi pojedirii rezultat" - a to se vrlo lako moie postiCi primjenom nekih jednosta\inih statistitkih postupaka (izratunavanje " z-vrijednosti" ili izraEunavanje "decila" i sl.).

Dalje, mnogo se puta u praksi pojavi pitanje kakav je oblik distribucije neke pojave ltoja nas zanima, tj. kako se t a pojava "rasporeduje" u prirodi. Kao Sto je poznato najEeSCa distribucija, s kojom se u iivotu susreCemo, jest tzv. "normalna distribucija", u kojoj nalazimo najviSe srednjih, a najrnanje ekstremno malih ili ek- stremno velikih rezultata: istodobno, t a je distribucija simetriEna. No, to ne mora uvijek biti tako, jer se mnoge pojave rasporeduju i na druge naEine. Ako nam je poznato kako se neka pojava distribuira, moiemo s veCim razumijevanjem inter- pretirati pojedinatne rezultate. Tako je, na primjer, poznato da se bilirubin u krvi distribuira asimetribo, da se broj nesreda pri radu takoder distribuira asimetriCno (jer najvedi broj ljudi ili nema nesreda ili ima samo jednu, a vrlo mali broj ljudi ima mnogo nesreCa), da promjer ljudskog srca daje nepravilnu krivulju s dva vrha, da upitnici za ispitivanje stavova obiCno daju takvu distribuciju u kojoj ima najmanje "srednjih" rezultata itd.

U deskriptivnu statistiku mogli bismo Eak svrstati i jedno od inate vrlo kom-

Page 4: ZaSto statistika? - zaf.biol.pmf.unizg.hrzaf.biol.pmf.unizg.hr/behaviour/Zasto statistika.pdf · djeteta medu drugom djecom. Ili, prilikom klasifikacijskih ispita za upis na neki

1. ZASTO STATISTIKA :?

pleksnih pitanja, tj. pitanje Sto je "normalno" a Sto "nenormalno". 0 tom prob- .lemu mnogo je pisano i raspravl,jano, i problem zasigurno prelazi granice statistike, ali se uz pomoC statistike i statistitkog natina miSljenja problem ipak moie jas- nije uotavati. Prvenstveno, izraz "normalno" znaEi ono Sto je prosjeEno, ili Sto je "najEeSCen , katkada "normalno" znati " bez bolesnih znakova", itd. Na primjer, poviSeni tlak ltod veCeg broja starijih muskaraca nije "normalan" utolilto Sto je to znak nekih patoloSltih promjena u nekim organima, ali je, s druge strane, "nor- malan" utoliko Sto je "pros,jeCni tlalt starijih ljudi viSi od tlaka mladih". No jedan od najteiih problema, osobito izraien u disciplinama koje se bave bolesnim stanjima organizma jest pitan.je granzce izmedu " zdravog" i " bolesnog" , tj. " normalnog" i "nenormalnog". Pitanje uopCe nije 1jeSivo na potpuno zddovoljavajuii naCin (jer uvijek postoji zrlatajno preklaponje simptonla izmedu zdrave i bolesne grupe), ali neki grafitki statistiFki postupci osiguravajli nani da s relativno najmanje pogresaka odredimo gdje se t a granica nalazi.

Pozriato je da mnoge pojave pokazuju neku manju ili veCu medusobnu za- visnost: l ada je jedna pojava u porastu, u porastu (ili u padu) je i druga, pa tako do odredene granice moienio iz neke vrijednosti u jednoj od tih p ~ j a v a za- kljutivati ria odgovarajutu vrijednost u drugoj pojavi (na primjer iz podatla o visini neltog tovjeka moiemo s odrederiom vjerojatnoSCu nagadati i o njegovoj vjerojatnoj teiini). Ta se pojava naziva korelacijom, i nalazimo je svagdje oko sebe: u korelaciji su visina i teiina, inteligencija i Skolski uspjeh, tjelesna temperatura i pills, in- tenzitjet tjelesnog napora i krvni tlak, koliEina kiSe i bujnost vegetacije, starost i tjelesna snaga, rnotivacija i radni utinalt, itd., itd. Za psihologa, li,jetnika, soci- ologa i druge strutnjake poja,m ltorelacije i t e kako je vaian, jer nam - kalto je vet reteno - korelacija omogutuje po~tavl~janje pro,gnoze iz jedne pojave u drugu: Sto ,je povezariost (ltorelacija) viSa, prognoza je toCnija.

Ad 3. ZakljuCi,uanje i z konkretnog slvtaja n a "opCi zalcon". Ako smo izmjerili visinu, recimo, 100 desetogodisnje muSke djece u Varaidinu i 100 desetogodisnje inuSke djece u Zagrebu, t,e smo naSli da su u prosjeku zagrebkka d,jeca visa od varaidinske, onda - pod pretpostavkom da je mjerenje izvrSeno bez pogresaka - * n,emrr. nikakve sumnje da su izmjerena varaidinslta djeca u prosjeku niia od izmje- rene zagrebatke djece. Ili, ako smo primijenili neltu riovli terapiju na odredeni broj bolesnika, i usporedili trajanje bolesti s kontrolnom grupom bolesnika, lijetenom na Itlasitan naCin, pa smo naSli da su bolesnici, lijeteni novim postupkom, ozdravili u pros,jeku za krade vrijeme - onda je to kod promatranih bolesnika sigurno tako. Talcoder, alto snlo naSli da djeca, koja iive u teSkini ekonornskim prilikama, u pros,jeltu irnaju slabiji Sltolski uspjeh od djece koja iive u obiteljiina bez ekonomskih t,eSltoCa --- taltoder nema sumrlje da je to totno kod djece na ltojoj smo mjerenje izvrsili. No, nas u oviin slutajevima zapravo t,oliko ne zarlima jesu li ova konkretna zagrebaCla djeca visa od varaidinske, ili jesu li ovi ko~nkretni bolesnici ozdravili brie od druge grupe, ili jesu li konkre tn ,~ ispitivana djeca iz ekonornski ugroiene sredine slabi.ji utenici. Ono Sto nas zanima jest, ponaiprije to m o i e m o li m i i z t ih pojedi- naEnih slu,Eujeva zakl j~~Civati opc'enito, tj. moBemo li na temelju izvrSenog mjerenja zaltljutiti d a su opc'enito zagrebacki 10-godiSnji d,jetaci viSi od svojih varaidinskih vrsnjaka, da nova nietoda lijetcnja opc'enito u prosjeku skratuje trajanje bolesti,

Page 5: ZaSto statistika? - zaf.biol.pmf.unizg.hrzaf.biol.pmf.unizg.hr/behaviour/Zasto statistika.pdf · djeteta medu drugom djecom. Ili, prilikom klasifikacijskih ispita za upis na neki

kao i je li ekonomska ugroienost opCenito povezana sa slabijim uspjehom djeteta u Skoli.

Kako vidimo, ovdje iz pojedinatnog slutaja ielimo zakljutiti na neku pojavu, koja je moida opCz zakon. Drugim rijetima, u svim takvim slueajevima (a t o je gotovo redovita pojava pri istraiivatkom radu!) mi zapravo ielimo i z pojedina6nog zakljuCiti n u opc'enzto.

"Inferencijalna statistika", tj. onaj dio statistiEkih postupaka koji nam omogutuje stvaranje zakljutaka, omoguCuje nam da ustanovima smijemo li ili ne smijemo nadenu pojavu smatrati generalnom, dakle opCevaieCom. DoduSe, kao Sto Ce se vidjeti, potpuna, "100%-trla" sigurnost u statistitkim je zakljueivanjima prakticki nemoguta, ali pri zakljutivanju ipak moiemo postiki sigurnost koja je blizu sigurnosti od 100%.

Uostalom, o problemima zakljutivanja u statistici bit Ce joS govora, i tom je pitanju posveCeno jedno Eitavo poglavlje u ovoj knjizi.

Kao Sto se logiEki i moie otekivati, inferencijalna statistika je to "opreznija" u zakljutivanju Sto smo na manjem broju podataka neke rezultate dobili. Napro- tiv, Sto je broj podataka veCi, to moiemo vise biti sigurni da dobiveni rezultati vrijede i "inate", a ne samo u slutaju koji smo izmjeri' . ~ i sve to, naravno, pod pretpostavkom da je "uzorak" na kojem smo mjerenje izvrSili reprezentatzvan za grupu kojoj t a j uzorak pripada, tj. da uzorak nije "pristran". Kada bismo, na primjer, izabrali samo najbolje utenike iz nekog razreda pa im izmjerili znanje matematike, onda rezultat, dakako, ne bi bio "reprezentativan" za cijeli razred. Kada bismo, primjerice, ieljeli dobiti podatak o prosjetnim osobnim dohocima zagrebaekih gradana, pa kada hismo iz telefonskog imenika nazvali svakog 50. pret- platnika i traiili od njega podatke o dohocima, Eak i onda kad bi nam svi upitani dali toFne podatke, ne bz n a m dobzvenz rezultatz dalz zspravnu slzku, jer naS uzorak nije dovoljno "reprezentativan" za pojam "gradanin Zagreba": u naSem se uzorku nalaze samo vlasnici telefona, a moiemo biti sigurni da prosjetni dohoci tih ljudi nisu jednaki prosjeeni~n dohocima onih gradana koji nemaju telefona.

Kalco u inferencijalnoj stat,istici problem uzorka i njegove reprezentativnosti ima primarno znatenje (jer svi zakljutci, koje iz dobivenih rezultata izvodimo, vrijede samo onda ako je uzorak pravilno izabran), mnogi statistitari inferencijalnu statistiku nazivaju jog i "statistikom uzoraka".

Ad 4. Planzranje zstraizvanja i eksperzmenata. Poznavanje statistitkih metoda rnoie istraiivaeu dosta pomoCi pri planiranju istraiivanja odnosno izrade nacrta eksperimenta. Spomenut Cemo iz toga podrutja samo dva primjera:

a) pitanje eksperimentalne i kontrolne skupine i b) pitanje veliEine uzorka. - Kao Sto je poznato, efekt nekoga odredenog djelovanja moiemo provjeriti samo

onda ako smo istodobno ispitivali i sluEajeve bez utjecaja tog djelovanja. Ako nas zanirna ima li neki lijek odredeni utjecaj na neku bolest, moramo njegovo djelo- vanje usporediti sa slueajevima kada ta j lijek nije primijenjen. U eksperimentalnom radu skupinu na kojoj provjeravamo efekt neke metode nazivamo eksperzmental- n o m skupinom, a onu na koju metoda nije primijenjena, kontrolnom skupinom. No kontrolna i eksperimentalna skupina moraju biti medusobno Sto slitnije u svim

Page 6: ZaSto statistika? - zaf.biol.pmf.unizg.hrzaf.biol.pmf.unizg.hr/behaviour/Zasto statistika.pdf · djeteta medu drugom djecom. Ili, prilikom klasifikacijskih ispita za upis na neki

onim svojstvima koja bi mogla imati utjecaj na ono Sto ispitujemo; na ta j naEin je- dina razlika izmedu obiju skupina bit Ce to da smo na jednu primijenili, a na drugu nismo primijenili neki postupak. Na primjer, ispitujemo li neku novu metodu uEenja stranog jezika, onda Cemo t u metodu usporediti s efektom neke druge (do sada upotrebljavane) metode, ali ispitanici eksperimentalne i kontrolne grupe moraju biti medusobno Sto sliEniji po starosnoj dobi, Skolskom obrazovanju, predznanju iz tog jezika, itd. Jednako tako, ako ispitujemo neku novu kirurSku tehniku, ispitanici eksperimentalne i kontrolne grupe moraju biti medusobno "komparabilni" po teiini oboljenja, po starosnoj dobi i drugim faktorima koji bi mogli biti u vezi s boleSCu ili s faktorima rezistencije.

Dok je u laboratorijskim ispitivanjima (relativno) lakSe provesti takvo iz- jednaEavanje eksperimentalne i kontrolne skupine (jer pri laboratorijskim eksperi- mentima obitno moiemo prethodno pailjivo sastaviti kontrolnu i eksperimentalnu grupu od ispitanika sa sliEnim karakteristikama), dotle je to Cesto vrlo teSko provesti npr. u lclznzCkom radu, u praktitnom radu industrijskog psihologa, i uopCe u radu "na terenu", gdje ne moiemo po volji sastavljati uzorak, nego smo prisiljeni raditi na tzv. "prigodnom" uzorku, tj. na uzorku kojim jedino raspolaiemo.

Jedno od vainih pitanja pri planiranju nekog istraiivanja - u kojem katkada dolazi do nesporazuma izmedu poEetnika i iskusnog statistiEara - jest pitanje veliFine uzorlca. PoEetnik, oEekujuCi od statistiEara gotove "recepte" za neke svoje postupke, obieno se iskreno razocara kada mu statistiear na njegovo pitanje koliko velik uzorak da uzme za neko istraiivanje, odgovori da - ne zna!

Potrebna veliEina uzorka zavisi naime od vise faktora, od kojih neki ne moraju uopCe biti poznati prije poEetka pokusa ili istraiivanja. Evo glavnih faktora: - ~ e l j e n a preczznost rezultata: Sto nam je veCa preciznost potrebna u nekom

istra%ivanju, t o je potreban i veCi uzorak. - Varzjabilnost pojave, koju ispitujemo: kada neka pojava uopCe ne bi varirala

(tj. kada bi svi Elanovi neke populacije imali identiEnu kolitinu one karakteris- tike koja nas zanima), bio bi dovoljan uzorak veliFine 1, jer bismo s tim jednim podatkom vet znali sve o pojavi koju mjerimo. Iz toga slijedi da je potreban to veCi uzorak Sto pojava, koju istraiujemo, vise varira. Kako, primjerice, Eovjekova teiina mnogo viSe varira od Covjekove tjelesne temperature (kao Sto Cete vidjeti u poglavlju "Mjere varijabilnosti", u teiini ljudi variraju preko 30 puta vise nego u tjelesnoj temperaturi!), iz toga slijedi da bi nam za dobivanje podataka o prosjetnoj tjelesnoj temperaturi (zdravih) ljudi bio dovoljan znatno manji uzorak nego za do- bivanje podataka o prosjeEnoj teiini. - Frelcvencija pojave: Sto je pojava, koju ispitujemo, opCenito rjeda, to je veCi

uzorak potreban; kod vrlo rijetkih pojava potrebni su zato vrlo veliki uzorci. Evo primjera: ako bi netko ielio ispitati neko novo cjepivo protiv poliomielitisa, pa bi, uzmimo, skupinu od 100 djece cijepio klasitnom vakcinom, a drugu, podjednako veliku skupinu, cijepio tim novim cjepivom, vrlo vjerojatno bi se dogodilo da ni u jednoj ni u drugoj grupi nijedno dijete ne bi oboljelo!

SliCna se pojava moie dogoditi praktiEarima (psiholozima ili 1ijeEnicima) koji u nekoj maloj radnoj organizaciji ispituju, na primjer, razliku izmedu mladih i stari,jih radnika u frekvenciji nesreCa pri radu. Naprotiv, da smo u prvom sluEaju

Page 7: ZaSto statistika? - zaf.biol.pmf.unizg.hrzaf.biol.pmf.unizg.hr/behaviour/Zasto statistika.pdf · djeteta medu drugom djecom. Ili, prilikom klasifikacijskih ispita za upis na neki

uzeli, pretpostavimo, u svaki uzorak oko 100 000 djece, onda bi se moida dogodilo da ih je u uzorku kontrolne grupe oboljelo 15-20, a u uzorku eksperimentalne grupe nijedno dijete - pa bismo na temelju toga, nakon potrebne statistieke obrade - vjerojatno vet mogli zakljutiti neSto o korisnosti novog cjepiva.

DjelomiEno u vezi s pitanjem velitine uzorka jest i pitanje o razlikama u veliCini izmedu kontrolnog i eksperimentalnog uzorka. JoS donedavno statistieari nisu ovdje postavljali nikakve posebne zahtjeve, jer same formule dopuStaju da medu uzorcima budu bilo koje razlike u veliEini. No, u novije vrijeme utvrdeno je da je znatno bolje ako su oba uzorka pribliino jednake veliEine (o tome Ce joS biti govora u ovoj knjizi u poglavlju "Razlika izmedu dvije aritmetiEke sredine"), pa se u tom sluEaju Cak mogu krSiti neka pravila u racunima, u vezi s uvjetima, potrebnim za primjenu neke metode, a da pri tome rezultati ipak budu pouzdani i upotrebljivi.

Sva ova 4 nivoa korisnosti poznavanja statistike rezultiraju glavnom koristi koju suvremeni Eovjek ima od statistike, a t o je usvajanje statistzc'kog nac'ina miSljenja, tj. usvajanje odredene tehnike misljenja i rada, bez koje zapravo nema znanstvenog miSljenja.

~ e s t o se mogu Cuti izjave otprilike ovog sadriaja: " Jedino statistiCki obradeni podaci mogu imati znanstvenu vrijednost." To je totno, ali to, dakako, ne znaCi da statistiCka obrada garantzra znanstvenu vrijednost podataka. Ili - kako h i e Blalock - "statistika moie biti samo pomoC, ali nikada zamjena za zdrav razum". StatistiEka je obrada samo nbetoda obrade podataka, ali nam ona ne moZe jamCiti da je skupljanje podataka ispravno provedeno, ili da je Eitavo istraiivanje dobro planirano. Bit Ce joS dosta prilike u ovoj knjizi za primjere koji Ce pokazati Eak zloupotrebu statistike radi nenamjernog ili Eak,namjernog zavaravanja javnosti. Jer, i potpuno izmigljeni podaci, mogu se statisticki obraditi! No za to, naravno, ne treba optuiivati statistiku, nego onoga tko je primjenjuje; ako netko kirurskim noiem izvrSi zloEin i nekoga ubije, nije noi za to odgovoran. Ili, ako netko uz pomoC statistike objavi neku lai, nije za to kriva statistika: statistika ne laie, nego laiu ljudi.

Katkada moiemo Euti miSljenje da su fizikalne znanosti mnogo "egzaktnije" znanosti od znanosti koje se bave iivim biCima (biologija, medicina, psihologija, sociologija, antropologija i dr.). Ove druge zbog toga se katkada zovu "statistieke znanosti". Medutim - prema misljenju Virginije Senders - razlika izmedu jednih i drugih znanosti sastoji se u sljedeCem:

1. Varzjabzlnost veCine fizikalnih zakona obiEno je tako malena da ne maskira po- javu koju istraiujemo. Naprotiv, varijabilnost iivotnih pojava, tj. zivog materijala, katkada je toliko velika da oteiava pronalaienje zakonitosti.

2. Druga se razlika sastoji u tome Sto se od onih znanosti koje se have iivim biCima, Eesto zahtijeva prognoza o funlccioniranju i ponaSanju jednog individuuma, dok se od fizike rijetko zahtijeva da dade prognozu o jednoj jedinoj molekuli ili atomu. Kada, na primjer, sociolozi i psiholozi daju prognozu o velikoj skupini ljudi, oni to Eine uspjesno, Sto pokazuju toEna predvidanja o pribliinom broju prometnih nesreCa za neke blagdane, o broju glasata na izborima i o ishodu glasovanja i sl. *4li te znanosti ne mogu dati (osirn u nekim rijetkim slutajevima) sigurnu prognozu Sto Ce neki odredeni pojedinac uEiniti ili Sto Ce se s njime dogoditi: ako predvidimo

Page 8: ZaSto statistika? - zaf.biol.pmf.unizg.hrzaf.biol.pmf.unizg.hr/behaviour/Zasto statistika.pdf · djeteta medu drugom djecom. Ili, prilikom klasifikacijskih ispita za upis na neki

da Ce 80% glasaEa glasovati za nekog kandidata, mi, na ialost, ne moiemo mnogo reCi o tome kako Ce neki odredeni pojedinac glasovati; ako znamo da neki novi lijek u prosjeku vrlo uspjeSno lijeCi neku bolest, mi ipak ne moiemo garantirati da Ce i po jed i~ac N. N. biti pomoCu tog lijeka izlijeten. Medutim - misli Senders - razlika izmedu tih dvaju podruEja znanosti samo je prividna, jer fiziEar moie s velikom preciznoSCu odrediti koliko Ce se od jednog grama radija raspasti u toku deset godina, ali hi se vrlo zaCudio kada bismo mu postavili pitanje neka toeno kaie kada Ce se raspasti neki odredeni, toEno definirani atom. A upravo t o se Eesto zahtijeva od drustvenih znanosti i od medicine! (Takav individualni pristup stoga i nazivamo " kliniEkim" pristupom, za razliku od " statistiEkog" pristupa, tj. pristupa preko velikog broja.)

Kao Sto je poznato, u javnosti u velikoj mjeri postoji " alergitnost' prema stati- stici, ne samo medu laicima nego Eesto i medu strucnjacima razlieitih struka. Na primjer, kada se studenti nekih druStvenih ili prirodno-druStvenih znanosti (socio- logija, psihologija) iznenade Sto moraju sluSati i polagati statistiku, oni to Cesto komentiraju rijeCima da su ta j studij upisali upravo zato Sto ne vole i ne znaju - matematiku. Dakle, poistovjeCuju statistiku s matematikom. ,

No, podimo redom, i pokuSajmo nabrojiti glavne razloge toga negativnog stava velikog broja ljudi prema statistici.

1. Iskrivljeno i odvec' simplificirano znaEenje pojma "statistika" ; mnogi, naime, ta j izraz upotrebljavaju za oznaCavanje tabliEnog pregleda nekih ispitanih podataka. Kada takvi ljudi kaiu "imam statistieke podatken, pokaiu vam tablice, u kojima se pregledno vide sume u svakoj kategoriji! Naravno, takva je "statistika" do mak- simuma suhoparna i dosadna, pa je ljudi izbjegavaju.

2. Mnogi su ljudi frustrirani pred statistikom zbog njezinog za njih nerazu- mljivog jezika, a naroEito zbog nepozn,atih simbola, na koje u statistici nailaze. No, svaka znanost ima svoje simbole, koji nisu nigta "ezoteriCnon, nego predstavljaju skraCeni i praktitniji sustav komuniciranja, koji onome koji t a j "jezik" poznaje, predstavlja jednako tako normalne rijeCi kao i sve ostale rijeCi. Kao Sto laika mo- gu impresionirati izrazi RR, SE, bilirubin, EEG, vitalni kapacitet ili, na primjer, G-faktor, satija,cija, semantieki diferencijal, IE-test (prvi od tih izraza koriste se u medicini, drugi u psihologiji), tako ga, dakako, mogu impresionirati i izrazi kao Sto su, primjerice, varijanca, X, hi-kvadrat, P < 0,05, standardna pogreSka i dr., a koji pripadaju statistici, i nisu niSta vise "ezoteriEnin od onih drugih izraza. Treba, doduSe, priznati da poCetnika u statistici moie osobito obeshrabriti 6njenica Sto svi statistiCki simboli nisu joS uvijek unificirani pa za isti pojam razliCiti autori Cesto joS upotrebljavaju razlieite simbole (na primjer, aritmetitku sredinu neki piSu znakom M, neki A. M., neki y, itd.). No sliEnih pojava, iako vjerojatno u manjoj mjeri, ima i u drugim znanostima.

3. Mnogi ljudi - a to je vjerojatno i glavni razlog alergicnosti prema statistici - smatraju da je statistiku nemoguc'e razu.mjeti i svladati bez znanja matemntike.

To, medutim, nije toEno! Glavni se statistieki principi i naEin miSljenja mogu usvojiti potpuno logiEkim putem, a od "matematike" je potrehno znati samo 4 osn,ovne operacije, dakle zbrajanje, oduzimanje, mnoienje i dijeljenje. DoduSe, u statistiCkim je raCunima Festo pot,rebno vaditi i drugi korijen, no za ta j posao

Page 9: ZaSto statistika? - zaf.biol.pmf.unizg.hrzaf.biol.pmf.unizg.hr/behaviour/Zasto statistika.pdf · djeteta medu drugom djecom. Ili, prilikom klasifikacijskih ispita za upis na neki

gotovo u svim satistitkim udibenicima postojale su tablice u dodatku. A danas za takve sluEajeve postoje elektronska diepna ratunala.

U jednoj anegdoti, ltoju spominje veC prije citirani Mainland, neki matematicar, koji se specijalizirao u matematici vjerojatnosti, ustvrdio je da znade naEin kako da sprijeEi prehladu: kad bi osjetio da mu se sprema prehlada, on bi uvete prije spavanja uzeo jedan lijek, i drugog jutra prehlade nije bilo. Njegova supruga je medutim ustvrdila da to nije nikakav dokaz, jer da on zapravo ne zna Sto bi se dogodilo da ta j lijek nzje uzeo. Za razliku od svog supruga, ona je - kaie Mainland - primijenila statistieki natin rezoniranja i ilustrirala Einjenicu da statistika i nije dio matematike.

Matematika je potrebna samo za profeszonalne statisticare, tj. za one koji stati- stiku i njezine metode stvaraju, jer oni neke statistieke zakone moraju izraziti matematitkim putem i tako stvoriti formulu pomoCu koje se neSto u statistici izratunava. No matematika nije potrebna za przmjenu tih postupaka, dakle za one koji statistiku koriste samo lcao jednu od metoda u svom radu. SliCno kaie i statistiear Levinsou: "Nije moguCe biti profesionalni statisticar u doslovnom smislu te rijeti bez dobrog poznavanja vise matematike. No nije potrebno biti profesionalni statistiEarl pa da bi se znala razlika izmedu dobrih i loSih statistitkih postupaka, i da bi se pametno koristile postojeCe statistieke metode". BuduCi da statistika ko- risti postupke ltoje su zzradzlz matematieari, to je u statistici matematika upadljivija nego u nekim drugim disciplinama, i to poEetnika zavodi. PoEetnik Eesto smatra da zato Sto ne moie razumjeti kako je nastala neka formula koju on koristi, ne moie razumjeti ni statistitki natin rezoniranja. No to, naravno, nije tako, Sto Cemo lako dokazati: automobil postoji zato da ga netko vozz; svi poznamo bolje i loSije vozaFe, a i one koji - kako kaiemo - odlieno voze. Vjerojatno nema nikoga tko bi ustvrdio da odlitan vozaE moie biti samo onaj koji potpuno i detaljno razumije konstruk- ciju i funkciju motora! Jednako tako je i u situacijama u kojima se sluiimo npr. televizorom, radiom, elektrokardiografom, orto-raterom, mikroskopom, aparatom za mjerenje bazalnog metabolizma, itd., itd. Sve te aparate moiemo vrlo korisno i mudro upotrebljavati a da ne znamo mnogo o mehanici, optici, elektronici, itd. Uostalom, koliko ljudi znade po ltojem principu funkcionira i kako se konstruira neko PC ratunalo? P a alto to ne znamo, zar se ne moiemo tim raEunalom vrlo usp je ino sluiztz?!

Dakle, u svim navedenim sluEajevima mi razumijemo moida samo neke os- novne principe konstrukcije i funkcioniranja pojedinog aparata, ali ono Sto treba da potpuno razumzgemo, t o ge naEzn upotrebe z sztuacije u kogzma takav uredag treba upotrzjebzt~. Takav jednaki zahtjev postavlja se i na "konzumenta" statistike, tj. on statistitke metode treba s razumijevanjem primijeniti na pravom mjestu. Statistieke su metode - kaie jedan statistiear - za znanstvenog radnika ono Sto je alat za tesara. On prvo treba nautiti kako Ce svoj alat upotrebljavati, a nakon toga moie - upotrebom tog alata - postiki lijepe rezultate. Ali sam alat mora biti upotrijebljen na pravom mjestu. Obrtnik neCe npr. upotrijebiti batik, dlijeto ili malu rezbarsku pilicu da bi blanjao dasku, niti Ce upotrijebiti CekiC da bi uvrnuo neki vijak. Jed- nako tako treba i znanstveni radnik upotrebljavati statistieke metode samo za ono za Sto su predvidene, i pri tome treba znatz Sto radz. Upravo u tom zahtjevu katkada

a

Page 10: ZaSto statistika? - zaf.biol.pmf.unizg.hrzaf.biol.pmf.unizg.hr/behaviour/Zasto statistika.pdf · djeteta medu drugom djecom. Ili, prilikom klasifikacijskih ispita za upis na neki

dolazi do nesporazuma: poneki student, koji je pogrijeSzo u raEunu, buni se Sto mu t a pogreSka snizuje ocjenu, jer - kako on kaie - t a pogreSka nema veze sa znanjem i razumijevanjem statistike. Zaista, Eesto i nema veze, i u takvim sluEajevima ona se obiEno i ne penalizira strogo. No, ako t a pogreSka dovede do rezultata koji je besmislen ili logiEki naprosto nemoguc', a onaj tko je pogreSku uEinio, to ne primijeti - onda se vise ne radi o "Eistoj" ratunskoj pogregci, nego o teioj pogreSci, a koja se sastoji u tome da zapravo ne znamo i ne razumijemo Sto radimo!

PoCetnika nematematieara donekle u statistici moie obeshrabriti i Einjenica - sliCna veC spomenutoj pojavi upotrebe razliEitih simbola - da su pojedini statistitki raEunski postupci u razlititim statistitkim udibenicima prikazani "razliCitimn for- mulama. No, zapravo ne radi se o razliEitim formulama, nego samo o razliEitim transformacijama iste formule - Sto Ce matematiearu dakako odmah biti jasno, ali Sto nematematiEara moie frustrirati. Zaista, ne moramo nematematieara kriviti ako ne prepozna da je izraz

isto Sto i izraz

1 ili da 5lI2 znaEi &, ili da 5-' znaEi -

5' '

U ovoj se knjizi pokugava osnovne statistieke postupke i principe protumaEiti Sto je vise moguCe 1ogiEkim putem. ~ i t a o c i Ce katkada naiCi na slueajeve da se iza neke formule navodi neka druga, praktitnija formula, kojom se isti statistieki postupak moie provesti pa Ce opravdano postaviti pitanje Cemu je prvu formulu trebalo uopCe navoditi. Medutim, to je uCinjeno u svim onim sluEajevima kada prva formula logiCki slijedi iz dotadaSnjih izlaganja. Tek kad je to shvaCeno, opravdano je prijeCi na drugu, praktiCniju formulu, koja zapravo predstavlja matematiEki ekvivalent prvoj formuli.

Ova je knjiga prvenstveno namijenjena onima kojima je "matematika" glavni razlog zbog ltojeg ne vole statistiku. Kao Sto je vet reCeno, u osnovnim statistitkim postupcima, koji su prijeko potrebni svakom znanstvenom radniku bilo koje struke, matematike zapravo nema - iako bi je naravno moglo biti kada bi struenjak ielio uvijelt do kraja shvatiti postanak neke formule.

Autor ovog udibenika - i Sam nematematiEar - stjecao je svojedobno "meto- dom vlastite koie" iskustva s osnovnim teSkoCama na koje nematematieari nailaze u statistici. A kasnije, imao je prilike i na drugim ljudima godinama pratiti, prilikom nastave statistike, razliEite vrste teSkoCa s kojima se sukobljuje nematematiear u susretu sa statistikom. I zato je teSkoCe ove vrste nastojao prebroditi na najbezbol- niji naEin sluieCi se - Sto je vise bilo moguCe - logiCkim zakljuCivanjem i praktiEnim primjerima.

I, na kraju, jog jedna vaina primjedba: rekli smo da automobil moiemo dobro voziti i bez nekog naroEitog poznavanja mehanike i elektrike njegovih uredaja. Jed-

Page 11: ZaSto statistika? - zaf.biol.pmf.unizg.hrzaf.biol.pmf.unizg.hr/behaviour/Zasto statistika.pdf · djeteta medu drugom djecom. Ili, prilikom klasifikacijskih ispita za upis na neki

nako tako statistiku moEemo vrlo uspjeSno upotrebljavati i bez poznavanja mate- matike. Ali automobil neCemo naueiti uz porno6 Eitanja o tome kako se automobil vozi ili uz pomoC predavanja o toj temi! Automobil treba voziti. Jednako tako svatko tko ima iskustva s praktiEnim radom na nekom osobnom ratunalu, veoma dobro - znade da se uspjeSna upotreba racunala moie postiCi jedino praksom, tj. Eestim radom na raEunalu. Isto tako niti statistiku neCemo nauEiti samo uz pomoC Eitanja knjiga ili sluSanja predavanja. I statistitki rad, tj. prakt i tno provodenje pravila i zakona koje smo logitki mogli posve razumjeti, jest vjeStina ko ju treba u praksi uvjedbavati.

U tu svrhu na kraju veCine poglavlja dani su Eitaocu primjeri i zadaCe za vjezbu. Ako zaista ielite nauEiti statisticku metodologiju, onda nemojte zaboraviti da ti zadaci postoje upravo zato da biste stekli odredenu "rutinu" u statistiEkim vjegtinama. Na kraju knjige naCi Cete rjeSenja tih zadataka, pa Cete tako moCi provjeriti do kojeg ste stupnja potrebne vjestine usvojili.