knjiga SPSS analiza

Univerzitet u Beogradu

Tehniki fakultet u Boru

Dr Dragan Manasijevi

Statistika analiza u SPSS programu(autorizovana predavanja)

Bor, 2011

2Sadraj1. Uvod u SPSS1.1. Priprema radnog fajla1.2. Unos podataka u radni list

2. Deskriptivna statistika2.1. Uvod2.2. Deskriptivna statistika analiza u SPSS-u2.3. Unakrsno tabeliranje

3. Grafiko prikazivanje statistikih rezultata3.1. Stubiasti dijagram3.2. Histogram3.3. Linijski dijagram3.4. Dijagram rasprenosti

4. Analiza pitanja sa viestrukim odgovorima (Multiple Response)

5. Uvod u analitiku statistiku5.1. Statistiko ocenjivanje5.2. Testiranje statistikih hipoteza5. 3. Testiranje pretpostavke normalne raspodele osnovnog skupa u SPSS-u5.4. Testiranje hipoteze zasnovano na jednom uzorku (One-Sample T-test)

6. Testovi za ispitivanje razlika izmeu grupa6.1. T test za nezavisne uzorke (T-Test for Independent Groups)6.2. T test za zavisne uzorke (Paired-Samples T-Test)6.3. Analiza varijanse sa jednim faktorom (ANOVA) (One-Way Analysis of Variance)6.4. Viefaktorska analiza varijanse (Factorial Analysis of Variance)

7. Tehnike za istraivanje veza izmeu raznih obeleja7.1. Korelaciona analiza primenom SPSS-a7.1.1. Uvod7.1.2. Pearsonov koeficijent proste linearne korelacije (Pearson product moment correlation coefficient)7.1.3. Spearmanov koeficijent korelacije ranga (Spearman Rank Order Correlation Coefficient)7.2 Linearna regresija primenom SPSS-a7.2.1. Uvod7.2.2 Primeri7.3. Viestruka regresija primenom SPSS-a7.3.1 Uvod7.3.2. Primeri

8. Faktorska analiza primenom SPSS-a8.1. Uvod8.2. Primer

9. Klaster analiza primenom SPSS-a9.1. Uvod9.2 Primer

10. Neparametarske tehnike10.1. Hi-kvadrat nezavisnosti10.2 Man-Vitnijev U test10.3. Vilkoksonov test ranga10.4. Kruskal-Volisov test

11. Provera pouzdanosti merne skale

12. Literatura

31. Uvod u SPSS

SPSS (Statistical Package for the Social Sciences) je statistiki softverski paket u

kome su implementirani gotovo svi konvencionalni statistiki metodi. Najnovija verzija je

18.0 ali vano je znati da, kada je u pitanju ovaj softverski paket, sama verzija ne predstavlja

neku preterano vanu karakteristiku s obzirom na to da svaka verzija ovog softvera

predstavlja dovoljno moan alat, koji sam po sebi zasluuje panju.

Osnovna prednost ovog softverskog paketa jeste nain na koji je osmiljena realizacija

same statistike analize. Bez obzira na to o kojoj se vrsti analize radi, do konanih rezultata se

uvek dolazi kroz etiri jednostavna koraka:

Faze statistike obrade podataka u SPSS-u

41.1. Priprema radnog fajla

Pretpostavimo da je sprovedeno istraivanje studenata jednog fakulteta u cilju

odreivanja njihovog zadovoljstva nastavom na fakultetu i njihovim uspehom na studijama.

Odgovori 20 sluajno izabranih ispitanika su prikupljeni primenom anketnog lista sa sledeim

pitanjima:

1. Pol (zaokruiti): 1. Muki 2. enski

2. Starost (upisati broj godina) ___________

3. Godina studija (zaokruiti): 1. godina 2. godina 3. godina 4. godina

4. Kako bi ste ocenili kvalitet nastave na fakultetu (zaokruiti jedan od ponuenih odgovora):

1. Veoma lo

2. Lo

3. Prosean

4. Dobar

5. Veoma dobar

5. Koliko ste zadovoljni vaim dosadanjim uspehom na studijama (zaokruiti jedan od

ponuenih odgovora):

1. Veoma nezadovoljan

2. Nezadovoljan

3. Ni nezadovoljan ni zadovoljan

4. Zadovoljan

5. Veoma zadovoljan

5Kodiranje podataka

Pre samog unosa podataka u program neophodno je izvriti kodiranje podataka.

Kodiranje obuhvata definisanje imena varijabli i dodeljivanje brojanih vrednosti odgovorima

na pitanja iz upitnika. Naredna tabela prikazuje kodiranje podataka za dato istraivanje.

Kodiranje podataka:

Broj pitanja Varijabla Ime varijable u

SPSS-u

Kod

1. pitanje Pol ispitanika Pol 1=muki

2=enski

2. pitanje Starost ispitanika Starost Broj godina

3. pitanje Godina studija Godina 1=1. godina

2=2. godina

3=3. godina

4=4. godina

4. pitanje Ocena kvaliteta nastave Kvalitet 1=veoma lo

2=lo

3=prosean

4=dobar

5=veoma dobar

5. pitanje Zadovoljstvo dosadanjim

uspehom

Uspeh 1=veoma

nezadovoljan

2=nezadovoljan

3=ni nezadovoljan ni

zadovoljan

4=zadovoljan

5=veoma zadovoljan

6Prikupljeni podaci

Naredna tabela prikazuje odgovore prikupljene anketiranjem 20 ispitanika:

Pol Starost Godina Kvalitet Uspeh

2 19 2 2 2

1 22 3 3 5

2 24 4 4 4

2 22 2 2 2

1 20 2 3 2

1 23 2 3 1

1 19 1 5 4

2 24 3 3 3

2 26 4 2 3

1 24 3 1 2

1 22 3 4 3

2 21 2 4 2

1 24 4 3 5

1 21 2 4 2

2 24 3 4 3

2 22 3 4 5

1 26 3 2 1

1 22 2 3 3

1 24 3 4 3

2 22 2 3 2

7Kreiranje radnog fajla u SPSS-u

Sledei koraci demonstriraju kako se prikupljeni podaci prikazani u prethodnoj tabeli

unose u radni fajl SPSS-a.

Kada se startuje SPSS program pojavljuje se sledei prozor.

Poto elimo da kreiramo novi fajl sa podacima zatvaramo prozor.

8Pojavljuje se Untitled SPSS Data Editor prozor:

Koristei pripremljenu knjigu kodova unosimo imena varijabli i njihove karakteristike.

(Type, Width, Decimals, Label, Values, Missing, Columns, Align, and Measure)

Na primer, varijabla Pol je kodirana kao 1-muki i 2-enski. U prvoj eliji ispod Name se

unosi ime prve varijable Pol. Da bi se varijabli dodelile kodirane vrednosti odgovora potrebno

je kliknuti na odgovarajuu eliju ispod Values. Dobija se:

Klikom na oseneni deo elije dobija se sledei Value Labels prozor:

Unesite 1 u polje Value i unesite Muki u polje Value Label. Klik na Add polje da bi se

zavrio unos kodova za muke ispitanike. Zatim se postupak ponavlja za enske ispitanike.

Popunjeni Value Labels prozor ima sledei izgled:

9Klikom na OK zavravamo unos podataka za varijablu Pol i vraamo se na Untitled SPSS

Data Editor list.

Ovaj postupak se ponavlja za sve preostale varijable.

Varijabla Starost je kontinualna varijabla i kao takva ona nema kodirane vrednosti odgovora.

U polju Label mogu se uneti potpuniji nazivi varijabli kako je prikazano:

10

1.2. Unos podataka u radni listPrikupljeni podaci se unose preko Data View prozora. Preite sa Variable View prozora na

Data View klikom na Data View.

U Data View prozoru redovi predstavljaju ispitanike a kolone varijable. Primer unetih

podataka je dat na donjoj slici:

11

2. Deskriptivna statistika

2.1. UvodStatistiki metodi istraivanja masovnih pojava mogu se podeliti u dve osnovne grupe.

Jedna obuhvata metode prikupljanja, sreivanja i prikazivanja podataka i metode odreivanja

parametara. Ona spada u domen deskriptivne statistike.

Drugu grupu sainjavaju metodi statistike analize, iji je osnovni zadatak objanjenje

varijabiliteta pomou klasifikacionih, korelacionih i drugih statistikih pokazatelja, kao i

statistiko zakljuivanje na osnovu uzorka. Ovim metodama bavi se analitika statistika,

koja se, meutim, ne moe strogo razgraniiti od deskriptivne statistike.

Ceo proces statistikog istraivanja, prema tome, moe se svesti u tri osnovne etape:

1) statistiko posmatranje, 2) sreivanje, grupisanje i obrada podataka i 3) statistika analiza.

Ispitivanjem odreene pojave na svim jedinicama statistikog skupa dobijamo mnotvo

statistikih podataka. Prisustvo mnotva brojanih podataka, bez obzira kako su ureeni

priinjava tekoe u pogledu dobijanja jedinstvene, jasne, koncizne i celovite predstave o

pojavi koju posmatramo. Zato nastojimo da seriju podataka zamenimo jednom ili veim

brojem numerikih karakteristika koje bi pruile to vie informacija o skupu i reprezentovale

skup. Pokazatelje rasporeda frekvencija koji pokazuju ceo osnovni skup nazivamo

parametrima skupa i svrstavamo ih u tri grupe. Jednu sainjavaju srednje vrednosti, kao mere

centralne tendencije rasporeda; drugu mere disperzije (rasprenosti), i treu mere oblika

rasporeda.

Pokazatelji rasporeda frekvencija reprezentuju skup ili uzorak, odnosno pripisuju se

skupu ili uzorku u zavisnosti da li se analizira raspored frekvencija skupa ili raspored

frekvencija uzorka. Deskriptivne mere koje se odnose na sve jedinice skupa nazivaju se

parametrima skupa, a deskriptivne mere koje se odnose na uzorak su statistike uzorka.

12

Mere centralne tendencije

Srednja vrednost je pokazatelj centralne tendencije i pokazuje lokaciju skupa. Srednja

vrednost se koristi u svim oblastima statistike analize. U zavisnosti od naina odreivanja

centralne vrednosti obeleja skupa srednje vrednosti se dele na: izraunate (aritmetika,

geometrijska, harmonijska, kvadratna, kubna), koje se izraunavaju na osnovu svih vrednosti

obeleja i pozicione (modus i medijana), koje se odreuju poloajem u seriji. Koja e se

vrednost uzeti kao parametar statistikog skupa zavisi od posmatrane pojave i od naina

grupisanja podataka.

Aritmetika sredina

Najiru upotrebu u statistikoj analizi stekla je aritmetika sredina ili, kako se popularno

zove prosek. Aritmetika sredina skupa se dobija kad se zbir svih vrednosti obeleja podeli

njihovim brojem. Ako je posmatrano obeleje X, njegove vrednosti x1, x2,..,xi,..,xN njihov broj

N, aritmetika sredina skupa, koju emo oznaiti sa m, dobie se kao:

=

=+++=N

ii

N xNN

xxx1

21 1...m ili uproenoN

x=mAko na pet ekonomskih fakulteta broj upisanih studenata u prvu godinu studija iznosi 820,

830, 860, 880 i 910, prosean broj upisanih, odnosno, aritmetika sredina bie:

8605

43005

910880860830820 ==++++== N

xm

Za uzorak, veliine n, aritmetika sredina negrupisanih podataka uzorka, koju oznaavamo sa

x ( i itamo x bar) jednaka je:

=

=+++++=n

ii

ni xnn

xxxxx

1

21 1.......

Geometrijska sredina

Geometrijska sredina se ne dobija iz zbira nego iz proizvoda vrednosti podataka, s tim

to se iz ovog uzima pozitivna vrednost korena iji je izloitelj jednak njihovom broju. Ako

posmatrano obeleje oznaimo sa X, a njegove vrednosti x1, x2,..,xi,..,xN, onda e geometrijska

sredina tih vrednosti biti definisana formulom:

13

NNxxxG ...21 =

Zbog injenica da se geometrijska sredina dobija iz proizvoda vrednosti obeleja njeno

izraunavanje nije mogue ako je neka vrednost serije jednaka nuli, ili manja od nule; njeno

izraunavanje ima smisla kada su sve vrednosti posmatranog obeleja vee od nule.

Modus

Pored izraunatih srednjih vrednosti: aritmetike, geometrijske i harmonijske sredine,

kao pokazatelj lokacije javljaju se i pozicione srednje vrednosti. One se odreuju na osnovu

mesta-pozicije, koju zauzimaju u seriji. Najpoznatiji meu njima su modus i medijana.

Modus je vrednost obeleja koja u posmatranoj seriji ima najveu frekvenciju najee se

javlja i zato je najtipinija vrednost u seriji.

Kada je u jednoj seriji samo jedna vrednost obeleja sa najveom frekvencijom kaemo da je

unimodalna, a ako postoje dve ili vie takvih vrednosti, serija je bimidalna, odnosno

multimodalna.

Moe se desiti i da modusa nema. Na primer, ako godine radnog staa pet radnika iznose: 34,

12, 13, 15, 25, modus nee biti definisan. To je nedostatak modusa.

Medijana

Medijana je ona vrednost obeleja koja se nalazi u sredini serije ureene po veliini

obeleja, odnosno to je vrednost obeleja koja deli sumu svih frekvencija na dva jednaka dela,

tako da jedna polovina obuhvaenih sluajeva ima manju, a druga polovina veu vrednost od

medijane.

Ako su vrednosti obeleja poreane po veliini i od njih i od njih obrazovana serija

negrupisanih podataka:

x1, x2,..,xi,..,xN

pri odreivanju medijane treba razlikovati sluajeve kada je broj lanova N neparan i paran

broj. Ako je N neparan broj, tada srednji lan deli ovaj niz na dva jednaka dela. Tako e u

nizu podataka o starosti nastavnika u jednoj koli ureenih po veliini:

23, 25, 26, 28, 31

medijana biti 26, jer se ta vrednost nalazi u sredini ove serije.

14

Ako je broj lanova niza, N, paran, u njemu postoje dva srednja lana, pa se za ma koju

veliinu izmeu ta dva lana moe smatrati da niz deli na dva jednaka dela i po definiciji

moe uzeti kao medijana. Da bi se izbegla ova neodreenost, za medijanu se uzima

aritmetika sredina tih lanova. Tako e za niz podataka:

18, 19, 20, 22, 24, 26

medijana biti 21, tj. aritmetika sredina dva sredinja podatka.

Mere disperzije

Srednja vrednost karakterie dati raspored kao mera centralne tendencije vrednosti

obeleja, ali ona nije dovoljna karakteristika, jer drugi rasporedi mogu imati istu srednju

vrednost a razliiti varijaciju (rasprenost ili disperziju).

Statistiki opis skupa kao i uzorka iziskuje zato pored mera centralne tendencije, odnosno

lokacije i odgovarajue mere varijacije ili disperzije. Za merenje disperzije jedne serije koristi

se vie mera, od kojih neke imaju apsolutni a neke relativni izraz.

Apsolutne mere disperzije

Apsolutne mere disperzije iskazuju varijabilitet u apsolutnim iznosima onih mernih

jedinica u kojima su dati modaliteti posmatranog obeleja: u milionima dinara, hiljadama

tona, kilometrima, komadima itd. Ove mere kao i mere lokacije mogu biti pozicione i

izraunate u odnosu na srednju vrednost (najee aritmetiku sredinu) skupa ili uzorka.

Od pozicionih mera varijacije najee se koristi razmak ili interval varijacije, koji predstavlja

razliku izmeu najvie i najnie vrednosti obeleja u seriji:

Interval varijacije i=xmax-xminPrecizniju informaciju o varijabilitetu posmatrane serije daju pokazatelji ije se izraunavanje

zasniva na odstupanju srednje vrednosti, najee aritmetike sredine, od svih vrednosti

obeleja koja ta serija sadri. Odstupanja pojedinih vrednosti obeleja od aritmetike sredine

bie: d1=x1-m, d2=x2-m,....,dN=xN-m.Algebarski zbir ovih odstupanja, zbog svojstva aritmetike sredine, bie jednak nuli. Zato se,

umesto od algebarskih, polazi od apsolutnih odstupanja aritmetike sredine od vrednosti

obeleja, di=|xi-m|, iji prosek predstavlja meru varijabiliteta, poznatu kao srednje apsolutno

odstupanje ( d ). Za negrupisane podatke izraunava se po formuli:

=

-=N

iixN

d1

1 m

Poto je prosek odstupanja pojedinih vrednosti obeleja od aritmetike sredine jednak nuli,

moemo uzeti kao meru disperzije prosek kvadrata odstupanja, koja se naziva varijansom, s2.Za serije negrupisanih podataka izraunava se po obrascu:

15

Varijansa skupa ( )2

1

2 1 =

-=N

iixN

ms

Varijansa uzorka ( )21

2

11

=--=

N

ii xxn

s

Poto je varijansa iskazana u mernim jedinicama na kvadrat, uzima se njen pozitivan

kvadratni koren i dobija najee koriena apsolutna mera disperzije, standardna devijacija,

s.

Standardna devijacija skupa 2ss =

Standardna devijacija uzorka 2ss =

16

2.2. Deskriptivna statistika analiza u SPSS-u

Iz Menu bara klik na Analyze a zatim na Descriptive Statistics i Frequencies. Otvara se

sledei Frequencies prozor:

U polju sa leve strane prozora, koje sadri varijable, selektujte varijable za koje elite da

uradite deskriptivnu statistiku i prebacite ih u odgovarajue polje sa desne strane prozora.

17

Klik na Statistics otvara Frequencies: Statistics prozor. Pretpostavimo da istraivaa

zanimaju Mean (srednja vrednost), Median (medijana), Mode (modus) i Standard

Deviation (standardna devijacija).

Obeleite sve navedene veliine i zatim klik na Continue. Kada se otvori Frequencies prozor

klik na OK.

Rezultati analize su prikazani u sledeim tabelama.

19

Rezultati i njihova interpretacija

Tabela Statistics prikazuje izraunate statistike parametre: mean (prosek), median

(medijana), mode (modus) i standard deviation (standardna devijacija) za 5 ispitivanih

varijabli.

Varijable Pol i Godina studija su kategorijske (nominalne) varijable i za njih proraunate

vrednosti proseka, medijane, modusa i standardne devijacije nemaju znaaj. Znaajni

statistiki parametri za ove varijable su dati u tabeli frekvencija gde se vidi da je bilo 11

mukih (55%) i 9 enskih ispitanika (45%). Jedan ispitanik (5%) je na 1 godini, 8 ispitanika

(40%) je na drugoj godini, 8 ispitanika (40%) je na treoj godini i 3 ispitanika (15%) je na 4

godini.

Preostale tri varijable su merene najmanje na ordinalnom nivou (korienjem ordinalne skale

ili preciznijih skala) i za njih proraunate statistike veliine imaju znaenje.

Rezultati pokazuju da je prosena starost (mean) 20 ispitanika 22.5 godina, medijana za

godine starosti iznosi 22 godina.

Postoje dva modusa (22 god. i 26 god. se javljaju po 6 puta u tabeli frekvencija). SPSS

prikazuje niu vrednost 22 za modus (mode).

Varijabla Ocena kvaliteta nastave ima sledee izraunate vrednosti: prosek 3.15, medijana 3,

dva modusa 3 i 4 (obe vrednosti se javljaju po 7 puta u tabeli frekvencija) i standardna

devijacija 0.988.

Varijabla Zadovoljstvo dosadanjim uspehom ima sledee izraunate vrednosti: prosek 2.85,

medijana 3, modus 2 i standardna devijacija 1.225.

20

2.3. Unakrsno tabeliranjeUnakrsne tabele se esto koriste za ispitivanje odnosa izmeu kategorijskih promenljivih.

Primer konstrukcije unakrsne tabele u SPSS programu je data za sledei set podataka koji

obuhvataju pol i status prema puenju ispitanika.

Polazni podaci:

21

Postupak

U glavnom meniju pritisnite Analyze pa zatim Descriptive Statistics, zatim Crosstabs.

Prebacite promenljivu pol u Row(s) polje. Prebacite promenljivu pua u Column(s) polje.

Pritisnite dugme Cell. U prozoru Crosstabs: Cell Display treba da su obeleene Observed i

Colum opcije.

22

Rezultati i tumaenje

Kao rezultat analize SPSS konstruie sledeu tabelu:

U tabeli vidimo odnose izmeu kategorija ispitivanih promenljivih pol i pua. U prvom redu

su prikazani muki ispitanici. Od ukupno 16 mukih ispitanika 7 su se izjasnili kao puai dok

su 9 nepuai. Od ukupno 14 enskih ispitanika 9 su puai dok 5 nisu.

43.8% od ukupnog broja puaa su mukarci dok 56.3% ine ene.

64.3% od ukupnog broja nepuaa su mukarci dok 35.7% ine ene.

23

3. Grafiko prikazivanje statistikih

podataka

Serije statistikih podataka mogu se radi razumljivijeg i interesantnijih izraavanja

prikazati grafiki u vidu geometrijskih oblika tj. dijagrama. Izbor vrste dijagrama zavisi od

podataka i ciljeva istraivanja. Oni mogu biti u vidu taaka, linijski, povrinski i prostorni.

3.1. Stubiasti dijagram (engl. Bar Chart)

Stubiasti dijagrami mogu biti jednostavni ili veoma sloeni, u zavisnosti od broja

ukljuenih promenljivih. Stubiasti dijagram moe prikazivati broj sluajeva (ispitanika) u

odreenim kategorijama ili vrednost neprekidne promenljive za razliite kategorije.

a) Primer stubiastog dijagrama koji prikazuje broj ispitanika u odreenim kategorijama

Kategorijska promenljiva: starosna grupa

24

b) Primer stubiastog dijagrama koji prikazuje vrednost neprekidne promenljive za razliite

kategorije jedne kategorijske promenljive

Neprekidna promenljiva: Broj poena na testu iz opte kulture i informisanosti

Kategorijska promenljiva: Nivo obrazovanja

25

c) Primer stubiastog dijagrama koji prikazuje vrednost neprekidne promenljive za razliite

kategorije dve kategorijske promenljive

Neprekidna promenljiva: Broj poena na testu opte kulture i informisanosti

Kategorijske promenljive: Nivo obrazovanja, Starosna grupa

26

Postupak crtanja stubiastog dijagramaNa osnovu sledeih podataka konstruisati:

a) stubiasti dijagram koji prikazuje broj ispitanika po starosnim grupama.

b) stubiasti dijagram koji prikazuje prosene vrednosti promenljive broj poena na testu iz

opte kulture za razliite kategorije u okviru promenljive obrazovanje.

c) stubiasti dijagram koji prikazuje prosene vrednosti promenljive broj poena na testu iz

opte kulture za razliite grupe u okviru promenljivih obrazovanje i starost ispitanika.

27

a) Iz menija biramo: GraphsBar

U Bar Charts prozoru biramo Simple i Summaries for groups of cases:

Zatim pritisnite Define.

U prozoru Define Simple Bar: Summaries for Groups of Cases promenljivu starosna grupa

prenosimo u polje Category Axis i zatim pritisnemo OK.

28

Rezultat je prikazan na sledeoj slici:

b) Iz menija biramo: GraphsBar


Zatim Define.

U polju Bars represent izaberite Other statistic. Prebacite neprekidnu promenljivu broj

poena na testu iz opte kulture i informisanosti u polje Variable. Prebacite kategorijsku

promenljivu nivo obrazovanja u polje Category Axis i zatim pritisnite OK.

29


30

c) Iz menija biramo: GraphsBar

U Bar Charts prozoru biramo Clustered i Summaries for groups of cases:

Zatim Define.

U polju Bars Represent izaberite Other statistic. Prebacite neprekidnu promenljivu broj

poena na testu iz opte kulture i informisanosti u polje Variable. Prebacite kategorijsku

promenljivu nivo obrazovanja u polje Category Axis a kategorijsku promenljivu starosna

grupa u polje Define Clusters by. Zatim pritisnite OK.

31


33

Primer.

Prikupljeni su podaci o kolskoj spremi ispitanika. Konstruisati odgovarajui stubiasti

dijagram.

Polazni podaci i njihov unos u SPSS program:

34

Reenje:

Iz menija biramo: GraphsBar


Zatim Define.

U prozoru Define Simple Bar: Summaries.. varijablu Sprema prenosimo u polje Category

Axis i zatim OK.

35

Dobijamo sledei stubiasti dijagram:

Stubiaste dijagrame esto koristimo i kada elimo da prikaemo odnos izmeu dve

kategorijske varijable.

Primer

Zaposleni u jednoj u organizaciji su anketirani koliko su zadovoljni svojim poslom. Ponueni

su sledei odgovori: veoma nezadovoljan, nezadovoljan, ni nezadovoljan ni zadovoljan,

zadovoljan, veoma zadovoljan. Istraivaa zanima da li postoji razlika u odgovorima izmeu

enskih i mukih ispitanika.

36


Reenje:


U Bar Charts prozoru biramo opciju Stacked i Summaries for groups of cases.

U prozoru Define Stacked Bar definiemo Category Axis i Define Stacks polja kako je dato

na slici:

37

Zatim OK.


38

Uoljivo je da postoji velika razlika u zadovoljstvu poslom izmeu mukih i enskih

ispitanika.

Druga mogunost:


U Bar Charts prozoru biramo opciju Clustered i Summaries for groups of cases.

U prozoru Define Clustered Bar definiemo Category Axis i Define Clusters polja kako je

dato na slici:

Zatim OK.


40

PrimerU sledeoj tabeli su dati procentualni udeli pojedinih drava u ukupnoj proizvodnji elika u

svetu u 2010. godini. Konstruisati odgovarajui stubiasti dijagram za date podatke.

Drava Procentualni udeo u svetskoj proizvodnji

elika u 2010. god.

Kina 44.3

Juna Koreja 4.1

Indija 4.7

Japan 7.8

SAD 5.7

Brazil 2.3

EU 12.2

Ukrajna 2.4

Rusija 4.7

Ostali 11.7

Reenje:Polazni podaci su uneti kako je dato na narednim slikama:

41

Iz menija biramo Graphs pa zatim Bar.

U Bar Charts prozoru biramo opciju Simple i Values of individual cases.

U prozoru Define Simple Bar: Values of Individual Cases, u polju Bars Represent

unosimo promenljivu procentualni udeo u svetskoj proizvodnji elika u 2010. godini. U polju

Category Labels biramo opciju Variable i odgovarajue polje unosimo promenljivu drava.

43

3.2. Histogram

Histogramima se prikazuje raspodela jedne neprekidne promenljive (na primer

prosena primanja, broj poena na testu opte kulture, prosean vek trajanja

proizvoda..)

Histogram frekvencija sastoji se iz niza spojenih pravougaonika. Osnovu svakog

pravougaonika ini veliina grupnog intervala a njegovu visinu odgovarajua frekvencija

intervala. Povrina svakog pravougaonika je proporcionalna frekvenciji odgovarajueg

grupnog intervala, a ukupna povrina svih pravougaonika histograma prikazuju ukupnu

frekvenciju.

Postupak crtanja histograma

Na osnovu sledeih podataka konstruisati histogram za neprekidnu promenljivu broj poena na

testu opte kulture i informisanosti kao i zasebne histograme iste promenljive za svaku

kategoriju nivo obrazovanja.

45

Iz menija biramo: GraphsHistogram

Izaberite neprekidnu promenljivu broj poena na testu opte kulture i informisanosti i prebacite

je u polje Variable. Zatim pritisnite OK.

Da bi smo dobili zasebne histograme za promenljivu broj poena na testu opste kulture i

informisanosti za svaku grupu u okviru promenljive nivo obrazovanja u odeljak Panel by:

stavite promenljivu nivo obrazovanja. Izaberite Rows da biste te zasebne dijagrame stavili

jedan iznad drugog ili Column kada elite da ih stavite jedan pored drugog. Pritisnite OK.

47

Primer

Prikupljeni su podaci o prosenim primanjima u jednoj profesiji na sluajnom uzorku od 30

ispitanika. Konstruisati odgovarajui histogram.


48

Reenje:

Iz menija biramo: GraphsHistogram

49

Primer

Slavni hokeja Wayne Gretzky je tokom svoje dvadesetogodinje karijere u NHL-u postigao

sledei broj golova po odigranim sezonama:

51, 55, 92, 71, 87, 73, 52, 62, 40, 54, 40, 41, 31, 16, 38, 11, 23, 25, 23, 9

Konstruisati histogram za datu seriju podataka.

50

Reenje:

51

3.3. Linijski dijagramLinijski dijagram prikazuje vrednost jedne neprekidne promenljive za vie razliitih

vrednosti neke kategorijske promenljive (npr. vreme 1, vreme 2, vreme 3).

Primer

Sledei podaci predstavljaju godinju dobit jedne firme za period 1995-2005.

Godina Dobit u milionima evra

1995 0.97

1996 1.08

1997 1.15

1998 1.10

1999 1.39

2000 1.46

2001 1.25

2002 0.70

2003 1.15

2004 1.79

2005 2.04

Na osnovu datih podataka konstruisati linijski dijagram za dati vremenski period.

Reenje:

52

PostupakU glavnom meniju pritisnite Graphs pa Line.

Izaberite Simple i Values of individual cases i pritisnite Define.

U polju Line Represents prebacite promenljivu dobit.

U polju Category Labels izaberite opciju Variable prebacite promenljivu godina.

Pritisnite OK.

53

Primer

Dati podaci predstavljaju svetsku proizvodnju elika u periodu od 1980. do 2011. godine.

Konstruisati odgovarajui linijski dijagram.

U glavnom meniju pritisnite Graphs pa Line.

Izaberite Simple i Values of individual cases i pritisnite Define.

U polju Line Represents prebacite promenljivu proizvodnja.

U polju Category Labels izaberite opciju Variable prebacite promenljivu godina.

54

Pritisnite OK.

Konstruisani linijski dijagram ima sledei oblik:

55

Primer

Sledei podaci predstavljaju vrednost tone bakra na tritu u drugoj polovini 2012 godine.

Datum Cena bakra (USD/t)

2 jul 2012 7700

13 avgust 2012 7400

25 septembar 2012 8200

7 novembar 2012 7600

20 decembar 2012 8000

Na osnovu datih podataka konstruisati linijski dijagram koji pokazuje trend promene cene

bakra za dati vremenski period.

Reenje:

56

3.4. Dijagram rasprenosti

Dijagrami rasprenosti se obino koriste za istraivanje odnosa izmeu dve neprekidne

promenljive. Preporuljivo je dijagram rasprenosti nacrtati pre raunanja korelacije.

Dijagram rasprenosti predoava posmatrau da li je odnos promenljivih linearan ili

krivolinijski. Za analizu korelacije prikladni su samo linearni odnosi. Dijagram rasprenosti

pokazuje da li su promenljive korelirane pozitivno (velikim vrednostima jedne promenljive

odgovaraju veliki iznosi druge) ili negativno (velikim vrednostima jedne promenljive

odgovaraju mali iznosi druge promenljive). Kod pozitivnih korelacija linija raste, tj. poinje

levo sa malim vrednostima i raste udesno. Kod negativnih korelacija linija opada tj. poinje

levo sa veim vrednostima i opada udesno.

Dijagram rasprenosti grubo pokazuje i jainu korelacije dve promenljive. Kada je korelacija

slaba, take su bez reda rasute posvuda, tj. ne ine prepoznatljiv geometrijski oblik. Kada je

korelacija jaka vidi se gomilanje taaka oko zamiljene prave linije.

Postupak crtanja dijagrama rasprenostiPrimer 1

Profesor eli da ispita odnos izmeu uspeha studenata na kolokvijumu i uspeha studenata na

ispitu iz svog predmeta. Prikupio je podatke o rezultatima ostvarenim na kolokvijumu i na

ispitu za 25 studenata. Podaci su uneti u SPSS program kako je dato na sledeim slikama.

57

Na osnovu datih podataka konstruisati odgovarajui dijagram rasprenosti.

U glavnom meniju pritisnite Graphs pa Scatter/Dot. Potvrdite polje Simple Scatter i zatim

pritisnite dugme Define. Prenesite promenljivu za koju smatrate da je nezavisna promenljiva

u X Axis polje. U ovom sluaju to je poeni na kolokvijumu. Prenesite zavisnu promenljivu u

Y Axis polje. To je promenljiva poeni na ispitu. Zatim pritisnite OK:

58


Tumaenje dijagrama rasprenosti

Sa prethodne slike se uoava jaka pozitivna korelacija izmeu dve posmatrane promenljive u

uzorku kao celini. Studenti sa veim brojem poena na kolokvijumu postiu bolje rezultate na

ispitu. Kako je sa slike ouljiva linearna veza promenljivih bilo bi umesno izraunati

Pirsonovu korelaciju tih dvaju promenljivih.

59

Primer 2

Istraiva ispituje odnos izmeu visine mukaraca i njihove sposobnosti da izvedu skok u

dalj. Sluajnim izborom formiran je uzorak od 25 mukaraca priblino istih godina koji nisu

prethodno trenirali. Zabeleene su njihove visine i ostvarene duine skoka u dalj. Podaci su

uneti u SPSS program kako je dato:




u X Axis polje. U ovom sluaju to je visina. Prenesite zavisnu promenljivu u Y Axis polje. To

je promenljiva duina skoka u dalj. Zatim pritisnite OK:

60


Dijagram rasprenosti sugerie na postojanje linearne veze izmeu visine i duine skoka u dalj

kod ispitivane populacije. Veim visinama odgovaraju vee ostvarene vrednosti duine skoka

u dalj to upuuje na pozitivnu tj. direktnu korelaciju.

Kako bi se preciznije ispitala jaina linearne veze potrebno je odrediti vrednost koeficijenta

Pirsonove linearne korelacije izmeu analiziranih promenljivih.

61

Primer 3

Menader eli da ispita vezu izmeu prodaje odreenog proizvoda i lokacije prodajnih

objekata tj. njegove udaljenosti od centra grada. Prikupljeni su podaci i uneti u SPSS na

sledei nain:




u X Axis polje. U ovom sluaju to je udaljenost prodavnice od centra grada. Prenesite zavisnu

promenljivu u Y Axis polje. To je promenljiva meseni broj prodatih proizvoda. Zatim

pritisnite OK:

62


Konstruisani dijagram rasprenosti upuuje na postojanje linearnog odnosa izmeu

ispitivanih promenljivih. Budui da se take priblino grupiu oko prave linije ima smisla

ispitati postojanje i jainu linearne veze izmeu dve promenljive proraunom Pirsonovog

koeficijenta korelacije. Kako velikim vrednostima jedne promenljive odgovaraju male

vrednosti druge ovde se radi o negativnoj korelaciji.

63

4. Analiza pitanja sa viestrukim

odgovorima (Multiple Response)

Ova analiza omoguava istraivau da analizira pitanja koja mogu da imaju vie

odgovora. Na primer, istraiva moe zahtevati od ispitanika da navede sve novine koje je

proitao prole nedelje ili da zaokrui sve novine sa liste ponuenih odgovora.

Primer:

Pretpostavimo da su u anketi dva postavljena pitanja glasila:

Koji su vai razlozi za pokretanje biznisa? (zaokruiti maksimalno dva odgovora)

a) Presti-bolji drutveni status

b) Bolja zarada

c) Ekonomske potrebe regiona

d) Karijera i ekonomska sigurnost

Koje ste resurse koristili za pokretanje biznisa? (zaokruiti maksimalno tri odgovora)

a) Uteevina

b) Bankarski krediti

c) Zarada od rada u inostranstvu

d) Zajam od prijatelja

e) Evropski fondovi

64

Primer kodiranja podataka za istraivanje koje je ukljuivalo data pitanja prikazan je u

sledeoj tabeli:

Promenljiva Kolona Kod

1=presti-bolji drutveni

status

2=bolja zarada

3=ekonomske potrebe

regiona

Razlog1 1

4=karijera i ekonomska

sigurnost

1=presti-bolji drutveni

status

2=bolja zarada

3=ekonomske potrebe

regiona

Razlog2 2

4=karijera i ekonomska

sigurnost

1=uteevina

2=bankarski krediti

3=zarada od rada u

inostranstvu

4=zajam od prijatelja

Res.1 3

5=evropski fondovi

Res.2 4 Kao prethodno

Res.3 5 Kao prethodno

65

Posle unosa podataka i definisanja promenljivih pristupa se analizi.

Iz menija klik na Analyze, zatim Multiple Response i Define Sets. Otvorie se sledei

Define Multiple Response Sets prozor:

66

U polje Set Definition izaberite promenljive koje se odnose na prvo pitanje (razlog1 i

razlog2) i prebacite ih u Varibles in Set polje. Kako su dva razloga kodirana iz poetne liste

koja je sadrala etiri razloga ekirajte Categories polje i unesite 1 do 4 u Range polje. Zatim

u polje Name unesite ime za grupu razloga (primer: razlozi)) a u polje Label unesite

objanjenje (primer: razlozi za preferiranje te partije (reasons for preferring that party).

Klik na Add da bi prebacili ovaj set odgovora u Mult Response Sets polje:

67

Zatim ponovite postupak za drugo pitanje:

68

Klik na Close kako bi zatvorili prozor.

Iz menija klik na Analyze, zatim Multiple Response i Frequencies. Otvara se sledei

Multiple Response Frequencies prozor:

Prebacite grupisane odgovora (razlozi i resursi) iz Mult Response Sets polja u polje

Table(s) for:

69

Zatim klik na OK kako bi startovali analizu viestrukih odgovora (multiple-response

frequencies analysis).

Rezultati:

U tabeli su predstavljeni dobijeni rezultati:

70

Tumaenje rezultata:

Pitanje Koji su vai razlozi za pokretanje biznisa? je ukupno generisalo 32 odgovora iz

uzorka od 20 ispitanika:

3 odgovora (ispitanika) su bila presti-bolji ekonomski status (9.4% ukupnog broja odgovora

(3/32) i 15.0% ispitanika (3/20)),

15 odgovora (ispitanika) su bila bolja zarada (46.9% ukupnog broja odgovora (15/32) i

75.0% ispitanika (15/20)),

3 odgovora (ispitanika) su bila ekonomske potrebe regiona (9.4% ukupnog broja odgovora

(3/32) i 15.0% ispitanika (3/20)),

11 odgovora (ispitanika) su bila karijera i ekonomska sigurnost (34.4% ukupnog broja

odgovora (11/32) i 55.0% ispitanika (11/20)).

Pitanje Koje ste resurse koristili za pokretanje biznisa? je ukupno generisalo 37

odgovora iz uzorka od 20 ispitanika:

12 odgovora (ispitanika) su bila uteevina (32.4% ukupnog broja odgovora (12/37) i 60.0%

ispitanika (12/20)),

13 odgovora (ispitanika) su bila bankarski kredit (35.1% ukupnog broja odgovora (13/37) i

65.0% ispitanika (13/20)),

6 odgovora (ispitanika) su bila zarada od rada u inostranstvu (16.2% ukupnog broja odgovora

(6/37) i 30.0% ispitanika (6/20)),

1 odgovor (ispitanik) je bio evropski fondovi (2.7% ukupnog broja odgovora (1/37) i 5.0%

ispitanika (1/20)).

71

5. Uvod u analitiku statistiku

Statistiko zakljuivanje predstavlja postupak donoenja zakljuaka o vrednostima

parametara osnovnog skupa na osnovu informacija dobijenih iz uzorka.

Statistiko zakljuivanje se sastoji iz statistikog ocenjivanja i testiranja statistikih hipoteza.

Izbor postupka koji emo primeniti zavisi od raspoloivih informacija o nepoznatom

parametru osnovnog skupa pre izbora uzorka.

5. 1. Statistiko ocenjivanje

Ako ne raspolaemo podacima na osnovu kojih bismo mogli da pretpostavimo vrednost

odreenog parametra skupa (najee su to aritmetika sredina, proprcija, varijansa, odnosno,

standardna devijacija skupa), ovu vrednost emo oceniti postupkom statistikog ocenjivanja.

Budui da numeriku vrednost parametra ocenjujemo na osnovu informacije iz uzorka, ne

moemo biti potpuno sigurni u ispravnost donetog zakljuka. Zbog toga zakljuak ocenjivanja

prihvatamo sa pouzdanou manjom od 100%.

S druge strane, ako nam je neka od osobina osnovnog skupa poznata ili pretpostavljamo

njenu vrednost (vrednost parametra skupa, oblik njegovog rasporeda i sl.), primeniemo

postupak testiranja hipoteze. Testiranjem hipoteze ispitujemo da li je polazna pretpostavka

prihvatljiva. Drugim reima, ispitujemo da li informacija iz uzorka protivrei ili podrava

nae poetno uverenje o karakteristici osnovnog skupa. Poto ne moemo biti potpuno sigurni

u ispravnost donetog zakljuka, pretpostavku emo prihvatiti ili je odbaciti uz odreeni rizik

da smo pogreili.

Na sledeem primeru emo pokazati razliku izmeu postupka ocenjivanja i testiranja

hipoteza.

Pretpostavimo da analiziramo uspeh studenata iz Osnova statistike analize. Interesuje

nas prosean broj poena na pismenom ispitu o kojem ne raspolaemo nikakvim podacima.

Umesto popisa primeniemo postupak statistikog ocenjivanja: izabraemo prost sluajni

uzorak, izraunaemo prosean broj poena u uzorku i na osnovu ove informacije oceniemo

prosean broj poena u osnovnom skupu. Ako je na primer, 5.69=x , mogli bismo grubo da

72

prihvatimo da i prosean broj poena u osnovnom skupu iznosi 69.5. Ali, budui da se x po

pravilu razlikuje od m, umesto jednim brojem, parametar m ocenjujemo intervalom vrednosti

koji formiramo oko realizovane vrednosti x iz uzorka. Tada kaemo, na primer, da interval

[67-72] verovatno sadri pravu vrednost m.Dakle, rezultat ocenjivanja je ocenjena vrednost nepoznatog parametra koju prikazujemo

jednim brojem ili, ee, intervalom vrednosti.

Sa druge strane, pretpostavimo da raspolaemo podatkom o prolaznosti studenata na

ispitu iz Osnova statistike analize u ranijim ispitnim rokovima, i da ona iznosi 71%. Pri

tome, opravdano sumnjamo da je dolo do promene u uspehu studenata. Osnovanost sumnje

(nae hipoteze) proveravamo postupkom testiranja hipoteze. Iz skupa svih studenata koji su

polagali ispit izvlaimo prost sluajan uzorak i u uzorku izraunavamo uee studenata koji

su ga poloili; neka ono iznosi 69%. Vidimo da postoji razlika izmeu do tada vaee

proporcije skupa (0.71) i realizovane vrednosti proporcije uzorka (0.69). Ova razlika moe

imati dva uzroka: jedan je fluktuacija elemenata u uzorcima, zbog koje proporcije uzoraka

odstupaju od proporcije skupa; drugi uzorak moe biti injenica da prolaznost na ispitu vie

nije 71%. Ako odstupanje od 2% moemo da objasnimo sluajnim kolebanjem proporcija

uzoraka, prihvatiemo da nije dolo do promene u uspehu studenata, tj. da je prolaznost na

ispitu 71%. Ako razliku od 2% ne moemo da opravdamo samo pomenutom fluktuacijom,

prihvatiemo hipotezu da se prolaznost na ispitu promenila. Rezultat testiranja je zakljuak da

se hipoteza o vrednosti parametra skupa prihvata ili ne prihvata.

Ocenjivanje aritmetike sredine osnovnog skupa

Takasta i intervalna ocena

Pretpostavimo da ocenjujemo prosene mesene izdatke za kulturu etvorolanih

domainstava u Vojvodini, i da u prostom sluajnom uzorku od 200 domainstava oni iznose

9000 dinara. Prihvatimo li ovu vrednost kao ocenjenu vrednost parametra m, skoro je izvesnoda emo pogreiti jer je veina aritmetikih sredina uzoraka bliska, ali retko jednaka

aritmetikoj sredini skupa. Ako smo izabrali redak uzorak koji, u odnosu na m, ima malu iliveliku aritmetiku sredinu, dobiemo deformisanu sliku o osnovnom skupu. Pored toga, ako

iz jednog skupa izaberemo vie uzoraka iste veliine, njihove aritmetike sredine e se

razlikovati meu sobom, pri emu ne moemo da odredimo koja od njih je najblia prosenoj

vrednosti skupa. Nedostaje nam podatak o preciznosti takaste ocene.

Bili bismo mnogo sigurniji u tanost zakljuaka kada bismo, umesto jednom vrednou,

aritmetiku sredinu skupa ocenili intervalom vrednosti formiranim oko X . Takvu ocenu

73

nazivamo intervalnom ocenom, a interval oko X intervalom pouzdanosti (ili intervalom

poverenja). Ovaj interval bi trebalo da bude toliko irok da, uzimajui u obzir sluajna

kolebanja aritmetikih sredina uzoraka oko aritmetike sredine skupa, on obuhvati i stvarnu

vrednost m. Ali, ako bismo formirali veoma irok interval koji bi sigurno sadrao vrednost m,on ne bi bio informativan. S druge strane, ako formiramo uzak interval, on ne mora da sadri

vrednost aritmerike sredine skupa, odnosno postoji rizik da je zakljuak pogrean. Ipak, na

osnovu rezultata teorije verovatnoe, veliinu ovog rizika moemo da kontroliemo ukoliko

koristimo sluajan uzorak.

Proraun intervalne ocene aritmetike sredine skupa

Za datu pouzdanost, preciznost ocene se poveava sa poveanjem uzorka. Rizik da smo

u zakljuivanju napravili greku nazivamo rizikom greke i obeleavamo ga sa a. Obino seuzimaju vrednosti 0.05 ili 0.01. Rizik a se dopunjuje do jedinice sa koeficijentompouzdanosti, koji je jednak (1-a).Interval pouzdanosti (poverenja) predstavlja interval vrednosti formiran oko aritmetike

sredine uzorka koji, sa definisanim koeficijentom pouzdanosti tj. sa definisanom

pouzdanou, obuhvata aritmetiku sredinu skupa .

Jednaina za proraun intervala pouzdanosti za poznatu standardnu devijaciju skupa je:

Koeficijent pouzdanosti (1-a) Odgovarajua vrednost z statistike 2/az

0.90 1.645

0.95 1.96

0.99 2.58

U najveem broju sluajeva, kada je aritmetika sredina skupa nepoznata, nepoznata je i

njegova standardna devijacija . Meutim, u praksi ukoliko je uzorak relativno veliki (30 ili

vie) standardna devijacija skupa () moe se aproksimirati standardnom devijacijom uzorka

(s) u jednaini za proraun intervala pouzdanosti.

74

Primer

1. Potanska firma u New York-u tvrdi da je njeno proseno vreme isporuke bilo gde u gradu

manje od 3 sata. Agencija za zatitu potroaa je odluila da sprovede istraivanje u cilju

provere ovog tvrenja. Sluajno su izabrana 50 isporuioca i utvreno je da proseno vreme

2.8 sati sa standardnom devijacijom s od 0.6 sati. Agencija eli da odredi interval poverenja

za sa pouzdanou od 95%. Odrediti interval pouzdanosti i oceniti da li tvrdnja potanske

agencije razumna.

Interval od 2.634 do 2.966 formira 95% interval poverenja za . Drugim reima, 95% smo

sigurni da se proseno vreme isporuke firme kree u intervalu od 2.634 do 2.966. Poto su obe

granice intervala ispod 3 sati moe se zakljuiti da postoji jak dokaz da je tvrenje kompanije

o prosenom vremenu isporuke tano.

Proraun veliine uzorka za odreivanje aritmetike sredine skupa

Prikupljanje podataka kota. Postavlja se pitanje odreivanja optimalne veliine uzorka za

sprovoenje odreenog statistikog istraivanja. Ukoliko je izabrani uzorak premali,

istraiva analizom dolazi do nepouzdanih informacija. Ukoliko je uzorak preveliki to dovodi

do poveanja trokova i vremena istraivanja.

Zbog toga izabrana veliina uzorka predstavlja kompromis izmeu potrebne preciznosti

statistike uzorka, kao ocene parametra osnovnog skupa, i potrebnog vremena i trokova da bi

se postigao oekivani stepen tanosti.

Jednaina za ocenjivanje potrebne veliine uzorka u cilju prorauna aritmetike sredine

osnovnog skupa sa odreenom pouzdanou (1-a) i veliinom intervala pouzdanosti W (gde

je Ex i E=W/2, E je nivo tanosti) glasi:

Da bi smo odredili potrebnu veliinu uzorka potrebno je poznavati vrednost varijanse

osnovnog skupa 2 (ili standardne devijacije osnovnog skupa ). Poto ovi parametri skupa

obino nisu poznati, varijansu osnovnog skupa 2 aproksimativno moemo zameniti

varijansom uzorka s2. Varijansu uzorka moemo oceniti na dva naina:

75

1. Korienjem prikupljenih informacija iz prethodnog istraivanja kako bi se procenila

varijansa uzorka s2. Izraunatu vrednost koristimo kao aproksimaciju 2.

2. Korienjem informacija o intervalu varijacije uzorka i da bi se procenila .

Primer

Trokovi studenata za kupovinu akademske literature su znatno poveani u odnosu na ostale

trokove studiranja. Rukovodstvo univerziteta eli da proceni prosene trokove kupovine

udbenika svih studenata univerzitata na osnovu odgovarajueg uzorka. Kako bi ova procena

bila relevantna procenjeni trokovi moraju imati nivo tanosti od 25 dolara. Koliki je

minimalni broj studenata u uzorku potreban da bi procenjeni trokovi zadovoljili potreban

nivo tanosti sa pouzdanou od 95%?

Reenje

Iz podataka prikupljenih ranijih godina, rukovodstvo univerziteta je odredilo da godinji

trokovi za literaturu mogu da se predstave histogramom koji sledi normalnu raspodelu sa

intervalom varijacija od 250 do 750 dolara. Poto distribucija trokova za literaturu sledi

normalnu raspodelu procena moe da se uradi na sledei nain:

Pojedini lanovi u jednaini za proraun veliine uzorka imaju sledee vrednosti:

E=25$

Koeficijent pouzdanosti (1-a)=0.95 ili 95% sledi da jeZamenom datih vrednosti u jednainu za proraun potrebne veliine uzorka dobijamo:

Dobijenu vrednost zaokruujemo na prvi vei ceo broj. Zakljuujemo da je uzorak od 97

ispitanika ili vei potreban kako bi izvrili proraun ocene prosenih trokova nabavke

literature sa nivoom tanosti od 25$ i pouzdanou od 95%.

76

Primer

Firma eli da testira proseni vek trajanja svog proizvoda. Sluajno su izabrana 10

proizvoda i odreeno je njihovo trajanje. Na osnovu podataka iz uzorka odrediti

prosean vek trajanja proizvoda sa pouzdanou od 95%.

Procedura:Biramo: AnalyzeDescriptive StatisticsExplore

Otvara se sledei prozor:

Varijablu Vek trajanja proizvoda prebacujemo u polje Dependent List.

77

Klik na Statistics. U prozoru Explore: Statistics potrebno je ekirati Descriptives i definisati

pouzdanost (95%):

Klik na Continue i OK.

U tabeli Descriptives moe se videti odgovarajua statistika uzorka:

78

Interval od 148.382 do 166.818 formira 95% interval poverenja za . Drugim reima, 95%

smo sigurni da se proseno vreme trajanja proizvoda kree u intervalu od 148.382 do 166.818

dana.

79

5. 2. Testiranje statistikih hipoteza

Do sada smo informacije iz uzorka koristili da bismo ocenili nepoznate parametre

osnovnog skupa. U drugoj oblasti statistikog zakljuivanja, testiranju statistikih hipoteza,

informacije iz uzorka koristimo da ispitamo prihvatljivost nekih tvrenja ili pretpostavki koje

se tiu osobina osnovnog skupa.

Primer 1:

Razmotrimo eksperiment u kome istraiva istrauje uticaj odreenog leka na ljudsko

pamenje. Istraiva daje lek na korienje jednoj grupi ispitanika ali ne i kontrolnoj grupi.

Zatim poredi srednje vrednosti grupa ostvarene na testu pamenja.

Deskriptivna statistika ne moe dati odgovor da li je uoena razlika u dobijenim srednjim

vrednostima rezultata testa izmeu grupa sluajna ili je zaista uslovljena uticajem leka.

Primer 2:

Sproveden je eksperiment u cilju ispitivanja koeficijenata inteligencije (IQ test) kod

devojica i deaka u prvom razredu.

Postavljena je istraivaka hipteza da devojice u prvom razredu imaju vii koeficijent

inteligencije (IQ) u odnosu na deake tog uzrasta.

Metodom sluajnog uzorka izabrane su etiri devojice i etiri deaka i sproveden je IQ

test.

Rezultati eksperimenta pokazuju da je prosena vrednost ostvarena na testu 110 u sluaju

devojica i 103 u sluaju deaka.

Na osnovu dobijenih rezultata da li istraiva moe zakljuiti da je njegova hipoteza

tana?

Da bi se naao odgovor na ovo pitanje mora se primeniti analitika statistika i testiranje

statistikih hipoteza.

Statistika hipoteza je precizno formulisano tvrenje ili pretpostavka o osobini

osnovnog skupa. Nauni metod kojim proveravamo prihvatljivost ovog tvrenja ili

pretpostavke nazivamo testiranjem statistike hipoteze.

80

Tipovi statistikih hipoteza

Istraivaka hipoteza.

Istraivaka hipoteza (H1) je precizno formulisano tvrenje ili pretpostavka o osobini

osnovnog skupa.

To je hipoteza koju je definisao istraiva i koja je bazirana na nekoj teoriji. Istraiva obino

veruje da je njegova hipoteza tana.

Nulta hipoteza.

Nulta hipoteza (H0) je tvrenje o osobini osnovnog skupa koje je inverzno onom definisanom

u istraivakoj hipotezi. Ona porie tvrenje koje je dato u istraivakoj hipotezi.

Testiranje statistike hipoteze

Nauni metod kojim proveravamo prihvatljivost statistike hipoteze nazivamo testiranje

statistike hipoteze.

Poto zakljuak o prihvatljivosti pretpostavke donosimo na osnovu informacije iz uzorka,

prilikom testiranja hipoteze prisutan je rizik da emo u zakljuku pogreiti.

Pri testiranju hipoteza mogue su dve vrste (tipa) greaka:

Greka prve vrste nastaje ako se H0 odbaci kada je H0 tana. Verovatnoa greke prve vrste se

oznaava sa a.Greka druge vrste nastaje ako se H0 ne odbaci kada je H1 tana. Verovatnoa greke druge

vrste se oznaava sa b.Idealan test ima male verovatnoe greaka prve i druge vrste. Meutim, istovremeno

minimiziranje verovatnoa a i b nije mogue zato to oni obrnuto zavisni. Sa fiksiranomveliinom uzorka i izabranim statistikim testom smanjenjem verovatnoe greke prve vrste adolazi do poveanja verovatnoe greke druge vrste b.S obzirom na interpretaciju hipoteza H0 i H1, obino nam je vanije da ne napravimo greku

prve vrste, jer bismo tim postupkom dokazali tvrenje koje nije tano (hipoteza H1). Greka

druge vrste nije toliko znaajna, jer ako nemamo dovoljno jakih dokaza protiv H0, a verujemo

da je H1 ipak tana, postupak dokazivanja hipoteze H1 moemo nastaviti izvoenjem novih,

obimnijih eksperimenata.

Postupak testiranja statistikih hipoteza

1. formuliemo nultu i istraivaku hipotezu;

2. vrimo izbor statistike testa;

81

3. biramo tzv. nivo znaajnosti testa a;4. formuliemo pravilo na osnovu koga odluujemo da li da odbacimo nultu hipotezu ili ne.

5. izraunavamo vrednost statistike testa

6. donosimo odluku da nultu hipotezu odbacimo ili da je ne odbacimo.

Nivo znaajnosti (a)Kada se sprovedenim testiranjem dve grupe uoi razlika u vrednostima nekog obeleja

(primer: IQ, test linosti, ...) postavlja se pitanje kako zakljuiti da je uoena razlika statistiki

znaajna. Ono to se jednom istraivau moe uiniti bitnom razlikom drugom istraivau

moe biti nevano. U cilju uvodjenja vee objektivnosti u interpretaciju dobijenih rezultata

uvodi se nivo znaajnosti.

Nivo znaajnosti predstavlja graninu verovatnou kojom odreujemo da li da prihvatimo ili

odbacimo nultu hipotezu. Obino se za nivo znaajnosti a uzimaju vrednosti 0.01 (1%) ili0.05 (5%). Ukoliko izaberemo 0.05 nivo znaajnosti postoji verovatnoa od 5% da smo

odbacivanjem nulte hipoteze uinili greku prve vrste tj. da je nulta hipoteza tana.

Za istu veliinu uzorka i istu statistiku testa, to je manji nivo znaajnosti, utoliko je tee

odbaciti nultu hipotezu H0. Smanjenjem nivoa znaajnosti poveava se verovatnoa greke

druge vrste. Poveanje veliine uzorka za izabrani nivo znaajnosti testa smanjuje

verovatnou javljanja greke druge vrste.

Realizovani nivo znaajnosti testa (p-vrednost)

U novijoj literaturi i praksi umesto proizvoljnog nivoa znaajnosti, sve vie se koristi tzv. p-

vrednost (Sig. u SPSS programu). Na ovaj nain, umesto da se unapred izabere nivo

znaajnosti, on se rauna na osnovu informacija iz uzorka.

P-vrednost je najmanji rizik sa kojim se nulta hipoteza moe odbaciti na osnovu

podataka iz uzorka.

Ako je nivo znaajnosti testa a unapred odreen, odluku da H0 odbacimo ili ne odbacimodoneemo uporeivanjem p-vrednosti sa rizikom a. Ako je pa, H0 emo odbaciti, a ako jep>a zakljuiemo da H0 ne moemo da odbacimo.

82

Izbor prikladnih statistikih tehnika

Kada je istraiva definisao istraivaku hipotezu sledei korak je izbor odgovarajueg

statistikog testa kojim e izvriti testiranje hipoteze. Pored prirode hipoteze koju eli da

testira (test razlikovanja ili test povezanosti) prilikom izbora statistike testa istraiva mora

uzeti u obzir i merne skale koje je koristio za merenje varijabli.

Merne skale

Postoje etiri nivoa merenja i etiri merne skale: nominalna, ordinalna, intervalna i skala

odnosa.

Nominalna skala je najnepreciznija. U ovoj skali brojevi se koriste kod pojava koje se mogu

klasifikovati samo na odreen broj i tip modaliteta. Tako se klasifikuju: pol, brano stanje, itd.

(primer: 1-muko; 2-ensko)

Ordinalna skala doputa rangiranje pojedinih vrednosti varijable. Tako na primer, lokaciju

prodavnice moemo oznaiti kao izuzetno povoljnu, povoljnu, osrednju, nepovoljnu i

izuzetno nepovoljnu i ove modalitete rangirati poev od broja 1 za izuzetno povoljnu do

rednog broja 5 za poslednji modalitet. Jos jedan primer bi bio rangiranje koarkakih timova.

Ispitanici bi mogli da na osnovu svog miljenja izvre rangiranje 4 tima na osnovu kvaliteta

na sledei nain: 1-najkvalitetniji tim, 2-sledei po kvalitetu itd. Iako ordinalna skala doputa

rangiranje timova po kvalitetu ona ne prua informacije koliko je jedan tim bolji od drugog.

Intervalna skala pokazuje ne samo rang modaliteta nego i meru njihovog razlikovanja. Na

intervalnoj skali su razlike iste numerike veliine meusobno jednake. Primer za intervalnu

skalu moe biti vrednost postignuta na IQ testu. Razlika od 10 poena je jednaka du cele

skale. Drugi primeri intervalne skale mogu biti: kalendarsko vreme, potencijalna energija,

temperatura (merena Celzijusovom skalom) itd.

Najvii nivo merenja postie se primenom skale odnosa, koja obezbeuje znaenje bilo kog

odnosa merenih objekata, kao to su: visina u centimetrima, telesna masa u kilogramima,

starost u godinama, prihod u dinarima i sl. Skalu odnosa karakterie ne samo upotreba

jedinice merenja nego i prava nulta taka. Ova skala nam doputa da iskaemo proporcionalan

83

odnos modaliteta koje merimo. Pakovanje eera, na primer, koje ima tri puta vie mernih

jedinica od drugog pakovanja, tri puta je tee. Ova skala je, prema tome, najpreciznija.

Istraivanje veza izmeu raznih obeleja

U anketnom istraivanju esto nisu vane razlike izmeu grupa, nego jaina veza

izmeu obeleja (promenljivih). Moe se upotrebiti vie tehnika. Neke od najvanijih su

navedene u daljem tekstu.

Korelacija

Za istraivanje jaine veze izmeu dve neprekidne promenljiveupotrebljavaju se Pirsonova i

Spirmanova korelacija. Korelacija pokazuje smer (pozitivan ili negativan) i jainu linearne

veze. Pozitivna korelacija pokazuje da obe promenljive zajedno i opadaju i rastu. Negativna

krelacija pokazuje da jedna promenljiva opada kada druga raste i obrnuto.

Viestruka regresija

Viestruka regresija je proirenje proste linearne regresije gde se na osnovu skupa nezavisnih

promenljivih predvia vrednost jednog neprekidnog zavisnog obeleja (promenljive). Razne

vrste viestruke regresije slue za poreenje prediktivne mogunosti odreenih nezavisnih

promenljivih i pronalaenje najboljeg skupa promenljivih za predikciju jedne zavisne

promenljive.

Faktorska analiza

Faktorska analiza slui za svoenje velikog skupa promenljivih ili stavki skale na manji broj

dimenzija ili faktora, s kojima je lake raditi. To se postie saimanjem oblika korelacije koji

lei u njihovoj osnovi i pronalaenjem grupa tesno povezanih stavki. Ova tehnika se esto

koristi kod razvoja mernih skala, za identifikaciju pripadne strukture.

Strukturno modelovanje

Strukturno modelovanje (engl. structural equation modelling) relativno je nova i veoma

sofisticirana tehnika za ispitivanje raznih modela meuveza u skupu promenljivih. Zasnovana

je na viestrukoj regresiji i tehnikama faktorske analize. Slui za izraunavanje svake

nezavisne promenljive u modelu i testiranje koliko dobro ceo model odgovara podacima, kao

i za poreenje alternativnih modela. Sam SPSS nema modul za strukturno modelovanje, ali

podrava dodatni program AMOS.

84

Ispitivanje razlika izmeu grupa

Postoji jo jedna porodica statistikih tehnika za utvrivanje statistiki znaajnih razlika

izmeu grupa. U nastavku su navedene parametarske verzije tih testova prikladne za podatke

na normalnim skalama i skalama odnosa sa normalnom raspodelom rezultata i njihove

neparametarske alternative.

T-testovi

T-test za dva uzorka se upotrebljavaju kada imamo dve grupe (recimo, mukarce i ene) ili

dva skupa podataka (pre i posle), i elimo da uporedimo srednje vrednosti nekog neprekidnog

obeleja (promenljive). T-test zavisnih uzoraka upotrebljavamo kada nas zanimaju promene

vrednosti posmatranog obeleja dobijene od subjekata testiranih u Vreme 1 i zatim ponovo u

Vreme 2 (obino posle neke intervencije ili dogaaja). Ti uzorci su povezani poto se radi o

istim ljudima testiranim u dva navrata. T-testovi nezavisnih uzoraka upotrebljavaju se kada

imate dve razliite (nezavisne) grupe ljudi (recimo, mukarce i ene) i elite da uporedite

njihove rezultate za posmatrano obeleje.

Jednofaktorska analiza varijanse

Jednofaktorska analiza varijanse (engl. one-way ANOVA) slina je t-testu, ali se koristi kada

imamo vie od dve grupe za koje elimo da uporedimo njihove srednje vrednosti za jednu

neprekidnu promenljivu (obeleje).

Sledea tabela daje prikaz raspoloivih statistikih testova koji stoje na raspolaganju

istraivau u zavisnosti od nivoa merenja vrednosti promenljivih:

85

Tabela. Statistiki metodi u zavisnosti od nivoa merenja vrednosti promenljivihRazlika u vrednostima obeleja (promenljive)Nivo

merenja

vrednosti

promenljive

Veza izmeu

promenljivih Jedna grupa

(uzorak)

Dve zavisne

grupe

(uzorka)

Dve

nezavisne

grupe

(uzorka)

Vie nezavisnih

grupa (uzoraka)

Point biserijski (rpb)

koeficijent

(dihotomna-kontinualna)

Hi-kvadrat

test

nezavisnosti

Hi-kvadrat test

za ispitivanje

kvaliteta

podudaranja

Nominalna

Fi koeficijent

(dihotomna-dihotomna)

Ordinalna Spirmanov koeficijent

korelacije

Kolmogorov-

Smirnov test

rangiranih

podataka

Vilkoksonov

test ranga

Man-

Vitnijev U

test

Kruskal-Volisov

test

Pirsonov koeficijent

korelacije

T-test za

jedan uzorak

T-test za

dva zavisna

uzorka

T-test za

dva

nezavisna

uzorka

Analiza

varijanse sa

jednim faktorom

(ANOVA)

Linearna regresija Multivarijaciona

analiza varijanse

(MANOVA)

Nelinearna regresija

Intervalna i

skala

odnosa

Strukturno modelovanje

86

5. 3. Testiranje pretpostavke normalne raspodele osnovnog skupa u SPSS-u

Mnogi statistiki testovi poivaju na pretpostavci da je raspodela vrednosti neprekidne

promenljive u skupu iz koga se uzima uzorak normalna. Ovakvi metodi nazivaju se

parametarski ili klasini metodi. Tanost dobijenih rezultata kod primene parametarskih

metoda zavisi od toga da li je ispunjen uslov normalnog rasporeda osnovnog skupa.

Normalna raspodela se odlikuje simetrinom, zvonolikom krivom sa najveim brojem

vrednosti promenljive u sredini i manjim brojem rezultata prema krajevima (repovima) zvona.

Postoje dve grupe metoda za testiranje normalnosti osnovnog skupa u SPSS-u. U prvu

grupu spadaju grafiki metodi a drugu grupu predstavljaju numeriki metodi. Grafiki metodi

se baziraju na vizuelnom ocenjivanju dok se numeriki metodi sprovode specijalnim

statistikim testovima.

Primer

Iz osnovnog skupa koga ine svi uenici osmog razreda u osnovnim kolama u jednom

gradu formiran je sluajni uzorak od 50 uenika. Na uzorku je sproveden test inteligencije (IQ

test) i dobijeni rezultati (brojevi osvojenih poena) su zabeleeni.

Testirati pretpostavku da sluajna promenljiva rezultati IQ testa ima normalnu raspodelu na

posmatranom skupu uenika osmog razreda u tom gradu kao i na odgovarajuim

podskupovima uenika i uenica.

Polazni podaci:

88

Procedura:U prvom delu analize testiraemo normalnu raspodelu na celom uzorku uenika.

Biramo: AnalyzeDescriptive StatisticsExplore


Varijablu za koju testiramo normalnu raspodelu prebacujemo u polje Dependent List.

Klik na Plots. U otvorenom prozoru Explore: Plots ekirati Normality plots with tests opciju:

89

Klik na Continue i OK.

Rezultati i tumaenjeZa testiranja pretpostavke normalnosti posmatramo rezultate u tabeli Tests of Normality i Q-

Q grafik.

Tabela Tests of Normality sadri rezultate dva statistika testa: Kolmogorov-Smirnov i

Shapiro-Wilk. Za testiranje normalnosti koristimo Shapiro-Wilk test koji je pogodniji za male

uzorke (< 50). Ako je realizovani nivo znaajnosti (Sig.) vei od 0.05 pretpostavka o

normalnosti je potvrena. U ovom sluaju realizovani nivo znaajnosti iznosi 0.345 pa

zakljuujemo da promenljiva rezultat IQ testa ima normalnu raspodelu na celoj populaciji

uenika osmog razreda u tom gradu.

90

Za vizuelno odreivanje normalnosti koristi se histogram i Q-Q grafik:

91

Ukoliko podaci slede normalnu raspodelu take na grafiku e biti pozicionirane blizu prave

linije. Ukoliko take imaju nelinearni trend rasporeda onda podaci nemaju normalnu

raspodelu. U ovom sluaju i histogram i Q-Q grafik ne ukazuju na znaajnije odstupanje

podataka od normalne raspodele.

Normalnost raspodele neprekidne promenljive takoe moemo testirati po pojedinim

kategorijama tj. grupama. Tako, u gornjem primeru moemo zasebno testirati normalnost

raspodele rezultata na IQ testu na podskupu mukaraca (uenika) i podskupu ena (uenica).

Biramo: AnalyzeDescriptive StatisticsExplore


Neprekidnu promenljivu, za koju testiramo normalnu raspodelu, prebacujemo u Dependent

List polje. Kategorijsku promenljivu koja sadri kategorije (grupe) za koje elimo da

testiramo normalnost raspodele neprekidne promenljive rezultat na IQ testu prebacujemo u

Factor list polje:

Ostala procedura je identina prethodno datoj.

92

Rezultati:

Rezultati u tabeli Tests of Normality potvruju normalnu distribuciju vrednosti promenljive

rezultat na IQ testu za obe ispitivane kategorije (mukarci i ene). Izraunati nivo

znaajnosti, po Shapiro-Wilk testu, za kategoriju mukaraca je 0.452 dok za kategoriju

enskih ispitanika iznosi 0.246. Kako su obe vrednosti znatno iznad standardnog nivoa

znaajnosti zakljuujemo da je normalna raspodela promenljive rezultat na IQ testu potvrena

na oba ispitivana podskupa uenika.

Vizuelna procena normalnosti raspodele promenljive rezultat na IQ testu se moe izvriti

analizom konstruisanih histograma i Normal Q-Q grafika za svaku kategoriju.

94

Primer

Opte je verovanje da vrednosti holesterola u krvi slede normalnu raspodelu u

velikim populacijama. Na osnovu izmerenih vrednosti za dvadeset pacijenata

testirajte hipotezu o normalnosti raspodele vrednosti ove promenljive.

95

RezultatiRealizovani nivo znaajnosti Shapiro-Wilk testa iznosi 0.302 to je vee od standardnog nivoa

znaajnosti (0.05) pa zakljuujemo da vrednost holesterola u krvi sledi normalnu raspodelu.

97

5.4. Testiranje hipoteze zasnovano na jednom uzorku (One-Sample T-test.)

Primer 1

Postoji sumnja da maina koja pakuje deterdent (ija je propisana teina 1 kg.) nije vie

precizna, pa bi trebalo izvriti njen remont. Da bismo doneli odluku o remontu, izabrali smo

uzorak od 16 pakovanja i dobili sledei rezultat:

1.020; 1.010; 1.050; 1.015; 1.002; 1.008; 1.025; 0.998

1.012; 1.033; 1.017; 1.001; 1.008; 1.011; 1.024; 1.066

Na osnovu dobijenih podataka proveriemo da li je sumnja u preciznost rada maine

opravdana. Iz iskustva znamo da je teina pakovanja deterdenta normalno rasporeena.

Nulta hipoteza u ovom sluaju glasi da je teina pakovanja deterdenta jednaka 1 kg.

Istraivaka hipoteza je da teina pakovanja deterdenta razliita od 1 kg.

Kodiranje

Variable Column Code

Tezina pakovanja 1 izmerena tezina pakovanja u kg

PostupakIz menija klik na Analyze, zatim Compare Means i onda One-Sample T-test.


98

Izmerena teina u kilogramima je varijabla za koju testiramo aritmetiku sredinu i

prebacujemo je Test Variable(s) polje. Poto vrednost aritmetike sredine koju testiramo

iznosi 1 kg u polje Test Value upisujemo 1.

Zatim klik na Options. Otvara se One-Sample T Test: Options prozor gde u polje

Confidence Interval unosimo vrednost nivoa pouzdanosti. U sluaju da izaberemo standardni

rizik odbacivanja nulte hipoteze (da je vrednost pakovanja deterdenta jednaka 1 kg.) 0.05 tj.

5%, pouzdanost iznosi 95%. (Rizik a se dopunjuje do jedinice koeficijentom pouzdanosti kojise, izraen u procentima naziva nivoom pouzdanosti).

Klik na Continue a zatim na OK.

99

Rezultati

One-Sample Statistics

N Mean Std. Deviation

Std. Error

Mean

izmerena tezina

u kilogramima16 1.01500 .013272 .003318

One-Sample Test

Test Value = 1

95% Confidence Interval

of the Difference

t df Sig. (2-tailed)

Mean

Difference Lower Upper

izmerena tezina

u kilogramima4.521 15 .000 .015000 .00793 .02207

Tumaenje rezultata

Aritmetika sredina uzorka je 1.015 kg a ocenjena vrednost standardne greke iznosi

0.0033. Vrednost statistike t je 4.521. Izraunati nivo znaajnosti ( p ili Sig. u SPSS

programu) je manji od standardnog nivoa znaajnosti (0.05). (u ovom sluaju p

100

Primer 2Merene su koncentracije olova u 37 sluajnih uzoraka odreene rude.

Da li se na osnovu podataka iz uzorka moe zakljuiti da je prosena koncentracija olova u

rudi vea od 30 mg/kg?

Polazni podaci:

Variable View

Data View

101

Rezultati:

Tumaenje rezultata:

a) Prosena koncentracija olova u uzorku (Mean) iznosi 37.124 mg/kg. Da bi odredili da li su

dobijeni podaci iz uzorka dovoljni dokaz da prihvatimo istraivaku hipotezu da je

koncentracija olova u rudi vea od 30 mg/kg posmatramo izraunatu vrednost statistike

dvostranog t testa (1.187) i odgovarajui realizovani nivo znaajnosti (Sig. = 0.243

(dvostrano)). Kako nas u ovom primeru zanima vrednost realizovanog nivoa znaajnosti koji

odgovara jednostranom t testu, koju SPSS ne rauna, tu vrednost dobijamo kada 0.243

podelimo sa dva. U ovom sluaju sledi da je Sig. = 0.122 (jednostrano). Kako je realizovani

nivo znaajnosti vei od standardnog nivoa znaajnosti (Sig. > 0.05) zakljuujemo da nepostoji dovoljno dokaza da je koncentracija olova u rudi vea od 30 mg/kg.

102

PrimerNa osnovu sprovedenog istraivanja utvreno je da proseno vreme spavanja u populaciji

odraslih u SAD iznosi 7 sati. U cilju ispitivanja hipoteze da studenti u proseku dnevno

spavaju manje od populacije odraslih, u SAD je sprovedeno novo istraivanje koje je

obuhvatilo uzorak od 40 sluajno izabranih studenata. Za svakog studenta iz uzorka odreeno

je njegovo proseno dnevno vreme spavanja i rezultati su uneti u SPSS program. Na osnovu

prikupljenih podataka odrediti:

1) 95% interval poverenja za proseno vreme spavanja studenata.

2) testirati hipotezu da studenti u proseku spavaju manje od cele populacije odraslih.

Postupak

1. 95% interval poverenja za prosenu vrednost moemo odrediti na nekoliko naina.

Izaberite Analyze, Descriptive analysis, Explore.

Promenljivu dnevno vreme spavanja prebacite u polje Dependent List.

103

Pritisnite OK.

Tumaenje rezultata

U tabeli Descriptives vidimo donju i gornju granicu 95% intervala poverenja za prosek. Donja

granica iznosi 6.131 dok gornja granica iznosi 6.644. Traeni interval poverenja je [6.131,

6.644].

2. Kako bi testirali hipotezu da je proseno vreme spavanja studenata krae od 7 sati

primeniemo t test za jedan uzorak. Iz menija klik na Analyze, zatim Compare Means i

onda One-Sample T-test.

Promenljivu dnevno vreme spavanja prebacite u polje Test Variable(s). U polje Test Value

upiite vrednost koju testirate. U ovom sluaju to je 7 sati.

104

Pritisnite OK.

Tumaenje rezultata

U tabeli One-sample Statistics vidimo statistiku uzorka. Proseno vreme spavanja iznosi

6.3875, standardna devijacija 0.8020 i standardna greka 0.1268:

U tabeli One-Sample Test vidimo rezultate dvostranog t testa koji testira istraivaku hipotezu

da je prosena vrednost u istraivakom skupu razliita od testirane vrednosti.

U ovom sluaju nulta hipoteza je da je proseno vreme spavanja studenata jednako 7 sati dok

je istraivaka hipoteza da je proseno vreme spavanja studenata razliito od 7 sati.

Poto se testira istraivaka hipoteza da je proseno vreme spavanja manje od 7 sati potrebni

su nam rezultati jednostranog T testa koji SPSS ne radi. Pa ipak, na osnovu dobijenih rezultata

koji se odnose na dvostrani t test lako moemo zakljuiti da li prihvatamo istraivaku

hipotezu.

105

Odgovarajui realizovani nivo znaajnosti iznosi Sig. = 0.000 (dvostrano) (to zapravo znai

da je Sig. (dvostrano)

106

6. Testovi za ispitivanje razlika izmeu

grupa

6.1. T test za nezavisne grupe (T-Test for Independent

Groups)

T test za nezavisne grupe se koristi za testiranje razlika izmeu prosenih vrednosti

obeleja dva nezavisne grupe. Nezavisnost grupa znai da sluajan izbor elemenata u uzorak

iz jedne grupe nema uticaja na sluajni izbor elementa u uzorak iz druge grupe.

Primeri:

Da li se domai i uvozni proizvodi razlikuju po kvalitetu?

Da li su prosene zarade u jednoj delatnosti vee od prosene zarade u drugoj delatnosti?

Da li se mukarci i ene razlikuju po rezultatima testiranja na standardnom testu pamenja?

Uslovi

-Mora postojati samo jedna nezavisna kategorijska varijabla (primer pol ispitanika);

-Nezavisna varijabla moe imati samo dve vrednosti (primer: muki pol, enski pol);

-Mora postojati samo jedna zavisna neprekidna varijabla.

Pretpostavke

1) Sluajni uzorci su meu sobom nezavisni.

2) Osnovni skupovi su normalno rasporeeni i njihove nepoznate varijanse su meu sobom

jednake.

107

Primer 1

Istraiva eli da ispita da li se studenti mukog pola razlikuju po svojim mogunostima

pamenja od svojih koleginica. Po deset mukih i enskih studenata je sluajno izabrano sa

prve godine kako bi bili testirani.

Svim ispitanicima su proitane trideset nepovezanih rei a zatim je zahtevano da ponove to

vie zapamenih rei. Ukupan broj ispravno ponovljenih rei svakog ispitanika je zabeleen.

Rezultati testa su prikazani tabelarno:

108

Analiza rezultata

Iz menija klik na Analyze, zatim Compare Means i onda Independent-Samples T-test.


Kako je pol nezavisna varijabla prebacite je u polje Grouping Variable. Promenljiva ukupan

broj ispravno ponovljenih rei predstavlja zavisnu varijablu i ona se prebacuje u polje Test

Variable(s):

Klik na Define Groups da bi definisali vrednosti za nezavisnu varijablu pol (kodiranu kao 1-

mukarci, 2-ene). U prozoru Define Groups ukucati 1 za prvu grupu (Group 1) i 2 za drugu

grupu (Group 2). Zatim klik na Continue.

109

Kada se otvori prozor Independent-Samples T Test klikom na OK startujemo analizu.

Rezultati

Tumaenje rezultata

U prvoj tabeli Group Statistics dobijamo statistike uzorka. Prosek ukupnog broja

ispravno ponovljenih rei u uzorku mukaraca iznosi 17.7 ( M=17.7), standardna devijacija

3.335 (SD=3.335). Prosek ukupnog broja ispravno ponovljenih rei u uzorku ena iznosi 22.1

( M=22.1), standardna devijacija 3.178 (SD=3.178).

Kako bi proverili da li je uoena razlika u prosenom broju ispravno ponovljenih rei

izmeu studenata i studentkinja statistiki znaajna posmatramo rezultate date u tabeli

Independent Samples Test.

U izlaznim rezultatima SPSS-a dobijaju se dva niza rezultata, jedan za situacije u kojima

pretpostavka o jednakosti varijanse nije naruena a drugi za one kada jeste.

Za testiranje hipoteze o jednakosti varijansi dva skupa koristi se Leveneov test

jednakosti varijansi (Levenes Test for Equality of Variances). Kada je izraunati nivo

110

znaajnosti tog testa Sig. manji od 0.05 to znai da varijanse dveju grupa nisu jednake i da ne

vai pretpostavka o homogenosti varijanse.

Kako je statistika F testa mala F=0.087 i odgovarajui izraunati nivo znaajnosti

Leveneovog testa jednakosti varijansi veliki (Sig. = 0.772 > 0.05), pretpostavka o

homogenosti varijansi je potvrena i rezultati t testa iz prvog reda se koriste za testiranje nulte

hipoteze o jednakosti prosenih vrednosti dva skupa.

Rezultati t-testa ukazuju da je prisutna statistiki znaajna razlika izmeu mukog i

enskog uzorka u pogledu proseka upamenih rei t(18) = 3.02, Sig. = 0.007

111

Predstavljanje rezultata t-testa

Rezultate ove analize mogli bismo predstaviti ovako:

Rezultati T test za nezavisne grupe ukazuju na statistiki znaajnu razliku u prosenom broju

ispravno ponovljenih rei kod studenata (M=17.70, SD=3.335) i studentkinja (M=22.10, SD=

3.178) t(18)= -3.020, p=0.007, =0.05. Razlika izmeu srednjih vrednosti obeleja po

grupama (prosena razlika = - 4.4, 95% CI: - 7.46 do 1.34) bila je vrlo velika (eta kvadrat

=0.366).

112

Primer 2

Istraiva eli da ispita razliku izmeu nivoa holesterola u krvi ljudi iz grada i nivoa

holesterola u krvi ljudi iz sela. Sluajno su izabrani sedam ljudi iz grada i sedam ljudi iz sela

kako bi bili testirani. Svim ispitanicima je uradjen laboratorijski nalaz krvi i svaki od njih je

zabelezen. Rezultati laboratorijskih nalaza kvri su prikazani tabelano:

Mesto Holesterol Mesto HolesterolSelo1 3.88 Grad1 4.31Selo2 4.11 Grad2 3.87Selo3 6.18 Grad3 3.07Selo4 8.10 Grad4 2.22Selo5 6.05 Grad5 4.19Selo6 5.57 Grad6 6.63Selo7 7.83 Grad7 3.00

Kodiranje podataka:

Kodiranje podataka emo izvriti na sledei nain:

Variables Columns CodeMesto 1 1=selo, 2=gradHolesterol 2 Nivo holesterola u krvi

U programu SPSS-u se zadatak radi na sledei nain:

113

Iz menija klik na Analyze, zatim Compare Means i onda Independent-Samples T-test.


Kako je mesto nezavisna varijabla prebacite je u polje Grouping Variable. Promenljiva nivo

holesterola u krvi predstavlja zavisnu varijablu i ona se prebacuje u polje Test Variable(s):

114

Klik na Define Groups da bi definisali vrednosti za nezavisnu varijablu pol (kodiranu kao 1-

mukarci, 2-ene). U prozoru Define Groups ukucati 1 za prvu grupu (Group 1) i 2 za drugu

grupu (Group 2). Zatim klik na Continue.

Kada se otvori prozor Independent-Samples T Test klikom na OK startujemo analizu.

Tumaenje rezultata:

Za testiranje hipoteze o jednakosti varijansi dva skupa koristi se Levenes Test for

Equality of Variances. Kako je statistika F testa mala F=0.252 i odgovarajui realizovani

nivo znaajnosti veliki (p=0.624>0.05) pretpostavka o homogenosti varijansi je potvrena pa

se rezultati t testa prezentovani u prvom redu mogu koristiti za testiranje nulte hipoteze o

jednakosti prosenih vrednosti dva skupa.

Rezultati ove analize pokazuju da je prisutna statistiki znaajna razlika izmeu nivoa

holesterola u krvi kod ljudi iz grada i ljudi iz sela t(12)=2,52, p=0.027

115

Iz ove analize zakljuujemo da ljudi u selu imaju vei proseni nivo holesterola u krvi

(M=5,96) od ljudi u gradu iji je proseni nivo holesterola u krvi 3,89 (M=3,89) i da su

dobijeni rezultati statistiki znaajni, t(12)=2.52, p=0.027 (obostrano).

Izraunavanje veliine uticaja

Eta kvadrat = ( )27752.252.2

2

2

-++=0.346

Eta kvadrat ukazuje na postojanje velike razlike.

Razlika izmeu srednjih vrednosti nivoa holesterola po grupama (prosena razlika 2.06, 95%

CI: 0.28 do 3.24) je vrlo velika (eta kvadrat = 0.346).

116

6.2. T test za zavisne uzorke (Paired-Samples T-Test)

T test zavisnih uzoraka (u literature se naziva i T-test uparenih uzoraka ili T-test

ponovljenih merenja) upotrebljavama kada imamo samo jednu grupu ljudi (ili maina,

preduzea, itd. tj. subjekata). U ovom sluaju, svaki ispitanik se testira dva puta u odnosu na

istu variablu. Uobiajni eksperiment ukljuuje stanja pre i posle.

Uslovi

-U svakoj analizi moraju postojati samo dva seta podataka;

-Dva seta podataka moraju biti prikupljeni od istih ispitanika ili od dve grupe povezanih

ispitanika.

Primer

Istraiva je dizajnirao eksperiment sa ciljem testiranja uticaja leka X na apetit mieva.

Praena je i beleena koliina hrane koju je grupa mieva pojela u peridu od jedne nedelje pre

uzimanja leka. Zatim je mievima dat lek i beleena je koliina hrane koju su pojeli u periodu

od nedelju dana posle uzimanja leka. Sledee koliine hrane u gramima su pojedene pre i

posle konzumiranja leka.

Koliina pojedene hrane u gramima

Pre uzimanja leka Posle uzimanja leka

S1 100 60

S2 180 80

S3 160 110

S4 220 140

S5 140 100

S6 250 200

S7 170 100

S8 220 180

S9 120 140

S10 210 130

117

Kodiranje podataka je izvreno na sledei nain:


pre 1 Koliina pojedene hrane (u

gramima)

posle 2 Koliina pojedene hrane (u

gramima)

Podaci su uneti u SPSS program kako je dato:

Iz menija klik na Analyze, zatim Compare Means i Paired-Samples T test. Otvara se

sledei prozor:

Prebacite pre i posle promenljive u Paired Variables polje. Kada se otvori Paired-Samples

T Test prozor startujte T-Test analizu.

118

Rezultati

Tumaenje rezultata

Rezultati ukazuju da postoji razlika u koliini hrane pojedenoj pre dejstva leka i posle i

da je ova razlika statistiki znaajna t(9) =5.08, p< 0.01.

Izraunate prosene vrednosti ukazuju da su mievi pojeli znaajno manju koliinu hrane pod

uticajem leka. (pre: M=177.00, posle: M=124.00).

119

Izraunavanje veliine uticaja u T-testu zavisnih uzoraka

Rezultati T-testa zavisnih uzoraka nam pokazuju da li je uoena razlika statistiki znaajna.

Meutim, utvrivanje statistike znaajnosti uoene razlike izmeu posmatrana dva skupa

nam nita ne govori o veliini te razlike tj. o veliini uticaja analiziranog faktora koji

uslovljava uoenu razliku. Utvrena statistika znaajnost nam jedino kazuje da je

verovatnoa da je uoena razlika izmeu dva skupa sluajna veoma mala (manja od granine).

Za odreivanje veliine uticaja moe se koristiti eta kvadrat pokazatelj koji se rauna po

sledeoj formuli:

Eta kvadrat =12

2

-+ Ntt

U naem primeru imamo:

Eta kvadrat =110076.5

076.52

2

-+ = 0.741

Smernice za tumaenje ove veliine glase:

0.01=mali uticaj, 0.06=umeren uticaj, 0.14=veliki uticaj.

Poto smo dobili eta kvadrat jednak 0.741, zakljuujemo da je veoma velika razlika u koliini

hrane pojedenoj pre dejstva leka i posle.

Predstavljanje rezultata T-testa zavisnih uzoraka

T-testom zavisnih uzoraka procenjen je uticaj dejstva leka na nedeljnu pojedenu

koliinu hrane kod mieva. Utvrena je statistiki znaajno smanjenje koliine hrane

koju su mievi pojeli za nedelju dana pod dejstvom leka (pre dejstva leka: M=177.00,

SD= 48.3, posle dejstva leka: M=124.00, 43.3), t(9) =5.08, p< 0.01 (obostrano).

Proseno smanjenje koliine pojedene hrane bilo je 53.0 grama dok se interval 95-

procentnog poverenja razlike protee od 29.3 do 76.6 grama.

Vrednost eta kvadrat pokazuje da je uticaj leka na koliinu pojedena hrane mieva

veliki.

120

6.3. Analiza varijanse sa jednim faktorom (ANOVA) (One-Way Analysis of

Variance)

Upoznali smo postupak testiranja hipoteze o razliitosti aritmetikih sredina dva

osnovna skupa. U praksi se, meutim, esto javljaju situacije u kojima je potrebno uporediti

aritmetike sredine vie od dve populacije.

Primeri:

Istraiva eli da uporedi prosene prinose kukuruza na parcelama na kojima su primenjene

etiri razliite vrste vetakih ubriva, ili prosenu dnevnu proizvodnju s obzirom na tri

naina organizacije posla, ili prosean vek trajanja automobilskih guma razliitih

proizvoaa.

ANOVA je ekstenzija nezavisnog t testa. Koristi se kada istrazivaa zanima da li se

aritmetike sredine vie od dve nezavisne grupe (skupa) razlikuju meusobno. Na primer,

istraiva eli da ispita da li se prosene vrednosti etiri etnike grupe postignute na testu

inteligencije razlikuju meusobno.

Uslovi

-Mora postojati samo jedna nezavisna varijabla (primer: nacionalna pripadnost);

-Nezavisna varijabla mora imati vie od dve vrednosti (primer: Amerikanac, Afrikanac,

Evropljanin i Azijat);

-Mora postojati samo jedna zavisna varijabla.

Pretpostavke

-Svi osnovni skupovi (populacije) iz kojih su uzeti uzorci imaju normalni raspored;

-Homogenost (jednakost) varijansi skupova;

-Opservacije su meusobno nezavisne.

121

Primer 1

Istraiva ispituje da li intenzitet elektrinog oka utie na vreme potrebno za reavanje seta

sloenih problema. Sluajnim uzorkovanjem odreeno je ukupno 18 ispitanika. Grupe od po 6

ispitanika su, zatim, izloeni razliitim intenzitetima elektrinog oka (slabi (Low); srednji

(Medium); Visoki (High)). Zatim je mereno vreme (u minutima) potrebno da svaki ispitanik

rei postavljene probleme.

Intenzitet elektrinog oka

Slab Srednji Jak

Ispitanik1 15 Ispitanik7 30 Ispitanik13 40






Kodiranje podataka je izvreno na sledei nain:


ok 1 1=slab, 2=srednji, 3=jak

Vreme 2 Vreme (u minutima)

Podaci su uneti u SPSS program na prikazani nain:

122

Posle unosa podataka analiza se vri na sledei nain.

Iz menija klik na Analyze, zatim Compare Means i One-Way ANOVA. Otvara se One-

Way ANOVA prozor:

Prebacite zavisnu varijablu vreme u polje Dependent List a nezavisnu varijablu sok u polje

Factor.

123

ANOVA e dati uoptene rezultate koji obuhvataju istovremeno poreenje sva tri uticaja

razliitih intenziteta oka na vreme. Da bi bile analizirane razlike izmeu pojedinih parova

intenziteta oka ( slab intenzitet oka prema srednjem intenzitetu oka; slab intenzitet oka

prema jakom intenzitetu oka i srednji intenzitet oka prema jakom intenzitetu oka) potrebno

je izvesti Post Hoc poreenje. Ovo se postie klikom na Post Hoc.

Kada se otvori prozor One-Way ANOVA: Post Hoc Multiple Comparisons obeleiti

Scheffe opciju kako bi se izveo Scheff Post Hoc test. Zatim klik na Continue.

Kada se otvori One-Way ANOVA prozor klik kako bi se otvorio One-Way ANOVA:

Options prozor. Oznaiti opciju Descriptive i zatim klik na Continue.

124

Kada se otvori One-Way ANOVA prozor analiza se startuje klikom na OK.

Rezultati

125

Tumaenje rezultata

Rezultati pokazuju da intenzitet elektrinog oka ima znaajan uticaj na vreme reavanja

problema F(2,15) = 40.13, p

126

U ovom primeru, zbir kvadrata odstupanja razliitih grupa (2100) treba podeliti ukupnim

zbirom kvadrata odstupanja (2492.5).

Dobija se eta kvadrat jednak 0.84, to po Koenovom kriterijumu kazuje da je uticaj razlike

veliki. Koen klasifikuje 0.01 kao mali uticaj, 0.06 kao srednji uticaj i 0.14 kao veliki uticaj.

Predstavljanje rezultata jednofaktorske analize varijanse

Jednofaktorskom analizom varijanse istraen je uticaj intenziteta elektrinog oka na

vreme reavanja problema. Primenjeni intenzitet oka je klasifikovan kao slab, srednji i

jak. Subjekti su, prema nivou intenziteta oka kome su bili izloeni, bili podeljeni u tri

grupe (grupa 1: slab intenzitet oka,

Documents

knjiga SPSS analiza