Upload
vukmihajlovic90
View
749
Download
46
Embed Size (px)
Citation preview
Univerzitet u Beogradu
Tehniki fakultet u Boru
Dr Dragan Manasijevi
Statistika analiza u SPSS programu(autorizovana predavanja)
Bor, 2011
2Sadraj1. Uvod u SPSS1.1. Priprema radnog fajla1.2. Unos podataka u radni list
2. Deskriptivna statistika2.1. Uvod2.2. Deskriptivna statistika analiza u SPSS-u2.3. Unakrsno tabeliranje
3. Grafiko prikazivanje statistikih rezultata3.1. Stubiasti dijagram3.2. Histogram3.3. Linijski dijagram3.4. Dijagram rasprenosti
4. Analiza pitanja sa viestrukim odgovorima (Multiple Response)
5. Uvod u analitiku statistiku5.1. Statistiko ocenjivanje5.2. Testiranje statistikih hipoteza5. 3. Testiranje pretpostavke normalne raspodele osnovnog skupa u SPSS-u5.4. Testiranje hipoteze zasnovano na jednom uzorku (One-Sample T-test)
6. Testovi za ispitivanje razlika izmeu grupa6.1. T test za nezavisne uzorke (T-Test for Independent Groups)6.2. T test za zavisne uzorke (Paired-Samples T-Test)6.3. Analiza varijanse sa jednim faktorom (ANOVA) (One-Way Analysis of Variance)6.4. Viefaktorska analiza varijanse (Factorial Analysis of Variance)
7. Tehnike za istraivanje veza izmeu raznih obeleja7.1. Korelaciona analiza primenom SPSS-a7.1.1. Uvod7.1.2. Pearsonov koeficijent proste linearne korelacije (Pearson product moment correlation coefficient)7.1.3. Spearmanov koeficijent korelacije ranga (Spearman Rank Order Correlation Coefficient)7.2 Linearna regresija primenom SPSS-a7.2.1. Uvod7.2.2 Primeri7.3. Viestruka regresija primenom SPSS-a7.3.1 Uvod7.3.2. Primeri
8. Faktorska analiza primenom SPSS-a8.1. Uvod8.2. Primer
9. Klaster analiza primenom SPSS-a9.1. Uvod9.2 Primer
10. Neparametarske tehnike10.1. Hi-kvadrat nezavisnosti10.2 Man-Vitnijev U test10.3. Vilkoksonov test ranga10.4. Kruskal-Volisov test
11. Provera pouzdanosti merne skale
12. Literatura
31. Uvod u SPSS
SPSS (Statistical Package for the Social Sciences) je statistiki softverski paket u
kome su implementirani gotovo svi konvencionalni statistiki metodi. Najnovija verzija je
18.0 ali vano je znati da, kada je u pitanju ovaj softverski paket, sama verzija ne predstavlja
neku preterano vanu karakteristiku s obzirom na to da svaka verzija ovog softvera
predstavlja dovoljno moan alat, koji sam po sebi zasluuje panju.
Osnovna prednost ovog softverskog paketa jeste nain na koji je osmiljena realizacija
same statistike analize. Bez obzira na to o kojoj se vrsti analize radi, do konanih rezultata se
uvek dolazi kroz etiri jednostavna koraka:
Faze statistike obrade podataka u SPSS-u
41.1. Priprema radnog fajla
Pretpostavimo da je sprovedeno istraivanje studenata jednog fakulteta u cilju
odreivanja njihovog zadovoljstva nastavom na fakultetu i njihovim uspehom na studijama.
Odgovori 20 sluajno izabranih ispitanika su prikupljeni primenom anketnog lista sa sledeim
pitanjima:
1. Pol (zaokruiti): 1. Muki 2. enski
2. Starost (upisati broj godina) ___________
3. Godina studija (zaokruiti): 1. godina 2. godina 3. godina 4. godina
4. Kako bi ste ocenili kvalitet nastave na fakultetu (zaokruiti jedan od ponuenih odgovora):
1. Veoma lo
2. Lo
3. Prosean
4. Dobar
5. Veoma dobar
5. Koliko ste zadovoljni vaim dosadanjim uspehom na studijama (zaokruiti jedan od
ponuenih odgovora):
1. Veoma nezadovoljan
2. Nezadovoljan
3. Ni nezadovoljan ni zadovoljan
4. Zadovoljan
5. Veoma zadovoljan
5Kodiranje podataka
Pre samog unosa podataka u program neophodno je izvriti kodiranje podataka.
Kodiranje obuhvata definisanje imena varijabli i dodeljivanje brojanih vrednosti odgovorima
na pitanja iz upitnika. Naredna tabela prikazuje kodiranje podataka za dato istraivanje.
Kodiranje podataka:
Broj pitanja Varijabla Ime varijable u
SPSS-u
Kod
1. pitanje Pol ispitanika Pol 1=muki
2=enski
2. pitanje Starost ispitanika Starost Broj godina
3. pitanje Godina studija Godina 1=1. godina
2=2. godina
3=3. godina
4=4. godina
4. pitanje Ocena kvaliteta nastave Kvalitet 1=veoma lo
2=lo
3=prosean
4=dobar
5=veoma dobar
5. pitanje Zadovoljstvo dosadanjim
uspehom
Uspeh 1=veoma
nezadovoljan
2=nezadovoljan
3=ni nezadovoljan ni
zadovoljan
4=zadovoljan
5=veoma zadovoljan
6Prikupljeni podaci
Naredna tabela prikazuje odgovore prikupljene anketiranjem 20 ispitanika:
Pol Starost Godina Kvalitet Uspeh
2 19 2 2 2
1 22 3 3 5
2 24 4 4 4
2 22 2 2 2
1 20 2 3 2
1 23 2 3 1
1 19 1 5 4
2 24 3 3 3
2 26 4 2 3
1 24 3 1 2
1 22 3 4 3
2 21 2 4 2
1 24 4 3 5
1 21 2 4 2
2 24 3 4 3
2 22 3 4 5
1 26 3 2 1
1 22 2 3 3
1 24 3 4 3
2 22 2 3 2
7Kreiranje radnog fajla u SPSS-u
Sledei koraci demonstriraju kako se prikupljeni podaci prikazani u prethodnoj tabeli
unose u radni fajl SPSS-a.
Kada se startuje SPSS program pojavljuje se sledei prozor.
Poto elimo da kreiramo novi fajl sa podacima zatvaramo prozor.
8Pojavljuje se Untitled SPSS Data Editor prozor:
Koristei pripremljenu knjigu kodova unosimo imena varijabli i njihove karakteristike.
(Type, Width, Decimals, Label, Values, Missing, Columns, Align, and Measure)
Na primer, varijabla Pol je kodirana kao 1-muki i 2-enski. U prvoj eliji ispod Name se
unosi ime prve varijable Pol. Da bi se varijabli dodelile kodirane vrednosti odgovora potrebno
je kliknuti na odgovarajuu eliju ispod Values. Dobija se:
Klikom na oseneni deo elije dobija se sledei Value Labels prozor:
Unesite 1 u polje Value i unesite Muki u polje Value Label. Klik na Add polje da bi se
zavrio unos kodova za muke ispitanike. Zatim se postupak ponavlja za enske ispitanike.
Popunjeni Value Labels prozor ima sledei izgled:
9Klikom na OK zavravamo unos podataka za varijablu Pol i vraamo se na Untitled SPSS
Data Editor list.
Ovaj postupak se ponavlja za sve preostale varijable.
Varijabla Starost je kontinualna varijabla i kao takva ona nema kodirane vrednosti odgovora.
U polju Label mogu se uneti potpuniji nazivi varijabli kako je prikazano:
10
1.2. Unos podataka u radni listPrikupljeni podaci se unose preko Data View prozora. Preite sa Variable View prozora na
Data View klikom na Data View.
U Data View prozoru redovi predstavljaju ispitanike a kolone varijable. Primer unetih
podataka je dat na donjoj slici:
11
2. Deskriptivna statistika
2.1. UvodStatistiki metodi istraivanja masovnih pojava mogu se podeliti u dve osnovne grupe.
Jedna obuhvata metode prikupljanja, sreivanja i prikazivanja podataka i metode odreivanja
parametara. Ona spada u domen deskriptivne statistike.
Drugu grupu sainjavaju metodi statistike analize, iji je osnovni zadatak objanjenje
varijabiliteta pomou klasifikacionih, korelacionih i drugih statistikih pokazatelja, kao i
statistiko zakljuivanje na osnovu uzorka. Ovim metodama bavi se analitika statistika,
koja se, meutim, ne moe strogo razgraniiti od deskriptivne statistike.
Ceo proces statistikog istraivanja, prema tome, moe se svesti u tri osnovne etape:
1) statistiko posmatranje, 2) sreivanje, grupisanje i obrada podataka i 3) statistika analiza.
Ispitivanjem odreene pojave na svim jedinicama statistikog skupa dobijamo mnotvo
statistikih podataka. Prisustvo mnotva brojanih podataka, bez obzira kako su ureeni
priinjava tekoe u pogledu dobijanja jedinstvene, jasne, koncizne i celovite predstave o
pojavi koju posmatramo. Zato nastojimo da seriju podataka zamenimo jednom ili veim
brojem numerikih karakteristika koje bi pruile to vie informacija o skupu i reprezentovale
skup. Pokazatelje rasporeda frekvencija koji pokazuju ceo osnovni skup nazivamo
parametrima skupa i svrstavamo ih u tri grupe. Jednu sainjavaju srednje vrednosti, kao mere
centralne tendencije rasporeda; drugu mere disperzije (rasprenosti), i treu mere oblika
rasporeda.
Pokazatelji rasporeda frekvencija reprezentuju skup ili uzorak, odnosno pripisuju se
skupu ili uzorku u zavisnosti da li se analizira raspored frekvencija skupa ili raspored
frekvencija uzorka. Deskriptivne mere koje se odnose na sve jedinice skupa nazivaju se
parametrima skupa, a deskriptivne mere koje se odnose na uzorak su statistike uzorka.
12
Mere centralne tendencije
Srednja vrednost je pokazatelj centralne tendencije i pokazuje lokaciju skupa. Srednja
vrednost se koristi u svim oblastima statistike analize. U zavisnosti od naina odreivanja
centralne vrednosti obeleja skupa srednje vrednosti se dele na: izraunate (aritmetika,
geometrijska, harmonijska, kvadratna, kubna), koje se izraunavaju na osnovu svih vrednosti
obeleja i pozicione (modus i medijana), koje se odreuju poloajem u seriji. Koja e se
vrednost uzeti kao parametar statistikog skupa zavisi od posmatrane pojave i od naina
grupisanja podataka.
Aritmetika sredina
Najiru upotrebu u statistikoj analizi stekla je aritmetika sredina ili, kako se popularno
zove prosek. Aritmetika sredina skupa se dobija kad se zbir svih vrednosti obeleja podeli
njihovim brojem. Ako je posmatrano obeleje X, njegove vrednosti x1, x2,..,xi,..,xN njihov broj
N, aritmetika sredina skupa, koju emo oznaiti sa m, dobie se kao:
=
=+++=N
ii
N xNN
xxx1
21 1...m ili uproenoN
x=mAko na pet ekonomskih fakulteta broj upisanih studenata u prvu godinu studija iznosi 820,
830, 860, 880 i 910, prosean broj upisanih, odnosno, aritmetika sredina bie:
8605
43005
910880860830820 ==++++== N
xm
Za uzorak, veliine n, aritmetika sredina negrupisanih podataka uzorka, koju oznaavamo sa
x ( i itamo x bar) jednaka je:
=
=+++++=n
ii
ni xnn
xxxxx
1
21 1.......
Geometrijska sredina
Geometrijska sredina se ne dobija iz zbira nego iz proizvoda vrednosti podataka, s tim
to se iz ovog uzima pozitivna vrednost korena iji je izloitelj jednak njihovom broju. Ako
posmatrano obeleje oznaimo sa X, a njegove vrednosti x1, x2,..,xi,..,xN, onda e geometrijska
sredina tih vrednosti biti definisana formulom:
13
NNxxxG ...21 =
Zbog injenica da se geometrijska sredina dobija iz proizvoda vrednosti obeleja njeno
izraunavanje nije mogue ako je neka vrednost serije jednaka nuli, ili manja od nule; njeno
izraunavanje ima smisla kada su sve vrednosti posmatranog obeleja vee od nule.
Modus
Pored izraunatih srednjih vrednosti: aritmetike, geometrijske i harmonijske sredine,
kao pokazatelj lokacije javljaju se i pozicione srednje vrednosti. One se odreuju na osnovu
mesta-pozicije, koju zauzimaju u seriji. Najpoznatiji meu njima su modus i medijana.
Modus je vrednost obeleja koja u posmatranoj seriji ima najveu frekvenciju najee se
javlja i zato je najtipinija vrednost u seriji.
Kada je u jednoj seriji samo jedna vrednost obeleja sa najveom frekvencijom kaemo da je
unimodalna, a ako postoje dve ili vie takvih vrednosti, serija je bimidalna, odnosno
multimodalna.
Moe se desiti i da modusa nema. Na primer, ako godine radnog staa pet radnika iznose: 34,
12, 13, 15, 25, modus nee biti definisan. To je nedostatak modusa.
Medijana
Medijana je ona vrednost obeleja koja se nalazi u sredini serije ureene po veliini
obeleja, odnosno to je vrednost obeleja koja deli sumu svih frekvencija na dva jednaka dela,
tako da jedna polovina obuhvaenih sluajeva ima manju, a druga polovina veu vrednost od
medijane.
Ako su vrednosti obeleja poreane po veliini i od njih i od njih obrazovana serija
negrupisanih podataka:
x1, x2,..,xi,..,xN
pri odreivanju medijane treba razlikovati sluajeve kada je broj lanova N neparan i paran
broj. Ako je N neparan broj, tada srednji lan deli ovaj niz na dva jednaka dela. Tako e u
nizu podataka o starosti nastavnika u jednoj koli ureenih po veliini:
23, 25, 26, 28, 31
medijana biti 26, jer se ta vrednost nalazi u sredini ove serije.
14
Ako je broj lanova niza, N, paran, u njemu postoje dva srednja lana, pa se za ma koju
veliinu izmeu ta dva lana moe smatrati da niz deli na dva jednaka dela i po definiciji
moe uzeti kao medijana. Da bi se izbegla ova neodreenost, za medijanu se uzima
aritmetika sredina tih lanova. Tako e za niz podataka:
18, 19, 20, 22, 24, 26
medijana biti 21, tj. aritmetika sredina dva sredinja podatka.
Mere disperzije
Srednja vrednost karakterie dati raspored kao mera centralne tendencije vrednosti
obeleja, ali ona nije dovoljna karakteristika, jer drugi rasporedi mogu imati istu srednju
vrednost a razliiti varijaciju (rasprenost ili disperziju).
Statistiki opis skupa kao i uzorka iziskuje zato pored mera centralne tendencije, odnosno
lokacije i odgovarajue mere varijacije ili disperzije. Za merenje disperzije jedne serije koristi
se vie mera, od kojih neke imaju apsolutni a neke relativni izraz.
Apsolutne mere disperzije
Apsolutne mere disperzije iskazuju varijabilitet u apsolutnim iznosima onih mernih
jedinica u kojima su dati modaliteti posmatranog obeleja: u milionima dinara, hiljadama
tona, kilometrima, komadima itd. Ove mere kao i mere lokacije mogu biti pozicione i
izraunate u odnosu na srednju vrednost (najee aritmetiku sredinu) skupa ili uzorka.
Od pozicionih mera varijacije najee se koristi razmak ili interval varijacije, koji predstavlja
razliku izmeu najvie i najnie vrednosti obeleja u seriji:
Interval varijacije i=xmax-xminPrecizniju informaciju o varijabilitetu posmatrane serije daju pokazatelji ije se izraunavanje
zasniva na odstupanju srednje vrednosti, najee aritmetike sredine, od svih vrednosti
obeleja koja ta serija sadri. Odstupanja pojedinih vrednosti obeleja od aritmetike sredine
bie: d1=x1-m, d2=x2-m,....,dN=xN-m.Algebarski zbir ovih odstupanja, zbog svojstva aritmetike sredine, bie jednak nuli. Zato se,
umesto od algebarskih, polazi od apsolutnih odstupanja aritmetike sredine od vrednosti
obeleja, di=|xi-m|, iji prosek predstavlja meru varijabiliteta, poznatu kao srednje apsolutno
odstupanje ( d ). Za negrupisane podatke izraunava se po formuli:
=
-=N
iixN
d1
1 m
Poto je prosek odstupanja pojedinih vrednosti obeleja od aritmetike sredine jednak nuli,
moemo uzeti kao meru disperzije prosek kvadrata odstupanja, koja se naziva varijansom, s2.Za serije negrupisanih podataka izraunava se po obrascu:
15
Varijansa skupa ( )2
1
2 1 =
-=N
iixN
ms
Varijansa uzorka ( )21
2
11
=--=
N
ii xxn
s
Poto je varijansa iskazana u mernim jedinicama na kvadrat, uzima se njen pozitivan
kvadratni koren i dobija najee koriena apsolutna mera disperzije, standardna devijacija,
s.
Standardna devijacija skupa 2ss =
Standardna devijacija uzorka 2ss =
16
2.2. Deskriptivna statistika analiza u SPSS-u
Iz Menu bara klik na Analyze a zatim na Descriptive Statistics i Frequencies. Otvara se
sledei Frequencies prozor:
U polju sa leve strane prozora, koje sadri varijable, selektujte varijable za koje elite da
uradite deskriptivnu statistiku i prebacite ih u odgovarajue polje sa desne strane prozora.
17
Klik na Statistics otvara Frequencies: Statistics prozor. Pretpostavimo da istraivaa
zanimaju Mean (srednja vrednost), Median (medijana), Mode (modus) i Standard
Deviation (standardna devijacija).
Obeleite sve navedene veliine i zatim klik na Continue. Kada se otvori Frequencies prozor
klik na OK.
Rezultati analize su prikazani u sledeim tabelama.
18
19
Rezultati i njihova interpretacija
Tabela Statistics prikazuje izraunate statistike parametre: mean (prosek), median
(medijana), mode (modus) i standard deviation (standardna devijacija) za 5 ispitivanih
varijabli.
Varijable Pol i Godina studija su kategorijske (nominalne) varijable i za njih proraunate
vrednosti proseka, medijane, modusa i standardne devijacije nemaju znaaj. Znaajni
statistiki parametri za ove varijable su dati u tabeli frekvencija gde se vidi da je bilo 11
mukih (55%) i 9 enskih ispitanika (45%). Jedan ispitanik (5%) je na 1 godini, 8 ispitanika
(40%) je na drugoj godini, 8 ispitanika (40%) je na treoj godini i 3 ispitanika (15%) je na 4
godini.
Preostale tri varijable su merene najmanje na ordinalnom nivou (korienjem ordinalne skale
ili preciznijih skala) i za njih proraunate statistike veliine imaju znaenje.
Rezultati pokazuju da je prosena starost (mean) 20 ispitanika 22.5 godina, medijana za
godine starosti iznosi 22 godina.
Postoje dva modusa (22 god. i 26 god. se javljaju po 6 puta u tabeli frekvencija). SPSS
prikazuje niu vrednost 22 za modus (mode).
Varijabla Ocena kvaliteta nastave ima sledee izraunate vrednosti: prosek 3.15, medijana 3,
dva modusa 3 i 4 (obe vrednosti se javljaju po 7 puta u tabeli frekvencija) i standardna
devijacija 0.988.
Varijabla Zadovoljstvo dosadanjim uspehom ima sledee izraunate vrednosti: prosek 2.85,
medijana 3, modus 2 i standardna devijacija 1.225.
20
2.3. Unakrsno tabeliranjeUnakrsne tabele se esto koriste za ispitivanje odnosa izmeu kategorijskih promenljivih.
Primer konstrukcije unakrsne tabele u SPSS programu je data za sledei set podataka koji
obuhvataju pol i status prema puenju ispitanika.
Polazni podaci:
21
Postupak
U glavnom meniju pritisnite Analyze pa zatim Descriptive Statistics, zatim Crosstabs.
Prebacite promenljivu pol u Row(s) polje. Prebacite promenljivu pua u Column(s) polje.
Pritisnite dugme Cell. U prozoru Crosstabs: Cell Display treba da su obeleene Observed i
Colum opcije.
22
Rezultati i tumaenje
Kao rezultat analize SPSS konstruie sledeu tabelu:
U tabeli vidimo odnose izmeu kategorija ispitivanih promenljivih pol i pua. U prvom redu
su prikazani muki ispitanici. Od ukupno 16 mukih ispitanika 7 su se izjasnili kao puai dok
su 9 nepuai. Od ukupno 14 enskih ispitanika 9 su puai dok 5 nisu.
43.8% od ukupnog broja puaa su mukarci dok 56.3% ine ene.
64.3% od ukupnog broja nepuaa su mukarci dok 35.7% ine ene.
23
3. Grafiko prikazivanje statistikih
podataka
Serije statistikih podataka mogu se radi razumljivijeg i interesantnijih izraavanja
prikazati grafiki u vidu geometrijskih oblika tj. dijagrama. Izbor vrste dijagrama zavisi od
podataka i ciljeva istraivanja. Oni mogu biti u vidu taaka, linijski, povrinski i prostorni.
3.1. Stubiasti dijagram (engl. Bar Chart)
Stubiasti dijagrami mogu biti jednostavni ili veoma sloeni, u zavisnosti od broja
ukljuenih promenljivih. Stubiasti dijagram moe prikazivati broj sluajeva (ispitanika) u
odreenim kategorijama ili vrednost neprekidne promenljive za razliite kategorije.
a) Primer stubiastog dijagrama koji prikazuje broj ispitanika u odreenim kategorijama
Kategorijska promenljiva: starosna grupa
24
b) Primer stubiastog dijagrama koji prikazuje vrednost neprekidne promenljive za razliite
kategorije jedne kategorijske promenljive
Neprekidna promenljiva: Broj poena na testu iz opte kulture i informisanosti
Kategorijska promenljiva: Nivo obrazovanja
25
c) Primer stubiastog dijagrama koji prikazuje vrednost neprekidne promenljive za razliite
kategorije dve kategorijske promenljive
Neprekidna promenljiva: Broj poena na testu opte kulture i informisanosti
Kategorijske promenljive: Nivo obrazovanja, Starosna grupa
26
Postupak crtanja stubiastog dijagramaNa osnovu sledeih podataka konstruisati:
a) stubiasti dijagram koji prikazuje broj ispitanika po starosnim grupama.
b) stubiasti dijagram koji prikazuje prosene vrednosti promenljive broj poena na testu iz
opte kulture za razliite kategorije u okviru promenljive obrazovanje.
c) stubiasti dijagram koji prikazuje prosene vrednosti promenljive broj poena na testu iz
opte kulture za razliite grupe u okviru promenljivih obrazovanje i starost ispitanika.
27
a) Iz menija biramo: GraphsBar
U Bar Charts prozoru biramo Simple i Summaries for groups of cases:
Zatim pritisnite Define.
U prozoru Define Simple Bar: Summaries for Groups of Cases promenljivu starosna grupa
prenosimo u polje Category Axis i zatim pritisnemo OK.
28
Rezultat je prikazan na sledeoj slici:
b) Iz menija biramo: GraphsBar
U Bar Charts prozoru biramo Simple i Summaries for groups of cases:
Zatim Define.
U polju Bars represent izaberite Other statistic. Prebacite neprekidnu promenljivu broj
poena na testu iz opte kulture i informisanosti u polje Variable. Prebacite kategorijsku
promenljivu nivo obrazovanja u polje Category Axis i zatim pritisnite OK.
29
Rezultat je prikazan na sledeoj slici:
30
c) Iz menija biramo: GraphsBar
U Bar Charts prozoru biramo Clustered i Summaries for groups of cases:
Zatim Define.
U polju Bars Represent izaberite Other statistic. Prebacite neprekidnu promenljivu broj
poena na testu iz opte kulture i informisanosti u polje Variable. Prebacite kategorijsku
promenljivu nivo obrazovanja u polje Category Axis a kategorijsku promenljivu starosna
grupa u polje Define Clusters by. Zatim pritisnite OK.
31
Rezultat je prikazan na sledeoj slici:
32
33
Primer.
Prikupljeni su podaci o kolskoj spremi ispitanika. Konstruisati odgovarajui stubiasti
dijagram.
Polazni podaci i njihov unos u SPSS program:
34
Reenje:
Iz menija biramo: GraphsBar
U Bar Charts prozoru biramo Simple i Summaries for groups of cases:
Zatim Define.
U prozoru Define Simple Bar: Summaries.. varijablu Sprema prenosimo u polje Category
Axis i zatim OK.
35
Dobijamo sledei stubiasti dijagram:
Stubiaste dijagrame esto koristimo i kada elimo da prikaemo odnos izmeu dve
kategorijske varijable.
Primer
Zaposleni u jednoj u organizaciji su anketirani koliko su zadovoljni svojim poslom. Ponueni
su sledei odgovori: veoma nezadovoljan, nezadovoljan, ni nezadovoljan ni zadovoljan,
zadovoljan, veoma zadovoljan. Istraivaa zanima da li postoji razlika u odgovorima izmeu
enskih i mukih ispitanika.
36
Polazni podaci i njihov unos u SPSS program:
Reenje:
Iz menija biramo: GraphsBar
U Bar Charts prozoru biramo opciju Stacked i Summaries for groups of cases.
U prozoru Define Stacked Bar definiemo Category Axis i Define Stacks polja kako je dato
na slici:
37
Zatim OK.
Dobijamo sledei stubiasti dijagram:
38
Uoljivo je da postoji velika razlika u zadovoljstvu poslom izmeu mukih i enskih
ispitanika.
Druga mogunost:
Iz menija biramo: GraphsBar
U Bar Charts prozoru biramo opciju Clustered i Summaries for groups of cases.
U prozoru Define Clustered Bar definiemo Category Axis i Define Clusters polja kako je
dato na slici:
Zatim OK.
Dobijamo sledei stubiasti dijagram:
39
40
PrimerU sledeoj tabeli su dati procentualni udeli pojedinih drava u ukupnoj proizvodnji elika u
svetu u 2010. godini. Konstruisati odgovarajui stubiasti dijagram za date podatke.
Drava Procentualni udeo u svetskoj proizvodnji
elika u 2010. god.
Kina 44.3
Juna Koreja 4.1
Indija 4.7
Japan 7.8
SAD 5.7
Brazil 2.3
EU 12.2
Ukrajna 2.4
Rusija 4.7
Ostali 11.7
Reenje:Polazni podaci su uneti kako je dato na narednim slikama:
41
Iz menija biramo Graphs pa zatim Bar.
U Bar Charts prozoru biramo opciju Simple i Values of individual cases.
U prozoru Define Simple Bar: Values of Individual Cases, u polju Bars Represent
unosimo promenljivu procentualni udeo u svetskoj proizvodnji elika u 2010. godini. U polju
Category Labels biramo opciju Variable i odgovarajue polje unosimo promenljivu drava.
42
43
3.2. Histogram
Histogramima se prikazuje raspodela jedne neprekidne promenljive (na primer
prosena primanja, broj poena na testu opte kulture, prosean vek trajanja
proizvoda..)
Histogram frekvencija sastoji se iz niza spojenih pravougaonika. Osnovu svakog
pravougaonika ini veliina grupnog intervala a njegovu visinu odgovarajua frekvencija
intervala. Povrina svakog pravougaonika je proporcionalna frekvenciji odgovarajueg
grupnog intervala, a ukupna povrina svih pravougaonika histograma prikazuju ukupnu
frekvenciju.
Postupak crtanja histograma
Na osnovu sledeih podataka konstruisati histogram za neprekidnu promenljivu broj poena na
testu opte kulture i informisanosti kao i zasebne histograme iste promenljive za svaku
kategoriju nivo obrazovanja.
44
45
Iz menija biramo: GraphsHistogram
Izaberite neprekidnu promenljivu broj poena na testu opte kulture i informisanosti i prebacite
je u polje Variable. Zatim pritisnite OK.
Da bi smo dobili zasebne histograme za promenljivu broj poena na testu opste kulture i
informisanosti za svaku grupu u okviru promenljive nivo obrazovanja u odeljak Panel by:
stavite promenljivu nivo obrazovanja. Izaberite Rows da biste te zasebne dijagrame stavili
jedan iznad drugog ili Column kada elite da ih stavite jedan pored drugog. Pritisnite OK.
46
47
Primer
Prikupljeni su podaci o prosenim primanjima u jednoj profesiji na sluajnom uzorku od 30
ispitanika. Konstruisati odgovarajui histogram.
Polazni podaci i njihov unos u SPSS program:
48
Reenje:
Iz menija biramo: GraphsHistogram
49
Primer
Slavni hokeja Wayne Gretzky je tokom svoje dvadesetogodinje karijere u NHL-u postigao
sledei broj golova po odigranim sezonama:
51, 55, 92, 71, 87, 73, 52, 62, 40, 54, 40, 41, 31, 16, 38, 11, 23, 25, 23, 9
Konstruisati histogram za datu seriju podataka.
50
Reenje:
51
3.3. Linijski dijagramLinijski dijagram prikazuje vrednost jedne neprekidne promenljive za vie razliitih
vrednosti neke kategorijske promenljive (npr. vreme 1, vreme 2, vreme 3).
Primer
Sledei podaci predstavljaju godinju dobit jedne firme za period 1995-2005.
Godina Dobit u milionima evra
1995 0.97
1996 1.08
1997 1.15
1998 1.10
1999 1.39
2000 1.46
2001 1.25
2002 0.70
2003 1.15
2004 1.79
2005 2.04
Na osnovu datih podataka konstruisati linijski dijagram za dati vremenski period.
Reenje:
52
PostupakU glavnom meniju pritisnite Graphs pa Line.
Izaberite Simple i Values of individual cases i pritisnite Define.
U polju Line Represents prebacite promenljivu dobit.
U polju Category Labels izaberite opciju Variable prebacite promenljivu godina.
Pritisnite OK.
53
Primer
Dati podaci predstavljaju svetsku proizvodnju elika u periodu od 1980. do 2011. godine.
Konstruisati odgovarajui linijski dijagram.
U glavnom meniju pritisnite Graphs pa Line.
Izaberite Simple i Values of individual cases i pritisnite Define.
U polju Line Represents prebacite promenljivu proizvodnja.
U polju Category Labels izaberite opciju Variable prebacite promenljivu godina.
54
Pritisnite OK.
Konstruisani linijski dijagram ima sledei oblik:
55
Primer
Sledei podaci predstavljaju vrednost tone bakra na tritu u drugoj polovini 2012 godine.
Datum Cena bakra (USD/t)
2 jul 2012 7700
13 avgust 2012 7400
25 septembar 2012 8200
7 novembar 2012 7600
20 decembar 2012 8000
Na osnovu datih podataka konstruisati linijski dijagram koji pokazuje trend promene cene
bakra za dati vremenski period.
Reenje:
56
3.4. Dijagram rasprenosti
Dijagrami rasprenosti se obino koriste za istraivanje odnosa izmeu dve neprekidne
promenljive. Preporuljivo je dijagram rasprenosti nacrtati pre raunanja korelacije.
Dijagram rasprenosti predoava posmatrau da li je odnos promenljivih linearan ili
krivolinijski. Za analizu korelacije prikladni su samo linearni odnosi. Dijagram rasprenosti
pokazuje da li su promenljive korelirane pozitivno (velikim vrednostima jedne promenljive
odgovaraju veliki iznosi druge) ili negativno (velikim vrednostima jedne promenljive
odgovaraju mali iznosi druge promenljive). Kod pozitivnih korelacija linija raste, tj. poinje
levo sa malim vrednostima i raste udesno. Kod negativnih korelacija linija opada tj. poinje
levo sa veim vrednostima i opada udesno.
Dijagram rasprenosti grubo pokazuje i jainu korelacije dve promenljive. Kada je korelacija
slaba, take su bez reda rasute posvuda, tj. ne ine prepoznatljiv geometrijski oblik. Kada je
korelacija jaka vidi se gomilanje taaka oko zamiljene prave linije.
Postupak crtanja dijagrama rasprenostiPrimer 1
Profesor eli da ispita odnos izmeu uspeha studenata na kolokvijumu i uspeha studenata na
ispitu iz svog predmeta. Prikupio je podatke o rezultatima ostvarenim na kolokvijumu i na
ispitu za 25 studenata. Podaci su uneti u SPSS program kako je dato na sledeim slikama.
57
Na osnovu datih podataka konstruisati odgovarajui dijagram rasprenosti.
U glavnom meniju pritisnite Graphs pa Scatter/Dot. Potvrdite polje Simple Scatter i zatim
pritisnite dugme Define. Prenesite promenljivu za koju smatrate da je nezavisna promenljiva
u X Axis polje. U ovom sluaju to je poeni na kolokvijumu. Prenesite zavisnu promenljivu u
Y Axis polje. To je promenljiva poeni na ispitu. Zatim pritisnite OK:
58
Rezultat je prikazan na sledeoj slici:
Tumaenje dijagrama rasprenosti
Sa prethodne slike se uoava jaka pozitivna korelacija izmeu dve posmatrane promenljive u
uzorku kao celini. Studenti sa veim brojem poena na kolokvijumu postiu bolje rezultate na
ispitu. Kako je sa slike ouljiva linearna veza promenljivih bilo bi umesno izraunati
Pirsonovu korelaciju tih dvaju promenljivih.
59
Primer 2
Istraiva ispituje odnos izmeu visine mukaraca i njihove sposobnosti da izvedu skok u
dalj. Sluajnim izborom formiran je uzorak od 25 mukaraca priblino istih godina koji nisu
prethodno trenirali. Zabeleene su njihove visine i ostvarene duine skoka u dalj. Podaci su
uneti u SPSS program kako je dato:
Na osnovu datih podataka konstruisati odgovarajui dijagram rasprenosti.
U glavnom meniju pritisnite Graphs pa Scatter/Dot. Potvrdite polje Simple Scatter i zatim
pritisnite dugme Define. Prenesite promenljivu za koju smatrate da je nezavisna promenljiva
u X Axis polje. U ovom sluaju to je visina. Prenesite zavisnu promenljivu u Y Axis polje. To
je promenljiva duina skoka u dalj. Zatim pritisnite OK:
60
Tumaenje dijagrama rasprenosti
Dijagram rasprenosti sugerie na postojanje linearne veze izmeu visine i duine skoka u dalj
kod ispitivane populacije. Veim visinama odgovaraju vee ostvarene vrednosti duine skoka
u dalj to upuuje na pozitivnu tj. direktnu korelaciju.
Kako bi se preciznije ispitala jaina linearne veze potrebno je odrediti vrednost koeficijenta
Pirsonove linearne korelacije izmeu analiziranih promenljivih.
61
Primer 3
Menader eli da ispita vezu izmeu prodaje odreenog proizvoda i lokacije prodajnih
objekata tj. njegove udaljenosti od centra grada. Prikupljeni su podaci i uneti u SPSS na
sledei nain:
Na osnovu datih podataka konstruisati odgovarajui dijagram rasprenosti.
U glavnom meniju pritisnite Graphs pa Scatter/Dot. Potvrdite polje Simple Scatter i zatim
pritisnite dugme Define. Prenesite promenljivu za koju smatrate da je nezavisna promenljiva
u X Axis polje. U ovom sluaju to je udaljenost prodavnice od centra grada. Prenesite zavisnu
promenljivu u Y Axis polje. To je promenljiva meseni broj prodatih proizvoda. Zatim
pritisnite OK:
62
Tumaenje dijagrama rasprenosti
Konstruisani dijagram rasprenosti upuuje na postojanje linearnog odnosa izmeu
ispitivanih promenljivih. Budui da se take priblino grupiu oko prave linije ima smisla
ispitati postojanje i jainu linearne veze izmeu dve promenljive proraunom Pirsonovog
koeficijenta korelacije. Kako velikim vrednostima jedne promenljive odgovaraju male
vrednosti druge ovde se radi o negativnoj korelaciji.
63
4. Analiza pitanja sa viestrukim
odgovorima (Multiple Response)
Ova analiza omoguava istraivau da analizira pitanja koja mogu da imaju vie
odgovora. Na primer, istraiva moe zahtevati od ispitanika da navede sve novine koje je
proitao prole nedelje ili da zaokrui sve novine sa liste ponuenih odgovora.
Primer:
Pretpostavimo da su u anketi dva postavljena pitanja glasila:
Koji su vai razlozi za pokretanje biznisa? (zaokruiti maksimalno dva odgovora)
a) Presti-bolji drutveni status
b) Bolja zarada
c) Ekonomske potrebe regiona
d) Karijera i ekonomska sigurnost
Koje ste resurse koristili za pokretanje biznisa? (zaokruiti maksimalno tri odgovora)
a) Uteevina
b) Bankarski krediti
c) Zarada od rada u inostranstvu
d) Zajam od prijatelja
e) Evropski fondovi
64
Primer kodiranja podataka za istraivanje koje je ukljuivalo data pitanja prikazan je u
sledeoj tabeli:
Promenljiva Kolona Kod
1=presti-bolji drutveni
status
2=bolja zarada
3=ekonomske potrebe
regiona
Razlog1 1
4=karijera i ekonomska
sigurnost
1=presti-bolji drutveni
status
2=bolja zarada
3=ekonomske potrebe
regiona
Razlog2 2
4=karijera i ekonomska
sigurnost
1=uteevina
2=bankarski krediti
3=zarada od rada u
inostranstvu
4=zajam od prijatelja
Res.1 3
5=evropski fondovi
Res.2 4 Kao prethodno
Res.3 5 Kao prethodno
65
Posle unosa podataka i definisanja promenljivih pristupa se analizi.
Iz menija klik na Analyze, zatim Multiple Response i Define Sets. Otvorie se sledei
Define Multiple Response Sets prozor:
66
U polje Set Definition izaberite promenljive koje se odnose na prvo pitanje (razlog1 i
razlog2) i prebacite ih u Varibles in Set polje. Kako su dva razloga kodirana iz poetne liste
koja je sadrala etiri razloga ekirajte Categories polje i unesite 1 do 4 u Range polje. Zatim
u polje Name unesite ime za grupu razloga (primer: razlozi)) a u polje Label unesite
objanjenje (primer: razlozi za preferiranje te partije (reasons for preferring that party).
Klik na Add da bi prebacili ovaj set odgovora u Mult Response Sets polje:
67
Zatim ponovite postupak za drugo pitanje:
68
Klik na Close kako bi zatvorili prozor.
Iz menija klik na Analyze, zatim Multiple Response i Frequencies. Otvara se sledei
Multiple Response Frequencies prozor:
Prebacite grupisane odgovora (razlozi i resursi) iz Mult Response Sets polja u polje
Table(s) for:
69
Zatim klik na OK kako bi startovali analizu viestrukih odgovora (multiple-response
frequencies analysis).
Rezultati:
U tabeli su predstavljeni dobijeni rezultati:
70
Tumaenje rezultata:
Pitanje Koji su vai razlozi za pokretanje biznisa? je ukupno generisalo 32 odgovora iz
uzorka od 20 ispitanika:
3 odgovora (ispitanika) su bila presti-bolji ekonomski status (9.4% ukupnog broja odgovora
(3/32) i 15.0% ispitanika (3/20)),
15 odgovora (ispitanika) su bila bolja zarada (46.9% ukupnog broja odgovora (15/32) i
75.0% ispitanika (15/20)),
3 odgovora (ispitanika) su bila ekonomske potrebe regiona (9.4% ukupnog broja odgovora
(3/32) i 15.0% ispitanika (3/20)),
11 odgovora (ispitanika) su bila karijera i ekonomska sigurnost (34.4% ukupnog broja
odgovora (11/32) i 55.0% ispitanika (11/20)).
Pitanje Koje ste resurse koristili za pokretanje biznisa? je ukupno generisalo 37
odgovora iz uzorka od 20 ispitanika:
12 odgovora (ispitanika) su bila uteevina (32.4% ukupnog broja odgovora (12/37) i 60.0%
ispitanika (12/20)),
13 odgovora (ispitanika) su bila bankarski kredit (35.1% ukupnog broja odgovora (13/37) i
65.0% ispitanika (13/20)),
6 odgovora (ispitanika) su bila zarada od rada u inostranstvu (16.2% ukupnog broja odgovora
(6/37) i 30.0% ispitanika (6/20)),
1 odgovor (ispitanik) je bio evropski fondovi (2.7% ukupnog broja odgovora (1/37) i 5.0%
ispitanika (1/20)).
71
5. Uvod u analitiku statistiku
Statistiko zakljuivanje predstavlja postupak donoenja zakljuaka o vrednostima
parametara osnovnog skupa na osnovu informacija dobijenih iz uzorka.
Statistiko zakljuivanje se sastoji iz statistikog ocenjivanja i testiranja statistikih hipoteza.
Izbor postupka koji emo primeniti zavisi od raspoloivih informacija o nepoznatom
parametru osnovnog skupa pre izbora uzorka.
5. 1. Statistiko ocenjivanje
Ako ne raspolaemo podacima na osnovu kojih bismo mogli da pretpostavimo vrednost
odreenog parametra skupa (najee su to aritmetika sredina, proprcija, varijansa, odnosno,
standardna devijacija skupa), ovu vrednost emo oceniti postupkom statistikog ocenjivanja.
Budui da numeriku vrednost parametra ocenjujemo na osnovu informacije iz uzorka, ne
moemo biti potpuno sigurni u ispravnost donetog zakljuka. Zbog toga zakljuak ocenjivanja
prihvatamo sa pouzdanou manjom od 100%.
S druge strane, ako nam je neka od osobina osnovnog skupa poznata ili pretpostavljamo
njenu vrednost (vrednost parametra skupa, oblik njegovog rasporeda i sl.), primeniemo
postupak testiranja hipoteze. Testiranjem hipoteze ispitujemo da li je polazna pretpostavka
prihvatljiva. Drugim reima, ispitujemo da li informacija iz uzorka protivrei ili podrava
nae poetno uverenje o karakteristici osnovnog skupa. Poto ne moemo biti potpuno sigurni
u ispravnost donetog zakljuka, pretpostavku emo prihvatiti ili je odbaciti uz odreeni rizik
da smo pogreili.
Na sledeem primeru emo pokazati razliku izmeu postupka ocenjivanja i testiranja
hipoteza.
Pretpostavimo da analiziramo uspeh studenata iz Osnova statistike analize. Interesuje
nas prosean broj poena na pismenom ispitu o kojem ne raspolaemo nikakvim podacima.
Umesto popisa primeniemo postupak statistikog ocenjivanja: izabraemo prost sluajni
uzorak, izraunaemo prosean broj poena u uzorku i na osnovu ove informacije oceniemo
prosean broj poena u osnovnom skupu. Ako je na primer, 5.69=x , mogli bismo grubo da
72
prihvatimo da i prosean broj poena u osnovnom skupu iznosi 69.5. Ali, budui da se x po
pravilu razlikuje od m, umesto jednim brojem, parametar m ocenjujemo intervalom vrednosti
koji formiramo oko realizovane vrednosti x iz uzorka. Tada kaemo, na primer, da interval
[67-72] verovatno sadri pravu vrednost m.Dakle, rezultat ocenjivanja je ocenjena vrednost nepoznatog parametra koju prikazujemo
jednim brojem ili, ee, intervalom vrednosti.
Sa druge strane, pretpostavimo da raspolaemo podatkom o prolaznosti studenata na
ispitu iz Osnova statistike analize u ranijim ispitnim rokovima, i da ona iznosi 71%. Pri
tome, opravdano sumnjamo da je dolo do promene u uspehu studenata. Osnovanost sumnje
(nae hipoteze) proveravamo postupkom testiranja hipoteze. Iz skupa svih studenata koji su
polagali ispit izvlaimo prost sluajan uzorak i u uzorku izraunavamo uee studenata koji
su ga poloili; neka ono iznosi 69%. Vidimo da postoji razlika izmeu do tada vaee
proporcije skupa (0.71) i realizovane vrednosti proporcije uzorka (0.69). Ova razlika moe
imati dva uzroka: jedan je fluktuacija elemenata u uzorcima, zbog koje proporcije uzoraka
odstupaju od proporcije skupa; drugi uzorak moe biti injenica da prolaznost na ispitu vie
nije 71%. Ako odstupanje od 2% moemo da objasnimo sluajnim kolebanjem proporcija
uzoraka, prihvatiemo da nije dolo do promene u uspehu studenata, tj. da je prolaznost na
ispitu 71%. Ako razliku od 2% ne moemo da opravdamo samo pomenutom fluktuacijom,
prihvatiemo hipotezu da se prolaznost na ispitu promenila. Rezultat testiranja je zakljuak da
se hipoteza o vrednosti parametra skupa prihvata ili ne prihvata.
Ocenjivanje aritmetike sredine osnovnog skupa
Takasta i intervalna ocena
Pretpostavimo da ocenjujemo prosene mesene izdatke za kulturu etvorolanih
domainstava u Vojvodini, i da u prostom sluajnom uzorku od 200 domainstava oni iznose
9000 dinara. Prihvatimo li ovu vrednost kao ocenjenu vrednost parametra m, skoro je izvesnoda emo pogreiti jer je veina aritmetikih sredina uzoraka bliska, ali retko jednaka
aritmetikoj sredini skupa. Ako smo izabrali redak uzorak koji, u odnosu na m, ima malu iliveliku aritmetiku sredinu, dobiemo deformisanu sliku o osnovnom skupu. Pored toga, ako
iz jednog skupa izaberemo vie uzoraka iste veliine, njihove aritmetike sredine e se
razlikovati meu sobom, pri emu ne moemo da odredimo koja od njih je najblia prosenoj
vrednosti skupa. Nedostaje nam podatak o preciznosti takaste ocene.
Bili bismo mnogo sigurniji u tanost zakljuaka kada bismo, umesto jednom vrednou,
aritmetiku sredinu skupa ocenili intervalom vrednosti formiranim oko X . Takvu ocenu
73
nazivamo intervalnom ocenom, a interval oko X intervalom pouzdanosti (ili intervalom
poverenja). Ovaj interval bi trebalo da bude toliko irok da, uzimajui u obzir sluajna
kolebanja aritmetikih sredina uzoraka oko aritmetike sredine skupa, on obuhvati i stvarnu
vrednost m. Ali, ako bismo formirali veoma irok interval koji bi sigurno sadrao vrednost m,on ne bi bio informativan. S druge strane, ako formiramo uzak interval, on ne mora da sadri
vrednost aritmerike sredine skupa, odnosno postoji rizik da je zakljuak pogrean. Ipak, na
osnovu rezultata teorije verovatnoe, veliinu ovog rizika moemo da kontroliemo ukoliko
koristimo sluajan uzorak.
Proraun intervalne ocene aritmetike sredine skupa
Za datu pouzdanost, preciznost ocene se poveava sa poveanjem uzorka. Rizik da smo
u zakljuivanju napravili greku nazivamo rizikom greke i obeleavamo ga sa a. Obino seuzimaju vrednosti 0.05 ili 0.01. Rizik a se dopunjuje do jedinice sa koeficijentompouzdanosti, koji je jednak (1-a).Interval pouzdanosti (poverenja) predstavlja interval vrednosti formiran oko aritmetike
sredine uzorka koji, sa definisanim koeficijentom pouzdanosti tj. sa definisanom
pouzdanou, obuhvata aritmetiku sredinu skupa .
Jednaina za proraun intervala pouzdanosti za poznatu standardnu devijaciju skupa je:
Koeficijent pouzdanosti (1-a) Odgovarajua vrednost z statistike 2/az
0.90 1.645
0.95 1.96
0.99 2.58
U najveem broju sluajeva, kada je aritmetika sredina skupa nepoznata, nepoznata je i
njegova standardna devijacija . Meutim, u praksi ukoliko je uzorak relativno veliki (30 ili
vie) standardna devijacija skupa () moe se aproksimirati standardnom devijacijom uzorka
(s) u jednaini za proraun intervala pouzdanosti.
74
Primer
1. Potanska firma u New York-u tvrdi da je njeno proseno vreme isporuke bilo gde u gradu
manje od 3 sata. Agencija za zatitu potroaa je odluila da sprovede istraivanje u cilju
provere ovog tvrenja. Sluajno su izabrana 50 isporuioca i utvreno je da proseno vreme
2.8 sati sa standardnom devijacijom s od 0.6 sati. Agencija eli da odredi interval poverenja
za sa pouzdanou od 95%. Odrediti interval pouzdanosti i oceniti da li tvrdnja potanske
agencije razumna.
Interval od 2.634 do 2.966 formira 95% interval poverenja za . Drugim reima, 95% smo
sigurni da se proseno vreme isporuke firme kree u intervalu od 2.634 do 2.966. Poto su obe
granice intervala ispod 3 sati moe se zakljuiti da postoji jak dokaz da je tvrenje kompanije
o prosenom vremenu isporuke tano.
Proraun veliine uzorka za odreivanje aritmetike sredine skupa
Prikupljanje podataka kota. Postavlja se pitanje odreivanja optimalne veliine uzorka za
sprovoenje odreenog statistikog istraivanja. Ukoliko je izabrani uzorak premali,
istraiva analizom dolazi do nepouzdanih informacija. Ukoliko je uzorak preveliki to dovodi
do poveanja trokova i vremena istraivanja.
Zbog toga izabrana veliina uzorka predstavlja kompromis izmeu potrebne preciznosti
statistike uzorka, kao ocene parametra osnovnog skupa, i potrebnog vremena i trokova da bi
se postigao oekivani stepen tanosti.
Jednaina za ocenjivanje potrebne veliine uzorka u cilju prorauna aritmetike sredine
osnovnog skupa sa odreenom pouzdanou (1-a) i veliinom intervala pouzdanosti W (gde
je Ex i E=W/2, E je nivo tanosti) glasi:
Da bi smo odredili potrebnu veliinu uzorka potrebno je poznavati vrednost varijanse
osnovnog skupa 2 (ili standardne devijacije osnovnog skupa ). Poto ovi parametri skupa
obino nisu poznati, varijansu osnovnog skupa 2 aproksimativno moemo zameniti
varijansom uzorka s2. Varijansu uzorka moemo oceniti na dva naina:
75
1. Korienjem prikupljenih informacija iz prethodnog istraivanja kako bi se procenila
varijansa uzorka s2. Izraunatu vrednost koristimo kao aproksimaciju 2.
2. Korienjem informacija o intervalu varijacije uzorka i da bi se procenila .
Primer
Trokovi studenata za kupovinu akademske literature su znatno poveani u odnosu na ostale
trokove studiranja. Rukovodstvo univerziteta eli da proceni prosene trokove kupovine
udbenika svih studenata univerzitata na osnovu odgovarajueg uzorka. Kako bi ova procena
bila relevantna procenjeni trokovi moraju imati nivo tanosti od 25 dolara. Koliki je
minimalni broj studenata u uzorku potreban da bi procenjeni trokovi zadovoljili potreban
nivo tanosti sa pouzdanou od 95%?
Reenje
Iz podataka prikupljenih ranijih godina, rukovodstvo univerziteta je odredilo da godinji
trokovi za literaturu mogu da se predstave histogramom koji sledi normalnu raspodelu sa
intervalom varijacija od 250 do 750 dolara. Poto distribucija trokova za literaturu sledi
normalnu raspodelu procena moe da se uradi na sledei nain:
Pojedini lanovi u jednaini za proraun veliine uzorka imaju sledee vrednosti:
E=25$
Koeficijent pouzdanosti (1-a)=0.95 ili 95% sledi da jeZamenom datih vrednosti u jednainu za proraun potrebne veliine uzorka dobijamo:
Dobijenu vrednost zaokruujemo na prvi vei ceo broj. Zakljuujemo da je uzorak od 97
ispitanika ili vei potreban kako bi izvrili proraun ocene prosenih trokova nabavke
literature sa nivoom tanosti od 25$ i pouzdanou od 95%.
76
Primer
Firma eli da testira proseni vek trajanja svog proizvoda. Sluajno su izabrana 10
proizvoda i odreeno je njihovo trajanje. Na osnovu podataka iz uzorka odrediti
prosean vek trajanja proizvoda sa pouzdanou od 95%.
Procedura:Biramo: AnalyzeDescriptive StatisticsExplore
Otvara se sledei prozor:
Varijablu Vek trajanja proizvoda prebacujemo u polje Dependent List.
77
Klik na Statistics. U prozoru Explore: Statistics potrebno je ekirati Descriptives i definisati
pouzdanost (95%):
Klik na Continue i OK.
U tabeli Descriptives moe se videti odgovarajua statistika uzorka:
78
Interval od 148.382 do 166.818 formira 95% interval poverenja za . Drugim reima, 95%
smo sigurni da se proseno vreme trajanja proizvoda kree u intervalu od 148.382 do 166.818
dana.
79
5. 2. Testiranje statistikih hipoteza
Do sada smo informacije iz uzorka koristili da bismo ocenili nepoznate parametre
osnovnog skupa. U drugoj oblasti statistikog zakljuivanja, testiranju statistikih hipoteza,
informacije iz uzorka koristimo da ispitamo prihvatljivost nekih tvrenja ili pretpostavki koje
se tiu osobina osnovnog skupa.
Primer 1:
Razmotrimo eksperiment u kome istraiva istrauje uticaj odreenog leka na ljudsko
pamenje. Istraiva daje lek na korienje jednoj grupi ispitanika ali ne i kontrolnoj grupi.
Zatim poredi srednje vrednosti grupa ostvarene na testu pamenja.
Deskriptivna statistika ne moe dati odgovor da li je uoena razlika u dobijenim srednjim
vrednostima rezultata testa izmeu grupa sluajna ili je zaista uslovljena uticajem leka.
Primer 2:
Sproveden je eksperiment u cilju ispitivanja koeficijenata inteligencije (IQ test) kod
devojica i deaka u prvom razredu.
Postavljena je istraivaka hipteza da devojice u prvom razredu imaju vii koeficijent
inteligencije (IQ) u odnosu na deake tog uzrasta.
Metodom sluajnog uzorka izabrane su etiri devojice i etiri deaka i sproveden je IQ
test.
Rezultati eksperimenta pokazuju da je prosena vrednost ostvarena na testu 110 u sluaju
devojica i 103 u sluaju deaka.
Na osnovu dobijenih rezultata da li istraiva moe zakljuiti da je njegova hipoteza
tana?
Da bi se naao odgovor na ovo pitanje mora se primeniti analitika statistika i testiranje
statistikih hipoteza.
Statistika hipoteza je precizno formulisano tvrenje ili pretpostavka o osobini
osnovnog skupa. Nauni metod kojim proveravamo prihvatljivost ovog tvrenja ili
pretpostavke nazivamo testiranjem statistike hipoteze.
80
Tipovi statistikih hipoteza
Istraivaka hipoteza.
Istraivaka hipoteza (H1) je precizno formulisano tvrenje ili pretpostavka o osobini
osnovnog skupa.
To je hipoteza koju je definisao istraiva i koja je bazirana na nekoj teoriji. Istraiva obino
veruje da je njegova hipoteza tana.
Nulta hipoteza.
Nulta hipoteza (H0) je tvrenje o osobini osnovnog skupa koje je inverzno onom definisanom
u istraivakoj hipotezi. Ona porie tvrenje koje je dato u istraivakoj hipotezi.
Testiranje statistike hipoteze
Nauni metod kojim proveravamo prihvatljivost statistike hipoteze nazivamo testiranje
statistike hipoteze.
Poto zakljuak o prihvatljivosti pretpostavke donosimo na osnovu informacije iz uzorka,
prilikom testiranja hipoteze prisutan je rizik da emo u zakljuku pogreiti.
Pri testiranju hipoteza mogue su dve vrste (tipa) greaka:
Greka prve vrste nastaje ako se H0 odbaci kada je H0 tana. Verovatnoa greke prve vrste se
oznaava sa a.Greka druge vrste nastaje ako se H0 ne odbaci kada je H1 tana. Verovatnoa greke druge
vrste se oznaava sa b.Idealan test ima male verovatnoe greaka prve i druge vrste. Meutim, istovremeno
minimiziranje verovatnoa a i b nije mogue zato to oni obrnuto zavisni. Sa fiksiranomveliinom uzorka i izabranim statistikim testom smanjenjem verovatnoe greke prve vrste adolazi do poveanja verovatnoe greke druge vrste b.S obzirom na interpretaciju hipoteza H0 i H1, obino nam je vanije da ne napravimo greku
prve vrste, jer bismo tim postupkom dokazali tvrenje koje nije tano (hipoteza H1). Greka
druge vrste nije toliko znaajna, jer ako nemamo dovoljno jakih dokaza protiv H0, a verujemo
da je H1 ipak tana, postupak dokazivanja hipoteze H1 moemo nastaviti izvoenjem novih,
obimnijih eksperimenata.
Postupak testiranja statistikih hipoteza
1. formuliemo nultu i istraivaku hipotezu;
2. vrimo izbor statistike testa;
81
3. biramo tzv. nivo znaajnosti testa a;4. formuliemo pravilo na osnovu koga odluujemo da li da odbacimo nultu hipotezu ili ne.
5. izraunavamo vrednost statistike testa
6. donosimo odluku da nultu hipotezu odbacimo ili da je ne odbacimo.
Nivo znaajnosti (a)Kada se sprovedenim testiranjem dve grupe uoi razlika u vrednostima nekog obeleja
(primer: IQ, test linosti, ...) postavlja se pitanje kako zakljuiti da je uoena razlika statistiki
znaajna. Ono to se jednom istraivau moe uiniti bitnom razlikom drugom istraivau
moe biti nevano. U cilju uvodjenja vee objektivnosti u interpretaciju dobijenih rezultata
uvodi se nivo znaajnosti.
Nivo znaajnosti predstavlja graninu verovatnou kojom odreujemo da li da prihvatimo ili
odbacimo nultu hipotezu. Obino se za nivo znaajnosti a uzimaju vrednosti 0.01 (1%) ili0.05 (5%). Ukoliko izaberemo 0.05 nivo znaajnosti postoji verovatnoa od 5% da smo
odbacivanjem nulte hipoteze uinili greku prve vrste tj. da je nulta hipoteza tana.
Za istu veliinu uzorka i istu statistiku testa, to je manji nivo znaajnosti, utoliko je tee
odbaciti nultu hipotezu H0. Smanjenjem nivoa znaajnosti poveava se verovatnoa greke
druge vrste. Poveanje veliine uzorka za izabrani nivo znaajnosti testa smanjuje
verovatnou javljanja greke druge vrste.
Realizovani nivo znaajnosti testa (p-vrednost)
U novijoj literaturi i praksi umesto proizvoljnog nivoa znaajnosti, sve vie se koristi tzv. p-
vrednost (Sig. u SPSS programu). Na ovaj nain, umesto da se unapred izabere nivo
znaajnosti, on se rauna na osnovu informacija iz uzorka.
P-vrednost je najmanji rizik sa kojim se nulta hipoteza moe odbaciti na osnovu
podataka iz uzorka.
Ako je nivo znaajnosti testa a unapred odreen, odluku da H0 odbacimo ili ne odbacimodoneemo uporeivanjem p-vrednosti sa rizikom a. Ako je pa, H0 emo odbaciti, a ako jep>a zakljuiemo da H0 ne moemo da odbacimo.
82
Izbor prikladnih statistikih tehnika
Kada je istraiva definisao istraivaku hipotezu sledei korak je izbor odgovarajueg
statistikog testa kojim e izvriti testiranje hipoteze. Pored prirode hipoteze koju eli da
testira (test razlikovanja ili test povezanosti) prilikom izbora statistike testa istraiva mora
uzeti u obzir i merne skale koje je koristio za merenje varijabli.
Merne skale
Postoje etiri nivoa merenja i etiri merne skale: nominalna, ordinalna, intervalna i skala
odnosa.
Nominalna skala je najnepreciznija. U ovoj skali brojevi se koriste kod pojava koje se mogu
klasifikovati samo na odreen broj i tip modaliteta. Tako se klasifikuju: pol, brano stanje, itd.
(primer: 1-muko; 2-ensko)
Ordinalna skala doputa rangiranje pojedinih vrednosti varijable. Tako na primer, lokaciju
prodavnice moemo oznaiti kao izuzetno povoljnu, povoljnu, osrednju, nepovoljnu i
izuzetno nepovoljnu i ove modalitete rangirati poev od broja 1 za izuzetno povoljnu do
rednog broja 5 za poslednji modalitet. Jos jedan primer bi bio rangiranje koarkakih timova.
Ispitanici bi mogli da na osnovu svog miljenja izvre rangiranje 4 tima na osnovu kvaliteta
na sledei nain: 1-najkvalitetniji tim, 2-sledei po kvalitetu itd. Iako ordinalna skala doputa
rangiranje timova po kvalitetu ona ne prua informacije koliko je jedan tim bolji od drugog.
Intervalna skala pokazuje ne samo rang modaliteta nego i meru njihovog razlikovanja. Na
intervalnoj skali su razlike iste numerike veliine meusobno jednake. Primer za intervalnu
skalu moe biti vrednost postignuta na IQ testu. Razlika od 10 poena je jednaka du cele
skale. Drugi primeri intervalne skale mogu biti: kalendarsko vreme, potencijalna energija,
temperatura (merena Celzijusovom skalom) itd.
Najvii nivo merenja postie se primenom skale odnosa, koja obezbeuje znaenje bilo kog
odnosa merenih objekata, kao to su: visina u centimetrima, telesna masa u kilogramima,
starost u godinama, prihod u dinarima i sl. Skalu odnosa karakterie ne samo upotreba
jedinice merenja nego i prava nulta taka. Ova skala nam doputa da iskaemo proporcionalan
83
odnos modaliteta koje merimo. Pakovanje eera, na primer, koje ima tri puta vie mernih
jedinica od drugog pakovanja, tri puta je tee. Ova skala je, prema tome, najpreciznija.
Istraivanje veza izmeu raznih obeleja
U anketnom istraivanju esto nisu vane razlike izmeu grupa, nego jaina veza
izmeu obeleja (promenljivih). Moe se upotrebiti vie tehnika. Neke od najvanijih su
navedene u daljem tekstu.
Korelacija
Za istraivanje jaine veze izmeu dve neprekidne promenljiveupotrebljavaju se Pirsonova i
Spirmanova korelacija. Korelacija pokazuje smer (pozitivan ili negativan) i jainu linearne
veze. Pozitivna korelacija pokazuje da obe promenljive zajedno i opadaju i rastu. Negativna
krelacija pokazuje da jedna promenljiva opada kada druga raste i obrnuto.
Viestruka regresija
Viestruka regresija je proirenje proste linearne regresije gde se na osnovu skupa nezavisnih
promenljivih predvia vrednost jednog neprekidnog zavisnog obeleja (promenljive). Razne
vrste viestruke regresije slue za poreenje prediktivne mogunosti odreenih nezavisnih
promenljivih i pronalaenje najboljeg skupa promenljivih za predikciju jedne zavisne
promenljive.
Faktorska analiza
Faktorska analiza slui za svoenje velikog skupa promenljivih ili stavki skale na manji broj
dimenzija ili faktora, s kojima je lake raditi. To se postie saimanjem oblika korelacije koji
lei u njihovoj osnovi i pronalaenjem grupa tesno povezanih stavki. Ova tehnika se esto
koristi kod razvoja mernih skala, za identifikaciju pripadne strukture.
Strukturno modelovanje
Strukturno modelovanje (engl. structural equation modelling) relativno je nova i veoma
sofisticirana tehnika za ispitivanje raznih modela meuveza u skupu promenljivih. Zasnovana
je na viestrukoj regresiji i tehnikama faktorske analize. Slui za izraunavanje svake
nezavisne promenljive u modelu i testiranje koliko dobro ceo model odgovara podacima, kao
i za poreenje alternativnih modela. Sam SPSS nema modul za strukturno modelovanje, ali
podrava dodatni program AMOS.
84
Ispitivanje razlika izmeu grupa
Postoji jo jedna porodica statistikih tehnika za utvrivanje statistiki znaajnih razlika
izmeu grupa. U nastavku su navedene parametarske verzije tih testova prikladne za podatke
na normalnim skalama i skalama odnosa sa normalnom raspodelom rezultata i njihove
neparametarske alternative.
T-testovi
T-test za dva uzorka se upotrebljavaju kada imamo dve grupe (recimo, mukarce i ene) ili
dva skupa podataka (pre i posle), i elimo da uporedimo srednje vrednosti nekog neprekidnog
obeleja (promenljive). T-test zavisnih uzoraka upotrebljavamo kada nas zanimaju promene
vrednosti posmatranog obeleja dobijene od subjekata testiranih u Vreme 1 i zatim ponovo u
Vreme 2 (obino posle neke intervencije ili dogaaja). Ti uzorci su povezani poto se radi o
istim ljudima testiranim u dva navrata. T-testovi nezavisnih uzoraka upotrebljavaju se kada
imate dve razliite (nezavisne) grupe ljudi (recimo, mukarce i ene) i elite da uporedite
njihove rezultate za posmatrano obeleje.
Jednofaktorska analiza varijanse
Jednofaktorska analiza varijanse (engl. one-way ANOVA) slina je t-testu, ali se koristi kada
imamo vie od dve grupe za koje elimo da uporedimo njihove srednje vrednosti za jednu
neprekidnu promenljivu (obeleje).
Sledea tabela daje prikaz raspoloivih statistikih testova koji stoje na raspolaganju
istraivau u zavisnosti od nivoa merenja vrednosti promenljivih:
85
Tabela. Statistiki metodi u zavisnosti od nivoa merenja vrednosti promenljivihRazlika u vrednostima obeleja (promenljive)Nivo
merenja
vrednosti
promenljive
Veza izmeu
promenljivih Jedna grupa
(uzorak)
Dve zavisne
grupe
(uzorka)
Dve
nezavisne
grupe
(uzorka)
Vie nezavisnih
grupa (uzoraka)
Point biserijski (rpb)
koeficijent
(dihotomna-kontinualna)
Hi-kvadrat
test
nezavisnosti
Hi-kvadrat test
za ispitivanje
kvaliteta
podudaranja
Nominalna
Fi koeficijent
(dihotomna-dihotomna)
Ordinalna Spirmanov koeficijent
korelacije
Kolmogorov-
Smirnov test
rangiranih
podataka
Vilkoksonov
test ranga
Man-
Vitnijev U
test
Kruskal-Volisov
test
Pirsonov koeficijent
korelacije
T-test za
jedan uzorak
T-test za
dva zavisna
uzorka
T-test za
dva
nezavisna
uzorka
Analiza
varijanse sa
jednim faktorom
(ANOVA)
Linearna regresija Multivarijaciona
analiza varijanse
(MANOVA)
Nelinearna regresija
Intervalna i
skala
odnosa
Strukturno modelovanje
86
5. 3. Testiranje pretpostavke normalne raspodele osnovnog skupa u SPSS-u
Mnogi statistiki testovi poivaju na pretpostavci da je raspodela vrednosti neprekidne
promenljive u skupu iz koga se uzima uzorak normalna. Ovakvi metodi nazivaju se
parametarski ili klasini metodi. Tanost dobijenih rezultata kod primene parametarskih
metoda zavisi od toga da li je ispunjen uslov normalnog rasporeda osnovnog skupa.
Normalna raspodela se odlikuje simetrinom, zvonolikom krivom sa najveim brojem
vrednosti promenljive u sredini i manjim brojem rezultata prema krajevima (repovima) zvona.
Postoje dve grupe metoda za testiranje normalnosti osnovnog skupa u SPSS-u. U prvu
grupu spadaju grafiki metodi a drugu grupu predstavljaju numeriki metodi. Grafiki metodi
se baziraju na vizuelnom ocenjivanju dok se numeriki metodi sprovode specijalnim
statistikim testovima.
Primer
Iz osnovnog skupa koga ine svi uenici osmog razreda u osnovnim kolama u jednom
gradu formiran je sluajni uzorak od 50 uenika. Na uzorku je sproveden test inteligencije (IQ
test) i dobijeni rezultati (brojevi osvojenih poena) su zabeleeni.
Testirati pretpostavku da sluajna promenljiva rezultati IQ testa ima normalnu raspodelu na
posmatranom skupu uenika osmog razreda u tom gradu kao i na odgovarajuim
podskupovima uenika i uenica.
Polazni podaci:
87
88
Procedura:U prvom delu analize testiraemo normalnu raspodelu na celom uzorku uenika.
Biramo: AnalyzeDescriptive StatisticsExplore
Otvara se sledei prozor:
Varijablu za koju testiramo normalnu raspodelu prebacujemo u polje Dependent List.
Klik na Plots. U otvorenom prozoru Explore: Plots ekirati Normality plots with tests opciju:
89
Klik na Continue i OK.
Rezultati i tumaenjeZa testiranja pretpostavke normalnosti posmatramo rezultate u tabeli Tests of Normality i Q-
Q grafik.
Tabela Tests of Normality sadri rezultate dva statistika testa: Kolmogorov-Smirnov i
Shapiro-Wilk. Za testiranje normalnosti koristimo Shapiro-Wilk test koji je pogodniji za male
uzorke (< 50). Ako je realizovani nivo znaajnosti (Sig.) vei od 0.05 pretpostavka o
normalnosti je potvrena. U ovom sluaju realizovani nivo znaajnosti iznosi 0.345 pa
zakljuujemo da promenljiva rezultat IQ testa ima normalnu raspodelu na celoj populaciji
uenika osmog razreda u tom gradu.
90
Za vizuelno odreivanje normalnosti koristi se histogram i Q-Q grafik:
91
Ukoliko podaci slede normalnu raspodelu take na grafiku e biti pozicionirane blizu prave
linije. Ukoliko take imaju nelinearni trend rasporeda onda podaci nemaju normalnu
raspodelu. U ovom sluaju i histogram i Q-Q grafik ne ukazuju na znaajnije odstupanje
podataka od normalne raspodele.
Normalnost raspodele neprekidne promenljive takoe moemo testirati po pojedinim
kategorijama tj. grupama. Tako, u gornjem primeru moemo zasebno testirati normalnost
raspodele rezultata na IQ testu na podskupu mukaraca (uenika) i podskupu ena (uenica).
Biramo: AnalyzeDescriptive StatisticsExplore
Otvara se sledei prozor:
Neprekidnu promenljivu, za koju testiramo normalnu raspodelu, prebacujemo u Dependent
List polje. Kategorijsku promenljivu koja sadri kategorije (grupe) za koje elimo da
testiramo normalnost raspodele neprekidne promenljive rezultat na IQ testu prebacujemo u
Factor list polje:
Ostala procedura je identina prethodno datoj.
92
Rezultati:
Rezultati u tabeli Tests of Normality potvruju normalnu distribuciju vrednosti promenljive
rezultat na IQ testu za obe ispitivane kategorije (mukarci i ene). Izraunati nivo
znaajnosti, po Shapiro-Wilk testu, za kategoriju mukaraca je 0.452 dok za kategoriju
enskih ispitanika iznosi 0.246. Kako su obe vrednosti znatno iznad standardnog nivoa
znaajnosti zakljuujemo da je normalna raspodela promenljive rezultat na IQ testu potvrena
na oba ispitivana podskupa uenika.
Vizuelna procena normalnosti raspodele promenljive rezultat na IQ testu se moe izvriti
analizom konstruisanih histograma i Normal Q-Q grafika za svaku kategoriju.
93
94
Primer
Opte je verovanje da vrednosti holesterola u krvi slede normalnu raspodelu u
velikim populacijama. Na osnovu izmerenih vrednosti za dvadeset pacijenata
testirajte hipotezu o normalnosti raspodele vrednosti ove promenljive.
95
RezultatiRealizovani nivo znaajnosti Shapiro-Wilk testa iznosi 0.302 to je vee od standardnog nivoa
znaajnosti (0.05) pa zakljuujemo da vrednost holesterola u krvi sledi normalnu raspodelu.
96
97
5.4. Testiranje hipoteze zasnovano na jednom uzorku (One-Sample T-test.)
Primer 1
Postoji sumnja da maina koja pakuje deterdent (ija je propisana teina 1 kg.) nije vie
precizna, pa bi trebalo izvriti njen remont. Da bismo doneli odluku o remontu, izabrali smo
uzorak od 16 pakovanja i dobili sledei rezultat:
1.020; 1.010; 1.050; 1.015; 1.002; 1.008; 1.025; 0.998
1.012; 1.033; 1.017; 1.001; 1.008; 1.011; 1.024; 1.066
Na osnovu dobijenih podataka proveriemo da li je sumnja u preciznost rada maine
opravdana. Iz iskustva znamo da je teina pakovanja deterdenta normalno rasporeena.
Nulta hipoteza u ovom sluaju glasi da je teina pakovanja deterdenta jednaka 1 kg.
Istraivaka hipoteza je da teina pakovanja deterdenta razliita od 1 kg.
Kodiranje
Variable Column Code
Tezina pakovanja 1 izmerena tezina pakovanja u kg
PostupakIz menija klik na Analyze, zatim Compare Means i onda One-Sample T-test.
Otvara se sledei prozor:
98
Izmerena teina u kilogramima je varijabla za koju testiramo aritmetiku sredinu i
prebacujemo je Test Variable(s) polje. Poto vrednost aritmetike sredine koju testiramo
iznosi 1 kg u polje Test Value upisujemo 1.
Zatim klik na Options. Otvara se One-Sample T Test: Options prozor gde u polje
Confidence Interval unosimo vrednost nivoa pouzdanosti. U sluaju da izaberemo standardni
rizik odbacivanja nulte hipoteze (da je vrednost pakovanja deterdenta jednaka 1 kg.) 0.05 tj.
5%, pouzdanost iznosi 95%. (Rizik a se dopunjuje do jedinice koeficijentom pouzdanosti kojise, izraen u procentima naziva nivoom pouzdanosti).
Klik na Continue a zatim na OK.
99
Rezultati
One-Sample Statistics
N Mean Std. Deviation
Std. Error
Mean
izmerena tezina
u kilogramima16 1.01500 .013272 .003318
One-Sample Test
Test Value = 1
95% Confidence Interval
of the Difference
t df Sig. (2-tailed)
Mean
Difference Lower Upper
izmerena tezina
u kilogramima4.521 15 .000 .015000 .00793 .02207
Tumaenje rezultata
Aritmetika sredina uzorka je 1.015 kg a ocenjena vrednost standardne greke iznosi
0.0033. Vrednost statistike t je 4.521. Izraunati nivo znaajnosti ( p ili Sig. u SPSS
programu) je manji od standardnog nivoa znaajnosti (0.05). (u ovom sluaju p
100
Primer 2Merene su koncentracije olova u 37 sluajnih uzoraka odreene rude.
Da li se na osnovu podataka iz uzorka moe zakljuiti da je prosena koncentracija olova u
rudi vea od 30 mg/kg?
Polazni podaci:
Variable View
Data View
101
Rezultati:
Tumaenje rezultata:
a) Prosena koncentracija olova u uzorku (Mean) iznosi 37.124 mg/kg. Da bi odredili da li su
dobijeni podaci iz uzorka dovoljni dokaz da prihvatimo istraivaku hipotezu da je
koncentracija olova u rudi vea od 30 mg/kg posmatramo izraunatu vrednost statistike
dvostranog t testa (1.187) i odgovarajui realizovani nivo znaajnosti (Sig. = 0.243
(dvostrano)). Kako nas u ovom primeru zanima vrednost realizovanog nivoa znaajnosti koji
odgovara jednostranom t testu, koju SPSS ne rauna, tu vrednost dobijamo kada 0.243
podelimo sa dva. U ovom sluaju sledi da je Sig. = 0.122 (jednostrano). Kako je realizovani
nivo znaajnosti vei od standardnog nivoa znaajnosti (Sig. > 0.05) zakljuujemo da nepostoji dovoljno dokaza da je koncentracija olova u rudi vea od 30 mg/kg.
102
PrimerNa osnovu sprovedenog istraivanja utvreno je da proseno vreme spavanja u populaciji
odraslih u SAD iznosi 7 sati. U cilju ispitivanja hipoteze da studenti u proseku dnevno
spavaju manje od populacije odraslih, u SAD je sprovedeno novo istraivanje koje je
obuhvatilo uzorak od 40 sluajno izabranih studenata. Za svakog studenta iz uzorka odreeno
je njegovo proseno dnevno vreme spavanja i rezultati su uneti u SPSS program. Na osnovu
prikupljenih podataka odrediti:
1) 95% interval poverenja za proseno vreme spavanja studenata.
2) testirati hipotezu da studenti u proseku spavaju manje od cele populacije odraslih.
Postupak
1. 95% interval poverenja za prosenu vrednost moemo odrediti na nekoliko naina.
Izaberite Analyze, Descriptive analysis, Explore.
Promenljivu dnevno vreme spavanja prebacite u polje Dependent List.
103
Pritisnite OK.
Tumaenje rezultata
U tabeli Descriptives vidimo donju i gornju granicu 95% intervala poverenja za prosek. Donja
granica iznosi 6.131 dok gornja granica iznosi 6.644. Traeni interval poverenja je [6.131,
6.644].
2. Kako bi testirali hipotezu da je proseno vreme spavanja studenata krae od 7 sati
primeniemo t test za jedan uzorak. Iz menija klik na Analyze, zatim Compare Means i
onda One-Sample T-test.
Promenljivu dnevno vreme spavanja prebacite u polje Test Variable(s). U polje Test Value
upiite vrednost koju testirate. U ovom sluaju to je 7 sati.
104
Pritisnite OK.
Tumaenje rezultata
U tabeli One-sample Statistics vidimo statistiku uzorka. Proseno vreme spavanja iznosi
6.3875, standardna devijacija 0.8020 i standardna greka 0.1268:
U tabeli One-Sample Test vidimo rezultate dvostranog t testa koji testira istraivaku hipotezu
da je prosena vrednost u istraivakom skupu razliita od testirane vrednosti.
U ovom sluaju nulta hipoteza je da je proseno vreme spavanja studenata jednako 7 sati dok
je istraivaka hipoteza da je proseno vreme spavanja studenata razliito od 7 sati.
Poto se testira istraivaka hipoteza da je proseno vreme spavanja manje od 7 sati potrebni
su nam rezultati jednostranog T testa koji SPSS ne radi. Pa ipak, na osnovu dobijenih rezultata
koji se odnose na dvostrani t test lako moemo zakljuiti da li prihvatamo istraivaku
hipotezu.
105
Odgovarajui realizovani nivo znaajnosti iznosi Sig. = 0.000 (dvostrano) (to zapravo znai
da je Sig. (dvostrano)
106
6. Testovi za ispitivanje razlika izmeu
grupa
6.1. T test za nezavisne grupe (T-Test for Independent
Groups)
T test za nezavisne grupe se koristi za testiranje razlika izmeu prosenih vrednosti
obeleja dva nezavisne grupe. Nezavisnost grupa znai da sluajan izbor elemenata u uzorak
iz jedne grupe nema uticaja na sluajni izbor elementa u uzorak iz druge grupe.
Primeri:
Da li se domai i uvozni proizvodi razlikuju po kvalitetu?
Da li su prosene zarade u jednoj delatnosti vee od prosene zarade u drugoj delatnosti?
Da li se mukarci i ene razlikuju po rezultatima testiranja na standardnom testu pamenja?
Uslovi
-Mora postojati samo jedna nezavisna kategorijska varijabla (primer pol ispitanika);
-Nezavisna varijabla moe imati samo dve vrednosti (primer: muki pol, enski pol);
-Mora postojati samo jedna zavisna neprekidna varijabla.
Pretpostavke
1) Sluajni uzorci su meu sobom nezavisni.
2) Osnovni skupovi su normalno rasporeeni i njihove nepoznate varijanse su meu sobom
jednake.
107
Primer 1
Istraiva eli da ispita da li se studenti mukog pola razlikuju po svojim mogunostima
pamenja od svojih koleginica. Po deset mukih i enskih studenata je sluajno izabrano sa
prve godine kako bi bili testirani.
Svim ispitanicima su proitane trideset nepovezanih rei a zatim je zahtevano da ponove to
vie zapamenih rei. Ukupan broj ispravno ponovljenih rei svakog ispitanika je zabeleen.
Rezultati testa su prikazani tabelarno:
108
Analiza rezultata
Iz menija klik na Analyze, zatim Compare Means i onda Independent-Samples T-test.
Otvara se sledei prozor:
Kako je pol nezavisna varijabla prebacite je u polje Grouping Variable. Promenljiva ukupan
broj ispravno ponovljenih rei predstavlja zavisnu varijablu i ona se prebacuje u polje Test
Variable(s):
Klik na Define Groups da bi definisali vrednosti za nezavisnu varijablu pol (kodiranu kao 1-
mukarci, 2-ene). U prozoru Define Groups ukucati 1 za prvu grupu (Group 1) i 2 za drugu
grupu (Group 2). Zatim klik na Continue.
109
Kada se otvori prozor Independent-Samples T Test klikom na OK startujemo analizu.
Rezultati
Tumaenje rezultata
U prvoj tabeli Group Statistics dobijamo statistike uzorka. Prosek ukupnog broja
ispravno ponovljenih rei u uzorku mukaraca iznosi 17.7 ( M=17.7), standardna devijacija
3.335 (SD=3.335). Prosek ukupnog broja ispravno ponovljenih rei u uzorku ena iznosi 22.1
( M=22.1), standardna devijacija 3.178 (SD=3.178).
Kako bi proverili da li je uoena razlika u prosenom broju ispravno ponovljenih rei
izmeu studenata i studentkinja statistiki znaajna posmatramo rezultate date u tabeli
Independent Samples Test.
U izlaznim rezultatima SPSS-a dobijaju se dva niza rezultata, jedan za situacije u kojima
pretpostavka o jednakosti varijanse nije naruena a drugi za one kada jeste.
Za testiranje hipoteze o jednakosti varijansi dva skupa koristi se Leveneov test
jednakosti varijansi (Levenes Test for Equality of Variances). Kada je izraunati nivo
110
znaajnosti tog testa Sig. manji od 0.05 to znai da varijanse dveju grupa nisu jednake i da ne
vai pretpostavka o homogenosti varijanse.
Kako je statistika F testa mala F=0.087 i odgovarajui izraunati nivo znaajnosti
Leveneovog testa jednakosti varijansi veliki (Sig. = 0.772 > 0.05), pretpostavka o
homogenosti varijansi je potvrena i rezultati t testa iz prvog reda se koriste za testiranje nulte
hipoteze o jednakosti prosenih vrednosti dva skupa.
Rezultati t-testa ukazuju da je prisutna statistiki znaajna razlika izmeu mukog i
enskog uzorka u pogledu proseka upamenih rei t(18) = 3.02, Sig. = 0.007
111
Predstavljanje rezultata t-testa
Rezultate ove analize mogli bismo predstaviti ovako:
Rezultati T test za nezavisne grupe ukazuju na statistiki znaajnu razliku u prosenom broju
ispravno ponovljenih rei kod studenata (M=17.70, SD=3.335) i studentkinja (M=22.10, SD=
3.178) t(18)= -3.020, p=0.007, =0.05. Razlika izmeu srednjih vrednosti obeleja po
grupama (prosena razlika = - 4.4, 95% CI: - 7.46 do 1.34) bila je vrlo velika (eta kvadrat
=0.366).
112
Primer 2
Istraiva eli da ispita razliku izmeu nivoa holesterola u krvi ljudi iz grada i nivoa
holesterola u krvi ljudi iz sela. Sluajno su izabrani sedam ljudi iz grada i sedam ljudi iz sela
kako bi bili testirani. Svim ispitanicima je uradjen laboratorijski nalaz krvi i svaki od njih je
zabelezen. Rezultati laboratorijskih nalaza kvri su prikazani tabelano:
Mesto Holesterol Mesto HolesterolSelo1 3.88 Grad1 4.31Selo2 4.11 Grad2 3.87Selo3 6.18 Grad3 3.07Selo4 8.10 Grad4 2.22Selo5 6.05 Grad5 4.19Selo6 5.57 Grad6 6.63Selo7 7.83 Grad7 3.00
Kodiranje podataka:
Kodiranje podataka emo izvriti na sledei nain:
Variables Columns CodeMesto 1 1=selo, 2=gradHolesterol 2 Nivo holesterola u krvi
U programu SPSS-u se zadatak radi na sledei nain:
113
Iz menija klik na Analyze, zatim Compare Means i onda Independent-Samples T-test.
Otvara se sledei prozor:
Kako je mesto nezavisna varijabla prebacite je u polje Grouping Variable. Promenljiva nivo
holesterola u krvi predstavlja zavisnu varijablu i ona se prebacuje u polje Test Variable(s):
114
Klik na Define Groups da bi definisali vrednosti za nezavisnu varijablu pol (kodiranu kao 1-
mukarci, 2-ene). U prozoru Define Groups ukucati 1 za prvu grupu (Group 1) i 2 za drugu
grupu (Group 2). Zatim klik na Continue.
Kada se otvori prozor Independent-Samples T Test klikom na OK startujemo analizu.
Tumaenje rezultata:
Za testiranje hipoteze o jednakosti varijansi dva skupa koristi se Levenes Test for
Equality of Variances. Kako je statistika F testa mala F=0.252 i odgovarajui realizovani
nivo znaajnosti veliki (p=0.624>0.05) pretpostavka o homogenosti varijansi je potvrena pa
se rezultati t testa prezentovani u prvom redu mogu koristiti za testiranje nulte hipoteze o
jednakosti prosenih vrednosti dva skupa.
Rezultati ove analize pokazuju da je prisutna statistiki znaajna razlika izmeu nivoa
holesterola u krvi kod ljudi iz grada i ljudi iz sela t(12)=2,52, p=0.027
115
Iz ove analize zakljuujemo da ljudi u selu imaju vei proseni nivo holesterola u krvi
(M=5,96) od ljudi u gradu iji je proseni nivo holesterola u krvi 3,89 (M=3,89) i da su
dobijeni rezultati statistiki znaajni, t(12)=2.52, p=0.027 (obostrano).
Izraunavanje veliine uticaja
Eta kvadrat = ( )27752.252.2
2
2
-++=0.346
Eta kvadrat ukazuje na postojanje velike razlike.
Razlika izmeu srednjih vrednosti nivoa holesterola po grupama (prosena razlika 2.06, 95%
CI: 0.28 do 3.24) je vrlo velika (eta kvadrat = 0.346).
116
6.2. T test za zavisne uzorke (Paired-Samples T-Test)
T test zavisnih uzoraka (u literature se naziva i T-test uparenih uzoraka ili T-test
ponovljenih merenja) upotrebljavama kada imamo samo jednu grupu ljudi (ili maina,
preduzea, itd. tj. subjekata). U ovom sluaju, svaki ispitanik se testira dva puta u odnosu na
istu variablu. Uobiajni eksperiment ukljuuje stanja pre i posle.
Uslovi
-U svakoj analizi moraju postojati samo dva seta podataka;
-Dva seta podataka moraju biti prikupljeni od istih ispitanika ili od dve grupe povezanih
ispitanika.
Primer
Istraiva je dizajnirao eksperiment sa ciljem testiranja uticaja leka X na apetit mieva.
Praena je i beleena koliina hrane koju je grupa mieva pojela u peridu od jedne nedelje pre
uzimanja leka. Zatim je mievima dat lek i beleena je koliina hrane koju su pojeli u periodu
od nedelju dana posle uzimanja leka. Sledee koliine hrane u gramima su pojedene pre i
posle konzumiranja leka.
Koliina pojedene hrane u gramima
Pre uzimanja leka Posle uzimanja leka
S1 100 60
S2 180 80
S3 160 110
S4 220 140
S5 140 100
S6 250 200
S7 170 100
S8 220 180
S9 120 140
S10 210 130
117
Kodiranje podataka je izvreno na sledei nain:
Promenljiva Kolona Kod
pre 1 Koliina pojedene hrane (u
gramima)
posle 2 Koliina pojedene hrane (u
gramima)
Podaci su uneti u SPSS program kako je dato:
Iz menija klik na Analyze, zatim Compare Means i Paired-Samples T test. Otvara se
sledei prozor:
Prebacite pre i posle promenljive u Paired Variables polje. Kada se otvori Paired-Samples
T Test prozor startujte T-Test analizu.
118
Rezultati
Tumaenje rezultata
Rezultati ukazuju da postoji razlika u koliini hrane pojedenoj pre dejstva leka i posle i
da je ova razlika statistiki znaajna t(9) =5.08, p< 0.01.
Izraunate prosene vrednosti ukazuju da su mievi pojeli znaajno manju koliinu hrane pod
uticajem leka. (pre: M=177.00, posle: M=124.00).
119
Izraunavanje veliine uticaja u T-testu zavisnih uzoraka
Rezultati T-testa zavisnih uzoraka nam pokazuju da li je uoena razlika statistiki znaajna.
Meutim, utvrivanje statistike znaajnosti uoene razlike izmeu posmatrana dva skupa
nam nita ne govori o veliini te razlike tj. o veliini uticaja analiziranog faktora koji
uslovljava uoenu razliku. Utvrena statistika znaajnost nam jedino kazuje da je
verovatnoa da je uoena razlika izmeu dva skupa sluajna veoma mala (manja od granine).
Za odreivanje veliine uticaja moe se koristiti eta kvadrat pokazatelj koji se rauna po
sledeoj formuli:
Eta kvadrat =12
2
-+ Ntt
U naem primeru imamo:
Eta kvadrat =110076.5
076.52
2
-+ = 0.741
Smernice za tumaenje ove veliine glase:
0.01=mali uticaj, 0.06=umeren uticaj, 0.14=veliki uticaj.
Poto smo dobili eta kvadrat jednak 0.741, zakljuujemo da je veoma velika razlika u koliini
hrane pojedenoj pre dejstva leka i posle.
Predstavljanje rezultata T-testa zavisnih uzoraka
T-testom zavisnih uzoraka procenjen je uticaj dejstva leka na nedeljnu pojedenu
koliinu hrane kod mieva. Utvrena je statistiki znaajno smanjenje koliine hrane
koju su mievi pojeli za nedelju dana pod dejstvom leka (pre dejstva leka: M=177.00,
SD= 48.3, posle dejstva leka: M=124.00, 43.3), t(9) =5.08, p< 0.01 (obostrano).
Proseno smanjenje koliine pojedene hrane bilo je 53.0 grama dok se interval 95-
procentnog poverenja razlike protee od 29.3 do 76.6 grama.
Vrednost eta kvadrat pokazuje da je uticaj leka na koliinu pojedena hrane mieva
veliki.
120
6.3. Analiza varijanse sa jednim faktorom (ANOVA) (One-Way Analysis of
Variance)
Upoznali smo postupak testiranja hipoteze o razliitosti aritmetikih sredina dva
osnovna skupa. U praksi se, meutim, esto javljaju situacije u kojima je potrebno uporediti
aritmetike sredine vie od dve populacije.
Primeri:
Istraiva eli da uporedi prosene prinose kukuruza na parcelama na kojima su primenjene
etiri razliite vrste vetakih ubriva, ili prosenu dnevnu proizvodnju s obzirom na tri
naina organizacije posla, ili prosean vek trajanja automobilskih guma razliitih
proizvoaa.
ANOVA je ekstenzija nezavisnog t testa. Koristi se kada istrazivaa zanima da li se
aritmetike sredine vie od dve nezavisne grupe (skupa) razlikuju meusobno. Na primer,
istraiva eli da ispita da li se prosene vrednosti etiri etnike grupe postignute na testu
inteligencije razlikuju meusobno.
Uslovi
-Mora postojati samo jedna nezavisna varijabla (primer: nacionalna pripadnost);
-Nezavisna varijabla mora imati vie od dve vrednosti (primer: Amerikanac, Afrikanac,
Evropljanin i Azijat);
-Mora postojati samo jedna zavisna varijabla.
Pretpostavke
-Svi osnovni skupovi (populacije) iz kojih su uzeti uzorci imaju normalni raspored;
-Homogenost (jednakost) varijansi skupova;
-Opservacije su meusobno nezavisne.
121
Primer 1
Istraiva ispituje da li intenzitet elektrinog oka utie na vreme potrebno za reavanje seta
sloenih problema. Sluajnim uzorkovanjem odreeno je ukupno 18 ispitanika. Grupe od po 6
ispitanika su, zatim, izloeni razliitim intenzitetima elektrinog oka (slabi (Low); srednji
(Medium); Visoki (High)). Zatim je mereno vreme (u minutima) potrebno da svaki ispitanik
rei postavljene probleme.
Intenzitet elektrinog oka
Slab Srednji Jak
Ispitanik1 15 Ispitanik7 30 Ispitanik13 40
Ispitanik2 10 Ispitanik8 15 Ispitanik14 35
Ispitanik3 25 Ispitanik9 20 Ispitanik15 50
Ispitanik4 15 Ispitanik10 25 Ispitanik16 43
Ispitanik5 20 Ispitanik11 23 Ispitanik17 45
Ispitanik6 18 Ispitanik12 20 Ispitanik18 40
Kodiranje podataka je izvreno na sledei nain:
Promenljiva Kolona Kod
ok 1 1=slab, 2=srednji, 3=jak
Vreme 2 Vreme (u minutima)
Podaci su uneti u SPSS program na prikazani nain:
122
Posle unosa podataka analiza se vri na sledei nain.
Iz menija klik na Analyze, zatim Compare Means i One-Way ANOVA. Otvara se One-
Way ANOVA prozor:
Prebacite zavisnu varijablu vreme u polje Dependent List a nezavisnu varijablu sok u polje
Factor.
123
ANOVA e dati uoptene rezultate koji obuhvataju istovremeno poreenje sva tri uticaja
razliitih intenziteta oka na vreme. Da bi bile analizirane razlike izmeu pojedinih parova
intenziteta oka ( slab intenzitet oka prema srednjem intenzitetu oka; slab intenzitet oka
prema jakom intenzitetu oka i srednji intenzitet oka prema jakom intenzitetu oka) potrebno
je izvesti Post Hoc poreenje. Ovo se postie klikom na Post Hoc.
Kada se otvori prozor One-Way ANOVA: Post Hoc Multiple Comparisons obeleiti
Scheffe opciju kako bi se izveo Scheff Post Hoc test. Zatim klik na Continue.
Kada se otvori One-Way ANOVA prozor klik kako bi se otvorio One-Way ANOVA:
Options prozor. Oznaiti opciju Descriptive i zatim klik na Continue.
124
Kada se otvori One-Way ANOVA prozor analiza se startuje klikom na OK.
Rezultati
125
Tumaenje rezultata
Rezultati pokazuju da intenzitet elektrinog oka ima znaajan uticaj na vreme reavanja
problema F(2,15) = 40.13, p
126
U ovom primeru, zbir kvadrata odstupanja razliitih grupa (2100) treba podeliti ukupnim
zbirom kvadrata odstupanja (2492.5).
Dobija se eta kvadrat jednak 0.84, to po Koenovom kriterijumu kazuje da je uticaj razlike
veliki. Koen klasifikuje 0.01 kao mali uticaj, 0.06 kao srednji uticaj i 0.14 kao veliki uticaj.
Predstavljanje rezultata jednofaktorske analize varijanse
Jednofaktorskom analizom varijanse istraen je uticaj intenziteta elektrinog oka na
vreme reavanja problema. Primenjeni intenzitet oka je klasifikovan kao slab, srednji i
jak. Subjekti su, prema nivou intenziteta oka kome su bili izloeni, bili podeljeni u tri
grupe (grupa 1: slab intenzitet oka,