SPSS.docx

Najpre moramo da definišemo parametre vezane za

promenljive. Pri tome treba obratiti pažnju da:

--> pitanje u upitniku kod koga se bira samo jedan odgovor -

predstavlja jednu promenljivu

(na primer, pitanje 2 iz upitnika "Mesto stalnog boravka" )

--> pitanje u upitniku kod koga se može odabrati više

odgovora -ne može da čini jednu promenljivu, već ga

razbijamo na podceline (tj. podpromenljive).

(na primer, pitanje 12 iz upitnika "Koji metod kontracepcije

koristite")

Uporedite upitnik i strukturu matrice (uključiti Variable View) da

biste videli ovu logiku definisanja promenljivih. Svaka

promenljiva se definiše u redovima, a parametri koji su vezani

za tu promenljivu nalaze se u kolonama. Ime (Name) treba

odabrati što kraće i što jasnije jer će ono biti prikazano u Data

View; opis (Label) treba da bude detaljan za odabranu

promenljivu; vrednosti (Values) promenljive su diskretnog

numeričkog tipa; upitnik je bio takav da nisu tolerisana

zabušavanja , znači da su žene morale je da popune sve

podatke, stoga nema "nedostajućih vrednosti" (Missing).

Ono što može da buni, kod definisanja parametra Values, je

kvantifikacija podataka, čija je priroda kvalitativna (al' sam ga

sročio).

--> Dakle, sve ćemo odgovore ispitanica (koji su većinom

kvalitativni) prikazati brojem !

Ovde ćemo razlikovati 4 situacije:

a) od ispitanice se očekuje neki unos (na primer, pitanje 1.

"Godine starosti")

--> ovde nema problema sa preslikavanjem na brojnu vrednost

jer se godine izražavaju brojem

b) od ispitanice se očekuje zaokruživanje jednog odgovora (na

primer, pitanje 2. "Mesto stalnog boravka")

--> svakoj opciji ćemo dodeliti po jednu numeričku vrednost

Da ne bi mnogo filozofirali, slika će da objasni ovaj princip:

1

Slika: definisanje numeričkih vrednosti za odgovore

Prvo se postarajmo da smo u Variable View. Potom kliknimo

naValues i kada je pojavi kvadratić, kliknimo na njega. Otvoriće

se novi prozor (u fokusu) gde definišemo preslikavanje

odgovora na numeričku vrednost. Kada povežemo oznaku i

broj, treba kliknuti naAdd.

c) ispitanica može da zaokruži više odgovora (na primer,

pitanje 12. vezano za izbor metode kontracepcije)

--> pitanje nećemo predstaviti sa jednom promenljivom, već sa

više tzv. DA/NE promenljivih. Svaka mogućnost koja može biti

zaokružena, biće predstavljena sa posebnom promenljivom.

Evo slike i za ovu situaciju:

Slika: primer razlaganja na više promenljivih sa vrednostima

DA i NE (tj. 1 i 2)

Malo edukacije: ovde nije pomenuta "apstinencija" koja takođe

predstavlja metodu kontracepcije i to jedinu 100% uspešnu

(drug je verovatno ovo sveo na pitanje 9 pod c)). Po jednom

istraživanju najčešća metoda kontracepcije kod srba je

takozvani "coitus interruptus" ili "prekinuti snošaj". Videću da

2

http://www.mycity.rs/slika.php?slika=152099_327414395_spssboravakk.jpeg

ubacim još jedan rad koji pokazuje FAIL ovih metoda, tj. kolika

je šansa da žena zatrudni ukoliko pribegava specifičnim

metodama kontracepcije. Koliko me sećanje služi, impulsivni

muškarci ne smeju pribegavati C.I. metodi jer ne mogu da

kontrolišu ejakulaciju. Oni koji, pak, mogu a pri tome su

neiskusni ~20% šanse je da će partner zatrudneti. Kod iskusnih

se ovaj procenat značajno smanjuje. Samo teorijski i uz grubu

apstrakciju posmatrano, ko želi potpuno "prirodan" metod

kontracepcije drugar preporučuje kombinaciju: praćenje

plodni/neplodni dani + apstinencija za vreme plodnih dana +

prekinut snošaj.

Nego, vratimo se mi na matricu

d) Numerički odgovori koji su zasnovani na Likertovoj skali (1-

5). Ako se sve ispratili do sada, i ovo bi trebalo da bude jasno.

Videti sliku:

Slika: prikaz odgovora po Likertovoj skali

OK, sad bi trebalo da znate da formulišete sve promenljive

(varijable) i odredite sve parametre sa lakoćom.

Sada je vreme da se prebacimo na Data View. U Data View, u

kolonama se nalaze promenljive, a u redovima opservacije

(odnosno jedan red = jedna opservacija = jedna ispitanica).

Možda ovo opet deluje pomalo nejasno, pa ćemo proći kroz

primer (da ne bih mnogo filozofirao):

3

http://www.mycity.rs/slika.php?slika=152099_261932174_spsslikert.jpeg

Slika: prikaz dela opservacije u Data View

OK, nahvatali smo prvu tetu s reda. Da vidimo kako ćemo

tumačiti podatke (otvorite u isto vreme matricu i sliku upitnika):

--> Ima 22 godine, živi u gradu, ide u srednju skolu, partner joj

ide na faks, ima stalnog partnera, u dugoj je emotivnoj vezi,

nema dece, broj dece je 0 (primetite bug ) , rijetko ima

seksualne odnose, koristi kontracepciju, pri tome koristi je

uvek, i to kondom i pilulu.

(naravno, reverznom metodom se na osnovu upitnika

popunjava matrica ! )

To je to. Očekuje vas naporan posao ukucavanja svih

opservacija....................

* Učitavanje matrice, čuvanje matrice, generisanje statistika, ...

i sve druge aktivnosti će biti logovane u Output prozoru. Kada

ga ugasite, SPSS će vas upitati da li želite da sačuvate

promene. Ovo pitanje nije vezano za samu matricu već samo

za Output prozor. Dakle, ako ne sačuvate promene to neće da

utiče na matricu.

[5] STATISTIKA

* Ukliko već niste, preuzmite i otvorite rad (DOC datoteku)

koji sam linkovao na početku članka

Za potrebe ovoga rada, najpre će nam trebati deskriptivna

statistika, deo oko analize frekvenci. Obratite pažnju na

poglavlje:Rezultati istraživanja i potpoglavlje 3.1 - Karakteristike

ispitivane populacije, grafikon 2.

Dakle, potrebno je odabrati meni: Analyze --> Descriptive

Statistics --> Frequencies...

4

http://www.mycity.rs/imgs2/152099_93547216_spsstumac.jpeg

Slika: odabir menija za analizu frekvenci

Klikom na strelicu udesno biramo promenljive koje će biti

analizirane:

Slika: odabir promenljive za analizu

Klikom na dugme Charts... dobija se sledeći prozor, gde

biramo opciju Histograms i treba štriklirati opciju With normal

curve (da bi se dobila linija normalne raspodele na

histrogramu).

5

http://www.mycity.rs/slika.php?slika=152099_57018376_Freq1.jpeg


Slika: odabir histograma, kao načina prikazivanja podataka

Rezultate analize softvera možete videti u tzv. Output

prozoru. U njemu se prate sve akcije, počevši od čuvanja

matrice, učitavanje nove datoteke, izvršene analize i druge

izvršene operacije.

Bitno je da nema missing values jer se ovaj parametar

pokazuje da li neke vrednosti nedostaju u matrici (ovo može

poslužiti kao mini reper za kontrolu unosa podataka u matricu).

N predstavlja veličinu uzorka;

Tabelu treba analizirati na sledeći način: broj anketiranih

devojaka koje imaju 16 godina je 3; procentualno 1.4% od

ukupnog broja anketiranih devojaka i kumulativni procenat

predstavlja zbir svih ostalih procenata u koloni do tekućeg reda.

Ovaj parametar se iskoristio u radu da se konstatuje da je npr.

uzrast ispitanica od 16 - 20 god. zastupljen sa 11.7 % .

6


Slika: Output prozor i rezultat analize frekvenci

Na prozoru Output prikazuje se i grafikon koji smo odabrali:

Slika: prikaz histograma koji je iskorišten za rad

Na grafikonu 3 je odabrana opcija Bar Charts sa definisanim

procentima kao vrednostima grafika:

7


http://www.mycity.rs/slika.php?slika=152099_81964015_histogram.jpg

Slika: prikaz definisanja parametara za Bar Chart

Kako na lak način da ubacite sve ove grafikone i tabele u

vaš seminarski/maturski/diplomski rad?

--> U prozoru Output, na beloj (slobodnoj) površini kliknite

desnim tasterom miša i odaberite opciju Export... Pojaviće se

sledeći prozor:

Slika: prozor za izvoz (export) sadržaja prozora Output

[url=http://www.mycity.rs/must-login.png prilažem i datoteku

koju sam dobio sa exportovanjem. Dakle, pomoću LibreOffice-

a,OpenOffice-a ili nekog drugog tekst procesora (tipa Microsoft

Office Word 2010) možete otvoriti datoteku i jednostavno u rad

8

http://www.mycity.rs/slika.php?slika=152099_43714171_bar.jpeg

http://www.mycity.rs/slika.php?slika=152099_655712694_export.jpeg

iskopirati tabele ili grafikone koji su vam od značaja.

Grafike je moguće formulisati i pojedinačno, bez statistika, a na

osnovu podataka iz matrice. Za te potrebe služi

meni Charts. Chart Builder predstavlja moćni Wizard koji služi

za definisanje informacija koje će se pojaviti u grafiku. Druga,

jednostavnija opcija je Legacy Dialogs, na primer:

Slika: odabir stavke Legacy Dialogs

Slika: odabraćemo grupu slučajeva

9

http://www.mycity.rs/slika.php?slika=152099_65571394_graf1.jpeg


Slika: Parčiće grafika (slices) ćemo odabrati po promenljivoj

"broj dece"

Slika: rezultirajući grafik u osnovnoj formi

Dakle, u ovoj situaciji pojaviće se samo grafik bez statistika, i to

bazična verzija grafika. Dvostrukim klikom na grafik moguće je

urediti taj grafik, na primer dodavanje procenata na parčiće,

definisanje drugog tipa grafika, dodavanje dimenzije, izmena

10



legende i drugo.

Kroz čitava potpoglavlja 3.1 i 3.2 iskorišteni su ovi, do sad

navedeni statistički principi, samo sa drugim promenljivima.

U potpoglavlju 3.3 - Faktori koji utiču na upotrebu kontracepcije

i negativni stavovi o kontracepciji, koristi se takozvani Hi-

kvadrat test (Chi Square Test) koji će biti upotrebljen iz

upoređivanja promenljivih (Crosstabulation).

Odaberite meni i stavke kao sa sledeće slike:

Slika: odabir stavke Crosstabs...

Želimo da vidimo kakvo je stanje sa upotrebom kontracepcije u

odnosu na mesto stalnog boravka:

11

http://www.mycity.rs/slika.php?slika=152099_43714402_crosstabs1.jpeg

Slika: definisanje promenljivih u redu i koloni

Kliknimo na dugme Statistics...; Označiti stavke kao sa slike i

potvrditi sa Continue.

Slika: dijalog Statistics...

Zatim treba kliknuti na dugme Cells jer želimo uključiti i prikaz

procenata; označiti parametre kao sa slike:

12



Slika: dijalog Cell Display...

Pojaviće se sledeći output prozor sa rezultatima analize.

Uporediti sa tabelom u radu:

Slika: prikaz rezultata u Output prozoru

Iz jedne druge analize vidimo deo koji se tiče Hi-kvadrat testa:

13



Slika: odeljak koji se tiče Chi Square testa

Parametri koji treba da se nalaze u vašem radu su:

Value --> predstavlja vrednost statistike

df --> predstavlja broj stepeni slobode (degrees of freedom). U

literaturi se označava i sa "n".

sig --> predstavlja značajnost statistike (significance); U literturi

se označava sa "p".

Najpre, hipoteze za Hi-kvadrat test nezavisnosti se postavljaju

na sledeći način (u opštem slučaju):

Ho: Dve kategoričke promenljive su nezavisne (ovo je tzv. nulta

hipoteza).

Ha: Dve kategoričke promenljive su zavisne (povezane).

Odlučivanje za odbacivanje ili prihvatanje hipoteza se vrši na

osnovuznačajnosti. Naime, ako je "p" <= 0.05, tada je

test statistički značajan i odbacuje se nulta hipoteza (Ho).

Dakle:

- Ukoliko je vrednost parametra "p" <= 0.05 hipoteza Ha se

prihvata, a odbacuje Ho.

- Ukoliko je vrednost parametra "p" > 0.05 hipoteza Ho se

prihvata, a Ha se odbacuje

Što se tiče frekventne analize ajtema, vrši se idenično kao

analiza frekvneci:

14


Slika: prikaz jedne frekventne analize ajtema

Za dalju diskusije oko prihvatanja ili odbacivanja hipoteza na

osnovu ovih statističkih rezultata i neslaganja rezultata sa

postojećim arhivskim rezultatima našeg područja, treba

pročitati deo u radu koji nosi naziv Diskusija.

Objašnjenje i izbor tipa varijable

Pogledajmo opciju sa slike:

Ukratko ćemo je pojasniti.

Postoje tri tipa (ili "nivoa merenja")

varijabli: nominalni, ordinalni iintervalni.

Nominalni. Odlika ovih varijabli je što o relaciji između

vrednosti jedne nominalne varijable ne možemo znati ništa

osim da se one razlikuju. Ilustrujmo primerima.

Primer 1

15

http://www.mycity.rs/slika.php?slika=152099_43714402_frekvanalajtema.jpeg

http://www.mycity.rs/slika.php?slika=107914_61294868_1.JPG

Nazovimo varijablu Boja. Pripišimo joj

vrednosti crna, crvena,žuta i plava. Sve što možemo reći o

odnosima ovih vrednosti je da se međusobno razlikuju.

Dakle,

crna ≠ crvena

crna ≠ crvena

crna ≠ žuta

crvena ≠ crna

crvena ≠ žuta

crvena ≠ plava

...

Zbog ovog svojstva varijabla je nominalna. Navedimo još

jedan primer.

Primer 2

Varijabla Grad. Vrednosti su Beč, Kan, Sidnej i Jagodina

Beč ≠ Kan

Beč ≠ Sidnej

Beč ≠ Jagodina

Kan ≠ Beč

Kan ≠ Sidnej

Kan ≠ Jagodina

Itd.

Sad, pretpostavimo da imamo skup od 9 ispitanika. (pravilnije

je reći jedinica istraživanja nego ispitanik, jer se istraživanja

vrše i na porodicama, domaćinstvima, raznim drugim grupama i

objektima) Skupu od devetoro ispitanika dodeljujemo vrednosti

varijable Grad. Onda ih grupišemo prema tim vrednostima i

poređamo u red. I dobijemo, recimo:

Sidnej

Sidnej

Kan

Kan

Jagodina

Beč

Beč

Beč

Beč

16

Vrednost koja se najviše puta pojavila

zovemo mod, modus ilimodalna vrednost (u SPSSu mod). U

ovom slučaju mod jeBeč. Moguće je imati više modalnih

vrednosti.

Idemo dalje.

Ordinalni. Pored toga što vrednosti ordinalne varijable

možemo međusobno da razlikujemo, možemo i da ih stavimo u

poredak (order - ordinal). Dakle, za svaku vrednost ordinalne

varijable znamo da li je veća ili manja od neke druge vrednosti

iste te varijable.

Primer

Varijabla Temperatura. Vrednosti i njihov poredak: jako

hladno> hladno > mlako > toplo > jako toplo.

Kao i u slučaju sa nominalnom varijablom, uzmemo npr. 9

nasumičnih vrednosti ove varijable, ali ih poređamo rastućim

redom.

jako hladno

jako hladno

jako hladno

hladno

mlako

toplo

toplo

toplo

toplo

Pored moda, kod ordinalnih varijabli možemo da izračunamo

imedian, minimum, maximum i range.

Median - vrednost srednjeg člana u ovako postavljanom nizu.

U ovom slučaju to je 5. član = mlako. Kada imamo paran broj

slučajeva, onda možemo da se opredelimo za jednu od

vrednosti dva srednja člana.

Minimum i maximum - najmanja i najveća vrednost u ovako

postavljenom nizu. U ovom slučaju jako hladno i toplo.

Range - opseg u kome se kreću vrednosti u nizu. Razlika

između maksimuma i minimuma. U ovom slučaju ... pogledaj

17

zvezdicu.

*u SPSSu nećemo videti u tabeli "mlako", "jako hladno", "toplo"

itd. Sva je prilika da ćemo ove vrednosti kodirati brojevima 1, 2,

3 itd. zbog lakšeg unosa u bazu podataka (matricu). Ono što

ćemo u tabeli u SPSSu da dobijemo su upravo ti kodovi-brojevi

za minimum, maksimum, range...

Npr. imamo varijablu Posećivanje crkve, a vrednosti su

Range, minimum i maximum su

Intervalni - vrednosti intervalnih varijabli imaju sva svojstva

vrednosti ordinalnih varijabli, sa time što u slučaju intervalnih

varijabli možemo da kažemo i za koliko je jedna vrednost od

druge veća ili manja. Najjednostavnije, vrednosti intervalnih

varijabli su najčešće brojčane vrednosti.

Pored mediane, moda, min/maksimuma itd., kod intervalnih

varijabli možemo da računamo i mean (aritmetičku sredinu)

ikvartile (quartiles).

Nije potrebno objašnjavati kako se računa aritmetička sredina.

Quartiles. Kvartili su, u rastućem nizu vrednosti svih slučajeva

(kao u primerima sa nominalnim i ordinalnim varijablama),

vrednosti slučajeva ispod kojih se nalazi četvrtina slučajeva. Pa

18

tako imamo 1. i 3. kvartil, tj. vrednosti slučajeva ispod kojih

stoje 25%, odnosno, 75% svih slučajeva. 2. kvartil je Mediana.

Percentiles (percentili) su, sledstveno ovome, vrednosti ispod

kojih spada određen procenat ukupnih slučajeva.

Primer

4,3

5,1

5,5

5,6

5,6

5,7 <--- 1. kvartil / 25. percentil - ispod ovog člana nalazi se

25% ukupnih slučajeva

5,8

5,9

5,9

5,9

6,2

6,3

6,4 <--- 2. kvartil / 50. percentil / Mediana - ispod ovog člana

nalazi se 50% ukupnih slučajeva

6,4

6,6

6,7

6,8

6,8

7,1

7,1 <--- 3. kvartil / 75. percentil - ispod ovog člana nalazi se

75% ukupnih slučajeva

7,1

7,3

7,4

7,5

8,1

9,1

Evo kako to izgleda u tabeli:

19

Sve ove pokazatelje možemo prikazati tabelarno sledećim

koracima:Analyze - Descriptive

statistics - Frequencies - Statistics.

Ove pokazatelje možemo prikazati i grafički sledećim

koracima:Analyze - Descriptive

statistics - Frequencies - Charts. (*za nominalne varijable

pogodni su Bar charts, za ordinalne Pie charts, a za

intervalne Histograms)

Generalno, pri formiranju varijabli (a one se vrlo često formiraju

iz pitanja u anketnim upitnicima), treba težiti tome da tip

varijable bude što višeg nivoa (intervalni je najviši), jer što viši

nivo varijable, to će više moći da nam pokaže, da nam da više

informacija. Recimo, dok nominalnu varijablu možemo opisati

samo modom, kod intervalne imamo i kvartile, mean, range itd.

BONUS - Dihotomne varijable

Dihotomne varijable su varijable koje imaju samo dve

vrednosti. Pogodne su jer ih možemo predstaviti i kao

nominalne i kao ordinalne i kao intervalne.

Indeks korisnih poruka u temi

* Izvrtanje odgovora na inverzna pitanja: LINK

* Hi-kvadrat se koristi kod kategorijalnih

(nominalnih i ordinalnihvarijabli) 1.

Ako je uspeh u školi varijabla ordinalnog tipa, trebalo bi da

20

uraditiANOVA test, koji proverava da li postoje razlike između

pojedinih grupa. 2.

*ANOVA test, proverava da li postoje razlike između pojedinih

grupa.

Preciznije: ANOVA proverava da li postoje razlike u prosečnim

vrednostima (tj. aritmetičkim sredinama)

intervalne Dependentvarijable za svaku od kategorija, pri čemu

su "kategorije", zapravo vrednosti kategorijalne Factor varijable

(a kategorijalne varijable su nominalnog ili ordinalnog tipa).

Hipoteza koja se testira ANOVA testom je da ne postoje

razlike u prosečnim vrednostima između grupa.

Dok nam ANOVA tabela u SPSS-u govori da li razlike

postoje, druga tabela, koja treba da bude rezultat

onog Bonferroni testa, treba da pokaže između kojih

grupa razlike postoje. link

* Više o tumačenju Bonferroni testa: LINK

* Faktorska analiza se koristi prilikom ispitivanja značaja

delovanjaodređenih faktora na varijablu. Na primer: varijabla

je hibrid, na koju deluju 3 faktora (preparat, godina i

tretman). link.

* PSPP je besplatna alternativa SPSS-u. Može da otvara baze

podataka iz SPSS-a (.sav), ali ne otvara output fajlove (.spo) iz

SPSSa (niti ih čuva u tom formatu). LINK

21

Documents

SPSS.docx