Upload
maja-mahmutovic
View
43
Download
4
Embed Size (px)
DESCRIPTION
Fakultet politickih nauka u Sarajevu
Citation preview
POGLAVLJE I: UVOD U STATISTIKU str. 1
POGLAVLJE I: UVOD U STATISTIKU ZA STUDENTE DRUŠTVENIH NAUKA
Postoje dvije osnovne ideje u statistici: uprosječavanje i slučajnost.
Uprosječavanje
Statistika uključuje proučavanje učestalosti događaja i ponašanja. Pretpostavimo da
svaki događaj ima svoju vjerovatnoću pojave, kao što je vjerovatnoća rođenja dječaka ili
djevojčice. Dugogodišnji prosjek je mjera te učestalosti. Važan zadatak statistike je zakon
velikih brojeva. Ako posmatramo ponavljanje nekog pokusa, eksperimenta ili događaja,
kao što je rođenje, dugogodišnja učestalost dešavanja jednog ili drugog ishoda, kao što je
rođenje dječaka ili djevojčice, je vrlo blizu prave učestalosti dešavanja tog ishoda. Drugi
važan zakon statistike je Teorema o centraloj granici, u kojoj se navodi da je učestalost
mogućih ishoda zbira varijabli normalno distribuiran. Kasnije ćemo se više baviti ovim
zakonima.
Slučajnost
Vjerovatnoća je nauka o slučajnosti i prilici. Sistematsko proučavanje vjerovatnoće je
postao važan predmet matematičkog izučavanja u 18. stoljeću. Krajem 18. i 19. stoljeća
primjena vjerovatnoće se preko igara na sreću raširila do studije o fizičkom i socijalnom
ponašanju. U 20. stoljeću istraživači su shvatili da se slučajnost može koristiti u
povećanju efikasnosti. Možda najiznenađujući aspekt statistike je bilo otkriće korisnosti
slučajnosti. Dvije ključne primjene ove ideje su:
1. Istraživanja na osnovu slučajnog uzorka;
2. Eksperimenti bazirani na slučajnosti.
1. Istraživanja na bazi slučajnih uzoraka:
Kako možemo imati saznanja o 100 miliona ljudi, na osnovu samo 1.000 njih?
Istraživanja na bazi slučajnih uzoraka su najrasprostranjeniji alat za mjerenje u
društvenim naukama. Skoro svi vladini podaci su sakupljeni koristeći istraživanja
bazirana na slučajnim uzorcima - uključujući mjere ekonomskih i socijalnih
uslova nacije, polazeći od povezanosti krivičnih djela sa dohotkom, siromaštva,
POGLAVLJE I: UVOD U STATISTIKU str. 2
zdravstvenog stanja. Istraživanja na bazi slučajnih uzoraka su baza kako bi
političke organizacije i akademska zajednica razumjele mišljenje javnosti o
važnim javnim politikama.
Kako istraživanja na bazi slučajnih uzoraka funkcionišu? Slučajnim odabirom se
izabere mala grupa ljudi i vrši se njihovo ispitivanje. Prosječni odgovor na svako
pitanje u slučajnom uzorku, se uzima kao pokazatelj mjere prosječnog odgovora
na to pitanje cijele populacije iz koje je uzorak uzet. Koliko ljudi će biti ispitano, i
koja pitanja će im biti postavljena zavisi od naučnika iz oblasti društvenih nauka.
Moć istraživanja na bazi slučajnog uzorka je da slučajni uzorak omogućava
istraživaču jednostavnije i pristupačnije izučavanje populacije.
2. Eksperimenti bazirani na slučajnosti:
Ljudi su provodili kontrolisane experimente stoljećima, naročito na fizičkim
objektima. Kontrole uključuju kreiranje uslova u kojem svi ostali faktori ostaju
nepromijenjeni. Nekontrolirani faktori mogu stvoriti sumnjive relacije, ili prikriti
važne efekte. Čak i u najbolje kontrolisanim eksperimentima, moguće je da neki
potencijalno važni faktor bude nekontrolisan. Vjerovatno najveći doprinos teorije
vjerovatnoće društvenim naukama u izučavanju društvenog i fizičkog ponašanja
je misao da izlaganje pojedinaca različitim uslovima može smanjiti ili eliminirati
prijetnju sumnjivih efekata.
Osnove istraživačkih metoda
Mjerenje i procjena
1. Koncepti i varijable, konstrukcije ponašanja koje želimo razumjeti. Dobar primjer
je nejednakost.
2. Mjere matematičke zastupljenosti koncepta. Naprimjer, raspodjela dohotka u
društvu može se koristiti za mjerenje nejednakosti.
POGLAVLJE I: UVOD U STATISTIKU str. 3
Konstrukcija modela
1. Efekti i odnosi u ponašanjima
Sociolozi često žele mjeriti kako jedan faktor utiče na drugi. Možemo nabrojati mnoštvo
primjera. Slijedi samo nekoliko relevantnih pitanja:
Kakav je efekat policije na krivična djela?
Kakav je efekat dodatne vojne snage na mogućnost pobjede u oružanom sukobu?
Kako veličina razreda utiče na rezultate u učenju?
Kako veličina radne grupe utiče na rezultate u socijalnom radu?
U svakom slučaju, postoji jedan faktor čija vrijednost bi trebala da varira, kao što je
naprimjer broj policajaca, kako bismo posmatrali promjene drugih faktora, kao što je
naprimjer broj krivičnih djela. Prvi faktor se zove nezavisna varijabla, a drugi faktor
zavisna varijabla. O ovim terminima ćemo razgovarati više u narednim sedmicama
nastave.
2. Računanje
Želimo napraviti cijelu računicu ponašanja. Kako bismo to postigli valorizirat ćemo
modele u kojima varijable imaju veću objašnjavajuću moć.
Primjer: Konačne cijene stambenih jedinica (kada su jedinice zaiste prodate) se mogu
dobro predvidjeti kao funkcija popisa cijena stambenih jedinica (cijene jedinica u
oglasima). Na normalnim tržištima prodajne cijene su 92% popisa cijena.
3. Koncept ravnoteže
Koncept ravnoteže je prisutan u mnogim idejama o tome kako društveni odnosi
proizvode ishode: maksimiziranje ličnih interesa, dinamično prilagođvanje, efikasnost
tržišta, ili prirodna selekcija. Snage koje stvaraju društvene ishode nisu jednostavne za
interpretiranje u smislu analize posmatranih faktora i odnosa.
POGLAVLJE I: UVOD U STATISTIKU str. 4
Zaključivanje
Temeljni metodološki problem je znati kada ići s jednim argumentom ili idejom ili ih
suprostavljati. Kada mjerimo pojave, koristimo mjerenja da izvučemo zaključke o
različitim idejama. Slijedi samo nekoliko relevantnih pitanja:
Da li su podaci u skladu s argumentom ili s idejom?
Koje zaključke možemo izvući o teorijama iz podataka?
Kakve teorijske zaključke možemo izvući iz podataka?
Onda na kraju statistika uključuje i teoriju odlučivanja.
Predviđanja teorije o svijetu se nazivaju hipoteze. Kada se navode hipoteze bitno je
iskristalisati sve moguće vrijednosti. U krivičnom pravu, hipoteza se odnosi na pitanje
krivice (neko je kriv ili nije kriv, potrebno je to dokazati). U medicini, hipoteze su vezane
za zdravstveno stanje pacijenta, kao naprimjer, da li je tumor benigni ili maligni, ili da li
je žena trudna ili ne. U nauci generalno, pitanje je da li je tvrdanja tačna ili ne.
Nažalost, mi nikada ne posmatramo istinu. Koristimo podatke za donošenje odluka o
hipotezama. Podaci se stavljaju u eksperiment. Akademska studija generira podatke.
Problem zaključivanja je kako koristiti podatke za donošenje odluka o hipotezama. U
konačnici, to će zavisiti od vrijednosti koju stavimo na različite ishode naših odluka.
Međutim, možemo formulirati problem s kojim se suočavamo prilično jednostavno.
Želimo donijeti ispravnu odluku, i možemo je donijeti na jedan od dva načina:
1. Možemo odlučiti, koristeći podatke, da je hipoteza istinita i opšti pogled je da
je ona istinita.
2. Možemo odlučiti, koristeći podatke, da hipoteza nije istina, i opšti pogled je da
ona nije istinita.
Također možemo napraviti grešku na dva načina.
1. Možemo odlučiti da je hipoteza istinita kada je ustvari lažna.
POGLAVLJE I: UVOD U STATISTIKU str. 5
2. Možemo odlučiti da je hipoteza lažna kada je ustvari istina.
Jedan od glavnih ciljeva istraživača je izbjeći obje vrste grešaka.
Istraživački pristup
U savremenom svijetu računara i informacionih tehnologija, sve discipline su prepoznale
važnost statistike. Statistika je pronašla aplikacije u društvenim naukama, poljoprivredi,
trgovini, biologiji, medicini, industriji, planiranju, obrazovanju i tako dalje. Danas ne
postoji aspekt ljudskog života gdje se statistika ne može upotrijebiti.
Porijeklo i razvoj statistike
Teorija statistike kao zasebna grana naučne metode odnedavno doživljava rast.
Istraživanja, naročito u oblasti matematičke teorije statistike rapidno rastu, a nova
otkrića se pojavljuju svakodnevno širom svijeta.
Značenje statistike
Statistika uključuje naučne metode za prikupljanje, organiziranje, sumiranje,
prezentiranje i analiziranje podataka kao i izvođenje valjanih zaključaka i stvaranje
razumnih odluka na temelju ove analize. Statistika se bavi sistemskim prikupljanjem
numeričkih podataka i njihove interpretacije.
Riječ 'statistika' se odnosi na:
1. Numeričke činjenice, kao što je broj ljudi koji žive u nekom području.
2. Istraživanje načina prikupljanja, analiziranja i interpretiranja činjenica.
Definicije
POGLAVLJE I: UVOD U STATISTIKU str. 6
Statistiku su u različitom periodu različiti autori različito definisali. U stara vremena
statistika je bila ograničena samo na državne poslove, ali danas ona obuhvata skoro
svaku sferu ljudskih aktivnosti. Stoga broj starih definicija, koje su bile ograničene na
usko područje istraživanja su zamijenile druge definicije, koje su mnogo obuhvatnije i
iscrpljujuće.
Statistika je definisana na dva načina - statistički podaci i statističke metode. Navest
ćemo nekoliko definicija statistike kao brojčanih podataka.
1. Statistike su klasificirane činjenice koje predstavljaju uslove ljudi u državi.
Činjenice mogu biti navedene u brojevima ili u tabelama brojeva ili u bilo kojem
tabelarnom ili klasifikovanom aranžmanu.
2. Statistike su mjerenja, popisivanja ili procjene prirodnih fenomena obično
sistemski uređenih, analiziranih i prezentiranih za uspostavu važnih relacija
između njih.
Definicije prema A.L. Bowley
Statistika je numerička izjava o činjenicama u bilo kojem ogranku istraživanja. - A.L.
Bowley
Statistika se može nazvati naukom računanja, također prema Bowley-u. Ovo je
nepotpuna definicija jer uzima u obzir samo aspekt prikupljanja a zanemaruje druge
aspekte, kao što su analiza, prezentacije i interpretacija.
Bowley daje drugu definiciju statistike, u kojoj se navodi 'Statistika se može s pravom
nazvati shema prosjeka'. Ova definicija je također nepotpuna, jer iako prosjeci igraju
važnu ulogu u razumijevanju i upoređivanju podataka, statistika pruža više od prosjeka.
Definicija po Croxton i Cowden
Statistika se može definisati kao nauka prikupljanja, prezentacije, analize i interpretacija
numeričkih podataka iz logičke analize.
POGLAVLJE I: UVOD U STATISTIKU str. 7
Prema toj definiciji postoje četiri faze:
1. Prikupljanje podataka: To je prvi korak i temelj cijelog seta podataka. Pažljivo
planiranje je neophodno prije prikupljanja podataka. Postoje različite metode
prikupljanja podataka (kao što su popis stanovništva, uzorkovanja, primarni
podaci, sekundarni podaci, itd.) i istraživači ih trebaju iskoristiti na pravi
način.
2. Prezentacija podataka: Masovno prikupljeni podaci trebaju biti prezentirani u
prikladnom, sažetom obliku za dalje analize. Prikupljeni podaci mogu biti
prezentirani u tabelarnom obliku ili dijagramski ili u grafičkom obliku.
3. Analiza podataka: Izneseni podaci trebaju biti pažljivo analizirani za izradu
zaključka iz prikazanih podataka, kao što su mjere centralne tendencije,
disperzija, regresija, korelacija, itd..
4. Interpretacija podataka: Završni korak je izvođenje zaključka iz prikupljenih
podataka.Validan zaključak mora biti izveden na bazi analize. Visok stepen
vještine i iskustvo je neophodno za interpretaciju.
Definicija Horacea Secrist:
Statistika se može definisati kao zbir činjenica uzrokovanih mnoštvom uzoraka, brojčano
izraženih, nabrojanih ili procijenjenih prema razumnim standardima tačnosti,
prikupljenih na sistemski način i za ugovorene svrhe. Definicija se čini najopsežnijom i
najiscrpnijom.
Funkcije statistike:
Postoje mnoge funkcije statistike. Razmotrimo pet važnih funkcija:
1. Kondenzacija
Općenito govoreći riječ "kondenzirati" znači smanjiti ili ublažiti. Kondenzacija se
uglavnom primjenjuje na prihvatanje razumijevanja velike mase podataka
pružajući samo nekoliko zapažanja. Ako su u određenom razredu u školi, samo
date ocjene, neće se postići svrha. Umjesto toga, ako se da srednja ocjena, postići
POGLAVLJE I: UVOD U STATISTIKU str. 8
će se bolja svrha. Slično raspon ocjena je također mjera podataka. Dakle,
statističke mjere pomažu smanjiti kompleksnost podataka, a time i povećati
razumijevanje velike mase podataka.
2. Poređenje
Klasifikacija i tabeliranje su dvije metode koje se koriste za kondenziranje
podataka. One nam pomažu da poredimo podatke prikupljene iz različitih izvora.
Mjere centralne tendencije, mjere disperzije, grafikoni i dijagrami, koeficijent
korelacija itd. pružaju dovoljno prostora za poređenje. Ako imamo jednu grupu
podataka, možemo vršiti poređenje unutar grupe. Ako je broj studenata na dva
različita distrikta fakulteta poznat, komparativna studija može biti napravljena –
možemo vršiti poređenje. Kao što je statistika zbir činjenica i brojeva, poređenje
je uvijek moguće i pomaže nam da bolje razumijemo podatke.
3. Predviđanje
Pod predviđanjem se podrazumijeva predvidjeti ili procijeniti unaprijed. Obzirom
na podatke o padavinama u posljednjih deset godina u Kantonu Sarajevo, moguće
je predvidjeti padavine u bliskoj budućnost. Prognoziranje je također važno za
društvene spoznaje, upravljačke politike i strategije. Analiza vremenske serije i
regresiona analiza igraju važnu ulogu u prognoziranju.
4. Procjena
Jedan od glavnih ciljeva statistike je izvođenje zaključka o populaciji iz analize
uzorka populacije.
Četiri glavne grane inferencijalne statistike su:
I. Teorija procjene
II. Testovi hipoteza
III. Neparametarski testovi
IV. Sekvencijalna analiza
POGLAVLJE I: UVOD U STATISTIKU str. 9
U teoriji procjene, naprimjer, procijenjujemo nepoznatu vrijednost populacijskog
parametra na temelju opzervacija. Pretpostavimo da imamo uzorak od 100
studenata u školi gdje smo mjerili njihovu individualnu visinu. Moguće je
procijeniti prosječnu visinu svih studenata u toj školi.
5. Testiranja hipoteza
Statistička hipoteza je izjava o vjerovatnoći distribucije i karakterizira populaciju
na bazi dostupne informacije iz uzorka. U formulaciji i testiranju hipoteze,
statističke metode su vrlo korisne. Bez obzira da li je riječ o rezultatu na izborima
neke političke stranke nakon korištenja nove metode političkog marketinga ili
efektivnosti novog lijeka u eliminisanju bolesti, oba slučaja predstavljaju
hipotezu, i testirani su statističkim alatima.
Obim statistike
Statistika nije samo uređaj za prikupljanje numeričkih podataka, već i sredstvo za
razvijanje tehnike za njihovo rukovanje, analizu i izvođenje valjanih zaključaka iz njih.
Statistika se primjenjuje u svim sferama ljudske djelatnosti - kao biologija, trgovina,
politologija, obrazovanje, planiranje, upravljanje, informacione tehnologije, itd. Gotovo
je nemoguće pronaći ljudsku djelatnost gdje se statistika ne može primijeniti. Sada ćemo
prikazati upotrebu statistike u različitim disciplinama koju bi studenti društvenih nauka
trebali znati radi raznih istraživanja koja se odnose na te discipline.
Statistika i industrija
Statistika se koristi u mnogim industrijama. U industrijama, kontrolni grafikoni se
koriste za održavanje određene razine kvalitete. U proizvodnom inžinjeringu, statistički
alati, planovi istraživanja, kontrolni grafikoni itd su od velike važnosti kako bi se
provjerilo da li je proizvod u skladu sa specifikacijama ili ne. U planovima istraživanja
neophodno je poslužiti se uzorkovanjem – važnim aspektom statistike.
POGLAVLJE I: UVOD U STATISTIKU str. 10
Statistika i trgovina
Statistika je ključ uspješne trgovine. Nijedan poduzetnik ne može dopustiti da ima višak
ili manjak proizvoda. U početku on/ona procjenjuje potražnju za svojom robom, a zatim
poduzima korake kako bi je uskladio/la sa svojom proizvodnjom ili mogućom
kupovinom. Samim tim statistika je neophodna u poslovanju i trgovini. Zahvaljujući
velikom prodoru multinacionalnih kompanija na globalnom tržištu, veličina i obim posla
raste. Na jednoj strani pojačava se konkurencija, dok se na drugoj strani ukusi mijenjaju
i novi trendovi dolaze. I u ovoj vezi, istraživanje tržišta igra važnu ulogu kako bi se
sagledalo sadašnje stanje i predvidjele promjene u budućnosti.
Statistika i poljoprivreda
Analiza varijanse (ANOVA) je jedan od statističkih alata, koji je razvio prof R.A. Fisher, i
koja igra važnu ulogu u poljoprivrednim eksperimentima. U testovima značajnosti
baziranih na malim uzorcima, može se pokazati da je statistika adekvatna za testiranje
značajne razlike između aritmetičkih sredina dva uzorka. U analizi varijanse, bavimo se
testiranjem jednakosti nekoliko aritmetičkih sredina populacije. Naprimjer, pet vrsta
gnojiva je korišteno na pet parcela na kojima se uzgaja pšenica, i poznat je prinos svake
parcele. Želimo saznati da li je uticaj gnojiva na prinos pšenice značajno različit. Slično
prethodnom, naprimjer, pet vrsta metoda političkog marketinga je korišteno u pet
gradova u kojima se organizuju izbori, i poznati su rezultati izbora. Želimo saznati da li je
marketing na izborni rezultat značajno različit. Drugim riječima, da li su uzorci uzeti iz
normalno distribuirane populacije ili ne. Odgovor na ovaj problem se dobija analizom
varijanse ANOVA, i koristi se za testiranje jednakosti više aritmetičkih sredina
populacije.
Statistika i ekonomija
Statističke metode su korisne u mjerenju numeričkih promjena složenih grupa i
tumačenju grupnog fenomena. Danas se statistika značajno koristi u bilo kojoj
ekonomskoj studiji. I u ekonomskoj teoriji i praksi statističke metode igraju važnu ulogu.
Potrebno je napomenuti da statistički podaci i tehnike statističkih alata su neizmjerno
korisni u rješavanju mnogih ekonomskih problema, kao što su plate, cijene, proizvodnja,
POGLAVLJE I: UVOD U STATISTIKU str. 11
distribucija dohotka i bogatstva, itd. Statistički alati poput indeksa, analiza baziranih na
vremenskoj seriji, teorija procjene, testiranje statističkih hipoteza, imaju značajnu
upotrebu u ekonomiji.
Statistika i obrazovanje:
Statistika se koristi i u obrazovanju. Istraživanje je postalo značajno u svim granama
djelatnosti. Statistika je potrebna za formulaciju novih predmeta, razmatranje objekata
raspoloživih za novi kurs i tako dalje. Mnogi ljudi se bave istraživanjima kako bi se
testirala znanja iz prošlosti i razvijala nova znanja. Ovo je moguće jedino kroz statistiku.
Statistika i planiranje:
Statistika je neophodna u planiranju. U savremenom svijetu, koji se može nazvati
"svijetom planiranja", gotovo sve vladine i nevladine organizacije traže pomoć u
planiranju efektivnijeg rada, u formuliranju odluka i njihovoj implementaciji. Kako bi se
postigli navedeni ciljevi, važni su statistički podaci koji se odnose na proizvodnju,
potrošnju, tražnju, ponudu, cijene, investicije, prihode, rashode i razne statističke
tehnike za obradu, analiziranje i tumačenje takvih složenih podataka. U EU statistika
igra važnu ulogu u planiranju i realizaciji EU strategija razvoja.
Statistika i medicina:
U medicini, statistički alati imaju značajnu upotrebu. T-test se koristi kako bi se poredila
efikasnost dva lijeka. Sve više se statistika koristi i u kliničkim istraživanjima.
Ograničenja statistike:
Statistika ima veliku aplikaciju u svakoj sferi ljudske aktivnosti. U nastavku spominjemo
neka od ograničenja statistike:
1. Statistika nije pogodna za proučavanje kvalitativnih fenomena: statistika je nauka
koja se bazira na numeričkim podacima i jedino je primjenjiva na kvantitativnim
podacima. Kvalitativno izraženi fenomeni kao što je iskrenost, siromaštvo,
ljepota, inteligencija i slično se ne mogu izraziti brojčano, samim tim statističke
POGLAVLJE I: UVOD U STATISTIKU str. 12
analize ne mogu na njih biti direktno primijenjene. Ipak, statističke tehnike se
mogu primijeniti indirektno zamjenjivanjem kvalitativnih izraza, kvantitavinim
terminima. Naprimjer, inteligencija grupe studenata se može ispitati na temelju
njihovih ocjena na nekom ispitu (ipak ovakav pristup je diskutabilan).
2. Statistika ne proučava pojedince: Statistika ne daje posebnu važnost jedinkama, u
stvari ona se bavi agregiranjem objekata. Pojedinačne stavke, kada se uzmu
pojedinačno, ne predstavljaju statistički podatak niti mogu biti korisni u
statističkom istraživanju.
3. Statistički zakoni nisu egzaktni: Poznato je da su matematičke i fizičke nauke
egzaktne. Ali, statistički zakoni nisu egzaktni i oni su samo aproksimacije.
Statistički zaključci nisu opšteprihvaćena istina. Oni su tačni samo u prosjeku.
4. Statistički set može biti zloupotrijebljen: Statističke metode su opasni alati u
rukama nestručnih osoba. Korištenje statističkih alata od strane neiskusnih osoba
može dovesti do pogrešnih zaključaka. Statistika može biti zloupotrebljena
citirajući pogrešne podatke ili na pogrešan način.
5. Statistika je samo jedan od načina izučavanja društvenog problema: Statistička
metoda ne daje cjelovito rješenje problema, jer se u proučavanju problema uzima
u obzir kultura zemlje, filozofija, religija i druge karakteristike. Tako bi statistička
studija trebala biti dopunjena drugim dokazima.