Upload
ivana-omaljev
View
87
Download
4
Embed Size (px)
DESCRIPTION
Uvod u Statistiku
Citation preview
1. Uvod u Statistiku1. Uvod u Statistiku1. Uvod u Statistiku1. Uvod u Statistiku
pripremila Tatjana Bajićpripremila Tatjana Bajić
SadržajSadržaj
Značenje pojma statistikePopulacija i uzorakPopulacija i uzorakVarijable i njihova podela
kSavremena statistika
2
StatistikaStatistikaStatistika (nlat. statisticus od lat. stata što znači stanje)Reč statistika ima dvojako značenje:
U svakodnevnom životu, reč statistika seU svakodnevnom životu, reč statistika se odnosi na numeričke činjenice odnosno numeričke podatke koji su sistematski prikupljeni.Drugo značenje: Statistika se odnosi na naučnu disciplinu.
3
StatistikaStatistikakao naučna disciplinakao naučna disciplina
Statistika je naučni metod koji se koristi za:za:
prikupljanje podatakaklasifikaciju podatakaklasifikaciju podatakaprikazivanje podatakaanalizu podatakaanalizu podatakainterpretaciju podatakai donošenje statističkih zaključakai donošenje statističkih zaključaka.
4
Predmet statističkog Predmet statističkog istraživanjaistraživanja
Predmet statističkog istraživanja su pojave koje su po svojoj prirodi varijabilne.koje su po svojoj prirodi varijabilne.Svaka pojava nastaje pod uticajem nekih faktora a samo njeno ponašanje jefaktora, a samo njeno ponašanje je uslovljeno prirodom, brojem i načinom kombinovanja tih faktorakombinovanja tih faktora.Faktori koji deluju na pojavu su varijabilni pa će i pojava pokazivati manjevarijabilni, pa će i pojava pokazivati, manje ili više izražen varijabilitet. 5
Procene i prognozeProcene i prognoze
Na osnovu statističkog posmatranja pojava i primenom statističkih metodapojava i primenom statističkih metoda zaključivanja donose se odluke.Odluke donete na osnovu statističkihOdluke donete na osnovu statističkih metoda nazivaju se procenama i prognozamaprognozama.
6
Osnovni skup ili populacijaOsnovni skup ili populacijaOsnovni skup ili populacijaOsnovni skup ili populacija
Osnovni skup ili populacija (sciljna populacija) sastoji se od elemenata čije p p j ) j jkarakteristike ispitujemo ili na kojima se izvesna pojava statistički posmatra.p j pElementi osnovnog skupa moraju imati bar jednu zajedničku osobinu koja ih svrstava u tajjednu zajedničku osobinu koja ih svrstava u taj skup.Elementi osnovnog skupa mogu bitiElementi osnovnog skupa mogu biti osobe, stvari ili predmeti. 7
UzorakUzorakFormiranje osnovnog skupa zavisi od prirodeFormiranje osnovnog skupa zavisi od prirode pojave koja se posmatra, cilja istraživanjai raspoloživih mogućnosti posmatranjai raspoloživih mogućnosti posmatranja.Deo osnovnog skupa koji je izabran u svrhe t ti tičk li i k B jstatističke analize naziva se uzorkom. Broj
elemenata uzorka zove se obim (veličina)kuzorka.
Uzorak koji u najvećoj meri odražava karakteristike osnovnog skupa jeste reprezentativni uzorak. 8
Varijabla (promenljiva ili Varijabla (promenljiva ili obeležje)obeležje)
Pojedinačni elementi osnovnog skupa ili uzorka nazivaju se elementima iliuzorka nazivaju se elementima ili jedinicama posmatranja.Varijabla (promenljiva ili obeležje) jeVarijabla (promenljiva ili obeležje) je osobina (karakteristika) koja se proučava ili istražuje i koja podrazumeva različiteistražuje i koja podrazumeva različite vrednosti po jedinicama posmatranja.Nasuprot varijabli je konstanta čijaNasuprot varijabli je konstanta čija vrednost je uvek fiksna. 9
Podela varijabliPodela varijabli
Najvažnija podela varijabli je na:kvantitativne (numeričke) varijablekvantitativne (numeričke) varijable kvalitativne (atributivne) ili kategorijske varijablevarijable
Različite vrednosti koje kvantitativna varijabla može uzeti odnosno različitivarijabla može uzeti, odnosno različiti vidovi u kojima se kvalitativna varijabla može javiti jednim imenom se nazivajumože javiti, jednim imenom se nazivaju modalitetima te varijable.
10
Opse acija ili podatakOpse acija ili podatakOpservacija ili podatakOpservacija ili podatak
Vrednost ili forma varijable koja se odnosi na jednu jedinicu posmatranjaodnosi na jednu jedinicu posmatranja naziva se opservacijom ili podatkompodatkom.
11
Kvantitativne varijableKvantitativne varijable
Varijabla koja se može brojčano izraziti naziva se kvantitativnom (numeričkom) ( )varijablom.Podaci prikupljeni o kvantitativnoj varijabliPodaci prikupljeni o kvantitativnoj varijabli nazivaju se kvantitativnim podacima.Kvantitativne varijable mogu biti:Kvantitativne varijable mogu biti:
prekidne (diskretne) varijable ilikid (k ti i ) ij blneprekidne (kontinuirane) varijable.
12
Prekidne varijablePrekidne varijable
Varijabla čije vrednosti možemo da prebrojimo naziva se prekidno (diskretnom) varijablom.naziva se prekidno (diskretnom) varijablom.Prekidna varijabla može da uzima samo izolovane vrednosti najčešće cele brojeve aizolovane vrednosti, najčešće cele brojeve, a ne i međuvrednosti.Primeri prekidnih varijabli:Primeri prekidnih varijabli:
broj učenika u razredub d ćbroj dece u vrtićubroj automobila na parkingu 13
Neprekidna varijablaNeprekidna varijabla
Varijabla koja može uzeti bilo koju numeričku vrednost u određenom intervalu ili intervalimavrednost u određenom intervalu ili intervalima jeste neprekidna (kontinuirana) varijabla.Vrednosti neprekidnih varijabli se ne moguVrednosti neprekidnih varijabli se ne mogu prebrojati.Primeri neprekidnih varijabli:Primeri neprekidnih varijabli:
vreme trajanja ispitadvisina studenata
visina beba 14
Kvalitativne (atributivne) Kvalitativne (atributivne) ili kategorijske varijableili kategorijske varijable
Varijabla koja ne može uzeti numeričke vrednosti, ali se može klasifikovati u dve ilivrednosti, ali se može klasifikovati u dve ili više kategorija jeste kvalitativna (atributivna) ili kategorijska varijabla.(atributivna) ili kategorijska varijabla.Podaci prikupljeni o ovakvoj varijabli nazivaju se kvalitativnim podacimase kvalitativnim podacima.Primer kvalitativnih varijabli: pol, pismenost, zanimanje marka automobila boja kose i slzanimanje, marka automobila, boja kose i sl.
15
Kategorije kvalitativnih Kategorije kvalitativnih varijablivarijabli
Kategorije (modaliteti) kvalitativnih varijabli ne odražavaju intezitet posmatrane osobinene odražavaju intezitet posmatrane osobine već samo njene različite pojavne oblike.Primer kategorija (modaliteta) kvalitativnePrimer kategorija (modaliteta) kvalitativne varijable pol: muški i ženski, predstavljaju samo različite vidove javljanja ove varijablesamo različite vidove javljanja ove varijable.
16
Vrste varijabliVrste varijabli
Varijablej
Kvantitativne KvalitativneKvantitativne Kvalitativne ili kategorijske
Prekidna Neprekidna
17
Varijable koja mogu biti i Varijable koja mogu biti i kvalitativne i kvantitativnekvalitativne i kvantitativne
Neke varijable se mogu izraziti i opisno i numerički.Na primer varijabla uspeh studenata se može izraziti kao dovoljan dobar vrloizraziti kao dovoljan, dobar, vrlo dobar, izuzetno dobar i odličan, ali može se iskazati i brojčanim ocenama 6,7,8,9 i 10iskazati i brojčanim ocenama 6,7,8,9 i 10.Za statistički obradu, kvantitativne varijable su pogodnije od kvalitativnih zbog mogućnostipogodnije od kvalitativnih zbog mogućnosti njihove šire matematičke obrade. 18
Savremena statistikaSavremena statistika
Podrazumeva dva aspekta:1 Teorijsku odnosno matematičku1. Teorijsku odnosno matematičku
statistiku koja se bavi razvojem, izvođenjem i dokazivanjem statističkihizvođenjem i dokazivanjem statističkih teorema, formula, pravila i zakona.P i j t ti tik k j d t lj2. Primenjenu statistiku koja predstavlja primenu statističke teorije u praksi, odnosno
i t ti tičkih t f l ilprimenu statističkih teorema, formula, pravila i zakona u rešavanju realnih problema. 19
Statistička teorijaStatistička teorija
Statistička teorija odnosno matematička statistika se zasniva namatematička statistika se zasniva na teoriji verovatnoća.Verovatnoća nekog događajaVerovatnoća nekog događaja predstavlja šansu pojavljivanja tog događaja u uslovima neizvesnostidogađaja u uslovima neizvesnosti.
20
Primenjena statistikaPrimenjena statistika
Primenjena statistika se u najširem smislu deli na dve oblasti:deli na dve oblasti:
Deskriptivnu ili statistiku u užem smisluInferencijalnu statistiku (statističkoInferencijalnu statistiku (statističko zaključivanje)
Verovatnoća koja predstavlja šansuVerovatnoća, koja predstavlja šansu javljanja određenog ishoda, upravo povezuje ove dve oblasti statistike: deskriptivnu iove dve oblasti statistike: deskriptivnu i inferencijalnu statistiku.
22
Deskriptivna statistikaDeskriptivna statistika
Deskriptivna statistika se sastoji od metodametoda
prikupljanja podatakasređivanja podatakasređivanja podatakaprikazivanja podataka iopisivanja podataka pomoću tabelaopisivanja podataka pomoću tabela, grafikona i sumiranih pokazatelja.
23
Inferencijalna statistikaInferencijalna statistika
Inferencija (lat. inferre – navoditi) je proces mišljenja kada se prelazi od jedne istine namišljenja kada se prelazi od jedne istine na drugu istinu koja se smatra istinom zbog svoje veze sa prvom.veze sa prvom.Inferencijalna statistika obuhvata statističke metode koje primenjujemo dastatističke metode koje primenjujemo da bismo na osnovu podataka prikupljenih iz uzorka došli do zaključka o karakteristikamauzorka došli do zaključka o karakteristikama osnovnog skupa.
24
Teorija verovatnoćaTeorija verovatnoća
Matematička statistika –Statistička teorijaStatistička teorija
P i j t ti tikPrimenjena statistika
Deskriptivna statistika
Inferencijalna statistika
25
statistika statistika
2 P ik lj j i đi j2 P ik lj j i đi j2. Prikupljanje i sređivanje 2. Prikupljanje i sređivanje podatakapodatakapodatakapodataka
pripremila Tatjana Bajićpripremila Tatjana Bajić
PRIKUPLJANJE I PRIKUPLJANJE I SREĐIVANJE PODATAKASREĐIVANJE PODATAKA
Prikupljanje podatakaSerije podataka: strukturne serije iSerije podataka: strukturne serije i vremenske serijeApsolutne frekvencijeApsolutne frekvencijeRelativne frekvencijeUčešće
27
Prikupljanje podatakaPrikupljanje podataka
Kada se podaci prikupe, informacije dobijene od svakog elementa populacije ili uzorka, g p p j ,zapisuje se redosledom u kojem pristižu.Podaci zapisni redosledom kojim sePodaci zapisni redosledom kojim se prikupljaju, pre nego što se urede po veličini ili grupišu nazivaju se sirovim podacima iliili grupišu, nazivaju se sirovim podacima ili negrupisanim podacima.Kao rezultat sređivanja prikupljenih podatakaKao rezultat sređivanja prikupljenih podataka dobijamo serije podataka. 28
Serija podatakaSerija podatakaSerije podataka su nizovi sređenih podataka koji prikazuju strukturu skupa u odnosu na posmatranu varijablu ili raspodelu skupa u prostoru, ili promenu skupa u vremenu.U zavisnosti od vremena u kojem će biti prikupljeni, serije podataka se mogu podeliti p up je , se je poda a a se ogu podena:
strukturne serije istrukturne serije ivremenske serije
29
Strukturne serije podatakaStrukturne serije podataka
Podaci prikupljeni o različitim elementima osnovnog skupa ili uzorka u istomosnovnog skupa ili uzorka u istom vremenskom trenutku ili u istom vremenskom periodu nazivaju sevremenskom periodu nazivaju se strukturnim serijama podataka (podacima preseka ili uporednim podacima).(podacima preseka ili uporednim podacima).Primer: grupisani podaci o uspehu studenata na ispitu iz Informatike u jednomstudenata na ispitu iz Informatike u jednom ispitnom roku
30
Vremenske serije podatakaVremenske serije podataka
Vremenske serije sadrže podatke o istoj jedinici osnovnog skupa ili uzorka ujedinici osnovnog skupa ili uzorka u različitim vremenskim periodima.Primer: podaci o prosečnoj oceni izPrimer: podaci o prosečnoj oceni iz Informatike tokom deset školskih godinagodina
31
Apsolutne frekvencijeApsolutne frekvencije
Struktura jednog skupa (populacije ili uzorka) prema datoj varijabli pokazuje kako suprema datoj varijabli pokazuje kako su modaliteti te varijable raspoređeni u skupu, tj. koliko jedinica posmatranja otpada na svakikoliko jedinica posmatranja otpada na svaki modalitet varijable.Broj jedinica koji odgovara jednom modalitetuBroj jedinica koji odgovara jednom modalitetu (kategoriji ili vrednosti) varijable jeste frekvencija (apsolutna frekvencija) tefrekvencija (apsolutna frekvencija) te kategorije, odnosno vrednosti.
32
Zbir i raspodela frekvencijaZbir i raspodela frekvencija
Zbir frekvencija fi svih modaliteta posmatrane varijable, u oznaci ∑ fi ,posmatrane varijable, u oznaci ∑ fi , jednaka je ukupnom broju jedinica posmatranja (veličini uzorka odnosnoposmatranja (veličini uzorka odnosno populacije). Raspodela frekvencija pokazuje kakoRaspodela frekvencija pokazuje kako su frekvencije raspoređene po različitim modalitetima varijablemodalitetima varijable.
33
Relativne frekvencijeRelativne frekvencijeRelativne frekvencijeRelativne frekvencije
Odnos frekvencije (fi) izvesne kategorije ili vrednosti varijable u odnosu na ukupan brojvrednosti varijable u odnosu na ukupan broj jedinica tog skupa (∑ fi) naziva se relativna frekvencija te kategorije, odnosno vrednosti.frekvencija te kategorije, odnosno vrednosti.Relativna frekvencija pokazuje koji deo ili procenat sume frekvencija (ukupnog brojaprocenat sume frekvencija (ukupnog broja jedinica posmatranja) pripada odgovarajućem modalitetumodalitetu.
34
Značaj relativnih frekvencijaZnačaj relativnih frekvencijaZnačaj relativnih frekvencijaZnačaj relativnih frekvencija
Relativne frekvencije povećavaju mogućnost analize statističkog skupa prikazanog u serijianalize statističkog skupa prikazanog u seriji jer, u odnosu na apsolutne frekvencije, proširuju informacije o strukturi posmatranogproširuju informacije o strukturi posmatranog skupa.Struktura skupa izražena pomoću relativnihStruktura skupa izražena pomoću relativnih frekvencija omogućava poređenje sa strukturom podskupova ili poređenje sastrukturom podskupova ili poređenje sa strukturom sličnih skupova.
35
Učešće (procenat)Učešće (procenat)
Relativna frekvencija može isključivo uzeti vrednost u zatvorenom intervalu [0,1].vrednost u zatvorenom intervalu [0,1].Relativna frekvencija izražena u procentima naziva se učešćeprocentima naziva se učešće.Procentualna raspodela je raspodela učešća svih modaliteta posmatraneučešća svih modaliteta posmatrane varijable.
36
Primer: Populacija, Primer: Populacija, varijabla i modalitetivarijabla i modalitetiOznačimo sa:
S={s1, s2 s3,..., sN} populaciju{ 1, 2 3, , N} p p j X varijabla {x1, x2 x3,..., xm} skup vrednosti ili { 1, 2 3, , m} pkategorija koje može uzeti varijabla X
}321{ mk∈∀ f je broj elemenata },,...,3,2,1{ mk∈∀ fk je broj elemenata populacije S na kojima varijabla X uzima vrednost ili se pojavljuje u formi
37
uzima vrednost ili se pojavljuje u formikategorije xk
Primer: Apsolutna i Primer: Apsolutna i relativna frekvencijarelativna frekvencija
f1 +...+fm=Nbroj fk se naziva apsolutnabroj fk se naziva apsolutna frekvencija vrednosti ili kategorije xk
broj f /N se naziva relativnabroj fk/N se naziva relativna frekvencija vrednosti ili kategorije xk , a broj 100* N /N predstavlja broj stotiha broj 100* Nk/N predstavlja broj stotih delova populacije gde obeležje X uzima vrednost x odnosno učešće (koje sevrednost xk odnosno učešće (koje se izražava u procentima) 38
3 T b l ik i j3 T b l ik i j3. Tabelarno prikazivanje 3. Tabelarno prikazivanje podatakapodatakapodatakapodataka
pripremila Tatjana Bajićpripremila Tatjana Bajić
39
Statistička tabelaStatistička tabela
Statistička tabela je jedan od oblika prikazivanja statističkih podataka ili serijaprikazivanja statističkih podataka ili serija podataka u preglednoj i prikladnoj formi koja olakšava da se rezultati statističkogkoja olakšava da se rezultati statističkog istraživanja sagledaju što jasnije i potpunije i olakšava korisnikupotpunije i olakšava korisniku upoređivanje podataka.
40
Forma statističke tabeleForma statističke tabele
Statističku tabelu čini određen broj polja koja se dobijaju u preseku horizontalnih i j j j pvertikalnih linija.Prve red se naziva zaglavlje, a prvaPrve red se naziva zaglavlje, a prva kolona pretkolona.Pretkolona i zaglavlje tabele služe zaPretkolona i zaglavlje tabele služe za unošenje modaliteta varijabli i vremenskih intervala
41
intervala.
I d t ti tičk t b lI d t ti tičk t b l
S k t ti tičk t b l i ti j l
Izrada statističke tabeleIzrada statističke tabele
Svaka statistička tabela mora imati svoj naslov, koji se stavlja iznad nje i koji treba kratko ali d lj d d li d ž j t b ldovoljno da opredeli sadržaj tabele.Modaliteti, bilo da su u zaglavlju ili pretkoloni, ne smeju se skraćivati.Tekst ispod tabele treba da sadrži obaveštenje p jo izvorima podataka, osnovne definicije, napomene o uporedivosti podataka i druga p p p gobaveštenja korisna za pravilno razumevanje podataka. 42
Podela statističkih tabela Podela statističkih tabela prema sadržiniprema sadržini
Statističke tabele po sadržini mogu biti proste, složene i kombinovane.proste, složene i kombinovane.Prosta tabela sadrži podatke jedne serije (serije strukture ili vremenske serije)(serije strukture ili vremenske serije).Složena statistička tabela dobija se spajanjem više prostih tabela koje pokazujuspajanjem više prostih tabela koje pokazuju različite podatke, a pri tom su raščlanjene prema istoj varijabli i u međusobnoj suprema istoj varijabli i u međusobnoj su sadržinskoj vezi. 44
Primer proste statističke Primer proste statističke tabeletabele
Tabela 1.1 Rezultati ispita iz Informatike u jan-feb. roku školske 2011/12. god.
f fOcena f f/N %5 31 0,25 25%6 33 0 27 27%6 33 0,27 27%7 37 0,30 30%8 14 0 11 11%8 14 0,11 11%9 6 0,05 5%10 1 0,01 1%
45
,Ukupno N=122 1 100%
Izvor podataka: Kartoni studenata predmetnog nastavnika
Primer složene statističke tabelePrimer složene statističke tabeleTabela 1.2 Rezultati ispita iz Informatike i Matematike u junskom ispitnom roku školske 2010/11 godispitnom roku školske 2010/11. god.
Ocena Informatika Matematikaf % f %f % f %
5 20 18% 6 26%6 28 25% 9 39%6 28 25% 9 39%7 31 27% 2 9%8 19 17% 2 9%9 14 12% 1 4%10 2 2% 3 13%
46
Ukupno 114 100% 23 100%Izvor podataka: Kartoni studenata predmetnog nastavnika
Kombinovane statističke Kombinovane statističke tabeletabele
U kombinovanoj tabeli izlažu se podaci serija dobijenih ukrštanjem dvepodaci serija dobijenih ukrštanjem dveili više varijabli, čije se oznake unose u zaglavlje i pretkolonu.zaglavlje i pretkolonu.Kombinovane tabele imaju veliki značaj, ali treba nastojati da ne bude pretrpanaali treba nastojati da ne bude pretrpana i komplikovana.
47
Primer kombinovane Primer kombinovane statističke tabelestatističke tabele
Tabela 1.3 Prolaznost studenata u januarsko-februarskom ispitnom roku školske 2011/12. godine
k šl šl l ž lGodina studija
Ukupno prijavilo ispit
Nije izašlo na ispit
Izašlo na ispit
Položilo ispit
f f f ff % f % f % f %
I godina 1110 100% 44 4% 1066 96% 968 87%II godina 1180 100% 167 14% 1013 86% 970 82%II godina 1180 100% 167 14% 1013 86% 970 82%III godina 1000 100% 67 7% 933 93% 896 90%
Ukupno 3290 100% 278 8% 3012 92% 2834 86%
48Izvor podataka: Studentska služba Škole
Tabele raspodele frekvencijaTabele raspodele frekvencijaTabele raspodele frekvencijaTabele raspodele frekvencija
Raspodele frekvencija varijabli se prikazuju pomoću tabela koje se nazivaju p j p j jtabelama raspodele frekvencija odnosno tabelama frekvencija.jRazlikujemo tabele frekvencija:
kvalitativnih varijablikvalitativnih varijablikvantitativnih prekidnih varijabli kvantitativnih neprekidnih varijablikvantitativnih neprekidnih varijabli
50
Tabelarni prikaz kvalitativnih Tabelarni prikaz kvalitativnih d t kd t kpodatakapodataka
Kvalitativni podaci se iskazuju opisno u formi kategorijakategorija.Klasifikacija kategorija se vrše prema kriterijumu koji najviše odgovora prirodi samekriterijumu koji najviše odgovora prirodi same varijable (pol: muški, ženski; pismenost: pismen nepismen; zdravstveno stanje: zdravpismen, nepismen; zdravstveno stanje: zdrav, bolestan; i sl.) ili ciljevima istraživanja (učenici po uspehu u školi kulture po vrstama ili popo uspehu u školi, kulture po vrstama ili po području, itd.).
51
Tabela frekvencija Tabela frekvencija kvalitativnih podatakakvalitativnih podataka
Tabela raspodele frekvencija za kvalitativne podatke sadrži dva niza pinformacija:
kategorije posmatrane varijable ikategorije posmatrane varijable iodgovarajući broj jedinica posmatranja koji pripada svakoj kategoriji.p p j g j
Analogno se formira i tabela raspodele relativnih frekvencija (tabelarelativnih frekvencija (tabela relativnih frekvencija).
52
Primer tabele frekvencija Primer tabele frekvencija kvalitativne varijablekvalitativne varijable
Tabela 2.1 Vrsta zaposlenja za koje će se studenti opredeliti
Varijabla Vrsta zaposlenja
Brojstudenata (f)
Kolona frekvencija
Privatni vrtić 16Privatni vrtić 16
Kategorija Državni vrtić 44 Frekvencija
S t i tić 23Sopstveni vrtić 23
Posao van vrtića 17
UKUPNO 100
53
Tabela relativnih frekvencijaTabela relativnih frekvencijaTabela relativnih frekvencija Tabela relativnih frekvencija kvalitativne varijablekvalitativne varijable
Tabela 2.2 Raspodela zaposlenih prema nivou stresa na posluDa li je posao stresan
Relativna učestalost
Procenat
Veoma 0,333 33,30%Malo 0,467 46,70%Nimalo 0,200 20,00%
Ukupno = 1,000 Ukupno = 100%
54
Napomena: U tabelu relativnih frekvencija mogu se uneti i same frekvencije.
Tabelarno prikazivanje Tabelarno prikazivanje kvantitativnih podatakakvantitativnih podataka
Tabela raspodela frekvencija za kvantitativne podatke sadrži dva niza informacija:
vrednosti varijable (prikazane izolovanim j (pnumeričkim vrednostima ili grupnim intervalima) injima odgovarajući broj jedinica posmatranja (frekvencije).
Kvantitativni podaci prikazani raspodelom p p pfrekvencija nazivaju se grupisani podaci.
55
Problem gradiranja Problem gradiranja kvantitativnih podatakakvantitativnih podataka
Ako je varijabla prekidna (diskretna) numeričke vrednosti se grupišu po veličininumeričke vrednosti se grupišu po veličini (od niže vrednosti ka višoj).Problem gradiranja numeričkih podataka seProblem gradiranja numeričkih podataka se pojavljuje kod neprekidnih varijabli i kod prekidnih sa velikim brojem modalitetaprekidnih sa velikim brojem modaliteta.
56
Primer Primer
Populacija: svi studenti prve godine Visokih škola strukovnih studija za vaspitače -j pgeneracija 2011/12. u SrbijiPrekidna varijabla X: ocena iz InformatikePrekidna varijabla X: ocena iz InformatikeUzorak: studenti prve godine Visoke škole strukovnih studija za vaspitače generacijastrukovnih studija za vaspitače-generacija 2011/12. u Šapcu{5 6 7 8 9 10} j k d ti k j ij bl{5,6,7,8,9,10} je skup vrednosti koje varijabla X može uzeti u realizovanom uzorku 57
Primer tabele frekvencija Primer tabele frekvencija prekidne varijableprekidne varijable
Tabela 3.1 Rezultati ispita iz Informatike u jan-feb. roku školske 2011/12. god.
fOcena f %5 31 25%6 33 27%6 33 27%7 37 30%8 14 11%8 14 11%9 6 5%10 1 1%
58
Ukupno 122 100%Izvor podataka: Karton studenata predmetnog nastavnika
Gradiranje numeričkih Gradiranje numeričkih
I t l i di id l ih d ti j d
podataka neprekidne varijablepodataka neprekidne varijableInterval individualnih vrednosti jedne kvantitativne varijable u datom uzorku ili
l iji ž biti ći ili ji ( i ipopulaciji može biti veći ili manji (npr. visina studenata se kreće od 150 do 200cm, njihova t l d 50 d 100 k itd )telesna masa od 50 do 100 kg, itd.).Da bismo dobili strukturu studenata npr. po
ž švisini ili težini potrebno je izvršiti gradiranje odgovarajućih vrednosti varijable, odnosno
čodrediti broj grupnih intervala, pri čemu grupni intervali ne smeju da se poklapaju.59
Grupni intervaliGrupni intervaličGrupni interval uključuje sve vrednosti
neprekidne varijableveće ili jednake od donje granice i strogo manje od gornje granice tog intervala ilistrogo veće od donje granice i manje ili jednake od gornje granice tog intervala.
Pri formiranju grupnih intervala preporučljivo je početi sa vrednošću manjom od najmanje u
š ć ćseriji (xmin), a završiti sa većom od najveće vrednosti u seriji (xmax). 60
Problem određivanja broja Problem određivanja broja grupnih intervalagrupnih intervala
Postavlja se pitanje broja grupnih intervala, odnosno njihove širine.odnosno njihove širine.Pravilo je da grupni intervali budu jednaki jer su samo tada uporedivisu samo tada uporedivi.Veći broj grupnih intervala daje detaljniju informaciju o sastavu skupa dok manji brojinformaciju o sastavu skupa, dok manji broj bolje otkriva pravilnosti o ponašanju skupa.
b d l h f hTreba zadovoljiti zahtev informacije i zahtev preglednosti. 61
ć
Broj grupnih intervalaBroj grupnih intervalaSturges-ovo pravilo je pravilo pomoću kog se određuje broj grupnih intervala:
K=1+3.3logN,gde je N je ukupan broj podataka.gde je N je ukupan broj podataka.Širina grupnog intervala (u oznaci i) se određuje zaokruživanjem aproksimativne širineodređuje zaokruživanjem aproksimativne širine grupnog intervala: (xmax – xmin )/Kgde je x najveća vrednost a x jegde je xmax najveća vrednost, a xmin je najmanja koju uzima neprekidna varijabla. 62
Širina, sredina i frekvencija Širina, sredina i frekvencija , j, jgrupnog intervalagrupnog intervala
Širinu (veličina) grupnog intervala je jednaka razlici između gornje i donje granice jednog g j j g j ggrupnog intervala.Sredina grupnog intervala se dobija kadaSredina grupnog intervala se dobija kada se zbir donje i gornje granice jednog grupnog intervala podeli sa 2intervala podeli sa 2.Frekvencija grupnog intervala predstavlja broj jedinica posmatranja koje pripadaju tombroj jedinica posmatranja koje pripadaju tom grupnom intervalu. 63
Primer problema širine Primer problema širine ih i t lih i t lgrupnih intervalagrupnih intervala
Prema evidenciji predmetnog nastavnika iz Informatike, na kolokvijumu održanom 3.12.2011., prikupljeni su podaci o dužini trajanja rešavanja testa 50 studenata, izraženih u minutima.Dužina trajanja testa se kretala u rasponu od u a aja ja es a se e a a u aspo u od7,5 min do 32,9 min, što znači da je minimalna vrednost u dobijenom nizu negrupisanih j g ppodataka 7,5, a maksimalna 32,9.
64
Jedno rešenje problema širine Jedno rešenje problema širine grupnih intervalagrupnih intervala
Ukoliko želimo da grupišemo ove podatke u 6 grupnih intervala jednake širine, tada je g p j , japroksimativna širina grupnog intervala
(32 9-7 5)/6=4 23(32,9 7,5)/6=4,23i njenim zaokruživanjem na neki pogodniji broj, za širinu grupnog intervala možemo uzeti 5za širinu grupnog intervala možemo uzeti 5.Za donju granicu prvog grupnog intervala
ž ti 7 5 ili k ikl d jmožemo uzeti 7,5 ili neku prikladnu manju vrednost, recimo 5. 65
Tabela raspodele frekvencija i Tabela raspodele frekvencija i procentualne raspodeleprocentualne raspodeleTabela 3.2 Dužina trajanja rešavanja testa
Vreme (u min) Broj studenata (f) Procenat (%)( ) j ( ) ( )manje od 5 0 0
5-10 2 4%10-15 3 6%15-20 15 30%20 2 8 36%20-25 18 36%25-30 8 16%30 35 4 8%
66
30-35 4 8%ukupno 50 100%
Značenje zapisa grupnih Značenje zapisa grupnih intervala iz tabele 3.2intervala iz tabele 3.2
B jVreme (u min) Broj studenata Procenat
opisno intervalno f %opisno intervalno f %manje od 5 <5 0 0
5-10 [5,10) 2 4%5 10 [5,10) 2 4%10-15 [10,15) 3 6%15-20 [15,20) 15 30%20-25 [20,25) 18 36%25-30 [25,30) 8 16%30 35 [30 35) 4 8%
67
30-35 [30,35) 4 8%ukupno 50 100%
Drugi način grupisanja Drugi način grupisanja d t k kid ij bld t k kid ij blpodataka neprekidne varijablepodataka neprekidne varijable
Vreme (u min) Broj studenata Procenat
opisno inte alno f %opisno intervalno f %do 5 5 0 05-10 (5 10] 2 4%5 10 (5,10] 2 4%10-15 (10,15] 3 6%15-20 (15,20] 16 32%( , ]20-25 (20,25] 17 34%25-30 (25,30] 8 16%
68
30-35 (30,35] 4 8%ukupno 50 100%
4 G fičk ik i j4 G fičk ik i j4. Grafičko prikazivanje 4. Grafičko prikazivanje podatakapodatakapodatakapodataka
pripremila Tatjana Bajićpripremila Tatjana Bajić
73
Grafičko prikazivanje Grafičko prikazivanje podatakapodataka
Na osnovu grafičkog prikaza jasno možemo videti karakteristike nekog skupa podataka.videti karakteristike nekog skupa podataka.Grafički prikaz podataka se prvenstveno zasniva na odgovarajućem tabelarnomzasniva na odgovarajućem tabelarnom prikazu podataka.Razlikujemo:Razlikujemo:
Grafičko prikazivanje kvalitativnih podatakaG f čk k k h d kGrafičko prikazivanje kvantitativnih podataka
74
Grafičko prikazivanje Grafičko prikazivanje kvalitativnih podatakakvalitativnih podataka
Postoje dve vrste dijagrama koje senajčešće koriste za grafički prikaznajčešće koriste za grafički prikaz kvalitativnih podataka:
štapičasti dijagrami ištapičasti dijagrami istrukturni krug (pita)
75
ŠŠŠtapičasti dijagramŠtapičasti dijagram
Grafikon koji se sastoji od stubića čija visina predstavlja frekvenciju (relativnuvisina predstavlja frekvenciju (relativnu frekvenciju ili učešće) različitih kategorija naziva se štapičasti dijagram.naziva se štapičasti dijagram.Kod štapičastog dijagrama na x-osu (apcisu) se nanose različite kategorije(apcisu) se nanose različite kategorije kvalitativne varijable, a na y-osu (ordinatu) nanose se frekvencije(ordinatu) nanose se frekvencije (relativne frekvencije ili učešća).
76
Primer štapičastog dijagrama za Primer štapičastog dijagrama za kvalitativne podatke iz Tabele 2 2kvalitativne podatke iz Tabele 2 2kvalitativne podatke iz Tabele 2.2 kvalitativne podatke iz Tabele 2.2
77
Strukturni krug (pita)Strukturni krug (pita)Krug podeljen na delove od kojih svakiKrug podeljen na delove, od kojih svaki deo srazmerno predstavlja relativnu frekvenciju ili učešće (procenat)frekvenciju ili učešće (procenat) odgovarajuće kategorije u osnovnom skupu ili uzorku naziva se strukturnimskupu ili uzorku naziva se strukturnim krugom.C t kt i k d t lj ličiCeo strukturni krug predstavlja veličinu uzorka ili osnovnog skupa.Strukturni krug se može koristiti i za prikazivanje frekvencija 78
Primer strukturnog kruga za Primer strukturnog kruga za k lit ti d tk i T b l 2 2k lit ti d tk i T b l 2 2kvalitativne podatke iz Tabele 2.2kvalitativne podatke iz Tabele 2.2
79
Grafičko prikazivanje Grafičko prikazivanje kvantitativnih podatakakvantitativnih podataka
Razlikujemo:Grafičko prikazivanje kvantitativnih podatakaGrafičko prikazivanje kvantitativnih podatakaprekidne varijableGrafičko prikazivanje kvantitativnih podatakaGrafičko prikazivanje kvantitativnih podatakaneprekidne varijable
80
Grafičko prikazivanje Grafičko prikazivanje d t k kid ij bld t k kid ij blpodataka prekidne varijablepodataka prekidne varijable
Kvantitativni podaci prekidne varijable se, kao i kvalitativni podaci najčešće grafičkikao i kvalitativni podaci, najčešće grafički prikazuju pomoću:
štapičastog dijagrama ištapičastog dijagrama istrukturnog kruga (pite)
Kod štapičastog dijagrama prekidne varijableKod štapičastog dijagrama prekidne varijable na x-osu (apcisu) se nanose različite vrednostivarijable a na y osu (ordinatu) nanose sevarijable, a na y-osu (ordinatu) nanose se frekvencije (relativne frekvencije ili učešća). 81
Primer štapičastog dijagrama za podatke Primer štapičastog dijagrama za podatke kid ij bl i T b l 3 1kid ij bl i T b l 3 1prekidne varijable iz Tabele 3.1prekidne varijable iz Tabele 3.1
82
Primer Primer strukturnstrukturnogog krugkrugaa za podatke za podatke kid ij bl i T b l 3 1kid ij bl i T b l 3 1prekidne varijable iz Tabele 3.1prekidne varijable iz Tabele 3.1
Ocene
83
Grafičko prikazivanje podataka Grafičko prikazivanje podataka kid ij blkid ij blneprekidne varijableneprekidne varijable
Kvantitativni podaci neprekidne varijable se najčešće grafički prikazuju pomoću:se najčešće grafički prikazuju pomoću:
histogramapoligona ipoligona ikrive raspodele frekvencija
84
HistogramHistogram
Histogram je dijagram koji se sastoji od niza spojenih pravougaonika, čije su osnovicespojenih pravougaonika, čije su osnovice(prikazane na x-osi) jednake širini grupnihintervala, a visine (prikazane na y-osi)intervala, a visine (prikazane na y osi)odgovaraju frekvencijama, relativnim frekvencijama ili učešćima i u zavisnosti odfrekvencijama ili učešćima i u zavisnosti od toga naziva se histogram frekvencija, histogram relativnih frekvencija ilihistogram relativnih frekvencija ili histogram učešća.
85
Primer histograma frekvencija Primer histograma frekvencija a podatke i Tabele 3 2a podatke i Tabele 3 2za podatke iz Tabele 3.2za podatke iz Tabele 3.2
1820
Dužina trajanja rešavanja testa
12141618
dena
ta
468
10
Bro
j st
ud
024
5-10 10-15 15-20 20-25 25-30 30-35
87
Vremenski intervali izraženi u minutima
5 10 10 15 15 20 20 25 25 30 30 35
PoligonPoligon
Poligon je dijagram koji se dobija spajanjem tačaka čije su koordinate sredine grupnih j g pintervala i odgovarajuće frekvencije intervala, odnosno spajanjem sredina vrhova , p j jsusednih pravougaonika histograma frekvencija.jSredina grupnog intervala se dobija kada se zbir donje i gornje granice jednog grupnogse zbir donje i gornje granice jednog grupnog intervala podeli sa 2.
93
Primer poligona frekvencija Primer poligona frekvencija za podatke iz Tabele 3.2za podatke iz Tabele 3.2
1820
Dužina trajanja izrade testa
12141618
dena
ta
468
10
Bro
j st
ud
024
7,5 12,5 17,5 22,5 27,5 32,5
94
7,5 12,5 17,5 22,5 27,5 32,5
Sredine grupnih vremenskih intervala izraženih u minutima
Kriva frekvencijaKriva frekvencija
Kada raspolažemo dugačkom serijom podataka, sa povećanjem broja grupnihpodataka, sa povećanjem broja grupnih intervala (i smanjenjem njihove širine), poligon frekvencija na kraju postajepoligon frekvencija na kraju postaje glatka, kontinuirana kriva.Dobijena kriva linija naziva se krivomDobijena kriva linija naziva se krivom raspodele frekvencija ili jednostavno krivom frekvencijakrivom frekvencija.
95
Primer krive frekvencijaPrimer krive frekvencija
96
5 Numeričke5 Numeričke5. Numeričke 5. Numeričke deskriptivne meredeskriptivne mere
5 1 Mere centralne tendencije5 1 Mere centralne tendencije
pripremila Tatjana Bajićpripremila Tatjana Bajić
5.1 Mere centralne tendencije5.1 Mere centralne tendencije
pripremila Tatjana Bajićpripremila Tatjana Bajić
Uvod Uvod Statističke serije strukture i vremenske serije, date u vidu tabela ili grafičkih prikaza, služe statističkoj analizi kao polazna osnova za istraživanje pravilnosti i zakonitosti posmatranih pojava.Prisustvo mnoštva numeričkih podataka, bez sus o oš a u e č poda a a, beobzira na njihovu uređenost, pričinjava teškoće u pogledu dobijanja jedinstvene, jasne, p g j j j , j ,koncizne i celovite predstave o pojavi koju posmatramo. 110
Pokazatelji raspodele Pokazatelji raspodele frekvencijafrekvencija
Raspodele frekvencija pružaju široku mogućnost za otkrivanje karakteristikamogućnost za otkrivanje karakteristika skupova, analizu njihove strukture i unutrašnjih odnosaodnosa.Raspodele frekvencija nastojimo da numerički opišemo sa jednom ili ećim b ojemopišemo sa jednom ili većim brojem karakterističnih vrednosti koje bi pružile što više informacija o skupu i reprezentovalešto više informacija o skupu i reprezentovale skup. 111
Numeričke deskriptivne Numeričke deskriptivne
ž
ppmeremere
Pokazatelji raspodele frekvencija izraženi numeričkim karakterističnim vrednostima
čnazivaju se numeričke deskriptivne mere ili (samo) deskriptivne mere.U zavisnosti da li se analizira raspodela frekvencija populacije ili raspodela j p p j pfrekvencija uzorka, pokazatelji raspodele frekvencija reprezentuju populaciju ili uzorak, odnosno pripisuju se celom skupu (populaciji) ili uzorku. 112
Parametri skupa i Parametri skupa i statistike uzorkastatistike uzorka
Deskriptivne mere koje se odnose na sve jedinice osnovnog skupa (populacije) j g p (p p j )nazivaju se parametrima skupa odnosnoparametrima.pDeskriptivne mere koje se odnose na uzorak nazivaju se statistike uzorkauzorak nazivaju se statistike uzorka odnosno statistike.
113
Podela numeričkih Podela numeričkih deskriptivnih meradeskriptivnih mera
Numeričke deskriptivne mere svrstavamo u sledeće grupe:
mere centralne tendencije raspodele frekvencija (srednje vrednosti)mere disperzije (raspršenosti)mere oblika raspodelepozicione mere
114
Srednja vrednost kao mera Srednja vrednost kao mera
R d l f k ij t tk i j
centralne tendencijecentralne tendencijeRaspodele frekvencija prvenstveno otkrivaju tendenciju grupisanja pojedinih vrednosti
ij bl k d ti k kt i tičvarijable oko vrednosti karakteristične za posmatrani skup.Varijabilnost vrednosti varijable nameće potrebu za merenjem centralne vrednosti varijable.Srednja vrednost, kao pokazatelj centralne j , p jtendencije vrednosti varijable, predstavlja meru centralne tendencije. 115
U i ti d t j i d či
Podela srednjih vrednostiPodela srednjih vrednostiU zavisnosti od posmatrane pojave i od načina grupisanja podataka u raspodeli frekvencija,
t t i ličit t lrazmatramo tri različite mere centralne tendencije raspodele odnosno srednje
d tivrednosti : aritmetičku sredinu (prosek)medijana imodus
Aritmetička sredina se izračunava, a medijana i moda se određuju na osnovu položaja u seriji.116
Aritmetička sredina skupa Aritmetička sredina skupa negrupisanih podatakanegrupisanih podataka
Aritmetička sredina skupa (ili prosek) se dobija kada se zbir svih vrednosti varijabledobija kada se zbir svih vrednosti varijable podeli njihovim brojem:
gde su x1,..., xN realizovane vrednosti posmatrane varijable nad skupom.p j pμ je realizovan parametar skupa.
119
Aritmetička sredina uzorka Aritmetička sredina uzorka negrupisanih podatakanegrupisanih podataka
Aritmetička sredina negrupisanih podataka (svaki podatak se javlja samo jedanput) uzorka veličine n:
gde su x x realizovane vrednostigde su x1,..., xn realizovane vrednosti posmatrane varijable nad uzorkom.
j li t ti tik kje realizovana statistika uzorka.120
Ponderisana aritmetička Ponderisana aritmetička sredinasredinaU praksi se češće susrećemo sa grupisanim podacima u vidu raspodele frekvencija.Aritmetička sredina grupisanih podataka t et č a s ed a g up sa podata anaziva se ponderisana aritmetička sredina jer se sve vrednosti varijable (xi) s ed a je se s e ed os a jab e ( i)u skupu ili uzorku uzimaju onoliko puta koliko se one javljaju, tj. ponderišu se j j j , j pnjihovim frekvencijama (fi).
121
Izračunavanje ponderisane Izračunavanje ponderisane ččaritmetičke sredinearitmetičke sredine
Ponderisana aritmetička sredina skupa je:
P d i it tičk di kPonderisana aritmetička sredina uzorkaobima n je:
122
P d i i i i t lP d i i i i t lPodaci grupisani u intervalePodaci grupisani u intervale
Ako je raspored frekvencija dat u vidu k grupnih intervala aritmetičkak grupnih intervala, aritmetička sredina skupa, kao i uzorka, izračunava se kao ponderisanaizračunava se kao ponderisana aritmetička sredina središnjih vrednosti grupnih intervalavrednosti grupnih intervala.
123
Aritmetička sredina podataka Aritmetička sredina podataka g pisanih inte aleg pisanih inte alegrupisanih u intervalegrupisanih u intervale
Aritmetička sredina skupa je:
i ičk di k bAritmetička sredina uzorka obima n je:
gde je x’ sredina a f frekvencija intervalagde je x sredina, a f frekvencija intervala.
124
PrimerPrimerTabela 5 1 Vreme koje studenti svakodnevnoTabela 5.1 Vreme koje studenti svakodnevno provedu u putovanjuVreme (u min.) Broj studenata (f) Sredina intervala (x/) fx/
manje od 0 0 0 00-10 4 5 2010-20 9 15 13510-20 9 15 13520-30 6 25 15030-40 4 35 14040-50 2 45 90
Ukupno 25 535
5351 k
125min40,21
255351
1==′= ∑
=
k
iii xf
Nμ
Važna osobina aritmetičke sredineVažna osobina aritmetičke sredine
Važna osobina aritmetičke sredine je da izravnava apsolutne varijacije vrednostiizravnava apsolutne varijacije vrednosti varijable.Aritmetička sredina uspešno reprezentujeAritmetička sredina uspešno reprezentuje one raspodele kod kojih najveću frekvenciju imaju one vrednosti varijablefrekvenciju imaju one vrednosti varijable koje su najbliže aritmetičkoj sredini.
128
Nedostatak aritmetičke Nedostatak aritmetičke sredinesredine
Ek t d ti d tiEkstremne vrednosti su one vrednosti varijable, koje ekstremno odstupaju od ostalih
d tivrednosti.Ako u skupu ili uzorku ima ekstremnih vrednosti, aritmetička sredina može dati iskrivljenu sliku, posebno ako raspodela
čfrekvencija nije simetrična.Za serije čije vrednosti varijable znatno j j jodstupaju od aritmetičke sredine kažemo da imaju veliku raspršenost ili disperziju. 132
MedijanaMedijanaMedijana je ona vrednost varijable koja se nalazi u sredini serije podataka koji su rangirani u rastućem poretku (od najmanje vrednosti ka najvećoj) ili u opadajućem poretku (od najveće vrednosti ka najmanjoj). Medijana deli sumu svih frekvencija na dva ed ja a de su u s e e c ja a d ajednaka dela, tako da jedna polovina obuhvaćenih slučajeva ima manju, a druga j j , gpolovina veću vrednost od medijane.
133
Izračunavanje medijaneIzračunavanje medijane
1. Podaci se rangiraju od najniže vrednosti ka najvišoj i na taj način se obrazuje serija j j j j jrangiranih podataka: x1 < x2 <...< xN.
2 Ako je broj podataka u seriji N2. Ako je broj podataka u seriji, N,neparan, onda je medijana jednaka vrednosti središnjeg člana rangiranih podataka;središnjeg člana rangiranih podataka;paran broj, onda se ona izračunava kao aritmetička sredina dva središnja podatka u seriji.aritmetička sredina dva središnja podatka u seriji.
134
Određivanje medijane kada je Određivanje medijane kada je broj podataka u seriji neparanbroj podataka u seriji neparan
Ako je N neparan broj, tada srednji član uređenog niza vrednosti varijable deli ovaj niz g j jna dva jednaka dela.Primer: U nizu podataka o starosti nastavnikaPrimer: U nizu podataka o starosti nastavnika u jednoj školi koji su poređani po veličini:
25 26 36 48 5125, 26, 36, 48, 51medijana će biti 36 jer se ta vrednost nalazi u
di i ijsredini ove serije.135
Određivanje medijane kada je Određivanje medijane kada je broj podataka u seriji paranbroj podataka u seriji paranbroj podataka u seriji paranbroj podataka u seriji paran
Ako je broj članova serije rangiranih podataka, N, paran, u njemu postoje dvapodataka, N, paran, u njemu postoje dva srednja člana pa se za medijanu uzima njihova aritmetička sredina.njihova aritmetička sredina.Primer: Za niz rangiranih podataka:
18 19 20 22 24 2618, 19, 20, 22, 24, 26medijana će biti aritmetička sredina vrednosti 20 22 d 220 i 22, odnosno 21.
136
Značajne osobine medijaneZnačajne osobine medijaneZnačajne osobine medijaneZnačajne osobine medijane
Medijana određuje centar histograma, pri čemu se polovina vrednosti nalazi levo odčemu se polovina vrednosti nalazi levo od medijane, a druga polovina desno od nje.Na medijanu ne utiču ekstremne vrednostiNa medijanu ne utiču ekstremne vrednosti, te se kod serije podataka koja sadrži ekstremne vrednosti medijana pokazuje kaoekstremne vrednosti, medijana pokazuje kao bolja mera centralne tendencije od aritmetičke sredinearitmetičke sredine.
141
ModusModusModusModus
Modus potiče od francuske reči mode koja označava predmet koji je najpopularniji ilioznačava predmet koji je najpopularniji ili najčešći.Modus (moda mod ili modalnaModus (moda, mod ili modalna vrednost) je vrednost varijable koja u posmatranoj seriji ima najveću frekvencijuposmatranoj seriji ima najveću frekvenciju.Odatle, modus predstavlja najzastupljeniju
d t iji d t kvrednost u seriji podataka.142
Nedostatak modusa kao Nedostatak modusa kao mere centralne tendencijemere centralne tendencije
Moguće je da jedna serija podataka ili nema modusa ili ima više od jednognema modusa ili ima više od jednog modusa, dok ta ista serija će imati samo jednu aritmetičku sredinu i samo jednujednu aritmetičku sredinu i samo jednu medijanu.Na primer serija podataka u kojoj seNa primer, serija podataka u kojoj se svaka vrednost varijable pojavljuje samo jedanput nema modusasamo jedanput, nema modusa.
143
Podela serija podataka Podela serija podataka prema broju modusaprema broju modusa
Serija podataka u kojoj se:samo jedna vrednost javlja sa najvećomsamo jedna vrednost javlja sa najvećom frekvencijom, ima samo jedan modus –unimodalna serijadve vrednosti javljaju sa istom (najvećom) frekvencijom, ima dva modusa – bimodalna serijaviše od dve vrednosti u seriji podataka javljaju
ć šsa istom (najvećom) frekvencijom, ima više od dva modusa – multimodalna serija 144
Primer: Serija podataka Primer: Serija podataka koja nema moduskoja nema modus
Visine sedam slučajno izabranih studentkinja su 160, 175, 168, 172,studentkinja su 160, 175, 168, 172, 158, 180, 163 centimetara.Pošto se svaka vrednost u ovoj serijiPošto se svaka vrednost u ovoj seriji javlja samo jedanput, ova serija nema modusmodus.
145
Primer serije podataka Primer serije podataka j d i dj d i dsa jednim modusomsa jednim modusom
Tabela 5.3 Rezultati ispita iz Informatike u jan feb roku školske 2011/12 godjan-feb. roku školske 2011/12. god.
Ocena f5 315 316 337 378 149 610 1
Ukupno 122
Modus je ocena 7 jer ima najveću frekvenciju.146
Primer serije sa dva modusaPrimer serije sa dva modusajj
Ova serija podataka ima dva modusa: 21
Tabela 5.4 Godine starosti slučajnoizabranih studenata
Godine starosti Broj studenata (f)i 22 jer obe vrednosti se javljaju sa (najvišom)
Godine starosti Broj studenata (f)19 120 1
sa (najvišom) frekvencijom koja iznosi 2.
21 222 223 1 iznosi 2.23 125 129 1
147
30 1∑=10
Modus kao mera centralneModus kao mera centralneModus kao mera centralne Modus kao mera centralne tendencije kvalitativnih serija tendencije kvalitativnih serija
Za razliku od ostalih srednjih vrednosti, aritmetičke sredine i medijane koje searitmetičke sredine i medijane, koje se računaju odnosno vezane su isključivo za numeričke podatke, modus se uza numeričke podatke, modus se u izvesnom smislu može koristiti i kao mera centralne tendencije kvalitativnihmera centralne tendencije kvalitativnih serija.
148
Primer određivanja modusa Primer određivanja modusa jjza kvalitativne podatkeza kvalitativne podatke
Tabela 5.5 Status studenata koji su članovi studentskog parlamentaStatus studenta Broj studenata (f)
student prve godine studija 3student prve godine studija 3student druge godine studija 2student treće godine studija 5g j
∑=10
Pošto se kategorija student treće godine pojavljuje najčešće od ostalih kategorija, ona je
d ij d kmodus ove serije podataka.149
P i dP i dPrimena modusaPrimena modusa
Modus je pogodan pokazatelj raspodele frekvencija za unimodalne serije i tofrekvencija za unimodalne serije i to naročito ako je frekvencija modalne vrednosti velika.vrednosti velika.U takvim slučajevima modus je tipična vrednost koja pokazuje u pravom smisluvrednost koja pokazuje u pravom smislu centralnu tendenciju posmatrane serije.
152
O bi dO bi dSve dok je frekvencija modalne vrednosti
Osobina modusaOsobina modusaSve dok je frekvencija modalne vrednosti maksimalna na veličinu modusa ne utiču:
f k ij ij blpromene frekvencija varijable kao ni promene frekvencije ekstremnih
ednostivrednosti.
Odatle, modus se može odrediti i u l č j i k d f k ij k t ihslučajevima kad frekvencije ekstremnih
vrednosti varijable nisu poznate ali se zna d i f k ij lda su im frekvencije male.
153
Prednost modusa u odnosu na Prednost modusa u odnosu na it tičk diit tičk diaritmetičku sredinuaritmetičku sredinu
Modus se ređe primenjuje od aritmetičke sredine ali je za neka statistička istraživanjasredine ali je za neka statistička istraživanja pogodniji, jer daje potpuniju informaciju o tendenciji okupljanja vrednosti varijable okotendenciji okupljanja vrednosti varijable oko srednje vrednosti.Primer: pri ispitivanju uslova stanovanjaPrimer: pri ispitivanju uslova stanovanja, bolji pokazatelj je veličina stambene površine koju koristi najveći broj stanovnika negokoju koristi najveći broj stanovnika nego prosečna površina po jednom stanovniku.
154
Zadaci za vežbuZadaci za vežbu
Zadatak 1.1 Na osnovu podataka o starosti nastavnika u jednoj školi: 36 26 51 25 48nastavnika u jednoj školi: 36, 26, 51, 25, 48, odrediti aritmetičku sredinu i medijanu skupa.skupa.Zadatak 1.2 Na osnovu podataka o starosti studenata u jednoj školi: 18 20 26 24 22studenata u jednoj školi: 18, 20, 26, 24, 22, 19, odrediti aritmetičku sredinu i medijanu skupaskupa.
155
Zadatak 2.1 Na osnovu podataka datih u sledećoj tabeli odrediti aritmetičku sredinu isledećoj tabeli odrediti aritmetičku sredinu i modu skupa.
Tabela 2.1 Rezultati ispita iz Informatike u junskom ispitnom roku školske 2010/11. god.
Ocena f6 287 317 318 199 1410 2
Ukupno 94
156
Zadatak 2.2 Na osnovu podataka datih u sledećoj tabeli odrediti aritmetičku sredinu isledećoj tabeli odrediti aritmetičku sredinu i modu skupa.
Tabela 2.2 Rezultati ispita iz Informatike u jan.-febr. ispitnom roku školske 2011/12. god.
Ocena f6 337 377 378 149 610 1
Ukupno 91
157
Zadatak 2.3 Na osnovu podataka datih u sledećoj tabeli odrediti aritmetičku sredinu isledećoj tabeli odrediti aritmetičku sredinu i modu skupa.
Tabela 2.3 Rezultati ispita iz Informatike u jan.-febr. roku školske 2010/11. god.
Ocena f6 417 447 448 179 410 1
Ukupno 107
158
Zadatak 2.4 Na osnovu podataka datih u sledećoj tabeli odrediti aritmetičku sredinu isledećoj tabeli odrediti aritmetičku sredinu i modu skupa.
Tabela 2.4 Rezultati ispita iz Informatike u junskom ispitnom roku školske 2009/10. god.
Ocena f6 397 347 348 209 1110 4
Ukupno 108
159
Zadatak 3.1 Na osnovu podataka datih u sledećoj tabeli odrediti aritmetičku sredinusledećoj tabeli odrediti aritmetičku sredinu skupa.
Tabela 3.1 Dužina trajanja rešavanja testaVreme (u min.) Broj studenata (f)Vreme (u min.) Broj studenata (f)
manje od 5 05-10 210-15 315-20 1520-25 1820 25 1825-30 830-35 4
Ukupno 50
160
Zadatak 3.2 Na osnovu podataka datih u sledećoj tabeli odrediti aritmetičku sredinusledećoj tabeli odrediti aritmetičku sredinu skupa.Tabela 3 2 Visine 200 novorođenčadiTabela 3.2 Visine 200 novorođenčadi
Visina beba (u cm) fmanje od 40 0manje od 40 0
40-43 243-46 743 46 746-49 4049-52 8752-55 5855-58 5
161
58-61 1Ukupno 200