Upload
muzafera-dazdarevic-gegic
View
47
Download
9
Embed Size (px)
Citation preview
1
2008.2008.
2
UvodUvod DDefinicije podataka kontinualnog i efinicije podataka kontinualnog i
diskretnodiskretnog tipag tipa Podaci kontinualnog tipa su npr. brojne Podaci kontinualnog tipa su npr. brojne
vrednosti iz skupa realnih brojeva. Takvi vrednosti iz skupa realnih brojeva. Takvi podaci mogu imati bilo koju vrednost iz opsega podaci mogu imati bilo koju vrednost iz opsega (-∞,+∞)(-∞,+∞)
Podaci diskretnog tipa mogu imati samo Podaci diskretnog tipa mogu imati samo odredjene vrednosti, npr. Broj osoba u nekom odredjene vrednosti, npr. Broj osoba u nekom eksperimentu moeksperimentu može biti samo ceo broj.že biti samo ceo broj.
Upotreba dodatnih metoda evaluacije Upotreba dodatnih metoda evaluacije uzorakauzoraka
Retrospektiva gradiva kroz primereRetrospektiva gradiva kroz primere
3
Teme:Teme: Stablo-list strukturaStablo-list struktura Zadaci Zadaci Aritmetička sredinaAritmetička sredina ModMod MedijanaMedijana KvartiliKvartili PrimeriPrimeri Merenje varijacijeMerenje varijacije Druge mere varijacijeDruge mere varijacije
4
Mere rasipanja jedninica neke Mere rasipanja jedninica neke populacijepopulacije
Sve pomenute teme se preklapaju i Sve pomenute teme se preklapaju i služe merenju raznih odstupanja služe merenju raznih odstupanja pojedinih jedinica od neke vrednostipojedinih jedinica od neke vrednosti
Arit. Sr.
Harmonijska sredina
Moda
Medijana
5
Prikaz rezultata-”Stablo-Prikaz rezultata-”Stablo-list”list”
Omogućava efikasniji prikaz Omogućava efikasniji prikaz podataka u odnosu na histogram za podataka u odnosu na histogram za veći broj observacija, posmatranja, veći broj observacija, posmatranja, merenja, npr. dvocifreni.merenja, npr. dvocifreni.
Slika se dobija sortiranjem Slika se dobija sortiranjem observacija, merenja po redovima u observacija, merenja po redovima u skladu sa prvom cifrom.skladu sa prvom cifrom.
6
Prikaz rezultata-”Stablo-Prikaz rezultata-”Stablo-list”list” Formiramo tabelu sa dve kolone.Formiramo tabelu sa dve kolone.
U koloni 1 su cifre od 0-9, i one U koloni 1 su cifre od 0-9, i one odgovaraju prvoj cifri nekog broja odgovaraju prvoj cifri nekog broja observacija ili merenja.observacija ili merenja.
Za svako merenje-posmatranje (rezultat), Za svako merenje-posmatranje (rezultat), u koloni 2 zapisujemo drugu cifru u redu u u koloni 2 zapisujemo drugu cifru u redu u kome se u koloni 1 nalazi prva cifra. Može kome se u koloni 1 nalazi prva cifra. Može biti više drugih cifara sa istom prvom, što biti više drugih cifara sa istom prvom, što znači da će u koloni 2 biti više cifara u znači da će u koloni 2 biti više cifara u istom redu.istom redu.
Sortiramo sve druge cifre po rastućem Sortiramo sve druge cifre po rastućem redosledu u svakom redu kolone 2.redosledu u svakom redu kolone 2.
7
Prikaz rezultata-”Stablo-Prikaz rezultata-”Stablo-list”list”
Rezultati ispita
Formiranje stablo-list strukture
8
9
Prikaz rezultata-”Stablo-Prikaz rezultata-”Stablo-list”list”
Stablo- kolona 1. Listovi –kolona 2.Stablo- kolona 1. Listovi –kolona 2. Cela struktura može biti tumačena i kao Cela struktura može biti tumačena i kao
histogram sa klasama od 10 poena. histogram sa klasama od 10 poena. Efikasnije od histograma jer su detaljnije Efikasnije od histograma jer su detaljnije
informacije.informacije. Listovi mogu biti i dve sledeće cifre, iza Listovi mogu biti i dve sledeće cifre, iza
vodeće. Npr. red stabla vodeće. Npr. red stabla 0,4 0,4 || 07 13 82 90 07 13 82 90, , predstavlja podatke, 0,407; 0,413; 0,482; predstavlja podatke, 0,407; 0,413; 0,482; 0,490;0,490;
Za ogroman broj ispitivanja ovakav dijagram Za ogroman broj ispitivanja ovakav dijagram ne može se lako konstruisati i treba ne može se lako konstruisati i treba pribegavati drugim metodama.pribegavati drugim metodama.
10
VežbanjeVežbanjeU ispitivanju gradjana kako se dovoze do U ispitivanju gradjana kako se dovoze do
radnog mesta dobijeni su sledeći podaci:radnog mesta dobijeni su sledeći podaci:
Sopstveni prevoz -25 osobaSopstveni prevoz -25 osoba
U nečijem vozilu -3 osobeU nečijem vozilu -3 osobe
Autobusom -7 osobaAutobusom -7 osoba
Ostalo -5 osobaOstalo -5 osoba..
Izračunati Relativne Frek. svake kategorije Izračunati Relativne Frek. svake kategorije prevoza i nacrtati kružni (torta) dijagramprevoza i nacrtati kružni (torta) dijagram
11
Mere centra i rasipanja Mere centra i rasipanja podataka. podataka.
Prethodne metode-vizuelizacija Prethodne metode-vizuelizacija prikupljenih podataka.prikupljenih podataka.
Korak dalje-dobijanje numeričkih Korak dalje-dobijanje numeričkih vrednosti radi lociranja centra vrednosti radi lociranja centra podataka i računanja raznih podataka i računanja raznih odstupanja.odstupanja.
Uzorak-deo populacije. Račun se Uzorak-deo populacije. Račun se odnosi ns uzorakodnosi ns uzorak
Podaci se numerišu označavaju na Podaci se numerišu označavaju na različite načinerazličite načine
xx1, 1, xx2 , 2 , xx3 , 3 , xx4 , ...4 , ...xxn, n, n-n-broj merenja, posmatranja, jedinicabroj merenja, posmatranja, jedinica
12
Srednja vrednost Srednja vrednost
Važan momenat u proučavanju Važan momenat u proučavanju distribucije podataka nekog distribucije podataka nekog uzorka-računanje neke centralne uzorka-računanje neke centralne vrednosti oko koje se grupišu svi vrednosti oko koje se grupišu svi podaci. Dva najčešće podaci. Dva najčešće upotrebljavanja termina su: upotrebljavanja termina su: srednja vrednostsrednja vrednost (aritmetička (aritmetička sredina) i sredina) i medijanamedijana..
n
ii
n xxnn
xxxx
1
321
n
merenjan zbir 1...
74,35
7,18
5
7,36,51,42,31,2
13
Mase beba rodjene tokom jednog Mase beba rodjene tokom jednog dana u nekom porodilištu su u kg: dana u nekom porodilištu su u kg: 9,2; 6,4; 10,5; 8,1; 7,8 9,2; 6,4; 10,5; 8,1; 7,8
kg 8,55
8,71,85,104,62,9
x
Prikaz podataka tačkastim dijagramom
14
MedijanaMedijana Medijana uzorka je vrednost koja se Medijana uzorka je vrednost koja se
nalazi u sredini niza kada se merenja nalazi u sredini niza kada se merenja poredjaju od najmanje ka najvećoj poredjaju od najmanje ka najvećoj vrednosti.vrednosti.
Medijana deli niz merenja na dva Medijana deli niz merenja na dva dela.dela.
Ako je broj merenja neparan Ako je broj merenja neparan medijana je jednoznačno odredjena.medijana je jednoznačno odredjena.
Ako je broj merenja paran broj Ako je broj merenja paran broj medijana se računa kao srednja medijana se računa kao srednja vrednost dve centralne vrednosti.vrednost dve centralne vrednosti.
15
MedijanaMedijana Medijana uzorka je vrednost koja se nalazi u Medijana uzorka je vrednost koja se nalazi u
sredini niza kada se merenja poredjaju od sredini niza kada se merenja poredjaju od najmanje ka najvećoj vrednosti.najmanje ka najvećoj vrednosti.
Medijana deli niz merenja na dva dela.Medijana deli niz merenja na dva dela. Ako je broj merenja neparan medijana je Ako je broj merenja neparan medijana je
jednoznačno odredjena.jednoznačno odredjena. Ako je broj merenja paran broj medijana se Ako je broj merenja paran broj medijana se
računa kao srednja vrednost dve centralne računa kao srednja vrednost dve centralne vrednosti. vrednosti.
Mase beba rodjene tokom jednog dana u Mase beba rodjene tokom jednog dana u nekom porodilištu su u kg: 9,2; 6,4; 10,5; 8,1; nekom porodilištu su u kg: 9,2; 6,4; 10,5; 8,1; 7,87,8. .
6,4 7,8 8,1 9,2 10,56,4 7,8 8,1 9,2 10,5
16
Izračunati medijanu i srednju Izračunati medijanu i srednju vrednost vremena poluraspada vrednost vremena poluraspada hemijskih elemenata, 15, 3, 46, hemijskih elemenata, 15, 3, 46, 623, 126, 64623, 126, 64
3, 15, 46, 64, 126, 6233, 15, 46, 64, 126, 623 MedijanaMedijana Srednja vrednost Srednja vrednost
dana 552
6446
2,1466
877
6
6231266446153
x
•Poslednji iznos u nizu veoma utiče na promenu srednje vrednosti, a samo jedan element ima period poluraspada duži od 146,2 dana. Srednja vrednost nije pravi pokazatelj centralne vrednosti. Potreban je veći broj podataka. Medijana bolje reprezentuje ovaj uzorak.
17
Ako je deo neke populacije dat u obliku Ako je deo neke populacije dat u obliku
xx1, 1, xx2 , 2 , xx3 , 3 , xx4 , ...4 , ...xxn n sa odgovarajućim sa odgovarajućim frekvencijama frekvencijama
ff1, 1, ff2 , 2 , ff3 , 3 , ff4 , ...4 , ...ffn n , , i ako su vrednosti obeležja X i ako su vrednosti obeležja X poredjane po rastućim vrednostima, onda poredjane po rastućim vrednostima, onda formiramo sumeformiramo sume
ff11,, ff1 1 +f+f22, f, f1 1 +f+f22+f+f3 3 ,..,.. dok se ne zadovolji uslovdok se ne zadovolji uslov
18
1
321
112
11
1321321
...2
medijana nalazi se kojoju klase granica leva
...22
tnejednakos azadovoljav M medijana onda
...2
...
k
k
e
nn
kek
kk
f
ffffN
dLM
L
xxxxd
dLd
xMd
xL
e
ffffN
ffff
19
KlaseKlase FrekvencijeFrekvencije
116-135116-135 11
136-155136-155 22
156-175156-175 11
176-195176-195 55
196-215196-215 2424
216-235216-235 4545
236-255236-255 4444
256-275256-275 3636
276-295276-295 2323
296-315296-315 1414
316-335316-335 22
336-355336-355 11
356-375356-375 11
376-392376-392 11
UkupnoUkupno N=200N=200
Medijana
Moda
20
Iz Iz tabeletabele imamo da je imamo da je
Geometrijski, medijana je predstavljena Geometrijski, medijana je predstavljena tačkom na apscisi iz koje polazi tačkom na apscisi iz koje polazi vertikalna linija koja deli histogram na vertikalna linija koja deli histogram na dva dela jednakih površina.dva dela jednakih površina.
24644
7810020236
:je jednaka i 255-236 klasi pripada medijana pa
1224445245121
7845245121
eM
21
ModaModa
Moda MModa Moo je ona vrednost obeležja X kojoj je ona vrednost obeležja X kojoj odgovara najveća frekvencija odgovara najveća frekvencija 2,2,3,7,8,8,8,10,112,2,3,7,8,8,8,10,11 MMoo=8=8
U nekim slučajevima može se desiti
da moda ne postoji, 4,5,7,10,15,18,20
da ima više modalnih vrednosti u jednom skupu podataka 3,3,5,7,7,7,9,11,12,12,12,15,21, (Mo1=7, Mo2=12)
22
Za podatke raspoređene u klase moda sZa podatke raspoređene u klase moda se izračunava prema obrascue izračunava prema obrascu
1,23544452445
244520216
primer prethodni Za
sledece susedne i efrekvencij modalne razlika
prethodne susedne i efrekvencij modalne razlika
afrekvencij najveca odgovara kojoj klase
klase modalne granica leva-
2
1
21
1
o
o
M
L
dLM
23
Geometrijska sredinaGeometrijska sredina Geometrijska sredina G skupa vrednosti Geometrijska sredina G skupa vrednosti
xx1, 1, xx2 , 2 , xx3 , 3 , xx4 , ...4 , ...xxnn je n-ti koren njihovog je n-ti koren njihovog proizvodaproizvoda
log...loglog1
log
:anjemlogaritmov obavlja seG racunanje ijeJednostavn
...
sredina kageometrijs je onda,,...ff,f,f
amafrekvencij sa pojavljuju X obelezja vrednostise Ako|
...
2211
321
N321
321
321
NN
n fN
fff
NN
xfxfxfN
G
xxxxG
xxxxG
N
24
Harmonijska sredinaHarmonijska sredina
Harmonijska sredina obeležja X je recipročna Harmonijska sredina obeležja X je recipročna vrednost aritmetičke sredine (srednje vrednost aritmetičke sredine (srednje vrednosti), recipročnih vrednosti obeležja vrednosti), recipročnih vrednosti obeležja xx1, 1,
xx2 , 2 , xx3 , 3 , xx4 , ...4 , ...xxnn..
N
i i
iN
i i
i
xf
N
xf
N
H
11
11
25
KvantiliKvantili Za veliki broj podataka, jedinica posmatranja, Za veliki broj podataka, jedinica posmatranja,
potrebno je skup podataka podeliti u više potrebno je skup podataka podeliti u više delova.delova.
Tačka podele skupa u dve polovine je Tačka podele skupa u dve polovine je medijanamedijana..
Tačke podela skupa na četvrtine se nazivaju Tačke podela skupa na četvrtine se nazivaju kvartilikvartili ( (prvi, drugi i treći kvartilprvi, drugi i treći kvartil).).
Tačke podele skupa na 10 jednakih delova Tačke podele skupa na 10 jednakih delova nazivaju se nazivaju se decili.decili.
Tačke podele skupa na još manje frakcije Tačke podele skupa na još manje frakcije nazivaju se nazivaju se percentili.percentili.
26
Percentil 100p- takva vrednost da, kada poredjamo Percentil 100p- takva vrednost da, kada poredjamo podatke po veličini od najmanjeg do najvećeg, podatke po veličini od najmanjeg do najvećeg, najmanje 100p% jedinica posmatranja (elemenata najmanje 100p% jedinica posmatranja (elemenata uzorka) je jednako ili manje od te vrednosti, a uzorka) je jednako ili manje od te vrednosti, a najmanje 100(1-p)% je jednako ili iznad te najmanje 100(1-p)% je jednako ili iznad te vrednosti.vrednosti.
Računanje percentila se vrši na sledeći način:Računanje percentila se vrši na sledeći način: poredjamo podatke po rastućem redosleduporedjamo podatke po rastućem redosledu računamo proizvod (veličina uzorka)računamo proizvod (veličina uzorka)(proporcija (proporcija
p)=Npp)=Np Ako Np nije ceo broj, vrednost zaokružujemo na Ako Np nije ceo broj, vrednost zaokružujemo na
prvi veći ceo broj i vrednost obeležja na tom prvi veći ceo broj i vrednost obeležja na tom rednom mestu je prvi kvantil.rednom mestu je prvi kvantil.
Ako je Np ceo broj, vrednost računamo srednju Ako je Np ceo broj, vrednost računamo srednju vrednost obeležja na tom i sledećem rednom vrednost obeležja na tom i sledećem rednom mestu, i to je prvi kvantil.mestu, i to je prvi kvantil.
27
PrimerPrimer Merenje buke saobraćaja u dB. Izvšeno Merenje buke saobraćaja u dB. Izvšeno
je 50 merenja buke na ulicama i podaci je 50 merenja buke na ulicama i podaci su poredjani po rastućem redosledu u su poredjani po rastućem redosledu u tabeli. Izračunati kvartile i tabeli. Izračunati kvartile i
10 –te percentile.10 –te percentile.
28
Da bi odredili prvi kvartil uzimamo p=0,25 i Da bi odredili prvi kvartil uzimamo p=0,25 i računamo proizvod Np, dakle računamo proizvod Np, dakle Np=50Np=500,25=12,5. Ovo nije ceo broj, pa se 0,25=12,5. Ovo nije ceo broj, pa se uzima prvi veći, a to je 13.uzima prvi veći, a to je 13.
Podatak na 13-tom mestu u Podatak na 13-tom mestu u tabelitabeli je 57,2. Dakle, je 57,2. Dakle, to je prvi kvartil. Obeležava se sa Qto je prvi kvartil. Obeležava se sa Q11=57,2.=57,2.
Ovo znači da imamo 13 vrednosti u skupu koje Ovo znači da imamo 13 vrednosti u skupu koje su manje ili jednake vrednosti 57,2 , a 38 su manje ili jednake vrednosti 57,2 , a 38 vrednosti jednakih ili iznad vrednosti 57,2.vrednosti jednakih ili iznad vrednosti 57,2.
Za računanje medijane uzimamo p=0,5, pa Za računanje medijane uzimamo p=0,5, pa imamo Np=50imamo Np=500,5=25. Ovo je ceo broj pa 0,5=25. Ovo je ceo broj pa računamo srednju vrednost obeležja na 25. i 26-računamo srednju vrednost obeležja na 25. i 26-tom mestu u tabeli. Dakle, tom mestu u tabeli. Dakle,
medijana=(60,8+61,0)/2=60,9.medijana=(60,8+61,0)/2=60,9.
29
Da bi odredili 10-ti percentil uzimamo Da bi odredili 10-ti percentil uzimamo p=0,1 i računamo proizvod Np, dakle p=0,1 i računamo proizvod Np, dakle Np=50Np=500,1=5. Ovo je ceo broj, pa 0,1=5. Ovo je ceo broj, pa računamo srednju vrednost obeležja na 5. i računamo srednju vrednost obeležja na 5. i 6-tom mestu u 6-tom mestu u tabelitabeli. 10-ti . 10-ti percentil=(55,8+55,9)/2=55,85. percentil=(55,8+55,9)/2=55,85.
Ovo znači da imamo 10% vrednosti u Ovo znači da imamo 10% vrednosti u skupu koje su manje ili jednake vrednosti skupu koje su manje ili jednake vrednosti 55,85. 55,85.
30
Merenje varijacijeMerenje varijacije
Dobra studija podataka Dobra studija podataka podrazumeva proračun varijacija oko podrazumeva proračun varijacija oko centralnih vrednosti.centralnih vrednosti.
Centralne vrednosti na ovim tačkastim dijgramima su iste, ali rasipanje podataka oko tih vrednosti se razlikuje
31
Kako je srednja vrednost mera centra varijacija Kako je srednja vrednost mera centra varijacija individualnih podataka od centra predstavljena individualnih podataka od centra predstavljena je njihovim odstupanjem od srednje vrednostije njihovim odstupanjem od srednje vrednosti..
x-xuzorka vred. sred.-elem. pojedinogvred.odstupanje
Za skup podataka 3,5,7,7,8 imamo da je:
Tako da se odstupanja dobijaju oduzimanjem broja 6 od svake pojedinačne vrednosti elementa.
65/305/87753 x
32
Elementi Elementi uzorkauzorka
xx
Odstupanje Odstupanje
x-xx-x
33
55
77
77
88
-3-3
-1-1
11
11
22
33
Odstupanje i varijansa Odstupanje i varijansa uzorkauzorka
11
odstupanja kvadrata suma
uzorka Varijansa
naziva se koja velicinanova se uvodi
odstupanja znake lieleiminisa Dabi
0
1
2
2
n
xx
ns
xxodstupanja
n
ii
i
34
Primer: Izračunati Primer: Izračunati varijansu uzorka za skup varijansu uzorka za skup
3,5,7,7,83,5,7,7,8
Za ovaj skup, n=5.Za ovaj skup, n=5. RačunamoRačunamo
Srednju vrednostSrednju vrednostPojedinačna odstupanja svih Pojedinačna odstupanja svih elemenataelemenata
Sumu kvadrata odstupanjaSumu kvadrata odstupanjaVarijansu uzorka Varijansu uzorka
35
Tabelarni prikaz rezultataTabelarni prikaz rezultataKvad. odst.odstupanjeElementi uzorka
36
Standardna devijacija-Standardna devijacija-standardno odstupanjestandardno odstupanje
Računanje varijanse podrazumeva Računanje varijanse podrazumeva sumu kvadrata, pa se dešava da takva sumu kvadrata, pa se dešava da takva vrsta merenja odstupanja rezultate vrsta merenja odstupanja rezultate daje u mernim jedinicama koje su daje u mernim jedinicama koje su kvadrirane. kvadrirane.
Merenje mase-odstupanja u kgMerenje mase-odstupanja u kg22.. Da bi se to izbeglo, uvodi se pojam Da bi se to izbeglo, uvodi se pojam
standardne devijacije.standardne devijacije. 1
varijanse 1
2
n
xxs
n
ii
37
Primer: Primer: Izračunati Izračunati standardno standardno odstupanje odstupanje za uzorak za uzorak
1,4,5,9,11. 1,4,5,9,11.
Nacrtati Nacrtati tačkaste tačkaste
dijagrame dijagrame za ovaj i za za ovaj i za
skup skup podataka podataka 3,5,7,7,83,5,7,7,8
Tačkasti dijagrami
Izračunavanje s
38
Alternativni izraz za varijansu Alternativni izraz za varijansu uzorkauzorka
n
xx
ns i
i
2
22
1
1
Izraz koji ne zahteva računanje individualnih odstupanja
Skraćuje postupak, naročito ako je srednja vrednost broj sa više decimala
39
Primer:U psihološkom eksperimentu Primer:U psihološkom eksperimentu mereno je vreme reakcije 6 mereno je vreme reakcije 6
pacijenata na odredjenu stimulaciju. pacijenata na odredjenu stimulaciju. Vremena reakcije su u sekundama Vremena reakcije su u sekundama
bila 4,2,3,3,6,3. Izračunati bila 4,2,3,3,6,3. Izračunati standardnu devijaciju.standardnu devijaciju.
40
ZaključakZaključak Odstupanje uključuje i znak ispred svoje vrednosti.Odstupanje uključuje i znak ispred svoje vrednosti. Varijansa uzorka- eliminiše znak odstupanja, ali Varijansa uzorka- eliminiše znak odstupanja, ali
iskazuje kvadrirane vrednosti mernih jedinica iskazuje kvadrirane vrednosti mernih jedinica elemenata uzorka. elemenata uzorka.
Standardna devijacija-eliminiše kvadrate vrednosti Standardna devijacija-eliminiše kvadrate vrednosti mernih jedinica.mernih jedinica.
Standardna devijacija se može posmatrati kao Standardna devijacija se može posmatrati kao opseg u kome leže podaci u odnosu na srednju opseg u kome leže podaci u odnosu na srednju vrednost.vrednost.
s
s
s
3xintervalu u se nalazi podataka 99,7%
2xintervalu u se nalazi podataka 95%
xintervalu u se nalazi podataka 68%
ivnoaproksimat
:zvona tiparaspodele Za
41
Druge mere varijacijeDruge mere varijacije Opseg uOpseg uzorka povremeno se koristi kao izraz za varijaciju-odstupanje.zorka povremeno se koristi kao izraz za varijaciju-odstupanje. opseg uzorka=najveća vrednost el.-najmanja vrednost el.opseg uzorka=najveća vrednost el.-najmanja vrednost el.
najmanja vrednost=52,0najmanja vrednost=52,0 najveća vrednost =77,1najveća vrednost =77,1 opseg uzorka (OU)=77,1-52,0 dBopseg uzorka (OU)=77,1-52,0 dB
42
Kao mera rasejanja-rasturanja Kao mera rasejanja-rasturanja podataka opseg uzorka ima dve podataka opseg uzorka ima dve najznačajnije osobine:najznačajnije osobine: izuzetno ga je lako izračunati i izuzetno ga je lako izračunati i
interpretirati.interpretirati. Ozbiljni nedostaci potiču iz prevelike Ozbiljni nedostaci potiču iz prevelike
osetljivosti na suviše veliki ili suviše osetljivosti na suviše veliki ili suviše mali broj podataka u uzorku.mali broj podataka u uzorku.
Zaobilazi informacije sadržane u Zaobilazi informacije sadržane u rasejanju podataka unutar samog rasejanju podataka unutar samog uzorka.uzorka.
43
Za bolje rešavanje ovih nedostataka Za bolje rešavanje ovih nedostataka napravljen je kompromis merenjem intervala napravljen je kompromis merenjem intervala izmedju prvog i trećeg kvartila.izmedju prvog i trećeg kvartila.
interkvartilni opseg uzorka=treći kvartil-prvi interkvartilni opseg uzorka=treći kvartil-prvi kvartil (IOU)kvartil (IOU)
ovaj opseg reprezentuje dužinu intervala koji ovaj opseg reprezentuje dužinu intervala koji je pokriven centralnom polovinom podataka.je pokriven centralnom polovinom podataka.
ovaj tip mere odstupanja se često koristi u ovaj tip mere odstupanja se često koristi u izveštajima vlade kada se radi o nekim izveštajima vlade kada se radi o nekim raspodelama koje imaju veliki broj podataka u raspodelama koje imaju veliki broj podataka u jednom pravcu.jednom pravcu.
Ovo se kombinuje sa standardnom Ovo se kombinuje sa standardnom devijacijom.devijacijom.
44
PrimerPrimer
Izračunati interkvartilni opseg Izračunati interkvartilni opseg uzorka iz tabele saobraćajne buke.uzorka iz tabele saobraćajne buke.
U ranijem primeru izračunati su prvi U ranijem primeru izračunati su prvi i treći kvartil: Qi treći kvartil: Q11=57,2 dB i Q=57,2 dB i Q33=64,6 =64,6 dB.dB.
Sada je Sada je
IOU= QIOU= Q3 3 - Q- Q11= 64,6 dB - 57,2 dB=7,4 = 64,6 dB - 57,2 dB=7,4 dB dB
45
Pravougaoni (box) Pravougaoni (box) dijagramidijagrami U poslednje vreme se često upotrebljavaju i U poslednje vreme se često upotrebljavaju i
predstavljaju sumarnu sliku informacija izraženih u predstavljaju sumarnu sliku informacija izraženih u kvartilima.kvartilima.
Glavno obeležje su pet značajnih vrednosti: Glavno obeležje su pet značajnih vrednosti: minimalna vrednost elminimalna vrednost el., ., prvi kvartilprvi kvartil, , drugi kvartildrugi kvartil, , treći kvartil, treći kvartil, maksimalna vrednost elementamaksimalna vrednost elementa. .
Centralna polovina podataka izmedju prvog i trećeg Centralna polovina podataka izmedju prvog i trećeg kvartila predstavlja se pravougaonikom i medijalnom kvartila predstavlja se pravougaonikom i medijalnom linijom unutar pravougaonika.linijom unutar pravougaonika.
Izvan pravougaonika se produžava linija od QIzvan pravougaonika se produžava linija od Q33 do do maksimalne vrednosti i od Qmaksimalne vrednosti i od Q11 do minimalne do minimalne vrednosti.vrednosti.
46
Slika predstavlja box dijagram Slika predstavlja box dijagram za podatke iz tabele za podatke iz tabele saobraćajne bukesaobraćajne buke
Box dijagrami su naročito pogodni za prikaz Box dijagrami su naročito pogodni za prikaz nekoliko različitih uzoraka, što omogućava bolje nekoliko različitih uzoraka, što omogućava bolje uporedjivanje njihovih podataka.uporedjivanje njihovih podataka.
50 60 70 80
Q1 Q2 Q3
47
Slika prikazuje iznos reflektovane Slika prikazuje iznos reflektovane svetlosti u infracrvenoj oblasti svetlosti u infracrvenoj oblasti snimljenoj iz satelita iznad šumskih i snimljenoj iz satelita iznad šumskih i urbanih predela.urbanih predela.
120
110
100
90
80
70
60
Šumski predeli Urbani predeli
48
Provera stabilnosti podataka duž Provera stabilnosti podataka duž vremenskog periodavremenskog perioda
Izračunavanje srednje vrednosti i varijanse uzorka tretira sve Izračunavanje srednje vrednosti i varijanse uzorka tretira sve podatke podjednako ne vodeći pri tome računa o nekoj podatke podjednako ne vodeći pri tome računa o nekoj vremenskoj raspodeli ili o njihovoj promeni tokom nekog vremenskoj raspodeli ili o njihovoj promeni tokom nekog vremenskog perioda. To spada u vrstu obrade podataka koji vremenskog perioda. To spada u vrstu obrade podataka koji su stabilni (ili je pak njihova promena stalna) tokom nekog su stabilni (ili je pak njihova promena stalna) tokom nekog vremena, i takav proces pos-matranja podataka je vremena, i takav proces pos-matranja podataka je statistički statistički kontrolisankontrolisan. .
Da bi se proverila stabilnost podataka duž nekog vremenskog Da bi se proverila stabilnost podataka duž nekog vremenskog intervala podaci se moraju grafički predstaviti u zavisnosti od intervala podaci se moraju grafički predstaviti u zavisnosti od vremena, ili bar po redosledu po kome su dobijani ili vremena, ili bar po redosledu po kome su dobijani ili posmatrani.posmatrani.
Rezultujući grafik takvog tipa se naziva vremenski graf ili Rezultujući grafik takvog tipa se naziva vremenski graf ili graf vremenske serije. Takav graf pokazuje da li su podaci graf vremenske serije. Takav graf pokazuje da li su podaci stabilni i da li postoji nekakav stabilni i da li postoji nekakav trendtrend promene tokom vremena. promene tokom vremena.
49
PrimerPrimer Jedna policijska stanica je posmatrala broj prekovremenih Jedna policijska stanica je posmatrala broj prekovremenih
sati rada na posebnim slučajevima kao što su velike pljačke, sati rada na posebnim slučajevima kao što su velike pljačke, pokušaji ubistva itd. Iako takvi dogadjaji nisu predvidljivi pokušaji ubistva itd. Iako takvi dogadjaji nisu predvidljivi pokazalo se da postoji odredjena konstantnost kada se pokazalo se da postoji odredjena konstantnost kada se podaci grupišu duž vremenskog perioda od šest meseci.podaci grupišu duž vremenskog perioda od šest meseci.
Vrednosti prekovremenih sati rada na posebnim Vrednosti prekovremenih sati rada na posebnim slučajevima u prethodnih osam godina su:slučajevima u prethodnih osam godina su:
2200 875 957 1758 868 398 1603 5232200 875 957 1758 868 398 1603 523
2034 1136 5326 1658 1945 344 807 12232034 1136 5326 1658 1945 344 807 1223 Nacrtati vremenski dijagramNacrtati vremenski dijagram..
50Period od šest meseci
Pre
kovr
emen
i rad
(u
sati
ma)
51
Primer Primer Robna razmena izmedju SAD i Japana može se Robna razmena izmedju SAD i Japana može se
meriti prema kursu dolar/jen, odnosno brojem meriti prema kursu dolar/jen, odnosno brojem jena za koji se može kupiti jedan dolar. Iako su jena za koji se može kupiti jedan dolar. Iako su te promene dnevne, dati su podaci za celu te promene dnevne, dati su podaci za celu godinu.godinu.
Nacrtati vremenski dijagram i proveriti Nacrtati vremenski dijagram i proveriti stabilnost podataka.stabilnost podataka.
godina
kurs
52
godina
kurs
53
Sa grafika se može uočiti da postoji opadajući trend Sa grafika se može uočiti da postoji opadajući trend duž vremena tako da kurs dolar/jen svakako nije u duž vremena tako da kurs dolar/jen svakako nije u statističkoj kontroli. Dolar je kupovan za manje statističkoj kontroli. Dolar je kupovan za manje jena sa prolaskom vremena izmedju 85. i 95. jena sa prolaskom vremena izmedju 85. i 95. godine. godine.
Proizvodjači imaju potrebu za posmatranjem Proizvodjači imaju potrebu za posmatranjem kritičnih dimenzija, temperatura, i drugih kritičnih dimenzija, temperatura, i drugih parametara, i ako parametri variraju, te varijacije parametara, i ako parametri variraju, te varijacije moraju biti u nekom dozvoljenom intervalu.moraju biti u nekom dozvoljenom intervalu.
Za takve potrebe pravi se tzv. kontrolni graf koji Za takve potrebe pravi se tzv. kontrolni graf koji omogućava vizuelnu inspekciju podataka ili omogućava vizuelnu inspekciju podataka ili varijacije podataka.varijacije podataka.
54
Pre
kovr
emen
i rad
(u
sati
ma)
Period od šest meseci
55
ProuProučavanje čavanje podataka sa više podataka sa više
promenljivih promenljivih obeležjaobeležja
56
Jedinjenja Jedinjenja ugljo-ugljo-
vodonika na vodonika na mesecu mesecu
Po dolasku Apola na Po dolasku Apola na mesec, naučnici su mesec, naučnici su tražili od astronauta tražili od astronauta da sakupe što više da sakupe što više uzoraka kamenja koje uzoraka kamenja koje bi poneli na zemlju bi poneli na zemlju radi ispitivanja radi ispitivanja hemijskog sastava. hemijskog sastava. Naročito je bilo važno Naročito je bilo važno ispitati sadržaj i ispitati sadržaj i učešće ugljovodonika.učešće ugljovodonika.
57
UvodUvod
Do sada - proučavani podaci sa jednim Do sada - proučavani podaci sa jednim obeležjem, jednom promenljivom. obeležjem, jednom promenljivom.
Posmatranja dve ili više promenljivih se Posmatranja dve ili više promenljivih se često beleže za individualne jedinice uzorka, često beleže za individualne jedinice uzorka, npr. težina i visina osoba, ili broj golova koje npr. težina i visina osoba, ili broj golova koje je jedan tim postigao ili primio. je jedan tim postigao ili primio.
Proučavanjem više ovakvih promenljivih teži Proučavanjem više ovakvih promenljivih teži se pronalasku neke eventualne povezanosti se pronalasku neke eventualne povezanosti izmedju njih, i da li neka od njih možda ima izmedju njih, i da li neka od njih možda ima značajnijeg uticaja na ostale.značajnijeg uticaja na ostale.
58
Primeri ilustracije konceptaPrimeri ilustracije koncepta Slučajevi nekih ispitivanja po dve karakteristike u Slučajevi nekih ispitivanja po dve karakteristike u
posebnim jedinicama uzorka:posebnim jedinicama uzorka: pol i hobi studenata nekog univerzitetapol i hobi studenata nekog univerziteta količina cigara iskorišćenih na dan i kapacitet pluća količina cigara iskorišćenih na dan i kapacitet pluća
odraslih osobaodraslih osoba starost neke aeroflote i vreme potrebno za reparacijustarost neke aeroflote i vreme potrebno za reparaciju
Karakteristike – obeležja koja se posmatraju mogu biti Karakteristike – obeležja koja se posmatraju mogu biti obe numeričkog, obe opisnog ili po jedna od oba tipa.obe numeričkog, obe opisnog ili po jedna od oba tipa. Numerička obeležja su npr. broj cigara, starost Numerička obeležja su npr. broj cigara, starost
aviona neke aeroflote aviona neke aeroflote Opisna obeležja npr. Pol, hobi, boja kose, boja kože i Opisna obeležja npr. Pol, hobi, boja kose, boja kože i
dr.dr.
59
Kada se dve osobine posmatraju za Kada se dve osobine posmatraju za individualne jedinice uzoraka i svaka individualne jedinice uzoraka i svaka osobina se beleži nekim kvalitativnim osobina se beleži nekim kvalitativnim kategorijama, onda rezultijući podaci mogu kategorijama, onda rezultijući podaci mogu biti skupljeni u formi tabele sa dvostrukom biti skupljeni u formi tabele sa dvostrukom frekvencijom. Kategorije za jedno obeležje frekvencijom. Kategorije za jedno obeležje se markiraju uz levu marginu, za drugo uz se markiraju uz levu marginu, za drugo uz gornju marginu a frekvencije se beleže u gornju marginu a frekvencije se beleže u ćelije tabele. Tabela se naziva unakrsno-ćelije tabele. Tabela se naziva unakrsno-klasifikovana, ili tabela unakrsnih klasifikovana, ili tabela unakrsnih vrednosti.vrednosti.
Sažimanje podataka sa više Sažimanje podataka sa više promenljivihpromenljivih
60
PrimerPrimer Eksperiment je radjen sa 400 osoba kojima Eksperiment je radjen sa 400 osoba kojima
su postavljana pitanja koja se tiču njihovog su postavljana pitanja koja se tiču njihovog učešća u sindikatu i njihovog stava prema učešća u sindikatu i njihovog stava prema smanjenju budžeta u svrhe socijalnih smanjenju budžeta u svrhe socijalnih programa. programa.
Pokazalo se da su njih 176 članovi Pokazalo se da su njih 176 članovi sindikata. Od tih 176, 112 je dalo podršku sindikata. Od tih 176, 112 je dalo podršku budžetu, 36 je ostalo uzdržano a 28 su bili budžetu, 36 je ostalo uzdržano a 28 su bili protiv.protiv.
Potrebno je proračunati i formirati Potrebno je proračunati i formirati raspodelu odgovora na odredjena pitanja. raspodelu odgovora na odredjena pitanja. To se postiže, u prvom stepenu To se postiže, u prvom stepenu proračunom relativnih frekvenci ćelija.proračunom relativnih frekvenci ćelija.
61
Unakrsno-klasifikovana Unakrsno-klasifikovana tabelatabela
podržapodržava va
budžetbudžet
uzdržauzdržanono
ne ne podržapodrža
va va budžetbudžet
ukupnukupnoo
član član sindikasindika
tata112112 3636 2828 176176
nije nije član član
sindikasindikatata
8484 6868 7272 224224
ukupnukupnoo
196196 104104 100100 400400
62
Računanje relativnih Računanje relativnih frekvencifrekvenci
Za ovakav proračun podelićemo vrednost Za ovakav proračun podelićemo vrednost frekvencije svake ćelije sa ukupnim brojem frekvencije svake ćelije sa ukupnim brojem ispitanika – 400.ispitanika – 400.
U zavisnosti specificiranih zahteva unakrsne U zavisnosti specificiranih zahteva unakrsne klasifikacije može se zahtevati proračun klasifikacije može se zahtevati proračun ćelijskih frekvencija u odnosu na ukupne ćelijskih frekvencija u odnosu na ukupne marginalne vrednosti. Može se zahtevati marginalne vrednosti. Može se zahtevati poredjenje stava prema budžetu članova poredjenje stava prema budžetu članova sindikata sa onima koji nisu članovi. To se sindikata sa onima koji nisu članovi. To se postiže računanjem odgovarajućih relativnih postiže računanjem odgovarajućih relativnih frakvenci, i formiraju se dve tabele. frakvenci, i formiraju se dve tabele.
63
Tabela relativnih Tabela relativnih frekvencija podataka u frekvencija podataka u
odnosu na sve ispitanikeodnosu na sve ispitanikepodržavpodržav
a a budžetbudžet
uzdržanuzdržanoo
ne ne podržavpodržav
a a budžetbudžet
ukupnoukupno
član član sindikatsindikat
aa0,280,28 0,090,09 0,070,07 0,440,44
nije nije član član
sindikatsindikataa
0,210,21 0,170,17 0,180,18 0,560,56
ukupnoukupno 0,490,49 0,260,26 0,250,25 1,001,00
64
Tabela sa relativnim Tabela sa relativnim frekvencijama u odnosu na frekvencijama u odnosu na
ukupne marginalne ukupne marginalne vrednosti prema članstvu u vrednosti prema članstvu u
sindikatusindikatupodržapodrža
va va budžetbudžet
uzdržauzdržanono
ne ne podržapodrža
va va budžetbudžet
ukupnoukupno
član član sindikasindika
tata0,6360,636 0,2050,205 0,1590,159 1,001,00
nije nije član član
sindikasindikatata
0,3750,375 0,3040,304 0,3210,321 1,001,00
65
Iz prethodne tabele- različiti stavovi Iz prethodne tabele- različiti stavovi prema budžetu izmedju dve grupacije prema budžetu izmedju dve grupacije sindikalaca i nesindikalaca. sindikalaca i nesindikalaca.
Podrška budžetu je jača medju Podrška budžetu je jača medju članovima sindikata nego medju onima članovima sindikata nego medju onima koji to nisu.koji to nisu.
Jedno od pitanja je: Da li ove Jedno od pitanja je: Da li ove posmatrane razlike samo trenutna posmatrane razlike samo trenutna slučajnost takvog uzorka ili zaista slučajnost takvog uzorka ili zaista postoje znatne razlike u stavu izmedju postoje znatne razlike u stavu izmedju gradjana koji su članovi sindikata i onih gradjana koji su članovi sindikata i onih koji to nisu?koji to nisu?
66
Paradox SimpsonaParadox SimpsonaU tabeli 1. su prikazani rezultati sa prijemnog ispita nekog univerziteta. Potrebno je proveriti da li su bolje rezultate na prijemnom ispitu postigli muškarci ili devojke.
Tabela 2. je tabela relativnih frekvencija polganja prijemnog ispita prema polu kandidata.
67
Tabela 2Tabela 2 PrimljeniPrimljeniNisu Nisu
primljeniprimljeni UKUPNOUKUPNO
MuškarciMuškarci 0,4180,418 0,5810,581 1,001,00
DevojkeDevojke 0,3120,312 0,6870,687 1,001,00
TabelaTabela 1 1 Primljeni Primljeni Nisu Nisu
primljeniprimljeni UKUPNOUKUPNO
MuškarciMuškarci 223223 557557
DevojkeDevojke
UKUPNOUKUPNO 321321 839839
324
88 282
518
194
68
Prema poslednjoj - tabeli 2. relativnih Prema poslednjoj - tabeli 2. relativnih frekvenci onih koji su položili prijemni prema frekvenci onih koji su položili prijemni prema polu kandidata, čini se da su uspešnije polu kandidata, čini se da su uspešnije prijemni uradili muškarci, jer je 41,8% od svih prijemni uradili muškarci, jer je 41,8% od svih muškaraca položilo prijemni, dok je od svih muškaraca položilo prijemni, dok je od svih devojaka, samo 31,2% položilo prijemni.devojaka, samo 31,2% položilo prijemni.
Medjutim, ako se posmatra uspeh prema Medjutim, ako se posmatra uspeh prema polaganju prijemnog ispita po smerovima, polaganju prijemnog ispita po smerovima, kojih ima dva, elektronika i umetnost, tada kojih ima dva, elektronika i umetnost, tada dolazimo do drugačijeg zaključka. dolazimo do drugačijeg zaključka.
Neka su u sledećim tabelama predstavljeni Neka su u sledećim tabelama predstavljeni podaci o uspehu na prijemnom prema podaci o uspehu na prijemnom prema smerovima, a u skladu sa brojkama iz tabele smerovima, a u skladu sa brojkama iz tabele 1.1.
69
ElektronikaElektronika Primljeni Primljeni Nisu Nisu
primljeniprimljeni UKUPNOUKUPNO
MuškarciMuškarci 151151 3535 186186
DevojkeDevojke 1616 22 1818
UKUPNOUKUPNO 167167 3737 204204
IstorijaIstorija Primljeni Primljeni Nisu Nisu
primljeniprimljeni UKUPNOUKUPNO
MuškarciMuškarci 8282 289289 371371
DevojkeDevojke 7272 192192 264264
UKUPNOUKUPNO 154154 481481 635635
Tabela 3.
Tabela 4.
70
ElektronikElektronikaa
Primljeni Primljeni Nisu Nisu
primljeniprimljeni UKUPNOUKUPNO
MuškarciMuškarci 0,8120,812 0,1880,188 1,001,00
DevojkeDevojke 0,8890,889 0,120,12 1,001,00
IstorijaIstorija Primljeni Primljeni Nisu Nisu
primljeniprimljeni UKUPNOUKUPNO
MuškarciMuškarci 0,220,22 0,780,78 1,001,00
DevojkeDevojke 0,270,27 0,730,73 1,001,00
Tabela 3.
Tabela 4.
71
Na osnovu prethodne dve tabele vidi se Na osnovu prethodne dve tabele vidi se da su i na smeru elektronika (0,889) i na da su i na smeru elektronika (0,889) i na smeru istorije (0,27) devojke uspešnije smeru istorije (0,27) devojke uspešnije uradile prijemni ispit.uradile prijemni ispit.
Ovakva mogućnost donošenja različitog Ovakva mogućnost donošenja različitog
zaključka u zavisnosti kako su podaci zaključka u zavisnosti kako su podaci predstavljeni tabelama unakrsnih predstavljeni tabelama unakrsnih vrednosti, naziva se Simpsonov vrednosti, naziva se Simpsonov paradoks.paradoks.
72
Zadatak 1Zadatak 1 Mineralna voda Mineralna voda iizz 18 izvora klasifikovana je 18 izvora klasifikovana je
kao nisko ili visoko alkalna i sa manjim ili kao nisko ili visoko alkalna i sa manjim ili većim sadržajem gvoždja. Sa visokim većim sadržajem gvoždja. Sa visokim alkalitetom procenjeno je 9 izvora, 6 je sa alkalitetom procenjeno je 9 izvora, 6 je sa većim sadržajem gvoždja, 5 ima obe visoke većim sadržajem gvoždja, 5 ima obe visoke vrednosti i alkalitet i gvoždje.vrednosti i alkalitet i gvoždje.
Formirati tabelu dvostrukih vrednostiFormirati tabelu dvostrukih vrednosti Izračunati relativne frekvencije ćelija.Izračunati relativne frekvencije ćelija. Izračunati relativne frekvencije prema Izračunati relativne frekvencije prema
ukupnom alkalitetu. ukupnom alkalitetu. Izračunati relativne frekvencije prema Izračunati relativne frekvencije prema
ukupnom sadržaju gvoždja. ukupnom sadržaju gvoždja.
73
Veći Veći sadržaj Fesadržaj Fe
Manji Manji sadržaj Fesadržaj Fe UKUPNOUKUPNO
Visok Alk.Visok Alk. 0,280,28 0,220,22 0,50,5
Nizak Alk.Nizak Alk. 0,050,05 0,440,44 0,50,5
UKUPNOUKUPNO 0,330,33 0,660,66 1,001,00
Veći sadržaj Veći sadržaj Fe Fe
Manji Manji sadržaj Fesadržaj Fe UKUPNOUKUPNO
Visok Alk.Visok Alk. 55 99
Nizak Alk.Nizak Alk.
UKUPNOUKUPNO 66 1818
4
1 9
12
8
74
Veći Veći sadržaj Fesadržaj Fe
Manji Manji sadržaj Fesadržaj Fe UKUPNOUKUPNO
Visok Alk.Visok Alk. 0,550,55 0,440,44 1,001,00
Nizak Alk.Nizak Alk. 0,110,11 0,880,88 1,001,00
Veći Veći sadržaj Fesadržaj Fe
Manji Manji sadržaj Fesadržaj Fe
Visok Alk.Visok Alk. 0,830,83 0,330,33
Nizak Alk.Nizak Alk. 0,160,16 0,660,66
UKUPNOUKUPNO 1,001,00 1,001,00
75
Zadatak 2Zadatak 2
Obavljen je razObavljen je razgovor sa 185 osoba, govor sa 185 osoba, koje su bile pod nekim stresom. Njih koje su bile pod nekim stresom. Njih 76 su alkoholičari (alkosi), 81 je 76 su alkoholičari (alkosi), 81 je depresivnog raspoloženja, 54 osobe depresivnog raspoloženja, 54 osobe su pod oba uticaja.su pod oba uticaja.
Formirati dvostruku tabelu Formirati dvostruku tabelu frekvenci.frekvenci.
Izračunati relativne frekvence za Izračunati relativne frekvence za ćelije tabelećelije tabele
76
AlkoholikAlkoholikNije Nije
alkoholikalkoholik UKUPNOUKUPNO
DepresivanDepresivan 5454 8181
Nije Nije depres.depres.
UKUPNOUKUPNO 7676 185185
AlkoholikAlkoholikNije Nije
alkoholikalkoholik UKUPNOUKUPNO
DepresivanDepresivan 0,290,29 0,140,14 0,430,43
Nije Nije depres.depres. 0,110,11 0,440,44 0,560,56
UKUPNOUKUPNO 0,410,41 0,580,58 1,001,00
27
22 104
109
82
77
U tabeli su dati podaci za broj kazni za nepropisno U tabeli su dati podaci za broj kazni za nepropisno parkiranje u 30 ulica u gradu. Kreirati Tabelu parkiranje u 30 ulica u gradu. Kreirati Tabelu frekvencija i relativnih frekvencija i prikazati podatke frekvencija i relativnih frekvencija i prikazati podatke histogramom histogramom
11 22 11 33 44 00 00 11 22 33
22 55 11 22 11 00 00 11 00 22
00 22 66 55 33 22 33 11 11 00
Zadatak
78
U tabeli su dati podaci o broju kupaca i broju U tabeli su dati podaci o broju kupaca i broju artikala kupljenih u jednom supermarketu tokom artikala kupljenih u jednom supermarketu tokom jednog dana. Predstaviti podatke histogramom. jednog dana. Predstaviti podatke histogramom. Izračunati modu i medijanuIzračunati modu i medijanu..
Broj Broj artikalaartikala
Broj Broj kupacakupaca
0-50-5
5-105-10
10-1510-15
15-2015-20
20-2520-25
25-3025-30
30-3530-35
35-4035-40
2525
2020
2828
3434
3030
2222
1111
55
Zadatak
79
TraTraži se pži se procena brzine rasta nekih biljaka u rocena brzine rasta nekih biljaka u odnosu na tip soli koji se koristi u njihovoj odnosu na tip soli koji se koristi u njihovoj ishraniishrani. Podaci su dati u Tabeli 1.. Podaci su dati u Tabeli 1.
Tip soli
Rast A B C
Dobar 16 8 14
Srednji 31 16 21
Odličan 18 36 25
65 60 60
Izračunati relativne frekvencije svih ćelija i uporediti kvalitet rasta sa pojedinim tipovima soli.
Zadatak
80
Za 60 automobila u nekom salonu dobijeni su Za 60 automobila u nekom salonu dobijeni su sledeći podaci:sledeći podaci: 8 automobila ima manuelni menjač i pogon 8 automobila ima manuelni menjač i pogon
sa dizel motoromsa dizel motorom 30 automobila ima automatski menjač i 30 automobila ima automatski menjač i
pogon sa benzinskim motorompogon sa benzinskim motorom 40 automobila ima benzinski motor40 automobila ima benzinski motor
a) Odrediti ukupne marginalne vrednosti prema tipu menjača i vrsti pogona
b) Kreirati tabelu relativnih frekvenci
c) Izračunati relativne frekvence prema svakom od obeležja
81
Linearna Linearna regresijaregresija
82
Istraživanje zavisnosti Istraživanje zavisnosti izmedju dve promenljive (izmedju dve promenljive (xx i i
yy)) Prvi korak- predstavljanje Prvi korak- predstavljanje nn parova ( parova (x,yx,y) na ) na
rasutom dijagramu.rasutom dijagramu. Ako postoji mogućnost aproksimacije Ako postoji mogućnost aproksimacije
(predstavljanja) skupa svih tačaka na (predstavljanja) skupa svih tačaka na dijagramu, koje potiču od parova (dijagramu, koje potiču od parova (x,yx,y), jednom ), jednom pravom linijom, tadapravom linijom, tada mo možemo definisati žemo definisati linearnu zavisnost medju promenljivim linearnu zavisnost medju promenljivim xx i i y.y.
U tom slučaju moguće je odrediti parametre U tom slučaju moguće je odrediti parametre linearne regresije (regresija linearne regresije (regresija yy od od xx), koji na ), koji na najbolji način opisuju linearnu zavisnost dvaju najbolji način opisuju linearnu zavisnost dvaju promenljivih.promenljivih.
Ovakva vrsta regresije je sa jednom Ovakva vrsta regresije je sa jednom promenljivom, jer je promenljivom, jer je yy zavisno samo od zavisno samo od promenljive promenljive x.x.
83
Prava linearne regresijePrava linearne regresije Matematički izraz koji predstavlja linearnu Matematički izraz koji predstavlja linearnu
regresijuregresiju
xx- nezavisna, ulazna promenljiva- nezavisna, ulazna promenljiva y-y- zavisna, izlazna promenljiva. zavisna, izlazna promenljiva.
Ovo je, ustvari, vrednost koja se očekuje Ovo je, ustvari, vrednost koja se očekuje za promenljivu za promenljivu yy kada je poznata kada je poznata vrednost promenljive vrednost promenljive xx
Čest naziv zaČest naziv za y- fitovana vrednost y- fitovana vrednost
01 xy
84
parametar parametar 0 0 predstavlja vrednost odsečka predstavlja vrednost odsečka izmedju koordinatnog početka rasutog izmedju koordinatnog početka rasutog dijagrama, i preseka regresione linije (prave) dijagrama, i preseka regresione linije (prave) sa sa y-y- osom. To je vrednost osom. To je vrednost y,y, kada je kada je xx=0.=0.
parametar parametar 11 predstavlja nagib ili gradijent predstavlja nagib ili gradijent
regresione linije. Opisuje porast promenljive regresione linije. Opisuje porast promenljive y,y, kada se ulazna promenljiva kada se ulazna promenljiva xx promeni za promeni za jediničnu vrednost.jediničnu vrednost.
Parametri Parametri 1 1 i i 0 0 se zajednički nazivaju se zajednički nazivaju koeficijenti linearne regresijekoeficijenti linearne regresije, ili , ili samo samo koeficijenti regresije koeficijenti regresije
01 xy
85
xy
xx
yyxx
n
yy
n
xx
n
n
n
i
in
i
i
10
1
2i
1ii
1
11
, ,
Računanje Računanje koeficijenata prave koeficijenata prave linearne regresijelinearne regresije
Rezultat – izraz za Rezultat – izraz za linarnu pravu sa linarnu pravu sa konkretnim konkretnim vrednostima, npr.vrednostima, npr.45,0318,2 xy
01 xy
86
Crtanje regresione linijeCrtanje regresione linije Kada su izračunati parametri Kada su izračunati parametri 11 i i 0 0 , , i dobijen i dobijen
izraz za regresionu pravu, npr. izraz za regresionu pravu, npr.
prelazi se na crtanje te prave na rasuti dijagram.prelazi se na crtanje te prave na rasuti dijagram.
Uzimamo npr. tri vrednosti za promenljivu Uzimamo npr. tri vrednosti za promenljivu x, x, iz iz skupa- uzorkaskupa- uzorka
(x(x11,x,x22,x,x33, ..., x, ..., xkk, x, xk+1k+1,...x,...xmm,..., x,..., xnn), npr. x), npr. x2 2 ,x,xk k i xi xmm . .
Svaku od vrednosti zamenimo u izraz za Svaku od vrednosti zamenimo u izraz za regresionu pravu, i dobijemo tri vrednosti za regresionu pravu, i dobijemo tri vrednosti za promenljivu y (y promenljivu y (y ‘‘,,yy““,,yy'"'"). Ova tri para). Ova tri para (x (x22,,y y ‘‘), (), (xxkk y y ““), (), (xxmm , ,yy '"'" ), ), predstavljaju tačke kroz koje treba predstavljaju tačke kroz koje treba provući liniju koja reprezentuje linearnu regresiju provući liniju koja reprezentuje linearnu regresiju za promenljiveza promenljive x i y. x i y.
45,0318,2 xy
87
PrimerPrimer
Ispitivano je vreme reakcije Ispitivano je vreme reakcije pacijenata, kojima je u krvotok pacijenata, kojima je u krvotok ubrizgan odredjeni stimulans. ubrizgan odredjeni stimulans.
Vreme- sekundeVreme- sekunde Stimulans- mmStimulans- mm33
Za pet pacijenata zabeleZa pet pacijenata zabeleženi su ženi su sledeći rezultati:sledeći rezultati:
88
Tabela rezultata ispitivanjaTabela rezultata ispitivanja
Red. Red. Br. Br.
pacijenpacijentata
Količina Količina stimulansstimulansa (mma (mm33))
Vreme Vreme reakcijreakcije (s)e (s)
11
22
33
44
55
11
22
33
44
55
11
11
22
22
44
89
Rasuti dijagramRasuti dijagram
1 2 3 4 5
1,0
1,5
2,0
2,5
3,0
3,5
4,0
Vre
me
re
akcije
Kolicina stimulansa (mm3)
90
Regresiona pravaRegresiona prava
1 2 3 4 5
1,0
1,5
2,0
2,5
3,0
3,5
4,0 B Linear Fit of Data1_B
Vre
me
re
akcije
Kolicina stimulansa (mm3)
91
xxii yyii xxii22 xxiiyyii
11
22
33
44
55
11
11
22
22
44
11
22
99
1616
2525
11
22
66
88
2020
∑∑xxii=15=15 ∑∑yyii=10=10 ∑ ∑ xxii
22=55=55∑ ∑
xxiiyyii=37=37
Tabela sa vrednostima potrebnim za računanje koeficijenata i
92
xy
n
yx
yxS
n
x
xS
S
S
xx
yyxx
nn
n
xy
n
n
xx
xx
xy
n
n
10
1i
1i
1ii
2
1i
1
2i
1
2i
1ii
1
10
7
Moguća je upotreba jednostavnijih izraza za izračunavanje koeficijenata 1 i kao što je pokazano na slici desno.
Ovakav pristup je brži, jer je moguće koristiti tabele sa manje kolona, čiji se medjuzbirovi koriste za dobijanje krajnje tražene vrednosti
93
Dat je skup podataka u Tabeli:Dat je skup podataka u Tabeli:
Odrediti koeficente linearne regresije Odrediti koeficente linearne regresije i nacrtati regresionu pravui nacrtati regresionu pravu
PrimerPrimer
xxii yyii
77 22
44 44
66 22
22 55
11 77
11 66
33 55
94
95
xxii yyii xxii22 yyii
22 xxiiyyii
77 22 4949 44 1414
44 44 1616 1616 1616
66 22 3636 44 1212
22 55 44 2525 1010
11 77 11 4949 77
11 66 11 3636 66
33 55 99 2525 1515
∑ ∑ ∑ ∑ ∑ ∑ ∑ ∑ ∑ ∑
2424 3131 116116 159159 8080
96
97
PrimerPrimer Dati su paroviDati su parovi podataka (x,y) podataka (x,y)
(2,5), (1,3), (5,6), (0,2)(2,5), (1,3), (5,6), (0,2), (3,9), (3,9)
NaNaćći koeficijente linearne regresije i izrai koeficijente linearne regresije i izraččunati unati koeficijent korelacije r koeficijent korelacije r
98
PrimerPrimer
HH 121200
8282 9900
88 3838 2020 2,2,88
6666 2,2,00
2020 8585
CC 101055
111100
9999
2222 5050 5050 7,7,33
7474 7,7,77
4545 5151
Dati su Dati su podaci o vlaznosti vazduha I podaci o vlaznosti vazduha I temperature u nekom hemijskom procesutemperature u nekom hemijskom procesu
Naci koeficijente linearne regresije i Naci koeficijente linearne regresije i izracunati koeficijent korelacije rizracunati koeficijent korelacije r
99
Ispitni zadatak 1.Ispitni zadatak 1.Skup podataka 24,Skup podataka 24, 31, 72, 35,31, 72, 35, 90, 81, 84, 40, 90, 81, 84, 40, 41, 42, 53, 56, 58, 47, 49, 72, 87, 78, 80, 7941, 42, 53, 56, 58, 47, 49, 72, 87, 78, 80, 79-p-predstaviti stablo-list strukturom. redstaviti stablo-list strukturom. Za ovaj skup:Za ovaj skup:Prvi kvartil iznosi Prvi kvartil iznosi ::Medijana iznosiMedijana iznosi::__________________Treći kvartil iznosiTreći kvartil iznosi::Za ovaj skup 35-ti percentil iznosiZa ovaj skup 35-ti percentil iznosi::
Za ovaj skup podatakaZa ovaj skup podatakaa) ima više modalnih vrednostia) ima više modalnih vrednostib) moda ne postoji b) moda ne postoji c) ima tačno jedna modalna vrednostc) ima tačno jedna modalna vrednostd) ne znamd) ne znam
100
Ispitni zadatak 2.Ispitni zadatak 2.
Slobodna mestaSlobodna mesta Broj avionaBroj aviona
1-51-5
5-105-10
10-1510-15
15-2015-20
20-25 20-25
22
44
22
11
3 3
101
Za podatke iz prethodne tabele sa Za podatke iz prethodne tabele sa merodavnom levom granicom klase važi:merodavnom levom granicom klase važi:
Medijana se nalazi u klasi __-__Medijana se nalazi u klasi __-__ Vrednost medijane iznosi______Vrednost medijane iznosi______ Moda se nalazi u klasi ___-___Moda se nalazi u klasi ___-___ Vrednost mode iznosi________Vrednost mode iznosi________ Zaokružiti tačne iskaze:Zaokružiti tačne iskaze: a) Može se odrediti tačan broja aviona sa a) Može se odrediti tačan broja aviona sa
manje od 10 slobodnih mestamanje od 10 slobodnih mesta b) Može se odrediti tačan broj aviona sa b) Može se odrediti tačan broj aviona sa
više od 10 slobodnih mestaviše od 10 slobodnih mesta c) Može se odrediti tačan broj aviona sa 2 c) Može se odrediti tačan broj aviona sa 2
slobodna mestaslobodna mesta d) Može se odrediti tačan broj aviona sa d) Može se odrediti tačan broj aviona sa
manje od 25 slobodnog mesta manje od 25 slobodnog mesta
102
Ispitni zadatak 3.Ispitni zadatak 3.
Prodaja 20 artikala Prodaja 20 artikala je izražena je izražena tabelom, tako da je tabelom, tako da je leva granica leva granica važeća. Predstaviti važeća. Predstaviti podatke podatke histogramom.histogramom.
Cena Cena (din.)(din.)
Broj Broj komada komada
5-105-10
10-1510-15
15-2015-20
20-2520-25
25-30 25-30
44
22
66
5 5
103
Ispitni zadatak 4.Ispitni zadatak 4. Od 60 ispitanih osoba, 18 nemaju sopstveni Od 60 ispitanih osoba, 18 nemaju sopstveni
auto, od kojih 10 ima položen vozački ispit, auto, od kojih 10 ima položen vozački ispit, dok je dvostruko više osoba sa položenim dok je dvostruko više osoba sa položenim nego nepoloženim ispitom. nego nepoloženim ispitom.
_______ je procenat vozača koji nemaju ni _______ je procenat vozača koji nemaju ni položen ispit ni auto u odnosu na sve položen ispit ni auto u odnosu na sve ispitanikeispitanike
_______ je procenat vozača sa položenim _______ je procenat vozača sa položenim ispitom i svojim autom u odnosu na sve koji ispitom i svojim autom u odnosu na sve koji imaju svoj autoimaju svoj auto
_______ je procenat vozača sa autom i _______ je procenat vozača sa autom i položenim ispitom u odnosu na sve položenim ispitom u odnosu na sve ispitanikaispitanika
104
Ispitni zadatak 5.Ispitni zadatak 5. U tabeli su date relativne frekvence prema polu za 60 U tabeli su date relativne frekvence prema polu za 60
ispitanih osoba, od kojih su 40 žene, u pogledu odnosa ispitanih osoba, od kojih su 40 žene, u pogledu odnosa rekreativnog bavljenja sportom i pola (Ž/M).rekreativnog bavljenja sportom i pola (Ž/M).
Upisati tačan broj osobaUpisati tačan broj osoba _______ žena se bavi rekreacijom_______ žena se bavi rekreacijom _______ muškaraca se ne bavi rekreacijom_______ muškaraca se ne bavi rekreacijom _______ osoba se ne bavi rekreacijom_______ osoba se ne bavi rekreacijom _______ osoba se bavi rekreacijom_______ osoba se bavi rekreacijom
Bavi se Bavi se rekreacijorekreacijom m
Ne bavi se Ne bavi se rekreacijorekreacijom m
ŽeneŽene 0,20,2 1,0 1,0
MuškarcMuškarcii
0,7 0,7 1,0 1,0
105
Ispitni zadatakIspitni zadatakSkup podataka 24,Skup podataka 24, 31, 72, 35,31, 72, 35, 90, 81, 84, 40, 90, 81, 84, 40, 41, 42, 53, 56, 58, 47, 49, 72, 87, 78, 80, 7941, 42, 53, 56, 58, 47, 49, 72, 87, 78, 80, 79-p-predstaviti stablo-list strukturom. redstaviti stablo-list strukturom. Za ovaj skup:Za ovaj skup:Prvi kvartil iznosi Prvi kvartil iznosi ::Medijana iznosiMedijana iznosi::__________________Treći kvartil iznosiTreći kvartil iznosi::Za ovaj skup 35-ti percentil iznosiZa ovaj skup 35-ti percentil iznosi::
Za ovaj skup podatakaZa ovaj skup podatakaa) ima više modalnih vrednostia) ima više modalnih vrednostib) moda ne postoji b) moda ne postoji c) ima tačno jedna modalna vrednostc) ima tačno jedna modalna vrednostd) ne znamd) ne znam
106
Ispitni zadatakIspitni zadatak
Slobodna mestaSlobodna mesta Broj avionaBroj aviona
1-51-5
5-105-10
10-1510-15
15-2015-20
20-25 20-25
22
55
22
11
3 3
107
Za podatke iz prethodne tabele sa merodavnom Za podatke iz prethodne tabele sa merodavnom levom granicom klase važi:levom granicom klase važi:
Medijana se nalazi u klasi __-__Medijana se nalazi u klasi __-__ Vrednost medijane iznosi______Vrednost medijane iznosi______ Moda se nalazi u klasi ___-___Moda se nalazi u klasi ___-___ Vrednost mode iznosi________Vrednost mode iznosi________
Zaokružiti tačne iskaze:Zaokružiti tačne iskaze: a) Može se odrediti tačan broja aviona sa manje a) Može se odrediti tačan broja aviona sa manje
od 10 slobodnih mestaod 10 slobodnih mesta b) Može se odrediti tačan broj aviona sa više od b) Može se odrediti tačan broj aviona sa više od
10 slobodnih mesta10 slobodnih mesta c) Može se odrediti tačan broj aviona sa 2 c) Može se odrediti tačan broj aviona sa 2
slobodna mestaslobodna mesta d) Može se odrediti tačan broj aviona sa manje d) Može se odrediti tačan broj aviona sa manje
od 25 slobodnog mesta od 25 slobodnog mesta
108
Ispitni zadatakIspitni zadatak
Od 20 studenata nekog univerziteta, medju Od 20 studenata nekog univerziteta, medju kojima je 8 žena, 25% od ukupnog broja kojima je 8 žena, 25% od ukupnog broja studenata su žene sa smera umetnosti, 7 studenata su žene sa smera umetnosti, 7 muškaraca je sa smera ekonomije. muškaraca je sa smera ekonomije.
Ukupan procenat studenata smera Ukupan procenat studenata smera umetnosti je:umetnosti je:
Od ukupnog broja muškaraca, umetnost Od ukupnog broja muškaraca, umetnost studira njih____%studira njih____%
109
Ispitni zadatakIspitni zadatak Za dati rasuti Za dati rasuti
didijjagramagram,, koeficijent koeficijent korelacije korelacije iznosi________iznosi________
Koeficijenti Koeficijenti linearne regresije linearne regresije su su 00=_______ , =_______ ,
11=________=________
-1 0 1 2 3 4 5 6 7 8 9
1
2
3
4
5
Y
X