109
1 2008. 2008.

Statistika Vladimir S

Embed Size (px)

Citation preview

Page 1: Statistika Vladimir S

1

2008.2008.

Page 2: Statistika Vladimir S

2

UvodUvod DDefinicije podataka kontinualnog i efinicije podataka kontinualnog i

diskretnodiskretnog tipag tipa Podaci kontinualnog tipa su npr. brojne Podaci kontinualnog tipa su npr. brojne

vrednosti iz skupa realnih brojeva. Takvi vrednosti iz skupa realnih brojeva. Takvi podaci mogu imati bilo koju vrednost iz opsega podaci mogu imati bilo koju vrednost iz opsega (-∞,+∞)(-∞,+∞)

Podaci diskretnog tipa mogu imati samo Podaci diskretnog tipa mogu imati samo odredjene vrednosti, npr. Broj osoba u nekom odredjene vrednosti, npr. Broj osoba u nekom eksperimentu moeksperimentu može biti samo ceo broj.že biti samo ceo broj.

Upotreba dodatnih metoda evaluacije Upotreba dodatnih metoda evaluacije uzorakauzoraka

Retrospektiva gradiva kroz primereRetrospektiva gradiva kroz primere

Page 3: Statistika Vladimir S

3

Teme:Teme: Stablo-list strukturaStablo-list struktura Zadaci Zadaci Aritmetička sredinaAritmetička sredina ModMod MedijanaMedijana KvartiliKvartili PrimeriPrimeri Merenje varijacijeMerenje varijacije Druge mere varijacijeDruge mere varijacije

Page 4: Statistika Vladimir S

4

Mere rasipanja jedninica neke Mere rasipanja jedninica neke populacijepopulacije

Sve pomenute teme se preklapaju i Sve pomenute teme se preklapaju i služe merenju raznih odstupanja služe merenju raznih odstupanja pojedinih jedinica od neke vrednostipojedinih jedinica od neke vrednosti

Arit. Sr.

Harmonijska sredina

Moda

Medijana

Page 5: Statistika Vladimir S

5

Prikaz rezultata-”Stablo-Prikaz rezultata-”Stablo-list”list”

Omogućava efikasniji prikaz Omogućava efikasniji prikaz podataka u odnosu na histogram za podataka u odnosu na histogram za veći broj observacija, posmatranja, veći broj observacija, posmatranja, merenja, npr. dvocifreni.merenja, npr. dvocifreni.

Slika se dobija sortiranjem Slika se dobija sortiranjem observacija, merenja po redovima u observacija, merenja po redovima u skladu sa prvom cifrom.skladu sa prvom cifrom.

Page 6: Statistika Vladimir S

6

Prikaz rezultata-”Stablo-Prikaz rezultata-”Stablo-list”list” Formiramo tabelu sa dve kolone.Formiramo tabelu sa dve kolone.

U koloni 1 su cifre od 0-9, i one U koloni 1 su cifre od 0-9, i one odgovaraju prvoj cifri nekog broja odgovaraju prvoj cifri nekog broja observacija ili merenja.observacija ili merenja.

Za svako merenje-posmatranje (rezultat), Za svako merenje-posmatranje (rezultat), u koloni 2 zapisujemo drugu cifru u redu u u koloni 2 zapisujemo drugu cifru u redu u kome se u koloni 1 nalazi prva cifra. Može kome se u koloni 1 nalazi prva cifra. Može biti više drugih cifara sa istom prvom, što biti više drugih cifara sa istom prvom, što znači da će u koloni 2 biti više cifara u znači da će u koloni 2 biti više cifara u istom redu.istom redu.

Sortiramo sve druge cifre po rastućem Sortiramo sve druge cifre po rastućem redosledu u svakom redu kolone 2.redosledu u svakom redu kolone 2.

Page 7: Statistika Vladimir S

7

Prikaz rezultata-”Stablo-Prikaz rezultata-”Stablo-list”list”

Rezultati ispita

Formiranje stablo-list strukture

Page 8: Statistika Vladimir S

8

Page 9: Statistika Vladimir S

9

Prikaz rezultata-”Stablo-Prikaz rezultata-”Stablo-list”list”

Stablo- kolona 1. Listovi –kolona 2.Stablo- kolona 1. Listovi –kolona 2. Cela struktura može biti tumačena i kao Cela struktura može biti tumačena i kao

histogram sa klasama od 10 poena. histogram sa klasama od 10 poena. Efikasnije od histograma jer su detaljnije Efikasnije od histograma jer su detaljnije

informacije.informacije. Listovi mogu biti i dve sledeće cifre, iza Listovi mogu biti i dve sledeće cifre, iza

vodeće. Npr. red stabla vodeće. Npr. red stabla 0,4 0,4 || 07 13 82 90 07 13 82 90, , predstavlja podatke, 0,407; 0,413; 0,482; predstavlja podatke, 0,407; 0,413; 0,482; 0,490;0,490;

Za ogroman broj ispitivanja ovakav dijagram Za ogroman broj ispitivanja ovakav dijagram ne može se lako konstruisati i treba ne može se lako konstruisati i treba pribegavati drugim metodama.pribegavati drugim metodama.

Page 10: Statistika Vladimir S

10

VežbanjeVežbanjeU ispitivanju gradjana kako se dovoze do U ispitivanju gradjana kako se dovoze do

radnog mesta dobijeni su sledeći podaci:radnog mesta dobijeni su sledeći podaci:

Sopstveni prevoz -25 osobaSopstveni prevoz -25 osoba

U nečijem vozilu -3 osobeU nečijem vozilu -3 osobe

Autobusom -7 osobaAutobusom -7 osoba

Ostalo -5 osobaOstalo -5 osoba..

Izračunati Relativne Frek. svake kategorije Izračunati Relativne Frek. svake kategorije prevoza i nacrtati kružni (torta) dijagramprevoza i nacrtati kružni (torta) dijagram

Page 11: Statistika Vladimir S

11

Mere centra i rasipanja Mere centra i rasipanja podataka. podataka.

Prethodne metode-vizuelizacija Prethodne metode-vizuelizacija prikupljenih podataka.prikupljenih podataka.

Korak dalje-dobijanje numeričkih Korak dalje-dobijanje numeričkih vrednosti radi lociranja centra vrednosti radi lociranja centra podataka i računanja raznih podataka i računanja raznih odstupanja.odstupanja.

Uzorak-deo populacije. Račun se Uzorak-deo populacije. Račun se odnosi ns uzorakodnosi ns uzorak

Podaci se numerišu označavaju na Podaci se numerišu označavaju na različite načinerazličite načine

xx1, 1, xx2 , 2 , xx3 , 3 , xx4 , ...4 , ...xxn, n, n-n-broj merenja, posmatranja, jedinicabroj merenja, posmatranja, jedinica

Page 12: Statistika Vladimir S

12

Srednja vrednost Srednja vrednost

Važan momenat u proučavanju Važan momenat u proučavanju distribucije podataka nekog distribucije podataka nekog uzorka-računanje neke centralne uzorka-računanje neke centralne vrednosti oko koje se grupišu svi vrednosti oko koje se grupišu svi podaci. Dva najčešće podaci. Dva najčešće upotrebljavanja termina su: upotrebljavanja termina su: srednja vrednostsrednja vrednost (aritmetička (aritmetička sredina) i sredina) i medijanamedijana..

n

ii

n xxnn

xxxx

1

321

n

merenjan zbir 1...

74,35

7,18

5

7,36,51,42,31,2

Page 13: Statistika Vladimir S

13

Mase beba rodjene tokom jednog Mase beba rodjene tokom jednog dana u nekom porodilištu su u kg: dana u nekom porodilištu su u kg: 9,2; 6,4; 10,5; 8,1; 7,8 9,2; 6,4; 10,5; 8,1; 7,8

kg 8,55

8,71,85,104,62,9

x

Prikaz podataka tačkastim dijagramom

Page 14: Statistika Vladimir S

14

MedijanaMedijana Medijana uzorka je vrednost koja se Medijana uzorka je vrednost koja se

nalazi u sredini niza kada se merenja nalazi u sredini niza kada se merenja poredjaju od najmanje ka najvećoj poredjaju od najmanje ka najvećoj vrednosti.vrednosti.

Medijana deli niz merenja na dva Medijana deli niz merenja na dva dela.dela.

Ako je broj merenja neparan Ako je broj merenja neparan medijana je jednoznačno odredjena.medijana je jednoznačno odredjena.

Ako je broj merenja paran broj Ako je broj merenja paran broj medijana se računa kao srednja medijana se računa kao srednja vrednost dve centralne vrednosti.vrednost dve centralne vrednosti.

Page 15: Statistika Vladimir S

15

MedijanaMedijana Medijana uzorka je vrednost koja se nalazi u Medijana uzorka je vrednost koja se nalazi u

sredini niza kada se merenja poredjaju od sredini niza kada se merenja poredjaju od najmanje ka najvećoj vrednosti.najmanje ka najvećoj vrednosti.

Medijana deli niz merenja na dva dela.Medijana deli niz merenja na dva dela. Ako je broj merenja neparan medijana je Ako je broj merenja neparan medijana je

jednoznačno odredjena.jednoznačno odredjena. Ako je broj merenja paran broj medijana se Ako je broj merenja paran broj medijana se

računa kao srednja vrednost dve centralne računa kao srednja vrednost dve centralne vrednosti. vrednosti.

Mase beba rodjene tokom jednog dana u Mase beba rodjene tokom jednog dana u nekom porodilištu su u kg: 9,2; 6,4; 10,5; 8,1; nekom porodilištu su u kg: 9,2; 6,4; 10,5; 8,1; 7,87,8. .

6,4 7,8 8,1 9,2 10,56,4 7,8 8,1 9,2 10,5

Page 16: Statistika Vladimir S

16

Izračunati medijanu i srednju Izračunati medijanu i srednju vrednost vremena poluraspada vrednost vremena poluraspada hemijskih elemenata, 15, 3, 46, hemijskih elemenata, 15, 3, 46, 623, 126, 64623, 126, 64

3, 15, 46, 64, 126, 6233, 15, 46, 64, 126, 623 MedijanaMedijana Srednja vrednost Srednja vrednost

dana 552

6446

2,1466

877

6

6231266446153

x

•Poslednji iznos u nizu veoma utiče na promenu srednje vrednosti, a samo jedan element ima period poluraspada duži od 146,2 dana. Srednja vrednost nije pravi pokazatelj centralne vrednosti. Potreban je veći broj podataka. Medijana bolje reprezentuje ovaj uzorak.

Page 17: Statistika Vladimir S

17

Ako je deo neke populacije dat u obliku Ako je deo neke populacije dat u obliku

xx1, 1, xx2 , 2 , xx3 , 3 , xx4 , ...4 , ...xxn n sa odgovarajućim sa odgovarajućim frekvencijama frekvencijama

ff1, 1, ff2 , 2 , ff3 , 3 , ff4 , ...4 , ...ffn n , , i ako su vrednosti obeležja X i ako su vrednosti obeležja X poredjane po rastućim vrednostima, onda poredjane po rastućim vrednostima, onda formiramo sumeformiramo sume

ff11,, ff1 1 +f+f22, f, f1 1 +f+f22+f+f3 3 ,..,.. dok se ne zadovolji uslovdok se ne zadovolji uslov

Page 18: Statistika Vladimir S

18

1

321

112

11

1321321

...2

medijana nalazi se kojoju klase granica leva

...22

tnejednakos azadovoljav M medijana onda

...2

...

k

k

e

nn

kek

kk

f

ffffN

dLM

L

xxxxd

dLd

xMd

xL

e

ffffN

ffff

Page 19: Statistika Vladimir S

19

KlaseKlase FrekvencijeFrekvencije

116-135116-135 11

136-155136-155 22

156-175156-175 11

176-195176-195 55

196-215196-215 2424

216-235216-235 4545

236-255236-255 4444

256-275256-275 3636

276-295276-295 2323

296-315296-315 1414

316-335316-335 22

336-355336-355 11

356-375356-375 11

376-392376-392 11

UkupnoUkupno N=200N=200

Medijana

Moda

Page 20: Statistika Vladimir S

20

Iz Iz tabeletabele imamo da je imamo da je

Geometrijski, medijana je predstavljena Geometrijski, medijana je predstavljena tačkom na apscisi iz koje polazi tačkom na apscisi iz koje polazi vertikalna linija koja deli histogram na vertikalna linija koja deli histogram na dva dela jednakih površina.dva dela jednakih površina.

24644

7810020236

:je jednaka i 255-236 klasi pripada medijana pa

1224445245121

7845245121

eM

Page 21: Statistika Vladimir S

21

ModaModa

Moda MModa Moo je ona vrednost obeležja X kojoj je ona vrednost obeležja X kojoj odgovara najveća frekvencija odgovara najveća frekvencija 2,2,3,7,8,8,8,10,112,2,3,7,8,8,8,10,11 MMoo=8=8

U nekim slučajevima može se desiti

da moda ne postoji, 4,5,7,10,15,18,20

da ima više modalnih vrednosti u jednom skupu podataka 3,3,5,7,7,7,9,11,12,12,12,15,21, (Mo1=7, Mo2=12)

Page 22: Statistika Vladimir S

22

Za podatke raspoređene u klase moda sZa podatke raspoređene u klase moda se izračunava prema obrascue izračunava prema obrascu

1,23544452445

244520216

primer prethodni Za

sledece susedne i efrekvencij modalne razlika

prethodne susedne i efrekvencij modalne razlika

afrekvencij najveca odgovara kojoj klase

klase modalne granica leva-

2

1

21

1

o

o

M

L

dLM

Page 23: Statistika Vladimir S

23

Geometrijska sredinaGeometrijska sredina Geometrijska sredina G skupa vrednosti Geometrijska sredina G skupa vrednosti

xx1, 1, xx2 , 2 , xx3 , 3 , xx4 , ...4 , ...xxnn je n-ti koren njihovog je n-ti koren njihovog proizvodaproizvoda

log...loglog1

log

:anjemlogaritmov obavlja seG racunanje ijeJednostavn

...

sredina kageometrijs je onda,,...ff,f,f

amafrekvencij sa pojavljuju X obelezja vrednostise Ako|

...

2211

321

N321

321

321

NN

n fN

fff

NN

xfxfxfN

G

xxxxG

xxxxG

N

Page 24: Statistika Vladimir S

24

Harmonijska sredinaHarmonijska sredina

Harmonijska sredina obeležja X je recipročna Harmonijska sredina obeležja X je recipročna vrednost aritmetičke sredine (srednje vrednost aritmetičke sredine (srednje vrednosti), recipročnih vrednosti obeležja vrednosti), recipročnih vrednosti obeležja xx1, 1,

xx2 , 2 , xx3 , 3 , xx4 , ...4 , ...xxnn..

N

i i

iN

i i

i

xf

N

xf

N

H

11

11

Page 25: Statistika Vladimir S

25

KvantiliKvantili Za veliki broj podataka, jedinica posmatranja, Za veliki broj podataka, jedinica posmatranja,

potrebno je skup podataka podeliti u više potrebno je skup podataka podeliti u više delova.delova.

Tačka podele skupa u dve polovine je Tačka podele skupa u dve polovine je medijanamedijana..

Tačke podela skupa na četvrtine se nazivaju Tačke podela skupa na četvrtine se nazivaju kvartilikvartili ( (prvi, drugi i treći kvartilprvi, drugi i treći kvartil).).

Tačke podele skupa na 10 jednakih delova Tačke podele skupa na 10 jednakih delova nazivaju se nazivaju se decili.decili.

Tačke podele skupa na još manje frakcije Tačke podele skupa na još manje frakcije nazivaju se nazivaju se percentili.percentili.

Page 26: Statistika Vladimir S

26

Percentil 100p- takva vrednost da, kada poredjamo Percentil 100p- takva vrednost da, kada poredjamo podatke po veličini od najmanjeg do najvećeg, podatke po veličini od najmanjeg do najvećeg, najmanje 100p% jedinica posmatranja (elemenata najmanje 100p% jedinica posmatranja (elemenata uzorka) je jednako ili manje od te vrednosti, a uzorka) je jednako ili manje od te vrednosti, a najmanje 100(1-p)% je jednako ili iznad te najmanje 100(1-p)% je jednako ili iznad te vrednosti.vrednosti.

Računanje percentila se vrši na sledeći način:Računanje percentila se vrši na sledeći način: poredjamo podatke po rastućem redosleduporedjamo podatke po rastućem redosledu računamo proizvod (veličina uzorka)računamo proizvod (veličina uzorka)(proporcija (proporcija

p)=Npp)=Np Ako Np nije ceo broj, vrednost zaokružujemo na Ako Np nije ceo broj, vrednost zaokružujemo na

prvi veći ceo broj i vrednost obeležja na tom prvi veći ceo broj i vrednost obeležja na tom rednom mestu je prvi kvantil.rednom mestu je prvi kvantil.

Ako je Np ceo broj, vrednost računamo srednju Ako je Np ceo broj, vrednost računamo srednju vrednost obeležja na tom i sledećem rednom vrednost obeležja na tom i sledećem rednom mestu, i to je prvi kvantil.mestu, i to je prvi kvantil.

Page 27: Statistika Vladimir S

27

PrimerPrimer Merenje buke saobraćaja u dB. Izvšeno Merenje buke saobraćaja u dB. Izvšeno

je 50 merenja buke na ulicama i podaci je 50 merenja buke na ulicama i podaci su poredjani po rastućem redosledu u su poredjani po rastućem redosledu u tabeli. Izračunati kvartile i tabeli. Izračunati kvartile i

10 –te percentile.10 –te percentile.

Page 28: Statistika Vladimir S

28

Da bi odredili prvi kvartil uzimamo p=0,25 i Da bi odredili prvi kvartil uzimamo p=0,25 i računamo proizvod Np, dakle računamo proizvod Np, dakle Np=50Np=500,25=12,5. Ovo nije ceo broj, pa se 0,25=12,5. Ovo nije ceo broj, pa se uzima prvi veći, a to je 13.uzima prvi veći, a to je 13.

Podatak na 13-tom mestu u Podatak na 13-tom mestu u tabelitabeli je 57,2. Dakle, je 57,2. Dakle, to je prvi kvartil. Obeležava se sa Qto je prvi kvartil. Obeležava se sa Q11=57,2.=57,2.

Ovo znači da imamo 13 vrednosti u skupu koje Ovo znači da imamo 13 vrednosti u skupu koje su manje ili jednake vrednosti 57,2 , a 38 su manje ili jednake vrednosti 57,2 , a 38 vrednosti jednakih ili iznad vrednosti 57,2.vrednosti jednakih ili iznad vrednosti 57,2.

Za računanje medijane uzimamo p=0,5, pa Za računanje medijane uzimamo p=0,5, pa imamo Np=50imamo Np=500,5=25. Ovo je ceo broj pa 0,5=25. Ovo je ceo broj pa računamo srednju vrednost obeležja na 25. i 26-računamo srednju vrednost obeležja na 25. i 26-tom mestu u tabeli. Dakle, tom mestu u tabeli. Dakle,

medijana=(60,8+61,0)/2=60,9.medijana=(60,8+61,0)/2=60,9.

Page 29: Statistika Vladimir S

29

Da bi odredili 10-ti percentil uzimamo Da bi odredili 10-ti percentil uzimamo p=0,1 i računamo proizvod Np, dakle p=0,1 i računamo proizvod Np, dakle Np=50Np=500,1=5. Ovo je ceo broj, pa 0,1=5. Ovo je ceo broj, pa računamo srednju vrednost obeležja na 5. i računamo srednju vrednost obeležja na 5. i 6-tom mestu u 6-tom mestu u tabelitabeli. 10-ti . 10-ti percentil=(55,8+55,9)/2=55,85. percentil=(55,8+55,9)/2=55,85.

Ovo znači da imamo 10% vrednosti u Ovo znači da imamo 10% vrednosti u skupu koje su manje ili jednake vrednosti skupu koje su manje ili jednake vrednosti 55,85. 55,85.

Page 30: Statistika Vladimir S

30

Merenje varijacijeMerenje varijacije

Dobra studija podataka Dobra studija podataka podrazumeva proračun varijacija oko podrazumeva proračun varijacija oko centralnih vrednosti.centralnih vrednosti.

Centralne vrednosti na ovim tačkastim dijgramima su iste, ali rasipanje podataka oko tih vrednosti se razlikuje

Page 31: Statistika Vladimir S

31

Kako je srednja vrednost mera centra varijacija Kako je srednja vrednost mera centra varijacija individualnih podataka od centra predstavljena individualnih podataka od centra predstavljena je njihovim odstupanjem od srednje vrednostije njihovim odstupanjem od srednje vrednosti..

x-xuzorka vred. sred.-elem. pojedinogvred.odstupanje

Za skup podataka 3,5,7,7,8 imamo da je:

Tako da se odstupanja dobijaju oduzimanjem broja 6 od svake pojedinačne vrednosti elementa.

65/305/87753 x

Page 32: Statistika Vladimir S

32

Elementi Elementi uzorkauzorka

xx

Odstupanje Odstupanje

x-xx-x

33

55

77

77

88

-3-3

-1-1

11

11

22

Page 33: Statistika Vladimir S

33

Odstupanje i varijansa Odstupanje i varijansa uzorkauzorka

11

odstupanja kvadrata suma

uzorka Varijansa

naziva se koja velicinanova se uvodi

odstupanja znake lieleiminisa Dabi

0

1

2

2

n

xx

ns

xxodstupanja

n

ii

i

Page 34: Statistika Vladimir S

34

Primer: Izračunati Primer: Izračunati varijansu uzorka za skup varijansu uzorka za skup

3,5,7,7,83,5,7,7,8

Za ovaj skup, n=5.Za ovaj skup, n=5. RačunamoRačunamo

Srednju vrednostSrednju vrednostPojedinačna odstupanja svih Pojedinačna odstupanja svih elemenataelemenata

Sumu kvadrata odstupanjaSumu kvadrata odstupanjaVarijansu uzorka Varijansu uzorka

Page 35: Statistika Vladimir S

35

Tabelarni prikaz rezultataTabelarni prikaz rezultataKvad. odst.odstupanjeElementi uzorka

Page 36: Statistika Vladimir S

36

Standardna devijacija-Standardna devijacija-standardno odstupanjestandardno odstupanje

Računanje varijanse podrazumeva Računanje varijanse podrazumeva sumu kvadrata, pa se dešava da takva sumu kvadrata, pa se dešava da takva vrsta merenja odstupanja rezultate vrsta merenja odstupanja rezultate daje u mernim jedinicama koje su daje u mernim jedinicama koje su kvadrirane. kvadrirane.

Merenje mase-odstupanja u kgMerenje mase-odstupanja u kg22.. Da bi se to izbeglo, uvodi se pojam Da bi se to izbeglo, uvodi se pojam

standardne devijacije.standardne devijacije. 1

varijanse 1

2

n

xxs

n

ii

Page 37: Statistika Vladimir S

37

Primer: Primer: Izračunati Izračunati standardno standardno odstupanje odstupanje za uzorak za uzorak

1,4,5,9,11. 1,4,5,9,11.

Nacrtati Nacrtati tačkaste tačkaste

dijagrame dijagrame za ovaj i za za ovaj i za

skup skup podataka podataka 3,5,7,7,83,5,7,7,8

Tačkasti dijagrami

Izračunavanje s

Page 38: Statistika Vladimir S

38

Alternativni izraz za varijansu Alternativni izraz za varijansu uzorkauzorka

n

xx

ns i

i

2

22

1

1

Izraz koji ne zahteva računanje individualnih odstupanja

Skraćuje postupak, naročito ako je srednja vrednost broj sa više decimala

Page 39: Statistika Vladimir S

39

Primer:U psihološkom eksperimentu Primer:U psihološkom eksperimentu mereno je vreme reakcije 6 mereno je vreme reakcije 6

pacijenata na odredjenu stimulaciju. pacijenata na odredjenu stimulaciju. Vremena reakcije su u sekundama Vremena reakcije su u sekundama

bila 4,2,3,3,6,3. Izračunati bila 4,2,3,3,6,3. Izračunati standardnu devijaciju.standardnu devijaciju.

Page 40: Statistika Vladimir S

40

ZaključakZaključak Odstupanje uključuje i znak ispred svoje vrednosti.Odstupanje uključuje i znak ispred svoje vrednosti. Varijansa uzorka- eliminiše znak odstupanja, ali Varijansa uzorka- eliminiše znak odstupanja, ali

iskazuje kvadrirane vrednosti mernih jedinica iskazuje kvadrirane vrednosti mernih jedinica elemenata uzorka. elemenata uzorka.

Standardna devijacija-eliminiše kvadrate vrednosti Standardna devijacija-eliminiše kvadrate vrednosti mernih jedinica.mernih jedinica.

Standardna devijacija se može posmatrati kao Standardna devijacija se može posmatrati kao opseg u kome leže podaci u odnosu na srednju opseg u kome leže podaci u odnosu na srednju vrednost.vrednost.

s

s

s

3xintervalu u se nalazi podataka 99,7%

2xintervalu u se nalazi podataka 95%

xintervalu u se nalazi podataka 68%

ivnoaproksimat

:zvona tiparaspodele Za

Page 41: Statistika Vladimir S

41

Druge mere varijacijeDruge mere varijacije Opseg uOpseg uzorka povremeno se koristi kao izraz za varijaciju-odstupanje.zorka povremeno se koristi kao izraz za varijaciju-odstupanje. opseg uzorka=najveća vrednost el.-najmanja vrednost el.opseg uzorka=najveća vrednost el.-najmanja vrednost el.

najmanja vrednost=52,0najmanja vrednost=52,0 najveća vrednost =77,1najveća vrednost =77,1 opseg uzorka (OU)=77,1-52,0 dBopseg uzorka (OU)=77,1-52,0 dB

Page 42: Statistika Vladimir S

42

Kao mera rasejanja-rasturanja Kao mera rasejanja-rasturanja podataka opseg uzorka ima dve podataka opseg uzorka ima dve najznačajnije osobine:najznačajnije osobine: izuzetno ga je lako izračunati i izuzetno ga je lako izračunati i

interpretirati.interpretirati. Ozbiljni nedostaci potiču iz prevelike Ozbiljni nedostaci potiču iz prevelike

osetljivosti na suviše veliki ili suviše osetljivosti na suviše veliki ili suviše mali broj podataka u uzorku.mali broj podataka u uzorku.

Zaobilazi informacije sadržane u Zaobilazi informacije sadržane u rasejanju podataka unutar samog rasejanju podataka unutar samog uzorka.uzorka.

Page 43: Statistika Vladimir S

43

Za bolje rešavanje ovih nedostataka Za bolje rešavanje ovih nedostataka napravljen je kompromis merenjem intervala napravljen je kompromis merenjem intervala izmedju prvog i trećeg kvartila.izmedju prvog i trećeg kvartila.

interkvartilni opseg uzorka=treći kvartil-prvi interkvartilni opseg uzorka=treći kvartil-prvi kvartil (IOU)kvartil (IOU)

ovaj opseg reprezentuje dužinu intervala koji ovaj opseg reprezentuje dužinu intervala koji je pokriven centralnom polovinom podataka.je pokriven centralnom polovinom podataka.

ovaj tip mere odstupanja se često koristi u ovaj tip mere odstupanja se često koristi u izveštajima vlade kada se radi o nekim izveštajima vlade kada se radi o nekim raspodelama koje imaju veliki broj podataka u raspodelama koje imaju veliki broj podataka u jednom pravcu.jednom pravcu.

Ovo se kombinuje sa standardnom Ovo se kombinuje sa standardnom devijacijom.devijacijom.

Page 44: Statistika Vladimir S

44

PrimerPrimer

Izračunati interkvartilni opseg Izračunati interkvartilni opseg uzorka iz tabele saobraćajne buke.uzorka iz tabele saobraćajne buke.

U ranijem primeru izračunati su prvi U ranijem primeru izračunati su prvi i treći kvartil: Qi treći kvartil: Q11=57,2 dB i Q=57,2 dB i Q33=64,6 =64,6 dB.dB.

Sada je Sada je

IOU= QIOU= Q3 3 - Q- Q11= 64,6 dB - 57,2 dB=7,4 = 64,6 dB - 57,2 dB=7,4 dB dB

Page 45: Statistika Vladimir S

45

Pravougaoni (box) Pravougaoni (box) dijagramidijagrami U poslednje vreme se često upotrebljavaju i U poslednje vreme se često upotrebljavaju i

predstavljaju sumarnu sliku informacija izraženih u predstavljaju sumarnu sliku informacija izraženih u kvartilima.kvartilima.

Glavno obeležje su pet značajnih vrednosti: Glavno obeležje su pet značajnih vrednosti: minimalna vrednost elminimalna vrednost el., ., prvi kvartilprvi kvartil, , drugi kvartildrugi kvartil, , treći kvartil, treći kvartil, maksimalna vrednost elementamaksimalna vrednost elementa. .

Centralna polovina podataka izmedju prvog i trećeg Centralna polovina podataka izmedju prvog i trećeg kvartila predstavlja se pravougaonikom i medijalnom kvartila predstavlja se pravougaonikom i medijalnom linijom unutar pravougaonika.linijom unutar pravougaonika.

Izvan pravougaonika se produžava linija od QIzvan pravougaonika se produžava linija od Q33 do do maksimalne vrednosti i od Qmaksimalne vrednosti i od Q11 do minimalne do minimalne vrednosti.vrednosti.

Page 46: Statistika Vladimir S

46

Slika predstavlja box dijagram Slika predstavlja box dijagram za podatke iz tabele za podatke iz tabele saobraćajne bukesaobraćajne buke

Box dijagrami su naročito pogodni za prikaz Box dijagrami su naročito pogodni za prikaz nekoliko različitih uzoraka, što omogućava bolje nekoliko različitih uzoraka, što omogućava bolje uporedjivanje njihovih podataka.uporedjivanje njihovih podataka.

50 60 70 80

Q1 Q2 Q3

Page 47: Statistika Vladimir S

47

Slika prikazuje iznos reflektovane Slika prikazuje iznos reflektovane svetlosti u infracrvenoj oblasti svetlosti u infracrvenoj oblasti snimljenoj iz satelita iznad šumskih i snimljenoj iz satelita iznad šumskih i urbanih predela.urbanih predela.

120

110

100

90

80

70

60

Šumski predeli Urbani predeli

Page 48: Statistika Vladimir S

48

Provera stabilnosti podataka duž Provera stabilnosti podataka duž vremenskog periodavremenskog perioda

Izračunavanje srednje vrednosti i varijanse uzorka tretira sve Izračunavanje srednje vrednosti i varijanse uzorka tretira sve podatke podjednako ne vodeći pri tome računa o nekoj podatke podjednako ne vodeći pri tome računa o nekoj vremenskoj raspodeli ili o njihovoj promeni tokom nekog vremenskoj raspodeli ili o njihovoj promeni tokom nekog vremenskog perioda. To spada u vrstu obrade podataka koji vremenskog perioda. To spada u vrstu obrade podataka koji su stabilni (ili je pak njihova promena stalna) tokom nekog su stabilni (ili je pak njihova promena stalna) tokom nekog vremena, i takav proces pos-matranja podataka je vremena, i takav proces pos-matranja podataka je statistički statistički kontrolisankontrolisan. .

Da bi se proverila stabilnost podataka duž nekog vremenskog Da bi se proverila stabilnost podataka duž nekog vremenskog intervala podaci se moraju grafički predstaviti u zavisnosti od intervala podaci se moraju grafički predstaviti u zavisnosti od vremena, ili bar po redosledu po kome su dobijani ili vremena, ili bar po redosledu po kome su dobijani ili posmatrani.posmatrani.

Rezultujući grafik takvog tipa se naziva vremenski graf ili Rezultujući grafik takvog tipa se naziva vremenski graf ili graf vremenske serije. Takav graf pokazuje da li su podaci graf vremenske serije. Takav graf pokazuje da li su podaci stabilni i da li postoji nekakav stabilni i da li postoji nekakav trendtrend promene tokom vremena. promene tokom vremena.

Page 49: Statistika Vladimir S

49

PrimerPrimer Jedna policijska stanica je posmatrala broj prekovremenih Jedna policijska stanica je posmatrala broj prekovremenih

sati rada na posebnim slučajevima kao što su velike pljačke, sati rada na posebnim slučajevima kao što su velike pljačke, pokušaji ubistva itd. Iako takvi dogadjaji nisu predvidljivi pokušaji ubistva itd. Iako takvi dogadjaji nisu predvidljivi pokazalo se da postoji odredjena konstantnost kada se pokazalo se da postoji odredjena konstantnost kada se podaci grupišu duž vremenskog perioda od šest meseci.podaci grupišu duž vremenskog perioda od šest meseci.

Vrednosti prekovremenih sati rada na posebnim Vrednosti prekovremenih sati rada na posebnim slučajevima u prethodnih osam godina su:slučajevima u prethodnih osam godina su:

2200 875 957 1758 868 398 1603 5232200 875 957 1758 868 398 1603 523

2034 1136 5326 1658 1945 344 807 12232034 1136 5326 1658 1945 344 807 1223 Nacrtati vremenski dijagramNacrtati vremenski dijagram..

Page 50: Statistika Vladimir S

50Period od šest meseci

Pre

kovr

emen

i rad

(u

sati

ma)

Page 51: Statistika Vladimir S

51

Primer Primer Robna razmena izmedju SAD i Japana može se Robna razmena izmedju SAD i Japana može se

meriti prema kursu dolar/jen, odnosno brojem meriti prema kursu dolar/jen, odnosno brojem jena za koji se može kupiti jedan dolar. Iako su jena za koji se može kupiti jedan dolar. Iako su te promene dnevne, dati su podaci za celu te promene dnevne, dati su podaci za celu godinu.godinu.

Nacrtati vremenski dijagram i proveriti Nacrtati vremenski dijagram i proveriti stabilnost podataka.stabilnost podataka.

godina

kurs

Page 52: Statistika Vladimir S

52

godina

kurs

Page 53: Statistika Vladimir S

53

Sa grafika se može uočiti da postoji opadajući trend Sa grafika se može uočiti da postoji opadajući trend duž vremena tako da kurs dolar/jen svakako nije u duž vremena tako da kurs dolar/jen svakako nije u statističkoj kontroli. Dolar je kupovan za manje statističkoj kontroli. Dolar je kupovan za manje jena sa prolaskom vremena izmedju 85. i 95. jena sa prolaskom vremena izmedju 85. i 95. godine. godine.

Proizvodjači imaju potrebu za posmatranjem Proizvodjači imaju potrebu za posmatranjem kritičnih dimenzija, temperatura, i drugih kritičnih dimenzija, temperatura, i drugih parametara, i ako parametri variraju, te varijacije parametara, i ako parametri variraju, te varijacije moraju biti u nekom dozvoljenom intervalu.moraju biti u nekom dozvoljenom intervalu.

Za takve potrebe pravi se tzv. kontrolni graf koji Za takve potrebe pravi se tzv. kontrolni graf koji omogućava vizuelnu inspekciju podataka ili omogućava vizuelnu inspekciju podataka ili varijacije podataka.varijacije podataka.

Page 54: Statistika Vladimir S

54

Pre

kovr

emen

i rad

(u

sati

ma)

Period od šest meseci

Page 55: Statistika Vladimir S

55

ProuProučavanje čavanje podataka sa više podataka sa više

promenljivih promenljivih obeležjaobeležja

Page 56: Statistika Vladimir S

56

Jedinjenja Jedinjenja ugljo-ugljo-

vodonika na vodonika na mesecu mesecu

Po dolasku Apola na Po dolasku Apola na mesec, naučnici su mesec, naučnici su tražili od astronauta tražili od astronauta da sakupe što više da sakupe što više uzoraka kamenja koje uzoraka kamenja koje bi poneli na zemlju bi poneli na zemlju radi ispitivanja radi ispitivanja hemijskog sastava. hemijskog sastava. Naročito je bilo važno Naročito je bilo važno ispitati sadržaj i ispitati sadržaj i učešće ugljovodonika.učešće ugljovodonika.

Page 57: Statistika Vladimir S

57

UvodUvod

Do sada - proučavani podaci sa jednim Do sada - proučavani podaci sa jednim obeležjem, jednom promenljivom. obeležjem, jednom promenljivom.

Posmatranja dve ili više promenljivih se Posmatranja dve ili više promenljivih se često beleže za individualne jedinice uzorka, često beleže za individualne jedinice uzorka, npr. težina i visina osoba, ili broj golova koje npr. težina i visina osoba, ili broj golova koje je jedan tim postigao ili primio. je jedan tim postigao ili primio.

Proučavanjem više ovakvih promenljivih teži Proučavanjem više ovakvih promenljivih teži se pronalasku neke eventualne povezanosti se pronalasku neke eventualne povezanosti izmedju njih, i da li neka od njih možda ima izmedju njih, i da li neka od njih možda ima značajnijeg uticaja na ostale.značajnijeg uticaja na ostale.

Page 58: Statistika Vladimir S

58

Primeri ilustracije konceptaPrimeri ilustracije koncepta Slučajevi nekih ispitivanja po dve karakteristike u Slučajevi nekih ispitivanja po dve karakteristike u

posebnim jedinicama uzorka:posebnim jedinicama uzorka: pol i hobi studenata nekog univerzitetapol i hobi studenata nekog univerziteta količina cigara iskorišćenih na dan i kapacitet pluća količina cigara iskorišćenih na dan i kapacitet pluća

odraslih osobaodraslih osoba starost neke aeroflote i vreme potrebno za reparacijustarost neke aeroflote i vreme potrebno za reparaciju

Karakteristike – obeležja koja se posmatraju mogu biti Karakteristike – obeležja koja se posmatraju mogu biti obe numeričkog, obe opisnog ili po jedna od oba tipa.obe numeričkog, obe opisnog ili po jedna od oba tipa. Numerička obeležja su npr. broj cigara, starost Numerička obeležja su npr. broj cigara, starost

aviona neke aeroflote aviona neke aeroflote Opisna obeležja npr. Pol, hobi, boja kose, boja kože i Opisna obeležja npr. Pol, hobi, boja kose, boja kože i

dr.dr.

Page 59: Statistika Vladimir S

59

Kada se dve osobine posmatraju za Kada se dve osobine posmatraju za individualne jedinice uzoraka i svaka individualne jedinice uzoraka i svaka osobina se beleži nekim kvalitativnim osobina se beleži nekim kvalitativnim kategorijama, onda rezultijući podaci mogu kategorijama, onda rezultijući podaci mogu biti skupljeni u formi tabele sa dvostrukom biti skupljeni u formi tabele sa dvostrukom frekvencijom. Kategorije za jedno obeležje frekvencijom. Kategorije za jedno obeležje se markiraju uz levu marginu, za drugo uz se markiraju uz levu marginu, za drugo uz gornju marginu a frekvencije se beleže u gornju marginu a frekvencije se beleže u ćelije tabele. Tabela se naziva unakrsno-ćelije tabele. Tabela se naziva unakrsno-klasifikovana, ili tabela unakrsnih klasifikovana, ili tabela unakrsnih vrednosti.vrednosti.

Sažimanje podataka sa više Sažimanje podataka sa više promenljivihpromenljivih

Page 60: Statistika Vladimir S

60

PrimerPrimer Eksperiment je radjen sa 400 osoba kojima Eksperiment je radjen sa 400 osoba kojima

su postavljana pitanja koja se tiču njihovog su postavljana pitanja koja se tiču njihovog učešća u sindikatu i njihovog stava prema učešća u sindikatu i njihovog stava prema smanjenju budžeta u svrhe socijalnih smanjenju budžeta u svrhe socijalnih programa. programa.

Pokazalo se da su njih 176 članovi Pokazalo se da su njih 176 članovi sindikata. Od tih 176, 112 je dalo podršku sindikata. Od tih 176, 112 je dalo podršku budžetu, 36 je ostalo uzdržano a 28 su bili budžetu, 36 je ostalo uzdržano a 28 su bili protiv.protiv.

Potrebno je proračunati i formirati Potrebno je proračunati i formirati raspodelu odgovora na odredjena pitanja. raspodelu odgovora na odredjena pitanja. To se postiže, u prvom stepenu To se postiže, u prvom stepenu proračunom relativnih frekvenci ćelija.proračunom relativnih frekvenci ćelija.

Page 61: Statistika Vladimir S

61

Unakrsno-klasifikovana Unakrsno-klasifikovana tabelatabela

podržapodržava va

budžetbudžet

uzdržauzdržanono

ne ne podržapodrža

va va budžetbudžet

ukupnukupnoo

član član sindikasindika

tata112112 3636 2828 176176

nije nije član član

sindikasindikatata

8484 6868 7272 224224

ukupnukupnoo

196196 104104 100100 400400

Page 62: Statistika Vladimir S

62

Računanje relativnih Računanje relativnih frekvencifrekvenci

Za ovakav proračun podelićemo vrednost Za ovakav proračun podelićemo vrednost frekvencije svake ćelije sa ukupnim brojem frekvencije svake ćelije sa ukupnim brojem ispitanika – 400.ispitanika – 400.

U zavisnosti specificiranih zahteva unakrsne U zavisnosti specificiranih zahteva unakrsne klasifikacije može se zahtevati proračun klasifikacije može se zahtevati proračun ćelijskih frekvencija u odnosu na ukupne ćelijskih frekvencija u odnosu na ukupne marginalne vrednosti. Može se zahtevati marginalne vrednosti. Može se zahtevati poredjenje stava prema budžetu članova poredjenje stava prema budžetu članova sindikata sa onima koji nisu članovi. To se sindikata sa onima koji nisu članovi. To se postiže računanjem odgovarajućih relativnih postiže računanjem odgovarajućih relativnih frakvenci, i formiraju se dve tabele. frakvenci, i formiraju se dve tabele.

Page 63: Statistika Vladimir S

63

Tabela relativnih Tabela relativnih frekvencija podataka u frekvencija podataka u

odnosu na sve ispitanikeodnosu na sve ispitanikepodržavpodržav

a a budžetbudžet

uzdržanuzdržanoo

ne ne podržavpodržav

a a budžetbudžet

ukupnoukupno

član član sindikatsindikat

aa0,280,28 0,090,09 0,070,07 0,440,44

nije nije član član

sindikatsindikataa

0,210,21 0,170,17 0,180,18 0,560,56

ukupnoukupno 0,490,49 0,260,26 0,250,25 1,001,00

Page 64: Statistika Vladimir S

64

Tabela sa relativnim Tabela sa relativnim frekvencijama u odnosu na frekvencijama u odnosu na

ukupne marginalne ukupne marginalne vrednosti prema članstvu u vrednosti prema članstvu u

sindikatusindikatupodržapodrža

va va budžetbudžet

uzdržauzdržanono

ne ne podržapodrža

va va budžetbudžet

ukupnoukupno

član član sindikasindika

tata0,6360,636 0,2050,205 0,1590,159 1,001,00

nije nije član član

sindikasindikatata

0,3750,375 0,3040,304 0,3210,321 1,001,00

Page 65: Statistika Vladimir S

65

Iz prethodne tabele- različiti stavovi Iz prethodne tabele- različiti stavovi prema budžetu izmedju dve grupacije prema budžetu izmedju dve grupacije sindikalaca i nesindikalaca. sindikalaca i nesindikalaca.

Podrška budžetu je jača medju Podrška budžetu je jača medju članovima sindikata nego medju onima članovima sindikata nego medju onima koji to nisu.koji to nisu.

Jedno od pitanja je: Da li ove Jedno od pitanja je: Da li ove posmatrane razlike samo trenutna posmatrane razlike samo trenutna slučajnost takvog uzorka ili zaista slučajnost takvog uzorka ili zaista postoje znatne razlike u stavu izmedju postoje znatne razlike u stavu izmedju gradjana koji su članovi sindikata i onih gradjana koji su članovi sindikata i onih koji to nisu?koji to nisu?

Page 66: Statistika Vladimir S

66

Paradox SimpsonaParadox SimpsonaU tabeli 1. su prikazani rezultati sa prijemnog ispita nekog univerziteta. Potrebno je proveriti da li su bolje rezultate na prijemnom ispitu postigli muškarci ili devojke.

Tabela 2. je tabela relativnih frekvencija polganja prijemnog ispita prema polu kandidata.

Page 67: Statistika Vladimir S

67

Tabela 2Tabela 2 PrimljeniPrimljeniNisu Nisu

primljeniprimljeni UKUPNOUKUPNO

MuškarciMuškarci 0,4180,418 0,5810,581 1,001,00

DevojkeDevojke 0,3120,312 0,6870,687 1,001,00

TabelaTabela 1 1 Primljeni Primljeni Nisu Nisu

primljeniprimljeni UKUPNOUKUPNO

MuškarciMuškarci 223223 557557

DevojkeDevojke

UKUPNOUKUPNO 321321 839839

324

88 282

518

194

Page 68: Statistika Vladimir S

68

Prema poslednjoj - tabeli 2. relativnih Prema poslednjoj - tabeli 2. relativnih frekvenci onih koji su položili prijemni prema frekvenci onih koji su položili prijemni prema polu kandidata, čini se da su uspešnije polu kandidata, čini se da su uspešnije prijemni uradili muškarci, jer je 41,8% od svih prijemni uradili muškarci, jer je 41,8% od svih muškaraca položilo prijemni, dok je od svih muškaraca položilo prijemni, dok je od svih devojaka, samo 31,2% položilo prijemni.devojaka, samo 31,2% položilo prijemni.

Medjutim, ako se posmatra uspeh prema Medjutim, ako se posmatra uspeh prema polaganju prijemnog ispita po smerovima, polaganju prijemnog ispita po smerovima, kojih ima dva, elektronika i umetnost, tada kojih ima dva, elektronika i umetnost, tada dolazimo do drugačijeg zaključka. dolazimo do drugačijeg zaključka.

Neka su u sledećim tabelama predstavljeni Neka su u sledećim tabelama predstavljeni podaci o uspehu na prijemnom prema podaci o uspehu na prijemnom prema smerovima, a u skladu sa brojkama iz tabele smerovima, a u skladu sa brojkama iz tabele 1.1.

Page 69: Statistika Vladimir S

69

ElektronikaElektronika Primljeni Primljeni Nisu Nisu

primljeniprimljeni UKUPNOUKUPNO

MuškarciMuškarci 151151 3535 186186

DevojkeDevojke 1616 22 1818

UKUPNOUKUPNO 167167 3737 204204

IstorijaIstorija Primljeni Primljeni Nisu Nisu

primljeniprimljeni UKUPNOUKUPNO

MuškarciMuškarci 8282 289289 371371

DevojkeDevojke 7272 192192 264264

UKUPNOUKUPNO 154154 481481 635635

Tabela 3.

Tabela 4.

Page 70: Statistika Vladimir S

70

ElektronikElektronikaa

Primljeni Primljeni Nisu Nisu

primljeniprimljeni UKUPNOUKUPNO

MuškarciMuškarci 0,8120,812 0,1880,188 1,001,00

DevojkeDevojke 0,8890,889 0,120,12 1,001,00

IstorijaIstorija Primljeni Primljeni Nisu Nisu

primljeniprimljeni UKUPNOUKUPNO

MuškarciMuškarci 0,220,22 0,780,78 1,001,00

DevojkeDevojke 0,270,27 0,730,73 1,001,00

Tabela 3.

Tabela 4.

Page 71: Statistika Vladimir S

71

Na osnovu prethodne dve tabele vidi se Na osnovu prethodne dve tabele vidi se da su i na smeru elektronika (0,889) i na da su i na smeru elektronika (0,889) i na smeru istorije (0,27) devojke uspešnije smeru istorije (0,27) devojke uspešnije uradile prijemni ispit.uradile prijemni ispit.

Ovakva mogućnost donošenja različitog Ovakva mogućnost donošenja različitog

zaključka u zavisnosti kako su podaci zaključka u zavisnosti kako su podaci predstavljeni tabelama unakrsnih predstavljeni tabelama unakrsnih vrednosti, naziva se Simpsonov vrednosti, naziva se Simpsonov paradoks.paradoks.

Page 72: Statistika Vladimir S

72

Zadatak 1Zadatak 1 Mineralna voda Mineralna voda iizz 18 izvora klasifikovana je 18 izvora klasifikovana je

kao nisko ili visoko alkalna i sa manjim ili kao nisko ili visoko alkalna i sa manjim ili većim sadržajem gvoždja. Sa visokim većim sadržajem gvoždja. Sa visokim alkalitetom procenjeno je 9 izvora, 6 je sa alkalitetom procenjeno je 9 izvora, 6 je sa većim sadržajem gvoždja, 5 ima obe visoke većim sadržajem gvoždja, 5 ima obe visoke vrednosti i alkalitet i gvoždje.vrednosti i alkalitet i gvoždje.

Formirati tabelu dvostrukih vrednostiFormirati tabelu dvostrukih vrednosti Izračunati relativne frekvencije ćelija.Izračunati relativne frekvencije ćelija. Izračunati relativne frekvencije prema Izračunati relativne frekvencije prema

ukupnom alkalitetu. ukupnom alkalitetu. Izračunati relativne frekvencije prema Izračunati relativne frekvencije prema

ukupnom sadržaju gvoždja. ukupnom sadržaju gvoždja.

Page 73: Statistika Vladimir S

73

Veći Veći sadržaj Fesadržaj Fe

Manji Manji sadržaj Fesadržaj Fe UKUPNOUKUPNO

Visok Alk.Visok Alk. 0,280,28 0,220,22 0,50,5

Nizak Alk.Nizak Alk. 0,050,05 0,440,44 0,50,5

UKUPNOUKUPNO 0,330,33 0,660,66 1,001,00

Veći sadržaj Veći sadržaj Fe Fe

Manji Manji sadržaj Fesadržaj Fe UKUPNOUKUPNO

Visok Alk.Visok Alk. 55 99

Nizak Alk.Nizak Alk.

UKUPNOUKUPNO 66 1818

4

1 9

12

8

Page 74: Statistika Vladimir S

74

Veći Veći sadržaj Fesadržaj Fe

Manji Manji sadržaj Fesadržaj Fe UKUPNOUKUPNO

Visok Alk.Visok Alk. 0,550,55 0,440,44 1,001,00

Nizak Alk.Nizak Alk. 0,110,11 0,880,88 1,001,00

Veći Veći sadržaj Fesadržaj Fe

Manji Manji sadržaj Fesadržaj Fe

Visok Alk.Visok Alk. 0,830,83 0,330,33

Nizak Alk.Nizak Alk. 0,160,16 0,660,66

UKUPNOUKUPNO 1,001,00 1,001,00

Page 75: Statistika Vladimir S

75

Zadatak 2Zadatak 2

Obavljen je razObavljen je razgovor sa 185 osoba, govor sa 185 osoba, koje su bile pod nekim stresom. Njih koje su bile pod nekim stresom. Njih 76 su alkoholičari (alkosi), 81 je 76 su alkoholičari (alkosi), 81 je depresivnog raspoloženja, 54 osobe depresivnog raspoloženja, 54 osobe su pod oba uticaja.su pod oba uticaja.

Formirati dvostruku tabelu Formirati dvostruku tabelu frekvenci.frekvenci.

Izračunati relativne frekvence za Izračunati relativne frekvence za ćelije tabelećelije tabele

Page 76: Statistika Vladimir S

76

AlkoholikAlkoholikNije Nije

alkoholikalkoholik UKUPNOUKUPNO

DepresivanDepresivan 5454 8181

Nije Nije depres.depres.

UKUPNOUKUPNO 7676 185185

AlkoholikAlkoholikNije Nije

alkoholikalkoholik UKUPNOUKUPNO

DepresivanDepresivan 0,290,29 0,140,14 0,430,43

Nije Nije depres.depres. 0,110,11 0,440,44 0,560,56

UKUPNOUKUPNO 0,410,41 0,580,58 1,001,00

27

22 104

109

82

Page 77: Statistika Vladimir S

77

U tabeli su dati podaci za broj kazni za nepropisno U tabeli su dati podaci za broj kazni za nepropisno parkiranje u 30 ulica u gradu. Kreirati Tabelu parkiranje u 30 ulica u gradu. Kreirati Tabelu frekvencija i relativnih frekvencija i prikazati podatke frekvencija i relativnih frekvencija i prikazati podatke histogramom histogramom

11 22 11 33 44 00 00 11 22 33

22 55 11 22 11 00 00 11 00 22

00 22 66 55 33 22 33 11 11 00

Zadatak

Page 78: Statistika Vladimir S

78

U tabeli su dati podaci o broju kupaca i broju U tabeli su dati podaci o broju kupaca i broju artikala kupljenih u jednom supermarketu tokom artikala kupljenih u jednom supermarketu tokom jednog dana. Predstaviti podatke histogramom. jednog dana. Predstaviti podatke histogramom. Izračunati modu i medijanuIzračunati modu i medijanu..

Broj Broj artikalaartikala

Broj Broj kupacakupaca

0-50-5

5-105-10

10-1510-15

15-2015-20

20-2520-25

25-3025-30

30-3530-35

35-4035-40

2525

2020

2828

3434

3030

2222

1111

55

Zadatak

Page 79: Statistika Vladimir S

79

TraTraži se pži se procena brzine rasta nekih biljaka u rocena brzine rasta nekih biljaka u odnosu na tip soli koji se koristi u njihovoj odnosu na tip soli koji se koristi u njihovoj ishraniishrani. Podaci su dati u Tabeli 1.. Podaci su dati u Tabeli 1.

Tip soli

Rast A B C

Dobar 16 8 14

Srednji 31 16 21

Odličan 18 36 25

65 60 60

Izračunati relativne frekvencije svih ćelija i uporediti kvalitet rasta sa pojedinim tipovima soli.

Zadatak

Page 80: Statistika Vladimir S

80

Za 60 automobila u nekom salonu dobijeni su Za 60 automobila u nekom salonu dobijeni su sledeći podaci:sledeći podaci: 8 automobila ima manuelni menjač i pogon 8 automobila ima manuelni menjač i pogon

sa dizel motoromsa dizel motorom 30 automobila ima automatski menjač i 30 automobila ima automatski menjač i

pogon sa benzinskim motorompogon sa benzinskim motorom 40 automobila ima benzinski motor40 automobila ima benzinski motor

a) Odrediti ukupne marginalne vrednosti prema tipu menjača i vrsti pogona

b) Kreirati tabelu relativnih frekvenci

c) Izračunati relativne frekvence prema svakom od obeležja

Page 81: Statistika Vladimir S

81

Linearna Linearna regresijaregresija

Page 82: Statistika Vladimir S

82

Istraživanje zavisnosti Istraživanje zavisnosti izmedju dve promenljive (izmedju dve promenljive (xx i i

yy)) Prvi korak- predstavljanje Prvi korak- predstavljanje nn parova ( parova (x,yx,y) na ) na

rasutom dijagramu.rasutom dijagramu. Ako postoji mogućnost aproksimacije Ako postoji mogućnost aproksimacije

(predstavljanja) skupa svih tačaka na (predstavljanja) skupa svih tačaka na dijagramu, koje potiču od parova (dijagramu, koje potiču od parova (x,yx,y), jednom ), jednom pravom linijom, tadapravom linijom, tada mo možemo definisati žemo definisati linearnu zavisnost medju promenljivim linearnu zavisnost medju promenljivim xx i i y.y.

U tom slučaju moguće je odrediti parametre U tom slučaju moguće je odrediti parametre linearne regresije (regresija linearne regresije (regresija yy od od xx), koji na ), koji na najbolji način opisuju linearnu zavisnost dvaju najbolji način opisuju linearnu zavisnost dvaju promenljivih.promenljivih.

Ovakva vrsta regresije je sa jednom Ovakva vrsta regresije je sa jednom promenljivom, jer je promenljivom, jer je yy zavisno samo od zavisno samo od promenljive promenljive x.x.

Page 83: Statistika Vladimir S

83

Prava linearne regresijePrava linearne regresije Matematički izraz koji predstavlja linearnu Matematički izraz koji predstavlja linearnu

regresijuregresiju

xx- nezavisna, ulazna promenljiva- nezavisna, ulazna promenljiva y-y- zavisna, izlazna promenljiva. zavisna, izlazna promenljiva.

Ovo je, ustvari, vrednost koja se očekuje Ovo je, ustvari, vrednost koja se očekuje za promenljivu za promenljivu yy kada je poznata kada je poznata vrednost promenljive vrednost promenljive xx

Čest naziv zaČest naziv za y- fitovana vrednost y- fitovana vrednost

01 xy

Page 84: Statistika Vladimir S

84

parametar parametar 0 0 predstavlja vrednost odsečka predstavlja vrednost odsečka izmedju koordinatnog početka rasutog izmedju koordinatnog početka rasutog dijagrama, i preseka regresione linije (prave) dijagrama, i preseka regresione linije (prave) sa sa y-y- osom. To je vrednost osom. To je vrednost y,y, kada je kada je xx=0.=0.

parametar parametar 11 predstavlja nagib ili gradijent predstavlja nagib ili gradijent

regresione linije. Opisuje porast promenljive regresione linije. Opisuje porast promenljive y,y, kada se ulazna promenljiva kada se ulazna promenljiva xx promeni za promeni za jediničnu vrednost.jediničnu vrednost.

Parametri Parametri 1 1 i i 0 0 se zajednički nazivaju se zajednički nazivaju koeficijenti linearne regresijekoeficijenti linearne regresije, ili , ili samo samo koeficijenti regresije koeficijenti regresije

01 xy

Page 85: Statistika Vladimir S

85

xy

xx

yyxx

n

yy

n

xx

n

n

n

i

in

i

i

10

1

2i

1ii

1

11

, ,

Računanje Računanje koeficijenata prave koeficijenata prave linearne regresijelinearne regresije

Rezultat – izraz za Rezultat – izraz za linarnu pravu sa linarnu pravu sa konkretnim konkretnim vrednostima, npr.vrednostima, npr.45,0318,2 xy

01 xy

Page 86: Statistika Vladimir S

86

Crtanje regresione linijeCrtanje regresione linije Kada su izračunati parametri Kada su izračunati parametri 11 i i 0 0 , , i dobijen i dobijen

izraz za regresionu pravu, npr. izraz za regresionu pravu, npr.

prelazi se na crtanje te prave na rasuti dijagram.prelazi se na crtanje te prave na rasuti dijagram.

Uzimamo npr. tri vrednosti za promenljivu Uzimamo npr. tri vrednosti za promenljivu x, x, iz iz skupa- uzorkaskupa- uzorka

(x(x11,x,x22,x,x33, ..., x, ..., xkk, x, xk+1k+1,...x,...xmm,..., x,..., xnn), npr. x), npr. x2 2 ,x,xk k i xi xmm . .

Svaku od vrednosti zamenimo u izraz za Svaku od vrednosti zamenimo u izraz za regresionu pravu, i dobijemo tri vrednosti za regresionu pravu, i dobijemo tri vrednosti za promenljivu y (y promenljivu y (y ‘‘,,yy““,,yy'"'"). Ova tri para). Ova tri para (x (x22,,y y ‘‘), (), (xxkk y y ““), (), (xxmm , ,yy '"'" ), ), predstavljaju tačke kroz koje treba predstavljaju tačke kroz koje treba provući liniju koja reprezentuje linearnu regresiju provući liniju koja reprezentuje linearnu regresiju za promenljiveza promenljive x i y. x i y.

45,0318,2 xy

Page 87: Statistika Vladimir S

87

PrimerPrimer

Ispitivano je vreme reakcije Ispitivano je vreme reakcije pacijenata, kojima je u krvotok pacijenata, kojima je u krvotok ubrizgan odredjeni stimulans. ubrizgan odredjeni stimulans.

Vreme- sekundeVreme- sekunde Stimulans- mmStimulans- mm33

Za pet pacijenata zabeleZa pet pacijenata zabeleženi su ženi su sledeći rezultati:sledeći rezultati:

Page 88: Statistika Vladimir S

88

Tabela rezultata ispitivanjaTabela rezultata ispitivanja

Red. Red. Br. Br.

pacijenpacijentata

Količina Količina stimulansstimulansa (mma (mm33))

Vreme Vreme reakcijreakcije (s)e (s)

11

22

33

44

55

11

22

33

44

55

11

11

22

22

44

Page 89: Statistika Vladimir S

89

Rasuti dijagramRasuti dijagram

1 2 3 4 5

1,0

1,5

2,0

2,5

3,0

3,5

4,0

Vre

me

re

akcije

Kolicina stimulansa (mm3)

Page 90: Statistika Vladimir S

90

Regresiona pravaRegresiona prava

1 2 3 4 5

1,0

1,5

2,0

2,5

3,0

3,5

4,0 B Linear Fit of Data1_B

Vre

me

re

akcije

Kolicina stimulansa (mm3)

Page 91: Statistika Vladimir S

91

xxii yyii xxii22 xxiiyyii

11

22

33

44

55

11

11

22

22

44

11

22

99

1616

2525

11

22

66

88

2020

∑∑xxii=15=15 ∑∑yyii=10=10 ∑ ∑ xxii

22=55=55∑ ∑

xxiiyyii=37=37

Tabela sa vrednostima potrebnim za računanje koeficijenata i

Page 92: Statistika Vladimir S

92

xy

n

yx

yxS

n

x

xS

S

S

xx

yyxx

nn

n

xy

n

n

xx

xx

xy

n

n

10

1i

1i

1ii

2

1i

1

2i

1

2i

1ii

1

10

7

Moguća je upotreba jednostavnijih izraza za izračunavanje koeficijenata 1 i kao što je pokazano na slici desno.

Ovakav pristup je brži, jer je moguće koristiti tabele sa manje kolona, čiji se medjuzbirovi koriste za dobijanje krajnje tražene vrednosti

Page 93: Statistika Vladimir S

93

Dat je skup podataka u Tabeli:Dat je skup podataka u Tabeli:

Odrediti koeficente linearne regresije Odrediti koeficente linearne regresije i nacrtati regresionu pravui nacrtati regresionu pravu

PrimerPrimer

xxii yyii

77 22

44 44

66 22

22 55

11 77

11 66

33 55

Page 94: Statistika Vladimir S

94

Page 95: Statistika Vladimir S

95

xxii yyii xxii22 yyii

22 xxiiyyii

77 22 4949 44 1414

44 44 1616 1616 1616

66 22 3636 44 1212

22 55 44 2525 1010

11 77 11 4949 77

11 66 11 3636 66

33 55 99 2525 1515

 ∑ ∑ ∑  ∑   ∑  ∑   ∑  ∑     ∑  ∑

2424 3131 116116 159159 8080

Page 96: Statistika Vladimir S

96

Page 97: Statistika Vladimir S

97

PrimerPrimer Dati su paroviDati su parovi podataka (x,y) podataka (x,y)

(2,5), (1,3), (5,6), (0,2)(2,5), (1,3), (5,6), (0,2), (3,9), (3,9)

NaNaćći koeficijente linearne regresije i izrai koeficijente linearne regresije i izraččunati unati koeficijent korelacije r koeficijent korelacije r

Page 98: Statistika Vladimir S

98

PrimerPrimer

HH 121200

8282 9900

88 3838 2020 2,2,88

6666 2,2,00

2020 8585

CC 101055

111100

9999

2222 5050 5050 7,7,33

7474 7,7,77

4545 5151

Dati su Dati su podaci o vlaznosti vazduha I podaci o vlaznosti vazduha I temperature u nekom hemijskom procesutemperature u nekom hemijskom procesu

Naci koeficijente linearne regresije i Naci koeficijente linearne regresije i izracunati koeficijent korelacije rizracunati koeficijent korelacije r

Page 99: Statistika Vladimir S

99

Ispitni zadatak 1.Ispitni zadatak 1.Skup podataka 24,Skup podataka 24, 31, 72, 35,31, 72, 35, 90, 81, 84, 40, 90, 81, 84, 40, 41, 42, 53, 56, 58, 47, 49, 72, 87, 78, 80, 7941, 42, 53, 56, 58, 47, 49, 72, 87, 78, 80, 79-p-predstaviti stablo-list strukturom. redstaviti stablo-list strukturom. Za ovaj skup:Za ovaj skup:Prvi kvartil iznosi Prvi kvartil iznosi ::Medijana iznosiMedijana iznosi::__________________Treći kvartil iznosiTreći kvartil iznosi::Za ovaj skup 35-ti percentil iznosiZa ovaj skup 35-ti percentil iznosi::

Za ovaj skup podatakaZa ovaj skup podatakaa) ima više modalnih vrednostia) ima više modalnih vrednostib) moda ne postoji b) moda ne postoji c) ima tačno jedna modalna vrednostc) ima tačno jedna modalna vrednostd) ne znamd) ne znam

Page 100: Statistika Vladimir S

100

Ispitni zadatak 2.Ispitni zadatak 2.

Slobodna mestaSlobodna mesta Broj avionaBroj aviona

1-51-5

5-105-10

10-1510-15

15-2015-20

20-25 20-25

22

44

22

11

3 3

Page 101: Statistika Vladimir S

101

Za podatke iz prethodne tabele sa Za podatke iz prethodne tabele sa merodavnom levom granicom klase važi:merodavnom levom granicom klase važi:

Medijana se nalazi u klasi __-__Medijana se nalazi u klasi __-__ Vrednost medijane iznosi______Vrednost medijane iznosi______ Moda se nalazi u klasi ___-___Moda se nalazi u klasi ___-___ Vrednost mode iznosi________Vrednost mode iznosi________ Zaokružiti tačne iskaze:Zaokružiti tačne iskaze: a) Može se odrediti tačan broja aviona sa a) Može se odrediti tačan broja aviona sa

manje od 10 slobodnih mestamanje od 10 slobodnih mesta b) Može se odrediti tačan broj aviona sa b) Može se odrediti tačan broj aviona sa

više od 10 slobodnih mestaviše od 10 slobodnih mesta c) Može se odrediti tačan broj aviona sa 2 c) Može se odrediti tačan broj aviona sa 2

slobodna mestaslobodna mesta d) Može se odrediti tačan broj aviona sa d) Može se odrediti tačan broj aviona sa

manje od 25 slobodnog mesta manje od 25 slobodnog mesta

Page 102: Statistika Vladimir S

102

Ispitni zadatak 3.Ispitni zadatak 3.

Prodaja 20 artikala Prodaja 20 artikala je izražena je izražena tabelom, tako da je tabelom, tako da je leva granica leva granica važeća. Predstaviti važeća. Predstaviti podatke podatke histogramom.histogramom.

Cena Cena (din.)(din.)

Broj Broj komada komada

5-105-10

10-1510-15

15-2015-20

20-2520-25

25-30 25-30

44

22

66

5 5

Page 103: Statistika Vladimir S

103

Ispitni zadatak 4.Ispitni zadatak 4. Od 60 ispitanih osoba, 18 nemaju sopstveni Od 60 ispitanih osoba, 18 nemaju sopstveni

auto, od kojih 10 ima položen vozački ispit, auto, od kojih 10 ima položen vozački ispit, dok je dvostruko više osoba sa položenim dok je dvostruko više osoba sa položenim nego nepoloženim ispitom. nego nepoloženim ispitom.

_______ je procenat vozača koji nemaju ni _______ je procenat vozača koji nemaju ni položen ispit ni auto u odnosu na sve položen ispit ni auto u odnosu na sve ispitanikeispitanike

_______ je procenat vozača sa položenim _______ je procenat vozača sa položenim ispitom i svojim autom u odnosu na sve koji ispitom i svojim autom u odnosu na sve koji imaju svoj autoimaju svoj auto

_______ je procenat vozača sa autom i _______ je procenat vozača sa autom i položenim ispitom u odnosu na sve položenim ispitom u odnosu na sve ispitanikaispitanika

Page 104: Statistika Vladimir S

104

Ispitni zadatak 5.Ispitni zadatak 5. U tabeli su date relativne frekvence prema polu za 60 U tabeli su date relativne frekvence prema polu za 60

ispitanih osoba, od kojih su 40 žene, u pogledu odnosa ispitanih osoba, od kojih su 40 žene, u pogledu odnosa rekreativnog bavljenja sportom i pola (Ž/M).rekreativnog bavljenja sportom i pola (Ž/M).

Upisati tačan broj osobaUpisati tačan broj osoba _______ žena se bavi rekreacijom_______ žena se bavi rekreacijom _______ muškaraca se ne bavi rekreacijom_______ muškaraca se ne bavi rekreacijom _______ osoba se ne bavi rekreacijom_______ osoba se ne bavi rekreacijom _______ osoba se bavi rekreacijom_______ osoba se bavi rekreacijom

Bavi se Bavi se rekreacijorekreacijom m

Ne bavi se Ne bavi se rekreacijorekreacijom m

ŽeneŽene 0,20,2 1,0 1,0

MuškarcMuškarcii

0,7 0,7 1,0 1,0

Page 105: Statistika Vladimir S

105

Ispitni zadatakIspitni zadatakSkup podataka 24,Skup podataka 24, 31, 72, 35,31, 72, 35, 90, 81, 84, 40, 90, 81, 84, 40, 41, 42, 53, 56, 58, 47, 49, 72, 87, 78, 80, 7941, 42, 53, 56, 58, 47, 49, 72, 87, 78, 80, 79-p-predstaviti stablo-list strukturom. redstaviti stablo-list strukturom. Za ovaj skup:Za ovaj skup:Prvi kvartil iznosi Prvi kvartil iznosi ::Medijana iznosiMedijana iznosi::__________________Treći kvartil iznosiTreći kvartil iznosi::Za ovaj skup 35-ti percentil iznosiZa ovaj skup 35-ti percentil iznosi::

Za ovaj skup podatakaZa ovaj skup podatakaa) ima više modalnih vrednostia) ima više modalnih vrednostib) moda ne postoji b) moda ne postoji c) ima tačno jedna modalna vrednostc) ima tačno jedna modalna vrednostd) ne znamd) ne znam

Page 106: Statistika Vladimir S

106

Ispitni zadatakIspitni zadatak

Slobodna mestaSlobodna mesta Broj avionaBroj aviona

1-51-5

5-105-10

10-1510-15

15-2015-20

20-25 20-25

22

55

22

11

3 3

Page 107: Statistika Vladimir S

107

Za podatke iz prethodne tabele sa merodavnom Za podatke iz prethodne tabele sa merodavnom levom granicom klase važi:levom granicom klase važi:

Medijana se nalazi u klasi __-__Medijana se nalazi u klasi __-__ Vrednost medijane iznosi______Vrednost medijane iznosi______ Moda se nalazi u klasi ___-___Moda se nalazi u klasi ___-___ Vrednost mode iznosi________Vrednost mode iznosi________

Zaokružiti tačne iskaze:Zaokružiti tačne iskaze: a) Može se odrediti tačan broja aviona sa manje a) Može se odrediti tačan broja aviona sa manje

od 10 slobodnih mestaod 10 slobodnih mesta b) Može se odrediti tačan broj aviona sa više od b) Može se odrediti tačan broj aviona sa više od

10 slobodnih mesta10 slobodnih mesta c) Može se odrediti tačan broj aviona sa 2 c) Može se odrediti tačan broj aviona sa 2

slobodna mestaslobodna mesta d) Može se odrediti tačan broj aviona sa manje d) Može se odrediti tačan broj aviona sa manje

od 25 slobodnog mesta od 25 slobodnog mesta

Page 108: Statistika Vladimir S

108

Ispitni zadatakIspitni zadatak

Od 20 studenata nekog univerziteta, medju Od 20 studenata nekog univerziteta, medju kojima je 8 žena, 25% od ukupnog broja kojima je 8 žena, 25% od ukupnog broja studenata su žene sa smera umetnosti, 7 studenata su žene sa smera umetnosti, 7 muškaraca je sa smera ekonomije. muškaraca je sa smera ekonomije.

Ukupan procenat studenata smera Ukupan procenat studenata smera umetnosti je:umetnosti je:

Od ukupnog broja muškaraca, umetnost Od ukupnog broja muškaraca, umetnost studira njih____%studira njih____%

Page 109: Statistika Vladimir S

109

Ispitni zadatakIspitni zadatak Za dati rasuti Za dati rasuti

didijjagramagram,, koeficijent koeficijent korelacije korelacije iznosi________iznosi________

Koeficijenti Koeficijenti linearne regresije linearne regresije su su 00=_______ , =_______ ,

11=________=________

-1 0 1 2 3 4 5 6 7 8 9

1

2

3

4

5

Y

X