50
OSNOVI STATISTIČKE ANALIZE III nedelja PREDAVANJA Prvi dvočas: 1. Osnovni pojmovi teorije verovatnoće 2. Slučajna promenljiva, raspodela verovatnoća Drugi dvočas: 3. Očekivana vrednost i varijansa slučajne promenljive 4. Teorijski modeli raspodela VEŽBE 1 Parametri osnovnog skupa Mere centralne tendencije Mere disperzije Mere oblika raspodele

Predavanja iz statistike

Embed Size (px)

DESCRIPTION

predavanja iz osnova statisticke analize

Citation preview

Page 1: Predavanja iz statistike

OSNOVI STATISTIČKE ANALIZE

III nedelja

PREDAVANJA

Prvi dvočas:

1. Osnovni pojmovi teorije verovatnoće

2. Slučajna promenljiva, raspodela verovatnoća

Drugi dvočas:

3. Očekivana vrednost i varijansa slučajne promenljive

4. Teorijski modeli raspodela

VEŽBE

1

Parametri osnovnog

skupa

Mere centralne

tendencije

Mere disperzije

Mere oblika

raspodele

Page 2: Predavanja iz statistike

Mere centralne tendencije

I dvočas:

Primeri koji su obrađeni na vežbama: Primer 1. Kako se ponaša aritmetička sredina ako se: a) svaka vrednost obeležja u rasporedu pomnoži sa 2; b) svakoj vrednosti obeležja doda 4.

Xi: 8 2 4 5 4 3 9 4 5

Rešenje: a) Xi: 8,2,4,5,4,3,9,4,5Yi: 16,4,8,10,8,6,18,8,10mx=4,889my=9,778my=2 mx

Y=2X μY=2 μx

b)Xi: 8,2,4,5,4,3,9,4,5Yi: 12,6,8,9,8,7,13,8,9mx=4,889my=8,889my=4+mx

Y=X+4 μY= μx+4

Primer 2. Modus je:

a) Najveća frekvencija u seriji;b) Najveća vrednost obeležja u seriji;c) Frekvencija kojoj odgovara najveća vrednost obeležja;d) Vrednost koja se nalazi u preseku kumulante ispod i iznad;e) Vrednost obeležja kojoj odgovara najveća frekvencija;f) Obeležje kome odgovara najveća frekvencija.

Rešenje: e)

Primer 3. Anketiranjem svih učenika osmih razreda jedne škole, došlo se do sledećih rezultata u pogledu uspeha. Odredite mere centralne tendencije i odgovorite koja merna skala je korišćena?

2

Page 3: Predavanja iz statistike

Uspeh Broj učenika Odgovor: a) Mo=50, Me=dobar, µ se ne može izračunati, korišćena je ordinalna skala, b) Mo=Me= vrlo dobar, µ se ne može izračunati, korišćena je ordinalna skala, c) Ne mogu se odrediti pozicione mere, jer je korišćena nominalna skala, d) Mo=50, Me=50, µ=31, korišćena je skala odnosa,e) Mo=vrlo dobar, Me=dobar, µ se ne može odrediti, koriščena je ordinalna skala.

Dovoljan 30

Dobar 34

Vrlo dobar 50

Odličan 10

Rešenje: e)

Primer 4:Date su sledeće vrednosti promenljive X:

13, 23, 17, 26, 32, 34, 30.

Pokazati da je suma kvadrata odstupanja od medijane veća od sume kvadrata odstupanja od aritmetičke sredine.

Primer 5.U tabeli su dati podaci o starosnoj strukturi stanovnika. Odredite mere centralne tendencije.

Godine starosti Broj stanovnika10 - 19,9 420 - 29,9 6630 - 39,9 4740 - 49,9 3650 - 59,9 1260 - 69,9 5

Primer 6. Raspolažemo serijom podataka o godinama radnog staža 6 radnika: 10, 8, 8, 5, 4, 7. Koji od sledećih stavova vezanih za ovu seriju JESTE korektan?

a) Posmatrano obeležje je numeričko, mereno na intervalnoj skali;b) Posmatrano obeležje je numeričko, mereno na nominalnoj skali;c) Interval varijacije ove serije iznosi 5 godina;d) Modalna dužina radnog staža iznosi 8 godina;e) Prosečna dužina radnog staža iznosi 8 godina.

Rešenje: d)

Primer 8. Odredite mere centralne tendencije i pozicione mere disperzije sledećeg rasporeda frekvencija.

3

Page 4: Predavanja iz statistike

x f37 2038 1539 2040 15

Primer 9. Promet po mesecima u jednoj prodavnici 2007. godine, bio je (u 000 €):5,2,1,3,8,3,6,7,4,1,2,6. Koliki je prosečan mesečni promet?

Rešenje: m = x/N= 48/12=4.

Prosečan promet u prodavnici tokom 2007. godine bio je 4 (000 €).

Primer 10. Rezultati ispitivanja u 40 opština dati su u sledećoj tabeli:Broj bioskopa

(x)Broj opština

(f)1 92 103 84 55 46 27 2∑ 40

Koliki je prosečan broj bioskopa u opštinama?Rešenje: Prosečan broj bioskopa u opštinama je 2,975.

Primer 11. Raspodelu frekvencija prikažite poligonom frekvencija i odredite modalni i medijalni grupni interval.

Visina rashoda u 000 din

Broj građana

Do 2 112-3 182-4 224-5 15

5 i više 21∑ 87

II dvočas:

4

Page 5: Predavanja iz statistike

Mere disperzije i oblika rasporeda

Važna pitanja:

Značaj rasporeda frekvencija u statističkoj analizi. Pokazatelji rasporeda frekvencija. Osnovne karakteristike srednjih vrednosti. Osobine i primena aritmetičke sredine. Kada je medijana pogodnija od aritmetičke sredine? Primeri. U kojim slučajevima aritmetička sredina ne reprezentuje dobro statistički skup?

Dodatna pitanja:

Čemu je jednak zbir odstupanja pojedinačnih vrednosti obeležja od aritmetičke sredine? Da li varijansa i standardna devijacija mogu biti negativne? U kojim slučajevima interval varijacije nije realan pokazatelj disperzije? Kada je interkvartilna razlika bolji pokazatelj disperzije od standardne devijacije? Kada se koriste relativne mere disperzije?

Primeri:

Negrupisani podaci

Primer 1. Dati su podaci: 8, 2, 4, 5, 4, 3, 9, 4, 5.

Nađite aritmetičku sredinu, medijanu, modus i sve mere disperzije.

Primer 2. Na osnovu serije podataka iz prethodnog primera 1. izračunajte standardizovano odstupanje za vrednost obeležja 8 i objasnite dobijen rezultat.

* Uputstvo za izračunavanje kvartila Q1, Q2 i Q3 kod negrupisanih podataka:

(1) Ako je broj članova neparan broj:

2 3 4 5 6 7 8 9 10

Q2= Ме=6

Ako izbacimo medijanu iz niza, Q1 је medijana preostalog niza sa leve strane тј. Q1=3,5, а Q3 је medijana preostalog niza sa desne strane тј. Q3 = 8,5.

(2) Ako je broj članova paran broj

1 2 3 4 5 6 7 8 9 10

5

Page 6: Predavanja iz statistike

Q2= Ме = 5,5

Medijana se nalazi između brojeva 5 i 6, Q1 је medijana preostalog niza sa leve strane (1 2 3 4 5), tj. Q1= 3, а Q3= 8.

Grupisani podaci- prekidne vrednosti obeležja

Primer 3. Na osnovu podataka o broju članova domaćinstava radnika jednog preduzeća, odredite: a) Prosečan broj članova, modus i medijanu;b) Interval varijacije, interkvartilnu razliku, standardnu devijaciju i koeficijent varijacije.

Br. članova(x) Br. radnika (f)1 172 343 1264 575 376 12

Ukupno 283

Grupisani podaci- neprekidne vrednosti obeležja

Primer 4. U osnovnom skupu od 50 telefonskih poziva, vreme trajanja razgovora ima sledeći raspored. a) Odredite modus grafički; b) Izračunajte aritmetičku sredinu, medijanu, modus i interkvartilnu razliku.

Dužina razgovora

Br. poziva (f)

0-2 202-4 154-6 106-8 5

Укупно 50

Primer 5. U uzorku od 100 radnika jednog pogona utvrdjena je prosečna dnevna proizvodnja od 145 proizvoda, sa standardnom devijacijom 10, a u drugom pogonu njihova prosečna dnevna proizvodnja bila je 80 proizvoda, sa standardnom devijacijom 10. Šta možete zaključiti?

Odgovor: a) uzorci imaju jednake disperzije jer su im standardne devijacije iste,

6

Page 7: Predavanja iz statistike

b) veću disperziju pokazuje prvi uzorak jer ima veću prosečnu proizvodnju, pa je i značajnije odstupanje od nje, c) …......

Primer 6. Aritmetička sredina u skupu A iznosi 100, a u skupu B je jednaka 50. Ako je relativna mera disperzije u oba skupa jednaka 0,20 (tj.20%), u kojem skupu je veća apsolutna mera disperzije?

Odgovor: a) jednake su;b) veća je u skupu A i iznosi..............;c) veća je u skupu B i iznosi..............;d) ne možemo ih izračunati na osnovu raspoloživih informacija.

Rešenje: b)

Primer 7. Jedna serija ima veću disperziju od druge ako je:a) njen interval varijacije veći;b) njena varijansa veća;c) njen koeficijent varijacije veći;d) njeno standardizovano odstupanje veće, pod uslovom da skup nema normalan raspored;e) ništa od gore navedenog, jer disperzija bez mere centralne tendencije nije dovoljan pokazatelj.

Primer 8. Dva zaposlena u firmama A i B imaju istu platu od po 1000 evra. Prvi je zadovoljan svojom platom, a drugi nije. Zašto?

7

Page 8: Predavanja iz statistike

IV nedelja

PREDAVANJA

Neprekidna slučjna promenljiva

Normalan raspored, osobine i značaj

Standardizovan normalan raspored i primena tablica standardizovanog normalnog

rasporeda, primeri

Uzorak i statistike uzorka - uvod

VEŽBE

I dvočas

Mere centralne tendencije,

Mere disperzije i oblika raspodele

Pored srednjih vrednosti i mera disperzije u pokazatelje raspodele ubrajamo i: mere asimetrije i mere spljoštenosti.

Simetrična raspodela - frekvencije vrednosti obeležja ravnomerno opadaju ili rastu počev od aritmetičke sredine. Asimetrična raspodela - elementi skupa pokazuju tendenciju grupisanja oko vrednosti ispod ili iznad srednje vrednosti.

Relativna mera asimetrije: Za poređenje oblika raspodele a) simetrična 3= 0 b) pozitivno asimetrična (»udesno«) 3> 0 (Vrednosti X grupišu se oko vrednosti <μ) c) negativno asimetrična (»ulevo«) 3< 0 (Vrednosti x grupišu se oko vrednosti > μ)

-0,5<3<0,5 → raspodela umereno asimetrična.3 izvan intervala -0,5 i 0,5 → raspodela znatno asimetrična.

8

Page 9: Predavanja iz statistike

Relativna mera spljoštenostiSpljoštenost raspodele veća ili manja u zavisnosti od odnosa frekvencije srednjih vrednosti i frekvencije ostalih vrednosti obeležja.

4=3 → raspodela ima normalnu spljoštenost, 4>3 → raspodela je manje spljoštena (više izdužen), 4 <3 →raspodela je više spljoštena.

Primer 1. U osnovnom skupu od 50 telefonskih poziva, vreme trajanja razgovora ima sledeću raspodelu. Izračunajte sve srednje vrednosti, mere disperzije, a na osnovu izračunatih mera 3 i 4

odredite oblik raspodele.

Dužina Dužina razgovorarazgovora Br. poziva (f)Br. poziva (f)

(x` – μ)2 (x` – μ)2 f

0-20-2 2020 4 802-42-4 1515 0 04-64-6 1010 4 406-86-8 55 16 80

УкупноУкупно 5050 200

M3=4,8; σ=2; 3 = 0,6 > 0,5 (Izrazita pozitivna asimetrija)M4=35,2; σ=2; 4 = 2,2 < 3 (Spljoštenost veća od normalne)

Σ xf= 150; μ=3.

Primer 2. Na osnovu podataka iz sledeće tabele:a) Odrediti asimetriju rasporeda frekvencija korišćenjem relativnih mera.b) Kakva je spljoštenost datog rasporeda?

Br. Br. članova(x)članova(x)

Br. radnika Br. radnika (f)(f)

11 171722 343433 12612644 575755 373766 1212

УкупноУкупно 283283

a) M3=0,338; σ=1,159; 3 = 0,217 < 0,5 (Umerena pozitivna asimetrija)b) M4=5,334; σ=1,159; 4 = 2,953 ≈ 3 (Približno normalna spljoštenost)

Primer 3. Visina štednih uloga u jednoj banci (u 000 €):

9

Page 10: Predavanja iz statistike

Štedni ulog (u 000 evra) 2 4 5 6 25

Navedite osnovne karakteristike datog rasporeda:a) simetričnost;b) mere lokacije;c) mere disperzije.d) Da li ima ekstremnih vrednosti?

x xi-m (xi-m)2

2 -6.4 40.964 -4.4 19.365 -3.4 11.566 -2.4 5.76

25 16.6 275.5642 0 353.208.4 70.64 3=1.41

8.405

3=1.41>0 (Znatna asimetrija udesno-pozitivna)

Ostale mere lokacije i disperzije:Mo= nema; Me=5; i=23 Q1=3; Q3=15,5 Iq= 12,5

Primer 4: Anketiranjem devet trgovinskih firmi dobijeni su sledeći podaci o nedeljnoj prodaji proizvoda X (u 000 komada):

20 10 15 16 14 20 13 17 50

Navedite osnovne karakteristike date raspodele.

Deskriptivne statistike

Promenljiva: Obim prodajen Min Max Prosek Mo Q1 Me Q39 10 50 19,4 20 13,5 16 20

s2 s iQ i α3 α4125,8 11,2 6,5 40 2,14 6,20

Osnovne karakteristike gornje raspodele su:

10

Page 11: Predavanja iz statistike

a) Umerena asimetrija: prosečan obim prodaje 19400 kom., st. dev. 11,900kom., nema ekstremnih vrednostib) Umerena asimetrija: prosečan obim prodaje 19400 kom., st. dev. 11,900kom., jedna ekstremna vrednostc) Znatna asimetrija: prosečan obim prodaje 19400 kom., st. dev. 11,900kom., jedna ekstremna vrednostd) Znatna asimetrija: Me = 16000kom., iQ=6500kom., jedna ekstremna vrednoste) Znatna asimetrija: Me = 16000kom., st. dev. 11,900kom., jedna ekstremna vrednost

Napomena: Karakteristike svake raspodele frekvencija su: simetričnost,

mere lokacije,mere disperzije,ekstremne vrednosti.

Prvo na osnovu određujemo da li je raspodela simetrična, umereno asimetrična ili znatno asimetrična. Pošto je u ovom zadatku raspodela znatno asimetrična i ima jednu ekstremnu vrednost, kao meru lokacije koristimo medijanu, a kao meru disperzije koristimo interkvartilnu razliku.

Ispitni zadatak (Jun 2008.) Iz osnovnog skupa od 1700 studenata I godine Ekonomskog fakulteta izabrana su dva slučajna uzorka od po 80 studenata. Grupisanjem studenata prema ocenama dobijenim na ispitima iz Matematike i Statistike dobijeni su sledeće raspodele frekvencija:

Broj studenata na ispitu

Ocena iz matematike iz statistike

5 25 30

6 15 12

7 12 12

8 10 10

9 8 10

10 10 6

a) Primenom odgovarajućih apsolutnih i relativnih mera, uporedite disperziju serija podataka.

Po izboru, obraditi sledeća pitanja i zadatke iz Zbirke:

I grupa 7. II grupa 4.

11

Page 12: Predavanja iz statistike

II dvočas

Verovatnoća (koncepcije verovatnoće), slučajna promenljiva, raspored verovatnoće, čekivana vrednost

Obrađena su sledeća pitanja: Statistički (slučajni) eksperiment, Ishod (elementarni događaj), Prostor uzorka, dogođaj A, Verovatnoća događaja A i osobine, Tri koncepcije verovatnoće Šta je slučajna promenljiva? Primeri... Raspored verovatnoće slučajne promenljive: prekidne i neprekidne. Koje osobine mora da ispuni svaki raspored verovatnoće? Određivanje i smisao očekivane vrednosti. Odnos očekivane vrednosti slučajne promenljive i aritmetičke sredine rasporeda

frekvencija Šta pokazuje varijansa slučajne promenljive?

Primer 1. Na osnovu rasporeda verovatnoće slučajne promenljive datog sledećom tabeloma) Izračunajte očekivanu vrednost i varijansu slučajne promenljive X.b) Odredite očekivanu vrednost i varijansu sl. promenljive Y=2X+1.

X p0 0,1251 0,3752 0,3753 0,125 1

Rešenje: a) E(X)=1,5, Var (X)=0,75;b) E(Y)=4 Var (Y)=3

Primer 2. Raspodela verovatnoća broja kvarova na jednoj mašini:

X 1 2 3 4 5

p 0,1 0,2 0,4 0,2 0,1

Kolika je verovatnoća da je:a) X manje od 3, a veće od 0;b) X manje od 2, a veće od 1;c) X manje od 0;d) X veće ili jednako 5;e) X jednako 2,5.

12

Page 13: Predavanja iz statistike

Primer 3. Slučajna promenljiva X ima raspodelu verovatnoća:

X 0 1 2 3p 2k 3k 13k 2k

a) Izračunajte b) Izračunajte F(2,5)

Rešenje: 20k=1 k=1/20=0,05X 0 1 2 3p 0,10 0,15 0,65 0,10ili: 2/20 3/20 13/20 2/20

a) P(-5<X<2) = 5/20=1/4 (=0,25)b) F(2,5)=P(X≤2,5)=18/20= 0,9c) P(X=2,5)=0

Primer 4. Dat je raspodela verovatnoća slučajne promenljive X. Odredite raspodelu verovatnoća slučajne promenljive Z=2X+5.

X 0 1 2 3 4 5p 1/10 2/10 3/10 1/10 1/10 2/10

Rešenje:

Z 5 7 9 11 13 15p 1/10 2/10 3/10 1/10 1/10 2/10

Primer 5. Data je sledeća raspodela verovatnoća:

X 0 1 2 3 4p 0,1 0,6 0,1 ... 0,1

a) Kolika je verovatnoća da će slučajno odabrana jedinica imati vrednost promenljive X veću od 2, a manju od 10?b) Izračunajte F(-2).c) Izračunajte očekivanu vrednost i varijansu gornje raspodele.

Rešenje:

a) p=0,2b) F(-2)=0c) E(X)=1,5 Var(X)=1,25

13

Page 14: Predavanja iz statistike

Obraditi sledeća pitanja i zadatke iz Zbirke:

II grupa 3. zadatak IV grupa 2. zadatak VI grupa 3. zadatak VII grupa 5. zadatak

14

Page 15: Predavanja iz statistike

V nedelja:

PREDAVANJA Uzorak i statistike uzorka Statisticko ocenjivanje - uvod

VEŽBE

I dvočas: Tema - Normalna raspodela i standardizovana normalna raspodela

Pitanja: Raspodela verovatnoća neprekidne slučajne promenljive. Da li je uvek 95% normalne krive između x= -1,96 i x=1,96? Da li u praksi nalazimo normalno raspoređene osnovne skupove? Značaj normalnog

rasporeda. Primeri . Binomna i normalna raspodela. Da li je normalna kriva uvek simetrična? Da li je simetrična kriva uvek normalna kriva? Koji parametri definišu normalnu raspodelu? Standardizovana normalna raspodela Kako na osnovu kumulativne funkcije raspodele možemo odrediti verovatnoću da

neprekidna slučajna promenljiva uzme neku vrednost u intervalu (0,1).

1. Raspodela verovatnoća neprekidne slučajne promenljive: kod neprekidne slučajne promenljive ima smisla samo verovatnoća da se X nađe u nekom intervalu, jer je P(X=x)=0 za svako x (ima beskonačno mnogo takvih vrednosti).

Pitanje: Kako se na osnovu funkcije raspodele može odrediti verovatnoća da neprekidna slučajna promenljiva uzme vrednost u intervalu (a,b)?

2. Problem korišćenja modela prekidnih raspodela: primena npr. binomne ili Poisson-ove tablice verovatnoće, kada su parametri rasporeda van opsega tablica;

Rešenje: aproksimacija modelima neprekidnih raspodela. Veliki broj ekonomskih i dr. društvenih pojava može uzeti ma koju vrednost iz nekog

konačnog ili beskonačnog intervala.

3. Osobine rasporeda verovatnoće neprekidne slučajne promenljive (funkcije gustine) f(x):

- f(x)≥0- ukupna površina ispod krive gustine verovatnoće = 1

Neprekidna promenljiva - umesto operatora za sabiranje koristi se integral (D - oblast definisanosti X od - ∞ do + ∞).

Ako je poznat matematički izraz f(x): verovatnoća da X uzme vrednost u nekom intervalu (a,b) jednaka je površini između krive f(x) i apscise u intervalu (a,b):

15

Page 16: Predavanja iz statistike

Neprekidna slučajna promenljiva može izeti beskonačno mnogo vrednosti; verovatnoća da uzme jednu određenu vrednost je 0: P(X=a) = P(X=b)=0, pa je

Uključivanje graničnih vrednosti ne menja verovatnoću da je X u ntervalu (a,b) !

4. Funkcija raspodele F(x) neprekidne slučajne promenljive - značaj u određivanju verovatnoće da X uzme vrednost u nekom intervalu.

Tablice verovatnoće modela raspodela najčešće date na osnovu F(x).F(x)=P(Xx) - grafički površina ispod krive funkcije gustine od njenog početka do tačke x. Površina ispod krive predstavlja verovatnoću; zbir funkcije rasporeda i ostatka površine =1, pa je:

5. Normalna raspodela - granični oblik binomnog rasporeda kada se broj opita neograničeno povećava.

Funkcija gustine – raspodela verovatnoća normalne slučajne promenljive:

Osobine:1. Normalna kriva ima oblik zvona, unimodalna i simetrična u odnosu na m.2. m = Mo = Me.3. Kriva se proteže od -∞ do +∞ , i= ∞.4. 3= 0, a 4= 3.5. Ukupna površina ispod krive je 1.6. Normalan raspored potpuno definisan parametrima m i s2 .

Pitanje: Da li je uvek 95% normalne krive između x= -1,96 i x=1,96?

Površina izvan intervala ± 3 s od m zanemarljivo mala. Ako X: N (m; s2) i njena linearna transformacija Y=a+bX ima takođe normalan raspored.

Suma n nezavisnih transformacija takođe ima normalan raspored.Postoji familija različitih normalnih rasporeda u zavisnosti od veličine parametara m i s2.

6. Problem određivanja verovatnoće normalno rasporedjene slučajne promenljive. Rešenje: Normalnu raspodelu transformišemo u standardizovanu normalnu raspodelu; pomoću nje računamo verovatnoće.Transformacija X u Z odstupanje:

7. 1) Normalna kriva - aproksimacija dr. rasporeda sa ograničenim intervalom varijacija, iako normalan rapored teorijski može uzeti vrednosti od - ∞ do + ∞.

16

Page 17: Predavanja iz statistike

2) Da li je normalna kriva uvek simetrična?m1 ≠ m2 ≠ m3 s1 = s2 = s3

3) Da li je simetrična kriva uvek normalna kriva?

8. Značaj normalne raspodele:1.Veliki broj pojava ima normalnu raspodelu.2.Dobra aproksimacija prekidnih raspodela (binomnog i Poisson-ovog) za vrednosti parametara koje nisu date u tablicama.3.Iz normalne raspodele izveden veliki broj drugih neprekidnih raspodela (t raspodela, F raspodela, c2 raspodela).4.Osnova za parametarsko zaključivanje.5.Veliki broj statističkih problema rešiv samo uz pretpostavku da se osnovni skup iz koga je biran uzorak ima normalnu raspodelu.

Zadaci:Primer 1. Ako je Z neprekidna slučajna promenljiva koja uzima vrednosti u intervalu od (0,1) koliko iznosi verovatnoća da Z bude jednako 0,5.

Rešenje: P(Z=0,5)=0 jer je 1/∞=0

Primer 2. Odredite verovatnoću da standardizovana normalna slučajna promenljiva uzme sledeće vrednosti:

a) P(Z ≤ -1,01) b) P(Z ≥ 1,3)c) P(-2,62 ≤ Z ≤2,33)d) P(Z =1)

Rešenje:a) 0,1562b) 1-0,9032=0,0968c) 0,9901-0,0044=0,9857d) 0

Primer 3. Ako je X: N(100;50) izračunajte F(50). Odgovor: a) F(50)= - ; b) F(50)= 5; c) F(50)=0; d) Nemoguće izračunati; e) 0<F(50)1.Rešenje:F(50) = P(X ≤ 50) = P(Z ≤ (50-100)/ 7,07) = P(Z ≤)

Primer 4. Visina studenata prve godine na Fakultetu za fizičku kulturu sledi normalan raspored X: N(177; 72). Kolika je verovatnoća da će slučajno izabrani student imati visinu u intervalu od 173-187cm?

Rešenje:

17

Page 18: Predavanja iz statistike

Primer 5. Pretpostavimo da je Z standardizovana normalno raspoređena slučajna promenljiva. Verovatnoća da se Z nađe u intervalu čije su granice simetrične u odnosu na µ iznosi 0,05. Pronađi te granice. Odgovor: Granice su: (-0.06; 0.06)

Rešenje:

Primer 6. Slučajna promenljiva X ima normalan raspored, . Ako je , da

li je manje ili veće od aritmetičke sredine, µ? Koliko iznosi ova razlika izražena u standardnim devijacijama ? Odgovor:b) je veće od µ za ..........0,67.............. standardnih devijacija;Rešenje:

II dvočas:

Tema- Standardizovana normalna raspodela Korišcenje tablica standardizovane normalne raspodele, primeri

Primer 1. Zarade radnika imaju normalan raspored sa prosekom od 3800 din. i stand. dev. od 600 din. Regresi za godišnji odmor imaju normalan raspored sa prosekom 1000 din. i stand.dev. 200 din.a) Koliko je učešće zaposlenih sa zaradama do 5000 din.?b) Učešće radnika sa regresom većim od 1500 din.?c) Odrediti oblik rasporeda ukupnih primanja zaposlenih u mesecu u kojem primaju i regres.

Rešenje: a) P(X1≤5000)= P(Z ≤2)= F(2)= 0,9772b) P(X2>1500)= 1-P(X ≤1500)= 1-P(Z ≤2,5)= 1-F(2,5)= 0,0062c) (X1+ X2): N (4800; 400 000)

Primer 2. Dnevni prihod od prodaje u prodavnicama jednog trgovinskog preduzeća ima normalnu raspodelu (X: 4000 din.; 1.000.000 din.2).a) Koliko je učešće i ukupan br. prodavnica sa dnevnim prihodom većim od 5500 din., ako posmatrano preduzeće ima ukupno 2500 prodavnica. b*) Odrediti dnevni prihod iznad kojeg će biti 80% prodavnica.

a) P(X>5500)= 1-P(Z ≤1,5)= 1-F(1,5)=1-0,9332=0,0668 N1=167 prodavnica

b*) P(X>x)= 0,80 x=?

P(X>x)=P(Z>z)=1- P(Z≤z)=0,80 F(z)=0,20 z = -0,84, x = 3160 dinara

18

Page 19: Predavanja iz statistike

Primer 3. Pretpostavlja se da prečnik jednog proizvoda sledi normalnu raspodelu sa prosekom 50mm i varijansom 16mm2.a) Da li je ispravno tvrđenje da 20,3% svih proizvoda proizvedenih u fabrici ima prečnik između 52 i 55mm?b) Kolika je verovatnoća da će slučajno odabrani proizvoda biti prečnika 41,5mm?c) Koliko proizvoda ima prečnik između 40 i 50mm od ukupno 7000 proizvedenih?d) Ako su granice tolerancije od 42mm do 58mm izračunajte procenat škarta.

a) Proveriti da li je P( 52 ≤ X ≤55)= 0,203. P( 0,5 ≤ Z ≤1,25)= F(1,25)-F(0,5)=0,203

b) P(X=41,5)= 0c) P(40 ≤ X ≤50)=P(-2,5 ≤ Z ≤0)=0,4938

N=7000 → N1=7000*0,4938=3457 d) P(42 ≤ X ≤58)=P(-2 ≤ Z ≤2)=2 F(2)-1=2* 0,9772-1=0,9544

95,44% - učešće ispravnih proizvoda; 4,56% - učešće neispravnih proizvoda!

Primer 4. Istraživanje pokazuje da 20% najskupljih sedmodnevnih aranžmana turističkih agencija Beograda za leto 2003. ima cenu veću od 400 evra. Pretpostavlja se da cena sedmodnevnih turističkih aranžmana ima normalan raspored. Prosečna cena svih ovih aranžmana je 250 evra. Na osnovu prethodnih informacija izračunajte standardnu devijaciju datog normalnog rasporeda.

Odgovor: a) 178,6 evra; b) 117,2 evra; c) 175 evra; d) 150 evra; e)................................

X: N(250; s2)P( X > 400) = 0,20

P( X ≤ 400) = 0,80 P( Z≤ ) = 0,8

F( )=0,8 =0,84 s=178,6

Primer 5. U prostom slučajnom uzorku od 12 elemenata izvučenom iz osnovnog skupa koji ima raspored X: N(25; 52) dobijene su sledeće pozicione mere disperzije : interval varijacije iznosi i=16, a interkvartilna razlika iznosi iQ = 6. Izračunajte interval varijacije i interkvartilnu razliku u osnovnom skupu i uporedite dobijene vrednosti sa rezultatima uzorka.

Rešenje: U osnovnom skupu sa normalnim rasporedom .Prvi i treći kvartil normalnog rasporeda određujemo iz verovatnoće:

P( Q1 ≤ X ≤Q3)= 2 F(z)-1= 0,50

F(z)=0,75 → z=0,67

19

Page 20: Predavanja iz statistike

→ Q1 = 21,65

→ Q3 = 28,35

Konačno je iQ= 28,35 – 21,65 = 6,7.

Primer 6. Dnevna potrošnja voća četvoročlanih domaćinstava ima normalan raspored. Oko 12% domaćinstava troši manje od 0,8 kg i oko 12% domaćinstava troši više od 2,2 kg voća dnevno. Izračunajte apsolutnu i relativnu meru disperzije ovog rasporeda. Odgovor: Apsolutna mera disperzije je .............., a relativna mera je ...........

Rešenje:

zbog simetričnosti normalnog rasporeda

* Napomena - sve zadatke raditi u sledećim etapama:1. postaviti verovatnoću2. nacrtati i šrafirati normalnu krivu3. izračunati verovatnoću4. obavezno komentarisati.

Ispitni zadaci:

Jun 2006. Na osnovu analize rezultata jednog kolokvijuma ustanovljeno je da je 30% studenata imalo više od 70 poena (od maksimalnih 100), a prosečan broj poena iznosio je 56,6.

Ukoliko pretpostavimo da broj poena na kolokvijumu sledi normalnu raspodelu, izračunajte koliko rezultati pojedinih studenata (mereni brojem poena) u proseku odstupaju od 56,6 poena.

Jun 2007. Slučajna promenljiva X ima normalan raspored sa varijansom jednakom 25. Ukoliko je poznato da se 67% površine normalne krive nalazi levo od vrednosti x=17,2, naći relativnu meru disperzije ovog rasporeda.

Jun 2007. Cena artikala u jednoj prodavnici ima približno normalan raspored sa varijansom jednakom 25 eura2. Ukoliko je poznato da 33% artikala ima cenu veću od 7,2 eura, izračunajte relativnu meru disperzije ovog rasporeda.

Obraditi sledeća pitanja iz Zbirke:

20

Page 21: Predavanja iz statistike

I grupa 3., 8. zadatak V grupa 2. zadatak VII grupa 4. zadatak VIII grupa 7. zadatak

21

Page 22: Predavanja iz statistike

VI nedelja:

PREDAVANJA Statističko ocenjivanje

VEŽBE

I dvočas: Uzorak i statistike uzorka

Teorijska pitanja: Vrste uzoraka; Slučajne i neslučajne greške; Raspodela osnovnog skupa, uzoračka raspodela (raspodela statistike uzorka); Uzoračka raspodela statistike Uzoračka raspodela statistike Centralna granična teorema;

Razlika između , i S2.

Pitanje 1: Kod prostog slučajnog uzorkaa) Svaki element populacije ima jednaku verovatnoću da bude izabran u uzorakb) Elementi u skupu koji se nalaze jedan do drugoga ne smeju da budu izabrani u isti

uzorakc) Moguće greške nije moguće procenitid) Svaki skup jednake veličine ima podjednaku verovatnoću da bude izabran u uzorake) Ništa od gore navedenog... Iz osnovnog skupa (N) izvlačimo uzorke veličine n; svaki mogući uzorak ima istu verovatnoću da bude izabran.

Pitanje2: Slučajne greške nastaju zbog: a) Pogrešno izabranog okvira; b) Nepreciznog upitnika; c) Razlike između skupa i uzorka; d) Neadekvatne realizacije slučajnog izbora elemenata u uzorak; e) Nemarnosti anketara.

* Objašnjenje: Slučajne greške nastaju usled razlike između stvarne vrednosti parametra osnovnog skupa i ocenjene vrednosti parametra na osnovu uzorka (zbog slučajnog izbora elemenata u uzorak).

Pitanje 3: Raspored statistike uzorka pokazuje(a) Raspored različitih veličina uzoraka koji se mogu koristiti u istraživanju; (b) Raspored vrednosti koje obeležje može uzeti u skupu, sa odgovarajućim verovatnoćama;(c) Raspored statistike koja je dobijena u izabranom uzorku; (d) Raspored vrednosti koje statistika u uzorku može uzeti, zajedno sa odgovarajućim verovatnoćama; (e) Raspored verovatnoće statistike testa u izabranom uzorku.

22

Page 23: Predavanja iz statistike

Pitanje 4: Standardna greška aritmetičke sredine pokazuje:a. prosečno odstupanje elemenata uzorka od elemenata skupa;b. prosečno odstupanje elemenata skupa od aritmetičke sredine uzorka;c. prosek odstupanja elemenata u uzorku od njegove aritmetičke sredine;d. prosek odstupanja aritmetičke sredine uzoraka od aritmetičke sredine skupa;e. prosek odstupanja statistike uzorka od statistike skupa

II dvočas

Uzorak i statistike uzorka – primeri

Primer 1. Prosečna visina u skupu sportista jednog kluba je 182 cm, a standardna devijacija 9cm. Slučajnim putem biramo 100 sportista. Da li možemo raspored artimetičkih sredina uzoraka aproksimirati normalnim rasporedom? Izračunajte: a) Standardnu grešku ocene aritmetičke sredine. b) Verovatnoću da prosečna visina u uzorku nije veća od 180 cm. c) Verovatnoću da se prosečna visina u uzorku razlikuje od prosečne visine skupa za manje od 2 cm.

Rešenje: Raspored artimetičkih sredina uzoraka aproksimirati normalnim rasporedom, jer

X: W(182; 92) i n=100 Na osnovu C.G.T. ® : ≈ N (182 ; 0,9) jer je n>30

a)

b)

c)

Primer 2. Propisana težina pakovanja keksa je 500 gr. Automatska mašina za pakovanje je podešena tako da je prosečna težina 505 gr., a standardna devijacija 15 gr. Ako je težina pakovanja normalno raspoređena, izračunajte verovatnoću da: a) na slučaj odabrana kutija bude lakša od propisane težine; b) prosečna težina u uzorku od 16 kutija bude manja od propisane težine; c) prosečna težina u uzorku od 64 kutije bude manja od propisane težine. d) Da li na izračunate verovatnoće utiče podatak da se osnovni skup sastoji od 1000 kutija?

a) X:N(505; 152)

23

Page 24: Predavanja iz statistike

b) n=16

c) n= 64 =

d) N= 1000; n=64 n/N= 0,064>0,05 p.f.k.s.

Podatak da se osnovni skup sastoji od 1000 kutija utiče na izračunatu verovatnoću na bazi uzorka od 64 elementa (na rezultat pod c.)

Primer 3. Ako je standardna devijacija osnovnog skupa 27, a veličina uzorka 81, koja je verovatnoća da će se razlikovati od m za više od 5?

Rešenje:

24

Page 25: Predavanja iz statistike

Primer 4. Proporcija apsolvenata u skupu studenata je 0,1. Ako izvlačimo uzorak od 55 studenata, odredite raspored proporcije uzorka, . Da li je opravdano koristiti normalan raspored kao aproksimaciju rasporeda statistike? Objasnite.

Izračunajte verovatnoću da će učešće apsolvenata u uzorku biti: a) manje od 8%; b) veće od 15%; c) između 7% i 12%.

Rešenje:

p = 0,1 n=55>30 : ≈ N (0,1; 0,042) n p =5,5 >5

n (1-p)=49,5 >5

a)

b)

c)

Primer 5. Učešće žena u političkom životu je 5%. a) Ako slučajnim putem iz skupa političara biramo 150 osoba, kolika je verovatnoća da ćemo izabrati najmanje 10 žena? b) Ako iz skupa od 2000 političara slučajnim putem biramo 150 osoba, kolika je verovatnoća da ćemo izabrati najmanje 10 žena? Zašto se rezultati pod a) i b) razlikuju? Objasnite.Rešenje:p= 0,05 n=150>30f=10p=10 / 150 = 0,067

a)

b) N= 2000 n / N= 0,075 > 0,05 ® p.f.k.s. ®

Primer 6. Uspeh na prijemnom ispitu ima normalan raspored sa prosečnim brojem poena 84,5 i varijansom 25; minimalan broj poena za prijem je 80. a) Izračunajte učešće i ukupan broj studenata koji su primljeni, ako je polagalo ukupno 1500 kandidata.

25

Page 26: Predavanja iz statistike

b) Kolika je verovatnoća da će, u uzorku od 30 kandidata, proporcija onih koji su položili biti manja od proporcije skupa za više od 5%?Rešenje:

X: N (84,5; 52)

a) P(X >80)=1 - P(Z< - 0,9)= 0,8159 ¬ pN= 1500 ® N1=1224

b) n= 30 p - > 0,05 ® - p < - 0,05

Primer 7. Iz osnovnog skupa sa 7 elemenata formirani su svi prosti slučajni uzorci bez ponavljanja od po 3 elementa. Suma kvadrata odstupanja aritmetičkih sredina uzoraka od aritmetičke sredine skupa iznosi 250. Kolika je standardna greška ocene aritmetičke sredine skupa?Rešenje:

=35

Po uslovu zadatka je: , pa je

Primer 8. Iz osnovnog skupa X: N(100, 102) biramo proste slučajne uzorke sa ponavljanjem od 25 elemenata. Odredite raspored aritmetičkih sredina ovih uzoraka i izračunajte verovatnoću da ćemo izabrati uzorak čija se aritmetička sredina razlikuje od aritmetičke sredine skupa za više od 2.

Rešenje:

26

Page 27: Predavanja iz statistike

Primer 9. Ako je standardna devijacija osnovnog skupa 27, a veličina uzorka 81, koja je verovatnoća da će se razlikovati od m za više od 5?

27

Page 28: Predavanja iz statistike

VII nedelja

PREDAVANJA

Testiranje statističkih hipoteza zasnovano na jednom uzorku

VEŽBE

I dvočas: Ocenjivanje aritmetičke sredine osnovnog skupa

Primer 1. Vek trajanja jednog proizvoda ima normalan raspored sa standardnom devijacijom od 500 časova. U uzorku od 15 takvih proizvoda, prosečan vek trajanja je 8900 časova.

Uz nivo pouzdanosti 90% odredite njihov prosečan vek trajanja u statističkom skupu.

Rešenje:

X:N(μ;5002) n=15

Primer 3. Osnovni skup ima normalan raspored . Kolika je veličina uzorka ako smo u ocenjivanju aritmetičke sredine skupa, dobili interval poverenja širine 0,8 uz koeficijent pouzdanosti 0,95? Odgovor: Uzorak ima: a. oko 10 elemenata, b. oko 100 elemenata, c. oko 20 elemenata, d. ________.

Rešenje:

Primer 4. (ispitni zatadak, IX 2002.) Varijansa skupa je 144, a pouzdanost sa kojom ocenjujemo nepoznatu aritmetičku sredinu skupa je 0.95.

Koliki treba da bude uzorak da bi širina intervala poverenja iznosila najviše 7? Odgovor: a. Veći od 45 ; b. Najviše 45;

28

Page 29: Predavanja iz statistike

c. Veći od 30; d. Veći od 12; e. Veći od 32.

Zadatak se radi na sličan način kao prethodni primer.

Primer 5. Ispitni zadatak (Sept. 2003.) Ispitujemo dužine telefonskih razgovora u jednom gradu. Da li je uzorak (čiji su podaci dati u tabeli) reprezentativan pri oceni prosečne dužine razgovora u osnovnom skupu ako je raspored osnovnog skupa X:N(4,5; 2,25)? Pouzdanost je 0,95.

Dužinarazgovorau min.

Brojrazgovora

Do 44 - 66 – 88 i više

3510105

Rešenje:

=1,96

4,5-1,96· ≤ µ ≤ 4,5+1,96· 4,12 ≤ µ ≤ 4,88

Primer 6. Interkvartilna razlika kod Studentovog rasporeda sa beskonačno stepeni slobode iznosi:a) 1,34 (zaokruženo na dve decimale)b) 1,96 (zaokruženo na dve decimale)c) 2,576 – 1, 282 = 1,294d) Beskonačnoe) Ništa od gore navedenogRešenje: Studentov raspored sa beskonačno stepeni slobode teži standardizovanom normalnom rasporedu, tako da je interkvartilna razlika jednaka 1,34.

Primer 7. (Kolokvijum 2007.) Izabran je prost slučajan uzorak od 25 zaposlenih jednog preduzeća. U posmatranom uzorku prosečna dnevna proizvodnja zaposlenih iznosi 30 kg proizvoda, a varijansa 100 kg2. Pretpostavlja se da proizvodnja sledi normalan raspored verovatnoće. Sa pouzdanošću od 95% ocenite prosečnu dnevnu proizvodnju svih zaposlenih u preduzeću.Odgovor: Sa pouzdanošću 95% zaključujemo da se prosečna dnevna proizvodnja svih zaposlenih u preduzeću nalazi u intervalu:a) (15,872-24,128)b) (16,578-23,422)c) (16,080-23,920)d) Ne možemo sprovesti ocenjivanje jer je uzorak mali, a varijansa skupa nepoznatae)....................................................

Primer 8. Prečnik jedne komponenete koja se proizvodi u firmi “X“ ima približno normalan raspored sa nepoznatom aritmetičkom sredinom i varijansom. U prostom slučajnom uzorku

29

Page 30: Predavanja iz statistike

veličine 25, prosečan prečnik te komponente je 2,5 cm, a formirani 95% interval poverenja ima širinu 4 cm. Zaključujemo da varijansa uzorka iznosi:

a) 4,85;b) 26,03;c) 5,102;d) 26,03;e) 23,47.

Rešenje:

Primer 9. U prostom slučajnom uzorku od 80 kupaca, analizirana je dnevna potrošnja hleba. Utvrđena je aritmetička sredina uzorka od 717,5 gr i ocenjena vrednost standardne greške 6,42 gr. Želimo da ocenimo prosečnu potrošnju hleba u osnovnom skupu. Ukoliko se veličina uzorka poveća na 150 kupaca:

a) neće se značajno promeniti širina intervala ukoliko se istovremeno ne promeni i pouzdanost

b) interval poverenja se smanjuje, pa se povećava i preciznost ocenec) interval poverenja se povećava, pa se povećava i preciznost ocened) interval poverenja se smanjuje, pa se time smanjuje i preciznost ocene

Iz zbirke obraditi sledeće zadatke:

II grupa: 2. zadatakVIII grupa: 6. zadatak.

30

Page 31: Predavanja iz statistike

II dvočas: Ocenjivanje proporcije osnovnog skupa zasnovano na velikim uzorcima

Primer 1. Od 100 slučajno anketiranih kupaca u jednoj samousluzi, 34 je odgovorilo da je probalo novi proizvod. Sa pouzdanošću od 0,95 ocenite učešće kupaca koji su probali novi proizvod.

= f/ n = 0,34

1. n=100 > 302. n = 34 > 53. n (1- ) = 66 > 5

= 0,0474

0,247 ≤ p ≤ 0,433

Primer 2. Od 1500 zaposlenih jednog preduzeća slučajnim putem je izabrano 90, od kojih je 54 podržalo novi program zaštite na radu. Sa pouzdanošću od 0,90 ocenite učešće i ukupan broj zaposlenih koji podržavaju novi program.

1. n=90 > 302. n = 54 > 53. n (1- ) = 36 > 5

f= 54 = f/ n = 0,6

N= 1500n = 90 n / N = 0,06 > 0,05 0,518 <p < 0,682

777 < N p < 1023

Primer 3. U slučajnom uzorku od 50 proizvoda jedne firme pronađeno je 4 koja se mogu klasifikovati kao škart. Uz koeficijent poverenja od 95% zaključujemo da se proporcija neispravnih proizvoda u osnovnom skupu nalazi između:a. (0,4%, 15,5%)b. (20,1%, 40,9%)c. (6,7%, 10,3%)d. (0,4%, 50%)e. Ništa od gore navedenog jer……….

Rešenje:n=50

=4/50=0,08 Pošto je ne možemo oceniti proporciju neispravnih proizvoda u osnovnom skupu, jer nije ispunjen jedan od uslova za aproksimaciju rasporeda proporcija normalnim rasporedom.

Primer 4. (Zadatak 15.2.c., zbirka) Prost slučajan uzorak iz normalno raspoređenog osnovnog skupa dao je sledeći rezultat:

31

Page 32: Predavanja iz statistike

Vreme trajanja bankarske usluge(min.)

Br. klijenata

7-9 69-11 811-13 1213-15 815-17 517-19 3Ukupno 42

Da li je uzorak reprezentativan pri oceni proporcije usluga koje traju duže od 15 min., ako je raspored osnovnog skupa X: N(13;22)? (=0,01)

0,033 ≤ p ≤ 0,347

P(X>15)=1-P(Z≤(15-13)/2)=1-F(1) = p

Uzorak jeste reprezentativan jer se prava vrednost proporcije p nalazi u intervalu poverenja formiranom na osnovu tog uzorka.

Primer 5. Iz skupa u kome je raspored X: N(5;1,52) izvučen je prost slučajan uzorak od 100 elemenata. Ako u uzorku učešće elemenata sa vrednošću većom od 5 iznosi 0,45, ispitajte da li je uzorak reprezentativan pri oceni učešća elemenata sa vrednošću većom od 5 u osnovnom skupu (nivo pouzdanosti je 95%).Odgovor: a) Uzorak je reprezentativan jer se ………….. nalazi u intervalu ……b) Uzorak nije reprezentativan, jer ……………….

Rešenje:

=0,45n=100

0,352 ≤ p ≤ 0,547

P(X>5)=1-P(Z≤0)=0,5 = p

Ovu proporciju i nismo morali da računamo, jer ako znamo osobinu normalnog rasporeda, poznato nam je i da verovatnoća da je X veće (manje ili jednako) od aritmetičke sredine μ=Me=Mo=5,

Uzorak jeste reprezentativan: tačno učešće elemenata u skupu sa vrednošću > 5, koje iznosi p=0,5 nalazi u intervalu formiranom na osnovu prostog slučajnog uzorka.

32

Page 33: Predavanja iz statistike

Primer 6. Na osnovu prostog slučajnog uzorka od 250 zaposlenih u Beogradu, ocenjeno je sa pouzdanošću od 0,95 da se učešće zaposlenih sa primanjima većim od 15000 dinara nalazi u intervalu od 22% do 38%.

Pod pretpostavkom da je raspored primanja u osnovnom skupu zaposlenih normalan, X: N(14500din.; 1000000din2), ispitajte da li je uzorak reprezentativan pri oceni učešća zaposlenih sa primanjima većim od 15000 dinara.

Rešenje:n=2500,22 ≤ p ≤ 0,38

Primer 7. Iz skupa od 7000 stanovnika jednog regiona izabran je prost slučajan uzorak od 900 stanovnika i u njemu utvrdjena proporcija od 0,265 onih koji primaju socijalnu pomoć. Da li je ispravno reći da sa pouzdanošću od 0,95 zaključujemo da u skupu postoji izmedju 1666 i 2044 stanovnika koji primaju pomoć? Odgovor: a) jeste, jer.......................................... b) nije, jer je .......................................... c) nemamo dovoljno podataka da ispitamo dato tvrdjenje, d) ništa od gore navedenog, jer..........................................

Rešenje:N=7000n=900p=0,265

0,238 ≤ p ≤ 0,292 1666 ≤ N p ≤ 2044

Primer 8. (kolokvijum 2007.) Iz jednog preduzeća prerađivačke industrije izabran je prost slučajan uzorak od 100 zaposlenih i u njemu zabeleženo da 20 zaposlenih ostvaruje mesečnu produktivnost veću od proseka. Sa pouzdanošću od 95% ocenite proporciju svih zaposlenih u preduzeću koji ostvaruju mesečnu produktivnost veću od proseka. a) (0,122; 0,278)b) (0,816; 0,944)c) (0,699; 0,861)d) ne može se primeniti normalna aproksimacijae)..........................................................................

Primer 9. (ispitni zadatak, septembar 2007.) Raspolažemo podacima o raspodeli 80 slučajno izabranih radnika prema visini ličnog dohotka:

Visina ličnog dohotka (u 000 din)

Broj radnika

10-20 10

33

Page 34: Predavanja iz statistike

20-30 3530-40 2740-50 550-60 3

Sa pouzdanošću od 90%, ocenite proporciju svih radnika čiji je lični dohodak veći od 40000 dinaraa. od 3,4% do 16,6%;b. Ne može se primeniti normalna aproksimacija;c. od 4,5% do 15,5%;d. od 84,5% do 95,5%;e. od 83,4% do 96,6%f. Ništa od navedenog već...

Po izboru, obraditi sledeće ispitne zadatke iz zbirke:

I grupa 4. zadatak IV grupa 10. zadatak VIII grupa 8. zadatak.

34

Page 35: Predavanja iz statistike

VIII nedelja

PREDAVANJA

Testiranje statističkih hipoteza Analiza varijanse sa jednim faktorom varijabiliteta

VEŽBE

I dvočas: Testiranje statističkih hipoteza - testiranje hipoteze o sredini osnovnog skupa

Pitanja:1. Nulta i alternativna hipoteza2. Oblast odbacivanja i neodbacivanja nulte hipoteze3. Greške i verovatnoće grešaka kod testiranja hipoteza4. Pristup donošenja odluka zasnovan na kritičnoj (tabličnoj) vrednosti 5. Pristup donošenja odluka zasnovan na p - vrednosti6. Postupak testiranja statističkih hipoteza

Postupak testiranja korišćenjem p-vrednosti 1. Postavljanje H0 i H1 i specifikacija nivoa značajnosti α.2. Izbor testa i izračunavanje statistike testa3. Provera pretpostavki i uslova na kojima se test zasniva4. Postavljanje pravila odlučivanja

- p-vrednost < α H0 odbacujemo (usvajamo H1)- izračunavamo p-vrednost (ili na osnovu komjuterskog outputa)- donosimo odluku o odbacivanju ili neodbacivanju H0

5. Zaključak

Pitanje. Prilikom testiranja nulte hipoteze H0:µ =100 protiv alternativne H1: µ100 , slučajan uzorak je dao aritmetičku sredinu 103 i p-vrednost 0,08. Na osnovu toga, uz rizik od 0,05 zaključujemo da

a) Postoji dovoljno razloga da zaključimo da je µ100.b) Postoji dovoljno razloga da zaključimo da je µ=100.c) Ne postoji dovoljno dokaza da zaključimo da je µ=100.d) Ne postoji dovoljno dokaza da zaključimo da je µ100.e) Postoji dovoljno razloga da zaključimo da je µ=103.f) Ništa od gore navedenog.

Primer 1. Proizvođač automobilskih guma tvrdi da je prosečan vek trajanja veći od 40000 kilometara, a da je standardna devijacija 5000 km. Ako je u uzorku od 150 guma prosečna dužina trajanja 40700 km, ispitajte, sa rizikom α = 0,05, da li se može prihvatiti tvrdnja proizvođača.

Rešenje: etape:1) H0: µ ≤ 40000 H1: µ > 400002) Uslovi: X: N(µ0; 50002) ® Z test3) ...z=1,71

35

Page 36: Predavanja iz statistike

4) Pravilo odlučivanja: p-vrednost < α H0 odbacujemo (usvajamo H1) p=P(Z >1,71)=1-P(Z ≤ 1,71)=1-0,9564= 0,0436 < 0,05 (α)

5) Uz rizik greške I vrste od 0,05 H0 odbacujemo i zaključujemo da se može prihvatiti tvrdnja proizvođača !

Primer 2. U slučajnom uzorku od 25 pakovanja jednog proizvoda prosečna težina iznosi 489 grama. Propisana težina pakovanja je 500 grama, a standardna devijacija iznosi 15 gr.

Ako težina pakovanja ima normalan raspored, utvrdite da li se na osnovu informacije iz uzorka može zaključiti da težina pakovanja odstupa od standarda; α = 0,01.

1) H0: µ = 500 H1: µ ≠ 500

2) Uslovi: X: N(µ0; 152) ® Z test

3) z=-3,6674) Pravilo odlučivanja: p-vrednost < α H0 odbacujemo (usvajamo H1)

p= 2P(Z >│3,667│)= 0 < 0,01 (α)5) Uz rizik α=0,01 odbacujemo H0; na osnovu informacije iz uzorka zaključujemo da težina pakovanja odstupa od standarda.

Primer 3. U reklami jednog servisa se tvrdi da prosečno vreme opsluživanja jednog klijenta iznosi manje od 30 minuta, a da je standarda devijacija 7 minuta. Ako smo u slučajnom uzorku od 36 klijenata zabeležili prosečno vreme opsluživanja od 28 minuta, ispitajte sa rizikom od 0,01, da li možemo prihvatiti tvrđenje servisa kao tačno.

1) H0: µ ≥ 30 H1: µ < 302) Z test Uslovi: X: N(µ0; 72) ® Z test3) z=-1,714) Pravilo odlučivanja: p-vrednost < α H0 odbacujemo (usvajamo H1)

p= P(Z < -1,714) = 0,0436 > 0,01 (α)5) Uz rizik α=0,01, H0 ne možemo odbaciti na osnovu podataka iz uzorka; zaključujemo da tvrđenje servisa ne možemo prihvatiti kao tačno!

Primer 4: Iz osnovnog skupa sa normalnim rasporedom uzet je prost slučajan uzorak od 16 opservacija radi testiranja nulte hipoteze H0:µ=10 protiv alternativne H1:µ<10. Budući da je standardna devijacija skupa nepoznata, t-test je primenjen. U kom od narednih slučajeva nulta hipoteza će biti odbačena na nivou od 0,05, ali ne na nivou 0,025?

a) t=2,12b) t= -2,50c) t= -2,12d) t=10-2,50=7,50e) t=10-2,12=7,88

36

Page 37: Predavanja iz statistike

II dvočas : Primeri: Testiranje hipoteza o proporciji osnovnog skupa

Primer 1. Komisija za kontrolu kvaliteta proizvoda tvrdi da je u tekućoj godini u jednoj fabrici došlo do promene broja neispravnih proizvoda, tj. da učešće neispravnih proizvoda odstupa od dosadašnjih 7%. Izvršena je kontrola kvaliteta proizvoda na uzorku od 200 proizvoda i utvrđeno da ima 24 neispravnih proizvoda. Da li ovaj uzorak odgovara tvrdjenju komisije?Rešenje:1. H0 : p= 0,07 H1 : p≠ 0,07 =0,05

2. z-test z = (0,12 – 0,07) / 0,018 = 2,773. Sva tri uslova ispunjena !

4. p < → H0 odbacujemop = 2P(Z>2,77) = 2[1-F(2,77)] = 0,0056 < =0,05

5. Odbacujemo H0 uz rizik =0,05 i zaključujemo................

Primer 2. Ako je pri testiranju nulte hipoteze H0:p=0,80 dobijena p-vrednost=0,0499 koja od sledećih odluka je korektna?

a) Ne može se odbaciti H0 jer je p-vrednost mala pri nivou značajnosti od 0,01.b) Odbacuje se H0 jer je p-vrednost mala pri nivou značajnosti od 0,01.c) Ne može se odbaciti H0 jer je p-vrednost velika.d) Odbacuje se H0 jer je p-vrednost velika pri nivou značajnosti od 0,01.e) Ne može se odbaciti H0 , pri nivou značajnosti od 0,01 jer je p-vrednost velika.

Primer 3. Prilikom jednočasovnog gostovanja tri predsednička kandidata na TV Pink, poslato je 350 SMS poruka u kojima je 253 gledalaca iskazalo svoju podršku Demokratskoj stranci. Minitab nam je dao sledeći izlaz:

Uzorak X N P 95,0%CIEgzaktna p-

vrednost1 253 350 0,722857 (0,672781;0,769117) 0,000

Pri testiranju H0 da će kandidat Demokratske stranke dobiti 68% glasova na predstojećim izborima zaključujemo:

a) H0 se ne može odbaciti, jer se 0,68 nalazi unutar intervala poverenja.b) H0 se odbacuje, jer se 0,68 ne nalazi unutar intervala poverenja.c) Testiranje se ne može sprovesti jer nije ispunjena normalna aproksimacija.d) Nema smisla sprovesti testiranje jer rezultati deluju nerealno.e) H0 se odbacuje, jer je..........f) Ništa od navedenog jer .............. uzorak nije slučajan.

Primeri: Testiranje hipoteza zasnovano na dva uzorka

Primer 1. Vrednosti prodaja dva proizvoda, A i B, imaju normalne rasporede sa varijansama din2 i din2. U prostom slučajnom uzorku od 20 prodaja proizvoda A

37

Page 38: Predavanja iz statistike

prosečna vrednost prodaje iznosi 170 dinara, a u uzorku od 30 prodaja proizvoda B prosečna vrednost je 182 dinara. Da li se prosečne vrednosti prodaja ova dva proizvoda među sobom razlikuju?(=0,05). Rešenje:

I etapa =0,05

II etapa Koristimo z-test.

III etapa – uslovi ispunjeni (nezavisnost slučajnih uzoraka, varijanse skupova poznate, normalni rasporedi osnovnih skupova)IV etapa p=2P(Z>2)=2(1-F(2))= 0,0456 p< H0 odbacujemo

V etapa Sa rizikom 0,05 odbacujemo H0 i zaključujemo da se prosečne vrednosti prodaja ova dva proizvoda među sobom razlikuju.

Primer 2. Ako je u uzorku od 10 prodavnica štampe u gradu A prosečna prodaja 4000 dnevnih listova i časopisa, a u uzorku od 8 prodavnica u gradu B ona iznosi 4300, ispitati da li se gradovi razlikuju u kupovini štampe. Standardna devijacija u I uzorku je 200 komada, a u II 250 (varijanse skupova jednake i nisu poznate).

1. H0: μ1 = μ2 H1: μ1 ≠ μ2 2. t test3. Ispunjeni uslovi: nezavisnost sl. uzoraka; s1=s2=?; normalan raspored

t=-2,8334. p < → H0 odbacujemo

p = 2P(T>│t │) = 2P(T > 2,833)n1+n2-2=16 2,583 < t=2,833 < 2,9208

2 • 0,005 < p < 2 • 0,01 0,01 < p < 0,02

38