Upload
others
View
1
Download
0
Embed Size (px)
Citation preview
Josipa Perkov, prof., pred. 1
4. MJERE DISPERZIJE4. MJERE DISPERZIJE
Josipa Perkov, prof., pred. 2
� Kod mnogih mjerenja se može opaziti da se rezultati grupiraju i skupljaju oko jedne srednje vrijednosti
� Srednja vrijednost dobro reprezentira rezultate ako su vrijednosti gusto grupirane (malo se razlikuju) oko srednje vrijednosti
� Srednja vrijednost loše reprezentira rezultate ako su vrijednosti minimalno grupirane oko srednje vrijednosti
� srednju vrijednost prikupljenih podataka potrebno je nadopuniti pokazateljem njihove raspršenosti (disperzije)
� mala vrijednost pokazatelja disperzije znači da je izračunata srednja vrijednost bolji reprezentant skupa podataka i obrnuto
Josipa Perkov, prof., pred. 3
� najpoznatije mjere disperzije:
(1) apsolutne mjere disperzije:
� raspon varijacije obilježja
� varijanca i standardna devijacija
� interkvartil
(2) relativne mjere disperzije:
� koeficijent varijacije
� koeficijent kvartilne devijacije
Josipa Perkov, prof., pred. 4
4.1. RASPON VARIJACIJE (RV)
� Najjednostavnija mjera disperzije (koriste se samo 2 vrijednosti)
� Za niz od N negrupiranih kvantitativnih podataka RV dan je izrazom:
� RV jednak je nuli kad nema disperzije
� RV u distribuciji frekvencija diskretne numeričke varijable je razlika između posljednje i prve vrijednosti
max minxR x x= −
1x kR x x= −
Josipa Perkov, prof., pred. 5
� RV distribucije frekvencija s razredima može se odrediti ako je poznata najveća i najmanja vrijednost varijable
� raspon se aproksimira kao razlika gornje granice posljednjeg i donje granice prvog razreda ili kao razlika razredne sredine posljednjeg i prvog razreda
� kod takvih distribucija frekvencija određivanje RV je nepouzdano
Josipa Perkov, prof., pred. 6
PRIMJER 1.
Prilikom dva puta po 10 mjerenja neke pojave, dobivena su 2 niza rezultata (rezultati su poredani po veličini)
1. mjerenje: 8 8.5 8.5 9 9 9 9 9.5 9.5 10
2. mjerenje: 1 2 3 5 9 9 13 15 16 17
Izračunajte aritmetičku sredinu i raspon varijacije za oba mjerenja. Interpretirajte rezultat.
Josipa Perkov, prof., pred. 7
4.2. INTERKVARTIL I KOEFICIJENT KVARTILNE DEVIJACIJE
� Kvantili su vrijednosti numeričke varijable koji niz uređen po veličini dijele na q jednakih dijelova
� Broj kvantila p je za jedan manji od njegova reda q , pr. medijan je kvantil reda q = 2 ⇒ p = 1 (dovoljna je jedna vrijednost da se niz podijeli u dva jednakobrojna dijela)
� Kvartili su kvantili koji dijele niz na 4 jednaka dijela,
decili su kvantili reda 10, percentili su kvantili reda 100, ...
Josipa Perkov, prof., pred. 8
Q1 Me Q3
25% 25%
Xmin Xmax
N/4 N/2 3N/4
Postoje 3 kvartila: prvi (donji) kvartil, drugi kvartil (medijan) i treći (gornji) kvartil
Josipa Perkov, prof., pred. 9
� TUMAČENJE KVARTILA:
� Donji kvartil je vrijednost varijable koja članove niza dijeli u dvije skupine� U 1. skupini se nalazi ¼ (25%) elemenata s vrijednostima varijable koja
je jednaka ili manja od kvartila
� U 2. skupini su ¾ (75%) članova s većim vrijednostima od kvartila
� Treći kvartil je vrijednost varijable koja dijeli niz na 2 dijela� U 1. skupini se nalazi ¾ (75%) elemenata s vrijednostima varijable
koja je jednaka ili manja od kvartila
� U 2. skupini su ¼ (25%) članova s većim vrijednostima od kvartila
� Drugi kvartil jednak je medijanu
Josipa Perkov, prof., pred. 10
� ODREĐIVANJE KVARTILA:
1. Uređivanje niza po veličini,
2. Pronalaženje članova s određenim rednim brojevima
donji kvartil:
gornji kvartil:
1
1
, , 14 4
, , 2 4 4
r
r r
N Nx INT r INT
Qx x N N
INT r+
≠ = +
= +
= =
3
1
3 3, , 1
4 4
3 3, ,
2 4 4
r
r r
N Nx INT r INT
Qx x N N
INT r+
≠ = +
= +
= =
INT je oznaka za “cijeli dio razlomka”
Josipa Perkov, prof., pred. 11
PRIMJER 2.
Promatramo dob zaposlenih u poduzeću X, stanje 31.12.2007.
xi : 28 23 59 25 23 20 31 48 32 god.
Odredite donji i gornji kvartil.
Josipa Perkov, prof., pred. 12
Donji kvartil:N = 9 ⇒ 9 / 4 ≠ INT ⇒ Q1= xr , r = INT(9/4) + 1 = 2 + 1 = 3Dakle, prvi kvartil je x3 , odnosno 23 godine (25% zaposlenih jemlađe ili jednako dobi od 23 godine, a 75% zaposlenih je starije ilijednako dobi od 23 godine)
Gornji kvartil:N = 9 ⇒ (3N / 4) ≠ INT ⇒ Q3= xr , r = INT(27/4) + 1 = 6 + 1 = 7Gornji kvartil je x7 , odnosno 32 godine (75% zaposlenih je mlađeili jednako dobi od 32 godine, a 25% zaposlenih je starije ili jednako dobi od 32godine)
Uredimo prvo zadani niz:20 23 23 25 28 31 32 48 59
Josipa Perkov, prof., pred. 13
1
1 1var
4
k
Nf
Q L if
−
= + ⋅
∑ 1
3 1var
3
4
k
Nf
Q L if
−
= + ⋅
∑
Izraz za određivanje gornjeg kvartila
distribucije frekvencija
Izraz za određivanje donjeg kvartila
distribucije frekvencija
L1 označava donju granicu razreda u kojemu se nalazi donji (gornji) kvartil,
Σ f1 označava zbroj frekvencija do kvartilnog razreda,
f kvar je oznaka za frekvenciju kvartilnog razreda
Josipa Perkov, prof., pred. 14
PRIMJER 3.
Tabela. Gradovi prema broju izgrađenih stanova
26Ukupno
5
8
6
4
2
1
50 – 150
150 – 250
250 – 350
350 – 450
450 – 550
550 – 650
Broj gradovaBroj izgrađenih
stanova
Odredite donji i gornji kvartil. Interpretirajte rezultate.
Josipa Perkov, prof., pred. 15
-
5
13
19
23
25
26
Kumulativni niz
“manje od”
-
100
200
300
400
500
600
Razredna
sredina
26Ukupno
5
8
6
4
2
1
50 – 150
150 – 250
250 – 350
350 – 450
450 – 550
550 – 650
Broj gradovaBroj izgrađenih
stanova
Donji kvartil: 26/4 ≠ INT ⇒ r = INT(26/4) + 1 = 6 + 1 = 7
Gornji kvartil: r = INT (3·26 / 4) + 1 = 19 + 1 = 20
Josipa Perkov, prof., pred. 16
� Interkvartil (oznaka: Iq) je apsolutna mjera disperzije koja pokazuje veličinu raspona varijacije središnjih 50% podataka uređenog numeričkog niza – iz razmatranja se isključuje po 25% najmanjih i najvećih vrijednosti obilježja
� Računa se kao razlika između gornjeg i donjeg kvartila
Iq = Q3 – Q1
� Nije potpuna mjera disperzije jer se za njegovo računanje koriste samo dvije vrijednosti
Što je interkvartilbrojčano manji disperzija će biti manja i obrnuto
Josipa Perkov, prof., pred. 17
� Može se izračunati i koeficijent kvartilne devijacije (oznaka Vq)
� Disperzija je to manja što je Vq bliže nuli, a relativno veća
što se više približava jedinici
� Izračunajte interkvartil i koeficijent kvartilne devijacije u primjeru 3. Interpretirajte rezultat.
3 1
3 1
, 0 1q q
Q QV V
Q Q
−= ≤ ≤
+
Josipa Perkov, prof., pred. 18
4.3. VARIJANCA, STANDARDNA DEVIJACIJA 4.3. VARIJANCA, STANDARDNA DEVIJACIJA I KOEFICIJENT VARIJACIJEI KOEFICIJENT VARIJACIJE
� Razlike između vrijednosti numeričke varijable i njezine AS pokazivat će stupanj varijacije (što su razlike veće veći je i stupanj varijabilnosti i obrnuto)
� Varijanca je aritmetička sredina kvadrata odstupanja vrijednosti numeričke varijable X od njezine aritmetičke sredine, a za negrupirane podatke računamo je po formuli:
Napomena: Umjesto apsolutnih, pri računanju varijance dopuštena je upotreba i relativnih frekvencija
2
2 2
1 1
1 1N N
i i
i i
x xN N
σ
= =
= −
∑ ∑
ili 2
2 2 2
1 1
1 1N N
i i
i i
b d dN N
σ
= =
= −
∑ ∑
Josipa Perkov, prof., pred. 19
� Radi lakše prosudbe stupnja varijabilnosti obilježja definira se standardna devijacija kao pozitivni drugi korijen iz varijance:
� Standardna devijacija je prosječno odstupanje vrijednosti
numeričke varijable od njezine aritmetičke sredine – smije se
računati samo uz AS
2
2
1 1
1 1N N
i i
i i
x xN N
σ
= =
= −
∑ ∑ ili
2
2
1 1
1 1N N
i i
i i
b d dN N
σ
= =
= −
∑ ∑
kao brza kontrola nam može poslužiti odnos između raspona i standardne devijacije: taj odnos gotovo nikad nije manji od 2 ili veći od 6.5
Josipa Perkov, prof., pred. 20
� Varijanca distribucije frekvencija diskretne numeričke varijable je vagani prosjek kvadrata odstupanja vrijednosti te varijable od njezine AS:
� Varijanca i iz nje izvedena standardna devijacija je najvažnija
mjera disperzije (potpuna mjera disperzije) – kad su poznate AS i
standardna devijacija nekih rezultata, onda su ti rezultati potpuno
definirani
2
2 2
1 1
1 1N N
i i i i
i i
f x f xN N
σ
= =
= −
∑ ∑ ili
2
2 2 2
1 1
1 1N N
i i i i
i i
b f d f dN N
σ
= =
= −
∑ ∑
Simbol xi označava originalne vrijednosti obilježja (ako su formirane grupe) ili njihove procjene, tj. vrijednosti razrednih sredina
Josipa Perkov, prof., pred. 21
� Kad su nam poznate aritmetička sredina i standardna devijacija nekih rezultata tada ih možemo uspoređivati s drugim rezultatima – koeficijent varijacije
� Koeficijent varijacije je omjer standardne devijacije i
aritmetičke sredine pomnožen sa sto, tj. pokazuje koliki postotak
vrijednosti AS iznosi vrijednost standardne devijacije:
� Koeficijent varijacije je relativna mjera disperzije
100Vx
σ= ⋅
Reprezentativnost AS je vrlo velika
ako je koef. varijacije ispod 20%
Josipa Perkov, prof., pred. 22
PRIMJER 4.
Statistički skup čini 30 učenika jednog razreda, a promatrano obilježje je uspjeh učenika. Dobiveni su ovi podaci:
4 3 4 3 1 3 4 3 3 32 4 1 5 3 4 1 3 3 13 5 4 3 1 4 5 4 1 3
a) Sastavite tablicu distribucije frekvencijab) Nacrtajte histogram frekvencijac) Izračunajte aritmetičku sredinu, varijancu, standardnu
devijaciju i koeficijent varijacije
Josipa Perkov, prof., pred. 23
PRIMJER 5.
godine starosti broj radnikax i f i
18 - 20 220 - 22 522 - 28 628 - 32 4
Izračunajte prosječnu starost radnika poduzeća X, varijancu i standardnu devijaciju za podatke navedene u tabeli:
Josipa Perkov, prof., pred. 24
4.4. STANDARDIZIRANA VARIJABLA. 4.4. STANDARDIZIRANA VARIJABLA. PRAVILO PRAVILO ČČEBIEBIŠŠEVAEVA
� Da bi se utvrdio položaj numeričkog podatka u nizu primjenjuje se standardizirana vrijednost varijable ( z – obilježje)
� Standardizirano obilježje je odstupanje vrijednosti numeričkog obilježja od aritmetičke sredine izraženo u jedinicama standardne devijacije:
� Budući da standardizirano obilježje ne ovisi o mjernim jedinicama, može poslužiti za usporedbu položaja podataka u raznovrsnim nizovima
, 1, 2,...,i
i
x xz i N
σ
−= =
Josipa Perkov, prof., pred. 25
Prosječna plaća u poduzeću A iznosi 6.000,00 kn s prosječnim
odstupanjem od 1.000,00 kn. U poduzeću B prosječna plaća
iznosi 10.000,00 kn s prosječnim odstupanjem od 2.000,00 kn.
Usporedite relativni položaj osobe s plaćom 8.000,00 kn u poduzeću A s položajem osobe s plaćom od 11.500,00 kn u poduzeću B
PRIMJER 6.
Josipa Perkov, prof., pred. 26
� Usporedimo relativni položaj osobe s plaćom od 8.000,00 kn u poduzeću A s položajem osobe s plaćom od 11.500,00 kn u poduzeću B
8000 60002
1000AA
A
x xz
σ
− −= = =
Obje osobe imaju iznadprosječnu plaću. Osoba iz poduzeća A u relativno je povoljnijem položaju na platnoj listi od osobe B, jer njezina plaća odstupa od prosjeka za + 2 standardne devijacije
75.02000
1000011500=
−=
−=
σ
BBB
xxz
Josipa Perkov, prof., pred. 27
Prosječni ostvareni ukupni godišnji prihod iznosio je 200
milijuna kn s prosječnim odstupanjem od 10 milijuna kn.
Prosječna stopa dobiti za skupinu iznosi 9.8 s prosječnim
odstupanjem od 2.2.
Prihod odabranog poduzeća iznosi 185 milijuna kn, a stopa
dobiti 5.6. Kakav je položaj poduzeća u skupini s obzirom na:
a) prihod,
b) stopu dobiti ?
PRIMJER 7.
Josipa Perkov, prof., pred. 28
� Standardizirana varijabla poprima različite vrijednosti, koje po predznaku mogu biti pozitivne i negativne
� Pravilo Čebiševa:
pojas od obuhvaća najmanje 75% svih podataka,
pojas od obuhvaća najmanje 88.89% svih podataka
2x σ±
3x σ±
Josipa Perkov, prof., pred. 29
Uzmimo osnovni skup od 20.000 žiro-računa komitenata jedne
banke. Prosječno kvartalno stanje sredstava iznosi 500.000,00 kn s
prosječnim odstupanjem od 100.000,00 kn
Pomoću pravila Čebiševa procijenite broj računa s
prosječnim stanjem kvartalnih stanja između 300.000,00 i
700.000,00 kn.
PRIMJER 8.
Josipa Perkov, prof., pred. 30
PITANJA ZA USMENI DIO ISPITAPITANJA ZA USMENI DIO ISPITA
1. Objasnite pojam raspršenosti. Nabrojite najvažnije mjere disperzije.
2. Koje su relativne mjere disperzije? Navedite njihova svojstva.
3. Koje su apsolutne mjere disperzije? Navedite njihova svojstva.
4. Što je standardizirano obilježje? Navedite pravilo Čebiševa.