58
Statistika u ekonomiji i menadžmentu 1 III sedmica Mjere disperzije, oblika distribucije i koncentracije

SEIM III Sedmica 2010 2011 Mjere Varijacije i Oblika Distribucije Za Web

Embed Size (px)

Citation preview

Page 1: SEIM III Sedmica 2010 2011 Mjere Varijacije i Oblika Distribucije Za Web

Statistika u ekonomiji i menadžmentu

1

III sedmica

Mjere disperzije, oblika

distribucije i koncentracije

Page 2: SEIM III Sedmica 2010 2011 Mjere Varijacije i Oblika Distribucije Za Web

Statistika u ekonomiji i menadžmentu 2

2.5.1. Apsolutne mjere disperzije 67

2.5.1.1. Raspon varijacije 67

2.5.1.2. Interkvantilno apsolutno odstupanje 67

2.5.1.3. Box Plot 67

2.5.1.4. Srednje apsolutno odstupanje 69

2.5.1.5. Varijansa 71

2.5.1.6. Standardna devijacija 74

2.5. MJERE DISPERZIJE ILI VARIJACIJE 66

Page 3: SEIM III Sedmica 2010 2011 Mjere Varijacije i Oblika Distribucije Za Web

Statistika u ekonomiji i menadžmentu 3

2.5.2. Relativne mjere disperzije 75

2.5.2.1. Interkvantilna relativna odstupanja 75

2.5.2.2. Koeficijent kvartilne devijacije 76

2.5.2.3. Koeficijent varijacije 76

2.5.2.4. Standardizovane varijable 76

Page 4: SEIM III Sedmica 2010 2011 Mjere Varijacije i Oblika Distribucije Za Web

Statistika u ekonomiji i menadžmentu 5

Raspon varijacije

Raspon varijacije:

RV = xmax-xmin

Page 5: SEIM III Sedmica 2010 2011 Mjere Varijacije i Oblika Distribucije Za Web

Statistika u ekonomiji i menadžmentu 6

Interkvantilna odstupanja su :

•Interdecilno odstupanje ID : D9-D1

•Interkvartilno odstupanje IQ : Q3-Q1

•Intercentilno odstupanje IC : C99-C1

Page 6: SEIM III Sedmica 2010 2011 Mjere Varijacije i Oblika Distribucije Za Web

Statistika u ekonomiji i menadžmentu 7

Box plot

25% 25%

Q1 Q3 x min x max Me

25% 25%

Page 7: SEIM III Sedmica 2010 2011 Mjere Varijacije i Oblika Distribucije Za Web

Statistika u ekonomiji i menadžmentu 8

0,1,0,3,1,1,2,1,1,0,1

N

i

i xxN

MAD1

1

N

i

i xxN

MAD1)(

)(

1

Srednje absolutno odstupanje

Formula za neureĎenu ( negrupisanu)seriju

Formula za rangiranu, ureĎenu seriju

Page 8: SEIM III Sedmica 2010 2011 Mjere Varijacije i Oblika Distribucije Za Web

Statistika u ekonomiji i menadžmentu 9

0,1,0,3,1,1,2,1,1,0,1

J

j

jj xxfN

MAD1

1

(ili 100)

J

j

jj xxpMAD1

J

j

jfN1

gdje je

gdje je

J

j

jp1

1

Za statističku distribuciju frekvencija

Za statističku distribuciju relativnih frekvencija

Page 9: SEIM III Sedmica 2010 2011 Mjere Varijacije i Oblika Distribucije Za Web

Statistika u ekonomiji i menadžmentu 10

0,1,0,3,1,1,2,1,1,0,1

N

i

iX xxN 1

22 1

Varijansa

Za neureĎenu (negrupisanu) seriju:

Page 10: SEIM III Sedmica 2010 2011 Mjere Varijacije i Oblika Distribucije Za Web

Statistika u ekonomiji i menadžmentu 11

0,1,0,3,1,1,2,1,1,0,1

gdje

(ili 100%)

J

j

jjX xxfN 1

22 1

J

j

jjX xxp1

22

J

j

jfN1

J

j

jp1

1gdje

Za statističku distribuciju frekvencija:

Za statističku distribuciju relativnih frekvencija:

Page 11: SEIM III Sedmica 2010 2011 Mjere Varijacije i Oblika Distribucije Za Web

Statistika u ekonomiji i menadžmentu 12

0,1,0,3,1,1,2,1,1,0,1

N

i

ii

N

i

iX xxxxN

xxN 1

22

1

22 211

Razvijena formula varijanse – prema König-u

N

i

N

i

N

i

iiX xN

xN

xx

N 1 1

2

1

22 121

N

i

iX xNN

xNN

xx

N 1

222 121

N

i

iX xxxN 1

2222 21

Page 12: SEIM III Sedmica 2010 2011 Mjere Varijacije i Oblika Distribucije Za Web

Statistika u ekonomiji i menadžmentu 13

2

1

22 1xx

N

N

i

ix

222 xxx

Page 13: SEIM III Sedmica 2010 2011 Mjere Varijacije i Oblika Distribucije Za Web

Statistika u ekonomiji i menadžmentu 14

Dokažite da su razvijene formule varijanse

za statističku distribuciju frekvencija i

relativnih frekvencija jednake:

2

1

22 1xxf

N

J

j

jjx

22

1

2 xxp j

J

j

jx

Page 14: SEIM III Sedmica 2010 2011 Mjere Varijacije i Oblika Distribucije Za Web

Statistika u ekonomiji i menadžmentu 15

0,1,0,3,1,1,2,1,1,0,1

Formalizacija osobina varijanse

VarXabaXVar

VarXaaXVar

VarXbXVar

2

2

)(

)(

)(

Page 15: SEIM III Sedmica 2010 2011 Mjere Varijacije i Oblika Distribucije Za Web

Statistika u ekonomiji i menadžmentu 16

0,1,0,3,1,1,2,1,1,0,1

Standardna devijacija

N

xxN

i

i

XX

1

2

2

)(

Standardna devijacija predstavlja prosječno odstupanje

vrijednosti numeričke varijable od njene aritmetičke sredine.

Page 16: SEIM III Sedmica 2010 2011 Mjere Varijacije i Oblika Distribucije Za Web

Statistika u ekonomiji i menadžmentu 17

n

i

iXX

n

i

iXX

xxN

xxN

1

222

1

22

1

1

Page 17: SEIM III Sedmica 2010 2011 Mjere Varijacije i Oblika Distribucije Za Web

Statistika u ekonomiji i menadžmentu 19

Interkvantilno relativno odstupanje

Relativne mjere disperzije ili varijabiliteta

1

3....

1

9....

1

99

Q

Q

D

D

C

C

Page 18: SEIM III Sedmica 2010 2011 Mjere Varijacije i Oblika Distribucije Za Web

Statistika u ekonomiji i menadžmentu 20

Interkvartilno odstupanje se može

definisati i na slijedeći način

1

13

Q

QQ

Page 19: SEIM III Sedmica 2010 2011 Mjere Varijacije i Oblika Distribucije Za Web

Statistika u ekonomiji i menadžmentu 21

Koeficijent kvartilne devijacije

10,13

13

QDQD k

QQ

QQk

Page 20: SEIM III Sedmica 2010 2011 Mjere Varijacije i Oblika Distribucije Za Web

Statistika u ekonomiji i menadžmentu 22

Koeficijent varijacije

xkV

Koeficijent varijacije je neimenovani broj i

izražava se u %

Page 21: SEIM III Sedmica 2010 2011 Mjere Varijacije i Oblika Distribucije Za Web

Statistika u ekonomiji i menadžmentu 24

Standardizovane varijable

Za utvrĎivanje relativnog položaja numeričke vrijednosti varijable u seriji primjenjuje se standardizirana vrijednost varijable.

N2,..., 1,i ,

xxz i

i

Page 22: SEIM III Sedmica 2010 2011 Mjere Varijacije i Oblika Distribucije Za Web

Statistika u ekonomiji i menadžmentu 25

N

i

i

N

i

iN

i

i

xxNN

xx

N

z

z1

11 01

Page 23: SEIM III Sedmica 2010 2011 Mjere Varijacije i Oblika Distribucije Za Web

Statistika u ekonomiji i menadžmentu 26

1 11

1

1

1

1

2

2

1

2

1

2

1

22

N

i

i

N

i

iN

i

i

N

i

iz

xxN

xx

Nz

Nzz

N

2

Page 24: SEIM III Sedmica 2010 2011 Mjere Varijacije i Oblika Distribucije Za Web

Statistika u ekonomiji i menadžmentu 27

Prema teoremi Čebiševa u nekoj distribuciji

ima najmanje 211 k

observacija koje se nalaze izmeĎu aritmetičke

sredine i manje ili više k puta standardna

devijacija, dakle u intervalu kx

1k ,1

1)(2

k

kxXkxP

ili

Istovremeno tumačenje aritmetičke sredine

i standardne greške: Čebiševa teorema

Page 25: SEIM III Sedmica 2010 2011 Mjere Varijacije i Oblika Distribucije Za Web

Statistika u ekonomiji i menadžmentu 28

0,1,0,3,1,1,2,1,1,0,1

840;460952650 kx

%752

11

11

22

kPrema teoremi Čebišev-a najmanje 75% plata

ove distribucije se nalaze u intervalu izmeĎu 460 i

840 KM.

Primjer : Raspodjela neto mjesečnih plata

• prosječna plata : 650 KM

• standardna devijacija : 95 KM

• izbor : k=2

Page 26: SEIM III Sedmica 2010 2011 Mjere Varijacije i Oblika Distribucije Za Web

Statistika u ekonomiji i menadžmentu 29

2.6. MJERE OBLIKA DISTRIBUCIJE 80

2.6.1. Momenti distribucije frekvencija 80

2.6.2. Mjere asimetrije 81

2.6.3. Parametri spljoštenosti 84

Page 27: SEIM III Sedmica 2010 2011 Mjere Varijacije i Oblika Distribucije Za Web

Statistika u ekonomiji i menadžmentu 31

NxxfN

r

j

J

j

jr ,...,1,0r ,1

1

NxxN

r

i

N

i

r ,...,1,0r ,1

1

Centralni moment r-tog reda

Mjere oblika distribucije frekvencija

Page 28: SEIM III Sedmica 2010 2011 Mjere Varijacije i Oblika Distribucije Za Web

Statistika u ekonomiji i menadžmentu 32

Mjere oblika distribucije frekvencija

Mjere asimetrije

Mjere zaobljenosti ili

spljoštenosti

i

Page 29: SEIM III Sedmica 2010 2011 Mjere Varijacije i Oblika Distribucije Za Web

Statistika u ekonomiji i menadžmentu 33

Polazna veličina za mjerenje asimetrije je treći

momenat oko sredine.

Za negrupisane podatke moment trećeg reda

je jednak:

N

xxN

i

i

1

3

3

Page 30: SEIM III Sedmica 2010 2011 Mjere Varijacije i Oblika Distribucije Za Web

Statistika u ekonomiji i menadžmentu 34

Za grupisanu distribuciju frekvencija treći

moment oko sredine je jednak:

J

1j

j

1

3

3 fN ,N

xxfJ

j

jj

Page 31: SEIM III Sedmica 2010 2011 Mjere Varijacije i Oblika Distribucije Za Web

Statistika u ekonomiji i menadžmentu 35

asimetrija lijeva 0

asimetrija desna 0

simetrija 0

3

3

3

Page 32: SEIM III Sedmica 2010 2011 Mjere Varijacije i Oblika Distribucije Za Web

Statistika u ekonomiji i menadžmentu 36

Ficher-ov koeficijent asimetrije:

3

33

Page 33: SEIM III Sedmica 2010 2011 Mjere Varijacije i Oblika Distribucije Za Web

Statistika u ekonomiji i menadžmentu 37

[-2;+2].

asimetrija lijeva 0

asimetrija desna 0

simetrija 0

3

3

3

Ovaj koeficijent predstavlja relativnu

mjeru smjera i veličine asimetrije.

Page 34: SEIM III Sedmica 2010 2011 Mjere Varijacije i Oblika Distribucije Za Web

Statistika u ekonomiji i menadžmentu 38

Pearsonov koeficijet:

je predstavljen kao standardizirano odstupanje

moda od aritmetičke sredine.

Najčešća vrijednost ovog koeficijenta se nalazi

u intervalu [-3;+3]

O

k

MxS

Page 35: SEIM III Sedmica 2010 2011 Mjere Varijacije i Oblika Distribucije Za Web

Statistika u ekonomiji i menadžmentu 39

Mo = Me = x

; 00 33

Simetrična distribucija

jf

jx

0kS

Page 36: SEIM III Sedmica 2010 2011 Mjere Varijacije i Oblika Distribucije Za Web

Statistika u ekonomiji i menadžmentu 40

Asimetrična distribucija

desna asimetrija

Me < Mo < x

; 00 33 jf

jx

0kS

Page 37: SEIM III Sedmica 2010 2011 Mjere Varijacije i Oblika Distribucije Za Web

Statistika u ekonomiji i menadžmentu 41

Asimetrična distribucija

lijeva asimetrija

< Me < Mo x

;00 33

jx

jf 0kS

Page 38: SEIM III Sedmica 2010 2011 Mjere Varijacije i Oblika Distribucije Za Web

Statistika u ekonomiji i menadžmentu 42

Parametri zaobljenosti

Četvrti moment oko sredine:

J

j

jj

N

i

i

xxfN

xxN

1

J

1j

j

4

4

1

4

4

fN ,)(1

1

Page 39: SEIM III Sedmica 2010 2011 Mjere Varijacije i Oblika Distribucije Za Web

Statistika u ekonomiji i menadžmentu 43

•Pearsonov koeficijent zaobljenosti:

Ficherov koeficijent zaobljenosti je

jednak:

4

44

34

44

Page 40: SEIM III Sedmica 2010 2011 Mjere Varijacije i Oblika Distribucije Za Web

Statistika u ekonomiji i menadžmentu 44

0 ;3 44

0 ;3 44

0 ;3 44

Normalna distribucija

jf

jxx

Page 41: SEIM III Sedmica 2010 2011 Mjere Varijacije i Oblika Distribucije Za Web

Statistika u ekonomiji i menadžmentu 45

Page 42: SEIM III Sedmica 2010 2011 Mjere Varijacije i Oblika Distribucije Za Web

Statistika u ekonomiji i menadžmentu 46

Ocjena xj Frekvencije fj

6 4

7 8

8 7

9 6

10 9

Ukupno 34

Primjer 8.

Page 43: SEIM III Sedmica 2010 2011 Mjere Varijacije i Oblika Distribucije Za Web

Statistika u ekonomiji i menadžmentu 47

Mean 8,24

Standard Error 0,24

Median 8,00

Mode 10,00

Standard Deviation 1,39

Sample Variance 1,94

Kurtosis -1,29

Skewness -0,09

Range 4,00

Minimum 6,00

Maximum 10,00

Sum 280,00

Count 34,00

Confidence

Level(95,0%) 0,49

Tabela 15. Rezultat dobijen primjenom Excela

Page 44: SEIM III Sedmica 2010 2011 Mjere Varijacije i Oblika Distribucije Za Web

Statistika u ekonomiji i menadžmentu 48

2.7. MJERE KONCENTRACIJE 87

2.7.1. Lorenzova kriva 87

2.7.2. Ginijev koeficijent 91

2.7.2.1. OdreĎivanje Ginijevog koeficijenta metodom

trapeza 92

2.7.2.2. OdreĎivanje Ginijevog koeficijenta metodom

trouglova 93

2.7.3. Medijala 95

Page 45: SEIM III Sedmica 2010 2011 Mjere Varijacije i Oblika Distribucije Za Web

Statistika u ekonomiji i menadžmentu 49

Mjere koncentracije

Najpoznatije su dvije mjere koncentracije:

1. Lorenzova kriva ili kriva koncentracije

2. Ginijev koeficijent.

Page 46: SEIM III Sedmica 2010 2011 Mjere Varijacije i Oblika Distribucije Za Web

Statistika u ekonomiji i menadžmentu 50

111

1

N

j

j

N

j

j

N

j

jj

jj

j

j

j

xx

jj

xx

jj

qp

fx

fxq

N

fp

qQ

pF

j

j

Page 47: SEIM III Sedmica 2010 2011 Mjere Varijacije i Oblika Distribucije Za Web

Statistika u ekonomiji i menadžmentu 51

A

Fj 1 0

A 1 B

Qj

Jednaka raspodjela

Površina koncentracije

S

C

Lorenzova kriva

Page 48: SEIM III Sedmica 2010 2011 Mjere Varijacije i Oblika Distribucije Za Web

Statistika u ekonomiji i menadžmentu 52

totalna jednakost

totalna nejednakost

Page 49: SEIM III Sedmica 2010 2011 Mjere Varijacije i Oblika Distribucije Za Web

Statistika u ekonomiji i menadžmentu 53

Godišnja

potrošnja per capita

% udjela u

stanovništvu

% udjela u

stanovništvu - kumulativno

% udjela u

potrošnji

% udjela u

potrošnji - kumulativno

0 - 1830 10% 10% 2,39% 2,39%

1830 - 2390 10% 20% 5,15% 7,54%

2390 - 2778 10% 30% 6,23% 13,77%

2778 - 3185 10% 40% 7,17% 20,94%

3185 - 3637 10% 50% 8,19% 29,13%

3637 - 4148 10% 60% 9,35% 38,48%

4148 - 4803 10% 70% 10,67% 49,15%

4803 - 5670 10% 80% 12,53% 61,69%

5670 - 7128 10% 90% 15,09% 76,78%

7128 - 24581 10% 100% 23,22% 100,00%

Tabela 13. Raspodjela potrošnje per capita u BiH za 2003. g.

Page 50: SEIM III Sedmica 2010 2011 Mjere Varijacije i Oblika Distribucije Za Web

Statistika u ekonomiji i menadžmentu 54

0,0%

10,0%

20,0%

30,0%

40,0%

50,0%

60,0%

70,0%

80,0%

90,0%

100,0%

0,0%

10,0

%

20,0

%

30,0

%

40,0

%

50,0

%

60,0

%

70,0

%

80,0

%

90,0

%

100,

0%

Lorencova

kriva za BiH

Potpuna

jednakost

Grafik 3. Lorencova kriva potrošnje per capita u BiH za 2003. g.

30027,0Gini

Page 51: SEIM III Sedmica 2010 2011 Mjere Varijacije i Oblika Distribucije Za Web

Statistika u ekonomiji i menadžmentu 55

Ginijev koeficijent je relativna mjera

koncentracije.

Definisan je kao odnos površine

koncentracije i površine trougla koji se

nalazi ispod dijagonale koja predstavlja

pravac jednake raspodjele.

Ginijev koeficijent

Page 52: SEIM III Sedmica 2010 2011 Mjere Varijacije i Oblika Distribucije Za Web

Statistika u ekonomiji i menadžmentu 56

0

20

40

60

80

100

0 20 40 60 80 100

Ginijev koeficijent = 2 puta površina

koncentracije

Kumulativna frekvencija

u %

Kumulativni agregat

u %

Površina koncentracije

b B

h

Fj-1 Fj

Qj-1

Qj 2

)( hBb

Page 53: SEIM III Sedmica 2010 2011 Mjere Varijacije i Oblika Distribucije Za Web

Statistika u ekonomiji i menadžmentu 57

Formula za računanje Ginijevog

koeficijenta metodom trapeza:

2

)(

2

12

hBbG

22

12

11 jjjj FFQQG

jjj QQpG 11

)(10

11 14 jjj QQpG

ili ako koristimo relativne frekvencije izražene u %.

Page 54: SEIM III Sedmica 2010 2011 Mjere Varijacije i Oblika Distribucije Za Web

Statistika u ekonomiji i menadžmentu 58

Ginijev koeficijent G

Ginijev koeficijent kreće se u intervalu

[0;1].

Dva granična slučaja su vrijednosti

koeficijenta 0 i 1.

SS

G 25,0OAC trouglaPovršina

ijekoncentrac Površina

Page 55: SEIM III Sedmica 2010 2011 Mjere Varijacije i Oblika Distribucije Za Web

Statistika u ekonomiji i menadžmentu 59

Kada je Ginijev koeficijent jednak 0

koncentracija je jednaka nuli i postoji

perfektna jednakost u raspodjeli

agregata.

Ako je G jednak jedinici koncentracija je

maksimalna i postoji maksimalna

nejednakost u raspodjeli ukupne mase

primanja.

Page 56: SEIM III Sedmica 2010 2011 Mjere Varijacije i Oblika Distribucije Za Web

Statistika u ekonomiji i menadžmentu 60

OdreĎivanje Ginijevog koeficijenta

metodom trouglova

1

1

11

J

j

jjjj QFQFG

Page 57: SEIM III Sedmica 2010 2011 Mjere Varijacije i Oblika Distribucije Za Web

Statistika u ekonomiji i menadžmentu 61

Medijala

Medijala je vrijednost varijable pridružena

relativnoj kumulativnoj rastućoj globalnoj

vrijednosti

OdreĎivanje medijale:

-izračunati globalne vrijednosti fjxj

-izračunati relativne globalne vrijednosti qj

- izračunati relativne kumulativne rastuće

globalne vrijednosti

-odrediti medijalnu klasu

- izračunati vrijednost medijale

%50jQ

jQ

Page 58: SEIM III Sedmica 2010 2011 Mjere Varijacije i Oblika Distribucije Za Web

Statistika u ekonomiji i menadžmentu 62

Odstupanje medijala-medijana:

nam daje prvu informaciju o koncentraciji: ako

je odstupanje veće i koncentracija je veća.

l

ld

lld xxQxQ

xQxxMle

)()(

)(,500

MeMleM