28
Appunti sulla concentrazione a.a. 2012-2013 a.a. 2012-2013 v.3 v.3

Appunti sulla concentrazione a.a. 2012-2013 v.3. 2 Sommario Introduzione La curva di concentrazione Indici di concentrazione Confronti Riferimenti

Embed Size (px)

Citation preview

Page 1: Appunti sulla concentrazione a.a. 2012-2013 v.3. 2 Sommario Introduzione La curva di concentrazione Indici di concentrazione Confronti Riferimenti

Appunti sulla concentrazione

aa 2012-2013aa 2012-2013

v3v3

2

Sommariobull Introduzionebull La curva di concentrazionebull Indici di concentrazionebull Confrontibull Riferimenti

3

Introduzione

La concentrazione puograve essere studiata per caratteri trasferibili ovvero caratteri quantitativi che almeno in linea di principio

possono essere trasferiti tra le unitagrave considerate

Es il reddito egrave un carattere trasferibile (tra gli individui) come lo sono il patrimonio il numero di azioni di una certa azienda (tra gli azionisti) e i finanziamenti ricevuti dalle regioni italiane (tra le regioni stesse)

Es lrsquoetagrave non egrave un carattere trasferibile (tra gli individui) e non lo egrave neppure lrsquointensitagrave delle precipitazioni (tra le localitagrave considerate)

4

IntroduzioneIntuitivamente un carattere statistico (si pensi ad esempio al reddito) egrave tanto piugrave concentrato quanto piugrave risulta suddiviso tra poche unitagrave della popolazione

Ogni situazione reale saragrave intermedia tra due situazioni estreme che chiameremo di concentrazione massima e di equiripartizione Si ha massima concentrazione quando una sola unitagrave statistica possiede la totalitagrave del carattere Si parla invece di equiripartizione quando tutte le unitagrave della popolazione possiedono la stessa quantitagrave di carattere

5

Curva di concentrazione

Consideriamo un carattere quantitativo trasferibile ordiniamo le quantitagrave del carattere (intensitagrave) possedute dalle unitagrave statistiche in senso non decrescente e definiamoNxxx 0 21

6

Curva di concentrazione

La curva di Lorenz (o curva di concentrazione) si ottiene rappresentando

le coppie (Fi Qi) nello spazio cartesiano e congiungendole

Il generico punto (Fi Qi) della curva si puograve interpretare nel seguente

modo lrsquo (Fi 100) piugrave povero di carattere possiede il (Qi 100) del carattere totale

Valgono le seguenti

1) (FNQN)=(11)

2) Qi le Fi per ogni i

La 2) segue dal fatto che

7

Curva di concentrazione

La curva di concentrazione egrave sempre compresa potendo eventualmente coincidere tra le due seguenti

1La bisettrice di equazione Q=F Lungo la bisettrice Fi=Qi per ogni i da cui segue che ogni unitagrave possiede una quantitagrave di carattere pari alla media dello stesso nella popolazione La bisettrice rappresenta quindi la situazione di equiripartizione

2 La curva passante per i punti (Fi0) i=1hellipN-1 e (11) In tal caso tutto il carattere egrave concentrato in una sola unitagrave statistica (lrsquoN-esima) e rappresenta quindi la situazione di massima concentrazione

Un esempio

8

80 90 21 23 32 16 62Dati i redditi di 7 individui

per ricavare la curva di concentrazione organizziamo le osservazioni in tabella (avendo cura di ordinarle in base ai valori di x ad esempio X1=16 percheacute lrsquoindividuo piugrave povero possiede 16) calcoliamo le coordinate dei punti (FiQi) e le congiungiamo Nel caso in esame la curva egrave piugrave vicina alla bisettrice

i x_i F_i Q_i

0 0 0

1 16 01429 00494

2 21 02857 01142

3 23 04286 01852

4 32 05714 02840

5 62 07143 04753

6 80 08571 07222

7 90 1 1

9

Indici di concentrazione

La curva di Lorenz-Gini egrave uno strumento grafico per rappresentare la concentrazione di un carattere Puograve tuttavia essere comodo valutare la concentrazione attraverso un indice numerico

Intuitivamente quanto piugrave la bisettrice si discosta dalla curva di concentrazione tanto maggiore egrave la concentrazione del carattere Ersquo naturale quindi costruire un indice di concentrazione basato sullo ldquoscostamentordquo della curva dalla bisettrice Una misura dello scostamento puograve essere basata

bullsulle distanze verticali tra la curva di concentrazione e la bisettricebullsullrsquoarea compresa tra la curva di concentrazione e la bisettrice

10

Indice di concentrazione (1) Le distanze verticali tra la curva di concentrazione e la bisettrice sono date da (Fi ndash Qi)

e sono non negative Un indice relativo di concentrazione si puograve ottenere dividendo la somma delle (Fi ndash Qi) per il valore massimo che tali differenze possono assumere

Lrsquoindice sopra egrave lrsquoindice di concentrazione di Gini Si ha 0 le R le 1 e in particolare

R = 0 nel caso di equiripartizione infatti in tal caso Fi - Qi =0 i=12hellipN-1

R = 1 nel caso di massima concentrazione infatti in tal caso Fi - Qi = Fi i=12hellipN-1

11

0

01

02

03

04

05

06

07

08

09

1

0 02 04 06 08 1

qi

pi

Indice di concentrazione (2)

Lrsquoarea A in figura compresa tra la curva di concentrazione e la retta di equidistribuzione prende il nome di area di concentrazione Si noti che A egrave pari allrsquoarea del triangolo di coordinate (00) (10) (11) meno lrsquoarea B formata dai trapezi di altezza Fi-Fi-1 e basi Qi e Qi-1

Area del trapezio

frac12 x Somma delle basi x altezza

A B

12

Un indice relativo di concentrazione si puograve ottenere dividendo lrsquoarea di concentrazione per il valore massimo che lrsquoarea puograve assumere

dove Amax si ottiene considerando lrsquoarea nel caso x1 =hellip= xN-1 =0 xN=Nμ e risulta pari a 12 ndash (1N)(1)(12)=(N-1)2N

Per costruzione egrave 0 le R le 1 in particolarebullR=0 nel caso di equiripartizionebullR=1 nel caso di massima concentrazione

Si puograve dimostrare che il rapporto cosigrave costruito egrave uguale ad R

Indice di concentrazione (2)

13

Un altro indice di concentrazione sempre basato sullrsquoarea si puograve ottenere osservando che questrsquoultima non puograve superare il valore 12 Possiamo quindi rapportare lrsquoarea di concentrazione al suo valore massimo teorico

Si ha (percheacute) con i due indici che tendono a coincidere per N grande

Indice di concentrazione (3)

14

80 90 21 23 32 16 62

Un esempio

i x_i F_i Q_i (Fi-Qi)

1 16 01429 00494 00935

2 21 02857 01142 01715

3 23 04286 01852 02434

4 32 05714 02840 02875

5 62 07143 04753 02390

6 80 08571 07222 01349

7 90 1 1

Totale

324 3 11698

Dati i redditi di 7 individui

per ricavare la curva di concentrazione organizziamo le osservazioni in tabella avendo cura di ordinarle in base ai valori di x (ad esempio X1=16 percheacute lrsquoindividuo piugrave povero possiede 16) e calcoliamo le differenze (Fi-Qi)

15

80 90 21 23 32 16 62

Per calcolare R con la formula (2) usiamo una tabella simile alla precedente per ricavare il numeratore Lrsquoarea massima che compare a denominatore egrave pari allrsquoarea massima teorica meno lrsquoarea del triangolo di base F7-F6 e altezza 1 Il calcolo di Ř egrave del tutto analogo egrave sufficiente porre lrsquoarea massima pari a frac12

Data i redditi di 7 individui

Un esempio

i x_i F_i Q_i (Fi-Fi-1)(Qi+Qi-1)

1 16 01429 00494 00070

2 21 02857 01142 00233

3 23 04286 01852 00427

4 32 05714 02840 00670

5 62 07143 04753 01085

6 80 08571 07222 01710

7 90 1 1 02461

Totale

06658

16

Variabili statistiche discrete

Finora abbiamo considerato N osservazioni non raggruppate Per ricavare lrsquoindice o la curva di concentrazione a partire da una distribuzione di frequenze assolute possiamo usare le seguenti versioni ldquoponderaterdquo di Fi e Qi

dove x1hellipxk sono k valori distinti ordinati in modo non decrescente con numerositagrave n1 hellipnk

17

Variabili statistiche discrete

1

1

1

1

)(

k

ii

k

iii

F

QFR

Con le coppie (Fi Qi) si puograve ottenere un indice analogo ad R

In generale RneR sugli stessi dati Infatti con lrsquoindice sopra la situazione di massima concentrazione si ha quando tutto il carattere appartiene alla k-esima classe (e non allrsquo N-esimo individuo come nel caso di R)

Unendo le coppie (Fi Qi

) si ottiene la stessa curva di concentrazione che si otterrebbe utilizzando con i dati unitari Infatti si puograve dimostrare che la pendenza della curva non cambia passando tra individui che hanno lo stesso ammontare di carattere Lrsquounica differenza egrave che ora per ottenere la spezzata si devono congiungere kltN punti

18

Nel caso in cui si disponga dellrsquoinformazione sullrsquoammontare totale di carattere in un intervallo egrave consigliabile discretizzare gli intervalli in modo ldquocoerenterdquo con tale informazione

Esempio se nellrsquointervallo [515) di numerositagrave Ni=10 il carattere totale egrave pari a 60 egrave preferibile discretizzare lrsquointervallo assumendo come punto ldquomediordquo il valore 6 e non il valore 10 (al quale corrisponderebbe un reddito totale di 100 e non di 60) Si noti che devono essere note le numerositagrave degli intervalli per poter procedere in questo modo

Nel caso in cui si disponga dellrsquoinformazione sullrsquoammontare totale di carattere in un intervallo egrave consigliabile discretizzare gli intervalli in modo ldquocoerenterdquo con tale informazione

Esempio se nellrsquointervallo [515) di numerositagrave Ni=10 il carattere totale egrave pari a 60 egrave preferibile discretizzare lrsquointervallo assumendo come punto ldquomediordquo il valore 6 e non il valore 10 (al quale corrisponderebbe un reddito totale di 100 e non di 60) Si noti che devono essere note le numerositagrave degli intervalli per poter procedere in questo modo

Se si desidera ricavare lrsquoindice o la curva di concentrazione per una variabile continua per intervallo il modo piugrave semplice di procedere consiste nel ldquodiscretizzarerdquo la variabile considerando le frequenze ldquoconcentraterdquo nei punti medi degli intervalli Si puograve poi procedere come nel caso precedente

Se si desidera ricavare lrsquoindice o la curva di concentrazione per una variabile continua per intervallo il modo piugrave semplice di procedere consiste nel ldquodiscretizzarerdquo la variabile considerando le frequenze ldquoconcentraterdquo nei punti medi degli intervalli Si puograve poi procedere come nel caso precedente

Variabili statistiche continue per intervallo

19

Se X egrave una variabile statistica continua non negativa con densitagrave f(x) e media finita μ le espressioni delle frequenze e delle intensitagrave cumulate diventano

Se X egrave una variabile statistica continua non negativa con densitagrave f(x) e media finita μ le espressioni delle frequenze e delle intensitagrave cumulate diventano

Variabili statistiche continue

Nota Talvolta si esprimono F e Q in funzione della frequenza cumulata r In tal caso si ha x = F-1( r ) da cui le nuove variabili

20

Il valore di R per un carattere con distribuzione continua si puograve ottenere come nel caso discreto rapportando lrsquoarea di concentrazione al suo valore massimo pari ad 12

Il valore di R per un carattere con distribuzione continua si puograve ottenere come nel caso discreto rapportando lrsquoarea di concentrazione al suo valore massimo pari ad 12

Variabili statistiche continue

Lrsquoindice di Gini egrave quindi pari a due volte lrsquoarea di concentrazione

Nota essendo Amax =12 si ha R=Ř

ConfrontiPuograve essere interessante confrontare la concentrazione di due caratteri

(o equivalentemente dello stesso carattere in due istanti diversi o in due ambiti territoriali diversi)

Esempio 1 il reddito risulta piugrave concentrato in Italia o in Francia

Esempio 2 la concentrazione del reddito in Italia era maggiore negli anni lsquo80 o negli anni lsquo90

Un modo semplice per stabilire quale carattere egrave maggiormente concentrato egrave quello di confrontare graficamente le curve di concentrazione nei due ambiti territoriali (o temporali) e stabilire quale si trova al di sopra

21

bull Non egrave detto che una delle due curve sia al di sopra dellrsquoaltra le curve si possono intersecare Si puograve tuttavia mostrare che se il carattere varia linearmente tra gli ambiti considerati allora le curve non si intersecano

bull In generale si puograve effettuare il confronto usando lrsquoindice di Gini

bull Poicheacute G=2A=1-2Area_sotto_la_curva_Lorenz il confronto attraverso lrsquoindici di Gini equivale al confronto tra le aree al di sotto delle curve di Lorenz dei due caratteri

Confronti

Confronti

Esempio la concentrazione del reddito nel mondo usando lrsquoindice R

23

Fonte CIA The world Factbook 2009

24

Esempio di Confronto Tra DistribuzioniSi riportano di seguito le distribuzioni dei finanziamenti concessi da un istituto bancario per lrsquoacquisto della prima casa a giovani coppie residenti in Campania ed in Sardegna

a) In quale regione risulta piugrave elevata la concentrazione dei finanziamenti concessi

b) Confrontare graficamente i diversi livelli di concentrazione dei finanziamenti nelle due regioni

Campania

Finanziamenti (migliaia di Euro) ni

0-50 10

50-100 25

100-150 37

150-200 22

200-250 6

Totale 100

Sardegna

Finanziamenti (migliaia di Euro) ni

0-50 57

50-100 3

100-150 7

150-200 8

200-250 25

Totale 100

25

Sardegna

Finanziamenti (migliaia di Euro) ni Ni pi xi xi ni Xi qi pi+1- pi qi+1+ qi (pi+1- pi)(qi+1+ qi)

0 0 0 0000 0 0 0 0000 0570 0149 0085

0-50 57 57 0570 25 1425 1425 0149 0030 0322 0010

50-100 3 60 0600 75 225 1650 0173 0070 0437 0031

100-150 7 67 0670 125 875 2525 0264 0080 0675 0054

150-200 8 75 0750 175 1400 3925 0411 0250 1411 0353

200-250 25 100 1000 225 5625 9550 1000 - - -

Totale 100 9550 0532

Concentrazione dei finanziamenti in Sardegna

26

Concentrazione dei finanziamenti in Campania

Campania

Finanziamenti (migliaia di Euro) ni Ni pi xi xi ni Xi qi pi+1- pi qi+1+ qi (pi+1- pi)(qi+1+ qi)

0 0 0 0000 0 0 0 0000 0100 0021 0002

0-50 10 10 0100 25 250 250 0021 0250 0199 0050

50-100 25 35 0350 75 1875 2125 0178 0370 0743 0275

100-150 37 72 0720 125 4625 6750 0565 0220 1452 0319

150-200 22 94 0940 175 3850 10600 0887 0060 1887 0113

200-250 6 100 1000 225 1350 11950 1000 - - -

Totale 100 11950 0759

27

00

01

02

03

04

05

06

07

08

09

10

00 01 02 03 04 05 06 07 08 09 10

pi

qi

Equidistribuzione Sardegna Campania

4680R~sar 2410R

~cam La concentrazione egrave piugrave

elevata in Sardegna

La curva di Lorenz conferma questo risultato

28

Riferimenti

bull C Gini (1912) Variabilitagrave e mutabilitagrave Contributo allo studio delle distribuzioni e relazioni statistiche Studi economici-giuridici dela Regia Universitagrave di Cagliari anno III

bull Lorenz M O (1905) Methods of measuring the concentration of wealth Publications of the American Statistical Association (Publications of the American Statistical Association Vol 9 No 70) 9 (70) 209ndash219

bull Per ulteriori riferimenti si possono consultare utilmente le pagine di Wikipedia relative allrsquoindice di Gini e alla curva di Lorenz

  • Appunti sulla concentrazione
  • Sommario
  • Introduzione
  • Slide 4
  • Curva di concentrazione
  • Slide 6
  • Slide 7
  • Un esempio
  • Indici di concentrazione
  • Indice di concentrazione (1)
  • Indice di concentrazione (2)
  • Slide 12
  • Indice di concentrazione (3)
  • Slide 14
  • Slide 15
  • Variabili statistiche discrete
  • Slide 17
  • Variabili statistiche continue per intervallo
  • Variabili statistiche continue
  • Slide 20
  • Confronti
  • Slide 22
  • Slide 23
  • PowerPoint Presentation
  • Slide 25
  • Slide 26
  • Slide 27
  • Slide 28
Page 2: Appunti sulla concentrazione a.a. 2012-2013 v.3. 2 Sommario Introduzione La curva di concentrazione Indici di concentrazione Confronti Riferimenti

2

Sommariobull Introduzionebull La curva di concentrazionebull Indici di concentrazionebull Confrontibull Riferimenti

3

Introduzione

La concentrazione puograve essere studiata per caratteri trasferibili ovvero caratteri quantitativi che almeno in linea di principio

possono essere trasferiti tra le unitagrave considerate

Es il reddito egrave un carattere trasferibile (tra gli individui) come lo sono il patrimonio il numero di azioni di una certa azienda (tra gli azionisti) e i finanziamenti ricevuti dalle regioni italiane (tra le regioni stesse)

Es lrsquoetagrave non egrave un carattere trasferibile (tra gli individui) e non lo egrave neppure lrsquointensitagrave delle precipitazioni (tra le localitagrave considerate)

4

IntroduzioneIntuitivamente un carattere statistico (si pensi ad esempio al reddito) egrave tanto piugrave concentrato quanto piugrave risulta suddiviso tra poche unitagrave della popolazione

Ogni situazione reale saragrave intermedia tra due situazioni estreme che chiameremo di concentrazione massima e di equiripartizione Si ha massima concentrazione quando una sola unitagrave statistica possiede la totalitagrave del carattere Si parla invece di equiripartizione quando tutte le unitagrave della popolazione possiedono la stessa quantitagrave di carattere

5

Curva di concentrazione

Consideriamo un carattere quantitativo trasferibile ordiniamo le quantitagrave del carattere (intensitagrave) possedute dalle unitagrave statistiche in senso non decrescente e definiamoNxxx 0 21

6

Curva di concentrazione

La curva di Lorenz (o curva di concentrazione) si ottiene rappresentando

le coppie (Fi Qi) nello spazio cartesiano e congiungendole

Il generico punto (Fi Qi) della curva si puograve interpretare nel seguente

modo lrsquo (Fi 100) piugrave povero di carattere possiede il (Qi 100) del carattere totale

Valgono le seguenti

1) (FNQN)=(11)

2) Qi le Fi per ogni i

La 2) segue dal fatto che

7

Curva di concentrazione

La curva di concentrazione egrave sempre compresa potendo eventualmente coincidere tra le due seguenti

1La bisettrice di equazione Q=F Lungo la bisettrice Fi=Qi per ogni i da cui segue che ogni unitagrave possiede una quantitagrave di carattere pari alla media dello stesso nella popolazione La bisettrice rappresenta quindi la situazione di equiripartizione

2 La curva passante per i punti (Fi0) i=1hellipN-1 e (11) In tal caso tutto il carattere egrave concentrato in una sola unitagrave statistica (lrsquoN-esima) e rappresenta quindi la situazione di massima concentrazione

Un esempio

8

80 90 21 23 32 16 62Dati i redditi di 7 individui

per ricavare la curva di concentrazione organizziamo le osservazioni in tabella (avendo cura di ordinarle in base ai valori di x ad esempio X1=16 percheacute lrsquoindividuo piugrave povero possiede 16) calcoliamo le coordinate dei punti (FiQi) e le congiungiamo Nel caso in esame la curva egrave piugrave vicina alla bisettrice

i x_i F_i Q_i

0 0 0

1 16 01429 00494

2 21 02857 01142

3 23 04286 01852

4 32 05714 02840

5 62 07143 04753

6 80 08571 07222

7 90 1 1

9

Indici di concentrazione

La curva di Lorenz-Gini egrave uno strumento grafico per rappresentare la concentrazione di un carattere Puograve tuttavia essere comodo valutare la concentrazione attraverso un indice numerico

Intuitivamente quanto piugrave la bisettrice si discosta dalla curva di concentrazione tanto maggiore egrave la concentrazione del carattere Ersquo naturale quindi costruire un indice di concentrazione basato sullo ldquoscostamentordquo della curva dalla bisettrice Una misura dello scostamento puograve essere basata

bullsulle distanze verticali tra la curva di concentrazione e la bisettricebullsullrsquoarea compresa tra la curva di concentrazione e la bisettrice

10

Indice di concentrazione (1) Le distanze verticali tra la curva di concentrazione e la bisettrice sono date da (Fi ndash Qi)

e sono non negative Un indice relativo di concentrazione si puograve ottenere dividendo la somma delle (Fi ndash Qi) per il valore massimo che tali differenze possono assumere

Lrsquoindice sopra egrave lrsquoindice di concentrazione di Gini Si ha 0 le R le 1 e in particolare

R = 0 nel caso di equiripartizione infatti in tal caso Fi - Qi =0 i=12hellipN-1

R = 1 nel caso di massima concentrazione infatti in tal caso Fi - Qi = Fi i=12hellipN-1

11

0

01

02

03

04

05

06

07

08

09

1

0 02 04 06 08 1

qi

pi

Indice di concentrazione (2)

Lrsquoarea A in figura compresa tra la curva di concentrazione e la retta di equidistribuzione prende il nome di area di concentrazione Si noti che A egrave pari allrsquoarea del triangolo di coordinate (00) (10) (11) meno lrsquoarea B formata dai trapezi di altezza Fi-Fi-1 e basi Qi e Qi-1

Area del trapezio

frac12 x Somma delle basi x altezza

A B

12

Un indice relativo di concentrazione si puograve ottenere dividendo lrsquoarea di concentrazione per il valore massimo che lrsquoarea puograve assumere

dove Amax si ottiene considerando lrsquoarea nel caso x1 =hellip= xN-1 =0 xN=Nμ e risulta pari a 12 ndash (1N)(1)(12)=(N-1)2N

Per costruzione egrave 0 le R le 1 in particolarebullR=0 nel caso di equiripartizionebullR=1 nel caso di massima concentrazione

Si puograve dimostrare che il rapporto cosigrave costruito egrave uguale ad R

Indice di concentrazione (2)

13

Un altro indice di concentrazione sempre basato sullrsquoarea si puograve ottenere osservando che questrsquoultima non puograve superare il valore 12 Possiamo quindi rapportare lrsquoarea di concentrazione al suo valore massimo teorico

Si ha (percheacute) con i due indici che tendono a coincidere per N grande

Indice di concentrazione (3)

14

80 90 21 23 32 16 62

Un esempio

i x_i F_i Q_i (Fi-Qi)

1 16 01429 00494 00935

2 21 02857 01142 01715

3 23 04286 01852 02434

4 32 05714 02840 02875

5 62 07143 04753 02390

6 80 08571 07222 01349

7 90 1 1

Totale

324 3 11698

Dati i redditi di 7 individui

per ricavare la curva di concentrazione organizziamo le osservazioni in tabella avendo cura di ordinarle in base ai valori di x (ad esempio X1=16 percheacute lrsquoindividuo piugrave povero possiede 16) e calcoliamo le differenze (Fi-Qi)

15

80 90 21 23 32 16 62

Per calcolare R con la formula (2) usiamo una tabella simile alla precedente per ricavare il numeratore Lrsquoarea massima che compare a denominatore egrave pari allrsquoarea massima teorica meno lrsquoarea del triangolo di base F7-F6 e altezza 1 Il calcolo di Ř egrave del tutto analogo egrave sufficiente porre lrsquoarea massima pari a frac12

Data i redditi di 7 individui

Un esempio

i x_i F_i Q_i (Fi-Fi-1)(Qi+Qi-1)

1 16 01429 00494 00070

2 21 02857 01142 00233

3 23 04286 01852 00427

4 32 05714 02840 00670

5 62 07143 04753 01085

6 80 08571 07222 01710

7 90 1 1 02461

Totale

06658

16

Variabili statistiche discrete

Finora abbiamo considerato N osservazioni non raggruppate Per ricavare lrsquoindice o la curva di concentrazione a partire da una distribuzione di frequenze assolute possiamo usare le seguenti versioni ldquoponderaterdquo di Fi e Qi

dove x1hellipxk sono k valori distinti ordinati in modo non decrescente con numerositagrave n1 hellipnk

17

Variabili statistiche discrete

1

1

1

1

)(

k

ii

k

iii

F

QFR

Con le coppie (Fi Qi) si puograve ottenere un indice analogo ad R

In generale RneR sugli stessi dati Infatti con lrsquoindice sopra la situazione di massima concentrazione si ha quando tutto il carattere appartiene alla k-esima classe (e non allrsquo N-esimo individuo come nel caso di R)

Unendo le coppie (Fi Qi

) si ottiene la stessa curva di concentrazione che si otterrebbe utilizzando con i dati unitari Infatti si puograve dimostrare che la pendenza della curva non cambia passando tra individui che hanno lo stesso ammontare di carattere Lrsquounica differenza egrave che ora per ottenere la spezzata si devono congiungere kltN punti

18

Nel caso in cui si disponga dellrsquoinformazione sullrsquoammontare totale di carattere in un intervallo egrave consigliabile discretizzare gli intervalli in modo ldquocoerenterdquo con tale informazione

Esempio se nellrsquointervallo [515) di numerositagrave Ni=10 il carattere totale egrave pari a 60 egrave preferibile discretizzare lrsquointervallo assumendo come punto ldquomediordquo il valore 6 e non il valore 10 (al quale corrisponderebbe un reddito totale di 100 e non di 60) Si noti che devono essere note le numerositagrave degli intervalli per poter procedere in questo modo

Nel caso in cui si disponga dellrsquoinformazione sullrsquoammontare totale di carattere in un intervallo egrave consigliabile discretizzare gli intervalli in modo ldquocoerenterdquo con tale informazione

Esempio se nellrsquointervallo [515) di numerositagrave Ni=10 il carattere totale egrave pari a 60 egrave preferibile discretizzare lrsquointervallo assumendo come punto ldquomediordquo il valore 6 e non il valore 10 (al quale corrisponderebbe un reddito totale di 100 e non di 60) Si noti che devono essere note le numerositagrave degli intervalli per poter procedere in questo modo

Se si desidera ricavare lrsquoindice o la curva di concentrazione per una variabile continua per intervallo il modo piugrave semplice di procedere consiste nel ldquodiscretizzarerdquo la variabile considerando le frequenze ldquoconcentraterdquo nei punti medi degli intervalli Si puograve poi procedere come nel caso precedente

Se si desidera ricavare lrsquoindice o la curva di concentrazione per una variabile continua per intervallo il modo piugrave semplice di procedere consiste nel ldquodiscretizzarerdquo la variabile considerando le frequenze ldquoconcentraterdquo nei punti medi degli intervalli Si puograve poi procedere come nel caso precedente

Variabili statistiche continue per intervallo

19

Se X egrave una variabile statistica continua non negativa con densitagrave f(x) e media finita μ le espressioni delle frequenze e delle intensitagrave cumulate diventano

Se X egrave una variabile statistica continua non negativa con densitagrave f(x) e media finita μ le espressioni delle frequenze e delle intensitagrave cumulate diventano

Variabili statistiche continue

Nota Talvolta si esprimono F e Q in funzione della frequenza cumulata r In tal caso si ha x = F-1( r ) da cui le nuove variabili

20

Il valore di R per un carattere con distribuzione continua si puograve ottenere come nel caso discreto rapportando lrsquoarea di concentrazione al suo valore massimo pari ad 12

Il valore di R per un carattere con distribuzione continua si puograve ottenere come nel caso discreto rapportando lrsquoarea di concentrazione al suo valore massimo pari ad 12

Variabili statistiche continue

Lrsquoindice di Gini egrave quindi pari a due volte lrsquoarea di concentrazione

Nota essendo Amax =12 si ha R=Ř

ConfrontiPuograve essere interessante confrontare la concentrazione di due caratteri

(o equivalentemente dello stesso carattere in due istanti diversi o in due ambiti territoriali diversi)

Esempio 1 il reddito risulta piugrave concentrato in Italia o in Francia

Esempio 2 la concentrazione del reddito in Italia era maggiore negli anni lsquo80 o negli anni lsquo90

Un modo semplice per stabilire quale carattere egrave maggiormente concentrato egrave quello di confrontare graficamente le curve di concentrazione nei due ambiti territoriali (o temporali) e stabilire quale si trova al di sopra

21

bull Non egrave detto che una delle due curve sia al di sopra dellrsquoaltra le curve si possono intersecare Si puograve tuttavia mostrare che se il carattere varia linearmente tra gli ambiti considerati allora le curve non si intersecano

bull In generale si puograve effettuare il confronto usando lrsquoindice di Gini

bull Poicheacute G=2A=1-2Area_sotto_la_curva_Lorenz il confronto attraverso lrsquoindici di Gini equivale al confronto tra le aree al di sotto delle curve di Lorenz dei due caratteri

Confronti

Confronti

Esempio la concentrazione del reddito nel mondo usando lrsquoindice R

23

Fonte CIA The world Factbook 2009

24

Esempio di Confronto Tra DistribuzioniSi riportano di seguito le distribuzioni dei finanziamenti concessi da un istituto bancario per lrsquoacquisto della prima casa a giovani coppie residenti in Campania ed in Sardegna

a) In quale regione risulta piugrave elevata la concentrazione dei finanziamenti concessi

b) Confrontare graficamente i diversi livelli di concentrazione dei finanziamenti nelle due regioni

Campania

Finanziamenti (migliaia di Euro) ni

0-50 10

50-100 25

100-150 37

150-200 22

200-250 6

Totale 100

Sardegna

Finanziamenti (migliaia di Euro) ni

0-50 57

50-100 3

100-150 7

150-200 8

200-250 25

Totale 100

25

Sardegna

Finanziamenti (migliaia di Euro) ni Ni pi xi xi ni Xi qi pi+1- pi qi+1+ qi (pi+1- pi)(qi+1+ qi)

0 0 0 0000 0 0 0 0000 0570 0149 0085

0-50 57 57 0570 25 1425 1425 0149 0030 0322 0010

50-100 3 60 0600 75 225 1650 0173 0070 0437 0031

100-150 7 67 0670 125 875 2525 0264 0080 0675 0054

150-200 8 75 0750 175 1400 3925 0411 0250 1411 0353

200-250 25 100 1000 225 5625 9550 1000 - - -

Totale 100 9550 0532

Concentrazione dei finanziamenti in Sardegna

26

Concentrazione dei finanziamenti in Campania

Campania

Finanziamenti (migliaia di Euro) ni Ni pi xi xi ni Xi qi pi+1- pi qi+1+ qi (pi+1- pi)(qi+1+ qi)

0 0 0 0000 0 0 0 0000 0100 0021 0002

0-50 10 10 0100 25 250 250 0021 0250 0199 0050

50-100 25 35 0350 75 1875 2125 0178 0370 0743 0275

100-150 37 72 0720 125 4625 6750 0565 0220 1452 0319

150-200 22 94 0940 175 3850 10600 0887 0060 1887 0113

200-250 6 100 1000 225 1350 11950 1000 - - -

Totale 100 11950 0759

27

00

01

02

03

04

05

06

07

08

09

10

00 01 02 03 04 05 06 07 08 09 10

pi

qi

Equidistribuzione Sardegna Campania

4680R~sar 2410R

~cam La concentrazione egrave piugrave

elevata in Sardegna

La curva di Lorenz conferma questo risultato

28

Riferimenti

bull C Gini (1912) Variabilitagrave e mutabilitagrave Contributo allo studio delle distribuzioni e relazioni statistiche Studi economici-giuridici dela Regia Universitagrave di Cagliari anno III

bull Lorenz M O (1905) Methods of measuring the concentration of wealth Publications of the American Statistical Association (Publications of the American Statistical Association Vol 9 No 70) 9 (70) 209ndash219

bull Per ulteriori riferimenti si possono consultare utilmente le pagine di Wikipedia relative allrsquoindice di Gini e alla curva di Lorenz

  • Appunti sulla concentrazione
  • Sommario
  • Introduzione
  • Slide 4
  • Curva di concentrazione
  • Slide 6
  • Slide 7
  • Un esempio
  • Indici di concentrazione
  • Indice di concentrazione (1)
  • Indice di concentrazione (2)
  • Slide 12
  • Indice di concentrazione (3)
  • Slide 14
  • Slide 15
  • Variabili statistiche discrete
  • Slide 17
  • Variabili statistiche continue per intervallo
  • Variabili statistiche continue
  • Slide 20
  • Confronti
  • Slide 22
  • Slide 23
  • PowerPoint Presentation
  • Slide 25
  • Slide 26
  • Slide 27
  • Slide 28
Page 3: Appunti sulla concentrazione a.a. 2012-2013 v.3. 2 Sommario Introduzione La curva di concentrazione Indici di concentrazione Confronti Riferimenti

3

Introduzione

La concentrazione puograve essere studiata per caratteri trasferibili ovvero caratteri quantitativi che almeno in linea di principio

possono essere trasferiti tra le unitagrave considerate

Es il reddito egrave un carattere trasferibile (tra gli individui) come lo sono il patrimonio il numero di azioni di una certa azienda (tra gli azionisti) e i finanziamenti ricevuti dalle regioni italiane (tra le regioni stesse)

Es lrsquoetagrave non egrave un carattere trasferibile (tra gli individui) e non lo egrave neppure lrsquointensitagrave delle precipitazioni (tra le localitagrave considerate)

4

IntroduzioneIntuitivamente un carattere statistico (si pensi ad esempio al reddito) egrave tanto piugrave concentrato quanto piugrave risulta suddiviso tra poche unitagrave della popolazione

Ogni situazione reale saragrave intermedia tra due situazioni estreme che chiameremo di concentrazione massima e di equiripartizione Si ha massima concentrazione quando una sola unitagrave statistica possiede la totalitagrave del carattere Si parla invece di equiripartizione quando tutte le unitagrave della popolazione possiedono la stessa quantitagrave di carattere

5

Curva di concentrazione

Consideriamo un carattere quantitativo trasferibile ordiniamo le quantitagrave del carattere (intensitagrave) possedute dalle unitagrave statistiche in senso non decrescente e definiamoNxxx 0 21

6

Curva di concentrazione

La curva di Lorenz (o curva di concentrazione) si ottiene rappresentando

le coppie (Fi Qi) nello spazio cartesiano e congiungendole

Il generico punto (Fi Qi) della curva si puograve interpretare nel seguente

modo lrsquo (Fi 100) piugrave povero di carattere possiede il (Qi 100) del carattere totale

Valgono le seguenti

1) (FNQN)=(11)

2) Qi le Fi per ogni i

La 2) segue dal fatto che

7

Curva di concentrazione

La curva di concentrazione egrave sempre compresa potendo eventualmente coincidere tra le due seguenti

1La bisettrice di equazione Q=F Lungo la bisettrice Fi=Qi per ogni i da cui segue che ogni unitagrave possiede una quantitagrave di carattere pari alla media dello stesso nella popolazione La bisettrice rappresenta quindi la situazione di equiripartizione

2 La curva passante per i punti (Fi0) i=1hellipN-1 e (11) In tal caso tutto il carattere egrave concentrato in una sola unitagrave statistica (lrsquoN-esima) e rappresenta quindi la situazione di massima concentrazione

Un esempio

8

80 90 21 23 32 16 62Dati i redditi di 7 individui

per ricavare la curva di concentrazione organizziamo le osservazioni in tabella (avendo cura di ordinarle in base ai valori di x ad esempio X1=16 percheacute lrsquoindividuo piugrave povero possiede 16) calcoliamo le coordinate dei punti (FiQi) e le congiungiamo Nel caso in esame la curva egrave piugrave vicina alla bisettrice

i x_i F_i Q_i

0 0 0

1 16 01429 00494

2 21 02857 01142

3 23 04286 01852

4 32 05714 02840

5 62 07143 04753

6 80 08571 07222

7 90 1 1

9

Indici di concentrazione

La curva di Lorenz-Gini egrave uno strumento grafico per rappresentare la concentrazione di un carattere Puograve tuttavia essere comodo valutare la concentrazione attraverso un indice numerico

Intuitivamente quanto piugrave la bisettrice si discosta dalla curva di concentrazione tanto maggiore egrave la concentrazione del carattere Ersquo naturale quindi costruire un indice di concentrazione basato sullo ldquoscostamentordquo della curva dalla bisettrice Una misura dello scostamento puograve essere basata

bullsulle distanze verticali tra la curva di concentrazione e la bisettricebullsullrsquoarea compresa tra la curva di concentrazione e la bisettrice

10

Indice di concentrazione (1) Le distanze verticali tra la curva di concentrazione e la bisettrice sono date da (Fi ndash Qi)

e sono non negative Un indice relativo di concentrazione si puograve ottenere dividendo la somma delle (Fi ndash Qi) per il valore massimo che tali differenze possono assumere

Lrsquoindice sopra egrave lrsquoindice di concentrazione di Gini Si ha 0 le R le 1 e in particolare

R = 0 nel caso di equiripartizione infatti in tal caso Fi - Qi =0 i=12hellipN-1

R = 1 nel caso di massima concentrazione infatti in tal caso Fi - Qi = Fi i=12hellipN-1

11

0

01

02

03

04

05

06

07

08

09

1

0 02 04 06 08 1

qi

pi

Indice di concentrazione (2)

Lrsquoarea A in figura compresa tra la curva di concentrazione e la retta di equidistribuzione prende il nome di area di concentrazione Si noti che A egrave pari allrsquoarea del triangolo di coordinate (00) (10) (11) meno lrsquoarea B formata dai trapezi di altezza Fi-Fi-1 e basi Qi e Qi-1

Area del trapezio

frac12 x Somma delle basi x altezza

A B

12

Un indice relativo di concentrazione si puograve ottenere dividendo lrsquoarea di concentrazione per il valore massimo che lrsquoarea puograve assumere

dove Amax si ottiene considerando lrsquoarea nel caso x1 =hellip= xN-1 =0 xN=Nμ e risulta pari a 12 ndash (1N)(1)(12)=(N-1)2N

Per costruzione egrave 0 le R le 1 in particolarebullR=0 nel caso di equiripartizionebullR=1 nel caso di massima concentrazione

Si puograve dimostrare che il rapporto cosigrave costruito egrave uguale ad R

Indice di concentrazione (2)

13

Un altro indice di concentrazione sempre basato sullrsquoarea si puograve ottenere osservando che questrsquoultima non puograve superare il valore 12 Possiamo quindi rapportare lrsquoarea di concentrazione al suo valore massimo teorico

Si ha (percheacute) con i due indici che tendono a coincidere per N grande

Indice di concentrazione (3)

14

80 90 21 23 32 16 62

Un esempio

i x_i F_i Q_i (Fi-Qi)

1 16 01429 00494 00935

2 21 02857 01142 01715

3 23 04286 01852 02434

4 32 05714 02840 02875

5 62 07143 04753 02390

6 80 08571 07222 01349

7 90 1 1

Totale

324 3 11698

Dati i redditi di 7 individui

per ricavare la curva di concentrazione organizziamo le osservazioni in tabella avendo cura di ordinarle in base ai valori di x (ad esempio X1=16 percheacute lrsquoindividuo piugrave povero possiede 16) e calcoliamo le differenze (Fi-Qi)

15

80 90 21 23 32 16 62

Per calcolare R con la formula (2) usiamo una tabella simile alla precedente per ricavare il numeratore Lrsquoarea massima che compare a denominatore egrave pari allrsquoarea massima teorica meno lrsquoarea del triangolo di base F7-F6 e altezza 1 Il calcolo di Ř egrave del tutto analogo egrave sufficiente porre lrsquoarea massima pari a frac12

Data i redditi di 7 individui

Un esempio

i x_i F_i Q_i (Fi-Fi-1)(Qi+Qi-1)

1 16 01429 00494 00070

2 21 02857 01142 00233

3 23 04286 01852 00427

4 32 05714 02840 00670

5 62 07143 04753 01085

6 80 08571 07222 01710

7 90 1 1 02461

Totale

06658

16

Variabili statistiche discrete

Finora abbiamo considerato N osservazioni non raggruppate Per ricavare lrsquoindice o la curva di concentrazione a partire da una distribuzione di frequenze assolute possiamo usare le seguenti versioni ldquoponderaterdquo di Fi e Qi

dove x1hellipxk sono k valori distinti ordinati in modo non decrescente con numerositagrave n1 hellipnk

17

Variabili statistiche discrete

1

1

1

1

)(

k

ii

k

iii

F

QFR

Con le coppie (Fi Qi) si puograve ottenere un indice analogo ad R

In generale RneR sugli stessi dati Infatti con lrsquoindice sopra la situazione di massima concentrazione si ha quando tutto il carattere appartiene alla k-esima classe (e non allrsquo N-esimo individuo come nel caso di R)

Unendo le coppie (Fi Qi

) si ottiene la stessa curva di concentrazione che si otterrebbe utilizzando con i dati unitari Infatti si puograve dimostrare che la pendenza della curva non cambia passando tra individui che hanno lo stesso ammontare di carattere Lrsquounica differenza egrave che ora per ottenere la spezzata si devono congiungere kltN punti

18

Nel caso in cui si disponga dellrsquoinformazione sullrsquoammontare totale di carattere in un intervallo egrave consigliabile discretizzare gli intervalli in modo ldquocoerenterdquo con tale informazione

Esempio se nellrsquointervallo [515) di numerositagrave Ni=10 il carattere totale egrave pari a 60 egrave preferibile discretizzare lrsquointervallo assumendo come punto ldquomediordquo il valore 6 e non il valore 10 (al quale corrisponderebbe un reddito totale di 100 e non di 60) Si noti che devono essere note le numerositagrave degli intervalli per poter procedere in questo modo

Nel caso in cui si disponga dellrsquoinformazione sullrsquoammontare totale di carattere in un intervallo egrave consigliabile discretizzare gli intervalli in modo ldquocoerenterdquo con tale informazione

Esempio se nellrsquointervallo [515) di numerositagrave Ni=10 il carattere totale egrave pari a 60 egrave preferibile discretizzare lrsquointervallo assumendo come punto ldquomediordquo il valore 6 e non il valore 10 (al quale corrisponderebbe un reddito totale di 100 e non di 60) Si noti che devono essere note le numerositagrave degli intervalli per poter procedere in questo modo

Se si desidera ricavare lrsquoindice o la curva di concentrazione per una variabile continua per intervallo il modo piugrave semplice di procedere consiste nel ldquodiscretizzarerdquo la variabile considerando le frequenze ldquoconcentraterdquo nei punti medi degli intervalli Si puograve poi procedere come nel caso precedente

Se si desidera ricavare lrsquoindice o la curva di concentrazione per una variabile continua per intervallo il modo piugrave semplice di procedere consiste nel ldquodiscretizzarerdquo la variabile considerando le frequenze ldquoconcentraterdquo nei punti medi degli intervalli Si puograve poi procedere come nel caso precedente

Variabili statistiche continue per intervallo

19

Se X egrave una variabile statistica continua non negativa con densitagrave f(x) e media finita μ le espressioni delle frequenze e delle intensitagrave cumulate diventano

Se X egrave una variabile statistica continua non negativa con densitagrave f(x) e media finita μ le espressioni delle frequenze e delle intensitagrave cumulate diventano

Variabili statistiche continue

Nota Talvolta si esprimono F e Q in funzione della frequenza cumulata r In tal caso si ha x = F-1( r ) da cui le nuove variabili

20

Il valore di R per un carattere con distribuzione continua si puograve ottenere come nel caso discreto rapportando lrsquoarea di concentrazione al suo valore massimo pari ad 12

Il valore di R per un carattere con distribuzione continua si puograve ottenere come nel caso discreto rapportando lrsquoarea di concentrazione al suo valore massimo pari ad 12

Variabili statistiche continue

Lrsquoindice di Gini egrave quindi pari a due volte lrsquoarea di concentrazione

Nota essendo Amax =12 si ha R=Ř

ConfrontiPuograve essere interessante confrontare la concentrazione di due caratteri

(o equivalentemente dello stesso carattere in due istanti diversi o in due ambiti territoriali diversi)

Esempio 1 il reddito risulta piugrave concentrato in Italia o in Francia

Esempio 2 la concentrazione del reddito in Italia era maggiore negli anni lsquo80 o negli anni lsquo90

Un modo semplice per stabilire quale carattere egrave maggiormente concentrato egrave quello di confrontare graficamente le curve di concentrazione nei due ambiti territoriali (o temporali) e stabilire quale si trova al di sopra

21

bull Non egrave detto che una delle due curve sia al di sopra dellrsquoaltra le curve si possono intersecare Si puograve tuttavia mostrare che se il carattere varia linearmente tra gli ambiti considerati allora le curve non si intersecano

bull In generale si puograve effettuare il confronto usando lrsquoindice di Gini

bull Poicheacute G=2A=1-2Area_sotto_la_curva_Lorenz il confronto attraverso lrsquoindici di Gini equivale al confronto tra le aree al di sotto delle curve di Lorenz dei due caratteri

Confronti

Confronti

Esempio la concentrazione del reddito nel mondo usando lrsquoindice R

23

Fonte CIA The world Factbook 2009

24

Esempio di Confronto Tra DistribuzioniSi riportano di seguito le distribuzioni dei finanziamenti concessi da un istituto bancario per lrsquoacquisto della prima casa a giovani coppie residenti in Campania ed in Sardegna

a) In quale regione risulta piugrave elevata la concentrazione dei finanziamenti concessi

b) Confrontare graficamente i diversi livelli di concentrazione dei finanziamenti nelle due regioni

Campania

Finanziamenti (migliaia di Euro) ni

0-50 10

50-100 25

100-150 37

150-200 22

200-250 6

Totale 100

Sardegna

Finanziamenti (migliaia di Euro) ni

0-50 57

50-100 3

100-150 7

150-200 8

200-250 25

Totale 100

25

Sardegna

Finanziamenti (migliaia di Euro) ni Ni pi xi xi ni Xi qi pi+1- pi qi+1+ qi (pi+1- pi)(qi+1+ qi)

0 0 0 0000 0 0 0 0000 0570 0149 0085

0-50 57 57 0570 25 1425 1425 0149 0030 0322 0010

50-100 3 60 0600 75 225 1650 0173 0070 0437 0031

100-150 7 67 0670 125 875 2525 0264 0080 0675 0054

150-200 8 75 0750 175 1400 3925 0411 0250 1411 0353

200-250 25 100 1000 225 5625 9550 1000 - - -

Totale 100 9550 0532

Concentrazione dei finanziamenti in Sardegna

26

Concentrazione dei finanziamenti in Campania

Campania

Finanziamenti (migliaia di Euro) ni Ni pi xi xi ni Xi qi pi+1- pi qi+1+ qi (pi+1- pi)(qi+1+ qi)

0 0 0 0000 0 0 0 0000 0100 0021 0002

0-50 10 10 0100 25 250 250 0021 0250 0199 0050

50-100 25 35 0350 75 1875 2125 0178 0370 0743 0275

100-150 37 72 0720 125 4625 6750 0565 0220 1452 0319

150-200 22 94 0940 175 3850 10600 0887 0060 1887 0113

200-250 6 100 1000 225 1350 11950 1000 - - -

Totale 100 11950 0759

27

00

01

02

03

04

05

06

07

08

09

10

00 01 02 03 04 05 06 07 08 09 10

pi

qi

Equidistribuzione Sardegna Campania

4680R~sar 2410R

~cam La concentrazione egrave piugrave

elevata in Sardegna

La curva di Lorenz conferma questo risultato

28

Riferimenti

bull C Gini (1912) Variabilitagrave e mutabilitagrave Contributo allo studio delle distribuzioni e relazioni statistiche Studi economici-giuridici dela Regia Universitagrave di Cagliari anno III

bull Lorenz M O (1905) Methods of measuring the concentration of wealth Publications of the American Statistical Association (Publications of the American Statistical Association Vol 9 No 70) 9 (70) 209ndash219

bull Per ulteriori riferimenti si possono consultare utilmente le pagine di Wikipedia relative allrsquoindice di Gini e alla curva di Lorenz

  • Appunti sulla concentrazione
  • Sommario
  • Introduzione
  • Slide 4
  • Curva di concentrazione
  • Slide 6
  • Slide 7
  • Un esempio
  • Indici di concentrazione
  • Indice di concentrazione (1)
  • Indice di concentrazione (2)
  • Slide 12
  • Indice di concentrazione (3)
  • Slide 14
  • Slide 15
  • Variabili statistiche discrete
  • Slide 17
  • Variabili statistiche continue per intervallo
  • Variabili statistiche continue
  • Slide 20
  • Confronti
  • Slide 22
  • Slide 23
  • PowerPoint Presentation
  • Slide 25
  • Slide 26
  • Slide 27
  • Slide 28
Page 4: Appunti sulla concentrazione a.a. 2012-2013 v.3. 2 Sommario Introduzione La curva di concentrazione Indici di concentrazione Confronti Riferimenti

4

IntroduzioneIntuitivamente un carattere statistico (si pensi ad esempio al reddito) egrave tanto piugrave concentrato quanto piugrave risulta suddiviso tra poche unitagrave della popolazione

Ogni situazione reale saragrave intermedia tra due situazioni estreme che chiameremo di concentrazione massima e di equiripartizione Si ha massima concentrazione quando una sola unitagrave statistica possiede la totalitagrave del carattere Si parla invece di equiripartizione quando tutte le unitagrave della popolazione possiedono la stessa quantitagrave di carattere

5

Curva di concentrazione

Consideriamo un carattere quantitativo trasferibile ordiniamo le quantitagrave del carattere (intensitagrave) possedute dalle unitagrave statistiche in senso non decrescente e definiamoNxxx 0 21

6

Curva di concentrazione

La curva di Lorenz (o curva di concentrazione) si ottiene rappresentando

le coppie (Fi Qi) nello spazio cartesiano e congiungendole

Il generico punto (Fi Qi) della curva si puograve interpretare nel seguente

modo lrsquo (Fi 100) piugrave povero di carattere possiede il (Qi 100) del carattere totale

Valgono le seguenti

1) (FNQN)=(11)

2) Qi le Fi per ogni i

La 2) segue dal fatto che

7

Curva di concentrazione

La curva di concentrazione egrave sempre compresa potendo eventualmente coincidere tra le due seguenti

1La bisettrice di equazione Q=F Lungo la bisettrice Fi=Qi per ogni i da cui segue che ogni unitagrave possiede una quantitagrave di carattere pari alla media dello stesso nella popolazione La bisettrice rappresenta quindi la situazione di equiripartizione

2 La curva passante per i punti (Fi0) i=1hellipN-1 e (11) In tal caso tutto il carattere egrave concentrato in una sola unitagrave statistica (lrsquoN-esima) e rappresenta quindi la situazione di massima concentrazione

Un esempio

8

80 90 21 23 32 16 62Dati i redditi di 7 individui

per ricavare la curva di concentrazione organizziamo le osservazioni in tabella (avendo cura di ordinarle in base ai valori di x ad esempio X1=16 percheacute lrsquoindividuo piugrave povero possiede 16) calcoliamo le coordinate dei punti (FiQi) e le congiungiamo Nel caso in esame la curva egrave piugrave vicina alla bisettrice

i x_i F_i Q_i

0 0 0

1 16 01429 00494

2 21 02857 01142

3 23 04286 01852

4 32 05714 02840

5 62 07143 04753

6 80 08571 07222

7 90 1 1

9

Indici di concentrazione

La curva di Lorenz-Gini egrave uno strumento grafico per rappresentare la concentrazione di un carattere Puograve tuttavia essere comodo valutare la concentrazione attraverso un indice numerico

Intuitivamente quanto piugrave la bisettrice si discosta dalla curva di concentrazione tanto maggiore egrave la concentrazione del carattere Ersquo naturale quindi costruire un indice di concentrazione basato sullo ldquoscostamentordquo della curva dalla bisettrice Una misura dello scostamento puograve essere basata

bullsulle distanze verticali tra la curva di concentrazione e la bisettricebullsullrsquoarea compresa tra la curva di concentrazione e la bisettrice

10

Indice di concentrazione (1) Le distanze verticali tra la curva di concentrazione e la bisettrice sono date da (Fi ndash Qi)

e sono non negative Un indice relativo di concentrazione si puograve ottenere dividendo la somma delle (Fi ndash Qi) per il valore massimo che tali differenze possono assumere

Lrsquoindice sopra egrave lrsquoindice di concentrazione di Gini Si ha 0 le R le 1 e in particolare

R = 0 nel caso di equiripartizione infatti in tal caso Fi - Qi =0 i=12hellipN-1

R = 1 nel caso di massima concentrazione infatti in tal caso Fi - Qi = Fi i=12hellipN-1

11

0

01

02

03

04

05

06

07

08

09

1

0 02 04 06 08 1

qi

pi

Indice di concentrazione (2)

Lrsquoarea A in figura compresa tra la curva di concentrazione e la retta di equidistribuzione prende il nome di area di concentrazione Si noti che A egrave pari allrsquoarea del triangolo di coordinate (00) (10) (11) meno lrsquoarea B formata dai trapezi di altezza Fi-Fi-1 e basi Qi e Qi-1

Area del trapezio

frac12 x Somma delle basi x altezza

A B

12

Un indice relativo di concentrazione si puograve ottenere dividendo lrsquoarea di concentrazione per il valore massimo che lrsquoarea puograve assumere

dove Amax si ottiene considerando lrsquoarea nel caso x1 =hellip= xN-1 =0 xN=Nμ e risulta pari a 12 ndash (1N)(1)(12)=(N-1)2N

Per costruzione egrave 0 le R le 1 in particolarebullR=0 nel caso di equiripartizionebullR=1 nel caso di massima concentrazione

Si puograve dimostrare che il rapporto cosigrave costruito egrave uguale ad R

Indice di concentrazione (2)

13

Un altro indice di concentrazione sempre basato sullrsquoarea si puograve ottenere osservando che questrsquoultima non puograve superare il valore 12 Possiamo quindi rapportare lrsquoarea di concentrazione al suo valore massimo teorico

Si ha (percheacute) con i due indici che tendono a coincidere per N grande

Indice di concentrazione (3)

14

80 90 21 23 32 16 62

Un esempio

i x_i F_i Q_i (Fi-Qi)

1 16 01429 00494 00935

2 21 02857 01142 01715

3 23 04286 01852 02434

4 32 05714 02840 02875

5 62 07143 04753 02390

6 80 08571 07222 01349

7 90 1 1

Totale

324 3 11698

Dati i redditi di 7 individui

per ricavare la curva di concentrazione organizziamo le osservazioni in tabella avendo cura di ordinarle in base ai valori di x (ad esempio X1=16 percheacute lrsquoindividuo piugrave povero possiede 16) e calcoliamo le differenze (Fi-Qi)

15

80 90 21 23 32 16 62

Per calcolare R con la formula (2) usiamo una tabella simile alla precedente per ricavare il numeratore Lrsquoarea massima che compare a denominatore egrave pari allrsquoarea massima teorica meno lrsquoarea del triangolo di base F7-F6 e altezza 1 Il calcolo di Ř egrave del tutto analogo egrave sufficiente porre lrsquoarea massima pari a frac12

Data i redditi di 7 individui

Un esempio

i x_i F_i Q_i (Fi-Fi-1)(Qi+Qi-1)

1 16 01429 00494 00070

2 21 02857 01142 00233

3 23 04286 01852 00427

4 32 05714 02840 00670

5 62 07143 04753 01085

6 80 08571 07222 01710

7 90 1 1 02461

Totale

06658

16

Variabili statistiche discrete

Finora abbiamo considerato N osservazioni non raggruppate Per ricavare lrsquoindice o la curva di concentrazione a partire da una distribuzione di frequenze assolute possiamo usare le seguenti versioni ldquoponderaterdquo di Fi e Qi

dove x1hellipxk sono k valori distinti ordinati in modo non decrescente con numerositagrave n1 hellipnk

17

Variabili statistiche discrete

1

1

1

1

)(

k

ii

k

iii

F

QFR

Con le coppie (Fi Qi) si puograve ottenere un indice analogo ad R

In generale RneR sugli stessi dati Infatti con lrsquoindice sopra la situazione di massima concentrazione si ha quando tutto il carattere appartiene alla k-esima classe (e non allrsquo N-esimo individuo come nel caso di R)

Unendo le coppie (Fi Qi

) si ottiene la stessa curva di concentrazione che si otterrebbe utilizzando con i dati unitari Infatti si puograve dimostrare che la pendenza della curva non cambia passando tra individui che hanno lo stesso ammontare di carattere Lrsquounica differenza egrave che ora per ottenere la spezzata si devono congiungere kltN punti

18

Nel caso in cui si disponga dellrsquoinformazione sullrsquoammontare totale di carattere in un intervallo egrave consigliabile discretizzare gli intervalli in modo ldquocoerenterdquo con tale informazione

Esempio se nellrsquointervallo [515) di numerositagrave Ni=10 il carattere totale egrave pari a 60 egrave preferibile discretizzare lrsquointervallo assumendo come punto ldquomediordquo il valore 6 e non il valore 10 (al quale corrisponderebbe un reddito totale di 100 e non di 60) Si noti che devono essere note le numerositagrave degli intervalli per poter procedere in questo modo

Nel caso in cui si disponga dellrsquoinformazione sullrsquoammontare totale di carattere in un intervallo egrave consigliabile discretizzare gli intervalli in modo ldquocoerenterdquo con tale informazione

Esempio se nellrsquointervallo [515) di numerositagrave Ni=10 il carattere totale egrave pari a 60 egrave preferibile discretizzare lrsquointervallo assumendo come punto ldquomediordquo il valore 6 e non il valore 10 (al quale corrisponderebbe un reddito totale di 100 e non di 60) Si noti che devono essere note le numerositagrave degli intervalli per poter procedere in questo modo

Se si desidera ricavare lrsquoindice o la curva di concentrazione per una variabile continua per intervallo il modo piugrave semplice di procedere consiste nel ldquodiscretizzarerdquo la variabile considerando le frequenze ldquoconcentraterdquo nei punti medi degli intervalli Si puograve poi procedere come nel caso precedente

Se si desidera ricavare lrsquoindice o la curva di concentrazione per una variabile continua per intervallo il modo piugrave semplice di procedere consiste nel ldquodiscretizzarerdquo la variabile considerando le frequenze ldquoconcentraterdquo nei punti medi degli intervalli Si puograve poi procedere come nel caso precedente

Variabili statistiche continue per intervallo

19

Se X egrave una variabile statistica continua non negativa con densitagrave f(x) e media finita μ le espressioni delle frequenze e delle intensitagrave cumulate diventano

Se X egrave una variabile statistica continua non negativa con densitagrave f(x) e media finita μ le espressioni delle frequenze e delle intensitagrave cumulate diventano

Variabili statistiche continue

Nota Talvolta si esprimono F e Q in funzione della frequenza cumulata r In tal caso si ha x = F-1( r ) da cui le nuove variabili

20

Il valore di R per un carattere con distribuzione continua si puograve ottenere come nel caso discreto rapportando lrsquoarea di concentrazione al suo valore massimo pari ad 12

Il valore di R per un carattere con distribuzione continua si puograve ottenere come nel caso discreto rapportando lrsquoarea di concentrazione al suo valore massimo pari ad 12

Variabili statistiche continue

Lrsquoindice di Gini egrave quindi pari a due volte lrsquoarea di concentrazione

Nota essendo Amax =12 si ha R=Ř

ConfrontiPuograve essere interessante confrontare la concentrazione di due caratteri

(o equivalentemente dello stesso carattere in due istanti diversi o in due ambiti territoriali diversi)

Esempio 1 il reddito risulta piugrave concentrato in Italia o in Francia

Esempio 2 la concentrazione del reddito in Italia era maggiore negli anni lsquo80 o negli anni lsquo90

Un modo semplice per stabilire quale carattere egrave maggiormente concentrato egrave quello di confrontare graficamente le curve di concentrazione nei due ambiti territoriali (o temporali) e stabilire quale si trova al di sopra

21

bull Non egrave detto che una delle due curve sia al di sopra dellrsquoaltra le curve si possono intersecare Si puograve tuttavia mostrare che se il carattere varia linearmente tra gli ambiti considerati allora le curve non si intersecano

bull In generale si puograve effettuare il confronto usando lrsquoindice di Gini

bull Poicheacute G=2A=1-2Area_sotto_la_curva_Lorenz il confronto attraverso lrsquoindici di Gini equivale al confronto tra le aree al di sotto delle curve di Lorenz dei due caratteri

Confronti

Confronti

Esempio la concentrazione del reddito nel mondo usando lrsquoindice R

23

Fonte CIA The world Factbook 2009

24

Esempio di Confronto Tra DistribuzioniSi riportano di seguito le distribuzioni dei finanziamenti concessi da un istituto bancario per lrsquoacquisto della prima casa a giovani coppie residenti in Campania ed in Sardegna

a) In quale regione risulta piugrave elevata la concentrazione dei finanziamenti concessi

b) Confrontare graficamente i diversi livelli di concentrazione dei finanziamenti nelle due regioni

Campania

Finanziamenti (migliaia di Euro) ni

0-50 10

50-100 25

100-150 37

150-200 22

200-250 6

Totale 100

Sardegna

Finanziamenti (migliaia di Euro) ni

0-50 57

50-100 3

100-150 7

150-200 8

200-250 25

Totale 100

25

Sardegna

Finanziamenti (migliaia di Euro) ni Ni pi xi xi ni Xi qi pi+1- pi qi+1+ qi (pi+1- pi)(qi+1+ qi)

0 0 0 0000 0 0 0 0000 0570 0149 0085

0-50 57 57 0570 25 1425 1425 0149 0030 0322 0010

50-100 3 60 0600 75 225 1650 0173 0070 0437 0031

100-150 7 67 0670 125 875 2525 0264 0080 0675 0054

150-200 8 75 0750 175 1400 3925 0411 0250 1411 0353

200-250 25 100 1000 225 5625 9550 1000 - - -

Totale 100 9550 0532

Concentrazione dei finanziamenti in Sardegna

26

Concentrazione dei finanziamenti in Campania

Campania

Finanziamenti (migliaia di Euro) ni Ni pi xi xi ni Xi qi pi+1- pi qi+1+ qi (pi+1- pi)(qi+1+ qi)

0 0 0 0000 0 0 0 0000 0100 0021 0002

0-50 10 10 0100 25 250 250 0021 0250 0199 0050

50-100 25 35 0350 75 1875 2125 0178 0370 0743 0275

100-150 37 72 0720 125 4625 6750 0565 0220 1452 0319

150-200 22 94 0940 175 3850 10600 0887 0060 1887 0113

200-250 6 100 1000 225 1350 11950 1000 - - -

Totale 100 11950 0759

27

00

01

02

03

04

05

06

07

08

09

10

00 01 02 03 04 05 06 07 08 09 10

pi

qi

Equidistribuzione Sardegna Campania

4680R~sar 2410R

~cam La concentrazione egrave piugrave

elevata in Sardegna

La curva di Lorenz conferma questo risultato

28

Riferimenti

bull C Gini (1912) Variabilitagrave e mutabilitagrave Contributo allo studio delle distribuzioni e relazioni statistiche Studi economici-giuridici dela Regia Universitagrave di Cagliari anno III

bull Lorenz M O (1905) Methods of measuring the concentration of wealth Publications of the American Statistical Association (Publications of the American Statistical Association Vol 9 No 70) 9 (70) 209ndash219

bull Per ulteriori riferimenti si possono consultare utilmente le pagine di Wikipedia relative allrsquoindice di Gini e alla curva di Lorenz

  • Appunti sulla concentrazione
  • Sommario
  • Introduzione
  • Slide 4
  • Curva di concentrazione
  • Slide 6
  • Slide 7
  • Un esempio
  • Indici di concentrazione
  • Indice di concentrazione (1)
  • Indice di concentrazione (2)
  • Slide 12
  • Indice di concentrazione (3)
  • Slide 14
  • Slide 15
  • Variabili statistiche discrete
  • Slide 17
  • Variabili statistiche continue per intervallo
  • Variabili statistiche continue
  • Slide 20
  • Confronti
  • Slide 22
  • Slide 23
  • PowerPoint Presentation
  • Slide 25
  • Slide 26
  • Slide 27
  • Slide 28
Page 5: Appunti sulla concentrazione a.a. 2012-2013 v.3. 2 Sommario Introduzione La curva di concentrazione Indici di concentrazione Confronti Riferimenti

5

Curva di concentrazione

Consideriamo un carattere quantitativo trasferibile ordiniamo le quantitagrave del carattere (intensitagrave) possedute dalle unitagrave statistiche in senso non decrescente e definiamoNxxx 0 21

6

Curva di concentrazione

La curva di Lorenz (o curva di concentrazione) si ottiene rappresentando

le coppie (Fi Qi) nello spazio cartesiano e congiungendole

Il generico punto (Fi Qi) della curva si puograve interpretare nel seguente

modo lrsquo (Fi 100) piugrave povero di carattere possiede il (Qi 100) del carattere totale

Valgono le seguenti

1) (FNQN)=(11)

2) Qi le Fi per ogni i

La 2) segue dal fatto che

7

Curva di concentrazione

La curva di concentrazione egrave sempre compresa potendo eventualmente coincidere tra le due seguenti

1La bisettrice di equazione Q=F Lungo la bisettrice Fi=Qi per ogni i da cui segue che ogni unitagrave possiede una quantitagrave di carattere pari alla media dello stesso nella popolazione La bisettrice rappresenta quindi la situazione di equiripartizione

2 La curva passante per i punti (Fi0) i=1hellipN-1 e (11) In tal caso tutto il carattere egrave concentrato in una sola unitagrave statistica (lrsquoN-esima) e rappresenta quindi la situazione di massima concentrazione

Un esempio

8

80 90 21 23 32 16 62Dati i redditi di 7 individui

per ricavare la curva di concentrazione organizziamo le osservazioni in tabella (avendo cura di ordinarle in base ai valori di x ad esempio X1=16 percheacute lrsquoindividuo piugrave povero possiede 16) calcoliamo le coordinate dei punti (FiQi) e le congiungiamo Nel caso in esame la curva egrave piugrave vicina alla bisettrice

i x_i F_i Q_i

0 0 0

1 16 01429 00494

2 21 02857 01142

3 23 04286 01852

4 32 05714 02840

5 62 07143 04753

6 80 08571 07222

7 90 1 1

9

Indici di concentrazione

La curva di Lorenz-Gini egrave uno strumento grafico per rappresentare la concentrazione di un carattere Puograve tuttavia essere comodo valutare la concentrazione attraverso un indice numerico

Intuitivamente quanto piugrave la bisettrice si discosta dalla curva di concentrazione tanto maggiore egrave la concentrazione del carattere Ersquo naturale quindi costruire un indice di concentrazione basato sullo ldquoscostamentordquo della curva dalla bisettrice Una misura dello scostamento puograve essere basata

bullsulle distanze verticali tra la curva di concentrazione e la bisettricebullsullrsquoarea compresa tra la curva di concentrazione e la bisettrice

10

Indice di concentrazione (1) Le distanze verticali tra la curva di concentrazione e la bisettrice sono date da (Fi ndash Qi)

e sono non negative Un indice relativo di concentrazione si puograve ottenere dividendo la somma delle (Fi ndash Qi) per il valore massimo che tali differenze possono assumere

Lrsquoindice sopra egrave lrsquoindice di concentrazione di Gini Si ha 0 le R le 1 e in particolare

R = 0 nel caso di equiripartizione infatti in tal caso Fi - Qi =0 i=12hellipN-1

R = 1 nel caso di massima concentrazione infatti in tal caso Fi - Qi = Fi i=12hellipN-1

11

0

01

02

03

04

05

06

07

08

09

1

0 02 04 06 08 1

qi

pi

Indice di concentrazione (2)

Lrsquoarea A in figura compresa tra la curva di concentrazione e la retta di equidistribuzione prende il nome di area di concentrazione Si noti che A egrave pari allrsquoarea del triangolo di coordinate (00) (10) (11) meno lrsquoarea B formata dai trapezi di altezza Fi-Fi-1 e basi Qi e Qi-1

Area del trapezio

frac12 x Somma delle basi x altezza

A B

12

Un indice relativo di concentrazione si puograve ottenere dividendo lrsquoarea di concentrazione per il valore massimo che lrsquoarea puograve assumere

dove Amax si ottiene considerando lrsquoarea nel caso x1 =hellip= xN-1 =0 xN=Nμ e risulta pari a 12 ndash (1N)(1)(12)=(N-1)2N

Per costruzione egrave 0 le R le 1 in particolarebullR=0 nel caso di equiripartizionebullR=1 nel caso di massima concentrazione

Si puograve dimostrare che il rapporto cosigrave costruito egrave uguale ad R

Indice di concentrazione (2)

13

Un altro indice di concentrazione sempre basato sullrsquoarea si puograve ottenere osservando che questrsquoultima non puograve superare il valore 12 Possiamo quindi rapportare lrsquoarea di concentrazione al suo valore massimo teorico

Si ha (percheacute) con i due indici che tendono a coincidere per N grande

Indice di concentrazione (3)

14

80 90 21 23 32 16 62

Un esempio

i x_i F_i Q_i (Fi-Qi)

1 16 01429 00494 00935

2 21 02857 01142 01715

3 23 04286 01852 02434

4 32 05714 02840 02875

5 62 07143 04753 02390

6 80 08571 07222 01349

7 90 1 1

Totale

324 3 11698

Dati i redditi di 7 individui

per ricavare la curva di concentrazione organizziamo le osservazioni in tabella avendo cura di ordinarle in base ai valori di x (ad esempio X1=16 percheacute lrsquoindividuo piugrave povero possiede 16) e calcoliamo le differenze (Fi-Qi)

15

80 90 21 23 32 16 62

Per calcolare R con la formula (2) usiamo una tabella simile alla precedente per ricavare il numeratore Lrsquoarea massima che compare a denominatore egrave pari allrsquoarea massima teorica meno lrsquoarea del triangolo di base F7-F6 e altezza 1 Il calcolo di Ř egrave del tutto analogo egrave sufficiente porre lrsquoarea massima pari a frac12

Data i redditi di 7 individui

Un esempio

i x_i F_i Q_i (Fi-Fi-1)(Qi+Qi-1)

1 16 01429 00494 00070

2 21 02857 01142 00233

3 23 04286 01852 00427

4 32 05714 02840 00670

5 62 07143 04753 01085

6 80 08571 07222 01710

7 90 1 1 02461

Totale

06658

16

Variabili statistiche discrete

Finora abbiamo considerato N osservazioni non raggruppate Per ricavare lrsquoindice o la curva di concentrazione a partire da una distribuzione di frequenze assolute possiamo usare le seguenti versioni ldquoponderaterdquo di Fi e Qi

dove x1hellipxk sono k valori distinti ordinati in modo non decrescente con numerositagrave n1 hellipnk

17

Variabili statistiche discrete

1

1

1

1

)(

k

ii

k

iii

F

QFR

Con le coppie (Fi Qi) si puograve ottenere un indice analogo ad R

In generale RneR sugli stessi dati Infatti con lrsquoindice sopra la situazione di massima concentrazione si ha quando tutto il carattere appartiene alla k-esima classe (e non allrsquo N-esimo individuo come nel caso di R)

Unendo le coppie (Fi Qi

) si ottiene la stessa curva di concentrazione che si otterrebbe utilizzando con i dati unitari Infatti si puograve dimostrare che la pendenza della curva non cambia passando tra individui che hanno lo stesso ammontare di carattere Lrsquounica differenza egrave che ora per ottenere la spezzata si devono congiungere kltN punti

18

Nel caso in cui si disponga dellrsquoinformazione sullrsquoammontare totale di carattere in un intervallo egrave consigliabile discretizzare gli intervalli in modo ldquocoerenterdquo con tale informazione

Esempio se nellrsquointervallo [515) di numerositagrave Ni=10 il carattere totale egrave pari a 60 egrave preferibile discretizzare lrsquointervallo assumendo come punto ldquomediordquo il valore 6 e non il valore 10 (al quale corrisponderebbe un reddito totale di 100 e non di 60) Si noti che devono essere note le numerositagrave degli intervalli per poter procedere in questo modo

Nel caso in cui si disponga dellrsquoinformazione sullrsquoammontare totale di carattere in un intervallo egrave consigliabile discretizzare gli intervalli in modo ldquocoerenterdquo con tale informazione

Esempio se nellrsquointervallo [515) di numerositagrave Ni=10 il carattere totale egrave pari a 60 egrave preferibile discretizzare lrsquointervallo assumendo come punto ldquomediordquo il valore 6 e non il valore 10 (al quale corrisponderebbe un reddito totale di 100 e non di 60) Si noti che devono essere note le numerositagrave degli intervalli per poter procedere in questo modo

Se si desidera ricavare lrsquoindice o la curva di concentrazione per una variabile continua per intervallo il modo piugrave semplice di procedere consiste nel ldquodiscretizzarerdquo la variabile considerando le frequenze ldquoconcentraterdquo nei punti medi degli intervalli Si puograve poi procedere come nel caso precedente

Se si desidera ricavare lrsquoindice o la curva di concentrazione per una variabile continua per intervallo il modo piugrave semplice di procedere consiste nel ldquodiscretizzarerdquo la variabile considerando le frequenze ldquoconcentraterdquo nei punti medi degli intervalli Si puograve poi procedere come nel caso precedente

Variabili statistiche continue per intervallo

19

Se X egrave una variabile statistica continua non negativa con densitagrave f(x) e media finita μ le espressioni delle frequenze e delle intensitagrave cumulate diventano

Se X egrave una variabile statistica continua non negativa con densitagrave f(x) e media finita μ le espressioni delle frequenze e delle intensitagrave cumulate diventano

Variabili statistiche continue

Nota Talvolta si esprimono F e Q in funzione della frequenza cumulata r In tal caso si ha x = F-1( r ) da cui le nuove variabili

20

Il valore di R per un carattere con distribuzione continua si puograve ottenere come nel caso discreto rapportando lrsquoarea di concentrazione al suo valore massimo pari ad 12

Il valore di R per un carattere con distribuzione continua si puograve ottenere come nel caso discreto rapportando lrsquoarea di concentrazione al suo valore massimo pari ad 12

Variabili statistiche continue

Lrsquoindice di Gini egrave quindi pari a due volte lrsquoarea di concentrazione

Nota essendo Amax =12 si ha R=Ř

ConfrontiPuograve essere interessante confrontare la concentrazione di due caratteri

(o equivalentemente dello stesso carattere in due istanti diversi o in due ambiti territoriali diversi)

Esempio 1 il reddito risulta piugrave concentrato in Italia o in Francia

Esempio 2 la concentrazione del reddito in Italia era maggiore negli anni lsquo80 o negli anni lsquo90

Un modo semplice per stabilire quale carattere egrave maggiormente concentrato egrave quello di confrontare graficamente le curve di concentrazione nei due ambiti territoriali (o temporali) e stabilire quale si trova al di sopra

21

bull Non egrave detto che una delle due curve sia al di sopra dellrsquoaltra le curve si possono intersecare Si puograve tuttavia mostrare che se il carattere varia linearmente tra gli ambiti considerati allora le curve non si intersecano

bull In generale si puograve effettuare il confronto usando lrsquoindice di Gini

bull Poicheacute G=2A=1-2Area_sotto_la_curva_Lorenz il confronto attraverso lrsquoindici di Gini equivale al confronto tra le aree al di sotto delle curve di Lorenz dei due caratteri

Confronti

Confronti

Esempio la concentrazione del reddito nel mondo usando lrsquoindice R

23

Fonte CIA The world Factbook 2009

24

Esempio di Confronto Tra DistribuzioniSi riportano di seguito le distribuzioni dei finanziamenti concessi da un istituto bancario per lrsquoacquisto della prima casa a giovani coppie residenti in Campania ed in Sardegna

a) In quale regione risulta piugrave elevata la concentrazione dei finanziamenti concessi

b) Confrontare graficamente i diversi livelli di concentrazione dei finanziamenti nelle due regioni

Campania

Finanziamenti (migliaia di Euro) ni

0-50 10

50-100 25

100-150 37

150-200 22

200-250 6

Totale 100

Sardegna

Finanziamenti (migliaia di Euro) ni

0-50 57

50-100 3

100-150 7

150-200 8

200-250 25

Totale 100

25

Sardegna

Finanziamenti (migliaia di Euro) ni Ni pi xi xi ni Xi qi pi+1- pi qi+1+ qi (pi+1- pi)(qi+1+ qi)

0 0 0 0000 0 0 0 0000 0570 0149 0085

0-50 57 57 0570 25 1425 1425 0149 0030 0322 0010

50-100 3 60 0600 75 225 1650 0173 0070 0437 0031

100-150 7 67 0670 125 875 2525 0264 0080 0675 0054

150-200 8 75 0750 175 1400 3925 0411 0250 1411 0353

200-250 25 100 1000 225 5625 9550 1000 - - -

Totale 100 9550 0532

Concentrazione dei finanziamenti in Sardegna

26

Concentrazione dei finanziamenti in Campania

Campania

Finanziamenti (migliaia di Euro) ni Ni pi xi xi ni Xi qi pi+1- pi qi+1+ qi (pi+1- pi)(qi+1+ qi)

0 0 0 0000 0 0 0 0000 0100 0021 0002

0-50 10 10 0100 25 250 250 0021 0250 0199 0050

50-100 25 35 0350 75 1875 2125 0178 0370 0743 0275

100-150 37 72 0720 125 4625 6750 0565 0220 1452 0319

150-200 22 94 0940 175 3850 10600 0887 0060 1887 0113

200-250 6 100 1000 225 1350 11950 1000 - - -

Totale 100 11950 0759

27

00

01

02

03

04

05

06

07

08

09

10

00 01 02 03 04 05 06 07 08 09 10

pi

qi

Equidistribuzione Sardegna Campania

4680R~sar 2410R

~cam La concentrazione egrave piugrave

elevata in Sardegna

La curva di Lorenz conferma questo risultato

28

Riferimenti

bull C Gini (1912) Variabilitagrave e mutabilitagrave Contributo allo studio delle distribuzioni e relazioni statistiche Studi economici-giuridici dela Regia Universitagrave di Cagliari anno III

bull Lorenz M O (1905) Methods of measuring the concentration of wealth Publications of the American Statistical Association (Publications of the American Statistical Association Vol 9 No 70) 9 (70) 209ndash219

bull Per ulteriori riferimenti si possono consultare utilmente le pagine di Wikipedia relative allrsquoindice di Gini e alla curva di Lorenz

  • Appunti sulla concentrazione
  • Sommario
  • Introduzione
  • Slide 4
  • Curva di concentrazione
  • Slide 6
  • Slide 7
  • Un esempio
  • Indici di concentrazione
  • Indice di concentrazione (1)
  • Indice di concentrazione (2)
  • Slide 12
  • Indice di concentrazione (3)
  • Slide 14
  • Slide 15
  • Variabili statistiche discrete
  • Slide 17
  • Variabili statistiche continue per intervallo
  • Variabili statistiche continue
  • Slide 20
  • Confronti
  • Slide 22
  • Slide 23
  • PowerPoint Presentation
  • Slide 25
  • Slide 26
  • Slide 27
  • Slide 28
Page 6: Appunti sulla concentrazione a.a. 2012-2013 v.3. 2 Sommario Introduzione La curva di concentrazione Indici di concentrazione Confronti Riferimenti

6

Curva di concentrazione

La curva di Lorenz (o curva di concentrazione) si ottiene rappresentando

le coppie (Fi Qi) nello spazio cartesiano e congiungendole

Il generico punto (Fi Qi) della curva si puograve interpretare nel seguente

modo lrsquo (Fi 100) piugrave povero di carattere possiede il (Qi 100) del carattere totale

Valgono le seguenti

1) (FNQN)=(11)

2) Qi le Fi per ogni i

La 2) segue dal fatto che

7

Curva di concentrazione

La curva di concentrazione egrave sempre compresa potendo eventualmente coincidere tra le due seguenti

1La bisettrice di equazione Q=F Lungo la bisettrice Fi=Qi per ogni i da cui segue che ogni unitagrave possiede una quantitagrave di carattere pari alla media dello stesso nella popolazione La bisettrice rappresenta quindi la situazione di equiripartizione

2 La curva passante per i punti (Fi0) i=1hellipN-1 e (11) In tal caso tutto il carattere egrave concentrato in una sola unitagrave statistica (lrsquoN-esima) e rappresenta quindi la situazione di massima concentrazione

Un esempio

8

80 90 21 23 32 16 62Dati i redditi di 7 individui

per ricavare la curva di concentrazione organizziamo le osservazioni in tabella (avendo cura di ordinarle in base ai valori di x ad esempio X1=16 percheacute lrsquoindividuo piugrave povero possiede 16) calcoliamo le coordinate dei punti (FiQi) e le congiungiamo Nel caso in esame la curva egrave piugrave vicina alla bisettrice

i x_i F_i Q_i

0 0 0

1 16 01429 00494

2 21 02857 01142

3 23 04286 01852

4 32 05714 02840

5 62 07143 04753

6 80 08571 07222

7 90 1 1

9

Indici di concentrazione

La curva di Lorenz-Gini egrave uno strumento grafico per rappresentare la concentrazione di un carattere Puograve tuttavia essere comodo valutare la concentrazione attraverso un indice numerico

Intuitivamente quanto piugrave la bisettrice si discosta dalla curva di concentrazione tanto maggiore egrave la concentrazione del carattere Ersquo naturale quindi costruire un indice di concentrazione basato sullo ldquoscostamentordquo della curva dalla bisettrice Una misura dello scostamento puograve essere basata

bullsulle distanze verticali tra la curva di concentrazione e la bisettricebullsullrsquoarea compresa tra la curva di concentrazione e la bisettrice

10

Indice di concentrazione (1) Le distanze verticali tra la curva di concentrazione e la bisettrice sono date da (Fi ndash Qi)

e sono non negative Un indice relativo di concentrazione si puograve ottenere dividendo la somma delle (Fi ndash Qi) per il valore massimo che tali differenze possono assumere

Lrsquoindice sopra egrave lrsquoindice di concentrazione di Gini Si ha 0 le R le 1 e in particolare

R = 0 nel caso di equiripartizione infatti in tal caso Fi - Qi =0 i=12hellipN-1

R = 1 nel caso di massima concentrazione infatti in tal caso Fi - Qi = Fi i=12hellipN-1

11

0

01

02

03

04

05

06

07

08

09

1

0 02 04 06 08 1

qi

pi

Indice di concentrazione (2)

Lrsquoarea A in figura compresa tra la curva di concentrazione e la retta di equidistribuzione prende il nome di area di concentrazione Si noti che A egrave pari allrsquoarea del triangolo di coordinate (00) (10) (11) meno lrsquoarea B formata dai trapezi di altezza Fi-Fi-1 e basi Qi e Qi-1

Area del trapezio

frac12 x Somma delle basi x altezza

A B

12

Un indice relativo di concentrazione si puograve ottenere dividendo lrsquoarea di concentrazione per il valore massimo che lrsquoarea puograve assumere

dove Amax si ottiene considerando lrsquoarea nel caso x1 =hellip= xN-1 =0 xN=Nμ e risulta pari a 12 ndash (1N)(1)(12)=(N-1)2N

Per costruzione egrave 0 le R le 1 in particolarebullR=0 nel caso di equiripartizionebullR=1 nel caso di massima concentrazione

Si puograve dimostrare che il rapporto cosigrave costruito egrave uguale ad R

Indice di concentrazione (2)

13

Un altro indice di concentrazione sempre basato sullrsquoarea si puograve ottenere osservando che questrsquoultima non puograve superare il valore 12 Possiamo quindi rapportare lrsquoarea di concentrazione al suo valore massimo teorico

Si ha (percheacute) con i due indici che tendono a coincidere per N grande

Indice di concentrazione (3)

14

80 90 21 23 32 16 62

Un esempio

i x_i F_i Q_i (Fi-Qi)

1 16 01429 00494 00935

2 21 02857 01142 01715

3 23 04286 01852 02434

4 32 05714 02840 02875

5 62 07143 04753 02390

6 80 08571 07222 01349

7 90 1 1

Totale

324 3 11698

Dati i redditi di 7 individui

per ricavare la curva di concentrazione organizziamo le osservazioni in tabella avendo cura di ordinarle in base ai valori di x (ad esempio X1=16 percheacute lrsquoindividuo piugrave povero possiede 16) e calcoliamo le differenze (Fi-Qi)

15

80 90 21 23 32 16 62

Per calcolare R con la formula (2) usiamo una tabella simile alla precedente per ricavare il numeratore Lrsquoarea massima che compare a denominatore egrave pari allrsquoarea massima teorica meno lrsquoarea del triangolo di base F7-F6 e altezza 1 Il calcolo di Ř egrave del tutto analogo egrave sufficiente porre lrsquoarea massima pari a frac12

Data i redditi di 7 individui

Un esempio

i x_i F_i Q_i (Fi-Fi-1)(Qi+Qi-1)

1 16 01429 00494 00070

2 21 02857 01142 00233

3 23 04286 01852 00427

4 32 05714 02840 00670

5 62 07143 04753 01085

6 80 08571 07222 01710

7 90 1 1 02461

Totale

06658

16

Variabili statistiche discrete

Finora abbiamo considerato N osservazioni non raggruppate Per ricavare lrsquoindice o la curva di concentrazione a partire da una distribuzione di frequenze assolute possiamo usare le seguenti versioni ldquoponderaterdquo di Fi e Qi

dove x1hellipxk sono k valori distinti ordinati in modo non decrescente con numerositagrave n1 hellipnk

17

Variabili statistiche discrete

1

1

1

1

)(

k

ii

k

iii

F

QFR

Con le coppie (Fi Qi) si puograve ottenere un indice analogo ad R

In generale RneR sugli stessi dati Infatti con lrsquoindice sopra la situazione di massima concentrazione si ha quando tutto il carattere appartiene alla k-esima classe (e non allrsquo N-esimo individuo come nel caso di R)

Unendo le coppie (Fi Qi

) si ottiene la stessa curva di concentrazione che si otterrebbe utilizzando con i dati unitari Infatti si puograve dimostrare che la pendenza della curva non cambia passando tra individui che hanno lo stesso ammontare di carattere Lrsquounica differenza egrave che ora per ottenere la spezzata si devono congiungere kltN punti

18

Nel caso in cui si disponga dellrsquoinformazione sullrsquoammontare totale di carattere in un intervallo egrave consigliabile discretizzare gli intervalli in modo ldquocoerenterdquo con tale informazione

Esempio se nellrsquointervallo [515) di numerositagrave Ni=10 il carattere totale egrave pari a 60 egrave preferibile discretizzare lrsquointervallo assumendo come punto ldquomediordquo il valore 6 e non il valore 10 (al quale corrisponderebbe un reddito totale di 100 e non di 60) Si noti che devono essere note le numerositagrave degli intervalli per poter procedere in questo modo

Nel caso in cui si disponga dellrsquoinformazione sullrsquoammontare totale di carattere in un intervallo egrave consigliabile discretizzare gli intervalli in modo ldquocoerenterdquo con tale informazione

Esempio se nellrsquointervallo [515) di numerositagrave Ni=10 il carattere totale egrave pari a 60 egrave preferibile discretizzare lrsquointervallo assumendo come punto ldquomediordquo il valore 6 e non il valore 10 (al quale corrisponderebbe un reddito totale di 100 e non di 60) Si noti che devono essere note le numerositagrave degli intervalli per poter procedere in questo modo

Se si desidera ricavare lrsquoindice o la curva di concentrazione per una variabile continua per intervallo il modo piugrave semplice di procedere consiste nel ldquodiscretizzarerdquo la variabile considerando le frequenze ldquoconcentraterdquo nei punti medi degli intervalli Si puograve poi procedere come nel caso precedente

Se si desidera ricavare lrsquoindice o la curva di concentrazione per una variabile continua per intervallo il modo piugrave semplice di procedere consiste nel ldquodiscretizzarerdquo la variabile considerando le frequenze ldquoconcentraterdquo nei punti medi degli intervalli Si puograve poi procedere come nel caso precedente

Variabili statistiche continue per intervallo

19

Se X egrave una variabile statistica continua non negativa con densitagrave f(x) e media finita μ le espressioni delle frequenze e delle intensitagrave cumulate diventano

Se X egrave una variabile statistica continua non negativa con densitagrave f(x) e media finita μ le espressioni delle frequenze e delle intensitagrave cumulate diventano

Variabili statistiche continue

Nota Talvolta si esprimono F e Q in funzione della frequenza cumulata r In tal caso si ha x = F-1( r ) da cui le nuove variabili

20

Il valore di R per un carattere con distribuzione continua si puograve ottenere come nel caso discreto rapportando lrsquoarea di concentrazione al suo valore massimo pari ad 12

Il valore di R per un carattere con distribuzione continua si puograve ottenere come nel caso discreto rapportando lrsquoarea di concentrazione al suo valore massimo pari ad 12

Variabili statistiche continue

Lrsquoindice di Gini egrave quindi pari a due volte lrsquoarea di concentrazione

Nota essendo Amax =12 si ha R=Ř

ConfrontiPuograve essere interessante confrontare la concentrazione di due caratteri

(o equivalentemente dello stesso carattere in due istanti diversi o in due ambiti territoriali diversi)

Esempio 1 il reddito risulta piugrave concentrato in Italia o in Francia

Esempio 2 la concentrazione del reddito in Italia era maggiore negli anni lsquo80 o negli anni lsquo90

Un modo semplice per stabilire quale carattere egrave maggiormente concentrato egrave quello di confrontare graficamente le curve di concentrazione nei due ambiti territoriali (o temporali) e stabilire quale si trova al di sopra

21

bull Non egrave detto che una delle due curve sia al di sopra dellrsquoaltra le curve si possono intersecare Si puograve tuttavia mostrare che se il carattere varia linearmente tra gli ambiti considerati allora le curve non si intersecano

bull In generale si puograve effettuare il confronto usando lrsquoindice di Gini

bull Poicheacute G=2A=1-2Area_sotto_la_curva_Lorenz il confronto attraverso lrsquoindici di Gini equivale al confronto tra le aree al di sotto delle curve di Lorenz dei due caratteri

Confronti

Confronti

Esempio la concentrazione del reddito nel mondo usando lrsquoindice R

23

Fonte CIA The world Factbook 2009

24

Esempio di Confronto Tra DistribuzioniSi riportano di seguito le distribuzioni dei finanziamenti concessi da un istituto bancario per lrsquoacquisto della prima casa a giovani coppie residenti in Campania ed in Sardegna

a) In quale regione risulta piugrave elevata la concentrazione dei finanziamenti concessi

b) Confrontare graficamente i diversi livelli di concentrazione dei finanziamenti nelle due regioni

Campania

Finanziamenti (migliaia di Euro) ni

0-50 10

50-100 25

100-150 37

150-200 22

200-250 6

Totale 100

Sardegna

Finanziamenti (migliaia di Euro) ni

0-50 57

50-100 3

100-150 7

150-200 8

200-250 25

Totale 100

25

Sardegna

Finanziamenti (migliaia di Euro) ni Ni pi xi xi ni Xi qi pi+1- pi qi+1+ qi (pi+1- pi)(qi+1+ qi)

0 0 0 0000 0 0 0 0000 0570 0149 0085

0-50 57 57 0570 25 1425 1425 0149 0030 0322 0010

50-100 3 60 0600 75 225 1650 0173 0070 0437 0031

100-150 7 67 0670 125 875 2525 0264 0080 0675 0054

150-200 8 75 0750 175 1400 3925 0411 0250 1411 0353

200-250 25 100 1000 225 5625 9550 1000 - - -

Totale 100 9550 0532

Concentrazione dei finanziamenti in Sardegna

26

Concentrazione dei finanziamenti in Campania

Campania

Finanziamenti (migliaia di Euro) ni Ni pi xi xi ni Xi qi pi+1- pi qi+1+ qi (pi+1- pi)(qi+1+ qi)

0 0 0 0000 0 0 0 0000 0100 0021 0002

0-50 10 10 0100 25 250 250 0021 0250 0199 0050

50-100 25 35 0350 75 1875 2125 0178 0370 0743 0275

100-150 37 72 0720 125 4625 6750 0565 0220 1452 0319

150-200 22 94 0940 175 3850 10600 0887 0060 1887 0113

200-250 6 100 1000 225 1350 11950 1000 - - -

Totale 100 11950 0759

27

00

01

02

03

04

05

06

07

08

09

10

00 01 02 03 04 05 06 07 08 09 10

pi

qi

Equidistribuzione Sardegna Campania

4680R~sar 2410R

~cam La concentrazione egrave piugrave

elevata in Sardegna

La curva di Lorenz conferma questo risultato

28

Riferimenti

bull C Gini (1912) Variabilitagrave e mutabilitagrave Contributo allo studio delle distribuzioni e relazioni statistiche Studi economici-giuridici dela Regia Universitagrave di Cagliari anno III

bull Lorenz M O (1905) Methods of measuring the concentration of wealth Publications of the American Statistical Association (Publications of the American Statistical Association Vol 9 No 70) 9 (70) 209ndash219

bull Per ulteriori riferimenti si possono consultare utilmente le pagine di Wikipedia relative allrsquoindice di Gini e alla curva di Lorenz

  • Appunti sulla concentrazione
  • Sommario
  • Introduzione
  • Slide 4
  • Curva di concentrazione
  • Slide 6
  • Slide 7
  • Un esempio
  • Indici di concentrazione
  • Indice di concentrazione (1)
  • Indice di concentrazione (2)
  • Slide 12
  • Indice di concentrazione (3)
  • Slide 14
  • Slide 15
  • Variabili statistiche discrete
  • Slide 17
  • Variabili statistiche continue per intervallo
  • Variabili statistiche continue
  • Slide 20
  • Confronti
  • Slide 22
  • Slide 23
  • PowerPoint Presentation
  • Slide 25
  • Slide 26
  • Slide 27
  • Slide 28
Page 7: Appunti sulla concentrazione a.a. 2012-2013 v.3. 2 Sommario Introduzione La curva di concentrazione Indici di concentrazione Confronti Riferimenti

7

Curva di concentrazione

La curva di concentrazione egrave sempre compresa potendo eventualmente coincidere tra le due seguenti

1La bisettrice di equazione Q=F Lungo la bisettrice Fi=Qi per ogni i da cui segue che ogni unitagrave possiede una quantitagrave di carattere pari alla media dello stesso nella popolazione La bisettrice rappresenta quindi la situazione di equiripartizione

2 La curva passante per i punti (Fi0) i=1hellipN-1 e (11) In tal caso tutto il carattere egrave concentrato in una sola unitagrave statistica (lrsquoN-esima) e rappresenta quindi la situazione di massima concentrazione

Un esempio

8

80 90 21 23 32 16 62Dati i redditi di 7 individui

per ricavare la curva di concentrazione organizziamo le osservazioni in tabella (avendo cura di ordinarle in base ai valori di x ad esempio X1=16 percheacute lrsquoindividuo piugrave povero possiede 16) calcoliamo le coordinate dei punti (FiQi) e le congiungiamo Nel caso in esame la curva egrave piugrave vicina alla bisettrice

i x_i F_i Q_i

0 0 0

1 16 01429 00494

2 21 02857 01142

3 23 04286 01852

4 32 05714 02840

5 62 07143 04753

6 80 08571 07222

7 90 1 1

9

Indici di concentrazione

La curva di Lorenz-Gini egrave uno strumento grafico per rappresentare la concentrazione di un carattere Puograve tuttavia essere comodo valutare la concentrazione attraverso un indice numerico

Intuitivamente quanto piugrave la bisettrice si discosta dalla curva di concentrazione tanto maggiore egrave la concentrazione del carattere Ersquo naturale quindi costruire un indice di concentrazione basato sullo ldquoscostamentordquo della curva dalla bisettrice Una misura dello scostamento puograve essere basata

bullsulle distanze verticali tra la curva di concentrazione e la bisettricebullsullrsquoarea compresa tra la curva di concentrazione e la bisettrice

10

Indice di concentrazione (1) Le distanze verticali tra la curva di concentrazione e la bisettrice sono date da (Fi ndash Qi)

e sono non negative Un indice relativo di concentrazione si puograve ottenere dividendo la somma delle (Fi ndash Qi) per il valore massimo che tali differenze possono assumere

Lrsquoindice sopra egrave lrsquoindice di concentrazione di Gini Si ha 0 le R le 1 e in particolare

R = 0 nel caso di equiripartizione infatti in tal caso Fi - Qi =0 i=12hellipN-1

R = 1 nel caso di massima concentrazione infatti in tal caso Fi - Qi = Fi i=12hellipN-1

11

0

01

02

03

04

05

06

07

08

09

1

0 02 04 06 08 1

qi

pi

Indice di concentrazione (2)

Lrsquoarea A in figura compresa tra la curva di concentrazione e la retta di equidistribuzione prende il nome di area di concentrazione Si noti che A egrave pari allrsquoarea del triangolo di coordinate (00) (10) (11) meno lrsquoarea B formata dai trapezi di altezza Fi-Fi-1 e basi Qi e Qi-1

Area del trapezio

frac12 x Somma delle basi x altezza

A B

12

Un indice relativo di concentrazione si puograve ottenere dividendo lrsquoarea di concentrazione per il valore massimo che lrsquoarea puograve assumere

dove Amax si ottiene considerando lrsquoarea nel caso x1 =hellip= xN-1 =0 xN=Nμ e risulta pari a 12 ndash (1N)(1)(12)=(N-1)2N

Per costruzione egrave 0 le R le 1 in particolarebullR=0 nel caso di equiripartizionebullR=1 nel caso di massima concentrazione

Si puograve dimostrare che il rapporto cosigrave costruito egrave uguale ad R

Indice di concentrazione (2)

13

Un altro indice di concentrazione sempre basato sullrsquoarea si puograve ottenere osservando che questrsquoultima non puograve superare il valore 12 Possiamo quindi rapportare lrsquoarea di concentrazione al suo valore massimo teorico

Si ha (percheacute) con i due indici che tendono a coincidere per N grande

Indice di concentrazione (3)

14

80 90 21 23 32 16 62

Un esempio

i x_i F_i Q_i (Fi-Qi)

1 16 01429 00494 00935

2 21 02857 01142 01715

3 23 04286 01852 02434

4 32 05714 02840 02875

5 62 07143 04753 02390

6 80 08571 07222 01349

7 90 1 1

Totale

324 3 11698

Dati i redditi di 7 individui

per ricavare la curva di concentrazione organizziamo le osservazioni in tabella avendo cura di ordinarle in base ai valori di x (ad esempio X1=16 percheacute lrsquoindividuo piugrave povero possiede 16) e calcoliamo le differenze (Fi-Qi)

15

80 90 21 23 32 16 62

Per calcolare R con la formula (2) usiamo una tabella simile alla precedente per ricavare il numeratore Lrsquoarea massima che compare a denominatore egrave pari allrsquoarea massima teorica meno lrsquoarea del triangolo di base F7-F6 e altezza 1 Il calcolo di Ř egrave del tutto analogo egrave sufficiente porre lrsquoarea massima pari a frac12

Data i redditi di 7 individui

Un esempio

i x_i F_i Q_i (Fi-Fi-1)(Qi+Qi-1)

1 16 01429 00494 00070

2 21 02857 01142 00233

3 23 04286 01852 00427

4 32 05714 02840 00670

5 62 07143 04753 01085

6 80 08571 07222 01710

7 90 1 1 02461

Totale

06658

16

Variabili statistiche discrete

Finora abbiamo considerato N osservazioni non raggruppate Per ricavare lrsquoindice o la curva di concentrazione a partire da una distribuzione di frequenze assolute possiamo usare le seguenti versioni ldquoponderaterdquo di Fi e Qi

dove x1hellipxk sono k valori distinti ordinati in modo non decrescente con numerositagrave n1 hellipnk

17

Variabili statistiche discrete

1

1

1

1

)(

k

ii

k

iii

F

QFR

Con le coppie (Fi Qi) si puograve ottenere un indice analogo ad R

In generale RneR sugli stessi dati Infatti con lrsquoindice sopra la situazione di massima concentrazione si ha quando tutto il carattere appartiene alla k-esima classe (e non allrsquo N-esimo individuo come nel caso di R)

Unendo le coppie (Fi Qi

) si ottiene la stessa curva di concentrazione che si otterrebbe utilizzando con i dati unitari Infatti si puograve dimostrare che la pendenza della curva non cambia passando tra individui che hanno lo stesso ammontare di carattere Lrsquounica differenza egrave che ora per ottenere la spezzata si devono congiungere kltN punti

18

Nel caso in cui si disponga dellrsquoinformazione sullrsquoammontare totale di carattere in un intervallo egrave consigliabile discretizzare gli intervalli in modo ldquocoerenterdquo con tale informazione

Esempio se nellrsquointervallo [515) di numerositagrave Ni=10 il carattere totale egrave pari a 60 egrave preferibile discretizzare lrsquointervallo assumendo come punto ldquomediordquo il valore 6 e non il valore 10 (al quale corrisponderebbe un reddito totale di 100 e non di 60) Si noti che devono essere note le numerositagrave degli intervalli per poter procedere in questo modo

Nel caso in cui si disponga dellrsquoinformazione sullrsquoammontare totale di carattere in un intervallo egrave consigliabile discretizzare gli intervalli in modo ldquocoerenterdquo con tale informazione

Esempio se nellrsquointervallo [515) di numerositagrave Ni=10 il carattere totale egrave pari a 60 egrave preferibile discretizzare lrsquointervallo assumendo come punto ldquomediordquo il valore 6 e non il valore 10 (al quale corrisponderebbe un reddito totale di 100 e non di 60) Si noti che devono essere note le numerositagrave degli intervalli per poter procedere in questo modo

Se si desidera ricavare lrsquoindice o la curva di concentrazione per una variabile continua per intervallo il modo piugrave semplice di procedere consiste nel ldquodiscretizzarerdquo la variabile considerando le frequenze ldquoconcentraterdquo nei punti medi degli intervalli Si puograve poi procedere come nel caso precedente

Se si desidera ricavare lrsquoindice o la curva di concentrazione per una variabile continua per intervallo il modo piugrave semplice di procedere consiste nel ldquodiscretizzarerdquo la variabile considerando le frequenze ldquoconcentraterdquo nei punti medi degli intervalli Si puograve poi procedere come nel caso precedente

Variabili statistiche continue per intervallo

19

Se X egrave una variabile statistica continua non negativa con densitagrave f(x) e media finita μ le espressioni delle frequenze e delle intensitagrave cumulate diventano

Se X egrave una variabile statistica continua non negativa con densitagrave f(x) e media finita μ le espressioni delle frequenze e delle intensitagrave cumulate diventano

Variabili statistiche continue

Nota Talvolta si esprimono F e Q in funzione della frequenza cumulata r In tal caso si ha x = F-1( r ) da cui le nuove variabili

20

Il valore di R per un carattere con distribuzione continua si puograve ottenere come nel caso discreto rapportando lrsquoarea di concentrazione al suo valore massimo pari ad 12

Il valore di R per un carattere con distribuzione continua si puograve ottenere come nel caso discreto rapportando lrsquoarea di concentrazione al suo valore massimo pari ad 12

Variabili statistiche continue

Lrsquoindice di Gini egrave quindi pari a due volte lrsquoarea di concentrazione

Nota essendo Amax =12 si ha R=Ř

ConfrontiPuograve essere interessante confrontare la concentrazione di due caratteri

(o equivalentemente dello stesso carattere in due istanti diversi o in due ambiti territoriali diversi)

Esempio 1 il reddito risulta piugrave concentrato in Italia o in Francia

Esempio 2 la concentrazione del reddito in Italia era maggiore negli anni lsquo80 o negli anni lsquo90

Un modo semplice per stabilire quale carattere egrave maggiormente concentrato egrave quello di confrontare graficamente le curve di concentrazione nei due ambiti territoriali (o temporali) e stabilire quale si trova al di sopra

21

bull Non egrave detto che una delle due curve sia al di sopra dellrsquoaltra le curve si possono intersecare Si puograve tuttavia mostrare che se il carattere varia linearmente tra gli ambiti considerati allora le curve non si intersecano

bull In generale si puograve effettuare il confronto usando lrsquoindice di Gini

bull Poicheacute G=2A=1-2Area_sotto_la_curva_Lorenz il confronto attraverso lrsquoindici di Gini equivale al confronto tra le aree al di sotto delle curve di Lorenz dei due caratteri

Confronti

Confronti

Esempio la concentrazione del reddito nel mondo usando lrsquoindice R

23

Fonte CIA The world Factbook 2009

24

Esempio di Confronto Tra DistribuzioniSi riportano di seguito le distribuzioni dei finanziamenti concessi da un istituto bancario per lrsquoacquisto della prima casa a giovani coppie residenti in Campania ed in Sardegna

a) In quale regione risulta piugrave elevata la concentrazione dei finanziamenti concessi

b) Confrontare graficamente i diversi livelli di concentrazione dei finanziamenti nelle due regioni

Campania

Finanziamenti (migliaia di Euro) ni

0-50 10

50-100 25

100-150 37

150-200 22

200-250 6

Totale 100

Sardegna

Finanziamenti (migliaia di Euro) ni

0-50 57

50-100 3

100-150 7

150-200 8

200-250 25

Totale 100

25

Sardegna

Finanziamenti (migliaia di Euro) ni Ni pi xi xi ni Xi qi pi+1- pi qi+1+ qi (pi+1- pi)(qi+1+ qi)

0 0 0 0000 0 0 0 0000 0570 0149 0085

0-50 57 57 0570 25 1425 1425 0149 0030 0322 0010

50-100 3 60 0600 75 225 1650 0173 0070 0437 0031

100-150 7 67 0670 125 875 2525 0264 0080 0675 0054

150-200 8 75 0750 175 1400 3925 0411 0250 1411 0353

200-250 25 100 1000 225 5625 9550 1000 - - -

Totale 100 9550 0532

Concentrazione dei finanziamenti in Sardegna

26

Concentrazione dei finanziamenti in Campania

Campania

Finanziamenti (migliaia di Euro) ni Ni pi xi xi ni Xi qi pi+1- pi qi+1+ qi (pi+1- pi)(qi+1+ qi)

0 0 0 0000 0 0 0 0000 0100 0021 0002

0-50 10 10 0100 25 250 250 0021 0250 0199 0050

50-100 25 35 0350 75 1875 2125 0178 0370 0743 0275

100-150 37 72 0720 125 4625 6750 0565 0220 1452 0319

150-200 22 94 0940 175 3850 10600 0887 0060 1887 0113

200-250 6 100 1000 225 1350 11950 1000 - - -

Totale 100 11950 0759

27

00

01

02

03

04

05

06

07

08

09

10

00 01 02 03 04 05 06 07 08 09 10

pi

qi

Equidistribuzione Sardegna Campania

4680R~sar 2410R

~cam La concentrazione egrave piugrave

elevata in Sardegna

La curva di Lorenz conferma questo risultato

28

Riferimenti

bull C Gini (1912) Variabilitagrave e mutabilitagrave Contributo allo studio delle distribuzioni e relazioni statistiche Studi economici-giuridici dela Regia Universitagrave di Cagliari anno III

bull Lorenz M O (1905) Methods of measuring the concentration of wealth Publications of the American Statistical Association (Publications of the American Statistical Association Vol 9 No 70) 9 (70) 209ndash219

bull Per ulteriori riferimenti si possono consultare utilmente le pagine di Wikipedia relative allrsquoindice di Gini e alla curva di Lorenz

  • Appunti sulla concentrazione
  • Sommario
  • Introduzione
  • Slide 4
  • Curva di concentrazione
  • Slide 6
  • Slide 7
  • Un esempio
  • Indici di concentrazione
  • Indice di concentrazione (1)
  • Indice di concentrazione (2)
  • Slide 12
  • Indice di concentrazione (3)
  • Slide 14
  • Slide 15
  • Variabili statistiche discrete
  • Slide 17
  • Variabili statistiche continue per intervallo
  • Variabili statistiche continue
  • Slide 20
  • Confronti
  • Slide 22
  • Slide 23
  • PowerPoint Presentation
  • Slide 25
  • Slide 26
  • Slide 27
  • Slide 28
Page 8: Appunti sulla concentrazione a.a. 2012-2013 v.3. 2 Sommario Introduzione La curva di concentrazione Indici di concentrazione Confronti Riferimenti

Un esempio

8

80 90 21 23 32 16 62Dati i redditi di 7 individui

per ricavare la curva di concentrazione organizziamo le osservazioni in tabella (avendo cura di ordinarle in base ai valori di x ad esempio X1=16 percheacute lrsquoindividuo piugrave povero possiede 16) calcoliamo le coordinate dei punti (FiQi) e le congiungiamo Nel caso in esame la curva egrave piugrave vicina alla bisettrice

i x_i F_i Q_i

0 0 0

1 16 01429 00494

2 21 02857 01142

3 23 04286 01852

4 32 05714 02840

5 62 07143 04753

6 80 08571 07222

7 90 1 1

9

Indici di concentrazione

La curva di Lorenz-Gini egrave uno strumento grafico per rappresentare la concentrazione di un carattere Puograve tuttavia essere comodo valutare la concentrazione attraverso un indice numerico

Intuitivamente quanto piugrave la bisettrice si discosta dalla curva di concentrazione tanto maggiore egrave la concentrazione del carattere Ersquo naturale quindi costruire un indice di concentrazione basato sullo ldquoscostamentordquo della curva dalla bisettrice Una misura dello scostamento puograve essere basata

bullsulle distanze verticali tra la curva di concentrazione e la bisettricebullsullrsquoarea compresa tra la curva di concentrazione e la bisettrice

10

Indice di concentrazione (1) Le distanze verticali tra la curva di concentrazione e la bisettrice sono date da (Fi ndash Qi)

e sono non negative Un indice relativo di concentrazione si puograve ottenere dividendo la somma delle (Fi ndash Qi) per il valore massimo che tali differenze possono assumere

Lrsquoindice sopra egrave lrsquoindice di concentrazione di Gini Si ha 0 le R le 1 e in particolare

R = 0 nel caso di equiripartizione infatti in tal caso Fi - Qi =0 i=12hellipN-1

R = 1 nel caso di massima concentrazione infatti in tal caso Fi - Qi = Fi i=12hellipN-1

11

0

01

02

03

04

05

06

07

08

09

1

0 02 04 06 08 1

qi

pi

Indice di concentrazione (2)

Lrsquoarea A in figura compresa tra la curva di concentrazione e la retta di equidistribuzione prende il nome di area di concentrazione Si noti che A egrave pari allrsquoarea del triangolo di coordinate (00) (10) (11) meno lrsquoarea B formata dai trapezi di altezza Fi-Fi-1 e basi Qi e Qi-1

Area del trapezio

frac12 x Somma delle basi x altezza

A B

12

Un indice relativo di concentrazione si puograve ottenere dividendo lrsquoarea di concentrazione per il valore massimo che lrsquoarea puograve assumere

dove Amax si ottiene considerando lrsquoarea nel caso x1 =hellip= xN-1 =0 xN=Nμ e risulta pari a 12 ndash (1N)(1)(12)=(N-1)2N

Per costruzione egrave 0 le R le 1 in particolarebullR=0 nel caso di equiripartizionebullR=1 nel caso di massima concentrazione

Si puograve dimostrare che il rapporto cosigrave costruito egrave uguale ad R

Indice di concentrazione (2)

13

Un altro indice di concentrazione sempre basato sullrsquoarea si puograve ottenere osservando che questrsquoultima non puograve superare il valore 12 Possiamo quindi rapportare lrsquoarea di concentrazione al suo valore massimo teorico

Si ha (percheacute) con i due indici che tendono a coincidere per N grande

Indice di concentrazione (3)

14

80 90 21 23 32 16 62

Un esempio

i x_i F_i Q_i (Fi-Qi)

1 16 01429 00494 00935

2 21 02857 01142 01715

3 23 04286 01852 02434

4 32 05714 02840 02875

5 62 07143 04753 02390

6 80 08571 07222 01349

7 90 1 1

Totale

324 3 11698

Dati i redditi di 7 individui

per ricavare la curva di concentrazione organizziamo le osservazioni in tabella avendo cura di ordinarle in base ai valori di x (ad esempio X1=16 percheacute lrsquoindividuo piugrave povero possiede 16) e calcoliamo le differenze (Fi-Qi)

15

80 90 21 23 32 16 62

Per calcolare R con la formula (2) usiamo una tabella simile alla precedente per ricavare il numeratore Lrsquoarea massima che compare a denominatore egrave pari allrsquoarea massima teorica meno lrsquoarea del triangolo di base F7-F6 e altezza 1 Il calcolo di Ř egrave del tutto analogo egrave sufficiente porre lrsquoarea massima pari a frac12

Data i redditi di 7 individui

Un esempio

i x_i F_i Q_i (Fi-Fi-1)(Qi+Qi-1)

1 16 01429 00494 00070

2 21 02857 01142 00233

3 23 04286 01852 00427

4 32 05714 02840 00670

5 62 07143 04753 01085

6 80 08571 07222 01710

7 90 1 1 02461

Totale

06658

16

Variabili statistiche discrete

Finora abbiamo considerato N osservazioni non raggruppate Per ricavare lrsquoindice o la curva di concentrazione a partire da una distribuzione di frequenze assolute possiamo usare le seguenti versioni ldquoponderaterdquo di Fi e Qi

dove x1hellipxk sono k valori distinti ordinati in modo non decrescente con numerositagrave n1 hellipnk

17

Variabili statistiche discrete

1

1

1

1

)(

k

ii

k

iii

F

QFR

Con le coppie (Fi Qi) si puograve ottenere un indice analogo ad R

In generale RneR sugli stessi dati Infatti con lrsquoindice sopra la situazione di massima concentrazione si ha quando tutto il carattere appartiene alla k-esima classe (e non allrsquo N-esimo individuo come nel caso di R)

Unendo le coppie (Fi Qi

) si ottiene la stessa curva di concentrazione che si otterrebbe utilizzando con i dati unitari Infatti si puograve dimostrare che la pendenza della curva non cambia passando tra individui che hanno lo stesso ammontare di carattere Lrsquounica differenza egrave che ora per ottenere la spezzata si devono congiungere kltN punti

18

Nel caso in cui si disponga dellrsquoinformazione sullrsquoammontare totale di carattere in un intervallo egrave consigliabile discretizzare gli intervalli in modo ldquocoerenterdquo con tale informazione

Esempio se nellrsquointervallo [515) di numerositagrave Ni=10 il carattere totale egrave pari a 60 egrave preferibile discretizzare lrsquointervallo assumendo come punto ldquomediordquo il valore 6 e non il valore 10 (al quale corrisponderebbe un reddito totale di 100 e non di 60) Si noti che devono essere note le numerositagrave degli intervalli per poter procedere in questo modo

Nel caso in cui si disponga dellrsquoinformazione sullrsquoammontare totale di carattere in un intervallo egrave consigliabile discretizzare gli intervalli in modo ldquocoerenterdquo con tale informazione

Esempio se nellrsquointervallo [515) di numerositagrave Ni=10 il carattere totale egrave pari a 60 egrave preferibile discretizzare lrsquointervallo assumendo come punto ldquomediordquo il valore 6 e non il valore 10 (al quale corrisponderebbe un reddito totale di 100 e non di 60) Si noti che devono essere note le numerositagrave degli intervalli per poter procedere in questo modo

Se si desidera ricavare lrsquoindice o la curva di concentrazione per una variabile continua per intervallo il modo piugrave semplice di procedere consiste nel ldquodiscretizzarerdquo la variabile considerando le frequenze ldquoconcentraterdquo nei punti medi degli intervalli Si puograve poi procedere come nel caso precedente

Se si desidera ricavare lrsquoindice o la curva di concentrazione per una variabile continua per intervallo il modo piugrave semplice di procedere consiste nel ldquodiscretizzarerdquo la variabile considerando le frequenze ldquoconcentraterdquo nei punti medi degli intervalli Si puograve poi procedere come nel caso precedente

Variabili statistiche continue per intervallo

19

Se X egrave una variabile statistica continua non negativa con densitagrave f(x) e media finita μ le espressioni delle frequenze e delle intensitagrave cumulate diventano

Se X egrave una variabile statistica continua non negativa con densitagrave f(x) e media finita μ le espressioni delle frequenze e delle intensitagrave cumulate diventano

Variabili statistiche continue

Nota Talvolta si esprimono F e Q in funzione della frequenza cumulata r In tal caso si ha x = F-1( r ) da cui le nuove variabili

20

Il valore di R per un carattere con distribuzione continua si puograve ottenere come nel caso discreto rapportando lrsquoarea di concentrazione al suo valore massimo pari ad 12

Il valore di R per un carattere con distribuzione continua si puograve ottenere come nel caso discreto rapportando lrsquoarea di concentrazione al suo valore massimo pari ad 12

Variabili statistiche continue

Lrsquoindice di Gini egrave quindi pari a due volte lrsquoarea di concentrazione

Nota essendo Amax =12 si ha R=Ř

ConfrontiPuograve essere interessante confrontare la concentrazione di due caratteri

(o equivalentemente dello stesso carattere in due istanti diversi o in due ambiti territoriali diversi)

Esempio 1 il reddito risulta piugrave concentrato in Italia o in Francia

Esempio 2 la concentrazione del reddito in Italia era maggiore negli anni lsquo80 o negli anni lsquo90

Un modo semplice per stabilire quale carattere egrave maggiormente concentrato egrave quello di confrontare graficamente le curve di concentrazione nei due ambiti territoriali (o temporali) e stabilire quale si trova al di sopra

21

bull Non egrave detto che una delle due curve sia al di sopra dellrsquoaltra le curve si possono intersecare Si puograve tuttavia mostrare che se il carattere varia linearmente tra gli ambiti considerati allora le curve non si intersecano

bull In generale si puograve effettuare il confronto usando lrsquoindice di Gini

bull Poicheacute G=2A=1-2Area_sotto_la_curva_Lorenz il confronto attraverso lrsquoindici di Gini equivale al confronto tra le aree al di sotto delle curve di Lorenz dei due caratteri

Confronti

Confronti

Esempio la concentrazione del reddito nel mondo usando lrsquoindice R

23

Fonte CIA The world Factbook 2009

24

Esempio di Confronto Tra DistribuzioniSi riportano di seguito le distribuzioni dei finanziamenti concessi da un istituto bancario per lrsquoacquisto della prima casa a giovani coppie residenti in Campania ed in Sardegna

a) In quale regione risulta piugrave elevata la concentrazione dei finanziamenti concessi

b) Confrontare graficamente i diversi livelli di concentrazione dei finanziamenti nelle due regioni

Campania

Finanziamenti (migliaia di Euro) ni

0-50 10

50-100 25

100-150 37

150-200 22

200-250 6

Totale 100

Sardegna

Finanziamenti (migliaia di Euro) ni

0-50 57

50-100 3

100-150 7

150-200 8

200-250 25

Totale 100

25

Sardegna

Finanziamenti (migliaia di Euro) ni Ni pi xi xi ni Xi qi pi+1- pi qi+1+ qi (pi+1- pi)(qi+1+ qi)

0 0 0 0000 0 0 0 0000 0570 0149 0085

0-50 57 57 0570 25 1425 1425 0149 0030 0322 0010

50-100 3 60 0600 75 225 1650 0173 0070 0437 0031

100-150 7 67 0670 125 875 2525 0264 0080 0675 0054

150-200 8 75 0750 175 1400 3925 0411 0250 1411 0353

200-250 25 100 1000 225 5625 9550 1000 - - -

Totale 100 9550 0532

Concentrazione dei finanziamenti in Sardegna

26

Concentrazione dei finanziamenti in Campania

Campania

Finanziamenti (migliaia di Euro) ni Ni pi xi xi ni Xi qi pi+1- pi qi+1+ qi (pi+1- pi)(qi+1+ qi)

0 0 0 0000 0 0 0 0000 0100 0021 0002

0-50 10 10 0100 25 250 250 0021 0250 0199 0050

50-100 25 35 0350 75 1875 2125 0178 0370 0743 0275

100-150 37 72 0720 125 4625 6750 0565 0220 1452 0319

150-200 22 94 0940 175 3850 10600 0887 0060 1887 0113

200-250 6 100 1000 225 1350 11950 1000 - - -

Totale 100 11950 0759

27

00

01

02

03

04

05

06

07

08

09

10

00 01 02 03 04 05 06 07 08 09 10

pi

qi

Equidistribuzione Sardegna Campania

4680R~sar 2410R

~cam La concentrazione egrave piugrave

elevata in Sardegna

La curva di Lorenz conferma questo risultato

28

Riferimenti

bull C Gini (1912) Variabilitagrave e mutabilitagrave Contributo allo studio delle distribuzioni e relazioni statistiche Studi economici-giuridici dela Regia Universitagrave di Cagliari anno III

bull Lorenz M O (1905) Methods of measuring the concentration of wealth Publications of the American Statistical Association (Publications of the American Statistical Association Vol 9 No 70) 9 (70) 209ndash219

bull Per ulteriori riferimenti si possono consultare utilmente le pagine di Wikipedia relative allrsquoindice di Gini e alla curva di Lorenz

  • Appunti sulla concentrazione
  • Sommario
  • Introduzione
  • Slide 4
  • Curva di concentrazione
  • Slide 6
  • Slide 7
  • Un esempio
  • Indici di concentrazione
  • Indice di concentrazione (1)
  • Indice di concentrazione (2)
  • Slide 12
  • Indice di concentrazione (3)
  • Slide 14
  • Slide 15
  • Variabili statistiche discrete
  • Slide 17
  • Variabili statistiche continue per intervallo
  • Variabili statistiche continue
  • Slide 20
  • Confronti
  • Slide 22
  • Slide 23
  • PowerPoint Presentation
  • Slide 25
  • Slide 26
  • Slide 27
  • Slide 28
Page 9: Appunti sulla concentrazione a.a. 2012-2013 v.3. 2 Sommario Introduzione La curva di concentrazione Indici di concentrazione Confronti Riferimenti

9

Indici di concentrazione

La curva di Lorenz-Gini egrave uno strumento grafico per rappresentare la concentrazione di un carattere Puograve tuttavia essere comodo valutare la concentrazione attraverso un indice numerico

Intuitivamente quanto piugrave la bisettrice si discosta dalla curva di concentrazione tanto maggiore egrave la concentrazione del carattere Ersquo naturale quindi costruire un indice di concentrazione basato sullo ldquoscostamentordquo della curva dalla bisettrice Una misura dello scostamento puograve essere basata

bullsulle distanze verticali tra la curva di concentrazione e la bisettricebullsullrsquoarea compresa tra la curva di concentrazione e la bisettrice

10

Indice di concentrazione (1) Le distanze verticali tra la curva di concentrazione e la bisettrice sono date da (Fi ndash Qi)

e sono non negative Un indice relativo di concentrazione si puograve ottenere dividendo la somma delle (Fi ndash Qi) per il valore massimo che tali differenze possono assumere

Lrsquoindice sopra egrave lrsquoindice di concentrazione di Gini Si ha 0 le R le 1 e in particolare

R = 0 nel caso di equiripartizione infatti in tal caso Fi - Qi =0 i=12hellipN-1

R = 1 nel caso di massima concentrazione infatti in tal caso Fi - Qi = Fi i=12hellipN-1

11

0

01

02

03

04

05

06

07

08

09

1

0 02 04 06 08 1

qi

pi

Indice di concentrazione (2)

Lrsquoarea A in figura compresa tra la curva di concentrazione e la retta di equidistribuzione prende il nome di area di concentrazione Si noti che A egrave pari allrsquoarea del triangolo di coordinate (00) (10) (11) meno lrsquoarea B formata dai trapezi di altezza Fi-Fi-1 e basi Qi e Qi-1

Area del trapezio

frac12 x Somma delle basi x altezza

A B

12

Un indice relativo di concentrazione si puograve ottenere dividendo lrsquoarea di concentrazione per il valore massimo che lrsquoarea puograve assumere

dove Amax si ottiene considerando lrsquoarea nel caso x1 =hellip= xN-1 =0 xN=Nμ e risulta pari a 12 ndash (1N)(1)(12)=(N-1)2N

Per costruzione egrave 0 le R le 1 in particolarebullR=0 nel caso di equiripartizionebullR=1 nel caso di massima concentrazione

Si puograve dimostrare che il rapporto cosigrave costruito egrave uguale ad R

Indice di concentrazione (2)

13

Un altro indice di concentrazione sempre basato sullrsquoarea si puograve ottenere osservando che questrsquoultima non puograve superare il valore 12 Possiamo quindi rapportare lrsquoarea di concentrazione al suo valore massimo teorico

Si ha (percheacute) con i due indici che tendono a coincidere per N grande

Indice di concentrazione (3)

14

80 90 21 23 32 16 62

Un esempio

i x_i F_i Q_i (Fi-Qi)

1 16 01429 00494 00935

2 21 02857 01142 01715

3 23 04286 01852 02434

4 32 05714 02840 02875

5 62 07143 04753 02390

6 80 08571 07222 01349

7 90 1 1

Totale

324 3 11698

Dati i redditi di 7 individui

per ricavare la curva di concentrazione organizziamo le osservazioni in tabella avendo cura di ordinarle in base ai valori di x (ad esempio X1=16 percheacute lrsquoindividuo piugrave povero possiede 16) e calcoliamo le differenze (Fi-Qi)

15

80 90 21 23 32 16 62

Per calcolare R con la formula (2) usiamo una tabella simile alla precedente per ricavare il numeratore Lrsquoarea massima che compare a denominatore egrave pari allrsquoarea massima teorica meno lrsquoarea del triangolo di base F7-F6 e altezza 1 Il calcolo di Ř egrave del tutto analogo egrave sufficiente porre lrsquoarea massima pari a frac12

Data i redditi di 7 individui

Un esempio

i x_i F_i Q_i (Fi-Fi-1)(Qi+Qi-1)

1 16 01429 00494 00070

2 21 02857 01142 00233

3 23 04286 01852 00427

4 32 05714 02840 00670

5 62 07143 04753 01085

6 80 08571 07222 01710

7 90 1 1 02461

Totale

06658

16

Variabili statistiche discrete

Finora abbiamo considerato N osservazioni non raggruppate Per ricavare lrsquoindice o la curva di concentrazione a partire da una distribuzione di frequenze assolute possiamo usare le seguenti versioni ldquoponderaterdquo di Fi e Qi

dove x1hellipxk sono k valori distinti ordinati in modo non decrescente con numerositagrave n1 hellipnk

17

Variabili statistiche discrete

1

1

1

1

)(

k

ii

k

iii

F

QFR

Con le coppie (Fi Qi) si puograve ottenere un indice analogo ad R

In generale RneR sugli stessi dati Infatti con lrsquoindice sopra la situazione di massima concentrazione si ha quando tutto il carattere appartiene alla k-esima classe (e non allrsquo N-esimo individuo come nel caso di R)

Unendo le coppie (Fi Qi

) si ottiene la stessa curva di concentrazione che si otterrebbe utilizzando con i dati unitari Infatti si puograve dimostrare che la pendenza della curva non cambia passando tra individui che hanno lo stesso ammontare di carattere Lrsquounica differenza egrave che ora per ottenere la spezzata si devono congiungere kltN punti

18

Nel caso in cui si disponga dellrsquoinformazione sullrsquoammontare totale di carattere in un intervallo egrave consigliabile discretizzare gli intervalli in modo ldquocoerenterdquo con tale informazione

Esempio se nellrsquointervallo [515) di numerositagrave Ni=10 il carattere totale egrave pari a 60 egrave preferibile discretizzare lrsquointervallo assumendo come punto ldquomediordquo il valore 6 e non il valore 10 (al quale corrisponderebbe un reddito totale di 100 e non di 60) Si noti che devono essere note le numerositagrave degli intervalli per poter procedere in questo modo

Nel caso in cui si disponga dellrsquoinformazione sullrsquoammontare totale di carattere in un intervallo egrave consigliabile discretizzare gli intervalli in modo ldquocoerenterdquo con tale informazione

Esempio se nellrsquointervallo [515) di numerositagrave Ni=10 il carattere totale egrave pari a 60 egrave preferibile discretizzare lrsquointervallo assumendo come punto ldquomediordquo il valore 6 e non il valore 10 (al quale corrisponderebbe un reddito totale di 100 e non di 60) Si noti che devono essere note le numerositagrave degli intervalli per poter procedere in questo modo

Se si desidera ricavare lrsquoindice o la curva di concentrazione per una variabile continua per intervallo il modo piugrave semplice di procedere consiste nel ldquodiscretizzarerdquo la variabile considerando le frequenze ldquoconcentraterdquo nei punti medi degli intervalli Si puograve poi procedere come nel caso precedente

Se si desidera ricavare lrsquoindice o la curva di concentrazione per una variabile continua per intervallo il modo piugrave semplice di procedere consiste nel ldquodiscretizzarerdquo la variabile considerando le frequenze ldquoconcentraterdquo nei punti medi degli intervalli Si puograve poi procedere come nel caso precedente

Variabili statistiche continue per intervallo

19

Se X egrave una variabile statistica continua non negativa con densitagrave f(x) e media finita μ le espressioni delle frequenze e delle intensitagrave cumulate diventano

Se X egrave una variabile statistica continua non negativa con densitagrave f(x) e media finita μ le espressioni delle frequenze e delle intensitagrave cumulate diventano

Variabili statistiche continue

Nota Talvolta si esprimono F e Q in funzione della frequenza cumulata r In tal caso si ha x = F-1( r ) da cui le nuove variabili

20

Il valore di R per un carattere con distribuzione continua si puograve ottenere come nel caso discreto rapportando lrsquoarea di concentrazione al suo valore massimo pari ad 12

Il valore di R per un carattere con distribuzione continua si puograve ottenere come nel caso discreto rapportando lrsquoarea di concentrazione al suo valore massimo pari ad 12

Variabili statistiche continue

Lrsquoindice di Gini egrave quindi pari a due volte lrsquoarea di concentrazione

Nota essendo Amax =12 si ha R=Ř

ConfrontiPuograve essere interessante confrontare la concentrazione di due caratteri

(o equivalentemente dello stesso carattere in due istanti diversi o in due ambiti territoriali diversi)

Esempio 1 il reddito risulta piugrave concentrato in Italia o in Francia

Esempio 2 la concentrazione del reddito in Italia era maggiore negli anni lsquo80 o negli anni lsquo90

Un modo semplice per stabilire quale carattere egrave maggiormente concentrato egrave quello di confrontare graficamente le curve di concentrazione nei due ambiti territoriali (o temporali) e stabilire quale si trova al di sopra

21

bull Non egrave detto che una delle due curve sia al di sopra dellrsquoaltra le curve si possono intersecare Si puograve tuttavia mostrare che se il carattere varia linearmente tra gli ambiti considerati allora le curve non si intersecano

bull In generale si puograve effettuare il confronto usando lrsquoindice di Gini

bull Poicheacute G=2A=1-2Area_sotto_la_curva_Lorenz il confronto attraverso lrsquoindici di Gini equivale al confronto tra le aree al di sotto delle curve di Lorenz dei due caratteri

Confronti

Confronti

Esempio la concentrazione del reddito nel mondo usando lrsquoindice R

23

Fonte CIA The world Factbook 2009

24

Esempio di Confronto Tra DistribuzioniSi riportano di seguito le distribuzioni dei finanziamenti concessi da un istituto bancario per lrsquoacquisto della prima casa a giovani coppie residenti in Campania ed in Sardegna

a) In quale regione risulta piugrave elevata la concentrazione dei finanziamenti concessi

b) Confrontare graficamente i diversi livelli di concentrazione dei finanziamenti nelle due regioni

Campania

Finanziamenti (migliaia di Euro) ni

0-50 10

50-100 25

100-150 37

150-200 22

200-250 6

Totale 100

Sardegna

Finanziamenti (migliaia di Euro) ni

0-50 57

50-100 3

100-150 7

150-200 8

200-250 25

Totale 100

25

Sardegna

Finanziamenti (migliaia di Euro) ni Ni pi xi xi ni Xi qi pi+1- pi qi+1+ qi (pi+1- pi)(qi+1+ qi)

0 0 0 0000 0 0 0 0000 0570 0149 0085

0-50 57 57 0570 25 1425 1425 0149 0030 0322 0010

50-100 3 60 0600 75 225 1650 0173 0070 0437 0031

100-150 7 67 0670 125 875 2525 0264 0080 0675 0054

150-200 8 75 0750 175 1400 3925 0411 0250 1411 0353

200-250 25 100 1000 225 5625 9550 1000 - - -

Totale 100 9550 0532

Concentrazione dei finanziamenti in Sardegna

26

Concentrazione dei finanziamenti in Campania

Campania

Finanziamenti (migliaia di Euro) ni Ni pi xi xi ni Xi qi pi+1- pi qi+1+ qi (pi+1- pi)(qi+1+ qi)

0 0 0 0000 0 0 0 0000 0100 0021 0002

0-50 10 10 0100 25 250 250 0021 0250 0199 0050

50-100 25 35 0350 75 1875 2125 0178 0370 0743 0275

100-150 37 72 0720 125 4625 6750 0565 0220 1452 0319

150-200 22 94 0940 175 3850 10600 0887 0060 1887 0113

200-250 6 100 1000 225 1350 11950 1000 - - -

Totale 100 11950 0759

27

00

01

02

03

04

05

06

07

08

09

10

00 01 02 03 04 05 06 07 08 09 10

pi

qi

Equidistribuzione Sardegna Campania

4680R~sar 2410R

~cam La concentrazione egrave piugrave

elevata in Sardegna

La curva di Lorenz conferma questo risultato

28

Riferimenti

bull C Gini (1912) Variabilitagrave e mutabilitagrave Contributo allo studio delle distribuzioni e relazioni statistiche Studi economici-giuridici dela Regia Universitagrave di Cagliari anno III

bull Lorenz M O (1905) Methods of measuring the concentration of wealth Publications of the American Statistical Association (Publications of the American Statistical Association Vol 9 No 70) 9 (70) 209ndash219

bull Per ulteriori riferimenti si possono consultare utilmente le pagine di Wikipedia relative allrsquoindice di Gini e alla curva di Lorenz

  • Appunti sulla concentrazione
  • Sommario
  • Introduzione
  • Slide 4
  • Curva di concentrazione
  • Slide 6
  • Slide 7
  • Un esempio
  • Indici di concentrazione
  • Indice di concentrazione (1)
  • Indice di concentrazione (2)
  • Slide 12
  • Indice di concentrazione (3)
  • Slide 14
  • Slide 15
  • Variabili statistiche discrete
  • Slide 17
  • Variabili statistiche continue per intervallo
  • Variabili statistiche continue
  • Slide 20
  • Confronti
  • Slide 22
  • Slide 23
  • PowerPoint Presentation
  • Slide 25
  • Slide 26
  • Slide 27
  • Slide 28
Page 10: Appunti sulla concentrazione a.a. 2012-2013 v.3. 2 Sommario Introduzione La curva di concentrazione Indici di concentrazione Confronti Riferimenti

10

Indice di concentrazione (1) Le distanze verticali tra la curva di concentrazione e la bisettrice sono date da (Fi ndash Qi)

e sono non negative Un indice relativo di concentrazione si puograve ottenere dividendo la somma delle (Fi ndash Qi) per il valore massimo che tali differenze possono assumere

Lrsquoindice sopra egrave lrsquoindice di concentrazione di Gini Si ha 0 le R le 1 e in particolare

R = 0 nel caso di equiripartizione infatti in tal caso Fi - Qi =0 i=12hellipN-1

R = 1 nel caso di massima concentrazione infatti in tal caso Fi - Qi = Fi i=12hellipN-1

11

0

01

02

03

04

05

06

07

08

09

1

0 02 04 06 08 1

qi

pi

Indice di concentrazione (2)

Lrsquoarea A in figura compresa tra la curva di concentrazione e la retta di equidistribuzione prende il nome di area di concentrazione Si noti che A egrave pari allrsquoarea del triangolo di coordinate (00) (10) (11) meno lrsquoarea B formata dai trapezi di altezza Fi-Fi-1 e basi Qi e Qi-1

Area del trapezio

frac12 x Somma delle basi x altezza

A B

12

Un indice relativo di concentrazione si puograve ottenere dividendo lrsquoarea di concentrazione per il valore massimo che lrsquoarea puograve assumere

dove Amax si ottiene considerando lrsquoarea nel caso x1 =hellip= xN-1 =0 xN=Nμ e risulta pari a 12 ndash (1N)(1)(12)=(N-1)2N

Per costruzione egrave 0 le R le 1 in particolarebullR=0 nel caso di equiripartizionebullR=1 nel caso di massima concentrazione

Si puograve dimostrare che il rapporto cosigrave costruito egrave uguale ad R

Indice di concentrazione (2)

13

Un altro indice di concentrazione sempre basato sullrsquoarea si puograve ottenere osservando che questrsquoultima non puograve superare il valore 12 Possiamo quindi rapportare lrsquoarea di concentrazione al suo valore massimo teorico

Si ha (percheacute) con i due indici che tendono a coincidere per N grande

Indice di concentrazione (3)

14

80 90 21 23 32 16 62

Un esempio

i x_i F_i Q_i (Fi-Qi)

1 16 01429 00494 00935

2 21 02857 01142 01715

3 23 04286 01852 02434

4 32 05714 02840 02875

5 62 07143 04753 02390

6 80 08571 07222 01349

7 90 1 1

Totale

324 3 11698

Dati i redditi di 7 individui

per ricavare la curva di concentrazione organizziamo le osservazioni in tabella avendo cura di ordinarle in base ai valori di x (ad esempio X1=16 percheacute lrsquoindividuo piugrave povero possiede 16) e calcoliamo le differenze (Fi-Qi)

15

80 90 21 23 32 16 62

Per calcolare R con la formula (2) usiamo una tabella simile alla precedente per ricavare il numeratore Lrsquoarea massima che compare a denominatore egrave pari allrsquoarea massima teorica meno lrsquoarea del triangolo di base F7-F6 e altezza 1 Il calcolo di Ř egrave del tutto analogo egrave sufficiente porre lrsquoarea massima pari a frac12

Data i redditi di 7 individui

Un esempio

i x_i F_i Q_i (Fi-Fi-1)(Qi+Qi-1)

1 16 01429 00494 00070

2 21 02857 01142 00233

3 23 04286 01852 00427

4 32 05714 02840 00670

5 62 07143 04753 01085

6 80 08571 07222 01710

7 90 1 1 02461

Totale

06658

16

Variabili statistiche discrete

Finora abbiamo considerato N osservazioni non raggruppate Per ricavare lrsquoindice o la curva di concentrazione a partire da una distribuzione di frequenze assolute possiamo usare le seguenti versioni ldquoponderaterdquo di Fi e Qi

dove x1hellipxk sono k valori distinti ordinati in modo non decrescente con numerositagrave n1 hellipnk

17

Variabili statistiche discrete

1

1

1

1

)(

k

ii

k

iii

F

QFR

Con le coppie (Fi Qi) si puograve ottenere un indice analogo ad R

In generale RneR sugli stessi dati Infatti con lrsquoindice sopra la situazione di massima concentrazione si ha quando tutto il carattere appartiene alla k-esima classe (e non allrsquo N-esimo individuo come nel caso di R)

Unendo le coppie (Fi Qi

) si ottiene la stessa curva di concentrazione che si otterrebbe utilizzando con i dati unitari Infatti si puograve dimostrare che la pendenza della curva non cambia passando tra individui che hanno lo stesso ammontare di carattere Lrsquounica differenza egrave che ora per ottenere la spezzata si devono congiungere kltN punti

18

Nel caso in cui si disponga dellrsquoinformazione sullrsquoammontare totale di carattere in un intervallo egrave consigliabile discretizzare gli intervalli in modo ldquocoerenterdquo con tale informazione

Esempio se nellrsquointervallo [515) di numerositagrave Ni=10 il carattere totale egrave pari a 60 egrave preferibile discretizzare lrsquointervallo assumendo come punto ldquomediordquo il valore 6 e non il valore 10 (al quale corrisponderebbe un reddito totale di 100 e non di 60) Si noti che devono essere note le numerositagrave degli intervalli per poter procedere in questo modo

Nel caso in cui si disponga dellrsquoinformazione sullrsquoammontare totale di carattere in un intervallo egrave consigliabile discretizzare gli intervalli in modo ldquocoerenterdquo con tale informazione

Esempio se nellrsquointervallo [515) di numerositagrave Ni=10 il carattere totale egrave pari a 60 egrave preferibile discretizzare lrsquointervallo assumendo come punto ldquomediordquo il valore 6 e non il valore 10 (al quale corrisponderebbe un reddito totale di 100 e non di 60) Si noti che devono essere note le numerositagrave degli intervalli per poter procedere in questo modo

Se si desidera ricavare lrsquoindice o la curva di concentrazione per una variabile continua per intervallo il modo piugrave semplice di procedere consiste nel ldquodiscretizzarerdquo la variabile considerando le frequenze ldquoconcentraterdquo nei punti medi degli intervalli Si puograve poi procedere come nel caso precedente

Se si desidera ricavare lrsquoindice o la curva di concentrazione per una variabile continua per intervallo il modo piugrave semplice di procedere consiste nel ldquodiscretizzarerdquo la variabile considerando le frequenze ldquoconcentraterdquo nei punti medi degli intervalli Si puograve poi procedere come nel caso precedente

Variabili statistiche continue per intervallo

19

Se X egrave una variabile statistica continua non negativa con densitagrave f(x) e media finita μ le espressioni delle frequenze e delle intensitagrave cumulate diventano

Se X egrave una variabile statistica continua non negativa con densitagrave f(x) e media finita μ le espressioni delle frequenze e delle intensitagrave cumulate diventano

Variabili statistiche continue

Nota Talvolta si esprimono F e Q in funzione della frequenza cumulata r In tal caso si ha x = F-1( r ) da cui le nuove variabili

20

Il valore di R per un carattere con distribuzione continua si puograve ottenere come nel caso discreto rapportando lrsquoarea di concentrazione al suo valore massimo pari ad 12

Il valore di R per un carattere con distribuzione continua si puograve ottenere come nel caso discreto rapportando lrsquoarea di concentrazione al suo valore massimo pari ad 12

Variabili statistiche continue

Lrsquoindice di Gini egrave quindi pari a due volte lrsquoarea di concentrazione

Nota essendo Amax =12 si ha R=Ř

ConfrontiPuograve essere interessante confrontare la concentrazione di due caratteri

(o equivalentemente dello stesso carattere in due istanti diversi o in due ambiti territoriali diversi)

Esempio 1 il reddito risulta piugrave concentrato in Italia o in Francia

Esempio 2 la concentrazione del reddito in Italia era maggiore negli anni lsquo80 o negli anni lsquo90

Un modo semplice per stabilire quale carattere egrave maggiormente concentrato egrave quello di confrontare graficamente le curve di concentrazione nei due ambiti territoriali (o temporali) e stabilire quale si trova al di sopra

21

bull Non egrave detto che una delle due curve sia al di sopra dellrsquoaltra le curve si possono intersecare Si puograve tuttavia mostrare che se il carattere varia linearmente tra gli ambiti considerati allora le curve non si intersecano

bull In generale si puograve effettuare il confronto usando lrsquoindice di Gini

bull Poicheacute G=2A=1-2Area_sotto_la_curva_Lorenz il confronto attraverso lrsquoindici di Gini equivale al confronto tra le aree al di sotto delle curve di Lorenz dei due caratteri

Confronti

Confronti

Esempio la concentrazione del reddito nel mondo usando lrsquoindice R

23

Fonte CIA The world Factbook 2009

24

Esempio di Confronto Tra DistribuzioniSi riportano di seguito le distribuzioni dei finanziamenti concessi da un istituto bancario per lrsquoacquisto della prima casa a giovani coppie residenti in Campania ed in Sardegna

a) In quale regione risulta piugrave elevata la concentrazione dei finanziamenti concessi

b) Confrontare graficamente i diversi livelli di concentrazione dei finanziamenti nelle due regioni

Campania

Finanziamenti (migliaia di Euro) ni

0-50 10

50-100 25

100-150 37

150-200 22

200-250 6

Totale 100

Sardegna

Finanziamenti (migliaia di Euro) ni

0-50 57

50-100 3

100-150 7

150-200 8

200-250 25

Totale 100

25

Sardegna

Finanziamenti (migliaia di Euro) ni Ni pi xi xi ni Xi qi pi+1- pi qi+1+ qi (pi+1- pi)(qi+1+ qi)

0 0 0 0000 0 0 0 0000 0570 0149 0085

0-50 57 57 0570 25 1425 1425 0149 0030 0322 0010

50-100 3 60 0600 75 225 1650 0173 0070 0437 0031

100-150 7 67 0670 125 875 2525 0264 0080 0675 0054

150-200 8 75 0750 175 1400 3925 0411 0250 1411 0353

200-250 25 100 1000 225 5625 9550 1000 - - -

Totale 100 9550 0532

Concentrazione dei finanziamenti in Sardegna

26

Concentrazione dei finanziamenti in Campania

Campania

Finanziamenti (migliaia di Euro) ni Ni pi xi xi ni Xi qi pi+1- pi qi+1+ qi (pi+1- pi)(qi+1+ qi)

0 0 0 0000 0 0 0 0000 0100 0021 0002

0-50 10 10 0100 25 250 250 0021 0250 0199 0050

50-100 25 35 0350 75 1875 2125 0178 0370 0743 0275

100-150 37 72 0720 125 4625 6750 0565 0220 1452 0319

150-200 22 94 0940 175 3850 10600 0887 0060 1887 0113

200-250 6 100 1000 225 1350 11950 1000 - - -

Totale 100 11950 0759

27

00

01

02

03

04

05

06

07

08

09

10

00 01 02 03 04 05 06 07 08 09 10

pi

qi

Equidistribuzione Sardegna Campania

4680R~sar 2410R

~cam La concentrazione egrave piugrave

elevata in Sardegna

La curva di Lorenz conferma questo risultato

28

Riferimenti

bull C Gini (1912) Variabilitagrave e mutabilitagrave Contributo allo studio delle distribuzioni e relazioni statistiche Studi economici-giuridici dela Regia Universitagrave di Cagliari anno III

bull Lorenz M O (1905) Methods of measuring the concentration of wealth Publications of the American Statistical Association (Publications of the American Statistical Association Vol 9 No 70) 9 (70) 209ndash219

bull Per ulteriori riferimenti si possono consultare utilmente le pagine di Wikipedia relative allrsquoindice di Gini e alla curva di Lorenz

  • Appunti sulla concentrazione
  • Sommario
  • Introduzione
  • Slide 4
  • Curva di concentrazione
  • Slide 6
  • Slide 7
  • Un esempio
  • Indici di concentrazione
  • Indice di concentrazione (1)
  • Indice di concentrazione (2)
  • Slide 12
  • Indice di concentrazione (3)
  • Slide 14
  • Slide 15
  • Variabili statistiche discrete
  • Slide 17
  • Variabili statistiche continue per intervallo
  • Variabili statistiche continue
  • Slide 20
  • Confronti
  • Slide 22
  • Slide 23
  • PowerPoint Presentation
  • Slide 25
  • Slide 26
  • Slide 27
  • Slide 28
Page 11: Appunti sulla concentrazione a.a. 2012-2013 v.3. 2 Sommario Introduzione La curva di concentrazione Indici di concentrazione Confronti Riferimenti

11

0

01

02

03

04

05

06

07

08

09

1

0 02 04 06 08 1

qi

pi

Indice di concentrazione (2)

Lrsquoarea A in figura compresa tra la curva di concentrazione e la retta di equidistribuzione prende il nome di area di concentrazione Si noti che A egrave pari allrsquoarea del triangolo di coordinate (00) (10) (11) meno lrsquoarea B formata dai trapezi di altezza Fi-Fi-1 e basi Qi e Qi-1

Area del trapezio

frac12 x Somma delle basi x altezza

A B

12

Un indice relativo di concentrazione si puograve ottenere dividendo lrsquoarea di concentrazione per il valore massimo che lrsquoarea puograve assumere

dove Amax si ottiene considerando lrsquoarea nel caso x1 =hellip= xN-1 =0 xN=Nμ e risulta pari a 12 ndash (1N)(1)(12)=(N-1)2N

Per costruzione egrave 0 le R le 1 in particolarebullR=0 nel caso di equiripartizionebullR=1 nel caso di massima concentrazione

Si puograve dimostrare che il rapporto cosigrave costruito egrave uguale ad R

Indice di concentrazione (2)

13

Un altro indice di concentrazione sempre basato sullrsquoarea si puograve ottenere osservando che questrsquoultima non puograve superare il valore 12 Possiamo quindi rapportare lrsquoarea di concentrazione al suo valore massimo teorico

Si ha (percheacute) con i due indici che tendono a coincidere per N grande

Indice di concentrazione (3)

14

80 90 21 23 32 16 62

Un esempio

i x_i F_i Q_i (Fi-Qi)

1 16 01429 00494 00935

2 21 02857 01142 01715

3 23 04286 01852 02434

4 32 05714 02840 02875

5 62 07143 04753 02390

6 80 08571 07222 01349

7 90 1 1

Totale

324 3 11698

Dati i redditi di 7 individui

per ricavare la curva di concentrazione organizziamo le osservazioni in tabella avendo cura di ordinarle in base ai valori di x (ad esempio X1=16 percheacute lrsquoindividuo piugrave povero possiede 16) e calcoliamo le differenze (Fi-Qi)

15

80 90 21 23 32 16 62

Per calcolare R con la formula (2) usiamo una tabella simile alla precedente per ricavare il numeratore Lrsquoarea massima che compare a denominatore egrave pari allrsquoarea massima teorica meno lrsquoarea del triangolo di base F7-F6 e altezza 1 Il calcolo di Ř egrave del tutto analogo egrave sufficiente porre lrsquoarea massima pari a frac12

Data i redditi di 7 individui

Un esempio

i x_i F_i Q_i (Fi-Fi-1)(Qi+Qi-1)

1 16 01429 00494 00070

2 21 02857 01142 00233

3 23 04286 01852 00427

4 32 05714 02840 00670

5 62 07143 04753 01085

6 80 08571 07222 01710

7 90 1 1 02461

Totale

06658

16

Variabili statistiche discrete

Finora abbiamo considerato N osservazioni non raggruppate Per ricavare lrsquoindice o la curva di concentrazione a partire da una distribuzione di frequenze assolute possiamo usare le seguenti versioni ldquoponderaterdquo di Fi e Qi

dove x1hellipxk sono k valori distinti ordinati in modo non decrescente con numerositagrave n1 hellipnk

17

Variabili statistiche discrete

1

1

1

1

)(

k

ii

k

iii

F

QFR

Con le coppie (Fi Qi) si puograve ottenere un indice analogo ad R

In generale RneR sugli stessi dati Infatti con lrsquoindice sopra la situazione di massima concentrazione si ha quando tutto il carattere appartiene alla k-esima classe (e non allrsquo N-esimo individuo come nel caso di R)

Unendo le coppie (Fi Qi

) si ottiene la stessa curva di concentrazione che si otterrebbe utilizzando con i dati unitari Infatti si puograve dimostrare che la pendenza della curva non cambia passando tra individui che hanno lo stesso ammontare di carattere Lrsquounica differenza egrave che ora per ottenere la spezzata si devono congiungere kltN punti

18

Nel caso in cui si disponga dellrsquoinformazione sullrsquoammontare totale di carattere in un intervallo egrave consigliabile discretizzare gli intervalli in modo ldquocoerenterdquo con tale informazione

Esempio se nellrsquointervallo [515) di numerositagrave Ni=10 il carattere totale egrave pari a 60 egrave preferibile discretizzare lrsquointervallo assumendo come punto ldquomediordquo il valore 6 e non il valore 10 (al quale corrisponderebbe un reddito totale di 100 e non di 60) Si noti che devono essere note le numerositagrave degli intervalli per poter procedere in questo modo

Nel caso in cui si disponga dellrsquoinformazione sullrsquoammontare totale di carattere in un intervallo egrave consigliabile discretizzare gli intervalli in modo ldquocoerenterdquo con tale informazione

Esempio se nellrsquointervallo [515) di numerositagrave Ni=10 il carattere totale egrave pari a 60 egrave preferibile discretizzare lrsquointervallo assumendo come punto ldquomediordquo il valore 6 e non il valore 10 (al quale corrisponderebbe un reddito totale di 100 e non di 60) Si noti che devono essere note le numerositagrave degli intervalli per poter procedere in questo modo

Se si desidera ricavare lrsquoindice o la curva di concentrazione per una variabile continua per intervallo il modo piugrave semplice di procedere consiste nel ldquodiscretizzarerdquo la variabile considerando le frequenze ldquoconcentraterdquo nei punti medi degli intervalli Si puograve poi procedere come nel caso precedente

Se si desidera ricavare lrsquoindice o la curva di concentrazione per una variabile continua per intervallo il modo piugrave semplice di procedere consiste nel ldquodiscretizzarerdquo la variabile considerando le frequenze ldquoconcentraterdquo nei punti medi degli intervalli Si puograve poi procedere come nel caso precedente

Variabili statistiche continue per intervallo

19

Se X egrave una variabile statistica continua non negativa con densitagrave f(x) e media finita μ le espressioni delle frequenze e delle intensitagrave cumulate diventano

Se X egrave una variabile statistica continua non negativa con densitagrave f(x) e media finita μ le espressioni delle frequenze e delle intensitagrave cumulate diventano

Variabili statistiche continue

Nota Talvolta si esprimono F e Q in funzione della frequenza cumulata r In tal caso si ha x = F-1( r ) da cui le nuove variabili

20

Il valore di R per un carattere con distribuzione continua si puograve ottenere come nel caso discreto rapportando lrsquoarea di concentrazione al suo valore massimo pari ad 12

Il valore di R per un carattere con distribuzione continua si puograve ottenere come nel caso discreto rapportando lrsquoarea di concentrazione al suo valore massimo pari ad 12

Variabili statistiche continue

Lrsquoindice di Gini egrave quindi pari a due volte lrsquoarea di concentrazione

Nota essendo Amax =12 si ha R=Ř

ConfrontiPuograve essere interessante confrontare la concentrazione di due caratteri

(o equivalentemente dello stesso carattere in due istanti diversi o in due ambiti territoriali diversi)

Esempio 1 il reddito risulta piugrave concentrato in Italia o in Francia

Esempio 2 la concentrazione del reddito in Italia era maggiore negli anni lsquo80 o negli anni lsquo90

Un modo semplice per stabilire quale carattere egrave maggiormente concentrato egrave quello di confrontare graficamente le curve di concentrazione nei due ambiti territoriali (o temporali) e stabilire quale si trova al di sopra

21

bull Non egrave detto che una delle due curve sia al di sopra dellrsquoaltra le curve si possono intersecare Si puograve tuttavia mostrare che se il carattere varia linearmente tra gli ambiti considerati allora le curve non si intersecano

bull In generale si puograve effettuare il confronto usando lrsquoindice di Gini

bull Poicheacute G=2A=1-2Area_sotto_la_curva_Lorenz il confronto attraverso lrsquoindici di Gini equivale al confronto tra le aree al di sotto delle curve di Lorenz dei due caratteri

Confronti

Confronti

Esempio la concentrazione del reddito nel mondo usando lrsquoindice R

23

Fonte CIA The world Factbook 2009

24

Esempio di Confronto Tra DistribuzioniSi riportano di seguito le distribuzioni dei finanziamenti concessi da un istituto bancario per lrsquoacquisto della prima casa a giovani coppie residenti in Campania ed in Sardegna

a) In quale regione risulta piugrave elevata la concentrazione dei finanziamenti concessi

b) Confrontare graficamente i diversi livelli di concentrazione dei finanziamenti nelle due regioni

Campania

Finanziamenti (migliaia di Euro) ni

0-50 10

50-100 25

100-150 37

150-200 22

200-250 6

Totale 100

Sardegna

Finanziamenti (migliaia di Euro) ni

0-50 57

50-100 3

100-150 7

150-200 8

200-250 25

Totale 100

25

Sardegna

Finanziamenti (migliaia di Euro) ni Ni pi xi xi ni Xi qi pi+1- pi qi+1+ qi (pi+1- pi)(qi+1+ qi)

0 0 0 0000 0 0 0 0000 0570 0149 0085

0-50 57 57 0570 25 1425 1425 0149 0030 0322 0010

50-100 3 60 0600 75 225 1650 0173 0070 0437 0031

100-150 7 67 0670 125 875 2525 0264 0080 0675 0054

150-200 8 75 0750 175 1400 3925 0411 0250 1411 0353

200-250 25 100 1000 225 5625 9550 1000 - - -

Totale 100 9550 0532

Concentrazione dei finanziamenti in Sardegna

26

Concentrazione dei finanziamenti in Campania

Campania

Finanziamenti (migliaia di Euro) ni Ni pi xi xi ni Xi qi pi+1- pi qi+1+ qi (pi+1- pi)(qi+1+ qi)

0 0 0 0000 0 0 0 0000 0100 0021 0002

0-50 10 10 0100 25 250 250 0021 0250 0199 0050

50-100 25 35 0350 75 1875 2125 0178 0370 0743 0275

100-150 37 72 0720 125 4625 6750 0565 0220 1452 0319

150-200 22 94 0940 175 3850 10600 0887 0060 1887 0113

200-250 6 100 1000 225 1350 11950 1000 - - -

Totale 100 11950 0759

27

00

01

02

03

04

05

06

07

08

09

10

00 01 02 03 04 05 06 07 08 09 10

pi

qi

Equidistribuzione Sardegna Campania

4680R~sar 2410R

~cam La concentrazione egrave piugrave

elevata in Sardegna

La curva di Lorenz conferma questo risultato

28

Riferimenti

bull C Gini (1912) Variabilitagrave e mutabilitagrave Contributo allo studio delle distribuzioni e relazioni statistiche Studi economici-giuridici dela Regia Universitagrave di Cagliari anno III

bull Lorenz M O (1905) Methods of measuring the concentration of wealth Publications of the American Statistical Association (Publications of the American Statistical Association Vol 9 No 70) 9 (70) 209ndash219

bull Per ulteriori riferimenti si possono consultare utilmente le pagine di Wikipedia relative allrsquoindice di Gini e alla curva di Lorenz

  • Appunti sulla concentrazione
  • Sommario
  • Introduzione
  • Slide 4
  • Curva di concentrazione
  • Slide 6
  • Slide 7
  • Un esempio
  • Indici di concentrazione
  • Indice di concentrazione (1)
  • Indice di concentrazione (2)
  • Slide 12
  • Indice di concentrazione (3)
  • Slide 14
  • Slide 15
  • Variabili statistiche discrete
  • Slide 17
  • Variabili statistiche continue per intervallo
  • Variabili statistiche continue
  • Slide 20
  • Confronti
  • Slide 22
  • Slide 23
  • PowerPoint Presentation
  • Slide 25
  • Slide 26
  • Slide 27
  • Slide 28
Page 12: Appunti sulla concentrazione a.a. 2012-2013 v.3. 2 Sommario Introduzione La curva di concentrazione Indici di concentrazione Confronti Riferimenti

12

Un indice relativo di concentrazione si puograve ottenere dividendo lrsquoarea di concentrazione per il valore massimo che lrsquoarea puograve assumere

dove Amax si ottiene considerando lrsquoarea nel caso x1 =hellip= xN-1 =0 xN=Nμ e risulta pari a 12 ndash (1N)(1)(12)=(N-1)2N

Per costruzione egrave 0 le R le 1 in particolarebullR=0 nel caso di equiripartizionebullR=1 nel caso di massima concentrazione

Si puograve dimostrare che il rapporto cosigrave costruito egrave uguale ad R

Indice di concentrazione (2)

13

Un altro indice di concentrazione sempre basato sullrsquoarea si puograve ottenere osservando che questrsquoultima non puograve superare il valore 12 Possiamo quindi rapportare lrsquoarea di concentrazione al suo valore massimo teorico

Si ha (percheacute) con i due indici che tendono a coincidere per N grande

Indice di concentrazione (3)

14

80 90 21 23 32 16 62

Un esempio

i x_i F_i Q_i (Fi-Qi)

1 16 01429 00494 00935

2 21 02857 01142 01715

3 23 04286 01852 02434

4 32 05714 02840 02875

5 62 07143 04753 02390

6 80 08571 07222 01349

7 90 1 1

Totale

324 3 11698

Dati i redditi di 7 individui

per ricavare la curva di concentrazione organizziamo le osservazioni in tabella avendo cura di ordinarle in base ai valori di x (ad esempio X1=16 percheacute lrsquoindividuo piugrave povero possiede 16) e calcoliamo le differenze (Fi-Qi)

15

80 90 21 23 32 16 62

Per calcolare R con la formula (2) usiamo una tabella simile alla precedente per ricavare il numeratore Lrsquoarea massima che compare a denominatore egrave pari allrsquoarea massima teorica meno lrsquoarea del triangolo di base F7-F6 e altezza 1 Il calcolo di Ř egrave del tutto analogo egrave sufficiente porre lrsquoarea massima pari a frac12

Data i redditi di 7 individui

Un esempio

i x_i F_i Q_i (Fi-Fi-1)(Qi+Qi-1)

1 16 01429 00494 00070

2 21 02857 01142 00233

3 23 04286 01852 00427

4 32 05714 02840 00670

5 62 07143 04753 01085

6 80 08571 07222 01710

7 90 1 1 02461

Totale

06658

16

Variabili statistiche discrete

Finora abbiamo considerato N osservazioni non raggruppate Per ricavare lrsquoindice o la curva di concentrazione a partire da una distribuzione di frequenze assolute possiamo usare le seguenti versioni ldquoponderaterdquo di Fi e Qi

dove x1hellipxk sono k valori distinti ordinati in modo non decrescente con numerositagrave n1 hellipnk

17

Variabili statistiche discrete

1

1

1

1

)(

k

ii

k

iii

F

QFR

Con le coppie (Fi Qi) si puograve ottenere un indice analogo ad R

In generale RneR sugli stessi dati Infatti con lrsquoindice sopra la situazione di massima concentrazione si ha quando tutto il carattere appartiene alla k-esima classe (e non allrsquo N-esimo individuo come nel caso di R)

Unendo le coppie (Fi Qi

) si ottiene la stessa curva di concentrazione che si otterrebbe utilizzando con i dati unitari Infatti si puograve dimostrare che la pendenza della curva non cambia passando tra individui che hanno lo stesso ammontare di carattere Lrsquounica differenza egrave che ora per ottenere la spezzata si devono congiungere kltN punti

18

Nel caso in cui si disponga dellrsquoinformazione sullrsquoammontare totale di carattere in un intervallo egrave consigliabile discretizzare gli intervalli in modo ldquocoerenterdquo con tale informazione

Esempio se nellrsquointervallo [515) di numerositagrave Ni=10 il carattere totale egrave pari a 60 egrave preferibile discretizzare lrsquointervallo assumendo come punto ldquomediordquo il valore 6 e non il valore 10 (al quale corrisponderebbe un reddito totale di 100 e non di 60) Si noti che devono essere note le numerositagrave degli intervalli per poter procedere in questo modo

Nel caso in cui si disponga dellrsquoinformazione sullrsquoammontare totale di carattere in un intervallo egrave consigliabile discretizzare gli intervalli in modo ldquocoerenterdquo con tale informazione

Esempio se nellrsquointervallo [515) di numerositagrave Ni=10 il carattere totale egrave pari a 60 egrave preferibile discretizzare lrsquointervallo assumendo come punto ldquomediordquo il valore 6 e non il valore 10 (al quale corrisponderebbe un reddito totale di 100 e non di 60) Si noti che devono essere note le numerositagrave degli intervalli per poter procedere in questo modo

Se si desidera ricavare lrsquoindice o la curva di concentrazione per una variabile continua per intervallo il modo piugrave semplice di procedere consiste nel ldquodiscretizzarerdquo la variabile considerando le frequenze ldquoconcentraterdquo nei punti medi degli intervalli Si puograve poi procedere come nel caso precedente

Se si desidera ricavare lrsquoindice o la curva di concentrazione per una variabile continua per intervallo il modo piugrave semplice di procedere consiste nel ldquodiscretizzarerdquo la variabile considerando le frequenze ldquoconcentraterdquo nei punti medi degli intervalli Si puograve poi procedere come nel caso precedente

Variabili statistiche continue per intervallo

19

Se X egrave una variabile statistica continua non negativa con densitagrave f(x) e media finita μ le espressioni delle frequenze e delle intensitagrave cumulate diventano

Se X egrave una variabile statistica continua non negativa con densitagrave f(x) e media finita μ le espressioni delle frequenze e delle intensitagrave cumulate diventano

Variabili statistiche continue

Nota Talvolta si esprimono F e Q in funzione della frequenza cumulata r In tal caso si ha x = F-1( r ) da cui le nuove variabili

20

Il valore di R per un carattere con distribuzione continua si puograve ottenere come nel caso discreto rapportando lrsquoarea di concentrazione al suo valore massimo pari ad 12

Il valore di R per un carattere con distribuzione continua si puograve ottenere come nel caso discreto rapportando lrsquoarea di concentrazione al suo valore massimo pari ad 12

Variabili statistiche continue

Lrsquoindice di Gini egrave quindi pari a due volte lrsquoarea di concentrazione

Nota essendo Amax =12 si ha R=Ř

ConfrontiPuograve essere interessante confrontare la concentrazione di due caratteri

(o equivalentemente dello stesso carattere in due istanti diversi o in due ambiti territoriali diversi)

Esempio 1 il reddito risulta piugrave concentrato in Italia o in Francia

Esempio 2 la concentrazione del reddito in Italia era maggiore negli anni lsquo80 o negli anni lsquo90

Un modo semplice per stabilire quale carattere egrave maggiormente concentrato egrave quello di confrontare graficamente le curve di concentrazione nei due ambiti territoriali (o temporali) e stabilire quale si trova al di sopra

21

bull Non egrave detto che una delle due curve sia al di sopra dellrsquoaltra le curve si possono intersecare Si puograve tuttavia mostrare che se il carattere varia linearmente tra gli ambiti considerati allora le curve non si intersecano

bull In generale si puograve effettuare il confronto usando lrsquoindice di Gini

bull Poicheacute G=2A=1-2Area_sotto_la_curva_Lorenz il confronto attraverso lrsquoindici di Gini equivale al confronto tra le aree al di sotto delle curve di Lorenz dei due caratteri

Confronti

Confronti

Esempio la concentrazione del reddito nel mondo usando lrsquoindice R

23

Fonte CIA The world Factbook 2009

24

Esempio di Confronto Tra DistribuzioniSi riportano di seguito le distribuzioni dei finanziamenti concessi da un istituto bancario per lrsquoacquisto della prima casa a giovani coppie residenti in Campania ed in Sardegna

a) In quale regione risulta piugrave elevata la concentrazione dei finanziamenti concessi

b) Confrontare graficamente i diversi livelli di concentrazione dei finanziamenti nelle due regioni

Campania

Finanziamenti (migliaia di Euro) ni

0-50 10

50-100 25

100-150 37

150-200 22

200-250 6

Totale 100

Sardegna

Finanziamenti (migliaia di Euro) ni

0-50 57

50-100 3

100-150 7

150-200 8

200-250 25

Totale 100

25

Sardegna

Finanziamenti (migliaia di Euro) ni Ni pi xi xi ni Xi qi pi+1- pi qi+1+ qi (pi+1- pi)(qi+1+ qi)

0 0 0 0000 0 0 0 0000 0570 0149 0085

0-50 57 57 0570 25 1425 1425 0149 0030 0322 0010

50-100 3 60 0600 75 225 1650 0173 0070 0437 0031

100-150 7 67 0670 125 875 2525 0264 0080 0675 0054

150-200 8 75 0750 175 1400 3925 0411 0250 1411 0353

200-250 25 100 1000 225 5625 9550 1000 - - -

Totale 100 9550 0532

Concentrazione dei finanziamenti in Sardegna

26

Concentrazione dei finanziamenti in Campania

Campania

Finanziamenti (migliaia di Euro) ni Ni pi xi xi ni Xi qi pi+1- pi qi+1+ qi (pi+1- pi)(qi+1+ qi)

0 0 0 0000 0 0 0 0000 0100 0021 0002

0-50 10 10 0100 25 250 250 0021 0250 0199 0050

50-100 25 35 0350 75 1875 2125 0178 0370 0743 0275

100-150 37 72 0720 125 4625 6750 0565 0220 1452 0319

150-200 22 94 0940 175 3850 10600 0887 0060 1887 0113

200-250 6 100 1000 225 1350 11950 1000 - - -

Totale 100 11950 0759

27

00

01

02

03

04

05

06

07

08

09

10

00 01 02 03 04 05 06 07 08 09 10

pi

qi

Equidistribuzione Sardegna Campania

4680R~sar 2410R

~cam La concentrazione egrave piugrave

elevata in Sardegna

La curva di Lorenz conferma questo risultato

28

Riferimenti

bull C Gini (1912) Variabilitagrave e mutabilitagrave Contributo allo studio delle distribuzioni e relazioni statistiche Studi economici-giuridici dela Regia Universitagrave di Cagliari anno III

bull Lorenz M O (1905) Methods of measuring the concentration of wealth Publications of the American Statistical Association (Publications of the American Statistical Association Vol 9 No 70) 9 (70) 209ndash219

bull Per ulteriori riferimenti si possono consultare utilmente le pagine di Wikipedia relative allrsquoindice di Gini e alla curva di Lorenz

  • Appunti sulla concentrazione
  • Sommario
  • Introduzione
  • Slide 4
  • Curva di concentrazione
  • Slide 6
  • Slide 7
  • Un esempio
  • Indici di concentrazione
  • Indice di concentrazione (1)
  • Indice di concentrazione (2)
  • Slide 12
  • Indice di concentrazione (3)
  • Slide 14
  • Slide 15
  • Variabili statistiche discrete
  • Slide 17
  • Variabili statistiche continue per intervallo
  • Variabili statistiche continue
  • Slide 20
  • Confronti
  • Slide 22
  • Slide 23
  • PowerPoint Presentation
  • Slide 25
  • Slide 26
  • Slide 27
  • Slide 28
Page 13: Appunti sulla concentrazione a.a. 2012-2013 v.3. 2 Sommario Introduzione La curva di concentrazione Indici di concentrazione Confronti Riferimenti

13

Un altro indice di concentrazione sempre basato sullrsquoarea si puograve ottenere osservando che questrsquoultima non puograve superare il valore 12 Possiamo quindi rapportare lrsquoarea di concentrazione al suo valore massimo teorico

Si ha (percheacute) con i due indici che tendono a coincidere per N grande

Indice di concentrazione (3)

14

80 90 21 23 32 16 62

Un esempio

i x_i F_i Q_i (Fi-Qi)

1 16 01429 00494 00935

2 21 02857 01142 01715

3 23 04286 01852 02434

4 32 05714 02840 02875

5 62 07143 04753 02390

6 80 08571 07222 01349

7 90 1 1

Totale

324 3 11698

Dati i redditi di 7 individui

per ricavare la curva di concentrazione organizziamo le osservazioni in tabella avendo cura di ordinarle in base ai valori di x (ad esempio X1=16 percheacute lrsquoindividuo piugrave povero possiede 16) e calcoliamo le differenze (Fi-Qi)

15

80 90 21 23 32 16 62

Per calcolare R con la formula (2) usiamo una tabella simile alla precedente per ricavare il numeratore Lrsquoarea massima che compare a denominatore egrave pari allrsquoarea massima teorica meno lrsquoarea del triangolo di base F7-F6 e altezza 1 Il calcolo di Ř egrave del tutto analogo egrave sufficiente porre lrsquoarea massima pari a frac12

Data i redditi di 7 individui

Un esempio

i x_i F_i Q_i (Fi-Fi-1)(Qi+Qi-1)

1 16 01429 00494 00070

2 21 02857 01142 00233

3 23 04286 01852 00427

4 32 05714 02840 00670

5 62 07143 04753 01085

6 80 08571 07222 01710

7 90 1 1 02461

Totale

06658

16

Variabili statistiche discrete

Finora abbiamo considerato N osservazioni non raggruppate Per ricavare lrsquoindice o la curva di concentrazione a partire da una distribuzione di frequenze assolute possiamo usare le seguenti versioni ldquoponderaterdquo di Fi e Qi

dove x1hellipxk sono k valori distinti ordinati in modo non decrescente con numerositagrave n1 hellipnk

17

Variabili statistiche discrete

1

1

1

1

)(

k

ii

k

iii

F

QFR

Con le coppie (Fi Qi) si puograve ottenere un indice analogo ad R

In generale RneR sugli stessi dati Infatti con lrsquoindice sopra la situazione di massima concentrazione si ha quando tutto il carattere appartiene alla k-esima classe (e non allrsquo N-esimo individuo come nel caso di R)

Unendo le coppie (Fi Qi

) si ottiene la stessa curva di concentrazione che si otterrebbe utilizzando con i dati unitari Infatti si puograve dimostrare che la pendenza della curva non cambia passando tra individui che hanno lo stesso ammontare di carattere Lrsquounica differenza egrave che ora per ottenere la spezzata si devono congiungere kltN punti

18

Nel caso in cui si disponga dellrsquoinformazione sullrsquoammontare totale di carattere in un intervallo egrave consigliabile discretizzare gli intervalli in modo ldquocoerenterdquo con tale informazione

Esempio se nellrsquointervallo [515) di numerositagrave Ni=10 il carattere totale egrave pari a 60 egrave preferibile discretizzare lrsquointervallo assumendo come punto ldquomediordquo il valore 6 e non il valore 10 (al quale corrisponderebbe un reddito totale di 100 e non di 60) Si noti che devono essere note le numerositagrave degli intervalli per poter procedere in questo modo

Nel caso in cui si disponga dellrsquoinformazione sullrsquoammontare totale di carattere in un intervallo egrave consigliabile discretizzare gli intervalli in modo ldquocoerenterdquo con tale informazione

Esempio se nellrsquointervallo [515) di numerositagrave Ni=10 il carattere totale egrave pari a 60 egrave preferibile discretizzare lrsquointervallo assumendo come punto ldquomediordquo il valore 6 e non il valore 10 (al quale corrisponderebbe un reddito totale di 100 e non di 60) Si noti che devono essere note le numerositagrave degli intervalli per poter procedere in questo modo

Se si desidera ricavare lrsquoindice o la curva di concentrazione per una variabile continua per intervallo il modo piugrave semplice di procedere consiste nel ldquodiscretizzarerdquo la variabile considerando le frequenze ldquoconcentraterdquo nei punti medi degli intervalli Si puograve poi procedere come nel caso precedente

Se si desidera ricavare lrsquoindice o la curva di concentrazione per una variabile continua per intervallo il modo piugrave semplice di procedere consiste nel ldquodiscretizzarerdquo la variabile considerando le frequenze ldquoconcentraterdquo nei punti medi degli intervalli Si puograve poi procedere come nel caso precedente

Variabili statistiche continue per intervallo

19

Se X egrave una variabile statistica continua non negativa con densitagrave f(x) e media finita μ le espressioni delle frequenze e delle intensitagrave cumulate diventano

Se X egrave una variabile statistica continua non negativa con densitagrave f(x) e media finita μ le espressioni delle frequenze e delle intensitagrave cumulate diventano

Variabili statistiche continue

Nota Talvolta si esprimono F e Q in funzione della frequenza cumulata r In tal caso si ha x = F-1( r ) da cui le nuove variabili

20

Il valore di R per un carattere con distribuzione continua si puograve ottenere come nel caso discreto rapportando lrsquoarea di concentrazione al suo valore massimo pari ad 12

Il valore di R per un carattere con distribuzione continua si puograve ottenere come nel caso discreto rapportando lrsquoarea di concentrazione al suo valore massimo pari ad 12

Variabili statistiche continue

Lrsquoindice di Gini egrave quindi pari a due volte lrsquoarea di concentrazione

Nota essendo Amax =12 si ha R=Ř

ConfrontiPuograve essere interessante confrontare la concentrazione di due caratteri

(o equivalentemente dello stesso carattere in due istanti diversi o in due ambiti territoriali diversi)

Esempio 1 il reddito risulta piugrave concentrato in Italia o in Francia

Esempio 2 la concentrazione del reddito in Italia era maggiore negli anni lsquo80 o negli anni lsquo90

Un modo semplice per stabilire quale carattere egrave maggiormente concentrato egrave quello di confrontare graficamente le curve di concentrazione nei due ambiti territoriali (o temporali) e stabilire quale si trova al di sopra

21

bull Non egrave detto che una delle due curve sia al di sopra dellrsquoaltra le curve si possono intersecare Si puograve tuttavia mostrare che se il carattere varia linearmente tra gli ambiti considerati allora le curve non si intersecano

bull In generale si puograve effettuare il confronto usando lrsquoindice di Gini

bull Poicheacute G=2A=1-2Area_sotto_la_curva_Lorenz il confronto attraverso lrsquoindici di Gini equivale al confronto tra le aree al di sotto delle curve di Lorenz dei due caratteri

Confronti

Confronti

Esempio la concentrazione del reddito nel mondo usando lrsquoindice R

23

Fonte CIA The world Factbook 2009

24

Esempio di Confronto Tra DistribuzioniSi riportano di seguito le distribuzioni dei finanziamenti concessi da un istituto bancario per lrsquoacquisto della prima casa a giovani coppie residenti in Campania ed in Sardegna

a) In quale regione risulta piugrave elevata la concentrazione dei finanziamenti concessi

b) Confrontare graficamente i diversi livelli di concentrazione dei finanziamenti nelle due regioni

Campania

Finanziamenti (migliaia di Euro) ni

0-50 10

50-100 25

100-150 37

150-200 22

200-250 6

Totale 100

Sardegna

Finanziamenti (migliaia di Euro) ni

0-50 57

50-100 3

100-150 7

150-200 8

200-250 25

Totale 100

25

Sardegna

Finanziamenti (migliaia di Euro) ni Ni pi xi xi ni Xi qi pi+1- pi qi+1+ qi (pi+1- pi)(qi+1+ qi)

0 0 0 0000 0 0 0 0000 0570 0149 0085

0-50 57 57 0570 25 1425 1425 0149 0030 0322 0010

50-100 3 60 0600 75 225 1650 0173 0070 0437 0031

100-150 7 67 0670 125 875 2525 0264 0080 0675 0054

150-200 8 75 0750 175 1400 3925 0411 0250 1411 0353

200-250 25 100 1000 225 5625 9550 1000 - - -

Totale 100 9550 0532

Concentrazione dei finanziamenti in Sardegna

26

Concentrazione dei finanziamenti in Campania

Campania

Finanziamenti (migliaia di Euro) ni Ni pi xi xi ni Xi qi pi+1- pi qi+1+ qi (pi+1- pi)(qi+1+ qi)

0 0 0 0000 0 0 0 0000 0100 0021 0002

0-50 10 10 0100 25 250 250 0021 0250 0199 0050

50-100 25 35 0350 75 1875 2125 0178 0370 0743 0275

100-150 37 72 0720 125 4625 6750 0565 0220 1452 0319

150-200 22 94 0940 175 3850 10600 0887 0060 1887 0113

200-250 6 100 1000 225 1350 11950 1000 - - -

Totale 100 11950 0759

27

00

01

02

03

04

05

06

07

08

09

10

00 01 02 03 04 05 06 07 08 09 10

pi

qi

Equidistribuzione Sardegna Campania

4680R~sar 2410R

~cam La concentrazione egrave piugrave

elevata in Sardegna

La curva di Lorenz conferma questo risultato

28

Riferimenti

bull C Gini (1912) Variabilitagrave e mutabilitagrave Contributo allo studio delle distribuzioni e relazioni statistiche Studi economici-giuridici dela Regia Universitagrave di Cagliari anno III

bull Lorenz M O (1905) Methods of measuring the concentration of wealth Publications of the American Statistical Association (Publications of the American Statistical Association Vol 9 No 70) 9 (70) 209ndash219

bull Per ulteriori riferimenti si possono consultare utilmente le pagine di Wikipedia relative allrsquoindice di Gini e alla curva di Lorenz

  • Appunti sulla concentrazione
  • Sommario
  • Introduzione
  • Slide 4
  • Curva di concentrazione
  • Slide 6
  • Slide 7
  • Un esempio
  • Indici di concentrazione
  • Indice di concentrazione (1)
  • Indice di concentrazione (2)
  • Slide 12
  • Indice di concentrazione (3)
  • Slide 14
  • Slide 15
  • Variabili statistiche discrete
  • Slide 17
  • Variabili statistiche continue per intervallo
  • Variabili statistiche continue
  • Slide 20
  • Confronti
  • Slide 22
  • Slide 23
  • PowerPoint Presentation
  • Slide 25
  • Slide 26
  • Slide 27
  • Slide 28
Page 14: Appunti sulla concentrazione a.a. 2012-2013 v.3. 2 Sommario Introduzione La curva di concentrazione Indici di concentrazione Confronti Riferimenti

14

80 90 21 23 32 16 62

Un esempio

i x_i F_i Q_i (Fi-Qi)

1 16 01429 00494 00935

2 21 02857 01142 01715

3 23 04286 01852 02434

4 32 05714 02840 02875

5 62 07143 04753 02390

6 80 08571 07222 01349

7 90 1 1

Totale

324 3 11698

Dati i redditi di 7 individui

per ricavare la curva di concentrazione organizziamo le osservazioni in tabella avendo cura di ordinarle in base ai valori di x (ad esempio X1=16 percheacute lrsquoindividuo piugrave povero possiede 16) e calcoliamo le differenze (Fi-Qi)

15

80 90 21 23 32 16 62

Per calcolare R con la formula (2) usiamo una tabella simile alla precedente per ricavare il numeratore Lrsquoarea massima che compare a denominatore egrave pari allrsquoarea massima teorica meno lrsquoarea del triangolo di base F7-F6 e altezza 1 Il calcolo di Ř egrave del tutto analogo egrave sufficiente porre lrsquoarea massima pari a frac12

Data i redditi di 7 individui

Un esempio

i x_i F_i Q_i (Fi-Fi-1)(Qi+Qi-1)

1 16 01429 00494 00070

2 21 02857 01142 00233

3 23 04286 01852 00427

4 32 05714 02840 00670

5 62 07143 04753 01085

6 80 08571 07222 01710

7 90 1 1 02461

Totale

06658

16

Variabili statistiche discrete

Finora abbiamo considerato N osservazioni non raggruppate Per ricavare lrsquoindice o la curva di concentrazione a partire da una distribuzione di frequenze assolute possiamo usare le seguenti versioni ldquoponderaterdquo di Fi e Qi

dove x1hellipxk sono k valori distinti ordinati in modo non decrescente con numerositagrave n1 hellipnk

17

Variabili statistiche discrete

1

1

1

1

)(

k

ii

k

iii

F

QFR

Con le coppie (Fi Qi) si puograve ottenere un indice analogo ad R

In generale RneR sugli stessi dati Infatti con lrsquoindice sopra la situazione di massima concentrazione si ha quando tutto il carattere appartiene alla k-esima classe (e non allrsquo N-esimo individuo come nel caso di R)

Unendo le coppie (Fi Qi

) si ottiene la stessa curva di concentrazione che si otterrebbe utilizzando con i dati unitari Infatti si puograve dimostrare che la pendenza della curva non cambia passando tra individui che hanno lo stesso ammontare di carattere Lrsquounica differenza egrave che ora per ottenere la spezzata si devono congiungere kltN punti

18

Nel caso in cui si disponga dellrsquoinformazione sullrsquoammontare totale di carattere in un intervallo egrave consigliabile discretizzare gli intervalli in modo ldquocoerenterdquo con tale informazione

Esempio se nellrsquointervallo [515) di numerositagrave Ni=10 il carattere totale egrave pari a 60 egrave preferibile discretizzare lrsquointervallo assumendo come punto ldquomediordquo il valore 6 e non il valore 10 (al quale corrisponderebbe un reddito totale di 100 e non di 60) Si noti che devono essere note le numerositagrave degli intervalli per poter procedere in questo modo

Nel caso in cui si disponga dellrsquoinformazione sullrsquoammontare totale di carattere in un intervallo egrave consigliabile discretizzare gli intervalli in modo ldquocoerenterdquo con tale informazione

Esempio se nellrsquointervallo [515) di numerositagrave Ni=10 il carattere totale egrave pari a 60 egrave preferibile discretizzare lrsquointervallo assumendo come punto ldquomediordquo il valore 6 e non il valore 10 (al quale corrisponderebbe un reddito totale di 100 e non di 60) Si noti che devono essere note le numerositagrave degli intervalli per poter procedere in questo modo

Se si desidera ricavare lrsquoindice o la curva di concentrazione per una variabile continua per intervallo il modo piugrave semplice di procedere consiste nel ldquodiscretizzarerdquo la variabile considerando le frequenze ldquoconcentraterdquo nei punti medi degli intervalli Si puograve poi procedere come nel caso precedente

Se si desidera ricavare lrsquoindice o la curva di concentrazione per una variabile continua per intervallo il modo piugrave semplice di procedere consiste nel ldquodiscretizzarerdquo la variabile considerando le frequenze ldquoconcentraterdquo nei punti medi degli intervalli Si puograve poi procedere come nel caso precedente

Variabili statistiche continue per intervallo

19

Se X egrave una variabile statistica continua non negativa con densitagrave f(x) e media finita μ le espressioni delle frequenze e delle intensitagrave cumulate diventano

Se X egrave una variabile statistica continua non negativa con densitagrave f(x) e media finita μ le espressioni delle frequenze e delle intensitagrave cumulate diventano

Variabili statistiche continue

Nota Talvolta si esprimono F e Q in funzione della frequenza cumulata r In tal caso si ha x = F-1( r ) da cui le nuove variabili

20

Il valore di R per un carattere con distribuzione continua si puograve ottenere come nel caso discreto rapportando lrsquoarea di concentrazione al suo valore massimo pari ad 12

Il valore di R per un carattere con distribuzione continua si puograve ottenere come nel caso discreto rapportando lrsquoarea di concentrazione al suo valore massimo pari ad 12

Variabili statistiche continue

Lrsquoindice di Gini egrave quindi pari a due volte lrsquoarea di concentrazione

Nota essendo Amax =12 si ha R=Ř

ConfrontiPuograve essere interessante confrontare la concentrazione di due caratteri

(o equivalentemente dello stesso carattere in due istanti diversi o in due ambiti territoriali diversi)

Esempio 1 il reddito risulta piugrave concentrato in Italia o in Francia

Esempio 2 la concentrazione del reddito in Italia era maggiore negli anni lsquo80 o negli anni lsquo90

Un modo semplice per stabilire quale carattere egrave maggiormente concentrato egrave quello di confrontare graficamente le curve di concentrazione nei due ambiti territoriali (o temporali) e stabilire quale si trova al di sopra

21

bull Non egrave detto che una delle due curve sia al di sopra dellrsquoaltra le curve si possono intersecare Si puograve tuttavia mostrare che se il carattere varia linearmente tra gli ambiti considerati allora le curve non si intersecano

bull In generale si puograve effettuare il confronto usando lrsquoindice di Gini

bull Poicheacute G=2A=1-2Area_sotto_la_curva_Lorenz il confronto attraverso lrsquoindici di Gini equivale al confronto tra le aree al di sotto delle curve di Lorenz dei due caratteri

Confronti

Confronti

Esempio la concentrazione del reddito nel mondo usando lrsquoindice R

23

Fonte CIA The world Factbook 2009

24

Esempio di Confronto Tra DistribuzioniSi riportano di seguito le distribuzioni dei finanziamenti concessi da un istituto bancario per lrsquoacquisto della prima casa a giovani coppie residenti in Campania ed in Sardegna

a) In quale regione risulta piugrave elevata la concentrazione dei finanziamenti concessi

b) Confrontare graficamente i diversi livelli di concentrazione dei finanziamenti nelle due regioni

Campania

Finanziamenti (migliaia di Euro) ni

0-50 10

50-100 25

100-150 37

150-200 22

200-250 6

Totale 100

Sardegna

Finanziamenti (migliaia di Euro) ni

0-50 57

50-100 3

100-150 7

150-200 8

200-250 25

Totale 100

25

Sardegna

Finanziamenti (migliaia di Euro) ni Ni pi xi xi ni Xi qi pi+1- pi qi+1+ qi (pi+1- pi)(qi+1+ qi)

0 0 0 0000 0 0 0 0000 0570 0149 0085

0-50 57 57 0570 25 1425 1425 0149 0030 0322 0010

50-100 3 60 0600 75 225 1650 0173 0070 0437 0031

100-150 7 67 0670 125 875 2525 0264 0080 0675 0054

150-200 8 75 0750 175 1400 3925 0411 0250 1411 0353

200-250 25 100 1000 225 5625 9550 1000 - - -

Totale 100 9550 0532

Concentrazione dei finanziamenti in Sardegna

26

Concentrazione dei finanziamenti in Campania

Campania

Finanziamenti (migliaia di Euro) ni Ni pi xi xi ni Xi qi pi+1- pi qi+1+ qi (pi+1- pi)(qi+1+ qi)

0 0 0 0000 0 0 0 0000 0100 0021 0002

0-50 10 10 0100 25 250 250 0021 0250 0199 0050

50-100 25 35 0350 75 1875 2125 0178 0370 0743 0275

100-150 37 72 0720 125 4625 6750 0565 0220 1452 0319

150-200 22 94 0940 175 3850 10600 0887 0060 1887 0113

200-250 6 100 1000 225 1350 11950 1000 - - -

Totale 100 11950 0759

27

00

01

02

03

04

05

06

07

08

09

10

00 01 02 03 04 05 06 07 08 09 10

pi

qi

Equidistribuzione Sardegna Campania

4680R~sar 2410R

~cam La concentrazione egrave piugrave

elevata in Sardegna

La curva di Lorenz conferma questo risultato

28

Riferimenti

bull C Gini (1912) Variabilitagrave e mutabilitagrave Contributo allo studio delle distribuzioni e relazioni statistiche Studi economici-giuridici dela Regia Universitagrave di Cagliari anno III

bull Lorenz M O (1905) Methods of measuring the concentration of wealth Publications of the American Statistical Association (Publications of the American Statistical Association Vol 9 No 70) 9 (70) 209ndash219

bull Per ulteriori riferimenti si possono consultare utilmente le pagine di Wikipedia relative allrsquoindice di Gini e alla curva di Lorenz

  • Appunti sulla concentrazione
  • Sommario
  • Introduzione
  • Slide 4
  • Curva di concentrazione
  • Slide 6
  • Slide 7
  • Un esempio
  • Indici di concentrazione
  • Indice di concentrazione (1)
  • Indice di concentrazione (2)
  • Slide 12
  • Indice di concentrazione (3)
  • Slide 14
  • Slide 15
  • Variabili statistiche discrete
  • Slide 17
  • Variabili statistiche continue per intervallo
  • Variabili statistiche continue
  • Slide 20
  • Confronti
  • Slide 22
  • Slide 23
  • PowerPoint Presentation
  • Slide 25
  • Slide 26
  • Slide 27
  • Slide 28
Page 15: Appunti sulla concentrazione a.a. 2012-2013 v.3. 2 Sommario Introduzione La curva di concentrazione Indici di concentrazione Confronti Riferimenti

15

80 90 21 23 32 16 62

Per calcolare R con la formula (2) usiamo una tabella simile alla precedente per ricavare il numeratore Lrsquoarea massima che compare a denominatore egrave pari allrsquoarea massima teorica meno lrsquoarea del triangolo di base F7-F6 e altezza 1 Il calcolo di Ř egrave del tutto analogo egrave sufficiente porre lrsquoarea massima pari a frac12

Data i redditi di 7 individui

Un esempio

i x_i F_i Q_i (Fi-Fi-1)(Qi+Qi-1)

1 16 01429 00494 00070

2 21 02857 01142 00233

3 23 04286 01852 00427

4 32 05714 02840 00670

5 62 07143 04753 01085

6 80 08571 07222 01710

7 90 1 1 02461

Totale

06658

16

Variabili statistiche discrete

Finora abbiamo considerato N osservazioni non raggruppate Per ricavare lrsquoindice o la curva di concentrazione a partire da una distribuzione di frequenze assolute possiamo usare le seguenti versioni ldquoponderaterdquo di Fi e Qi

dove x1hellipxk sono k valori distinti ordinati in modo non decrescente con numerositagrave n1 hellipnk

17

Variabili statistiche discrete

1

1

1

1

)(

k

ii

k

iii

F

QFR

Con le coppie (Fi Qi) si puograve ottenere un indice analogo ad R

In generale RneR sugli stessi dati Infatti con lrsquoindice sopra la situazione di massima concentrazione si ha quando tutto il carattere appartiene alla k-esima classe (e non allrsquo N-esimo individuo come nel caso di R)

Unendo le coppie (Fi Qi

) si ottiene la stessa curva di concentrazione che si otterrebbe utilizzando con i dati unitari Infatti si puograve dimostrare che la pendenza della curva non cambia passando tra individui che hanno lo stesso ammontare di carattere Lrsquounica differenza egrave che ora per ottenere la spezzata si devono congiungere kltN punti

18

Nel caso in cui si disponga dellrsquoinformazione sullrsquoammontare totale di carattere in un intervallo egrave consigliabile discretizzare gli intervalli in modo ldquocoerenterdquo con tale informazione

Esempio se nellrsquointervallo [515) di numerositagrave Ni=10 il carattere totale egrave pari a 60 egrave preferibile discretizzare lrsquointervallo assumendo come punto ldquomediordquo il valore 6 e non il valore 10 (al quale corrisponderebbe un reddito totale di 100 e non di 60) Si noti che devono essere note le numerositagrave degli intervalli per poter procedere in questo modo

Nel caso in cui si disponga dellrsquoinformazione sullrsquoammontare totale di carattere in un intervallo egrave consigliabile discretizzare gli intervalli in modo ldquocoerenterdquo con tale informazione

Esempio se nellrsquointervallo [515) di numerositagrave Ni=10 il carattere totale egrave pari a 60 egrave preferibile discretizzare lrsquointervallo assumendo come punto ldquomediordquo il valore 6 e non il valore 10 (al quale corrisponderebbe un reddito totale di 100 e non di 60) Si noti che devono essere note le numerositagrave degli intervalli per poter procedere in questo modo

Se si desidera ricavare lrsquoindice o la curva di concentrazione per una variabile continua per intervallo il modo piugrave semplice di procedere consiste nel ldquodiscretizzarerdquo la variabile considerando le frequenze ldquoconcentraterdquo nei punti medi degli intervalli Si puograve poi procedere come nel caso precedente

Se si desidera ricavare lrsquoindice o la curva di concentrazione per una variabile continua per intervallo il modo piugrave semplice di procedere consiste nel ldquodiscretizzarerdquo la variabile considerando le frequenze ldquoconcentraterdquo nei punti medi degli intervalli Si puograve poi procedere come nel caso precedente

Variabili statistiche continue per intervallo

19

Se X egrave una variabile statistica continua non negativa con densitagrave f(x) e media finita μ le espressioni delle frequenze e delle intensitagrave cumulate diventano

Se X egrave una variabile statistica continua non negativa con densitagrave f(x) e media finita μ le espressioni delle frequenze e delle intensitagrave cumulate diventano

Variabili statistiche continue

Nota Talvolta si esprimono F e Q in funzione della frequenza cumulata r In tal caso si ha x = F-1( r ) da cui le nuove variabili

20

Il valore di R per un carattere con distribuzione continua si puograve ottenere come nel caso discreto rapportando lrsquoarea di concentrazione al suo valore massimo pari ad 12

Il valore di R per un carattere con distribuzione continua si puograve ottenere come nel caso discreto rapportando lrsquoarea di concentrazione al suo valore massimo pari ad 12

Variabili statistiche continue

Lrsquoindice di Gini egrave quindi pari a due volte lrsquoarea di concentrazione

Nota essendo Amax =12 si ha R=Ř

ConfrontiPuograve essere interessante confrontare la concentrazione di due caratteri

(o equivalentemente dello stesso carattere in due istanti diversi o in due ambiti territoriali diversi)

Esempio 1 il reddito risulta piugrave concentrato in Italia o in Francia

Esempio 2 la concentrazione del reddito in Italia era maggiore negli anni lsquo80 o negli anni lsquo90

Un modo semplice per stabilire quale carattere egrave maggiormente concentrato egrave quello di confrontare graficamente le curve di concentrazione nei due ambiti territoriali (o temporali) e stabilire quale si trova al di sopra

21

bull Non egrave detto che una delle due curve sia al di sopra dellrsquoaltra le curve si possono intersecare Si puograve tuttavia mostrare che se il carattere varia linearmente tra gli ambiti considerati allora le curve non si intersecano

bull In generale si puograve effettuare il confronto usando lrsquoindice di Gini

bull Poicheacute G=2A=1-2Area_sotto_la_curva_Lorenz il confronto attraverso lrsquoindici di Gini equivale al confronto tra le aree al di sotto delle curve di Lorenz dei due caratteri

Confronti

Confronti

Esempio la concentrazione del reddito nel mondo usando lrsquoindice R

23

Fonte CIA The world Factbook 2009

24

Esempio di Confronto Tra DistribuzioniSi riportano di seguito le distribuzioni dei finanziamenti concessi da un istituto bancario per lrsquoacquisto della prima casa a giovani coppie residenti in Campania ed in Sardegna

a) In quale regione risulta piugrave elevata la concentrazione dei finanziamenti concessi

b) Confrontare graficamente i diversi livelli di concentrazione dei finanziamenti nelle due regioni

Campania

Finanziamenti (migliaia di Euro) ni

0-50 10

50-100 25

100-150 37

150-200 22

200-250 6

Totale 100

Sardegna

Finanziamenti (migliaia di Euro) ni

0-50 57

50-100 3

100-150 7

150-200 8

200-250 25

Totale 100

25

Sardegna

Finanziamenti (migliaia di Euro) ni Ni pi xi xi ni Xi qi pi+1- pi qi+1+ qi (pi+1- pi)(qi+1+ qi)

0 0 0 0000 0 0 0 0000 0570 0149 0085

0-50 57 57 0570 25 1425 1425 0149 0030 0322 0010

50-100 3 60 0600 75 225 1650 0173 0070 0437 0031

100-150 7 67 0670 125 875 2525 0264 0080 0675 0054

150-200 8 75 0750 175 1400 3925 0411 0250 1411 0353

200-250 25 100 1000 225 5625 9550 1000 - - -

Totale 100 9550 0532

Concentrazione dei finanziamenti in Sardegna

26

Concentrazione dei finanziamenti in Campania

Campania

Finanziamenti (migliaia di Euro) ni Ni pi xi xi ni Xi qi pi+1- pi qi+1+ qi (pi+1- pi)(qi+1+ qi)

0 0 0 0000 0 0 0 0000 0100 0021 0002

0-50 10 10 0100 25 250 250 0021 0250 0199 0050

50-100 25 35 0350 75 1875 2125 0178 0370 0743 0275

100-150 37 72 0720 125 4625 6750 0565 0220 1452 0319

150-200 22 94 0940 175 3850 10600 0887 0060 1887 0113

200-250 6 100 1000 225 1350 11950 1000 - - -

Totale 100 11950 0759

27

00

01

02

03

04

05

06

07

08

09

10

00 01 02 03 04 05 06 07 08 09 10

pi

qi

Equidistribuzione Sardegna Campania

4680R~sar 2410R

~cam La concentrazione egrave piugrave

elevata in Sardegna

La curva di Lorenz conferma questo risultato

28

Riferimenti

bull C Gini (1912) Variabilitagrave e mutabilitagrave Contributo allo studio delle distribuzioni e relazioni statistiche Studi economici-giuridici dela Regia Universitagrave di Cagliari anno III

bull Lorenz M O (1905) Methods of measuring the concentration of wealth Publications of the American Statistical Association (Publications of the American Statistical Association Vol 9 No 70) 9 (70) 209ndash219

bull Per ulteriori riferimenti si possono consultare utilmente le pagine di Wikipedia relative allrsquoindice di Gini e alla curva di Lorenz

  • Appunti sulla concentrazione
  • Sommario
  • Introduzione
  • Slide 4
  • Curva di concentrazione
  • Slide 6
  • Slide 7
  • Un esempio
  • Indici di concentrazione
  • Indice di concentrazione (1)
  • Indice di concentrazione (2)
  • Slide 12
  • Indice di concentrazione (3)
  • Slide 14
  • Slide 15
  • Variabili statistiche discrete
  • Slide 17
  • Variabili statistiche continue per intervallo
  • Variabili statistiche continue
  • Slide 20
  • Confronti
  • Slide 22
  • Slide 23
  • PowerPoint Presentation
  • Slide 25
  • Slide 26
  • Slide 27
  • Slide 28
Page 16: Appunti sulla concentrazione a.a. 2012-2013 v.3. 2 Sommario Introduzione La curva di concentrazione Indici di concentrazione Confronti Riferimenti

16

Variabili statistiche discrete

Finora abbiamo considerato N osservazioni non raggruppate Per ricavare lrsquoindice o la curva di concentrazione a partire da una distribuzione di frequenze assolute possiamo usare le seguenti versioni ldquoponderaterdquo di Fi e Qi

dove x1hellipxk sono k valori distinti ordinati in modo non decrescente con numerositagrave n1 hellipnk

17

Variabili statistiche discrete

1

1

1

1

)(

k

ii

k

iii

F

QFR

Con le coppie (Fi Qi) si puograve ottenere un indice analogo ad R

In generale RneR sugli stessi dati Infatti con lrsquoindice sopra la situazione di massima concentrazione si ha quando tutto il carattere appartiene alla k-esima classe (e non allrsquo N-esimo individuo come nel caso di R)

Unendo le coppie (Fi Qi

) si ottiene la stessa curva di concentrazione che si otterrebbe utilizzando con i dati unitari Infatti si puograve dimostrare che la pendenza della curva non cambia passando tra individui che hanno lo stesso ammontare di carattere Lrsquounica differenza egrave che ora per ottenere la spezzata si devono congiungere kltN punti

18

Nel caso in cui si disponga dellrsquoinformazione sullrsquoammontare totale di carattere in un intervallo egrave consigliabile discretizzare gli intervalli in modo ldquocoerenterdquo con tale informazione

Esempio se nellrsquointervallo [515) di numerositagrave Ni=10 il carattere totale egrave pari a 60 egrave preferibile discretizzare lrsquointervallo assumendo come punto ldquomediordquo il valore 6 e non il valore 10 (al quale corrisponderebbe un reddito totale di 100 e non di 60) Si noti che devono essere note le numerositagrave degli intervalli per poter procedere in questo modo

Nel caso in cui si disponga dellrsquoinformazione sullrsquoammontare totale di carattere in un intervallo egrave consigliabile discretizzare gli intervalli in modo ldquocoerenterdquo con tale informazione

Esempio se nellrsquointervallo [515) di numerositagrave Ni=10 il carattere totale egrave pari a 60 egrave preferibile discretizzare lrsquointervallo assumendo come punto ldquomediordquo il valore 6 e non il valore 10 (al quale corrisponderebbe un reddito totale di 100 e non di 60) Si noti che devono essere note le numerositagrave degli intervalli per poter procedere in questo modo

Se si desidera ricavare lrsquoindice o la curva di concentrazione per una variabile continua per intervallo il modo piugrave semplice di procedere consiste nel ldquodiscretizzarerdquo la variabile considerando le frequenze ldquoconcentraterdquo nei punti medi degli intervalli Si puograve poi procedere come nel caso precedente

Se si desidera ricavare lrsquoindice o la curva di concentrazione per una variabile continua per intervallo il modo piugrave semplice di procedere consiste nel ldquodiscretizzarerdquo la variabile considerando le frequenze ldquoconcentraterdquo nei punti medi degli intervalli Si puograve poi procedere come nel caso precedente

Variabili statistiche continue per intervallo

19

Se X egrave una variabile statistica continua non negativa con densitagrave f(x) e media finita μ le espressioni delle frequenze e delle intensitagrave cumulate diventano

Se X egrave una variabile statistica continua non negativa con densitagrave f(x) e media finita μ le espressioni delle frequenze e delle intensitagrave cumulate diventano

Variabili statistiche continue

Nota Talvolta si esprimono F e Q in funzione della frequenza cumulata r In tal caso si ha x = F-1( r ) da cui le nuove variabili

20

Il valore di R per un carattere con distribuzione continua si puograve ottenere come nel caso discreto rapportando lrsquoarea di concentrazione al suo valore massimo pari ad 12

Il valore di R per un carattere con distribuzione continua si puograve ottenere come nel caso discreto rapportando lrsquoarea di concentrazione al suo valore massimo pari ad 12

Variabili statistiche continue

Lrsquoindice di Gini egrave quindi pari a due volte lrsquoarea di concentrazione

Nota essendo Amax =12 si ha R=Ř

ConfrontiPuograve essere interessante confrontare la concentrazione di due caratteri

(o equivalentemente dello stesso carattere in due istanti diversi o in due ambiti territoriali diversi)

Esempio 1 il reddito risulta piugrave concentrato in Italia o in Francia

Esempio 2 la concentrazione del reddito in Italia era maggiore negli anni lsquo80 o negli anni lsquo90

Un modo semplice per stabilire quale carattere egrave maggiormente concentrato egrave quello di confrontare graficamente le curve di concentrazione nei due ambiti territoriali (o temporali) e stabilire quale si trova al di sopra

21

bull Non egrave detto che una delle due curve sia al di sopra dellrsquoaltra le curve si possono intersecare Si puograve tuttavia mostrare che se il carattere varia linearmente tra gli ambiti considerati allora le curve non si intersecano

bull In generale si puograve effettuare il confronto usando lrsquoindice di Gini

bull Poicheacute G=2A=1-2Area_sotto_la_curva_Lorenz il confronto attraverso lrsquoindici di Gini equivale al confronto tra le aree al di sotto delle curve di Lorenz dei due caratteri

Confronti

Confronti

Esempio la concentrazione del reddito nel mondo usando lrsquoindice R

23

Fonte CIA The world Factbook 2009

24

Esempio di Confronto Tra DistribuzioniSi riportano di seguito le distribuzioni dei finanziamenti concessi da un istituto bancario per lrsquoacquisto della prima casa a giovani coppie residenti in Campania ed in Sardegna

a) In quale regione risulta piugrave elevata la concentrazione dei finanziamenti concessi

b) Confrontare graficamente i diversi livelli di concentrazione dei finanziamenti nelle due regioni

Campania

Finanziamenti (migliaia di Euro) ni

0-50 10

50-100 25

100-150 37

150-200 22

200-250 6

Totale 100

Sardegna

Finanziamenti (migliaia di Euro) ni

0-50 57

50-100 3

100-150 7

150-200 8

200-250 25

Totale 100

25

Sardegna

Finanziamenti (migliaia di Euro) ni Ni pi xi xi ni Xi qi pi+1- pi qi+1+ qi (pi+1- pi)(qi+1+ qi)

0 0 0 0000 0 0 0 0000 0570 0149 0085

0-50 57 57 0570 25 1425 1425 0149 0030 0322 0010

50-100 3 60 0600 75 225 1650 0173 0070 0437 0031

100-150 7 67 0670 125 875 2525 0264 0080 0675 0054

150-200 8 75 0750 175 1400 3925 0411 0250 1411 0353

200-250 25 100 1000 225 5625 9550 1000 - - -

Totale 100 9550 0532

Concentrazione dei finanziamenti in Sardegna

26

Concentrazione dei finanziamenti in Campania

Campania

Finanziamenti (migliaia di Euro) ni Ni pi xi xi ni Xi qi pi+1- pi qi+1+ qi (pi+1- pi)(qi+1+ qi)

0 0 0 0000 0 0 0 0000 0100 0021 0002

0-50 10 10 0100 25 250 250 0021 0250 0199 0050

50-100 25 35 0350 75 1875 2125 0178 0370 0743 0275

100-150 37 72 0720 125 4625 6750 0565 0220 1452 0319

150-200 22 94 0940 175 3850 10600 0887 0060 1887 0113

200-250 6 100 1000 225 1350 11950 1000 - - -

Totale 100 11950 0759

27

00

01

02

03

04

05

06

07

08

09

10

00 01 02 03 04 05 06 07 08 09 10

pi

qi

Equidistribuzione Sardegna Campania

4680R~sar 2410R

~cam La concentrazione egrave piugrave

elevata in Sardegna

La curva di Lorenz conferma questo risultato

28

Riferimenti

bull C Gini (1912) Variabilitagrave e mutabilitagrave Contributo allo studio delle distribuzioni e relazioni statistiche Studi economici-giuridici dela Regia Universitagrave di Cagliari anno III

bull Lorenz M O (1905) Methods of measuring the concentration of wealth Publications of the American Statistical Association (Publications of the American Statistical Association Vol 9 No 70) 9 (70) 209ndash219

bull Per ulteriori riferimenti si possono consultare utilmente le pagine di Wikipedia relative allrsquoindice di Gini e alla curva di Lorenz

  • Appunti sulla concentrazione
  • Sommario
  • Introduzione
  • Slide 4
  • Curva di concentrazione
  • Slide 6
  • Slide 7
  • Un esempio
  • Indici di concentrazione
  • Indice di concentrazione (1)
  • Indice di concentrazione (2)
  • Slide 12
  • Indice di concentrazione (3)
  • Slide 14
  • Slide 15
  • Variabili statistiche discrete
  • Slide 17
  • Variabili statistiche continue per intervallo
  • Variabili statistiche continue
  • Slide 20
  • Confronti
  • Slide 22
  • Slide 23
  • PowerPoint Presentation
  • Slide 25
  • Slide 26
  • Slide 27
  • Slide 28
Page 17: Appunti sulla concentrazione a.a. 2012-2013 v.3. 2 Sommario Introduzione La curva di concentrazione Indici di concentrazione Confronti Riferimenti

17

Variabili statistiche discrete

1

1

1

1

)(

k

ii

k

iii

F

QFR

Con le coppie (Fi Qi) si puograve ottenere un indice analogo ad R

In generale RneR sugli stessi dati Infatti con lrsquoindice sopra la situazione di massima concentrazione si ha quando tutto il carattere appartiene alla k-esima classe (e non allrsquo N-esimo individuo come nel caso di R)

Unendo le coppie (Fi Qi

) si ottiene la stessa curva di concentrazione che si otterrebbe utilizzando con i dati unitari Infatti si puograve dimostrare che la pendenza della curva non cambia passando tra individui che hanno lo stesso ammontare di carattere Lrsquounica differenza egrave che ora per ottenere la spezzata si devono congiungere kltN punti

18

Nel caso in cui si disponga dellrsquoinformazione sullrsquoammontare totale di carattere in un intervallo egrave consigliabile discretizzare gli intervalli in modo ldquocoerenterdquo con tale informazione

Esempio se nellrsquointervallo [515) di numerositagrave Ni=10 il carattere totale egrave pari a 60 egrave preferibile discretizzare lrsquointervallo assumendo come punto ldquomediordquo il valore 6 e non il valore 10 (al quale corrisponderebbe un reddito totale di 100 e non di 60) Si noti che devono essere note le numerositagrave degli intervalli per poter procedere in questo modo

Nel caso in cui si disponga dellrsquoinformazione sullrsquoammontare totale di carattere in un intervallo egrave consigliabile discretizzare gli intervalli in modo ldquocoerenterdquo con tale informazione

Esempio se nellrsquointervallo [515) di numerositagrave Ni=10 il carattere totale egrave pari a 60 egrave preferibile discretizzare lrsquointervallo assumendo come punto ldquomediordquo il valore 6 e non il valore 10 (al quale corrisponderebbe un reddito totale di 100 e non di 60) Si noti che devono essere note le numerositagrave degli intervalli per poter procedere in questo modo

Se si desidera ricavare lrsquoindice o la curva di concentrazione per una variabile continua per intervallo il modo piugrave semplice di procedere consiste nel ldquodiscretizzarerdquo la variabile considerando le frequenze ldquoconcentraterdquo nei punti medi degli intervalli Si puograve poi procedere come nel caso precedente

Se si desidera ricavare lrsquoindice o la curva di concentrazione per una variabile continua per intervallo il modo piugrave semplice di procedere consiste nel ldquodiscretizzarerdquo la variabile considerando le frequenze ldquoconcentraterdquo nei punti medi degli intervalli Si puograve poi procedere come nel caso precedente

Variabili statistiche continue per intervallo

19

Se X egrave una variabile statistica continua non negativa con densitagrave f(x) e media finita μ le espressioni delle frequenze e delle intensitagrave cumulate diventano

Se X egrave una variabile statistica continua non negativa con densitagrave f(x) e media finita μ le espressioni delle frequenze e delle intensitagrave cumulate diventano

Variabili statistiche continue

Nota Talvolta si esprimono F e Q in funzione della frequenza cumulata r In tal caso si ha x = F-1( r ) da cui le nuove variabili

20

Il valore di R per un carattere con distribuzione continua si puograve ottenere come nel caso discreto rapportando lrsquoarea di concentrazione al suo valore massimo pari ad 12

Il valore di R per un carattere con distribuzione continua si puograve ottenere come nel caso discreto rapportando lrsquoarea di concentrazione al suo valore massimo pari ad 12

Variabili statistiche continue

Lrsquoindice di Gini egrave quindi pari a due volte lrsquoarea di concentrazione

Nota essendo Amax =12 si ha R=Ř

ConfrontiPuograve essere interessante confrontare la concentrazione di due caratteri

(o equivalentemente dello stesso carattere in due istanti diversi o in due ambiti territoriali diversi)

Esempio 1 il reddito risulta piugrave concentrato in Italia o in Francia

Esempio 2 la concentrazione del reddito in Italia era maggiore negli anni lsquo80 o negli anni lsquo90

Un modo semplice per stabilire quale carattere egrave maggiormente concentrato egrave quello di confrontare graficamente le curve di concentrazione nei due ambiti territoriali (o temporali) e stabilire quale si trova al di sopra

21

bull Non egrave detto che una delle due curve sia al di sopra dellrsquoaltra le curve si possono intersecare Si puograve tuttavia mostrare che se il carattere varia linearmente tra gli ambiti considerati allora le curve non si intersecano

bull In generale si puograve effettuare il confronto usando lrsquoindice di Gini

bull Poicheacute G=2A=1-2Area_sotto_la_curva_Lorenz il confronto attraverso lrsquoindici di Gini equivale al confronto tra le aree al di sotto delle curve di Lorenz dei due caratteri

Confronti

Confronti

Esempio la concentrazione del reddito nel mondo usando lrsquoindice R

23

Fonte CIA The world Factbook 2009

24

Esempio di Confronto Tra DistribuzioniSi riportano di seguito le distribuzioni dei finanziamenti concessi da un istituto bancario per lrsquoacquisto della prima casa a giovani coppie residenti in Campania ed in Sardegna

a) In quale regione risulta piugrave elevata la concentrazione dei finanziamenti concessi

b) Confrontare graficamente i diversi livelli di concentrazione dei finanziamenti nelle due regioni

Campania

Finanziamenti (migliaia di Euro) ni

0-50 10

50-100 25

100-150 37

150-200 22

200-250 6

Totale 100

Sardegna

Finanziamenti (migliaia di Euro) ni

0-50 57

50-100 3

100-150 7

150-200 8

200-250 25

Totale 100

25

Sardegna

Finanziamenti (migliaia di Euro) ni Ni pi xi xi ni Xi qi pi+1- pi qi+1+ qi (pi+1- pi)(qi+1+ qi)

0 0 0 0000 0 0 0 0000 0570 0149 0085

0-50 57 57 0570 25 1425 1425 0149 0030 0322 0010

50-100 3 60 0600 75 225 1650 0173 0070 0437 0031

100-150 7 67 0670 125 875 2525 0264 0080 0675 0054

150-200 8 75 0750 175 1400 3925 0411 0250 1411 0353

200-250 25 100 1000 225 5625 9550 1000 - - -

Totale 100 9550 0532

Concentrazione dei finanziamenti in Sardegna

26

Concentrazione dei finanziamenti in Campania

Campania

Finanziamenti (migliaia di Euro) ni Ni pi xi xi ni Xi qi pi+1- pi qi+1+ qi (pi+1- pi)(qi+1+ qi)

0 0 0 0000 0 0 0 0000 0100 0021 0002

0-50 10 10 0100 25 250 250 0021 0250 0199 0050

50-100 25 35 0350 75 1875 2125 0178 0370 0743 0275

100-150 37 72 0720 125 4625 6750 0565 0220 1452 0319

150-200 22 94 0940 175 3850 10600 0887 0060 1887 0113

200-250 6 100 1000 225 1350 11950 1000 - - -

Totale 100 11950 0759

27

00

01

02

03

04

05

06

07

08

09

10

00 01 02 03 04 05 06 07 08 09 10

pi

qi

Equidistribuzione Sardegna Campania

4680R~sar 2410R

~cam La concentrazione egrave piugrave

elevata in Sardegna

La curva di Lorenz conferma questo risultato

28

Riferimenti

bull C Gini (1912) Variabilitagrave e mutabilitagrave Contributo allo studio delle distribuzioni e relazioni statistiche Studi economici-giuridici dela Regia Universitagrave di Cagliari anno III

bull Lorenz M O (1905) Methods of measuring the concentration of wealth Publications of the American Statistical Association (Publications of the American Statistical Association Vol 9 No 70) 9 (70) 209ndash219

bull Per ulteriori riferimenti si possono consultare utilmente le pagine di Wikipedia relative allrsquoindice di Gini e alla curva di Lorenz

  • Appunti sulla concentrazione
  • Sommario
  • Introduzione
  • Slide 4
  • Curva di concentrazione
  • Slide 6
  • Slide 7
  • Un esempio
  • Indici di concentrazione
  • Indice di concentrazione (1)
  • Indice di concentrazione (2)
  • Slide 12
  • Indice di concentrazione (3)
  • Slide 14
  • Slide 15
  • Variabili statistiche discrete
  • Slide 17
  • Variabili statistiche continue per intervallo
  • Variabili statistiche continue
  • Slide 20
  • Confronti
  • Slide 22
  • Slide 23
  • PowerPoint Presentation
  • Slide 25
  • Slide 26
  • Slide 27
  • Slide 28
Page 18: Appunti sulla concentrazione a.a. 2012-2013 v.3. 2 Sommario Introduzione La curva di concentrazione Indici di concentrazione Confronti Riferimenti

18

Nel caso in cui si disponga dellrsquoinformazione sullrsquoammontare totale di carattere in un intervallo egrave consigliabile discretizzare gli intervalli in modo ldquocoerenterdquo con tale informazione

Esempio se nellrsquointervallo [515) di numerositagrave Ni=10 il carattere totale egrave pari a 60 egrave preferibile discretizzare lrsquointervallo assumendo come punto ldquomediordquo il valore 6 e non il valore 10 (al quale corrisponderebbe un reddito totale di 100 e non di 60) Si noti che devono essere note le numerositagrave degli intervalli per poter procedere in questo modo

Nel caso in cui si disponga dellrsquoinformazione sullrsquoammontare totale di carattere in un intervallo egrave consigliabile discretizzare gli intervalli in modo ldquocoerenterdquo con tale informazione

Esempio se nellrsquointervallo [515) di numerositagrave Ni=10 il carattere totale egrave pari a 60 egrave preferibile discretizzare lrsquointervallo assumendo come punto ldquomediordquo il valore 6 e non il valore 10 (al quale corrisponderebbe un reddito totale di 100 e non di 60) Si noti che devono essere note le numerositagrave degli intervalli per poter procedere in questo modo

Se si desidera ricavare lrsquoindice o la curva di concentrazione per una variabile continua per intervallo il modo piugrave semplice di procedere consiste nel ldquodiscretizzarerdquo la variabile considerando le frequenze ldquoconcentraterdquo nei punti medi degli intervalli Si puograve poi procedere come nel caso precedente

Se si desidera ricavare lrsquoindice o la curva di concentrazione per una variabile continua per intervallo il modo piugrave semplice di procedere consiste nel ldquodiscretizzarerdquo la variabile considerando le frequenze ldquoconcentraterdquo nei punti medi degli intervalli Si puograve poi procedere come nel caso precedente

Variabili statistiche continue per intervallo

19

Se X egrave una variabile statistica continua non negativa con densitagrave f(x) e media finita μ le espressioni delle frequenze e delle intensitagrave cumulate diventano

Se X egrave una variabile statistica continua non negativa con densitagrave f(x) e media finita μ le espressioni delle frequenze e delle intensitagrave cumulate diventano

Variabili statistiche continue

Nota Talvolta si esprimono F e Q in funzione della frequenza cumulata r In tal caso si ha x = F-1( r ) da cui le nuove variabili

20

Il valore di R per un carattere con distribuzione continua si puograve ottenere come nel caso discreto rapportando lrsquoarea di concentrazione al suo valore massimo pari ad 12

Il valore di R per un carattere con distribuzione continua si puograve ottenere come nel caso discreto rapportando lrsquoarea di concentrazione al suo valore massimo pari ad 12

Variabili statistiche continue

Lrsquoindice di Gini egrave quindi pari a due volte lrsquoarea di concentrazione

Nota essendo Amax =12 si ha R=Ř

ConfrontiPuograve essere interessante confrontare la concentrazione di due caratteri

(o equivalentemente dello stesso carattere in due istanti diversi o in due ambiti territoriali diversi)

Esempio 1 il reddito risulta piugrave concentrato in Italia o in Francia

Esempio 2 la concentrazione del reddito in Italia era maggiore negli anni lsquo80 o negli anni lsquo90

Un modo semplice per stabilire quale carattere egrave maggiormente concentrato egrave quello di confrontare graficamente le curve di concentrazione nei due ambiti territoriali (o temporali) e stabilire quale si trova al di sopra

21

bull Non egrave detto che una delle due curve sia al di sopra dellrsquoaltra le curve si possono intersecare Si puograve tuttavia mostrare che se il carattere varia linearmente tra gli ambiti considerati allora le curve non si intersecano

bull In generale si puograve effettuare il confronto usando lrsquoindice di Gini

bull Poicheacute G=2A=1-2Area_sotto_la_curva_Lorenz il confronto attraverso lrsquoindici di Gini equivale al confronto tra le aree al di sotto delle curve di Lorenz dei due caratteri

Confronti

Confronti

Esempio la concentrazione del reddito nel mondo usando lrsquoindice R

23

Fonte CIA The world Factbook 2009

24

Esempio di Confronto Tra DistribuzioniSi riportano di seguito le distribuzioni dei finanziamenti concessi da un istituto bancario per lrsquoacquisto della prima casa a giovani coppie residenti in Campania ed in Sardegna

a) In quale regione risulta piugrave elevata la concentrazione dei finanziamenti concessi

b) Confrontare graficamente i diversi livelli di concentrazione dei finanziamenti nelle due regioni

Campania

Finanziamenti (migliaia di Euro) ni

0-50 10

50-100 25

100-150 37

150-200 22

200-250 6

Totale 100

Sardegna

Finanziamenti (migliaia di Euro) ni

0-50 57

50-100 3

100-150 7

150-200 8

200-250 25

Totale 100

25

Sardegna

Finanziamenti (migliaia di Euro) ni Ni pi xi xi ni Xi qi pi+1- pi qi+1+ qi (pi+1- pi)(qi+1+ qi)

0 0 0 0000 0 0 0 0000 0570 0149 0085

0-50 57 57 0570 25 1425 1425 0149 0030 0322 0010

50-100 3 60 0600 75 225 1650 0173 0070 0437 0031

100-150 7 67 0670 125 875 2525 0264 0080 0675 0054

150-200 8 75 0750 175 1400 3925 0411 0250 1411 0353

200-250 25 100 1000 225 5625 9550 1000 - - -

Totale 100 9550 0532

Concentrazione dei finanziamenti in Sardegna

26

Concentrazione dei finanziamenti in Campania

Campania

Finanziamenti (migliaia di Euro) ni Ni pi xi xi ni Xi qi pi+1- pi qi+1+ qi (pi+1- pi)(qi+1+ qi)

0 0 0 0000 0 0 0 0000 0100 0021 0002

0-50 10 10 0100 25 250 250 0021 0250 0199 0050

50-100 25 35 0350 75 1875 2125 0178 0370 0743 0275

100-150 37 72 0720 125 4625 6750 0565 0220 1452 0319

150-200 22 94 0940 175 3850 10600 0887 0060 1887 0113

200-250 6 100 1000 225 1350 11950 1000 - - -

Totale 100 11950 0759

27

00

01

02

03

04

05

06

07

08

09

10

00 01 02 03 04 05 06 07 08 09 10

pi

qi

Equidistribuzione Sardegna Campania

4680R~sar 2410R

~cam La concentrazione egrave piugrave

elevata in Sardegna

La curva di Lorenz conferma questo risultato

28

Riferimenti

bull C Gini (1912) Variabilitagrave e mutabilitagrave Contributo allo studio delle distribuzioni e relazioni statistiche Studi economici-giuridici dela Regia Universitagrave di Cagliari anno III

bull Lorenz M O (1905) Methods of measuring the concentration of wealth Publications of the American Statistical Association (Publications of the American Statistical Association Vol 9 No 70) 9 (70) 209ndash219

bull Per ulteriori riferimenti si possono consultare utilmente le pagine di Wikipedia relative allrsquoindice di Gini e alla curva di Lorenz

  • Appunti sulla concentrazione
  • Sommario
  • Introduzione
  • Slide 4
  • Curva di concentrazione
  • Slide 6
  • Slide 7
  • Un esempio
  • Indici di concentrazione
  • Indice di concentrazione (1)
  • Indice di concentrazione (2)
  • Slide 12
  • Indice di concentrazione (3)
  • Slide 14
  • Slide 15
  • Variabili statistiche discrete
  • Slide 17
  • Variabili statistiche continue per intervallo
  • Variabili statistiche continue
  • Slide 20
  • Confronti
  • Slide 22
  • Slide 23
  • PowerPoint Presentation
  • Slide 25
  • Slide 26
  • Slide 27
  • Slide 28
Page 19: Appunti sulla concentrazione a.a. 2012-2013 v.3. 2 Sommario Introduzione La curva di concentrazione Indici di concentrazione Confronti Riferimenti

19

Se X egrave una variabile statistica continua non negativa con densitagrave f(x) e media finita μ le espressioni delle frequenze e delle intensitagrave cumulate diventano

Se X egrave una variabile statistica continua non negativa con densitagrave f(x) e media finita μ le espressioni delle frequenze e delle intensitagrave cumulate diventano

Variabili statistiche continue

Nota Talvolta si esprimono F e Q in funzione della frequenza cumulata r In tal caso si ha x = F-1( r ) da cui le nuove variabili

20

Il valore di R per un carattere con distribuzione continua si puograve ottenere come nel caso discreto rapportando lrsquoarea di concentrazione al suo valore massimo pari ad 12

Il valore di R per un carattere con distribuzione continua si puograve ottenere come nel caso discreto rapportando lrsquoarea di concentrazione al suo valore massimo pari ad 12

Variabili statistiche continue

Lrsquoindice di Gini egrave quindi pari a due volte lrsquoarea di concentrazione

Nota essendo Amax =12 si ha R=Ř

ConfrontiPuograve essere interessante confrontare la concentrazione di due caratteri

(o equivalentemente dello stesso carattere in due istanti diversi o in due ambiti territoriali diversi)

Esempio 1 il reddito risulta piugrave concentrato in Italia o in Francia

Esempio 2 la concentrazione del reddito in Italia era maggiore negli anni lsquo80 o negli anni lsquo90

Un modo semplice per stabilire quale carattere egrave maggiormente concentrato egrave quello di confrontare graficamente le curve di concentrazione nei due ambiti territoriali (o temporali) e stabilire quale si trova al di sopra

21

bull Non egrave detto che una delle due curve sia al di sopra dellrsquoaltra le curve si possono intersecare Si puograve tuttavia mostrare che se il carattere varia linearmente tra gli ambiti considerati allora le curve non si intersecano

bull In generale si puograve effettuare il confronto usando lrsquoindice di Gini

bull Poicheacute G=2A=1-2Area_sotto_la_curva_Lorenz il confronto attraverso lrsquoindici di Gini equivale al confronto tra le aree al di sotto delle curve di Lorenz dei due caratteri

Confronti

Confronti

Esempio la concentrazione del reddito nel mondo usando lrsquoindice R

23

Fonte CIA The world Factbook 2009

24

Esempio di Confronto Tra DistribuzioniSi riportano di seguito le distribuzioni dei finanziamenti concessi da un istituto bancario per lrsquoacquisto della prima casa a giovani coppie residenti in Campania ed in Sardegna

a) In quale regione risulta piugrave elevata la concentrazione dei finanziamenti concessi

b) Confrontare graficamente i diversi livelli di concentrazione dei finanziamenti nelle due regioni

Campania

Finanziamenti (migliaia di Euro) ni

0-50 10

50-100 25

100-150 37

150-200 22

200-250 6

Totale 100

Sardegna

Finanziamenti (migliaia di Euro) ni

0-50 57

50-100 3

100-150 7

150-200 8

200-250 25

Totale 100

25

Sardegna

Finanziamenti (migliaia di Euro) ni Ni pi xi xi ni Xi qi pi+1- pi qi+1+ qi (pi+1- pi)(qi+1+ qi)

0 0 0 0000 0 0 0 0000 0570 0149 0085

0-50 57 57 0570 25 1425 1425 0149 0030 0322 0010

50-100 3 60 0600 75 225 1650 0173 0070 0437 0031

100-150 7 67 0670 125 875 2525 0264 0080 0675 0054

150-200 8 75 0750 175 1400 3925 0411 0250 1411 0353

200-250 25 100 1000 225 5625 9550 1000 - - -

Totale 100 9550 0532

Concentrazione dei finanziamenti in Sardegna

26

Concentrazione dei finanziamenti in Campania

Campania

Finanziamenti (migliaia di Euro) ni Ni pi xi xi ni Xi qi pi+1- pi qi+1+ qi (pi+1- pi)(qi+1+ qi)

0 0 0 0000 0 0 0 0000 0100 0021 0002

0-50 10 10 0100 25 250 250 0021 0250 0199 0050

50-100 25 35 0350 75 1875 2125 0178 0370 0743 0275

100-150 37 72 0720 125 4625 6750 0565 0220 1452 0319

150-200 22 94 0940 175 3850 10600 0887 0060 1887 0113

200-250 6 100 1000 225 1350 11950 1000 - - -

Totale 100 11950 0759

27

00

01

02

03

04

05

06

07

08

09

10

00 01 02 03 04 05 06 07 08 09 10

pi

qi

Equidistribuzione Sardegna Campania

4680R~sar 2410R

~cam La concentrazione egrave piugrave

elevata in Sardegna

La curva di Lorenz conferma questo risultato

28

Riferimenti

bull C Gini (1912) Variabilitagrave e mutabilitagrave Contributo allo studio delle distribuzioni e relazioni statistiche Studi economici-giuridici dela Regia Universitagrave di Cagliari anno III

bull Lorenz M O (1905) Methods of measuring the concentration of wealth Publications of the American Statistical Association (Publications of the American Statistical Association Vol 9 No 70) 9 (70) 209ndash219

bull Per ulteriori riferimenti si possono consultare utilmente le pagine di Wikipedia relative allrsquoindice di Gini e alla curva di Lorenz

  • Appunti sulla concentrazione
  • Sommario
  • Introduzione
  • Slide 4
  • Curva di concentrazione
  • Slide 6
  • Slide 7
  • Un esempio
  • Indici di concentrazione
  • Indice di concentrazione (1)
  • Indice di concentrazione (2)
  • Slide 12
  • Indice di concentrazione (3)
  • Slide 14
  • Slide 15
  • Variabili statistiche discrete
  • Slide 17
  • Variabili statistiche continue per intervallo
  • Variabili statistiche continue
  • Slide 20
  • Confronti
  • Slide 22
  • Slide 23
  • PowerPoint Presentation
  • Slide 25
  • Slide 26
  • Slide 27
  • Slide 28
Page 20: Appunti sulla concentrazione a.a. 2012-2013 v.3. 2 Sommario Introduzione La curva di concentrazione Indici di concentrazione Confronti Riferimenti

20

Il valore di R per un carattere con distribuzione continua si puograve ottenere come nel caso discreto rapportando lrsquoarea di concentrazione al suo valore massimo pari ad 12

Il valore di R per un carattere con distribuzione continua si puograve ottenere come nel caso discreto rapportando lrsquoarea di concentrazione al suo valore massimo pari ad 12

Variabili statistiche continue

Lrsquoindice di Gini egrave quindi pari a due volte lrsquoarea di concentrazione

Nota essendo Amax =12 si ha R=Ř

ConfrontiPuograve essere interessante confrontare la concentrazione di due caratteri

(o equivalentemente dello stesso carattere in due istanti diversi o in due ambiti territoriali diversi)

Esempio 1 il reddito risulta piugrave concentrato in Italia o in Francia

Esempio 2 la concentrazione del reddito in Italia era maggiore negli anni lsquo80 o negli anni lsquo90

Un modo semplice per stabilire quale carattere egrave maggiormente concentrato egrave quello di confrontare graficamente le curve di concentrazione nei due ambiti territoriali (o temporali) e stabilire quale si trova al di sopra

21

bull Non egrave detto che una delle due curve sia al di sopra dellrsquoaltra le curve si possono intersecare Si puograve tuttavia mostrare che se il carattere varia linearmente tra gli ambiti considerati allora le curve non si intersecano

bull In generale si puograve effettuare il confronto usando lrsquoindice di Gini

bull Poicheacute G=2A=1-2Area_sotto_la_curva_Lorenz il confronto attraverso lrsquoindici di Gini equivale al confronto tra le aree al di sotto delle curve di Lorenz dei due caratteri

Confronti

Confronti

Esempio la concentrazione del reddito nel mondo usando lrsquoindice R

23

Fonte CIA The world Factbook 2009

24

Esempio di Confronto Tra DistribuzioniSi riportano di seguito le distribuzioni dei finanziamenti concessi da un istituto bancario per lrsquoacquisto della prima casa a giovani coppie residenti in Campania ed in Sardegna

a) In quale regione risulta piugrave elevata la concentrazione dei finanziamenti concessi

b) Confrontare graficamente i diversi livelli di concentrazione dei finanziamenti nelle due regioni

Campania

Finanziamenti (migliaia di Euro) ni

0-50 10

50-100 25

100-150 37

150-200 22

200-250 6

Totale 100

Sardegna

Finanziamenti (migliaia di Euro) ni

0-50 57

50-100 3

100-150 7

150-200 8

200-250 25

Totale 100

25

Sardegna

Finanziamenti (migliaia di Euro) ni Ni pi xi xi ni Xi qi pi+1- pi qi+1+ qi (pi+1- pi)(qi+1+ qi)

0 0 0 0000 0 0 0 0000 0570 0149 0085

0-50 57 57 0570 25 1425 1425 0149 0030 0322 0010

50-100 3 60 0600 75 225 1650 0173 0070 0437 0031

100-150 7 67 0670 125 875 2525 0264 0080 0675 0054

150-200 8 75 0750 175 1400 3925 0411 0250 1411 0353

200-250 25 100 1000 225 5625 9550 1000 - - -

Totale 100 9550 0532

Concentrazione dei finanziamenti in Sardegna

26

Concentrazione dei finanziamenti in Campania

Campania

Finanziamenti (migliaia di Euro) ni Ni pi xi xi ni Xi qi pi+1- pi qi+1+ qi (pi+1- pi)(qi+1+ qi)

0 0 0 0000 0 0 0 0000 0100 0021 0002

0-50 10 10 0100 25 250 250 0021 0250 0199 0050

50-100 25 35 0350 75 1875 2125 0178 0370 0743 0275

100-150 37 72 0720 125 4625 6750 0565 0220 1452 0319

150-200 22 94 0940 175 3850 10600 0887 0060 1887 0113

200-250 6 100 1000 225 1350 11950 1000 - - -

Totale 100 11950 0759

27

00

01

02

03

04

05

06

07

08

09

10

00 01 02 03 04 05 06 07 08 09 10

pi

qi

Equidistribuzione Sardegna Campania

4680R~sar 2410R

~cam La concentrazione egrave piugrave

elevata in Sardegna

La curva di Lorenz conferma questo risultato

28

Riferimenti

bull C Gini (1912) Variabilitagrave e mutabilitagrave Contributo allo studio delle distribuzioni e relazioni statistiche Studi economici-giuridici dela Regia Universitagrave di Cagliari anno III

bull Lorenz M O (1905) Methods of measuring the concentration of wealth Publications of the American Statistical Association (Publications of the American Statistical Association Vol 9 No 70) 9 (70) 209ndash219

bull Per ulteriori riferimenti si possono consultare utilmente le pagine di Wikipedia relative allrsquoindice di Gini e alla curva di Lorenz

  • Appunti sulla concentrazione
  • Sommario
  • Introduzione
  • Slide 4
  • Curva di concentrazione
  • Slide 6
  • Slide 7
  • Un esempio
  • Indici di concentrazione
  • Indice di concentrazione (1)
  • Indice di concentrazione (2)
  • Slide 12
  • Indice di concentrazione (3)
  • Slide 14
  • Slide 15
  • Variabili statistiche discrete
  • Slide 17
  • Variabili statistiche continue per intervallo
  • Variabili statistiche continue
  • Slide 20
  • Confronti
  • Slide 22
  • Slide 23
  • PowerPoint Presentation
  • Slide 25
  • Slide 26
  • Slide 27
  • Slide 28
Page 21: Appunti sulla concentrazione a.a. 2012-2013 v.3. 2 Sommario Introduzione La curva di concentrazione Indici di concentrazione Confronti Riferimenti

ConfrontiPuograve essere interessante confrontare la concentrazione di due caratteri

(o equivalentemente dello stesso carattere in due istanti diversi o in due ambiti territoriali diversi)

Esempio 1 il reddito risulta piugrave concentrato in Italia o in Francia

Esempio 2 la concentrazione del reddito in Italia era maggiore negli anni lsquo80 o negli anni lsquo90

Un modo semplice per stabilire quale carattere egrave maggiormente concentrato egrave quello di confrontare graficamente le curve di concentrazione nei due ambiti territoriali (o temporali) e stabilire quale si trova al di sopra

21

bull Non egrave detto che una delle due curve sia al di sopra dellrsquoaltra le curve si possono intersecare Si puograve tuttavia mostrare che se il carattere varia linearmente tra gli ambiti considerati allora le curve non si intersecano

bull In generale si puograve effettuare il confronto usando lrsquoindice di Gini

bull Poicheacute G=2A=1-2Area_sotto_la_curva_Lorenz il confronto attraverso lrsquoindici di Gini equivale al confronto tra le aree al di sotto delle curve di Lorenz dei due caratteri

Confronti

Confronti

Esempio la concentrazione del reddito nel mondo usando lrsquoindice R

23

Fonte CIA The world Factbook 2009

24

Esempio di Confronto Tra DistribuzioniSi riportano di seguito le distribuzioni dei finanziamenti concessi da un istituto bancario per lrsquoacquisto della prima casa a giovani coppie residenti in Campania ed in Sardegna

a) In quale regione risulta piugrave elevata la concentrazione dei finanziamenti concessi

b) Confrontare graficamente i diversi livelli di concentrazione dei finanziamenti nelle due regioni

Campania

Finanziamenti (migliaia di Euro) ni

0-50 10

50-100 25

100-150 37

150-200 22

200-250 6

Totale 100

Sardegna

Finanziamenti (migliaia di Euro) ni

0-50 57

50-100 3

100-150 7

150-200 8

200-250 25

Totale 100

25

Sardegna

Finanziamenti (migliaia di Euro) ni Ni pi xi xi ni Xi qi pi+1- pi qi+1+ qi (pi+1- pi)(qi+1+ qi)

0 0 0 0000 0 0 0 0000 0570 0149 0085

0-50 57 57 0570 25 1425 1425 0149 0030 0322 0010

50-100 3 60 0600 75 225 1650 0173 0070 0437 0031

100-150 7 67 0670 125 875 2525 0264 0080 0675 0054

150-200 8 75 0750 175 1400 3925 0411 0250 1411 0353

200-250 25 100 1000 225 5625 9550 1000 - - -

Totale 100 9550 0532

Concentrazione dei finanziamenti in Sardegna

26

Concentrazione dei finanziamenti in Campania

Campania

Finanziamenti (migliaia di Euro) ni Ni pi xi xi ni Xi qi pi+1- pi qi+1+ qi (pi+1- pi)(qi+1+ qi)

0 0 0 0000 0 0 0 0000 0100 0021 0002

0-50 10 10 0100 25 250 250 0021 0250 0199 0050

50-100 25 35 0350 75 1875 2125 0178 0370 0743 0275

100-150 37 72 0720 125 4625 6750 0565 0220 1452 0319

150-200 22 94 0940 175 3850 10600 0887 0060 1887 0113

200-250 6 100 1000 225 1350 11950 1000 - - -

Totale 100 11950 0759

27

00

01

02

03

04

05

06

07

08

09

10

00 01 02 03 04 05 06 07 08 09 10

pi

qi

Equidistribuzione Sardegna Campania

4680R~sar 2410R

~cam La concentrazione egrave piugrave

elevata in Sardegna

La curva di Lorenz conferma questo risultato

28

Riferimenti

bull C Gini (1912) Variabilitagrave e mutabilitagrave Contributo allo studio delle distribuzioni e relazioni statistiche Studi economici-giuridici dela Regia Universitagrave di Cagliari anno III

bull Lorenz M O (1905) Methods of measuring the concentration of wealth Publications of the American Statistical Association (Publications of the American Statistical Association Vol 9 No 70) 9 (70) 209ndash219

bull Per ulteriori riferimenti si possono consultare utilmente le pagine di Wikipedia relative allrsquoindice di Gini e alla curva di Lorenz

  • Appunti sulla concentrazione
  • Sommario
  • Introduzione
  • Slide 4
  • Curva di concentrazione
  • Slide 6
  • Slide 7
  • Un esempio
  • Indici di concentrazione
  • Indice di concentrazione (1)
  • Indice di concentrazione (2)
  • Slide 12
  • Indice di concentrazione (3)
  • Slide 14
  • Slide 15
  • Variabili statistiche discrete
  • Slide 17
  • Variabili statistiche continue per intervallo
  • Variabili statistiche continue
  • Slide 20
  • Confronti
  • Slide 22
  • Slide 23
  • PowerPoint Presentation
  • Slide 25
  • Slide 26
  • Slide 27
  • Slide 28
Page 22: Appunti sulla concentrazione a.a. 2012-2013 v.3. 2 Sommario Introduzione La curva di concentrazione Indici di concentrazione Confronti Riferimenti

bull Non egrave detto che una delle due curve sia al di sopra dellrsquoaltra le curve si possono intersecare Si puograve tuttavia mostrare che se il carattere varia linearmente tra gli ambiti considerati allora le curve non si intersecano

bull In generale si puograve effettuare il confronto usando lrsquoindice di Gini

bull Poicheacute G=2A=1-2Area_sotto_la_curva_Lorenz il confronto attraverso lrsquoindici di Gini equivale al confronto tra le aree al di sotto delle curve di Lorenz dei due caratteri

Confronti

Confronti

Esempio la concentrazione del reddito nel mondo usando lrsquoindice R

23

Fonte CIA The world Factbook 2009

24

Esempio di Confronto Tra DistribuzioniSi riportano di seguito le distribuzioni dei finanziamenti concessi da un istituto bancario per lrsquoacquisto della prima casa a giovani coppie residenti in Campania ed in Sardegna

a) In quale regione risulta piugrave elevata la concentrazione dei finanziamenti concessi

b) Confrontare graficamente i diversi livelli di concentrazione dei finanziamenti nelle due regioni

Campania

Finanziamenti (migliaia di Euro) ni

0-50 10

50-100 25

100-150 37

150-200 22

200-250 6

Totale 100

Sardegna

Finanziamenti (migliaia di Euro) ni

0-50 57

50-100 3

100-150 7

150-200 8

200-250 25

Totale 100

25

Sardegna

Finanziamenti (migliaia di Euro) ni Ni pi xi xi ni Xi qi pi+1- pi qi+1+ qi (pi+1- pi)(qi+1+ qi)

0 0 0 0000 0 0 0 0000 0570 0149 0085

0-50 57 57 0570 25 1425 1425 0149 0030 0322 0010

50-100 3 60 0600 75 225 1650 0173 0070 0437 0031

100-150 7 67 0670 125 875 2525 0264 0080 0675 0054

150-200 8 75 0750 175 1400 3925 0411 0250 1411 0353

200-250 25 100 1000 225 5625 9550 1000 - - -

Totale 100 9550 0532

Concentrazione dei finanziamenti in Sardegna

26

Concentrazione dei finanziamenti in Campania

Campania

Finanziamenti (migliaia di Euro) ni Ni pi xi xi ni Xi qi pi+1- pi qi+1+ qi (pi+1- pi)(qi+1+ qi)

0 0 0 0000 0 0 0 0000 0100 0021 0002

0-50 10 10 0100 25 250 250 0021 0250 0199 0050

50-100 25 35 0350 75 1875 2125 0178 0370 0743 0275

100-150 37 72 0720 125 4625 6750 0565 0220 1452 0319

150-200 22 94 0940 175 3850 10600 0887 0060 1887 0113

200-250 6 100 1000 225 1350 11950 1000 - - -

Totale 100 11950 0759

27

00

01

02

03

04

05

06

07

08

09

10

00 01 02 03 04 05 06 07 08 09 10

pi

qi

Equidistribuzione Sardegna Campania

4680R~sar 2410R

~cam La concentrazione egrave piugrave

elevata in Sardegna

La curva di Lorenz conferma questo risultato

28

Riferimenti

bull C Gini (1912) Variabilitagrave e mutabilitagrave Contributo allo studio delle distribuzioni e relazioni statistiche Studi economici-giuridici dela Regia Universitagrave di Cagliari anno III

bull Lorenz M O (1905) Methods of measuring the concentration of wealth Publications of the American Statistical Association (Publications of the American Statistical Association Vol 9 No 70) 9 (70) 209ndash219

bull Per ulteriori riferimenti si possono consultare utilmente le pagine di Wikipedia relative allrsquoindice di Gini e alla curva di Lorenz

  • Appunti sulla concentrazione
  • Sommario
  • Introduzione
  • Slide 4
  • Curva di concentrazione
  • Slide 6
  • Slide 7
  • Un esempio
  • Indici di concentrazione
  • Indice di concentrazione (1)
  • Indice di concentrazione (2)
  • Slide 12
  • Indice di concentrazione (3)
  • Slide 14
  • Slide 15
  • Variabili statistiche discrete
  • Slide 17
  • Variabili statistiche continue per intervallo
  • Variabili statistiche continue
  • Slide 20
  • Confronti
  • Slide 22
  • Slide 23
  • PowerPoint Presentation
  • Slide 25
  • Slide 26
  • Slide 27
  • Slide 28
Page 23: Appunti sulla concentrazione a.a. 2012-2013 v.3. 2 Sommario Introduzione La curva di concentrazione Indici di concentrazione Confronti Riferimenti

Confronti

Esempio la concentrazione del reddito nel mondo usando lrsquoindice R

23

Fonte CIA The world Factbook 2009

24

Esempio di Confronto Tra DistribuzioniSi riportano di seguito le distribuzioni dei finanziamenti concessi da un istituto bancario per lrsquoacquisto della prima casa a giovani coppie residenti in Campania ed in Sardegna

a) In quale regione risulta piugrave elevata la concentrazione dei finanziamenti concessi

b) Confrontare graficamente i diversi livelli di concentrazione dei finanziamenti nelle due regioni

Campania

Finanziamenti (migliaia di Euro) ni

0-50 10

50-100 25

100-150 37

150-200 22

200-250 6

Totale 100

Sardegna

Finanziamenti (migliaia di Euro) ni

0-50 57

50-100 3

100-150 7

150-200 8

200-250 25

Totale 100

25

Sardegna

Finanziamenti (migliaia di Euro) ni Ni pi xi xi ni Xi qi pi+1- pi qi+1+ qi (pi+1- pi)(qi+1+ qi)

0 0 0 0000 0 0 0 0000 0570 0149 0085

0-50 57 57 0570 25 1425 1425 0149 0030 0322 0010

50-100 3 60 0600 75 225 1650 0173 0070 0437 0031

100-150 7 67 0670 125 875 2525 0264 0080 0675 0054

150-200 8 75 0750 175 1400 3925 0411 0250 1411 0353

200-250 25 100 1000 225 5625 9550 1000 - - -

Totale 100 9550 0532

Concentrazione dei finanziamenti in Sardegna

26

Concentrazione dei finanziamenti in Campania

Campania

Finanziamenti (migliaia di Euro) ni Ni pi xi xi ni Xi qi pi+1- pi qi+1+ qi (pi+1- pi)(qi+1+ qi)

0 0 0 0000 0 0 0 0000 0100 0021 0002

0-50 10 10 0100 25 250 250 0021 0250 0199 0050

50-100 25 35 0350 75 1875 2125 0178 0370 0743 0275

100-150 37 72 0720 125 4625 6750 0565 0220 1452 0319

150-200 22 94 0940 175 3850 10600 0887 0060 1887 0113

200-250 6 100 1000 225 1350 11950 1000 - - -

Totale 100 11950 0759

27

00

01

02

03

04

05

06

07

08

09

10

00 01 02 03 04 05 06 07 08 09 10

pi

qi

Equidistribuzione Sardegna Campania

4680R~sar 2410R

~cam La concentrazione egrave piugrave

elevata in Sardegna

La curva di Lorenz conferma questo risultato

28

Riferimenti

bull C Gini (1912) Variabilitagrave e mutabilitagrave Contributo allo studio delle distribuzioni e relazioni statistiche Studi economici-giuridici dela Regia Universitagrave di Cagliari anno III

bull Lorenz M O (1905) Methods of measuring the concentration of wealth Publications of the American Statistical Association (Publications of the American Statistical Association Vol 9 No 70) 9 (70) 209ndash219

bull Per ulteriori riferimenti si possono consultare utilmente le pagine di Wikipedia relative allrsquoindice di Gini e alla curva di Lorenz

  • Appunti sulla concentrazione
  • Sommario
  • Introduzione
  • Slide 4
  • Curva di concentrazione
  • Slide 6
  • Slide 7
  • Un esempio
  • Indici di concentrazione
  • Indice di concentrazione (1)
  • Indice di concentrazione (2)
  • Slide 12
  • Indice di concentrazione (3)
  • Slide 14
  • Slide 15
  • Variabili statistiche discrete
  • Slide 17
  • Variabili statistiche continue per intervallo
  • Variabili statistiche continue
  • Slide 20
  • Confronti
  • Slide 22
  • Slide 23
  • PowerPoint Presentation
  • Slide 25
  • Slide 26
  • Slide 27
  • Slide 28
Page 24: Appunti sulla concentrazione a.a. 2012-2013 v.3. 2 Sommario Introduzione La curva di concentrazione Indici di concentrazione Confronti Riferimenti

24

Esempio di Confronto Tra DistribuzioniSi riportano di seguito le distribuzioni dei finanziamenti concessi da un istituto bancario per lrsquoacquisto della prima casa a giovani coppie residenti in Campania ed in Sardegna

a) In quale regione risulta piugrave elevata la concentrazione dei finanziamenti concessi

b) Confrontare graficamente i diversi livelli di concentrazione dei finanziamenti nelle due regioni

Campania

Finanziamenti (migliaia di Euro) ni

0-50 10

50-100 25

100-150 37

150-200 22

200-250 6

Totale 100

Sardegna

Finanziamenti (migliaia di Euro) ni

0-50 57

50-100 3

100-150 7

150-200 8

200-250 25

Totale 100

25

Sardegna

Finanziamenti (migliaia di Euro) ni Ni pi xi xi ni Xi qi pi+1- pi qi+1+ qi (pi+1- pi)(qi+1+ qi)

0 0 0 0000 0 0 0 0000 0570 0149 0085

0-50 57 57 0570 25 1425 1425 0149 0030 0322 0010

50-100 3 60 0600 75 225 1650 0173 0070 0437 0031

100-150 7 67 0670 125 875 2525 0264 0080 0675 0054

150-200 8 75 0750 175 1400 3925 0411 0250 1411 0353

200-250 25 100 1000 225 5625 9550 1000 - - -

Totale 100 9550 0532

Concentrazione dei finanziamenti in Sardegna

26

Concentrazione dei finanziamenti in Campania

Campania

Finanziamenti (migliaia di Euro) ni Ni pi xi xi ni Xi qi pi+1- pi qi+1+ qi (pi+1- pi)(qi+1+ qi)

0 0 0 0000 0 0 0 0000 0100 0021 0002

0-50 10 10 0100 25 250 250 0021 0250 0199 0050

50-100 25 35 0350 75 1875 2125 0178 0370 0743 0275

100-150 37 72 0720 125 4625 6750 0565 0220 1452 0319

150-200 22 94 0940 175 3850 10600 0887 0060 1887 0113

200-250 6 100 1000 225 1350 11950 1000 - - -

Totale 100 11950 0759

27

00

01

02

03

04

05

06

07

08

09

10

00 01 02 03 04 05 06 07 08 09 10

pi

qi

Equidistribuzione Sardegna Campania

4680R~sar 2410R

~cam La concentrazione egrave piugrave

elevata in Sardegna

La curva di Lorenz conferma questo risultato

28

Riferimenti

bull C Gini (1912) Variabilitagrave e mutabilitagrave Contributo allo studio delle distribuzioni e relazioni statistiche Studi economici-giuridici dela Regia Universitagrave di Cagliari anno III

bull Lorenz M O (1905) Methods of measuring the concentration of wealth Publications of the American Statistical Association (Publications of the American Statistical Association Vol 9 No 70) 9 (70) 209ndash219

bull Per ulteriori riferimenti si possono consultare utilmente le pagine di Wikipedia relative allrsquoindice di Gini e alla curva di Lorenz

  • Appunti sulla concentrazione
  • Sommario
  • Introduzione
  • Slide 4
  • Curva di concentrazione
  • Slide 6
  • Slide 7
  • Un esempio
  • Indici di concentrazione
  • Indice di concentrazione (1)
  • Indice di concentrazione (2)
  • Slide 12
  • Indice di concentrazione (3)
  • Slide 14
  • Slide 15
  • Variabili statistiche discrete
  • Slide 17
  • Variabili statistiche continue per intervallo
  • Variabili statistiche continue
  • Slide 20
  • Confronti
  • Slide 22
  • Slide 23
  • PowerPoint Presentation
  • Slide 25
  • Slide 26
  • Slide 27
  • Slide 28
Page 25: Appunti sulla concentrazione a.a. 2012-2013 v.3. 2 Sommario Introduzione La curva di concentrazione Indici di concentrazione Confronti Riferimenti

25

Sardegna

Finanziamenti (migliaia di Euro) ni Ni pi xi xi ni Xi qi pi+1- pi qi+1+ qi (pi+1- pi)(qi+1+ qi)

0 0 0 0000 0 0 0 0000 0570 0149 0085

0-50 57 57 0570 25 1425 1425 0149 0030 0322 0010

50-100 3 60 0600 75 225 1650 0173 0070 0437 0031

100-150 7 67 0670 125 875 2525 0264 0080 0675 0054

150-200 8 75 0750 175 1400 3925 0411 0250 1411 0353

200-250 25 100 1000 225 5625 9550 1000 - - -

Totale 100 9550 0532

Concentrazione dei finanziamenti in Sardegna

26

Concentrazione dei finanziamenti in Campania

Campania

Finanziamenti (migliaia di Euro) ni Ni pi xi xi ni Xi qi pi+1- pi qi+1+ qi (pi+1- pi)(qi+1+ qi)

0 0 0 0000 0 0 0 0000 0100 0021 0002

0-50 10 10 0100 25 250 250 0021 0250 0199 0050

50-100 25 35 0350 75 1875 2125 0178 0370 0743 0275

100-150 37 72 0720 125 4625 6750 0565 0220 1452 0319

150-200 22 94 0940 175 3850 10600 0887 0060 1887 0113

200-250 6 100 1000 225 1350 11950 1000 - - -

Totale 100 11950 0759

27

00

01

02

03

04

05

06

07

08

09

10

00 01 02 03 04 05 06 07 08 09 10

pi

qi

Equidistribuzione Sardegna Campania

4680R~sar 2410R

~cam La concentrazione egrave piugrave

elevata in Sardegna

La curva di Lorenz conferma questo risultato

28

Riferimenti

bull C Gini (1912) Variabilitagrave e mutabilitagrave Contributo allo studio delle distribuzioni e relazioni statistiche Studi economici-giuridici dela Regia Universitagrave di Cagliari anno III

bull Lorenz M O (1905) Methods of measuring the concentration of wealth Publications of the American Statistical Association (Publications of the American Statistical Association Vol 9 No 70) 9 (70) 209ndash219

bull Per ulteriori riferimenti si possono consultare utilmente le pagine di Wikipedia relative allrsquoindice di Gini e alla curva di Lorenz

  • Appunti sulla concentrazione
  • Sommario
  • Introduzione
  • Slide 4
  • Curva di concentrazione
  • Slide 6
  • Slide 7
  • Un esempio
  • Indici di concentrazione
  • Indice di concentrazione (1)
  • Indice di concentrazione (2)
  • Slide 12
  • Indice di concentrazione (3)
  • Slide 14
  • Slide 15
  • Variabili statistiche discrete
  • Slide 17
  • Variabili statistiche continue per intervallo
  • Variabili statistiche continue
  • Slide 20
  • Confronti
  • Slide 22
  • Slide 23
  • PowerPoint Presentation
  • Slide 25
  • Slide 26
  • Slide 27
  • Slide 28
Page 26: Appunti sulla concentrazione a.a. 2012-2013 v.3. 2 Sommario Introduzione La curva di concentrazione Indici di concentrazione Confronti Riferimenti

26

Concentrazione dei finanziamenti in Campania

Campania

Finanziamenti (migliaia di Euro) ni Ni pi xi xi ni Xi qi pi+1- pi qi+1+ qi (pi+1- pi)(qi+1+ qi)

0 0 0 0000 0 0 0 0000 0100 0021 0002

0-50 10 10 0100 25 250 250 0021 0250 0199 0050

50-100 25 35 0350 75 1875 2125 0178 0370 0743 0275

100-150 37 72 0720 125 4625 6750 0565 0220 1452 0319

150-200 22 94 0940 175 3850 10600 0887 0060 1887 0113

200-250 6 100 1000 225 1350 11950 1000 - - -

Totale 100 11950 0759

27

00

01

02

03

04

05

06

07

08

09

10

00 01 02 03 04 05 06 07 08 09 10

pi

qi

Equidistribuzione Sardegna Campania

4680R~sar 2410R

~cam La concentrazione egrave piugrave

elevata in Sardegna

La curva di Lorenz conferma questo risultato

28

Riferimenti

bull C Gini (1912) Variabilitagrave e mutabilitagrave Contributo allo studio delle distribuzioni e relazioni statistiche Studi economici-giuridici dela Regia Universitagrave di Cagliari anno III

bull Lorenz M O (1905) Methods of measuring the concentration of wealth Publications of the American Statistical Association (Publications of the American Statistical Association Vol 9 No 70) 9 (70) 209ndash219

bull Per ulteriori riferimenti si possono consultare utilmente le pagine di Wikipedia relative allrsquoindice di Gini e alla curva di Lorenz

  • Appunti sulla concentrazione
  • Sommario
  • Introduzione
  • Slide 4
  • Curva di concentrazione
  • Slide 6
  • Slide 7
  • Un esempio
  • Indici di concentrazione
  • Indice di concentrazione (1)
  • Indice di concentrazione (2)
  • Slide 12
  • Indice di concentrazione (3)
  • Slide 14
  • Slide 15
  • Variabili statistiche discrete
  • Slide 17
  • Variabili statistiche continue per intervallo
  • Variabili statistiche continue
  • Slide 20
  • Confronti
  • Slide 22
  • Slide 23
  • PowerPoint Presentation
  • Slide 25
  • Slide 26
  • Slide 27
  • Slide 28
Page 27: Appunti sulla concentrazione a.a. 2012-2013 v.3. 2 Sommario Introduzione La curva di concentrazione Indici di concentrazione Confronti Riferimenti

27

00

01

02

03

04

05

06

07

08

09

10

00 01 02 03 04 05 06 07 08 09 10

pi

qi

Equidistribuzione Sardegna Campania

4680R~sar 2410R

~cam La concentrazione egrave piugrave

elevata in Sardegna

La curva di Lorenz conferma questo risultato

28

Riferimenti

bull C Gini (1912) Variabilitagrave e mutabilitagrave Contributo allo studio delle distribuzioni e relazioni statistiche Studi economici-giuridici dela Regia Universitagrave di Cagliari anno III

bull Lorenz M O (1905) Methods of measuring the concentration of wealth Publications of the American Statistical Association (Publications of the American Statistical Association Vol 9 No 70) 9 (70) 209ndash219

bull Per ulteriori riferimenti si possono consultare utilmente le pagine di Wikipedia relative allrsquoindice di Gini e alla curva di Lorenz

  • Appunti sulla concentrazione
  • Sommario
  • Introduzione
  • Slide 4
  • Curva di concentrazione
  • Slide 6
  • Slide 7
  • Un esempio
  • Indici di concentrazione
  • Indice di concentrazione (1)
  • Indice di concentrazione (2)
  • Slide 12
  • Indice di concentrazione (3)
  • Slide 14
  • Slide 15
  • Variabili statistiche discrete
  • Slide 17
  • Variabili statistiche continue per intervallo
  • Variabili statistiche continue
  • Slide 20
  • Confronti
  • Slide 22
  • Slide 23
  • PowerPoint Presentation
  • Slide 25
  • Slide 26
  • Slide 27
  • Slide 28
Page 28: Appunti sulla concentrazione a.a. 2012-2013 v.3. 2 Sommario Introduzione La curva di concentrazione Indici di concentrazione Confronti Riferimenti

28

Riferimenti

bull C Gini (1912) Variabilitagrave e mutabilitagrave Contributo allo studio delle distribuzioni e relazioni statistiche Studi economici-giuridici dela Regia Universitagrave di Cagliari anno III

bull Lorenz M O (1905) Methods of measuring the concentration of wealth Publications of the American Statistical Association (Publications of the American Statistical Association Vol 9 No 70) 9 (70) 209ndash219

bull Per ulteriori riferimenti si possono consultare utilmente le pagine di Wikipedia relative allrsquoindice di Gini e alla curva di Lorenz

  • Appunti sulla concentrazione
  • Sommario
  • Introduzione
  • Slide 4
  • Curva di concentrazione
  • Slide 6
  • Slide 7
  • Un esempio
  • Indici di concentrazione
  • Indice di concentrazione (1)
  • Indice di concentrazione (2)
  • Slide 12
  • Indice di concentrazione (3)
  • Slide 14
  • Slide 15
  • Variabili statistiche discrete
  • Slide 17
  • Variabili statistiche continue per intervallo
  • Variabili statistiche continue
  • Slide 20
  • Confronti
  • Slide 22
  • Slide 23
  • PowerPoint Presentation
  • Slide 25
  • Slide 26
  • Slide 27
  • Slide 28