Upload
fortunata-buono
View
220
Download
0
Embed Size (px)
Citation preview
Appunti sulla concentrazione
aa 2012-2013aa 2012-2013
v3v3
2
Sommariobull Introduzionebull La curva di concentrazionebull Indici di concentrazionebull Confrontibull Riferimenti
3
Introduzione
La concentrazione puograve essere studiata per caratteri trasferibili ovvero caratteri quantitativi che almeno in linea di principio
possono essere trasferiti tra le unitagrave considerate
Es il reddito egrave un carattere trasferibile (tra gli individui) come lo sono il patrimonio il numero di azioni di una certa azienda (tra gli azionisti) e i finanziamenti ricevuti dalle regioni italiane (tra le regioni stesse)
Es lrsquoetagrave non egrave un carattere trasferibile (tra gli individui) e non lo egrave neppure lrsquointensitagrave delle precipitazioni (tra le localitagrave considerate)
4
IntroduzioneIntuitivamente un carattere statistico (si pensi ad esempio al reddito) egrave tanto piugrave concentrato quanto piugrave risulta suddiviso tra poche unitagrave della popolazione
Ogni situazione reale saragrave intermedia tra due situazioni estreme che chiameremo di concentrazione massima e di equiripartizione Si ha massima concentrazione quando una sola unitagrave statistica possiede la totalitagrave del carattere Si parla invece di equiripartizione quando tutte le unitagrave della popolazione possiedono la stessa quantitagrave di carattere
5
Curva di concentrazione
Consideriamo un carattere quantitativo trasferibile ordiniamo le quantitagrave del carattere (intensitagrave) possedute dalle unitagrave statistiche in senso non decrescente e definiamoNxxx 0 21
6
Curva di concentrazione
La curva di Lorenz (o curva di concentrazione) si ottiene rappresentando
le coppie (Fi Qi) nello spazio cartesiano e congiungendole
Il generico punto (Fi Qi) della curva si puograve interpretare nel seguente
modo lrsquo (Fi 100) piugrave povero di carattere possiede il (Qi 100) del carattere totale
Valgono le seguenti
1) (FNQN)=(11)
2) Qi le Fi per ogni i
La 2) segue dal fatto che
7
Curva di concentrazione
La curva di concentrazione egrave sempre compresa potendo eventualmente coincidere tra le due seguenti
1La bisettrice di equazione Q=F Lungo la bisettrice Fi=Qi per ogni i da cui segue che ogni unitagrave possiede una quantitagrave di carattere pari alla media dello stesso nella popolazione La bisettrice rappresenta quindi la situazione di equiripartizione
2 La curva passante per i punti (Fi0) i=1hellipN-1 e (11) In tal caso tutto il carattere egrave concentrato in una sola unitagrave statistica (lrsquoN-esima) e rappresenta quindi la situazione di massima concentrazione
Un esempio
8
80 90 21 23 32 16 62Dati i redditi di 7 individui
per ricavare la curva di concentrazione organizziamo le osservazioni in tabella (avendo cura di ordinarle in base ai valori di x ad esempio X1=16 percheacute lrsquoindividuo piugrave povero possiede 16) calcoliamo le coordinate dei punti (FiQi) e le congiungiamo Nel caso in esame la curva egrave piugrave vicina alla bisettrice
i x_i F_i Q_i
0 0 0
1 16 01429 00494
2 21 02857 01142
3 23 04286 01852
4 32 05714 02840
5 62 07143 04753
6 80 08571 07222
7 90 1 1
9
Indici di concentrazione
La curva di Lorenz-Gini egrave uno strumento grafico per rappresentare la concentrazione di un carattere Puograve tuttavia essere comodo valutare la concentrazione attraverso un indice numerico
Intuitivamente quanto piugrave la bisettrice si discosta dalla curva di concentrazione tanto maggiore egrave la concentrazione del carattere Ersquo naturale quindi costruire un indice di concentrazione basato sullo ldquoscostamentordquo della curva dalla bisettrice Una misura dello scostamento puograve essere basata
bullsulle distanze verticali tra la curva di concentrazione e la bisettricebullsullrsquoarea compresa tra la curva di concentrazione e la bisettrice
10
Indice di concentrazione (1) Le distanze verticali tra la curva di concentrazione e la bisettrice sono date da (Fi ndash Qi)
e sono non negative Un indice relativo di concentrazione si puograve ottenere dividendo la somma delle (Fi ndash Qi) per il valore massimo che tali differenze possono assumere
Lrsquoindice sopra egrave lrsquoindice di concentrazione di Gini Si ha 0 le R le 1 e in particolare
R = 0 nel caso di equiripartizione infatti in tal caso Fi - Qi =0 i=12hellipN-1
R = 1 nel caso di massima concentrazione infatti in tal caso Fi - Qi = Fi i=12hellipN-1
11
0
01
02
03
04
05
06
07
08
09
1
0 02 04 06 08 1
qi
pi
Indice di concentrazione (2)
Lrsquoarea A in figura compresa tra la curva di concentrazione e la retta di equidistribuzione prende il nome di area di concentrazione Si noti che A egrave pari allrsquoarea del triangolo di coordinate (00) (10) (11) meno lrsquoarea B formata dai trapezi di altezza Fi-Fi-1 e basi Qi e Qi-1
Area del trapezio
frac12 x Somma delle basi x altezza
A B
12
Un indice relativo di concentrazione si puograve ottenere dividendo lrsquoarea di concentrazione per il valore massimo che lrsquoarea puograve assumere
dove Amax si ottiene considerando lrsquoarea nel caso x1 =hellip= xN-1 =0 xN=Nμ e risulta pari a 12 ndash (1N)(1)(12)=(N-1)2N
Per costruzione egrave 0 le R le 1 in particolarebullR=0 nel caso di equiripartizionebullR=1 nel caso di massima concentrazione
Si puograve dimostrare che il rapporto cosigrave costruito egrave uguale ad R
Indice di concentrazione (2)
13
Un altro indice di concentrazione sempre basato sullrsquoarea si puograve ottenere osservando che questrsquoultima non puograve superare il valore 12 Possiamo quindi rapportare lrsquoarea di concentrazione al suo valore massimo teorico
Si ha (percheacute) con i due indici che tendono a coincidere per N grande
Indice di concentrazione (3)
14
80 90 21 23 32 16 62
Un esempio
i x_i F_i Q_i (Fi-Qi)
1 16 01429 00494 00935
2 21 02857 01142 01715
3 23 04286 01852 02434
4 32 05714 02840 02875
5 62 07143 04753 02390
6 80 08571 07222 01349
7 90 1 1
Totale
324 3 11698
Dati i redditi di 7 individui
per ricavare la curva di concentrazione organizziamo le osservazioni in tabella avendo cura di ordinarle in base ai valori di x (ad esempio X1=16 percheacute lrsquoindividuo piugrave povero possiede 16) e calcoliamo le differenze (Fi-Qi)
15
80 90 21 23 32 16 62
Per calcolare R con la formula (2) usiamo una tabella simile alla precedente per ricavare il numeratore Lrsquoarea massima che compare a denominatore egrave pari allrsquoarea massima teorica meno lrsquoarea del triangolo di base F7-F6 e altezza 1 Il calcolo di Ř egrave del tutto analogo egrave sufficiente porre lrsquoarea massima pari a frac12
Data i redditi di 7 individui
Un esempio
i x_i F_i Q_i (Fi-Fi-1)(Qi+Qi-1)
1 16 01429 00494 00070
2 21 02857 01142 00233
3 23 04286 01852 00427
4 32 05714 02840 00670
5 62 07143 04753 01085
6 80 08571 07222 01710
7 90 1 1 02461
Totale
06658
16
Variabili statistiche discrete
Finora abbiamo considerato N osservazioni non raggruppate Per ricavare lrsquoindice o la curva di concentrazione a partire da una distribuzione di frequenze assolute possiamo usare le seguenti versioni ldquoponderaterdquo di Fi e Qi
dove x1hellipxk sono k valori distinti ordinati in modo non decrescente con numerositagrave n1 hellipnk
17
Variabili statistiche discrete
1
1
1
1
)(
k
ii
k
iii
F
QFR
Con le coppie (Fi Qi) si puograve ottenere un indice analogo ad R
In generale RneR sugli stessi dati Infatti con lrsquoindice sopra la situazione di massima concentrazione si ha quando tutto il carattere appartiene alla k-esima classe (e non allrsquo N-esimo individuo come nel caso di R)
Unendo le coppie (Fi Qi
) si ottiene la stessa curva di concentrazione che si otterrebbe utilizzando con i dati unitari Infatti si puograve dimostrare che la pendenza della curva non cambia passando tra individui che hanno lo stesso ammontare di carattere Lrsquounica differenza egrave che ora per ottenere la spezzata si devono congiungere kltN punti
18
Nel caso in cui si disponga dellrsquoinformazione sullrsquoammontare totale di carattere in un intervallo egrave consigliabile discretizzare gli intervalli in modo ldquocoerenterdquo con tale informazione
Esempio se nellrsquointervallo [515) di numerositagrave Ni=10 il carattere totale egrave pari a 60 egrave preferibile discretizzare lrsquointervallo assumendo come punto ldquomediordquo il valore 6 e non il valore 10 (al quale corrisponderebbe un reddito totale di 100 e non di 60) Si noti che devono essere note le numerositagrave degli intervalli per poter procedere in questo modo
Nel caso in cui si disponga dellrsquoinformazione sullrsquoammontare totale di carattere in un intervallo egrave consigliabile discretizzare gli intervalli in modo ldquocoerenterdquo con tale informazione
Esempio se nellrsquointervallo [515) di numerositagrave Ni=10 il carattere totale egrave pari a 60 egrave preferibile discretizzare lrsquointervallo assumendo come punto ldquomediordquo il valore 6 e non il valore 10 (al quale corrisponderebbe un reddito totale di 100 e non di 60) Si noti che devono essere note le numerositagrave degli intervalli per poter procedere in questo modo
Se si desidera ricavare lrsquoindice o la curva di concentrazione per una variabile continua per intervallo il modo piugrave semplice di procedere consiste nel ldquodiscretizzarerdquo la variabile considerando le frequenze ldquoconcentraterdquo nei punti medi degli intervalli Si puograve poi procedere come nel caso precedente
Se si desidera ricavare lrsquoindice o la curva di concentrazione per una variabile continua per intervallo il modo piugrave semplice di procedere consiste nel ldquodiscretizzarerdquo la variabile considerando le frequenze ldquoconcentraterdquo nei punti medi degli intervalli Si puograve poi procedere come nel caso precedente
Variabili statistiche continue per intervallo
19
Se X egrave una variabile statistica continua non negativa con densitagrave f(x) e media finita μ le espressioni delle frequenze e delle intensitagrave cumulate diventano
Se X egrave una variabile statistica continua non negativa con densitagrave f(x) e media finita μ le espressioni delle frequenze e delle intensitagrave cumulate diventano
Variabili statistiche continue
Nota Talvolta si esprimono F e Q in funzione della frequenza cumulata r In tal caso si ha x = F-1( r ) da cui le nuove variabili
20
Il valore di R per un carattere con distribuzione continua si puograve ottenere come nel caso discreto rapportando lrsquoarea di concentrazione al suo valore massimo pari ad 12
Il valore di R per un carattere con distribuzione continua si puograve ottenere come nel caso discreto rapportando lrsquoarea di concentrazione al suo valore massimo pari ad 12
Variabili statistiche continue
Lrsquoindice di Gini egrave quindi pari a due volte lrsquoarea di concentrazione
Nota essendo Amax =12 si ha R=Ř
ConfrontiPuograve essere interessante confrontare la concentrazione di due caratteri
(o equivalentemente dello stesso carattere in due istanti diversi o in due ambiti territoriali diversi)
Esempio 1 il reddito risulta piugrave concentrato in Italia o in Francia
Esempio 2 la concentrazione del reddito in Italia era maggiore negli anni lsquo80 o negli anni lsquo90
Un modo semplice per stabilire quale carattere egrave maggiormente concentrato egrave quello di confrontare graficamente le curve di concentrazione nei due ambiti territoriali (o temporali) e stabilire quale si trova al di sopra
21
bull Non egrave detto che una delle due curve sia al di sopra dellrsquoaltra le curve si possono intersecare Si puograve tuttavia mostrare che se il carattere varia linearmente tra gli ambiti considerati allora le curve non si intersecano
bull In generale si puograve effettuare il confronto usando lrsquoindice di Gini
bull Poicheacute G=2A=1-2Area_sotto_la_curva_Lorenz il confronto attraverso lrsquoindici di Gini equivale al confronto tra le aree al di sotto delle curve di Lorenz dei due caratteri
Confronti
Confronti
Esempio la concentrazione del reddito nel mondo usando lrsquoindice R
23
Fonte CIA The world Factbook 2009
24
Esempio di Confronto Tra DistribuzioniSi riportano di seguito le distribuzioni dei finanziamenti concessi da un istituto bancario per lrsquoacquisto della prima casa a giovani coppie residenti in Campania ed in Sardegna
a) In quale regione risulta piugrave elevata la concentrazione dei finanziamenti concessi
b) Confrontare graficamente i diversi livelli di concentrazione dei finanziamenti nelle due regioni
Campania
Finanziamenti (migliaia di Euro) ni
0-50 10
50-100 25
100-150 37
150-200 22
200-250 6
Totale 100
Sardegna
Finanziamenti (migliaia di Euro) ni
0-50 57
50-100 3
100-150 7
150-200 8
200-250 25
Totale 100
25
Sardegna
Finanziamenti (migliaia di Euro) ni Ni pi xi xi ni Xi qi pi+1- pi qi+1+ qi (pi+1- pi)(qi+1+ qi)
0 0 0 0000 0 0 0 0000 0570 0149 0085
0-50 57 57 0570 25 1425 1425 0149 0030 0322 0010
50-100 3 60 0600 75 225 1650 0173 0070 0437 0031
100-150 7 67 0670 125 875 2525 0264 0080 0675 0054
150-200 8 75 0750 175 1400 3925 0411 0250 1411 0353
200-250 25 100 1000 225 5625 9550 1000 - - -
Totale 100 9550 0532
Concentrazione dei finanziamenti in Sardegna
26
Concentrazione dei finanziamenti in Campania
Campania
Finanziamenti (migliaia di Euro) ni Ni pi xi xi ni Xi qi pi+1- pi qi+1+ qi (pi+1- pi)(qi+1+ qi)
0 0 0 0000 0 0 0 0000 0100 0021 0002
0-50 10 10 0100 25 250 250 0021 0250 0199 0050
50-100 25 35 0350 75 1875 2125 0178 0370 0743 0275
100-150 37 72 0720 125 4625 6750 0565 0220 1452 0319
150-200 22 94 0940 175 3850 10600 0887 0060 1887 0113
200-250 6 100 1000 225 1350 11950 1000 - - -
Totale 100 11950 0759
27
00
01
02
03
04
05
06
07
08
09
10
00 01 02 03 04 05 06 07 08 09 10
pi
qi
Equidistribuzione Sardegna Campania
4680R~sar 2410R
~cam La concentrazione egrave piugrave
elevata in Sardegna
La curva di Lorenz conferma questo risultato
28
Riferimenti
bull C Gini (1912) Variabilitagrave e mutabilitagrave Contributo allo studio delle distribuzioni e relazioni statistiche Studi economici-giuridici dela Regia Universitagrave di Cagliari anno III
bull Lorenz M O (1905) Methods of measuring the concentration of wealth Publications of the American Statistical Association (Publications of the American Statistical Association Vol 9 No 70) 9 (70) 209ndash219
bull Per ulteriori riferimenti si possono consultare utilmente le pagine di Wikipedia relative allrsquoindice di Gini e alla curva di Lorenz
2
Sommariobull Introduzionebull La curva di concentrazionebull Indici di concentrazionebull Confrontibull Riferimenti
3
Introduzione
La concentrazione puograve essere studiata per caratteri trasferibili ovvero caratteri quantitativi che almeno in linea di principio
possono essere trasferiti tra le unitagrave considerate
Es il reddito egrave un carattere trasferibile (tra gli individui) come lo sono il patrimonio il numero di azioni di una certa azienda (tra gli azionisti) e i finanziamenti ricevuti dalle regioni italiane (tra le regioni stesse)
Es lrsquoetagrave non egrave un carattere trasferibile (tra gli individui) e non lo egrave neppure lrsquointensitagrave delle precipitazioni (tra le localitagrave considerate)
4
IntroduzioneIntuitivamente un carattere statistico (si pensi ad esempio al reddito) egrave tanto piugrave concentrato quanto piugrave risulta suddiviso tra poche unitagrave della popolazione
Ogni situazione reale saragrave intermedia tra due situazioni estreme che chiameremo di concentrazione massima e di equiripartizione Si ha massima concentrazione quando una sola unitagrave statistica possiede la totalitagrave del carattere Si parla invece di equiripartizione quando tutte le unitagrave della popolazione possiedono la stessa quantitagrave di carattere
5
Curva di concentrazione
Consideriamo un carattere quantitativo trasferibile ordiniamo le quantitagrave del carattere (intensitagrave) possedute dalle unitagrave statistiche in senso non decrescente e definiamoNxxx 0 21
6
Curva di concentrazione
La curva di Lorenz (o curva di concentrazione) si ottiene rappresentando
le coppie (Fi Qi) nello spazio cartesiano e congiungendole
Il generico punto (Fi Qi) della curva si puograve interpretare nel seguente
modo lrsquo (Fi 100) piugrave povero di carattere possiede il (Qi 100) del carattere totale
Valgono le seguenti
1) (FNQN)=(11)
2) Qi le Fi per ogni i
La 2) segue dal fatto che
7
Curva di concentrazione
La curva di concentrazione egrave sempre compresa potendo eventualmente coincidere tra le due seguenti
1La bisettrice di equazione Q=F Lungo la bisettrice Fi=Qi per ogni i da cui segue che ogni unitagrave possiede una quantitagrave di carattere pari alla media dello stesso nella popolazione La bisettrice rappresenta quindi la situazione di equiripartizione
2 La curva passante per i punti (Fi0) i=1hellipN-1 e (11) In tal caso tutto il carattere egrave concentrato in una sola unitagrave statistica (lrsquoN-esima) e rappresenta quindi la situazione di massima concentrazione
Un esempio
8
80 90 21 23 32 16 62Dati i redditi di 7 individui
per ricavare la curva di concentrazione organizziamo le osservazioni in tabella (avendo cura di ordinarle in base ai valori di x ad esempio X1=16 percheacute lrsquoindividuo piugrave povero possiede 16) calcoliamo le coordinate dei punti (FiQi) e le congiungiamo Nel caso in esame la curva egrave piugrave vicina alla bisettrice
i x_i F_i Q_i
0 0 0
1 16 01429 00494
2 21 02857 01142
3 23 04286 01852
4 32 05714 02840
5 62 07143 04753
6 80 08571 07222
7 90 1 1
9
Indici di concentrazione
La curva di Lorenz-Gini egrave uno strumento grafico per rappresentare la concentrazione di un carattere Puograve tuttavia essere comodo valutare la concentrazione attraverso un indice numerico
Intuitivamente quanto piugrave la bisettrice si discosta dalla curva di concentrazione tanto maggiore egrave la concentrazione del carattere Ersquo naturale quindi costruire un indice di concentrazione basato sullo ldquoscostamentordquo della curva dalla bisettrice Una misura dello scostamento puograve essere basata
bullsulle distanze verticali tra la curva di concentrazione e la bisettricebullsullrsquoarea compresa tra la curva di concentrazione e la bisettrice
10
Indice di concentrazione (1) Le distanze verticali tra la curva di concentrazione e la bisettrice sono date da (Fi ndash Qi)
e sono non negative Un indice relativo di concentrazione si puograve ottenere dividendo la somma delle (Fi ndash Qi) per il valore massimo che tali differenze possono assumere
Lrsquoindice sopra egrave lrsquoindice di concentrazione di Gini Si ha 0 le R le 1 e in particolare
R = 0 nel caso di equiripartizione infatti in tal caso Fi - Qi =0 i=12hellipN-1
R = 1 nel caso di massima concentrazione infatti in tal caso Fi - Qi = Fi i=12hellipN-1
11
0
01
02
03
04
05
06
07
08
09
1
0 02 04 06 08 1
qi
pi
Indice di concentrazione (2)
Lrsquoarea A in figura compresa tra la curva di concentrazione e la retta di equidistribuzione prende il nome di area di concentrazione Si noti che A egrave pari allrsquoarea del triangolo di coordinate (00) (10) (11) meno lrsquoarea B formata dai trapezi di altezza Fi-Fi-1 e basi Qi e Qi-1
Area del trapezio
frac12 x Somma delle basi x altezza
A B
12
Un indice relativo di concentrazione si puograve ottenere dividendo lrsquoarea di concentrazione per il valore massimo che lrsquoarea puograve assumere
dove Amax si ottiene considerando lrsquoarea nel caso x1 =hellip= xN-1 =0 xN=Nμ e risulta pari a 12 ndash (1N)(1)(12)=(N-1)2N
Per costruzione egrave 0 le R le 1 in particolarebullR=0 nel caso di equiripartizionebullR=1 nel caso di massima concentrazione
Si puograve dimostrare che il rapporto cosigrave costruito egrave uguale ad R
Indice di concentrazione (2)
13
Un altro indice di concentrazione sempre basato sullrsquoarea si puograve ottenere osservando che questrsquoultima non puograve superare il valore 12 Possiamo quindi rapportare lrsquoarea di concentrazione al suo valore massimo teorico
Si ha (percheacute) con i due indici che tendono a coincidere per N grande
Indice di concentrazione (3)
14
80 90 21 23 32 16 62
Un esempio
i x_i F_i Q_i (Fi-Qi)
1 16 01429 00494 00935
2 21 02857 01142 01715
3 23 04286 01852 02434
4 32 05714 02840 02875
5 62 07143 04753 02390
6 80 08571 07222 01349
7 90 1 1
Totale
324 3 11698
Dati i redditi di 7 individui
per ricavare la curva di concentrazione organizziamo le osservazioni in tabella avendo cura di ordinarle in base ai valori di x (ad esempio X1=16 percheacute lrsquoindividuo piugrave povero possiede 16) e calcoliamo le differenze (Fi-Qi)
15
80 90 21 23 32 16 62
Per calcolare R con la formula (2) usiamo una tabella simile alla precedente per ricavare il numeratore Lrsquoarea massima che compare a denominatore egrave pari allrsquoarea massima teorica meno lrsquoarea del triangolo di base F7-F6 e altezza 1 Il calcolo di Ř egrave del tutto analogo egrave sufficiente porre lrsquoarea massima pari a frac12
Data i redditi di 7 individui
Un esempio
i x_i F_i Q_i (Fi-Fi-1)(Qi+Qi-1)
1 16 01429 00494 00070
2 21 02857 01142 00233
3 23 04286 01852 00427
4 32 05714 02840 00670
5 62 07143 04753 01085
6 80 08571 07222 01710
7 90 1 1 02461
Totale
06658
16
Variabili statistiche discrete
Finora abbiamo considerato N osservazioni non raggruppate Per ricavare lrsquoindice o la curva di concentrazione a partire da una distribuzione di frequenze assolute possiamo usare le seguenti versioni ldquoponderaterdquo di Fi e Qi
dove x1hellipxk sono k valori distinti ordinati in modo non decrescente con numerositagrave n1 hellipnk
17
Variabili statistiche discrete
1
1
1
1
)(
k
ii
k
iii
F
QFR
Con le coppie (Fi Qi) si puograve ottenere un indice analogo ad R
In generale RneR sugli stessi dati Infatti con lrsquoindice sopra la situazione di massima concentrazione si ha quando tutto il carattere appartiene alla k-esima classe (e non allrsquo N-esimo individuo come nel caso di R)
Unendo le coppie (Fi Qi
) si ottiene la stessa curva di concentrazione che si otterrebbe utilizzando con i dati unitari Infatti si puograve dimostrare che la pendenza della curva non cambia passando tra individui che hanno lo stesso ammontare di carattere Lrsquounica differenza egrave che ora per ottenere la spezzata si devono congiungere kltN punti
18
Nel caso in cui si disponga dellrsquoinformazione sullrsquoammontare totale di carattere in un intervallo egrave consigliabile discretizzare gli intervalli in modo ldquocoerenterdquo con tale informazione
Esempio se nellrsquointervallo [515) di numerositagrave Ni=10 il carattere totale egrave pari a 60 egrave preferibile discretizzare lrsquointervallo assumendo come punto ldquomediordquo il valore 6 e non il valore 10 (al quale corrisponderebbe un reddito totale di 100 e non di 60) Si noti che devono essere note le numerositagrave degli intervalli per poter procedere in questo modo
Nel caso in cui si disponga dellrsquoinformazione sullrsquoammontare totale di carattere in un intervallo egrave consigliabile discretizzare gli intervalli in modo ldquocoerenterdquo con tale informazione
Esempio se nellrsquointervallo [515) di numerositagrave Ni=10 il carattere totale egrave pari a 60 egrave preferibile discretizzare lrsquointervallo assumendo come punto ldquomediordquo il valore 6 e non il valore 10 (al quale corrisponderebbe un reddito totale di 100 e non di 60) Si noti che devono essere note le numerositagrave degli intervalli per poter procedere in questo modo
Se si desidera ricavare lrsquoindice o la curva di concentrazione per una variabile continua per intervallo il modo piugrave semplice di procedere consiste nel ldquodiscretizzarerdquo la variabile considerando le frequenze ldquoconcentraterdquo nei punti medi degli intervalli Si puograve poi procedere come nel caso precedente
Se si desidera ricavare lrsquoindice o la curva di concentrazione per una variabile continua per intervallo il modo piugrave semplice di procedere consiste nel ldquodiscretizzarerdquo la variabile considerando le frequenze ldquoconcentraterdquo nei punti medi degli intervalli Si puograve poi procedere come nel caso precedente
Variabili statistiche continue per intervallo
19
Se X egrave una variabile statistica continua non negativa con densitagrave f(x) e media finita μ le espressioni delle frequenze e delle intensitagrave cumulate diventano
Se X egrave una variabile statistica continua non negativa con densitagrave f(x) e media finita μ le espressioni delle frequenze e delle intensitagrave cumulate diventano
Variabili statistiche continue
Nota Talvolta si esprimono F e Q in funzione della frequenza cumulata r In tal caso si ha x = F-1( r ) da cui le nuove variabili
20
Il valore di R per un carattere con distribuzione continua si puograve ottenere come nel caso discreto rapportando lrsquoarea di concentrazione al suo valore massimo pari ad 12
Il valore di R per un carattere con distribuzione continua si puograve ottenere come nel caso discreto rapportando lrsquoarea di concentrazione al suo valore massimo pari ad 12
Variabili statistiche continue
Lrsquoindice di Gini egrave quindi pari a due volte lrsquoarea di concentrazione
Nota essendo Amax =12 si ha R=Ř
ConfrontiPuograve essere interessante confrontare la concentrazione di due caratteri
(o equivalentemente dello stesso carattere in due istanti diversi o in due ambiti territoriali diversi)
Esempio 1 il reddito risulta piugrave concentrato in Italia o in Francia
Esempio 2 la concentrazione del reddito in Italia era maggiore negli anni lsquo80 o negli anni lsquo90
Un modo semplice per stabilire quale carattere egrave maggiormente concentrato egrave quello di confrontare graficamente le curve di concentrazione nei due ambiti territoriali (o temporali) e stabilire quale si trova al di sopra
21
bull Non egrave detto che una delle due curve sia al di sopra dellrsquoaltra le curve si possono intersecare Si puograve tuttavia mostrare che se il carattere varia linearmente tra gli ambiti considerati allora le curve non si intersecano
bull In generale si puograve effettuare il confronto usando lrsquoindice di Gini
bull Poicheacute G=2A=1-2Area_sotto_la_curva_Lorenz il confronto attraverso lrsquoindici di Gini equivale al confronto tra le aree al di sotto delle curve di Lorenz dei due caratteri
Confronti
Confronti
Esempio la concentrazione del reddito nel mondo usando lrsquoindice R
23
Fonte CIA The world Factbook 2009
24
Esempio di Confronto Tra DistribuzioniSi riportano di seguito le distribuzioni dei finanziamenti concessi da un istituto bancario per lrsquoacquisto della prima casa a giovani coppie residenti in Campania ed in Sardegna
a) In quale regione risulta piugrave elevata la concentrazione dei finanziamenti concessi
b) Confrontare graficamente i diversi livelli di concentrazione dei finanziamenti nelle due regioni
Campania
Finanziamenti (migliaia di Euro) ni
0-50 10
50-100 25
100-150 37
150-200 22
200-250 6
Totale 100
Sardegna
Finanziamenti (migliaia di Euro) ni
0-50 57
50-100 3
100-150 7
150-200 8
200-250 25
Totale 100
25
Sardegna
Finanziamenti (migliaia di Euro) ni Ni pi xi xi ni Xi qi pi+1- pi qi+1+ qi (pi+1- pi)(qi+1+ qi)
0 0 0 0000 0 0 0 0000 0570 0149 0085
0-50 57 57 0570 25 1425 1425 0149 0030 0322 0010
50-100 3 60 0600 75 225 1650 0173 0070 0437 0031
100-150 7 67 0670 125 875 2525 0264 0080 0675 0054
150-200 8 75 0750 175 1400 3925 0411 0250 1411 0353
200-250 25 100 1000 225 5625 9550 1000 - - -
Totale 100 9550 0532
Concentrazione dei finanziamenti in Sardegna
26
Concentrazione dei finanziamenti in Campania
Campania
Finanziamenti (migliaia di Euro) ni Ni pi xi xi ni Xi qi pi+1- pi qi+1+ qi (pi+1- pi)(qi+1+ qi)
0 0 0 0000 0 0 0 0000 0100 0021 0002
0-50 10 10 0100 25 250 250 0021 0250 0199 0050
50-100 25 35 0350 75 1875 2125 0178 0370 0743 0275
100-150 37 72 0720 125 4625 6750 0565 0220 1452 0319
150-200 22 94 0940 175 3850 10600 0887 0060 1887 0113
200-250 6 100 1000 225 1350 11950 1000 - - -
Totale 100 11950 0759
27
00
01
02
03
04
05
06
07
08
09
10
00 01 02 03 04 05 06 07 08 09 10
pi
qi
Equidistribuzione Sardegna Campania
4680R~sar 2410R
~cam La concentrazione egrave piugrave
elevata in Sardegna
La curva di Lorenz conferma questo risultato
28
Riferimenti
bull C Gini (1912) Variabilitagrave e mutabilitagrave Contributo allo studio delle distribuzioni e relazioni statistiche Studi economici-giuridici dela Regia Universitagrave di Cagliari anno III
bull Lorenz M O (1905) Methods of measuring the concentration of wealth Publications of the American Statistical Association (Publications of the American Statistical Association Vol 9 No 70) 9 (70) 209ndash219
bull Per ulteriori riferimenti si possono consultare utilmente le pagine di Wikipedia relative allrsquoindice di Gini e alla curva di Lorenz
3
Introduzione
La concentrazione puograve essere studiata per caratteri trasferibili ovvero caratteri quantitativi che almeno in linea di principio
possono essere trasferiti tra le unitagrave considerate
Es il reddito egrave un carattere trasferibile (tra gli individui) come lo sono il patrimonio il numero di azioni di una certa azienda (tra gli azionisti) e i finanziamenti ricevuti dalle regioni italiane (tra le regioni stesse)
Es lrsquoetagrave non egrave un carattere trasferibile (tra gli individui) e non lo egrave neppure lrsquointensitagrave delle precipitazioni (tra le localitagrave considerate)
4
IntroduzioneIntuitivamente un carattere statistico (si pensi ad esempio al reddito) egrave tanto piugrave concentrato quanto piugrave risulta suddiviso tra poche unitagrave della popolazione
Ogni situazione reale saragrave intermedia tra due situazioni estreme che chiameremo di concentrazione massima e di equiripartizione Si ha massima concentrazione quando una sola unitagrave statistica possiede la totalitagrave del carattere Si parla invece di equiripartizione quando tutte le unitagrave della popolazione possiedono la stessa quantitagrave di carattere
5
Curva di concentrazione
Consideriamo un carattere quantitativo trasferibile ordiniamo le quantitagrave del carattere (intensitagrave) possedute dalle unitagrave statistiche in senso non decrescente e definiamoNxxx 0 21
6
Curva di concentrazione
La curva di Lorenz (o curva di concentrazione) si ottiene rappresentando
le coppie (Fi Qi) nello spazio cartesiano e congiungendole
Il generico punto (Fi Qi) della curva si puograve interpretare nel seguente
modo lrsquo (Fi 100) piugrave povero di carattere possiede il (Qi 100) del carattere totale
Valgono le seguenti
1) (FNQN)=(11)
2) Qi le Fi per ogni i
La 2) segue dal fatto che
7
Curva di concentrazione
La curva di concentrazione egrave sempre compresa potendo eventualmente coincidere tra le due seguenti
1La bisettrice di equazione Q=F Lungo la bisettrice Fi=Qi per ogni i da cui segue che ogni unitagrave possiede una quantitagrave di carattere pari alla media dello stesso nella popolazione La bisettrice rappresenta quindi la situazione di equiripartizione
2 La curva passante per i punti (Fi0) i=1hellipN-1 e (11) In tal caso tutto il carattere egrave concentrato in una sola unitagrave statistica (lrsquoN-esima) e rappresenta quindi la situazione di massima concentrazione
Un esempio
8
80 90 21 23 32 16 62Dati i redditi di 7 individui
per ricavare la curva di concentrazione organizziamo le osservazioni in tabella (avendo cura di ordinarle in base ai valori di x ad esempio X1=16 percheacute lrsquoindividuo piugrave povero possiede 16) calcoliamo le coordinate dei punti (FiQi) e le congiungiamo Nel caso in esame la curva egrave piugrave vicina alla bisettrice
i x_i F_i Q_i
0 0 0
1 16 01429 00494
2 21 02857 01142
3 23 04286 01852
4 32 05714 02840
5 62 07143 04753
6 80 08571 07222
7 90 1 1
9
Indici di concentrazione
La curva di Lorenz-Gini egrave uno strumento grafico per rappresentare la concentrazione di un carattere Puograve tuttavia essere comodo valutare la concentrazione attraverso un indice numerico
Intuitivamente quanto piugrave la bisettrice si discosta dalla curva di concentrazione tanto maggiore egrave la concentrazione del carattere Ersquo naturale quindi costruire un indice di concentrazione basato sullo ldquoscostamentordquo della curva dalla bisettrice Una misura dello scostamento puograve essere basata
bullsulle distanze verticali tra la curva di concentrazione e la bisettricebullsullrsquoarea compresa tra la curva di concentrazione e la bisettrice
10
Indice di concentrazione (1) Le distanze verticali tra la curva di concentrazione e la bisettrice sono date da (Fi ndash Qi)
e sono non negative Un indice relativo di concentrazione si puograve ottenere dividendo la somma delle (Fi ndash Qi) per il valore massimo che tali differenze possono assumere
Lrsquoindice sopra egrave lrsquoindice di concentrazione di Gini Si ha 0 le R le 1 e in particolare
R = 0 nel caso di equiripartizione infatti in tal caso Fi - Qi =0 i=12hellipN-1
R = 1 nel caso di massima concentrazione infatti in tal caso Fi - Qi = Fi i=12hellipN-1
11
0
01
02
03
04
05
06
07
08
09
1
0 02 04 06 08 1
qi
pi
Indice di concentrazione (2)
Lrsquoarea A in figura compresa tra la curva di concentrazione e la retta di equidistribuzione prende il nome di area di concentrazione Si noti che A egrave pari allrsquoarea del triangolo di coordinate (00) (10) (11) meno lrsquoarea B formata dai trapezi di altezza Fi-Fi-1 e basi Qi e Qi-1
Area del trapezio
frac12 x Somma delle basi x altezza
A B
12
Un indice relativo di concentrazione si puograve ottenere dividendo lrsquoarea di concentrazione per il valore massimo che lrsquoarea puograve assumere
dove Amax si ottiene considerando lrsquoarea nel caso x1 =hellip= xN-1 =0 xN=Nμ e risulta pari a 12 ndash (1N)(1)(12)=(N-1)2N
Per costruzione egrave 0 le R le 1 in particolarebullR=0 nel caso di equiripartizionebullR=1 nel caso di massima concentrazione
Si puograve dimostrare che il rapporto cosigrave costruito egrave uguale ad R
Indice di concentrazione (2)
13
Un altro indice di concentrazione sempre basato sullrsquoarea si puograve ottenere osservando che questrsquoultima non puograve superare il valore 12 Possiamo quindi rapportare lrsquoarea di concentrazione al suo valore massimo teorico
Si ha (percheacute) con i due indici che tendono a coincidere per N grande
Indice di concentrazione (3)
14
80 90 21 23 32 16 62
Un esempio
i x_i F_i Q_i (Fi-Qi)
1 16 01429 00494 00935
2 21 02857 01142 01715
3 23 04286 01852 02434
4 32 05714 02840 02875
5 62 07143 04753 02390
6 80 08571 07222 01349
7 90 1 1
Totale
324 3 11698
Dati i redditi di 7 individui
per ricavare la curva di concentrazione organizziamo le osservazioni in tabella avendo cura di ordinarle in base ai valori di x (ad esempio X1=16 percheacute lrsquoindividuo piugrave povero possiede 16) e calcoliamo le differenze (Fi-Qi)
15
80 90 21 23 32 16 62
Per calcolare R con la formula (2) usiamo una tabella simile alla precedente per ricavare il numeratore Lrsquoarea massima che compare a denominatore egrave pari allrsquoarea massima teorica meno lrsquoarea del triangolo di base F7-F6 e altezza 1 Il calcolo di Ř egrave del tutto analogo egrave sufficiente porre lrsquoarea massima pari a frac12
Data i redditi di 7 individui
Un esempio
i x_i F_i Q_i (Fi-Fi-1)(Qi+Qi-1)
1 16 01429 00494 00070
2 21 02857 01142 00233
3 23 04286 01852 00427
4 32 05714 02840 00670
5 62 07143 04753 01085
6 80 08571 07222 01710
7 90 1 1 02461
Totale
06658
16
Variabili statistiche discrete
Finora abbiamo considerato N osservazioni non raggruppate Per ricavare lrsquoindice o la curva di concentrazione a partire da una distribuzione di frequenze assolute possiamo usare le seguenti versioni ldquoponderaterdquo di Fi e Qi
dove x1hellipxk sono k valori distinti ordinati in modo non decrescente con numerositagrave n1 hellipnk
17
Variabili statistiche discrete
1
1
1
1
)(
k
ii
k
iii
F
QFR
Con le coppie (Fi Qi) si puograve ottenere un indice analogo ad R
In generale RneR sugli stessi dati Infatti con lrsquoindice sopra la situazione di massima concentrazione si ha quando tutto il carattere appartiene alla k-esima classe (e non allrsquo N-esimo individuo come nel caso di R)
Unendo le coppie (Fi Qi
) si ottiene la stessa curva di concentrazione che si otterrebbe utilizzando con i dati unitari Infatti si puograve dimostrare che la pendenza della curva non cambia passando tra individui che hanno lo stesso ammontare di carattere Lrsquounica differenza egrave che ora per ottenere la spezzata si devono congiungere kltN punti
18
Nel caso in cui si disponga dellrsquoinformazione sullrsquoammontare totale di carattere in un intervallo egrave consigliabile discretizzare gli intervalli in modo ldquocoerenterdquo con tale informazione
Esempio se nellrsquointervallo [515) di numerositagrave Ni=10 il carattere totale egrave pari a 60 egrave preferibile discretizzare lrsquointervallo assumendo come punto ldquomediordquo il valore 6 e non il valore 10 (al quale corrisponderebbe un reddito totale di 100 e non di 60) Si noti che devono essere note le numerositagrave degli intervalli per poter procedere in questo modo
Nel caso in cui si disponga dellrsquoinformazione sullrsquoammontare totale di carattere in un intervallo egrave consigliabile discretizzare gli intervalli in modo ldquocoerenterdquo con tale informazione
Esempio se nellrsquointervallo [515) di numerositagrave Ni=10 il carattere totale egrave pari a 60 egrave preferibile discretizzare lrsquointervallo assumendo come punto ldquomediordquo il valore 6 e non il valore 10 (al quale corrisponderebbe un reddito totale di 100 e non di 60) Si noti che devono essere note le numerositagrave degli intervalli per poter procedere in questo modo
Se si desidera ricavare lrsquoindice o la curva di concentrazione per una variabile continua per intervallo il modo piugrave semplice di procedere consiste nel ldquodiscretizzarerdquo la variabile considerando le frequenze ldquoconcentraterdquo nei punti medi degli intervalli Si puograve poi procedere come nel caso precedente
Se si desidera ricavare lrsquoindice o la curva di concentrazione per una variabile continua per intervallo il modo piugrave semplice di procedere consiste nel ldquodiscretizzarerdquo la variabile considerando le frequenze ldquoconcentraterdquo nei punti medi degli intervalli Si puograve poi procedere come nel caso precedente
Variabili statistiche continue per intervallo
19
Se X egrave una variabile statistica continua non negativa con densitagrave f(x) e media finita μ le espressioni delle frequenze e delle intensitagrave cumulate diventano
Se X egrave una variabile statistica continua non negativa con densitagrave f(x) e media finita μ le espressioni delle frequenze e delle intensitagrave cumulate diventano
Variabili statistiche continue
Nota Talvolta si esprimono F e Q in funzione della frequenza cumulata r In tal caso si ha x = F-1( r ) da cui le nuove variabili
20
Il valore di R per un carattere con distribuzione continua si puograve ottenere come nel caso discreto rapportando lrsquoarea di concentrazione al suo valore massimo pari ad 12
Il valore di R per un carattere con distribuzione continua si puograve ottenere come nel caso discreto rapportando lrsquoarea di concentrazione al suo valore massimo pari ad 12
Variabili statistiche continue
Lrsquoindice di Gini egrave quindi pari a due volte lrsquoarea di concentrazione
Nota essendo Amax =12 si ha R=Ř
ConfrontiPuograve essere interessante confrontare la concentrazione di due caratteri
(o equivalentemente dello stesso carattere in due istanti diversi o in due ambiti territoriali diversi)
Esempio 1 il reddito risulta piugrave concentrato in Italia o in Francia
Esempio 2 la concentrazione del reddito in Italia era maggiore negli anni lsquo80 o negli anni lsquo90
Un modo semplice per stabilire quale carattere egrave maggiormente concentrato egrave quello di confrontare graficamente le curve di concentrazione nei due ambiti territoriali (o temporali) e stabilire quale si trova al di sopra
21
bull Non egrave detto che una delle due curve sia al di sopra dellrsquoaltra le curve si possono intersecare Si puograve tuttavia mostrare che se il carattere varia linearmente tra gli ambiti considerati allora le curve non si intersecano
bull In generale si puograve effettuare il confronto usando lrsquoindice di Gini
bull Poicheacute G=2A=1-2Area_sotto_la_curva_Lorenz il confronto attraverso lrsquoindici di Gini equivale al confronto tra le aree al di sotto delle curve di Lorenz dei due caratteri
Confronti
Confronti
Esempio la concentrazione del reddito nel mondo usando lrsquoindice R
23
Fonte CIA The world Factbook 2009
24
Esempio di Confronto Tra DistribuzioniSi riportano di seguito le distribuzioni dei finanziamenti concessi da un istituto bancario per lrsquoacquisto della prima casa a giovani coppie residenti in Campania ed in Sardegna
a) In quale regione risulta piugrave elevata la concentrazione dei finanziamenti concessi
b) Confrontare graficamente i diversi livelli di concentrazione dei finanziamenti nelle due regioni
Campania
Finanziamenti (migliaia di Euro) ni
0-50 10
50-100 25
100-150 37
150-200 22
200-250 6
Totale 100
Sardegna
Finanziamenti (migliaia di Euro) ni
0-50 57
50-100 3
100-150 7
150-200 8
200-250 25
Totale 100
25
Sardegna
Finanziamenti (migliaia di Euro) ni Ni pi xi xi ni Xi qi pi+1- pi qi+1+ qi (pi+1- pi)(qi+1+ qi)
0 0 0 0000 0 0 0 0000 0570 0149 0085
0-50 57 57 0570 25 1425 1425 0149 0030 0322 0010
50-100 3 60 0600 75 225 1650 0173 0070 0437 0031
100-150 7 67 0670 125 875 2525 0264 0080 0675 0054
150-200 8 75 0750 175 1400 3925 0411 0250 1411 0353
200-250 25 100 1000 225 5625 9550 1000 - - -
Totale 100 9550 0532
Concentrazione dei finanziamenti in Sardegna
26
Concentrazione dei finanziamenti in Campania
Campania
Finanziamenti (migliaia di Euro) ni Ni pi xi xi ni Xi qi pi+1- pi qi+1+ qi (pi+1- pi)(qi+1+ qi)
0 0 0 0000 0 0 0 0000 0100 0021 0002
0-50 10 10 0100 25 250 250 0021 0250 0199 0050
50-100 25 35 0350 75 1875 2125 0178 0370 0743 0275
100-150 37 72 0720 125 4625 6750 0565 0220 1452 0319
150-200 22 94 0940 175 3850 10600 0887 0060 1887 0113
200-250 6 100 1000 225 1350 11950 1000 - - -
Totale 100 11950 0759
27
00
01
02
03
04
05
06
07
08
09
10
00 01 02 03 04 05 06 07 08 09 10
pi
qi
Equidistribuzione Sardegna Campania
4680R~sar 2410R
~cam La concentrazione egrave piugrave
elevata in Sardegna
La curva di Lorenz conferma questo risultato
28
Riferimenti
bull C Gini (1912) Variabilitagrave e mutabilitagrave Contributo allo studio delle distribuzioni e relazioni statistiche Studi economici-giuridici dela Regia Universitagrave di Cagliari anno III
bull Lorenz M O (1905) Methods of measuring the concentration of wealth Publications of the American Statistical Association (Publications of the American Statistical Association Vol 9 No 70) 9 (70) 209ndash219
bull Per ulteriori riferimenti si possono consultare utilmente le pagine di Wikipedia relative allrsquoindice di Gini e alla curva di Lorenz
4
IntroduzioneIntuitivamente un carattere statistico (si pensi ad esempio al reddito) egrave tanto piugrave concentrato quanto piugrave risulta suddiviso tra poche unitagrave della popolazione
Ogni situazione reale saragrave intermedia tra due situazioni estreme che chiameremo di concentrazione massima e di equiripartizione Si ha massima concentrazione quando una sola unitagrave statistica possiede la totalitagrave del carattere Si parla invece di equiripartizione quando tutte le unitagrave della popolazione possiedono la stessa quantitagrave di carattere
5
Curva di concentrazione
Consideriamo un carattere quantitativo trasferibile ordiniamo le quantitagrave del carattere (intensitagrave) possedute dalle unitagrave statistiche in senso non decrescente e definiamoNxxx 0 21
6
Curva di concentrazione
La curva di Lorenz (o curva di concentrazione) si ottiene rappresentando
le coppie (Fi Qi) nello spazio cartesiano e congiungendole
Il generico punto (Fi Qi) della curva si puograve interpretare nel seguente
modo lrsquo (Fi 100) piugrave povero di carattere possiede il (Qi 100) del carattere totale
Valgono le seguenti
1) (FNQN)=(11)
2) Qi le Fi per ogni i
La 2) segue dal fatto che
7
Curva di concentrazione
La curva di concentrazione egrave sempre compresa potendo eventualmente coincidere tra le due seguenti
1La bisettrice di equazione Q=F Lungo la bisettrice Fi=Qi per ogni i da cui segue che ogni unitagrave possiede una quantitagrave di carattere pari alla media dello stesso nella popolazione La bisettrice rappresenta quindi la situazione di equiripartizione
2 La curva passante per i punti (Fi0) i=1hellipN-1 e (11) In tal caso tutto il carattere egrave concentrato in una sola unitagrave statistica (lrsquoN-esima) e rappresenta quindi la situazione di massima concentrazione
Un esempio
8
80 90 21 23 32 16 62Dati i redditi di 7 individui
per ricavare la curva di concentrazione organizziamo le osservazioni in tabella (avendo cura di ordinarle in base ai valori di x ad esempio X1=16 percheacute lrsquoindividuo piugrave povero possiede 16) calcoliamo le coordinate dei punti (FiQi) e le congiungiamo Nel caso in esame la curva egrave piugrave vicina alla bisettrice
i x_i F_i Q_i
0 0 0
1 16 01429 00494
2 21 02857 01142
3 23 04286 01852
4 32 05714 02840
5 62 07143 04753
6 80 08571 07222
7 90 1 1
9
Indici di concentrazione
La curva di Lorenz-Gini egrave uno strumento grafico per rappresentare la concentrazione di un carattere Puograve tuttavia essere comodo valutare la concentrazione attraverso un indice numerico
Intuitivamente quanto piugrave la bisettrice si discosta dalla curva di concentrazione tanto maggiore egrave la concentrazione del carattere Ersquo naturale quindi costruire un indice di concentrazione basato sullo ldquoscostamentordquo della curva dalla bisettrice Una misura dello scostamento puograve essere basata
bullsulle distanze verticali tra la curva di concentrazione e la bisettricebullsullrsquoarea compresa tra la curva di concentrazione e la bisettrice
10
Indice di concentrazione (1) Le distanze verticali tra la curva di concentrazione e la bisettrice sono date da (Fi ndash Qi)
e sono non negative Un indice relativo di concentrazione si puograve ottenere dividendo la somma delle (Fi ndash Qi) per il valore massimo che tali differenze possono assumere
Lrsquoindice sopra egrave lrsquoindice di concentrazione di Gini Si ha 0 le R le 1 e in particolare
R = 0 nel caso di equiripartizione infatti in tal caso Fi - Qi =0 i=12hellipN-1
R = 1 nel caso di massima concentrazione infatti in tal caso Fi - Qi = Fi i=12hellipN-1
11
0
01
02
03
04
05
06
07
08
09
1
0 02 04 06 08 1
qi
pi
Indice di concentrazione (2)
Lrsquoarea A in figura compresa tra la curva di concentrazione e la retta di equidistribuzione prende il nome di area di concentrazione Si noti che A egrave pari allrsquoarea del triangolo di coordinate (00) (10) (11) meno lrsquoarea B formata dai trapezi di altezza Fi-Fi-1 e basi Qi e Qi-1
Area del trapezio
frac12 x Somma delle basi x altezza
A B
12
Un indice relativo di concentrazione si puograve ottenere dividendo lrsquoarea di concentrazione per il valore massimo che lrsquoarea puograve assumere
dove Amax si ottiene considerando lrsquoarea nel caso x1 =hellip= xN-1 =0 xN=Nμ e risulta pari a 12 ndash (1N)(1)(12)=(N-1)2N
Per costruzione egrave 0 le R le 1 in particolarebullR=0 nel caso di equiripartizionebullR=1 nel caso di massima concentrazione
Si puograve dimostrare che il rapporto cosigrave costruito egrave uguale ad R
Indice di concentrazione (2)
13
Un altro indice di concentrazione sempre basato sullrsquoarea si puograve ottenere osservando che questrsquoultima non puograve superare il valore 12 Possiamo quindi rapportare lrsquoarea di concentrazione al suo valore massimo teorico
Si ha (percheacute) con i due indici che tendono a coincidere per N grande
Indice di concentrazione (3)
14
80 90 21 23 32 16 62
Un esempio
i x_i F_i Q_i (Fi-Qi)
1 16 01429 00494 00935
2 21 02857 01142 01715
3 23 04286 01852 02434
4 32 05714 02840 02875
5 62 07143 04753 02390
6 80 08571 07222 01349
7 90 1 1
Totale
324 3 11698
Dati i redditi di 7 individui
per ricavare la curva di concentrazione organizziamo le osservazioni in tabella avendo cura di ordinarle in base ai valori di x (ad esempio X1=16 percheacute lrsquoindividuo piugrave povero possiede 16) e calcoliamo le differenze (Fi-Qi)
15
80 90 21 23 32 16 62
Per calcolare R con la formula (2) usiamo una tabella simile alla precedente per ricavare il numeratore Lrsquoarea massima che compare a denominatore egrave pari allrsquoarea massima teorica meno lrsquoarea del triangolo di base F7-F6 e altezza 1 Il calcolo di Ř egrave del tutto analogo egrave sufficiente porre lrsquoarea massima pari a frac12
Data i redditi di 7 individui
Un esempio
i x_i F_i Q_i (Fi-Fi-1)(Qi+Qi-1)
1 16 01429 00494 00070
2 21 02857 01142 00233
3 23 04286 01852 00427
4 32 05714 02840 00670
5 62 07143 04753 01085
6 80 08571 07222 01710
7 90 1 1 02461
Totale
06658
16
Variabili statistiche discrete
Finora abbiamo considerato N osservazioni non raggruppate Per ricavare lrsquoindice o la curva di concentrazione a partire da una distribuzione di frequenze assolute possiamo usare le seguenti versioni ldquoponderaterdquo di Fi e Qi
dove x1hellipxk sono k valori distinti ordinati in modo non decrescente con numerositagrave n1 hellipnk
17
Variabili statistiche discrete
1
1
1
1
)(
k
ii
k
iii
F
QFR
Con le coppie (Fi Qi) si puograve ottenere un indice analogo ad R
In generale RneR sugli stessi dati Infatti con lrsquoindice sopra la situazione di massima concentrazione si ha quando tutto il carattere appartiene alla k-esima classe (e non allrsquo N-esimo individuo come nel caso di R)
Unendo le coppie (Fi Qi
) si ottiene la stessa curva di concentrazione che si otterrebbe utilizzando con i dati unitari Infatti si puograve dimostrare che la pendenza della curva non cambia passando tra individui che hanno lo stesso ammontare di carattere Lrsquounica differenza egrave che ora per ottenere la spezzata si devono congiungere kltN punti
18
Nel caso in cui si disponga dellrsquoinformazione sullrsquoammontare totale di carattere in un intervallo egrave consigliabile discretizzare gli intervalli in modo ldquocoerenterdquo con tale informazione
Esempio se nellrsquointervallo [515) di numerositagrave Ni=10 il carattere totale egrave pari a 60 egrave preferibile discretizzare lrsquointervallo assumendo come punto ldquomediordquo il valore 6 e non il valore 10 (al quale corrisponderebbe un reddito totale di 100 e non di 60) Si noti che devono essere note le numerositagrave degli intervalli per poter procedere in questo modo
Nel caso in cui si disponga dellrsquoinformazione sullrsquoammontare totale di carattere in un intervallo egrave consigliabile discretizzare gli intervalli in modo ldquocoerenterdquo con tale informazione
Esempio se nellrsquointervallo [515) di numerositagrave Ni=10 il carattere totale egrave pari a 60 egrave preferibile discretizzare lrsquointervallo assumendo come punto ldquomediordquo il valore 6 e non il valore 10 (al quale corrisponderebbe un reddito totale di 100 e non di 60) Si noti che devono essere note le numerositagrave degli intervalli per poter procedere in questo modo
Se si desidera ricavare lrsquoindice o la curva di concentrazione per una variabile continua per intervallo il modo piugrave semplice di procedere consiste nel ldquodiscretizzarerdquo la variabile considerando le frequenze ldquoconcentraterdquo nei punti medi degli intervalli Si puograve poi procedere come nel caso precedente
Se si desidera ricavare lrsquoindice o la curva di concentrazione per una variabile continua per intervallo il modo piugrave semplice di procedere consiste nel ldquodiscretizzarerdquo la variabile considerando le frequenze ldquoconcentraterdquo nei punti medi degli intervalli Si puograve poi procedere come nel caso precedente
Variabili statistiche continue per intervallo
19
Se X egrave una variabile statistica continua non negativa con densitagrave f(x) e media finita μ le espressioni delle frequenze e delle intensitagrave cumulate diventano
Se X egrave una variabile statistica continua non negativa con densitagrave f(x) e media finita μ le espressioni delle frequenze e delle intensitagrave cumulate diventano
Variabili statistiche continue
Nota Talvolta si esprimono F e Q in funzione della frequenza cumulata r In tal caso si ha x = F-1( r ) da cui le nuove variabili
20
Il valore di R per un carattere con distribuzione continua si puograve ottenere come nel caso discreto rapportando lrsquoarea di concentrazione al suo valore massimo pari ad 12
Il valore di R per un carattere con distribuzione continua si puograve ottenere come nel caso discreto rapportando lrsquoarea di concentrazione al suo valore massimo pari ad 12
Variabili statistiche continue
Lrsquoindice di Gini egrave quindi pari a due volte lrsquoarea di concentrazione
Nota essendo Amax =12 si ha R=Ř
ConfrontiPuograve essere interessante confrontare la concentrazione di due caratteri
(o equivalentemente dello stesso carattere in due istanti diversi o in due ambiti territoriali diversi)
Esempio 1 il reddito risulta piugrave concentrato in Italia o in Francia
Esempio 2 la concentrazione del reddito in Italia era maggiore negli anni lsquo80 o negli anni lsquo90
Un modo semplice per stabilire quale carattere egrave maggiormente concentrato egrave quello di confrontare graficamente le curve di concentrazione nei due ambiti territoriali (o temporali) e stabilire quale si trova al di sopra
21
bull Non egrave detto che una delle due curve sia al di sopra dellrsquoaltra le curve si possono intersecare Si puograve tuttavia mostrare che se il carattere varia linearmente tra gli ambiti considerati allora le curve non si intersecano
bull In generale si puograve effettuare il confronto usando lrsquoindice di Gini
bull Poicheacute G=2A=1-2Area_sotto_la_curva_Lorenz il confronto attraverso lrsquoindici di Gini equivale al confronto tra le aree al di sotto delle curve di Lorenz dei due caratteri
Confronti
Confronti
Esempio la concentrazione del reddito nel mondo usando lrsquoindice R
23
Fonte CIA The world Factbook 2009
24
Esempio di Confronto Tra DistribuzioniSi riportano di seguito le distribuzioni dei finanziamenti concessi da un istituto bancario per lrsquoacquisto della prima casa a giovani coppie residenti in Campania ed in Sardegna
a) In quale regione risulta piugrave elevata la concentrazione dei finanziamenti concessi
b) Confrontare graficamente i diversi livelli di concentrazione dei finanziamenti nelle due regioni
Campania
Finanziamenti (migliaia di Euro) ni
0-50 10
50-100 25
100-150 37
150-200 22
200-250 6
Totale 100
Sardegna
Finanziamenti (migliaia di Euro) ni
0-50 57
50-100 3
100-150 7
150-200 8
200-250 25
Totale 100
25
Sardegna
Finanziamenti (migliaia di Euro) ni Ni pi xi xi ni Xi qi pi+1- pi qi+1+ qi (pi+1- pi)(qi+1+ qi)
0 0 0 0000 0 0 0 0000 0570 0149 0085
0-50 57 57 0570 25 1425 1425 0149 0030 0322 0010
50-100 3 60 0600 75 225 1650 0173 0070 0437 0031
100-150 7 67 0670 125 875 2525 0264 0080 0675 0054
150-200 8 75 0750 175 1400 3925 0411 0250 1411 0353
200-250 25 100 1000 225 5625 9550 1000 - - -
Totale 100 9550 0532
Concentrazione dei finanziamenti in Sardegna
26
Concentrazione dei finanziamenti in Campania
Campania
Finanziamenti (migliaia di Euro) ni Ni pi xi xi ni Xi qi pi+1- pi qi+1+ qi (pi+1- pi)(qi+1+ qi)
0 0 0 0000 0 0 0 0000 0100 0021 0002
0-50 10 10 0100 25 250 250 0021 0250 0199 0050
50-100 25 35 0350 75 1875 2125 0178 0370 0743 0275
100-150 37 72 0720 125 4625 6750 0565 0220 1452 0319
150-200 22 94 0940 175 3850 10600 0887 0060 1887 0113
200-250 6 100 1000 225 1350 11950 1000 - - -
Totale 100 11950 0759
27
00
01
02
03
04
05
06
07
08
09
10
00 01 02 03 04 05 06 07 08 09 10
pi
qi
Equidistribuzione Sardegna Campania
4680R~sar 2410R
~cam La concentrazione egrave piugrave
elevata in Sardegna
La curva di Lorenz conferma questo risultato
28
Riferimenti
bull C Gini (1912) Variabilitagrave e mutabilitagrave Contributo allo studio delle distribuzioni e relazioni statistiche Studi economici-giuridici dela Regia Universitagrave di Cagliari anno III
bull Lorenz M O (1905) Methods of measuring the concentration of wealth Publications of the American Statistical Association (Publications of the American Statistical Association Vol 9 No 70) 9 (70) 209ndash219
bull Per ulteriori riferimenti si possono consultare utilmente le pagine di Wikipedia relative allrsquoindice di Gini e alla curva di Lorenz
5
Curva di concentrazione
Consideriamo un carattere quantitativo trasferibile ordiniamo le quantitagrave del carattere (intensitagrave) possedute dalle unitagrave statistiche in senso non decrescente e definiamoNxxx 0 21
6
Curva di concentrazione
La curva di Lorenz (o curva di concentrazione) si ottiene rappresentando
le coppie (Fi Qi) nello spazio cartesiano e congiungendole
Il generico punto (Fi Qi) della curva si puograve interpretare nel seguente
modo lrsquo (Fi 100) piugrave povero di carattere possiede il (Qi 100) del carattere totale
Valgono le seguenti
1) (FNQN)=(11)
2) Qi le Fi per ogni i
La 2) segue dal fatto che
7
Curva di concentrazione
La curva di concentrazione egrave sempre compresa potendo eventualmente coincidere tra le due seguenti
1La bisettrice di equazione Q=F Lungo la bisettrice Fi=Qi per ogni i da cui segue che ogni unitagrave possiede una quantitagrave di carattere pari alla media dello stesso nella popolazione La bisettrice rappresenta quindi la situazione di equiripartizione
2 La curva passante per i punti (Fi0) i=1hellipN-1 e (11) In tal caso tutto il carattere egrave concentrato in una sola unitagrave statistica (lrsquoN-esima) e rappresenta quindi la situazione di massima concentrazione
Un esempio
8
80 90 21 23 32 16 62Dati i redditi di 7 individui
per ricavare la curva di concentrazione organizziamo le osservazioni in tabella (avendo cura di ordinarle in base ai valori di x ad esempio X1=16 percheacute lrsquoindividuo piugrave povero possiede 16) calcoliamo le coordinate dei punti (FiQi) e le congiungiamo Nel caso in esame la curva egrave piugrave vicina alla bisettrice
i x_i F_i Q_i
0 0 0
1 16 01429 00494
2 21 02857 01142
3 23 04286 01852
4 32 05714 02840
5 62 07143 04753
6 80 08571 07222
7 90 1 1
9
Indici di concentrazione
La curva di Lorenz-Gini egrave uno strumento grafico per rappresentare la concentrazione di un carattere Puograve tuttavia essere comodo valutare la concentrazione attraverso un indice numerico
Intuitivamente quanto piugrave la bisettrice si discosta dalla curva di concentrazione tanto maggiore egrave la concentrazione del carattere Ersquo naturale quindi costruire un indice di concentrazione basato sullo ldquoscostamentordquo della curva dalla bisettrice Una misura dello scostamento puograve essere basata
bullsulle distanze verticali tra la curva di concentrazione e la bisettricebullsullrsquoarea compresa tra la curva di concentrazione e la bisettrice
10
Indice di concentrazione (1) Le distanze verticali tra la curva di concentrazione e la bisettrice sono date da (Fi ndash Qi)
e sono non negative Un indice relativo di concentrazione si puograve ottenere dividendo la somma delle (Fi ndash Qi) per il valore massimo che tali differenze possono assumere
Lrsquoindice sopra egrave lrsquoindice di concentrazione di Gini Si ha 0 le R le 1 e in particolare
R = 0 nel caso di equiripartizione infatti in tal caso Fi - Qi =0 i=12hellipN-1
R = 1 nel caso di massima concentrazione infatti in tal caso Fi - Qi = Fi i=12hellipN-1
11
0
01
02
03
04
05
06
07
08
09
1
0 02 04 06 08 1
qi
pi
Indice di concentrazione (2)
Lrsquoarea A in figura compresa tra la curva di concentrazione e la retta di equidistribuzione prende il nome di area di concentrazione Si noti che A egrave pari allrsquoarea del triangolo di coordinate (00) (10) (11) meno lrsquoarea B formata dai trapezi di altezza Fi-Fi-1 e basi Qi e Qi-1
Area del trapezio
frac12 x Somma delle basi x altezza
A B
12
Un indice relativo di concentrazione si puograve ottenere dividendo lrsquoarea di concentrazione per il valore massimo che lrsquoarea puograve assumere
dove Amax si ottiene considerando lrsquoarea nel caso x1 =hellip= xN-1 =0 xN=Nμ e risulta pari a 12 ndash (1N)(1)(12)=(N-1)2N
Per costruzione egrave 0 le R le 1 in particolarebullR=0 nel caso di equiripartizionebullR=1 nel caso di massima concentrazione
Si puograve dimostrare che il rapporto cosigrave costruito egrave uguale ad R
Indice di concentrazione (2)
13
Un altro indice di concentrazione sempre basato sullrsquoarea si puograve ottenere osservando che questrsquoultima non puograve superare il valore 12 Possiamo quindi rapportare lrsquoarea di concentrazione al suo valore massimo teorico
Si ha (percheacute) con i due indici che tendono a coincidere per N grande
Indice di concentrazione (3)
14
80 90 21 23 32 16 62
Un esempio
i x_i F_i Q_i (Fi-Qi)
1 16 01429 00494 00935
2 21 02857 01142 01715
3 23 04286 01852 02434
4 32 05714 02840 02875
5 62 07143 04753 02390
6 80 08571 07222 01349
7 90 1 1
Totale
324 3 11698
Dati i redditi di 7 individui
per ricavare la curva di concentrazione organizziamo le osservazioni in tabella avendo cura di ordinarle in base ai valori di x (ad esempio X1=16 percheacute lrsquoindividuo piugrave povero possiede 16) e calcoliamo le differenze (Fi-Qi)
15
80 90 21 23 32 16 62
Per calcolare R con la formula (2) usiamo una tabella simile alla precedente per ricavare il numeratore Lrsquoarea massima che compare a denominatore egrave pari allrsquoarea massima teorica meno lrsquoarea del triangolo di base F7-F6 e altezza 1 Il calcolo di Ř egrave del tutto analogo egrave sufficiente porre lrsquoarea massima pari a frac12
Data i redditi di 7 individui
Un esempio
i x_i F_i Q_i (Fi-Fi-1)(Qi+Qi-1)
1 16 01429 00494 00070
2 21 02857 01142 00233
3 23 04286 01852 00427
4 32 05714 02840 00670
5 62 07143 04753 01085
6 80 08571 07222 01710
7 90 1 1 02461
Totale
06658
16
Variabili statistiche discrete
Finora abbiamo considerato N osservazioni non raggruppate Per ricavare lrsquoindice o la curva di concentrazione a partire da una distribuzione di frequenze assolute possiamo usare le seguenti versioni ldquoponderaterdquo di Fi e Qi
dove x1hellipxk sono k valori distinti ordinati in modo non decrescente con numerositagrave n1 hellipnk
17
Variabili statistiche discrete
1
1
1
1
)(
k
ii
k
iii
F
QFR
Con le coppie (Fi Qi) si puograve ottenere un indice analogo ad R
In generale RneR sugli stessi dati Infatti con lrsquoindice sopra la situazione di massima concentrazione si ha quando tutto il carattere appartiene alla k-esima classe (e non allrsquo N-esimo individuo come nel caso di R)
Unendo le coppie (Fi Qi
) si ottiene la stessa curva di concentrazione che si otterrebbe utilizzando con i dati unitari Infatti si puograve dimostrare che la pendenza della curva non cambia passando tra individui che hanno lo stesso ammontare di carattere Lrsquounica differenza egrave che ora per ottenere la spezzata si devono congiungere kltN punti
18
Nel caso in cui si disponga dellrsquoinformazione sullrsquoammontare totale di carattere in un intervallo egrave consigliabile discretizzare gli intervalli in modo ldquocoerenterdquo con tale informazione
Esempio se nellrsquointervallo [515) di numerositagrave Ni=10 il carattere totale egrave pari a 60 egrave preferibile discretizzare lrsquointervallo assumendo come punto ldquomediordquo il valore 6 e non il valore 10 (al quale corrisponderebbe un reddito totale di 100 e non di 60) Si noti che devono essere note le numerositagrave degli intervalli per poter procedere in questo modo
Nel caso in cui si disponga dellrsquoinformazione sullrsquoammontare totale di carattere in un intervallo egrave consigliabile discretizzare gli intervalli in modo ldquocoerenterdquo con tale informazione
Esempio se nellrsquointervallo [515) di numerositagrave Ni=10 il carattere totale egrave pari a 60 egrave preferibile discretizzare lrsquointervallo assumendo come punto ldquomediordquo il valore 6 e non il valore 10 (al quale corrisponderebbe un reddito totale di 100 e non di 60) Si noti che devono essere note le numerositagrave degli intervalli per poter procedere in questo modo
Se si desidera ricavare lrsquoindice o la curva di concentrazione per una variabile continua per intervallo il modo piugrave semplice di procedere consiste nel ldquodiscretizzarerdquo la variabile considerando le frequenze ldquoconcentraterdquo nei punti medi degli intervalli Si puograve poi procedere come nel caso precedente
Se si desidera ricavare lrsquoindice o la curva di concentrazione per una variabile continua per intervallo il modo piugrave semplice di procedere consiste nel ldquodiscretizzarerdquo la variabile considerando le frequenze ldquoconcentraterdquo nei punti medi degli intervalli Si puograve poi procedere come nel caso precedente
Variabili statistiche continue per intervallo
19
Se X egrave una variabile statistica continua non negativa con densitagrave f(x) e media finita μ le espressioni delle frequenze e delle intensitagrave cumulate diventano
Se X egrave una variabile statistica continua non negativa con densitagrave f(x) e media finita μ le espressioni delle frequenze e delle intensitagrave cumulate diventano
Variabili statistiche continue
Nota Talvolta si esprimono F e Q in funzione della frequenza cumulata r In tal caso si ha x = F-1( r ) da cui le nuove variabili
20
Il valore di R per un carattere con distribuzione continua si puograve ottenere come nel caso discreto rapportando lrsquoarea di concentrazione al suo valore massimo pari ad 12
Il valore di R per un carattere con distribuzione continua si puograve ottenere come nel caso discreto rapportando lrsquoarea di concentrazione al suo valore massimo pari ad 12
Variabili statistiche continue
Lrsquoindice di Gini egrave quindi pari a due volte lrsquoarea di concentrazione
Nota essendo Amax =12 si ha R=Ř
ConfrontiPuograve essere interessante confrontare la concentrazione di due caratteri
(o equivalentemente dello stesso carattere in due istanti diversi o in due ambiti territoriali diversi)
Esempio 1 il reddito risulta piugrave concentrato in Italia o in Francia
Esempio 2 la concentrazione del reddito in Italia era maggiore negli anni lsquo80 o negli anni lsquo90
Un modo semplice per stabilire quale carattere egrave maggiormente concentrato egrave quello di confrontare graficamente le curve di concentrazione nei due ambiti territoriali (o temporali) e stabilire quale si trova al di sopra
21
bull Non egrave detto che una delle due curve sia al di sopra dellrsquoaltra le curve si possono intersecare Si puograve tuttavia mostrare che se il carattere varia linearmente tra gli ambiti considerati allora le curve non si intersecano
bull In generale si puograve effettuare il confronto usando lrsquoindice di Gini
bull Poicheacute G=2A=1-2Area_sotto_la_curva_Lorenz il confronto attraverso lrsquoindici di Gini equivale al confronto tra le aree al di sotto delle curve di Lorenz dei due caratteri
Confronti
Confronti
Esempio la concentrazione del reddito nel mondo usando lrsquoindice R
23
Fonte CIA The world Factbook 2009
24
Esempio di Confronto Tra DistribuzioniSi riportano di seguito le distribuzioni dei finanziamenti concessi da un istituto bancario per lrsquoacquisto della prima casa a giovani coppie residenti in Campania ed in Sardegna
a) In quale regione risulta piugrave elevata la concentrazione dei finanziamenti concessi
b) Confrontare graficamente i diversi livelli di concentrazione dei finanziamenti nelle due regioni
Campania
Finanziamenti (migliaia di Euro) ni
0-50 10
50-100 25
100-150 37
150-200 22
200-250 6
Totale 100
Sardegna
Finanziamenti (migliaia di Euro) ni
0-50 57
50-100 3
100-150 7
150-200 8
200-250 25
Totale 100
25
Sardegna
Finanziamenti (migliaia di Euro) ni Ni pi xi xi ni Xi qi pi+1- pi qi+1+ qi (pi+1- pi)(qi+1+ qi)
0 0 0 0000 0 0 0 0000 0570 0149 0085
0-50 57 57 0570 25 1425 1425 0149 0030 0322 0010
50-100 3 60 0600 75 225 1650 0173 0070 0437 0031
100-150 7 67 0670 125 875 2525 0264 0080 0675 0054
150-200 8 75 0750 175 1400 3925 0411 0250 1411 0353
200-250 25 100 1000 225 5625 9550 1000 - - -
Totale 100 9550 0532
Concentrazione dei finanziamenti in Sardegna
26
Concentrazione dei finanziamenti in Campania
Campania
Finanziamenti (migliaia di Euro) ni Ni pi xi xi ni Xi qi pi+1- pi qi+1+ qi (pi+1- pi)(qi+1+ qi)
0 0 0 0000 0 0 0 0000 0100 0021 0002
0-50 10 10 0100 25 250 250 0021 0250 0199 0050
50-100 25 35 0350 75 1875 2125 0178 0370 0743 0275
100-150 37 72 0720 125 4625 6750 0565 0220 1452 0319
150-200 22 94 0940 175 3850 10600 0887 0060 1887 0113
200-250 6 100 1000 225 1350 11950 1000 - - -
Totale 100 11950 0759
27
00
01
02
03
04
05
06
07
08
09
10
00 01 02 03 04 05 06 07 08 09 10
pi
qi
Equidistribuzione Sardegna Campania
4680R~sar 2410R
~cam La concentrazione egrave piugrave
elevata in Sardegna
La curva di Lorenz conferma questo risultato
28
Riferimenti
bull C Gini (1912) Variabilitagrave e mutabilitagrave Contributo allo studio delle distribuzioni e relazioni statistiche Studi economici-giuridici dela Regia Universitagrave di Cagliari anno III
bull Lorenz M O (1905) Methods of measuring the concentration of wealth Publications of the American Statistical Association (Publications of the American Statistical Association Vol 9 No 70) 9 (70) 209ndash219
bull Per ulteriori riferimenti si possono consultare utilmente le pagine di Wikipedia relative allrsquoindice di Gini e alla curva di Lorenz
6
Curva di concentrazione
La curva di Lorenz (o curva di concentrazione) si ottiene rappresentando
le coppie (Fi Qi) nello spazio cartesiano e congiungendole
Il generico punto (Fi Qi) della curva si puograve interpretare nel seguente
modo lrsquo (Fi 100) piugrave povero di carattere possiede il (Qi 100) del carattere totale
Valgono le seguenti
1) (FNQN)=(11)
2) Qi le Fi per ogni i
La 2) segue dal fatto che
7
Curva di concentrazione
La curva di concentrazione egrave sempre compresa potendo eventualmente coincidere tra le due seguenti
1La bisettrice di equazione Q=F Lungo la bisettrice Fi=Qi per ogni i da cui segue che ogni unitagrave possiede una quantitagrave di carattere pari alla media dello stesso nella popolazione La bisettrice rappresenta quindi la situazione di equiripartizione
2 La curva passante per i punti (Fi0) i=1hellipN-1 e (11) In tal caso tutto il carattere egrave concentrato in una sola unitagrave statistica (lrsquoN-esima) e rappresenta quindi la situazione di massima concentrazione
Un esempio
8
80 90 21 23 32 16 62Dati i redditi di 7 individui
per ricavare la curva di concentrazione organizziamo le osservazioni in tabella (avendo cura di ordinarle in base ai valori di x ad esempio X1=16 percheacute lrsquoindividuo piugrave povero possiede 16) calcoliamo le coordinate dei punti (FiQi) e le congiungiamo Nel caso in esame la curva egrave piugrave vicina alla bisettrice
i x_i F_i Q_i
0 0 0
1 16 01429 00494
2 21 02857 01142
3 23 04286 01852
4 32 05714 02840
5 62 07143 04753
6 80 08571 07222
7 90 1 1
9
Indici di concentrazione
La curva di Lorenz-Gini egrave uno strumento grafico per rappresentare la concentrazione di un carattere Puograve tuttavia essere comodo valutare la concentrazione attraverso un indice numerico
Intuitivamente quanto piugrave la bisettrice si discosta dalla curva di concentrazione tanto maggiore egrave la concentrazione del carattere Ersquo naturale quindi costruire un indice di concentrazione basato sullo ldquoscostamentordquo della curva dalla bisettrice Una misura dello scostamento puograve essere basata
bullsulle distanze verticali tra la curva di concentrazione e la bisettricebullsullrsquoarea compresa tra la curva di concentrazione e la bisettrice
10
Indice di concentrazione (1) Le distanze verticali tra la curva di concentrazione e la bisettrice sono date da (Fi ndash Qi)
e sono non negative Un indice relativo di concentrazione si puograve ottenere dividendo la somma delle (Fi ndash Qi) per il valore massimo che tali differenze possono assumere
Lrsquoindice sopra egrave lrsquoindice di concentrazione di Gini Si ha 0 le R le 1 e in particolare
R = 0 nel caso di equiripartizione infatti in tal caso Fi - Qi =0 i=12hellipN-1
R = 1 nel caso di massima concentrazione infatti in tal caso Fi - Qi = Fi i=12hellipN-1
11
0
01
02
03
04
05
06
07
08
09
1
0 02 04 06 08 1
qi
pi
Indice di concentrazione (2)
Lrsquoarea A in figura compresa tra la curva di concentrazione e la retta di equidistribuzione prende il nome di area di concentrazione Si noti che A egrave pari allrsquoarea del triangolo di coordinate (00) (10) (11) meno lrsquoarea B formata dai trapezi di altezza Fi-Fi-1 e basi Qi e Qi-1
Area del trapezio
frac12 x Somma delle basi x altezza
A B
12
Un indice relativo di concentrazione si puograve ottenere dividendo lrsquoarea di concentrazione per il valore massimo che lrsquoarea puograve assumere
dove Amax si ottiene considerando lrsquoarea nel caso x1 =hellip= xN-1 =0 xN=Nμ e risulta pari a 12 ndash (1N)(1)(12)=(N-1)2N
Per costruzione egrave 0 le R le 1 in particolarebullR=0 nel caso di equiripartizionebullR=1 nel caso di massima concentrazione
Si puograve dimostrare che il rapporto cosigrave costruito egrave uguale ad R
Indice di concentrazione (2)
13
Un altro indice di concentrazione sempre basato sullrsquoarea si puograve ottenere osservando che questrsquoultima non puograve superare il valore 12 Possiamo quindi rapportare lrsquoarea di concentrazione al suo valore massimo teorico
Si ha (percheacute) con i due indici che tendono a coincidere per N grande
Indice di concentrazione (3)
14
80 90 21 23 32 16 62
Un esempio
i x_i F_i Q_i (Fi-Qi)
1 16 01429 00494 00935
2 21 02857 01142 01715
3 23 04286 01852 02434
4 32 05714 02840 02875
5 62 07143 04753 02390
6 80 08571 07222 01349
7 90 1 1
Totale
324 3 11698
Dati i redditi di 7 individui
per ricavare la curva di concentrazione organizziamo le osservazioni in tabella avendo cura di ordinarle in base ai valori di x (ad esempio X1=16 percheacute lrsquoindividuo piugrave povero possiede 16) e calcoliamo le differenze (Fi-Qi)
15
80 90 21 23 32 16 62
Per calcolare R con la formula (2) usiamo una tabella simile alla precedente per ricavare il numeratore Lrsquoarea massima che compare a denominatore egrave pari allrsquoarea massima teorica meno lrsquoarea del triangolo di base F7-F6 e altezza 1 Il calcolo di Ř egrave del tutto analogo egrave sufficiente porre lrsquoarea massima pari a frac12
Data i redditi di 7 individui
Un esempio
i x_i F_i Q_i (Fi-Fi-1)(Qi+Qi-1)
1 16 01429 00494 00070
2 21 02857 01142 00233
3 23 04286 01852 00427
4 32 05714 02840 00670
5 62 07143 04753 01085
6 80 08571 07222 01710
7 90 1 1 02461
Totale
06658
16
Variabili statistiche discrete
Finora abbiamo considerato N osservazioni non raggruppate Per ricavare lrsquoindice o la curva di concentrazione a partire da una distribuzione di frequenze assolute possiamo usare le seguenti versioni ldquoponderaterdquo di Fi e Qi
dove x1hellipxk sono k valori distinti ordinati in modo non decrescente con numerositagrave n1 hellipnk
17
Variabili statistiche discrete
1
1
1
1
)(
k
ii
k
iii
F
QFR
Con le coppie (Fi Qi) si puograve ottenere un indice analogo ad R
In generale RneR sugli stessi dati Infatti con lrsquoindice sopra la situazione di massima concentrazione si ha quando tutto il carattere appartiene alla k-esima classe (e non allrsquo N-esimo individuo come nel caso di R)
Unendo le coppie (Fi Qi
) si ottiene la stessa curva di concentrazione che si otterrebbe utilizzando con i dati unitari Infatti si puograve dimostrare che la pendenza della curva non cambia passando tra individui che hanno lo stesso ammontare di carattere Lrsquounica differenza egrave che ora per ottenere la spezzata si devono congiungere kltN punti
18
Nel caso in cui si disponga dellrsquoinformazione sullrsquoammontare totale di carattere in un intervallo egrave consigliabile discretizzare gli intervalli in modo ldquocoerenterdquo con tale informazione
Esempio se nellrsquointervallo [515) di numerositagrave Ni=10 il carattere totale egrave pari a 60 egrave preferibile discretizzare lrsquointervallo assumendo come punto ldquomediordquo il valore 6 e non il valore 10 (al quale corrisponderebbe un reddito totale di 100 e non di 60) Si noti che devono essere note le numerositagrave degli intervalli per poter procedere in questo modo
Nel caso in cui si disponga dellrsquoinformazione sullrsquoammontare totale di carattere in un intervallo egrave consigliabile discretizzare gli intervalli in modo ldquocoerenterdquo con tale informazione
Esempio se nellrsquointervallo [515) di numerositagrave Ni=10 il carattere totale egrave pari a 60 egrave preferibile discretizzare lrsquointervallo assumendo come punto ldquomediordquo il valore 6 e non il valore 10 (al quale corrisponderebbe un reddito totale di 100 e non di 60) Si noti che devono essere note le numerositagrave degli intervalli per poter procedere in questo modo
Se si desidera ricavare lrsquoindice o la curva di concentrazione per una variabile continua per intervallo il modo piugrave semplice di procedere consiste nel ldquodiscretizzarerdquo la variabile considerando le frequenze ldquoconcentraterdquo nei punti medi degli intervalli Si puograve poi procedere come nel caso precedente
Se si desidera ricavare lrsquoindice o la curva di concentrazione per una variabile continua per intervallo il modo piugrave semplice di procedere consiste nel ldquodiscretizzarerdquo la variabile considerando le frequenze ldquoconcentraterdquo nei punti medi degli intervalli Si puograve poi procedere come nel caso precedente
Variabili statistiche continue per intervallo
19
Se X egrave una variabile statistica continua non negativa con densitagrave f(x) e media finita μ le espressioni delle frequenze e delle intensitagrave cumulate diventano
Se X egrave una variabile statistica continua non negativa con densitagrave f(x) e media finita μ le espressioni delle frequenze e delle intensitagrave cumulate diventano
Variabili statistiche continue
Nota Talvolta si esprimono F e Q in funzione della frequenza cumulata r In tal caso si ha x = F-1( r ) da cui le nuove variabili
20
Il valore di R per un carattere con distribuzione continua si puograve ottenere come nel caso discreto rapportando lrsquoarea di concentrazione al suo valore massimo pari ad 12
Il valore di R per un carattere con distribuzione continua si puograve ottenere come nel caso discreto rapportando lrsquoarea di concentrazione al suo valore massimo pari ad 12
Variabili statistiche continue
Lrsquoindice di Gini egrave quindi pari a due volte lrsquoarea di concentrazione
Nota essendo Amax =12 si ha R=Ř
ConfrontiPuograve essere interessante confrontare la concentrazione di due caratteri
(o equivalentemente dello stesso carattere in due istanti diversi o in due ambiti territoriali diversi)
Esempio 1 il reddito risulta piugrave concentrato in Italia o in Francia
Esempio 2 la concentrazione del reddito in Italia era maggiore negli anni lsquo80 o negli anni lsquo90
Un modo semplice per stabilire quale carattere egrave maggiormente concentrato egrave quello di confrontare graficamente le curve di concentrazione nei due ambiti territoriali (o temporali) e stabilire quale si trova al di sopra
21
bull Non egrave detto che una delle due curve sia al di sopra dellrsquoaltra le curve si possono intersecare Si puograve tuttavia mostrare che se il carattere varia linearmente tra gli ambiti considerati allora le curve non si intersecano
bull In generale si puograve effettuare il confronto usando lrsquoindice di Gini
bull Poicheacute G=2A=1-2Area_sotto_la_curva_Lorenz il confronto attraverso lrsquoindici di Gini equivale al confronto tra le aree al di sotto delle curve di Lorenz dei due caratteri
Confronti
Confronti
Esempio la concentrazione del reddito nel mondo usando lrsquoindice R
23
Fonte CIA The world Factbook 2009
24
Esempio di Confronto Tra DistribuzioniSi riportano di seguito le distribuzioni dei finanziamenti concessi da un istituto bancario per lrsquoacquisto della prima casa a giovani coppie residenti in Campania ed in Sardegna
a) In quale regione risulta piugrave elevata la concentrazione dei finanziamenti concessi
b) Confrontare graficamente i diversi livelli di concentrazione dei finanziamenti nelle due regioni
Campania
Finanziamenti (migliaia di Euro) ni
0-50 10
50-100 25
100-150 37
150-200 22
200-250 6
Totale 100
Sardegna
Finanziamenti (migliaia di Euro) ni
0-50 57
50-100 3
100-150 7
150-200 8
200-250 25
Totale 100
25
Sardegna
Finanziamenti (migliaia di Euro) ni Ni pi xi xi ni Xi qi pi+1- pi qi+1+ qi (pi+1- pi)(qi+1+ qi)
0 0 0 0000 0 0 0 0000 0570 0149 0085
0-50 57 57 0570 25 1425 1425 0149 0030 0322 0010
50-100 3 60 0600 75 225 1650 0173 0070 0437 0031
100-150 7 67 0670 125 875 2525 0264 0080 0675 0054
150-200 8 75 0750 175 1400 3925 0411 0250 1411 0353
200-250 25 100 1000 225 5625 9550 1000 - - -
Totale 100 9550 0532
Concentrazione dei finanziamenti in Sardegna
26
Concentrazione dei finanziamenti in Campania
Campania
Finanziamenti (migliaia di Euro) ni Ni pi xi xi ni Xi qi pi+1- pi qi+1+ qi (pi+1- pi)(qi+1+ qi)
0 0 0 0000 0 0 0 0000 0100 0021 0002
0-50 10 10 0100 25 250 250 0021 0250 0199 0050
50-100 25 35 0350 75 1875 2125 0178 0370 0743 0275
100-150 37 72 0720 125 4625 6750 0565 0220 1452 0319
150-200 22 94 0940 175 3850 10600 0887 0060 1887 0113
200-250 6 100 1000 225 1350 11950 1000 - - -
Totale 100 11950 0759
27
00
01
02
03
04
05
06
07
08
09
10
00 01 02 03 04 05 06 07 08 09 10
pi
qi
Equidistribuzione Sardegna Campania
4680R~sar 2410R
~cam La concentrazione egrave piugrave
elevata in Sardegna
La curva di Lorenz conferma questo risultato
28
Riferimenti
bull C Gini (1912) Variabilitagrave e mutabilitagrave Contributo allo studio delle distribuzioni e relazioni statistiche Studi economici-giuridici dela Regia Universitagrave di Cagliari anno III
bull Lorenz M O (1905) Methods of measuring the concentration of wealth Publications of the American Statistical Association (Publications of the American Statistical Association Vol 9 No 70) 9 (70) 209ndash219
bull Per ulteriori riferimenti si possono consultare utilmente le pagine di Wikipedia relative allrsquoindice di Gini e alla curva di Lorenz
7
Curva di concentrazione
La curva di concentrazione egrave sempre compresa potendo eventualmente coincidere tra le due seguenti
1La bisettrice di equazione Q=F Lungo la bisettrice Fi=Qi per ogni i da cui segue che ogni unitagrave possiede una quantitagrave di carattere pari alla media dello stesso nella popolazione La bisettrice rappresenta quindi la situazione di equiripartizione
2 La curva passante per i punti (Fi0) i=1hellipN-1 e (11) In tal caso tutto il carattere egrave concentrato in una sola unitagrave statistica (lrsquoN-esima) e rappresenta quindi la situazione di massima concentrazione
Un esempio
8
80 90 21 23 32 16 62Dati i redditi di 7 individui
per ricavare la curva di concentrazione organizziamo le osservazioni in tabella (avendo cura di ordinarle in base ai valori di x ad esempio X1=16 percheacute lrsquoindividuo piugrave povero possiede 16) calcoliamo le coordinate dei punti (FiQi) e le congiungiamo Nel caso in esame la curva egrave piugrave vicina alla bisettrice
i x_i F_i Q_i
0 0 0
1 16 01429 00494
2 21 02857 01142
3 23 04286 01852
4 32 05714 02840
5 62 07143 04753
6 80 08571 07222
7 90 1 1
9
Indici di concentrazione
La curva di Lorenz-Gini egrave uno strumento grafico per rappresentare la concentrazione di un carattere Puograve tuttavia essere comodo valutare la concentrazione attraverso un indice numerico
Intuitivamente quanto piugrave la bisettrice si discosta dalla curva di concentrazione tanto maggiore egrave la concentrazione del carattere Ersquo naturale quindi costruire un indice di concentrazione basato sullo ldquoscostamentordquo della curva dalla bisettrice Una misura dello scostamento puograve essere basata
bullsulle distanze verticali tra la curva di concentrazione e la bisettricebullsullrsquoarea compresa tra la curva di concentrazione e la bisettrice
10
Indice di concentrazione (1) Le distanze verticali tra la curva di concentrazione e la bisettrice sono date da (Fi ndash Qi)
e sono non negative Un indice relativo di concentrazione si puograve ottenere dividendo la somma delle (Fi ndash Qi) per il valore massimo che tali differenze possono assumere
Lrsquoindice sopra egrave lrsquoindice di concentrazione di Gini Si ha 0 le R le 1 e in particolare
R = 0 nel caso di equiripartizione infatti in tal caso Fi - Qi =0 i=12hellipN-1
R = 1 nel caso di massima concentrazione infatti in tal caso Fi - Qi = Fi i=12hellipN-1
11
0
01
02
03
04
05
06
07
08
09
1
0 02 04 06 08 1
qi
pi
Indice di concentrazione (2)
Lrsquoarea A in figura compresa tra la curva di concentrazione e la retta di equidistribuzione prende il nome di area di concentrazione Si noti che A egrave pari allrsquoarea del triangolo di coordinate (00) (10) (11) meno lrsquoarea B formata dai trapezi di altezza Fi-Fi-1 e basi Qi e Qi-1
Area del trapezio
frac12 x Somma delle basi x altezza
A B
12
Un indice relativo di concentrazione si puograve ottenere dividendo lrsquoarea di concentrazione per il valore massimo che lrsquoarea puograve assumere
dove Amax si ottiene considerando lrsquoarea nel caso x1 =hellip= xN-1 =0 xN=Nμ e risulta pari a 12 ndash (1N)(1)(12)=(N-1)2N
Per costruzione egrave 0 le R le 1 in particolarebullR=0 nel caso di equiripartizionebullR=1 nel caso di massima concentrazione
Si puograve dimostrare che il rapporto cosigrave costruito egrave uguale ad R
Indice di concentrazione (2)
13
Un altro indice di concentrazione sempre basato sullrsquoarea si puograve ottenere osservando che questrsquoultima non puograve superare il valore 12 Possiamo quindi rapportare lrsquoarea di concentrazione al suo valore massimo teorico
Si ha (percheacute) con i due indici che tendono a coincidere per N grande
Indice di concentrazione (3)
14
80 90 21 23 32 16 62
Un esempio
i x_i F_i Q_i (Fi-Qi)
1 16 01429 00494 00935
2 21 02857 01142 01715
3 23 04286 01852 02434
4 32 05714 02840 02875
5 62 07143 04753 02390
6 80 08571 07222 01349
7 90 1 1
Totale
324 3 11698
Dati i redditi di 7 individui
per ricavare la curva di concentrazione organizziamo le osservazioni in tabella avendo cura di ordinarle in base ai valori di x (ad esempio X1=16 percheacute lrsquoindividuo piugrave povero possiede 16) e calcoliamo le differenze (Fi-Qi)
15
80 90 21 23 32 16 62
Per calcolare R con la formula (2) usiamo una tabella simile alla precedente per ricavare il numeratore Lrsquoarea massima che compare a denominatore egrave pari allrsquoarea massima teorica meno lrsquoarea del triangolo di base F7-F6 e altezza 1 Il calcolo di Ř egrave del tutto analogo egrave sufficiente porre lrsquoarea massima pari a frac12
Data i redditi di 7 individui
Un esempio
i x_i F_i Q_i (Fi-Fi-1)(Qi+Qi-1)
1 16 01429 00494 00070
2 21 02857 01142 00233
3 23 04286 01852 00427
4 32 05714 02840 00670
5 62 07143 04753 01085
6 80 08571 07222 01710
7 90 1 1 02461
Totale
06658
16
Variabili statistiche discrete
Finora abbiamo considerato N osservazioni non raggruppate Per ricavare lrsquoindice o la curva di concentrazione a partire da una distribuzione di frequenze assolute possiamo usare le seguenti versioni ldquoponderaterdquo di Fi e Qi
dove x1hellipxk sono k valori distinti ordinati in modo non decrescente con numerositagrave n1 hellipnk
17
Variabili statistiche discrete
1
1
1
1
)(
k
ii
k
iii
F
QFR
Con le coppie (Fi Qi) si puograve ottenere un indice analogo ad R
In generale RneR sugli stessi dati Infatti con lrsquoindice sopra la situazione di massima concentrazione si ha quando tutto il carattere appartiene alla k-esima classe (e non allrsquo N-esimo individuo come nel caso di R)
Unendo le coppie (Fi Qi
) si ottiene la stessa curva di concentrazione che si otterrebbe utilizzando con i dati unitari Infatti si puograve dimostrare che la pendenza della curva non cambia passando tra individui che hanno lo stesso ammontare di carattere Lrsquounica differenza egrave che ora per ottenere la spezzata si devono congiungere kltN punti
18
Nel caso in cui si disponga dellrsquoinformazione sullrsquoammontare totale di carattere in un intervallo egrave consigliabile discretizzare gli intervalli in modo ldquocoerenterdquo con tale informazione
Esempio se nellrsquointervallo [515) di numerositagrave Ni=10 il carattere totale egrave pari a 60 egrave preferibile discretizzare lrsquointervallo assumendo come punto ldquomediordquo il valore 6 e non il valore 10 (al quale corrisponderebbe un reddito totale di 100 e non di 60) Si noti che devono essere note le numerositagrave degli intervalli per poter procedere in questo modo
Nel caso in cui si disponga dellrsquoinformazione sullrsquoammontare totale di carattere in un intervallo egrave consigliabile discretizzare gli intervalli in modo ldquocoerenterdquo con tale informazione
Esempio se nellrsquointervallo [515) di numerositagrave Ni=10 il carattere totale egrave pari a 60 egrave preferibile discretizzare lrsquointervallo assumendo come punto ldquomediordquo il valore 6 e non il valore 10 (al quale corrisponderebbe un reddito totale di 100 e non di 60) Si noti che devono essere note le numerositagrave degli intervalli per poter procedere in questo modo
Se si desidera ricavare lrsquoindice o la curva di concentrazione per una variabile continua per intervallo il modo piugrave semplice di procedere consiste nel ldquodiscretizzarerdquo la variabile considerando le frequenze ldquoconcentraterdquo nei punti medi degli intervalli Si puograve poi procedere come nel caso precedente
Se si desidera ricavare lrsquoindice o la curva di concentrazione per una variabile continua per intervallo il modo piugrave semplice di procedere consiste nel ldquodiscretizzarerdquo la variabile considerando le frequenze ldquoconcentraterdquo nei punti medi degli intervalli Si puograve poi procedere come nel caso precedente
Variabili statistiche continue per intervallo
19
Se X egrave una variabile statistica continua non negativa con densitagrave f(x) e media finita μ le espressioni delle frequenze e delle intensitagrave cumulate diventano
Se X egrave una variabile statistica continua non negativa con densitagrave f(x) e media finita μ le espressioni delle frequenze e delle intensitagrave cumulate diventano
Variabili statistiche continue
Nota Talvolta si esprimono F e Q in funzione della frequenza cumulata r In tal caso si ha x = F-1( r ) da cui le nuove variabili
20
Il valore di R per un carattere con distribuzione continua si puograve ottenere come nel caso discreto rapportando lrsquoarea di concentrazione al suo valore massimo pari ad 12
Il valore di R per un carattere con distribuzione continua si puograve ottenere come nel caso discreto rapportando lrsquoarea di concentrazione al suo valore massimo pari ad 12
Variabili statistiche continue
Lrsquoindice di Gini egrave quindi pari a due volte lrsquoarea di concentrazione
Nota essendo Amax =12 si ha R=Ř
ConfrontiPuograve essere interessante confrontare la concentrazione di due caratteri
(o equivalentemente dello stesso carattere in due istanti diversi o in due ambiti territoriali diversi)
Esempio 1 il reddito risulta piugrave concentrato in Italia o in Francia
Esempio 2 la concentrazione del reddito in Italia era maggiore negli anni lsquo80 o negli anni lsquo90
Un modo semplice per stabilire quale carattere egrave maggiormente concentrato egrave quello di confrontare graficamente le curve di concentrazione nei due ambiti territoriali (o temporali) e stabilire quale si trova al di sopra
21
bull Non egrave detto che una delle due curve sia al di sopra dellrsquoaltra le curve si possono intersecare Si puograve tuttavia mostrare che se il carattere varia linearmente tra gli ambiti considerati allora le curve non si intersecano
bull In generale si puograve effettuare il confronto usando lrsquoindice di Gini
bull Poicheacute G=2A=1-2Area_sotto_la_curva_Lorenz il confronto attraverso lrsquoindici di Gini equivale al confronto tra le aree al di sotto delle curve di Lorenz dei due caratteri
Confronti
Confronti
Esempio la concentrazione del reddito nel mondo usando lrsquoindice R
23
Fonte CIA The world Factbook 2009
24
Esempio di Confronto Tra DistribuzioniSi riportano di seguito le distribuzioni dei finanziamenti concessi da un istituto bancario per lrsquoacquisto della prima casa a giovani coppie residenti in Campania ed in Sardegna
a) In quale regione risulta piugrave elevata la concentrazione dei finanziamenti concessi
b) Confrontare graficamente i diversi livelli di concentrazione dei finanziamenti nelle due regioni
Campania
Finanziamenti (migliaia di Euro) ni
0-50 10
50-100 25
100-150 37
150-200 22
200-250 6
Totale 100
Sardegna
Finanziamenti (migliaia di Euro) ni
0-50 57
50-100 3
100-150 7
150-200 8
200-250 25
Totale 100
25
Sardegna
Finanziamenti (migliaia di Euro) ni Ni pi xi xi ni Xi qi pi+1- pi qi+1+ qi (pi+1- pi)(qi+1+ qi)
0 0 0 0000 0 0 0 0000 0570 0149 0085
0-50 57 57 0570 25 1425 1425 0149 0030 0322 0010
50-100 3 60 0600 75 225 1650 0173 0070 0437 0031
100-150 7 67 0670 125 875 2525 0264 0080 0675 0054
150-200 8 75 0750 175 1400 3925 0411 0250 1411 0353
200-250 25 100 1000 225 5625 9550 1000 - - -
Totale 100 9550 0532
Concentrazione dei finanziamenti in Sardegna
26
Concentrazione dei finanziamenti in Campania
Campania
Finanziamenti (migliaia di Euro) ni Ni pi xi xi ni Xi qi pi+1- pi qi+1+ qi (pi+1- pi)(qi+1+ qi)
0 0 0 0000 0 0 0 0000 0100 0021 0002
0-50 10 10 0100 25 250 250 0021 0250 0199 0050
50-100 25 35 0350 75 1875 2125 0178 0370 0743 0275
100-150 37 72 0720 125 4625 6750 0565 0220 1452 0319
150-200 22 94 0940 175 3850 10600 0887 0060 1887 0113
200-250 6 100 1000 225 1350 11950 1000 - - -
Totale 100 11950 0759
27
00
01
02
03
04
05
06
07
08
09
10
00 01 02 03 04 05 06 07 08 09 10
pi
qi
Equidistribuzione Sardegna Campania
4680R~sar 2410R
~cam La concentrazione egrave piugrave
elevata in Sardegna
La curva di Lorenz conferma questo risultato
28
Riferimenti
bull C Gini (1912) Variabilitagrave e mutabilitagrave Contributo allo studio delle distribuzioni e relazioni statistiche Studi economici-giuridici dela Regia Universitagrave di Cagliari anno III
bull Lorenz M O (1905) Methods of measuring the concentration of wealth Publications of the American Statistical Association (Publications of the American Statistical Association Vol 9 No 70) 9 (70) 209ndash219
bull Per ulteriori riferimenti si possono consultare utilmente le pagine di Wikipedia relative allrsquoindice di Gini e alla curva di Lorenz
Un esempio
8
80 90 21 23 32 16 62Dati i redditi di 7 individui
per ricavare la curva di concentrazione organizziamo le osservazioni in tabella (avendo cura di ordinarle in base ai valori di x ad esempio X1=16 percheacute lrsquoindividuo piugrave povero possiede 16) calcoliamo le coordinate dei punti (FiQi) e le congiungiamo Nel caso in esame la curva egrave piugrave vicina alla bisettrice
i x_i F_i Q_i
0 0 0
1 16 01429 00494
2 21 02857 01142
3 23 04286 01852
4 32 05714 02840
5 62 07143 04753
6 80 08571 07222
7 90 1 1
9
Indici di concentrazione
La curva di Lorenz-Gini egrave uno strumento grafico per rappresentare la concentrazione di un carattere Puograve tuttavia essere comodo valutare la concentrazione attraverso un indice numerico
Intuitivamente quanto piugrave la bisettrice si discosta dalla curva di concentrazione tanto maggiore egrave la concentrazione del carattere Ersquo naturale quindi costruire un indice di concentrazione basato sullo ldquoscostamentordquo della curva dalla bisettrice Una misura dello scostamento puograve essere basata
bullsulle distanze verticali tra la curva di concentrazione e la bisettricebullsullrsquoarea compresa tra la curva di concentrazione e la bisettrice
10
Indice di concentrazione (1) Le distanze verticali tra la curva di concentrazione e la bisettrice sono date da (Fi ndash Qi)
e sono non negative Un indice relativo di concentrazione si puograve ottenere dividendo la somma delle (Fi ndash Qi) per il valore massimo che tali differenze possono assumere
Lrsquoindice sopra egrave lrsquoindice di concentrazione di Gini Si ha 0 le R le 1 e in particolare
R = 0 nel caso di equiripartizione infatti in tal caso Fi - Qi =0 i=12hellipN-1
R = 1 nel caso di massima concentrazione infatti in tal caso Fi - Qi = Fi i=12hellipN-1
11
0
01
02
03
04
05
06
07
08
09
1
0 02 04 06 08 1
qi
pi
Indice di concentrazione (2)
Lrsquoarea A in figura compresa tra la curva di concentrazione e la retta di equidistribuzione prende il nome di area di concentrazione Si noti che A egrave pari allrsquoarea del triangolo di coordinate (00) (10) (11) meno lrsquoarea B formata dai trapezi di altezza Fi-Fi-1 e basi Qi e Qi-1
Area del trapezio
frac12 x Somma delle basi x altezza
A B
12
Un indice relativo di concentrazione si puograve ottenere dividendo lrsquoarea di concentrazione per il valore massimo che lrsquoarea puograve assumere
dove Amax si ottiene considerando lrsquoarea nel caso x1 =hellip= xN-1 =0 xN=Nμ e risulta pari a 12 ndash (1N)(1)(12)=(N-1)2N
Per costruzione egrave 0 le R le 1 in particolarebullR=0 nel caso di equiripartizionebullR=1 nel caso di massima concentrazione
Si puograve dimostrare che il rapporto cosigrave costruito egrave uguale ad R
Indice di concentrazione (2)
13
Un altro indice di concentrazione sempre basato sullrsquoarea si puograve ottenere osservando che questrsquoultima non puograve superare il valore 12 Possiamo quindi rapportare lrsquoarea di concentrazione al suo valore massimo teorico
Si ha (percheacute) con i due indici che tendono a coincidere per N grande
Indice di concentrazione (3)
14
80 90 21 23 32 16 62
Un esempio
i x_i F_i Q_i (Fi-Qi)
1 16 01429 00494 00935
2 21 02857 01142 01715
3 23 04286 01852 02434
4 32 05714 02840 02875
5 62 07143 04753 02390
6 80 08571 07222 01349
7 90 1 1
Totale
324 3 11698
Dati i redditi di 7 individui
per ricavare la curva di concentrazione organizziamo le osservazioni in tabella avendo cura di ordinarle in base ai valori di x (ad esempio X1=16 percheacute lrsquoindividuo piugrave povero possiede 16) e calcoliamo le differenze (Fi-Qi)
15
80 90 21 23 32 16 62
Per calcolare R con la formula (2) usiamo una tabella simile alla precedente per ricavare il numeratore Lrsquoarea massima che compare a denominatore egrave pari allrsquoarea massima teorica meno lrsquoarea del triangolo di base F7-F6 e altezza 1 Il calcolo di Ř egrave del tutto analogo egrave sufficiente porre lrsquoarea massima pari a frac12
Data i redditi di 7 individui
Un esempio
i x_i F_i Q_i (Fi-Fi-1)(Qi+Qi-1)
1 16 01429 00494 00070
2 21 02857 01142 00233
3 23 04286 01852 00427
4 32 05714 02840 00670
5 62 07143 04753 01085
6 80 08571 07222 01710
7 90 1 1 02461
Totale
06658
16
Variabili statistiche discrete
Finora abbiamo considerato N osservazioni non raggruppate Per ricavare lrsquoindice o la curva di concentrazione a partire da una distribuzione di frequenze assolute possiamo usare le seguenti versioni ldquoponderaterdquo di Fi e Qi
dove x1hellipxk sono k valori distinti ordinati in modo non decrescente con numerositagrave n1 hellipnk
17
Variabili statistiche discrete
1
1
1
1
)(
k
ii
k
iii
F
QFR
Con le coppie (Fi Qi) si puograve ottenere un indice analogo ad R
In generale RneR sugli stessi dati Infatti con lrsquoindice sopra la situazione di massima concentrazione si ha quando tutto il carattere appartiene alla k-esima classe (e non allrsquo N-esimo individuo come nel caso di R)
Unendo le coppie (Fi Qi
) si ottiene la stessa curva di concentrazione che si otterrebbe utilizzando con i dati unitari Infatti si puograve dimostrare che la pendenza della curva non cambia passando tra individui che hanno lo stesso ammontare di carattere Lrsquounica differenza egrave che ora per ottenere la spezzata si devono congiungere kltN punti
18
Nel caso in cui si disponga dellrsquoinformazione sullrsquoammontare totale di carattere in un intervallo egrave consigliabile discretizzare gli intervalli in modo ldquocoerenterdquo con tale informazione
Esempio se nellrsquointervallo [515) di numerositagrave Ni=10 il carattere totale egrave pari a 60 egrave preferibile discretizzare lrsquointervallo assumendo come punto ldquomediordquo il valore 6 e non il valore 10 (al quale corrisponderebbe un reddito totale di 100 e non di 60) Si noti che devono essere note le numerositagrave degli intervalli per poter procedere in questo modo
Nel caso in cui si disponga dellrsquoinformazione sullrsquoammontare totale di carattere in un intervallo egrave consigliabile discretizzare gli intervalli in modo ldquocoerenterdquo con tale informazione
Esempio se nellrsquointervallo [515) di numerositagrave Ni=10 il carattere totale egrave pari a 60 egrave preferibile discretizzare lrsquointervallo assumendo come punto ldquomediordquo il valore 6 e non il valore 10 (al quale corrisponderebbe un reddito totale di 100 e non di 60) Si noti che devono essere note le numerositagrave degli intervalli per poter procedere in questo modo
Se si desidera ricavare lrsquoindice o la curva di concentrazione per una variabile continua per intervallo il modo piugrave semplice di procedere consiste nel ldquodiscretizzarerdquo la variabile considerando le frequenze ldquoconcentraterdquo nei punti medi degli intervalli Si puograve poi procedere come nel caso precedente
Se si desidera ricavare lrsquoindice o la curva di concentrazione per una variabile continua per intervallo il modo piugrave semplice di procedere consiste nel ldquodiscretizzarerdquo la variabile considerando le frequenze ldquoconcentraterdquo nei punti medi degli intervalli Si puograve poi procedere come nel caso precedente
Variabili statistiche continue per intervallo
19
Se X egrave una variabile statistica continua non negativa con densitagrave f(x) e media finita μ le espressioni delle frequenze e delle intensitagrave cumulate diventano
Se X egrave una variabile statistica continua non negativa con densitagrave f(x) e media finita μ le espressioni delle frequenze e delle intensitagrave cumulate diventano
Variabili statistiche continue
Nota Talvolta si esprimono F e Q in funzione della frequenza cumulata r In tal caso si ha x = F-1( r ) da cui le nuove variabili
20
Il valore di R per un carattere con distribuzione continua si puograve ottenere come nel caso discreto rapportando lrsquoarea di concentrazione al suo valore massimo pari ad 12
Il valore di R per un carattere con distribuzione continua si puograve ottenere come nel caso discreto rapportando lrsquoarea di concentrazione al suo valore massimo pari ad 12
Variabili statistiche continue
Lrsquoindice di Gini egrave quindi pari a due volte lrsquoarea di concentrazione
Nota essendo Amax =12 si ha R=Ř
ConfrontiPuograve essere interessante confrontare la concentrazione di due caratteri
(o equivalentemente dello stesso carattere in due istanti diversi o in due ambiti territoriali diversi)
Esempio 1 il reddito risulta piugrave concentrato in Italia o in Francia
Esempio 2 la concentrazione del reddito in Italia era maggiore negli anni lsquo80 o negli anni lsquo90
Un modo semplice per stabilire quale carattere egrave maggiormente concentrato egrave quello di confrontare graficamente le curve di concentrazione nei due ambiti territoriali (o temporali) e stabilire quale si trova al di sopra
21
bull Non egrave detto che una delle due curve sia al di sopra dellrsquoaltra le curve si possono intersecare Si puograve tuttavia mostrare che se il carattere varia linearmente tra gli ambiti considerati allora le curve non si intersecano
bull In generale si puograve effettuare il confronto usando lrsquoindice di Gini
bull Poicheacute G=2A=1-2Area_sotto_la_curva_Lorenz il confronto attraverso lrsquoindici di Gini equivale al confronto tra le aree al di sotto delle curve di Lorenz dei due caratteri
Confronti
Confronti
Esempio la concentrazione del reddito nel mondo usando lrsquoindice R
23
Fonte CIA The world Factbook 2009
24
Esempio di Confronto Tra DistribuzioniSi riportano di seguito le distribuzioni dei finanziamenti concessi da un istituto bancario per lrsquoacquisto della prima casa a giovani coppie residenti in Campania ed in Sardegna
a) In quale regione risulta piugrave elevata la concentrazione dei finanziamenti concessi
b) Confrontare graficamente i diversi livelli di concentrazione dei finanziamenti nelle due regioni
Campania
Finanziamenti (migliaia di Euro) ni
0-50 10
50-100 25
100-150 37
150-200 22
200-250 6
Totale 100
Sardegna
Finanziamenti (migliaia di Euro) ni
0-50 57
50-100 3
100-150 7
150-200 8
200-250 25
Totale 100
25
Sardegna
Finanziamenti (migliaia di Euro) ni Ni pi xi xi ni Xi qi pi+1- pi qi+1+ qi (pi+1- pi)(qi+1+ qi)
0 0 0 0000 0 0 0 0000 0570 0149 0085
0-50 57 57 0570 25 1425 1425 0149 0030 0322 0010
50-100 3 60 0600 75 225 1650 0173 0070 0437 0031
100-150 7 67 0670 125 875 2525 0264 0080 0675 0054
150-200 8 75 0750 175 1400 3925 0411 0250 1411 0353
200-250 25 100 1000 225 5625 9550 1000 - - -
Totale 100 9550 0532
Concentrazione dei finanziamenti in Sardegna
26
Concentrazione dei finanziamenti in Campania
Campania
Finanziamenti (migliaia di Euro) ni Ni pi xi xi ni Xi qi pi+1- pi qi+1+ qi (pi+1- pi)(qi+1+ qi)
0 0 0 0000 0 0 0 0000 0100 0021 0002
0-50 10 10 0100 25 250 250 0021 0250 0199 0050
50-100 25 35 0350 75 1875 2125 0178 0370 0743 0275
100-150 37 72 0720 125 4625 6750 0565 0220 1452 0319
150-200 22 94 0940 175 3850 10600 0887 0060 1887 0113
200-250 6 100 1000 225 1350 11950 1000 - - -
Totale 100 11950 0759
27
00
01
02
03
04
05
06
07
08
09
10
00 01 02 03 04 05 06 07 08 09 10
pi
qi
Equidistribuzione Sardegna Campania
4680R~sar 2410R
~cam La concentrazione egrave piugrave
elevata in Sardegna
La curva di Lorenz conferma questo risultato
28
Riferimenti
bull C Gini (1912) Variabilitagrave e mutabilitagrave Contributo allo studio delle distribuzioni e relazioni statistiche Studi economici-giuridici dela Regia Universitagrave di Cagliari anno III
bull Lorenz M O (1905) Methods of measuring the concentration of wealth Publications of the American Statistical Association (Publications of the American Statistical Association Vol 9 No 70) 9 (70) 209ndash219
bull Per ulteriori riferimenti si possono consultare utilmente le pagine di Wikipedia relative allrsquoindice di Gini e alla curva di Lorenz
9
Indici di concentrazione
La curva di Lorenz-Gini egrave uno strumento grafico per rappresentare la concentrazione di un carattere Puograve tuttavia essere comodo valutare la concentrazione attraverso un indice numerico
Intuitivamente quanto piugrave la bisettrice si discosta dalla curva di concentrazione tanto maggiore egrave la concentrazione del carattere Ersquo naturale quindi costruire un indice di concentrazione basato sullo ldquoscostamentordquo della curva dalla bisettrice Una misura dello scostamento puograve essere basata
bullsulle distanze verticali tra la curva di concentrazione e la bisettricebullsullrsquoarea compresa tra la curva di concentrazione e la bisettrice
10
Indice di concentrazione (1) Le distanze verticali tra la curva di concentrazione e la bisettrice sono date da (Fi ndash Qi)
e sono non negative Un indice relativo di concentrazione si puograve ottenere dividendo la somma delle (Fi ndash Qi) per il valore massimo che tali differenze possono assumere
Lrsquoindice sopra egrave lrsquoindice di concentrazione di Gini Si ha 0 le R le 1 e in particolare
R = 0 nel caso di equiripartizione infatti in tal caso Fi - Qi =0 i=12hellipN-1
R = 1 nel caso di massima concentrazione infatti in tal caso Fi - Qi = Fi i=12hellipN-1
11
0
01
02
03
04
05
06
07
08
09
1
0 02 04 06 08 1
qi
pi
Indice di concentrazione (2)
Lrsquoarea A in figura compresa tra la curva di concentrazione e la retta di equidistribuzione prende il nome di area di concentrazione Si noti che A egrave pari allrsquoarea del triangolo di coordinate (00) (10) (11) meno lrsquoarea B formata dai trapezi di altezza Fi-Fi-1 e basi Qi e Qi-1
Area del trapezio
frac12 x Somma delle basi x altezza
A B
12
Un indice relativo di concentrazione si puograve ottenere dividendo lrsquoarea di concentrazione per il valore massimo che lrsquoarea puograve assumere
dove Amax si ottiene considerando lrsquoarea nel caso x1 =hellip= xN-1 =0 xN=Nμ e risulta pari a 12 ndash (1N)(1)(12)=(N-1)2N
Per costruzione egrave 0 le R le 1 in particolarebullR=0 nel caso di equiripartizionebullR=1 nel caso di massima concentrazione
Si puograve dimostrare che il rapporto cosigrave costruito egrave uguale ad R
Indice di concentrazione (2)
13
Un altro indice di concentrazione sempre basato sullrsquoarea si puograve ottenere osservando che questrsquoultima non puograve superare il valore 12 Possiamo quindi rapportare lrsquoarea di concentrazione al suo valore massimo teorico
Si ha (percheacute) con i due indici che tendono a coincidere per N grande
Indice di concentrazione (3)
14
80 90 21 23 32 16 62
Un esempio
i x_i F_i Q_i (Fi-Qi)
1 16 01429 00494 00935
2 21 02857 01142 01715
3 23 04286 01852 02434
4 32 05714 02840 02875
5 62 07143 04753 02390
6 80 08571 07222 01349
7 90 1 1
Totale
324 3 11698
Dati i redditi di 7 individui
per ricavare la curva di concentrazione organizziamo le osservazioni in tabella avendo cura di ordinarle in base ai valori di x (ad esempio X1=16 percheacute lrsquoindividuo piugrave povero possiede 16) e calcoliamo le differenze (Fi-Qi)
15
80 90 21 23 32 16 62
Per calcolare R con la formula (2) usiamo una tabella simile alla precedente per ricavare il numeratore Lrsquoarea massima che compare a denominatore egrave pari allrsquoarea massima teorica meno lrsquoarea del triangolo di base F7-F6 e altezza 1 Il calcolo di Ř egrave del tutto analogo egrave sufficiente porre lrsquoarea massima pari a frac12
Data i redditi di 7 individui
Un esempio
i x_i F_i Q_i (Fi-Fi-1)(Qi+Qi-1)
1 16 01429 00494 00070
2 21 02857 01142 00233
3 23 04286 01852 00427
4 32 05714 02840 00670
5 62 07143 04753 01085
6 80 08571 07222 01710
7 90 1 1 02461
Totale
06658
16
Variabili statistiche discrete
Finora abbiamo considerato N osservazioni non raggruppate Per ricavare lrsquoindice o la curva di concentrazione a partire da una distribuzione di frequenze assolute possiamo usare le seguenti versioni ldquoponderaterdquo di Fi e Qi
dove x1hellipxk sono k valori distinti ordinati in modo non decrescente con numerositagrave n1 hellipnk
17
Variabili statistiche discrete
1
1
1
1
)(
k
ii
k
iii
F
QFR
Con le coppie (Fi Qi) si puograve ottenere un indice analogo ad R
In generale RneR sugli stessi dati Infatti con lrsquoindice sopra la situazione di massima concentrazione si ha quando tutto il carattere appartiene alla k-esima classe (e non allrsquo N-esimo individuo come nel caso di R)
Unendo le coppie (Fi Qi
) si ottiene la stessa curva di concentrazione che si otterrebbe utilizzando con i dati unitari Infatti si puograve dimostrare che la pendenza della curva non cambia passando tra individui che hanno lo stesso ammontare di carattere Lrsquounica differenza egrave che ora per ottenere la spezzata si devono congiungere kltN punti
18
Nel caso in cui si disponga dellrsquoinformazione sullrsquoammontare totale di carattere in un intervallo egrave consigliabile discretizzare gli intervalli in modo ldquocoerenterdquo con tale informazione
Esempio se nellrsquointervallo [515) di numerositagrave Ni=10 il carattere totale egrave pari a 60 egrave preferibile discretizzare lrsquointervallo assumendo come punto ldquomediordquo il valore 6 e non il valore 10 (al quale corrisponderebbe un reddito totale di 100 e non di 60) Si noti che devono essere note le numerositagrave degli intervalli per poter procedere in questo modo
Nel caso in cui si disponga dellrsquoinformazione sullrsquoammontare totale di carattere in un intervallo egrave consigliabile discretizzare gli intervalli in modo ldquocoerenterdquo con tale informazione
Esempio se nellrsquointervallo [515) di numerositagrave Ni=10 il carattere totale egrave pari a 60 egrave preferibile discretizzare lrsquointervallo assumendo come punto ldquomediordquo il valore 6 e non il valore 10 (al quale corrisponderebbe un reddito totale di 100 e non di 60) Si noti che devono essere note le numerositagrave degli intervalli per poter procedere in questo modo
Se si desidera ricavare lrsquoindice o la curva di concentrazione per una variabile continua per intervallo il modo piugrave semplice di procedere consiste nel ldquodiscretizzarerdquo la variabile considerando le frequenze ldquoconcentraterdquo nei punti medi degli intervalli Si puograve poi procedere come nel caso precedente
Se si desidera ricavare lrsquoindice o la curva di concentrazione per una variabile continua per intervallo il modo piugrave semplice di procedere consiste nel ldquodiscretizzarerdquo la variabile considerando le frequenze ldquoconcentraterdquo nei punti medi degli intervalli Si puograve poi procedere come nel caso precedente
Variabili statistiche continue per intervallo
19
Se X egrave una variabile statistica continua non negativa con densitagrave f(x) e media finita μ le espressioni delle frequenze e delle intensitagrave cumulate diventano
Se X egrave una variabile statistica continua non negativa con densitagrave f(x) e media finita μ le espressioni delle frequenze e delle intensitagrave cumulate diventano
Variabili statistiche continue
Nota Talvolta si esprimono F e Q in funzione della frequenza cumulata r In tal caso si ha x = F-1( r ) da cui le nuove variabili
20
Il valore di R per un carattere con distribuzione continua si puograve ottenere come nel caso discreto rapportando lrsquoarea di concentrazione al suo valore massimo pari ad 12
Il valore di R per un carattere con distribuzione continua si puograve ottenere come nel caso discreto rapportando lrsquoarea di concentrazione al suo valore massimo pari ad 12
Variabili statistiche continue
Lrsquoindice di Gini egrave quindi pari a due volte lrsquoarea di concentrazione
Nota essendo Amax =12 si ha R=Ř
ConfrontiPuograve essere interessante confrontare la concentrazione di due caratteri
(o equivalentemente dello stesso carattere in due istanti diversi o in due ambiti territoriali diversi)
Esempio 1 il reddito risulta piugrave concentrato in Italia o in Francia
Esempio 2 la concentrazione del reddito in Italia era maggiore negli anni lsquo80 o negli anni lsquo90
Un modo semplice per stabilire quale carattere egrave maggiormente concentrato egrave quello di confrontare graficamente le curve di concentrazione nei due ambiti territoriali (o temporali) e stabilire quale si trova al di sopra
21
bull Non egrave detto che una delle due curve sia al di sopra dellrsquoaltra le curve si possono intersecare Si puograve tuttavia mostrare che se il carattere varia linearmente tra gli ambiti considerati allora le curve non si intersecano
bull In generale si puograve effettuare il confronto usando lrsquoindice di Gini
bull Poicheacute G=2A=1-2Area_sotto_la_curva_Lorenz il confronto attraverso lrsquoindici di Gini equivale al confronto tra le aree al di sotto delle curve di Lorenz dei due caratteri
Confronti
Confronti
Esempio la concentrazione del reddito nel mondo usando lrsquoindice R
23
Fonte CIA The world Factbook 2009
24
Esempio di Confronto Tra DistribuzioniSi riportano di seguito le distribuzioni dei finanziamenti concessi da un istituto bancario per lrsquoacquisto della prima casa a giovani coppie residenti in Campania ed in Sardegna
a) In quale regione risulta piugrave elevata la concentrazione dei finanziamenti concessi
b) Confrontare graficamente i diversi livelli di concentrazione dei finanziamenti nelle due regioni
Campania
Finanziamenti (migliaia di Euro) ni
0-50 10
50-100 25
100-150 37
150-200 22
200-250 6
Totale 100
Sardegna
Finanziamenti (migliaia di Euro) ni
0-50 57
50-100 3
100-150 7
150-200 8
200-250 25
Totale 100
25
Sardegna
Finanziamenti (migliaia di Euro) ni Ni pi xi xi ni Xi qi pi+1- pi qi+1+ qi (pi+1- pi)(qi+1+ qi)
0 0 0 0000 0 0 0 0000 0570 0149 0085
0-50 57 57 0570 25 1425 1425 0149 0030 0322 0010
50-100 3 60 0600 75 225 1650 0173 0070 0437 0031
100-150 7 67 0670 125 875 2525 0264 0080 0675 0054
150-200 8 75 0750 175 1400 3925 0411 0250 1411 0353
200-250 25 100 1000 225 5625 9550 1000 - - -
Totale 100 9550 0532
Concentrazione dei finanziamenti in Sardegna
26
Concentrazione dei finanziamenti in Campania
Campania
Finanziamenti (migliaia di Euro) ni Ni pi xi xi ni Xi qi pi+1- pi qi+1+ qi (pi+1- pi)(qi+1+ qi)
0 0 0 0000 0 0 0 0000 0100 0021 0002
0-50 10 10 0100 25 250 250 0021 0250 0199 0050
50-100 25 35 0350 75 1875 2125 0178 0370 0743 0275
100-150 37 72 0720 125 4625 6750 0565 0220 1452 0319
150-200 22 94 0940 175 3850 10600 0887 0060 1887 0113
200-250 6 100 1000 225 1350 11950 1000 - - -
Totale 100 11950 0759
27
00
01
02
03
04
05
06
07
08
09
10
00 01 02 03 04 05 06 07 08 09 10
pi
qi
Equidistribuzione Sardegna Campania
4680R~sar 2410R
~cam La concentrazione egrave piugrave
elevata in Sardegna
La curva di Lorenz conferma questo risultato
28
Riferimenti
bull C Gini (1912) Variabilitagrave e mutabilitagrave Contributo allo studio delle distribuzioni e relazioni statistiche Studi economici-giuridici dela Regia Universitagrave di Cagliari anno III
bull Lorenz M O (1905) Methods of measuring the concentration of wealth Publications of the American Statistical Association (Publications of the American Statistical Association Vol 9 No 70) 9 (70) 209ndash219
bull Per ulteriori riferimenti si possono consultare utilmente le pagine di Wikipedia relative allrsquoindice di Gini e alla curva di Lorenz
10
Indice di concentrazione (1) Le distanze verticali tra la curva di concentrazione e la bisettrice sono date da (Fi ndash Qi)
e sono non negative Un indice relativo di concentrazione si puograve ottenere dividendo la somma delle (Fi ndash Qi) per il valore massimo che tali differenze possono assumere
Lrsquoindice sopra egrave lrsquoindice di concentrazione di Gini Si ha 0 le R le 1 e in particolare
R = 0 nel caso di equiripartizione infatti in tal caso Fi - Qi =0 i=12hellipN-1
R = 1 nel caso di massima concentrazione infatti in tal caso Fi - Qi = Fi i=12hellipN-1
11
0
01
02
03
04
05
06
07
08
09
1
0 02 04 06 08 1
qi
pi
Indice di concentrazione (2)
Lrsquoarea A in figura compresa tra la curva di concentrazione e la retta di equidistribuzione prende il nome di area di concentrazione Si noti che A egrave pari allrsquoarea del triangolo di coordinate (00) (10) (11) meno lrsquoarea B formata dai trapezi di altezza Fi-Fi-1 e basi Qi e Qi-1
Area del trapezio
frac12 x Somma delle basi x altezza
A B
12
Un indice relativo di concentrazione si puograve ottenere dividendo lrsquoarea di concentrazione per il valore massimo che lrsquoarea puograve assumere
dove Amax si ottiene considerando lrsquoarea nel caso x1 =hellip= xN-1 =0 xN=Nμ e risulta pari a 12 ndash (1N)(1)(12)=(N-1)2N
Per costruzione egrave 0 le R le 1 in particolarebullR=0 nel caso di equiripartizionebullR=1 nel caso di massima concentrazione
Si puograve dimostrare che il rapporto cosigrave costruito egrave uguale ad R
Indice di concentrazione (2)
13
Un altro indice di concentrazione sempre basato sullrsquoarea si puograve ottenere osservando che questrsquoultima non puograve superare il valore 12 Possiamo quindi rapportare lrsquoarea di concentrazione al suo valore massimo teorico
Si ha (percheacute) con i due indici che tendono a coincidere per N grande
Indice di concentrazione (3)
14
80 90 21 23 32 16 62
Un esempio
i x_i F_i Q_i (Fi-Qi)
1 16 01429 00494 00935
2 21 02857 01142 01715
3 23 04286 01852 02434
4 32 05714 02840 02875
5 62 07143 04753 02390
6 80 08571 07222 01349
7 90 1 1
Totale
324 3 11698
Dati i redditi di 7 individui
per ricavare la curva di concentrazione organizziamo le osservazioni in tabella avendo cura di ordinarle in base ai valori di x (ad esempio X1=16 percheacute lrsquoindividuo piugrave povero possiede 16) e calcoliamo le differenze (Fi-Qi)
15
80 90 21 23 32 16 62
Per calcolare R con la formula (2) usiamo una tabella simile alla precedente per ricavare il numeratore Lrsquoarea massima che compare a denominatore egrave pari allrsquoarea massima teorica meno lrsquoarea del triangolo di base F7-F6 e altezza 1 Il calcolo di Ř egrave del tutto analogo egrave sufficiente porre lrsquoarea massima pari a frac12
Data i redditi di 7 individui
Un esempio
i x_i F_i Q_i (Fi-Fi-1)(Qi+Qi-1)
1 16 01429 00494 00070
2 21 02857 01142 00233
3 23 04286 01852 00427
4 32 05714 02840 00670
5 62 07143 04753 01085
6 80 08571 07222 01710
7 90 1 1 02461
Totale
06658
16
Variabili statistiche discrete
Finora abbiamo considerato N osservazioni non raggruppate Per ricavare lrsquoindice o la curva di concentrazione a partire da una distribuzione di frequenze assolute possiamo usare le seguenti versioni ldquoponderaterdquo di Fi e Qi
dove x1hellipxk sono k valori distinti ordinati in modo non decrescente con numerositagrave n1 hellipnk
17
Variabili statistiche discrete
1
1
1
1
)(
k
ii
k
iii
F
QFR
Con le coppie (Fi Qi) si puograve ottenere un indice analogo ad R
In generale RneR sugli stessi dati Infatti con lrsquoindice sopra la situazione di massima concentrazione si ha quando tutto il carattere appartiene alla k-esima classe (e non allrsquo N-esimo individuo come nel caso di R)
Unendo le coppie (Fi Qi
) si ottiene la stessa curva di concentrazione che si otterrebbe utilizzando con i dati unitari Infatti si puograve dimostrare che la pendenza della curva non cambia passando tra individui che hanno lo stesso ammontare di carattere Lrsquounica differenza egrave che ora per ottenere la spezzata si devono congiungere kltN punti
18
Nel caso in cui si disponga dellrsquoinformazione sullrsquoammontare totale di carattere in un intervallo egrave consigliabile discretizzare gli intervalli in modo ldquocoerenterdquo con tale informazione
Esempio se nellrsquointervallo [515) di numerositagrave Ni=10 il carattere totale egrave pari a 60 egrave preferibile discretizzare lrsquointervallo assumendo come punto ldquomediordquo il valore 6 e non il valore 10 (al quale corrisponderebbe un reddito totale di 100 e non di 60) Si noti che devono essere note le numerositagrave degli intervalli per poter procedere in questo modo
Nel caso in cui si disponga dellrsquoinformazione sullrsquoammontare totale di carattere in un intervallo egrave consigliabile discretizzare gli intervalli in modo ldquocoerenterdquo con tale informazione
Esempio se nellrsquointervallo [515) di numerositagrave Ni=10 il carattere totale egrave pari a 60 egrave preferibile discretizzare lrsquointervallo assumendo come punto ldquomediordquo il valore 6 e non il valore 10 (al quale corrisponderebbe un reddito totale di 100 e non di 60) Si noti che devono essere note le numerositagrave degli intervalli per poter procedere in questo modo
Se si desidera ricavare lrsquoindice o la curva di concentrazione per una variabile continua per intervallo il modo piugrave semplice di procedere consiste nel ldquodiscretizzarerdquo la variabile considerando le frequenze ldquoconcentraterdquo nei punti medi degli intervalli Si puograve poi procedere come nel caso precedente
Se si desidera ricavare lrsquoindice o la curva di concentrazione per una variabile continua per intervallo il modo piugrave semplice di procedere consiste nel ldquodiscretizzarerdquo la variabile considerando le frequenze ldquoconcentraterdquo nei punti medi degli intervalli Si puograve poi procedere come nel caso precedente
Variabili statistiche continue per intervallo
19
Se X egrave una variabile statistica continua non negativa con densitagrave f(x) e media finita μ le espressioni delle frequenze e delle intensitagrave cumulate diventano
Se X egrave una variabile statistica continua non negativa con densitagrave f(x) e media finita μ le espressioni delle frequenze e delle intensitagrave cumulate diventano
Variabili statistiche continue
Nota Talvolta si esprimono F e Q in funzione della frequenza cumulata r In tal caso si ha x = F-1( r ) da cui le nuove variabili
20
Il valore di R per un carattere con distribuzione continua si puograve ottenere come nel caso discreto rapportando lrsquoarea di concentrazione al suo valore massimo pari ad 12
Il valore di R per un carattere con distribuzione continua si puograve ottenere come nel caso discreto rapportando lrsquoarea di concentrazione al suo valore massimo pari ad 12
Variabili statistiche continue
Lrsquoindice di Gini egrave quindi pari a due volte lrsquoarea di concentrazione
Nota essendo Amax =12 si ha R=Ř
ConfrontiPuograve essere interessante confrontare la concentrazione di due caratteri
(o equivalentemente dello stesso carattere in due istanti diversi o in due ambiti territoriali diversi)
Esempio 1 il reddito risulta piugrave concentrato in Italia o in Francia
Esempio 2 la concentrazione del reddito in Italia era maggiore negli anni lsquo80 o negli anni lsquo90
Un modo semplice per stabilire quale carattere egrave maggiormente concentrato egrave quello di confrontare graficamente le curve di concentrazione nei due ambiti territoriali (o temporali) e stabilire quale si trova al di sopra
21
bull Non egrave detto che una delle due curve sia al di sopra dellrsquoaltra le curve si possono intersecare Si puograve tuttavia mostrare che se il carattere varia linearmente tra gli ambiti considerati allora le curve non si intersecano
bull In generale si puograve effettuare il confronto usando lrsquoindice di Gini
bull Poicheacute G=2A=1-2Area_sotto_la_curva_Lorenz il confronto attraverso lrsquoindici di Gini equivale al confronto tra le aree al di sotto delle curve di Lorenz dei due caratteri
Confronti
Confronti
Esempio la concentrazione del reddito nel mondo usando lrsquoindice R
23
Fonte CIA The world Factbook 2009
24
Esempio di Confronto Tra DistribuzioniSi riportano di seguito le distribuzioni dei finanziamenti concessi da un istituto bancario per lrsquoacquisto della prima casa a giovani coppie residenti in Campania ed in Sardegna
a) In quale regione risulta piugrave elevata la concentrazione dei finanziamenti concessi
b) Confrontare graficamente i diversi livelli di concentrazione dei finanziamenti nelle due regioni
Campania
Finanziamenti (migliaia di Euro) ni
0-50 10
50-100 25
100-150 37
150-200 22
200-250 6
Totale 100
Sardegna
Finanziamenti (migliaia di Euro) ni
0-50 57
50-100 3
100-150 7
150-200 8
200-250 25
Totale 100
25
Sardegna
Finanziamenti (migliaia di Euro) ni Ni pi xi xi ni Xi qi pi+1- pi qi+1+ qi (pi+1- pi)(qi+1+ qi)
0 0 0 0000 0 0 0 0000 0570 0149 0085
0-50 57 57 0570 25 1425 1425 0149 0030 0322 0010
50-100 3 60 0600 75 225 1650 0173 0070 0437 0031
100-150 7 67 0670 125 875 2525 0264 0080 0675 0054
150-200 8 75 0750 175 1400 3925 0411 0250 1411 0353
200-250 25 100 1000 225 5625 9550 1000 - - -
Totale 100 9550 0532
Concentrazione dei finanziamenti in Sardegna
26
Concentrazione dei finanziamenti in Campania
Campania
Finanziamenti (migliaia di Euro) ni Ni pi xi xi ni Xi qi pi+1- pi qi+1+ qi (pi+1- pi)(qi+1+ qi)
0 0 0 0000 0 0 0 0000 0100 0021 0002
0-50 10 10 0100 25 250 250 0021 0250 0199 0050
50-100 25 35 0350 75 1875 2125 0178 0370 0743 0275
100-150 37 72 0720 125 4625 6750 0565 0220 1452 0319
150-200 22 94 0940 175 3850 10600 0887 0060 1887 0113
200-250 6 100 1000 225 1350 11950 1000 - - -
Totale 100 11950 0759
27
00
01
02
03
04
05
06
07
08
09
10
00 01 02 03 04 05 06 07 08 09 10
pi
qi
Equidistribuzione Sardegna Campania
4680R~sar 2410R
~cam La concentrazione egrave piugrave
elevata in Sardegna
La curva di Lorenz conferma questo risultato
28
Riferimenti
bull C Gini (1912) Variabilitagrave e mutabilitagrave Contributo allo studio delle distribuzioni e relazioni statistiche Studi economici-giuridici dela Regia Universitagrave di Cagliari anno III
bull Lorenz M O (1905) Methods of measuring the concentration of wealth Publications of the American Statistical Association (Publications of the American Statistical Association Vol 9 No 70) 9 (70) 209ndash219
bull Per ulteriori riferimenti si possono consultare utilmente le pagine di Wikipedia relative allrsquoindice di Gini e alla curva di Lorenz
11
0
01
02
03
04
05
06
07
08
09
1
0 02 04 06 08 1
qi
pi
Indice di concentrazione (2)
Lrsquoarea A in figura compresa tra la curva di concentrazione e la retta di equidistribuzione prende il nome di area di concentrazione Si noti che A egrave pari allrsquoarea del triangolo di coordinate (00) (10) (11) meno lrsquoarea B formata dai trapezi di altezza Fi-Fi-1 e basi Qi e Qi-1
Area del trapezio
frac12 x Somma delle basi x altezza
A B
12
Un indice relativo di concentrazione si puograve ottenere dividendo lrsquoarea di concentrazione per il valore massimo che lrsquoarea puograve assumere
dove Amax si ottiene considerando lrsquoarea nel caso x1 =hellip= xN-1 =0 xN=Nμ e risulta pari a 12 ndash (1N)(1)(12)=(N-1)2N
Per costruzione egrave 0 le R le 1 in particolarebullR=0 nel caso di equiripartizionebullR=1 nel caso di massima concentrazione
Si puograve dimostrare che il rapporto cosigrave costruito egrave uguale ad R
Indice di concentrazione (2)
13
Un altro indice di concentrazione sempre basato sullrsquoarea si puograve ottenere osservando che questrsquoultima non puograve superare il valore 12 Possiamo quindi rapportare lrsquoarea di concentrazione al suo valore massimo teorico
Si ha (percheacute) con i due indici che tendono a coincidere per N grande
Indice di concentrazione (3)
14
80 90 21 23 32 16 62
Un esempio
i x_i F_i Q_i (Fi-Qi)
1 16 01429 00494 00935
2 21 02857 01142 01715
3 23 04286 01852 02434
4 32 05714 02840 02875
5 62 07143 04753 02390
6 80 08571 07222 01349
7 90 1 1
Totale
324 3 11698
Dati i redditi di 7 individui
per ricavare la curva di concentrazione organizziamo le osservazioni in tabella avendo cura di ordinarle in base ai valori di x (ad esempio X1=16 percheacute lrsquoindividuo piugrave povero possiede 16) e calcoliamo le differenze (Fi-Qi)
15
80 90 21 23 32 16 62
Per calcolare R con la formula (2) usiamo una tabella simile alla precedente per ricavare il numeratore Lrsquoarea massima che compare a denominatore egrave pari allrsquoarea massima teorica meno lrsquoarea del triangolo di base F7-F6 e altezza 1 Il calcolo di Ř egrave del tutto analogo egrave sufficiente porre lrsquoarea massima pari a frac12
Data i redditi di 7 individui
Un esempio
i x_i F_i Q_i (Fi-Fi-1)(Qi+Qi-1)
1 16 01429 00494 00070
2 21 02857 01142 00233
3 23 04286 01852 00427
4 32 05714 02840 00670
5 62 07143 04753 01085
6 80 08571 07222 01710
7 90 1 1 02461
Totale
06658
16
Variabili statistiche discrete
Finora abbiamo considerato N osservazioni non raggruppate Per ricavare lrsquoindice o la curva di concentrazione a partire da una distribuzione di frequenze assolute possiamo usare le seguenti versioni ldquoponderaterdquo di Fi e Qi
dove x1hellipxk sono k valori distinti ordinati in modo non decrescente con numerositagrave n1 hellipnk
17
Variabili statistiche discrete
1
1
1
1
)(
k
ii
k
iii
F
QFR
Con le coppie (Fi Qi) si puograve ottenere un indice analogo ad R
In generale RneR sugli stessi dati Infatti con lrsquoindice sopra la situazione di massima concentrazione si ha quando tutto il carattere appartiene alla k-esima classe (e non allrsquo N-esimo individuo come nel caso di R)
Unendo le coppie (Fi Qi
) si ottiene la stessa curva di concentrazione che si otterrebbe utilizzando con i dati unitari Infatti si puograve dimostrare che la pendenza della curva non cambia passando tra individui che hanno lo stesso ammontare di carattere Lrsquounica differenza egrave che ora per ottenere la spezzata si devono congiungere kltN punti
18
Nel caso in cui si disponga dellrsquoinformazione sullrsquoammontare totale di carattere in un intervallo egrave consigliabile discretizzare gli intervalli in modo ldquocoerenterdquo con tale informazione
Esempio se nellrsquointervallo [515) di numerositagrave Ni=10 il carattere totale egrave pari a 60 egrave preferibile discretizzare lrsquointervallo assumendo come punto ldquomediordquo il valore 6 e non il valore 10 (al quale corrisponderebbe un reddito totale di 100 e non di 60) Si noti che devono essere note le numerositagrave degli intervalli per poter procedere in questo modo
Nel caso in cui si disponga dellrsquoinformazione sullrsquoammontare totale di carattere in un intervallo egrave consigliabile discretizzare gli intervalli in modo ldquocoerenterdquo con tale informazione
Esempio se nellrsquointervallo [515) di numerositagrave Ni=10 il carattere totale egrave pari a 60 egrave preferibile discretizzare lrsquointervallo assumendo come punto ldquomediordquo il valore 6 e non il valore 10 (al quale corrisponderebbe un reddito totale di 100 e non di 60) Si noti che devono essere note le numerositagrave degli intervalli per poter procedere in questo modo
Se si desidera ricavare lrsquoindice o la curva di concentrazione per una variabile continua per intervallo il modo piugrave semplice di procedere consiste nel ldquodiscretizzarerdquo la variabile considerando le frequenze ldquoconcentraterdquo nei punti medi degli intervalli Si puograve poi procedere come nel caso precedente
Se si desidera ricavare lrsquoindice o la curva di concentrazione per una variabile continua per intervallo il modo piugrave semplice di procedere consiste nel ldquodiscretizzarerdquo la variabile considerando le frequenze ldquoconcentraterdquo nei punti medi degli intervalli Si puograve poi procedere come nel caso precedente
Variabili statistiche continue per intervallo
19
Se X egrave una variabile statistica continua non negativa con densitagrave f(x) e media finita μ le espressioni delle frequenze e delle intensitagrave cumulate diventano
Se X egrave una variabile statistica continua non negativa con densitagrave f(x) e media finita μ le espressioni delle frequenze e delle intensitagrave cumulate diventano
Variabili statistiche continue
Nota Talvolta si esprimono F e Q in funzione della frequenza cumulata r In tal caso si ha x = F-1( r ) da cui le nuove variabili
20
Il valore di R per un carattere con distribuzione continua si puograve ottenere come nel caso discreto rapportando lrsquoarea di concentrazione al suo valore massimo pari ad 12
Il valore di R per un carattere con distribuzione continua si puograve ottenere come nel caso discreto rapportando lrsquoarea di concentrazione al suo valore massimo pari ad 12
Variabili statistiche continue
Lrsquoindice di Gini egrave quindi pari a due volte lrsquoarea di concentrazione
Nota essendo Amax =12 si ha R=Ř
ConfrontiPuograve essere interessante confrontare la concentrazione di due caratteri
(o equivalentemente dello stesso carattere in due istanti diversi o in due ambiti territoriali diversi)
Esempio 1 il reddito risulta piugrave concentrato in Italia o in Francia
Esempio 2 la concentrazione del reddito in Italia era maggiore negli anni lsquo80 o negli anni lsquo90
Un modo semplice per stabilire quale carattere egrave maggiormente concentrato egrave quello di confrontare graficamente le curve di concentrazione nei due ambiti territoriali (o temporali) e stabilire quale si trova al di sopra
21
bull Non egrave detto che una delle due curve sia al di sopra dellrsquoaltra le curve si possono intersecare Si puograve tuttavia mostrare che se il carattere varia linearmente tra gli ambiti considerati allora le curve non si intersecano
bull In generale si puograve effettuare il confronto usando lrsquoindice di Gini
bull Poicheacute G=2A=1-2Area_sotto_la_curva_Lorenz il confronto attraverso lrsquoindici di Gini equivale al confronto tra le aree al di sotto delle curve di Lorenz dei due caratteri
Confronti
Confronti
Esempio la concentrazione del reddito nel mondo usando lrsquoindice R
23
Fonte CIA The world Factbook 2009
24
Esempio di Confronto Tra DistribuzioniSi riportano di seguito le distribuzioni dei finanziamenti concessi da un istituto bancario per lrsquoacquisto della prima casa a giovani coppie residenti in Campania ed in Sardegna
a) In quale regione risulta piugrave elevata la concentrazione dei finanziamenti concessi
b) Confrontare graficamente i diversi livelli di concentrazione dei finanziamenti nelle due regioni
Campania
Finanziamenti (migliaia di Euro) ni
0-50 10
50-100 25
100-150 37
150-200 22
200-250 6
Totale 100
Sardegna
Finanziamenti (migliaia di Euro) ni
0-50 57
50-100 3
100-150 7
150-200 8
200-250 25
Totale 100
25
Sardegna
Finanziamenti (migliaia di Euro) ni Ni pi xi xi ni Xi qi pi+1- pi qi+1+ qi (pi+1- pi)(qi+1+ qi)
0 0 0 0000 0 0 0 0000 0570 0149 0085
0-50 57 57 0570 25 1425 1425 0149 0030 0322 0010
50-100 3 60 0600 75 225 1650 0173 0070 0437 0031
100-150 7 67 0670 125 875 2525 0264 0080 0675 0054
150-200 8 75 0750 175 1400 3925 0411 0250 1411 0353
200-250 25 100 1000 225 5625 9550 1000 - - -
Totale 100 9550 0532
Concentrazione dei finanziamenti in Sardegna
26
Concentrazione dei finanziamenti in Campania
Campania
Finanziamenti (migliaia di Euro) ni Ni pi xi xi ni Xi qi pi+1- pi qi+1+ qi (pi+1- pi)(qi+1+ qi)
0 0 0 0000 0 0 0 0000 0100 0021 0002
0-50 10 10 0100 25 250 250 0021 0250 0199 0050
50-100 25 35 0350 75 1875 2125 0178 0370 0743 0275
100-150 37 72 0720 125 4625 6750 0565 0220 1452 0319
150-200 22 94 0940 175 3850 10600 0887 0060 1887 0113
200-250 6 100 1000 225 1350 11950 1000 - - -
Totale 100 11950 0759
27
00
01
02
03
04
05
06
07
08
09
10
00 01 02 03 04 05 06 07 08 09 10
pi
qi
Equidistribuzione Sardegna Campania
4680R~sar 2410R
~cam La concentrazione egrave piugrave
elevata in Sardegna
La curva di Lorenz conferma questo risultato
28
Riferimenti
bull C Gini (1912) Variabilitagrave e mutabilitagrave Contributo allo studio delle distribuzioni e relazioni statistiche Studi economici-giuridici dela Regia Universitagrave di Cagliari anno III
bull Lorenz M O (1905) Methods of measuring the concentration of wealth Publications of the American Statistical Association (Publications of the American Statistical Association Vol 9 No 70) 9 (70) 209ndash219
bull Per ulteriori riferimenti si possono consultare utilmente le pagine di Wikipedia relative allrsquoindice di Gini e alla curva di Lorenz
12
Un indice relativo di concentrazione si puograve ottenere dividendo lrsquoarea di concentrazione per il valore massimo che lrsquoarea puograve assumere
dove Amax si ottiene considerando lrsquoarea nel caso x1 =hellip= xN-1 =0 xN=Nμ e risulta pari a 12 ndash (1N)(1)(12)=(N-1)2N
Per costruzione egrave 0 le R le 1 in particolarebullR=0 nel caso di equiripartizionebullR=1 nel caso di massima concentrazione
Si puograve dimostrare che il rapporto cosigrave costruito egrave uguale ad R
Indice di concentrazione (2)
13
Un altro indice di concentrazione sempre basato sullrsquoarea si puograve ottenere osservando che questrsquoultima non puograve superare il valore 12 Possiamo quindi rapportare lrsquoarea di concentrazione al suo valore massimo teorico
Si ha (percheacute) con i due indici che tendono a coincidere per N grande
Indice di concentrazione (3)
14
80 90 21 23 32 16 62
Un esempio
i x_i F_i Q_i (Fi-Qi)
1 16 01429 00494 00935
2 21 02857 01142 01715
3 23 04286 01852 02434
4 32 05714 02840 02875
5 62 07143 04753 02390
6 80 08571 07222 01349
7 90 1 1
Totale
324 3 11698
Dati i redditi di 7 individui
per ricavare la curva di concentrazione organizziamo le osservazioni in tabella avendo cura di ordinarle in base ai valori di x (ad esempio X1=16 percheacute lrsquoindividuo piugrave povero possiede 16) e calcoliamo le differenze (Fi-Qi)
15
80 90 21 23 32 16 62
Per calcolare R con la formula (2) usiamo una tabella simile alla precedente per ricavare il numeratore Lrsquoarea massima che compare a denominatore egrave pari allrsquoarea massima teorica meno lrsquoarea del triangolo di base F7-F6 e altezza 1 Il calcolo di Ř egrave del tutto analogo egrave sufficiente porre lrsquoarea massima pari a frac12
Data i redditi di 7 individui
Un esempio
i x_i F_i Q_i (Fi-Fi-1)(Qi+Qi-1)
1 16 01429 00494 00070
2 21 02857 01142 00233
3 23 04286 01852 00427
4 32 05714 02840 00670
5 62 07143 04753 01085
6 80 08571 07222 01710
7 90 1 1 02461
Totale
06658
16
Variabili statistiche discrete
Finora abbiamo considerato N osservazioni non raggruppate Per ricavare lrsquoindice o la curva di concentrazione a partire da una distribuzione di frequenze assolute possiamo usare le seguenti versioni ldquoponderaterdquo di Fi e Qi
dove x1hellipxk sono k valori distinti ordinati in modo non decrescente con numerositagrave n1 hellipnk
17
Variabili statistiche discrete
1
1
1
1
)(
k
ii
k
iii
F
QFR
Con le coppie (Fi Qi) si puograve ottenere un indice analogo ad R
In generale RneR sugli stessi dati Infatti con lrsquoindice sopra la situazione di massima concentrazione si ha quando tutto il carattere appartiene alla k-esima classe (e non allrsquo N-esimo individuo come nel caso di R)
Unendo le coppie (Fi Qi
) si ottiene la stessa curva di concentrazione che si otterrebbe utilizzando con i dati unitari Infatti si puograve dimostrare che la pendenza della curva non cambia passando tra individui che hanno lo stesso ammontare di carattere Lrsquounica differenza egrave che ora per ottenere la spezzata si devono congiungere kltN punti
18
Nel caso in cui si disponga dellrsquoinformazione sullrsquoammontare totale di carattere in un intervallo egrave consigliabile discretizzare gli intervalli in modo ldquocoerenterdquo con tale informazione
Esempio se nellrsquointervallo [515) di numerositagrave Ni=10 il carattere totale egrave pari a 60 egrave preferibile discretizzare lrsquointervallo assumendo come punto ldquomediordquo il valore 6 e non il valore 10 (al quale corrisponderebbe un reddito totale di 100 e non di 60) Si noti che devono essere note le numerositagrave degli intervalli per poter procedere in questo modo
Nel caso in cui si disponga dellrsquoinformazione sullrsquoammontare totale di carattere in un intervallo egrave consigliabile discretizzare gli intervalli in modo ldquocoerenterdquo con tale informazione
Esempio se nellrsquointervallo [515) di numerositagrave Ni=10 il carattere totale egrave pari a 60 egrave preferibile discretizzare lrsquointervallo assumendo come punto ldquomediordquo il valore 6 e non il valore 10 (al quale corrisponderebbe un reddito totale di 100 e non di 60) Si noti che devono essere note le numerositagrave degli intervalli per poter procedere in questo modo
Se si desidera ricavare lrsquoindice o la curva di concentrazione per una variabile continua per intervallo il modo piugrave semplice di procedere consiste nel ldquodiscretizzarerdquo la variabile considerando le frequenze ldquoconcentraterdquo nei punti medi degli intervalli Si puograve poi procedere come nel caso precedente
Se si desidera ricavare lrsquoindice o la curva di concentrazione per una variabile continua per intervallo il modo piugrave semplice di procedere consiste nel ldquodiscretizzarerdquo la variabile considerando le frequenze ldquoconcentraterdquo nei punti medi degli intervalli Si puograve poi procedere come nel caso precedente
Variabili statistiche continue per intervallo
19
Se X egrave una variabile statistica continua non negativa con densitagrave f(x) e media finita μ le espressioni delle frequenze e delle intensitagrave cumulate diventano
Se X egrave una variabile statistica continua non negativa con densitagrave f(x) e media finita μ le espressioni delle frequenze e delle intensitagrave cumulate diventano
Variabili statistiche continue
Nota Talvolta si esprimono F e Q in funzione della frequenza cumulata r In tal caso si ha x = F-1( r ) da cui le nuove variabili
20
Il valore di R per un carattere con distribuzione continua si puograve ottenere come nel caso discreto rapportando lrsquoarea di concentrazione al suo valore massimo pari ad 12
Il valore di R per un carattere con distribuzione continua si puograve ottenere come nel caso discreto rapportando lrsquoarea di concentrazione al suo valore massimo pari ad 12
Variabili statistiche continue
Lrsquoindice di Gini egrave quindi pari a due volte lrsquoarea di concentrazione
Nota essendo Amax =12 si ha R=Ř
ConfrontiPuograve essere interessante confrontare la concentrazione di due caratteri
(o equivalentemente dello stesso carattere in due istanti diversi o in due ambiti territoriali diversi)
Esempio 1 il reddito risulta piugrave concentrato in Italia o in Francia
Esempio 2 la concentrazione del reddito in Italia era maggiore negli anni lsquo80 o negli anni lsquo90
Un modo semplice per stabilire quale carattere egrave maggiormente concentrato egrave quello di confrontare graficamente le curve di concentrazione nei due ambiti territoriali (o temporali) e stabilire quale si trova al di sopra
21
bull Non egrave detto che una delle due curve sia al di sopra dellrsquoaltra le curve si possono intersecare Si puograve tuttavia mostrare che se il carattere varia linearmente tra gli ambiti considerati allora le curve non si intersecano
bull In generale si puograve effettuare il confronto usando lrsquoindice di Gini
bull Poicheacute G=2A=1-2Area_sotto_la_curva_Lorenz il confronto attraverso lrsquoindici di Gini equivale al confronto tra le aree al di sotto delle curve di Lorenz dei due caratteri
Confronti
Confronti
Esempio la concentrazione del reddito nel mondo usando lrsquoindice R
23
Fonte CIA The world Factbook 2009
24
Esempio di Confronto Tra DistribuzioniSi riportano di seguito le distribuzioni dei finanziamenti concessi da un istituto bancario per lrsquoacquisto della prima casa a giovani coppie residenti in Campania ed in Sardegna
a) In quale regione risulta piugrave elevata la concentrazione dei finanziamenti concessi
b) Confrontare graficamente i diversi livelli di concentrazione dei finanziamenti nelle due regioni
Campania
Finanziamenti (migliaia di Euro) ni
0-50 10
50-100 25
100-150 37
150-200 22
200-250 6
Totale 100
Sardegna
Finanziamenti (migliaia di Euro) ni
0-50 57
50-100 3
100-150 7
150-200 8
200-250 25
Totale 100
25
Sardegna
Finanziamenti (migliaia di Euro) ni Ni pi xi xi ni Xi qi pi+1- pi qi+1+ qi (pi+1- pi)(qi+1+ qi)
0 0 0 0000 0 0 0 0000 0570 0149 0085
0-50 57 57 0570 25 1425 1425 0149 0030 0322 0010
50-100 3 60 0600 75 225 1650 0173 0070 0437 0031
100-150 7 67 0670 125 875 2525 0264 0080 0675 0054
150-200 8 75 0750 175 1400 3925 0411 0250 1411 0353
200-250 25 100 1000 225 5625 9550 1000 - - -
Totale 100 9550 0532
Concentrazione dei finanziamenti in Sardegna
26
Concentrazione dei finanziamenti in Campania
Campania
Finanziamenti (migliaia di Euro) ni Ni pi xi xi ni Xi qi pi+1- pi qi+1+ qi (pi+1- pi)(qi+1+ qi)
0 0 0 0000 0 0 0 0000 0100 0021 0002
0-50 10 10 0100 25 250 250 0021 0250 0199 0050
50-100 25 35 0350 75 1875 2125 0178 0370 0743 0275
100-150 37 72 0720 125 4625 6750 0565 0220 1452 0319
150-200 22 94 0940 175 3850 10600 0887 0060 1887 0113
200-250 6 100 1000 225 1350 11950 1000 - - -
Totale 100 11950 0759
27
00
01
02
03
04
05
06
07
08
09
10
00 01 02 03 04 05 06 07 08 09 10
pi
qi
Equidistribuzione Sardegna Campania
4680R~sar 2410R
~cam La concentrazione egrave piugrave
elevata in Sardegna
La curva di Lorenz conferma questo risultato
28
Riferimenti
bull C Gini (1912) Variabilitagrave e mutabilitagrave Contributo allo studio delle distribuzioni e relazioni statistiche Studi economici-giuridici dela Regia Universitagrave di Cagliari anno III
bull Lorenz M O (1905) Methods of measuring the concentration of wealth Publications of the American Statistical Association (Publications of the American Statistical Association Vol 9 No 70) 9 (70) 209ndash219
bull Per ulteriori riferimenti si possono consultare utilmente le pagine di Wikipedia relative allrsquoindice di Gini e alla curva di Lorenz
13
Un altro indice di concentrazione sempre basato sullrsquoarea si puograve ottenere osservando che questrsquoultima non puograve superare il valore 12 Possiamo quindi rapportare lrsquoarea di concentrazione al suo valore massimo teorico
Si ha (percheacute) con i due indici che tendono a coincidere per N grande
Indice di concentrazione (3)
14
80 90 21 23 32 16 62
Un esempio
i x_i F_i Q_i (Fi-Qi)
1 16 01429 00494 00935
2 21 02857 01142 01715
3 23 04286 01852 02434
4 32 05714 02840 02875
5 62 07143 04753 02390
6 80 08571 07222 01349
7 90 1 1
Totale
324 3 11698
Dati i redditi di 7 individui
per ricavare la curva di concentrazione organizziamo le osservazioni in tabella avendo cura di ordinarle in base ai valori di x (ad esempio X1=16 percheacute lrsquoindividuo piugrave povero possiede 16) e calcoliamo le differenze (Fi-Qi)
15
80 90 21 23 32 16 62
Per calcolare R con la formula (2) usiamo una tabella simile alla precedente per ricavare il numeratore Lrsquoarea massima che compare a denominatore egrave pari allrsquoarea massima teorica meno lrsquoarea del triangolo di base F7-F6 e altezza 1 Il calcolo di Ř egrave del tutto analogo egrave sufficiente porre lrsquoarea massima pari a frac12
Data i redditi di 7 individui
Un esempio
i x_i F_i Q_i (Fi-Fi-1)(Qi+Qi-1)
1 16 01429 00494 00070
2 21 02857 01142 00233
3 23 04286 01852 00427
4 32 05714 02840 00670
5 62 07143 04753 01085
6 80 08571 07222 01710
7 90 1 1 02461
Totale
06658
16
Variabili statistiche discrete
Finora abbiamo considerato N osservazioni non raggruppate Per ricavare lrsquoindice o la curva di concentrazione a partire da una distribuzione di frequenze assolute possiamo usare le seguenti versioni ldquoponderaterdquo di Fi e Qi
dove x1hellipxk sono k valori distinti ordinati in modo non decrescente con numerositagrave n1 hellipnk
17
Variabili statistiche discrete
1
1
1
1
)(
k
ii
k
iii
F
QFR
Con le coppie (Fi Qi) si puograve ottenere un indice analogo ad R
In generale RneR sugli stessi dati Infatti con lrsquoindice sopra la situazione di massima concentrazione si ha quando tutto il carattere appartiene alla k-esima classe (e non allrsquo N-esimo individuo come nel caso di R)
Unendo le coppie (Fi Qi
) si ottiene la stessa curva di concentrazione che si otterrebbe utilizzando con i dati unitari Infatti si puograve dimostrare che la pendenza della curva non cambia passando tra individui che hanno lo stesso ammontare di carattere Lrsquounica differenza egrave che ora per ottenere la spezzata si devono congiungere kltN punti
18
Nel caso in cui si disponga dellrsquoinformazione sullrsquoammontare totale di carattere in un intervallo egrave consigliabile discretizzare gli intervalli in modo ldquocoerenterdquo con tale informazione
Esempio se nellrsquointervallo [515) di numerositagrave Ni=10 il carattere totale egrave pari a 60 egrave preferibile discretizzare lrsquointervallo assumendo come punto ldquomediordquo il valore 6 e non il valore 10 (al quale corrisponderebbe un reddito totale di 100 e non di 60) Si noti che devono essere note le numerositagrave degli intervalli per poter procedere in questo modo
Nel caso in cui si disponga dellrsquoinformazione sullrsquoammontare totale di carattere in un intervallo egrave consigliabile discretizzare gli intervalli in modo ldquocoerenterdquo con tale informazione
Esempio se nellrsquointervallo [515) di numerositagrave Ni=10 il carattere totale egrave pari a 60 egrave preferibile discretizzare lrsquointervallo assumendo come punto ldquomediordquo il valore 6 e non il valore 10 (al quale corrisponderebbe un reddito totale di 100 e non di 60) Si noti che devono essere note le numerositagrave degli intervalli per poter procedere in questo modo
Se si desidera ricavare lrsquoindice o la curva di concentrazione per una variabile continua per intervallo il modo piugrave semplice di procedere consiste nel ldquodiscretizzarerdquo la variabile considerando le frequenze ldquoconcentraterdquo nei punti medi degli intervalli Si puograve poi procedere come nel caso precedente
Se si desidera ricavare lrsquoindice o la curva di concentrazione per una variabile continua per intervallo il modo piugrave semplice di procedere consiste nel ldquodiscretizzarerdquo la variabile considerando le frequenze ldquoconcentraterdquo nei punti medi degli intervalli Si puograve poi procedere come nel caso precedente
Variabili statistiche continue per intervallo
19
Se X egrave una variabile statistica continua non negativa con densitagrave f(x) e media finita μ le espressioni delle frequenze e delle intensitagrave cumulate diventano
Se X egrave una variabile statistica continua non negativa con densitagrave f(x) e media finita μ le espressioni delle frequenze e delle intensitagrave cumulate diventano
Variabili statistiche continue
Nota Talvolta si esprimono F e Q in funzione della frequenza cumulata r In tal caso si ha x = F-1( r ) da cui le nuove variabili
20
Il valore di R per un carattere con distribuzione continua si puograve ottenere come nel caso discreto rapportando lrsquoarea di concentrazione al suo valore massimo pari ad 12
Il valore di R per un carattere con distribuzione continua si puograve ottenere come nel caso discreto rapportando lrsquoarea di concentrazione al suo valore massimo pari ad 12
Variabili statistiche continue
Lrsquoindice di Gini egrave quindi pari a due volte lrsquoarea di concentrazione
Nota essendo Amax =12 si ha R=Ř
ConfrontiPuograve essere interessante confrontare la concentrazione di due caratteri
(o equivalentemente dello stesso carattere in due istanti diversi o in due ambiti territoriali diversi)
Esempio 1 il reddito risulta piugrave concentrato in Italia o in Francia
Esempio 2 la concentrazione del reddito in Italia era maggiore negli anni lsquo80 o negli anni lsquo90
Un modo semplice per stabilire quale carattere egrave maggiormente concentrato egrave quello di confrontare graficamente le curve di concentrazione nei due ambiti territoriali (o temporali) e stabilire quale si trova al di sopra
21
bull Non egrave detto che una delle due curve sia al di sopra dellrsquoaltra le curve si possono intersecare Si puograve tuttavia mostrare che se il carattere varia linearmente tra gli ambiti considerati allora le curve non si intersecano
bull In generale si puograve effettuare il confronto usando lrsquoindice di Gini
bull Poicheacute G=2A=1-2Area_sotto_la_curva_Lorenz il confronto attraverso lrsquoindici di Gini equivale al confronto tra le aree al di sotto delle curve di Lorenz dei due caratteri
Confronti
Confronti
Esempio la concentrazione del reddito nel mondo usando lrsquoindice R
23
Fonte CIA The world Factbook 2009
24
Esempio di Confronto Tra DistribuzioniSi riportano di seguito le distribuzioni dei finanziamenti concessi da un istituto bancario per lrsquoacquisto della prima casa a giovani coppie residenti in Campania ed in Sardegna
a) In quale regione risulta piugrave elevata la concentrazione dei finanziamenti concessi
b) Confrontare graficamente i diversi livelli di concentrazione dei finanziamenti nelle due regioni
Campania
Finanziamenti (migliaia di Euro) ni
0-50 10
50-100 25
100-150 37
150-200 22
200-250 6
Totale 100
Sardegna
Finanziamenti (migliaia di Euro) ni
0-50 57
50-100 3
100-150 7
150-200 8
200-250 25
Totale 100
25
Sardegna
Finanziamenti (migliaia di Euro) ni Ni pi xi xi ni Xi qi pi+1- pi qi+1+ qi (pi+1- pi)(qi+1+ qi)
0 0 0 0000 0 0 0 0000 0570 0149 0085
0-50 57 57 0570 25 1425 1425 0149 0030 0322 0010
50-100 3 60 0600 75 225 1650 0173 0070 0437 0031
100-150 7 67 0670 125 875 2525 0264 0080 0675 0054
150-200 8 75 0750 175 1400 3925 0411 0250 1411 0353
200-250 25 100 1000 225 5625 9550 1000 - - -
Totale 100 9550 0532
Concentrazione dei finanziamenti in Sardegna
26
Concentrazione dei finanziamenti in Campania
Campania
Finanziamenti (migliaia di Euro) ni Ni pi xi xi ni Xi qi pi+1- pi qi+1+ qi (pi+1- pi)(qi+1+ qi)
0 0 0 0000 0 0 0 0000 0100 0021 0002
0-50 10 10 0100 25 250 250 0021 0250 0199 0050
50-100 25 35 0350 75 1875 2125 0178 0370 0743 0275
100-150 37 72 0720 125 4625 6750 0565 0220 1452 0319
150-200 22 94 0940 175 3850 10600 0887 0060 1887 0113
200-250 6 100 1000 225 1350 11950 1000 - - -
Totale 100 11950 0759
27
00
01
02
03
04
05
06
07
08
09
10
00 01 02 03 04 05 06 07 08 09 10
pi
qi
Equidistribuzione Sardegna Campania
4680R~sar 2410R
~cam La concentrazione egrave piugrave
elevata in Sardegna
La curva di Lorenz conferma questo risultato
28
Riferimenti
bull C Gini (1912) Variabilitagrave e mutabilitagrave Contributo allo studio delle distribuzioni e relazioni statistiche Studi economici-giuridici dela Regia Universitagrave di Cagliari anno III
bull Lorenz M O (1905) Methods of measuring the concentration of wealth Publications of the American Statistical Association (Publications of the American Statistical Association Vol 9 No 70) 9 (70) 209ndash219
bull Per ulteriori riferimenti si possono consultare utilmente le pagine di Wikipedia relative allrsquoindice di Gini e alla curva di Lorenz
14
80 90 21 23 32 16 62
Un esempio
i x_i F_i Q_i (Fi-Qi)
1 16 01429 00494 00935
2 21 02857 01142 01715
3 23 04286 01852 02434
4 32 05714 02840 02875
5 62 07143 04753 02390
6 80 08571 07222 01349
7 90 1 1
Totale
324 3 11698
Dati i redditi di 7 individui
per ricavare la curva di concentrazione organizziamo le osservazioni in tabella avendo cura di ordinarle in base ai valori di x (ad esempio X1=16 percheacute lrsquoindividuo piugrave povero possiede 16) e calcoliamo le differenze (Fi-Qi)
15
80 90 21 23 32 16 62
Per calcolare R con la formula (2) usiamo una tabella simile alla precedente per ricavare il numeratore Lrsquoarea massima che compare a denominatore egrave pari allrsquoarea massima teorica meno lrsquoarea del triangolo di base F7-F6 e altezza 1 Il calcolo di Ř egrave del tutto analogo egrave sufficiente porre lrsquoarea massima pari a frac12
Data i redditi di 7 individui
Un esempio
i x_i F_i Q_i (Fi-Fi-1)(Qi+Qi-1)
1 16 01429 00494 00070
2 21 02857 01142 00233
3 23 04286 01852 00427
4 32 05714 02840 00670
5 62 07143 04753 01085
6 80 08571 07222 01710
7 90 1 1 02461
Totale
06658
16
Variabili statistiche discrete
Finora abbiamo considerato N osservazioni non raggruppate Per ricavare lrsquoindice o la curva di concentrazione a partire da una distribuzione di frequenze assolute possiamo usare le seguenti versioni ldquoponderaterdquo di Fi e Qi
dove x1hellipxk sono k valori distinti ordinati in modo non decrescente con numerositagrave n1 hellipnk
17
Variabili statistiche discrete
1
1
1
1
)(
k
ii
k
iii
F
QFR
Con le coppie (Fi Qi) si puograve ottenere un indice analogo ad R
In generale RneR sugli stessi dati Infatti con lrsquoindice sopra la situazione di massima concentrazione si ha quando tutto il carattere appartiene alla k-esima classe (e non allrsquo N-esimo individuo come nel caso di R)
Unendo le coppie (Fi Qi
) si ottiene la stessa curva di concentrazione che si otterrebbe utilizzando con i dati unitari Infatti si puograve dimostrare che la pendenza della curva non cambia passando tra individui che hanno lo stesso ammontare di carattere Lrsquounica differenza egrave che ora per ottenere la spezzata si devono congiungere kltN punti
18
Nel caso in cui si disponga dellrsquoinformazione sullrsquoammontare totale di carattere in un intervallo egrave consigliabile discretizzare gli intervalli in modo ldquocoerenterdquo con tale informazione
Esempio se nellrsquointervallo [515) di numerositagrave Ni=10 il carattere totale egrave pari a 60 egrave preferibile discretizzare lrsquointervallo assumendo come punto ldquomediordquo il valore 6 e non il valore 10 (al quale corrisponderebbe un reddito totale di 100 e non di 60) Si noti che devono essere note le numerositagrave degli intervalli per poter procedere in questo modo
Nel caso in cui si disponga dellrsquoinformazione sullrsquoammontare totale di carattere in un intervallo egrave consigliabile discretizzare gli intervalli in modo ldquocoerenterdquo con tale informazione
Esempio se nellrsquointervallo [515) di numerositagrave Ni=10 il carattere totale egrave pari a 60 egrave preferibile discretizzare lrsquointervallo assumendo come punto ldquomediordquo il valore 6 e non il valore 10 (al quale corrisponderebbe un reddito totale di 100 e non di 60) Si noti che devono essere note le numerositagrave degli intervalli per poter procedere in questo modo
Se si desidera ricavare lrsquoindice o la curva di concentrazione per una variabile continua per intervallo il modo piugrave semplice di procedere consiste nel ldquodiscretizzarerdquo la variabile considerando le frequenze ldquoconcentraterdquo nei punti medi degli intervalli Si puograve poi procedere come nel caso precedente
Se si desidera ricavare lrsquoindice o la curva di concentrazione per una variabile continua per intervallo il modo piugrave semplice di procedere consiste nel ldquodiscretizzarerdquo la variabile considerando le frequenze ldquoconcentraterdquo nei punti medi degli intervalli Si puograve poi procedere come nel caso precedente
Variabili statistiche continue per intervallo
19
Se X egrave una variabile statistica continua non negativa con densitagrave f(x) e media finita μ le espressioni delle frequenze e delle intensitagrave cumulate diventano
Se X egrave una variabile statistica continua non negativa con densitagrave f(x) e media finita μ le espressioni delle frequenze e delle intensitagrave cumulate diventano
Variabili statistiche continue
Nota Talvolta si esprimono F e Q in funzione della frequenza cumulata r In tal caso si ha x = F-1( r ) da cui le nuove variabili
20
Il valore di R per un carattere con distribuzione continua si puograve ottenere come nel caso discreto rapportando lrsquoarea di concentrazione al suo valore massimo pari ad 12
Il valore di R per un carattere con distribuzione continua si puograve ottenere come nel caso discreto rapportando lrsquoarea di concentrazione al suo valore massimo pari ad 12
Variabili statistiche continue
Lrsquoindice di Gini egrave quindi pari a due volte lrsquoarea di concentrazione
Nota essendo Amax =12 si ha R=Ř
ConfrontiPuograve essere interessante confrontare la concentrazione di due caratteri
(o equivalentemente dello stesso carattere in due istanti diversi o in due ambiti territoriali diversi)
Esempio 1 il reddito risulta piugrave concentrato in Italia o in Francia
Esempio 2 la concentrazione del reddito in Italia era maggiore negli anni lsquo80 o negli anni lsquo90
Un modo semplice per stabilire quale carattere egrave maggiormente concentrato egrave quello di confrontare graficamente le curve di concentrazione nei due ambiti territoriali (o temporali) e stabilire quale si trova al di sopra
21
bull Non egrave detto che una delle due curve sia al di sopra dellrsquoaltra le curve si possono intersecare Si puograve tuttavia mostrare che se il carattere varia linearmente tra gli ambiti considerati allora le curve non si intersecano
bull In generale si puograve effettuare il confronto usando lrsquoindice di Gini
bull Poicheacute G=2A=1-2Area_sotto_la_curva_Lorenz il confronto attraverso lrsquoindici di Gini equivale al confronto tra le aree al di sotto delle curve di Lorenz dei due caratteri
Confronti
Confronti
Esempio la concentrazione del reddito nel mondo usando lrsquoindice R
23
Fonte CIA The world Factbook 2009
24
Esempio di Confronto Tra DistribuzioniSi riportano di seguito le distribuzioni dei finanziamenti concessi da un istituto bancario per lrsquoacquisto della prima casa a giovani coppie residenti in Campania ed in Sardegna
a) In quale regione risulta piugrave elevata la concentrazione dei finanziamenti concessi
b) Confrontare graficamente i diversi livelli di concentrazione dei finanziamenti nelle due regioni
Campania
Finanziamenti (migliaia di Euro) ni
0-50 10
50-100 25
100-150 37
150-200 22
200-250 6
Totale 100
Sardegna
Finanziamenti (migliaia di Euro) ni
0-50 57
50-100 3
100-150 7
150-200 8
200-250 25
Totale 100
25
Sardegna
Finanziamenti (migliaia di Euro) ni Ni pi xi xi ni Xi qi pi+1- pi qi+1+ qi (pi+1- pi)(qi+1+ qi)
0 0 0 0000 0 0 0 0000 0570 0149 0085
0-50 57 57 0570 25 1425 1425 0149 0030 0322 0010
50-100 3 60 0600 75 225 1650 0173 0070 0437 0031
100-150 7 67 0670 125 875 2525 0264 0080 0675 0054
150-200 8 75 0750 175 1400 3925 0411 0250 1411 0353
200-250 25 100 1000 225 5625 9550 1000 - - -
Totale 100 9550 0532
Concentrazione dei finanziamenti in Sardegna
26
Concentrazione dei finanziamenti in Campania
Campania
Finanziamenti (migliaia di Euro) ni Ni pi xi xi ni Xi qi pi+1- pi qi+1+ qi (pi+1- pi)(qi+1+ qi)
0 0 0 0000 0 0 0 0000 0100 0021 0002
0-50 10 10 0100 25 250 250 0021 0250 0199 0050
50-100 25 35 0350 75 1875 2125 0178 0370 0743 0275
100-150 37 72 0720 125 4625 6750 0565 0220 1452 0319
150-200 22 94 0940 175 3850 10600 0887 0060 1887 0113
200-250 6 100 1000 225 1350 11950 1000 - - -
Totale 100 11950 0759
27
00
01
02
03
04
05
06
07
08
09
10
00 01 02 03 04 05 06 07 08 09 10
pi
qi
Equidistribuzione Sardegna Campania
4680R~sar 2410R
~cam La concentrazione egrave piugrave
elevata in Sardegna
La curva di Lorenz conferma questo risultato
28
Riferimenti
bull C Gini (1912) Variabilitagrave e mutabilitagrave Contributo allo studio delle distribuzioni e relazioni statistiche Studi economici-giuridici dela Regia Universitagrave di Cagliari anno III
bull Lorenz M O (1905) Methods of measuring the concentration of wealth Publications of the American Statistical Association (Publications of the American Statistical Association Vol 9 No 70) 9 (70) 209ndash219
bull Per ulteriori riferimenti si possono consultare utilmente le pagine di Wikipedia relative allrsquoindice di Gini e alla curva di Lorenz
15
80 90 21 23 32 16 62
Per calcolare R con la formula (2) usiamo una tabella simile alla precedente per ricavare il numeratore Lrsquoarea massima che compare a denominatore egrave pari allrsquoarea massima teorica meno lrsquoarea del triangolo di base F7-F6 e altezza 1 Il calcolo di Ř egrave del tutto analogo egrave sufficiente porre lrsquoarea massima pari a frac12
Data i redditi di 7 individui
Un esempio
i x_i F_i Q_i (Fi-Fi-1)(Qi+Qi-1)
1 16 01429 00494 00070
2 21 02857 01142 00233
3 23 04286 01852 00427
4 32 05714 02840 00670
5 62 07143 04753 01085
6 80 08571 07222 01710
7 90 1 1 02461
Totale
06658
16
Variabili statistiche discrete
Finora abbiamo considerato N osservazioni non raggruppate Per ricavare lrsquoindice o la curva di concentrazione a partire da una distribuzione di frequenze assolute possiamo usare le seguenti versioni ldquoponderaterdquo di Fi e Qi
dove x1hellipxk sono k valori distinti ordinati in modo non decrescente con numerositagrave n1 hellipnk
17
Variabili statistiche discrete
1
1
1
1
)(
k
ii
k
iii
F
QFR
Con le coppie (Fi Qi) si puograve ottenere un indice analogo ad R
In generale RneR sugli stessi dati Infatti con lrsquoindice sopra la situazione di massima concentrazione si ha quando tutto il carattere appartiene alla k-esima classe (e non allrsquo N-esimo individuo come nel caso di R)
Unendo le coppie (Fi Qi
) si ottiene la stessa curva di concentrazione che si otterrebbe utilizzando con i dati unitari Infatti si puograve dimostrare che la pendenza della curva non cambia passando tra individui che hanno lo stesso ammontare di carattere Lrsquounica differenza egrave che ora per ottenere la spezzata si devono congiungere kltN punti
18
Nel caso in cui si disponga dellrsquoinformazione sullrsquoammontare totale di carattere in un intervallo egrave consigliabile discretizzare gli intervalli in modo ldquocoerenterdquo con tale informazione
Esempio se nellrsquointervallo [515) di numerositagrave Ni=10 il carattere totale egrave pari a 60 egrave preferibile discretizzare lrsquointervallo assumendo come punto ldquomediordquo il valore 6 e non il valore 10 (al quale corrisponderebbe un reddito totale di 100 e non di 60) Si noti che devono essere note le numerositagrave degli intervalli per poter procedere in questo modo
Nel caso in cui si disponga dellrsquoinformazione sullrsquoammontare totale di carattere in un intervallo egrave consigliabile discretizzare gli intervalli in modo ldquocoerenterdquo con tale informazione
Esempio se nellrsquointervallo [515) di numerositagrave Ni=10 il carattere totale egrave pari a 60 egrave preferibile discretizzare lrsquointervallo assumendo come punto ldquomediordquo il valore 6 e non il valore 10 (al quale corrisponderebbe un reddito totale di 100 e non di 60) Si noti che devono essere note le numerositagrave degli intervalli per poter procedere in questo modo
Se si desidera ricavare lrsquoindice o la curva di concentrazione per una variabile continua per intervallo il modo piugrave semplice di procedere consiste nel ldquodiscretizzarerdquo la variabile considerando le frequenze ldquoconcentraterdquo nei punti medi degli intervalli Si puograve poi procedere come nel caso precedente
Se si desidera ricavare lrsquoindice o la curva di concentrazione per una variabile continua per intervallo il modo piugrave semplice di procedere consiste nel ldquodiscretizzarerdquo la variabile considerando le frequenze ldquoconcentraterdquo nei punti medi degli intervalli Si puograve poi procedere come nel caso precedente
Variabili statistiche continue per intervallo
19
Se X egrave una variabile statistica continua non negativa con densitagrave f(x) e media finita μ le espressioni delle frequenze e delle intensitagrave cumulate diventano
Se X egrave una variabile statistica continua non negativa con densitagrave f(x) e media finita μ le espressioni delle frequenze e delle intensitagrave cumulate diventano
Variabili statistiche continue
Nota Talvolta si esprimono F e Q in funzione della frequenza cumulata r In tal caso si ha x = F-1( r ) da cui le nuove variabili
20
Il valore di R per un carattere con distribuzione continua si puograve ottenere come nel caso discreto rapportando lrsquoarea di concentrazione al suo valore massimo pari ad 12
Il valore di R per un carattere con distribuzione continua si puograve ottenere come nel caso discreto rapportando lrsquoarea di concentrazione al suo valore massimo pari ad 12
Variabili statistiche continue
Lrsquoindice di Gini egrave quindi pari a due volte lrsquoarea di concentrazione
Nota essendo Amax =12 si ha R=Ř
ConfrontiPuograve essere interessante confrontare la concentrazione di due caratteri
(o equivalentemente dello stesso carattere in due istanti diversi o in due ambiti territoriali diversi)
Esempio 1 il reddito risulta piugrave concentrato in Italia o in Francia
Esempio 2 la concentrazione del reddito in Italia era maggiore negli anni lsquo80 o negli anni lsquo90
Un modo semplice per stabilire quale carattere egrave maggiormente concentrato egrave quello di confrontare graficamente le curve di concentrazione nei due ambiti territoriali (o temporali) e stabilire quale si trova al di sopra
21
bull Non egrave detto che una delle due curve sia al di sopra dellrsquoaltra le curve si possono intersecare Si puograve tuttavia mostrare che se il carattere varia linearmente tra gli ambiti considerati allora le curve non si intersecano
bull In generale si puograve effettuare il confronto usando lrsquoindice di Gini
bull Poicheacute G=2A=1-2Area_sotto_la_curva_Lorenz il confronto attraverso lrsquoindici di Gini equivale al confronto tra le aree al di sotto delle curve di Lorenz dei due caratteri
Confronti
Confronti
Esempio la concentrazione del reddito nel mondo usando lrsquoindice R
23
Fonte CIA The world Factbook 2009
24
Esempio di Confronto Tra DistribuzioniSi riportano di seguito le distribuzioni dei finanziamenti concessi da un istituto bancario per lrsquoacquisto della prima casa a giovani coppie residenti in Campania ed in Sardegna
a) In quale regione risulta piugrave elevata la concentrazione dei finanziamenti concessi
b) Confrontare graficamente i diversi livelli di concentrazione dei finanziamenti nelle due regioni
Campania
Finanziamenti (migliaia di Euro) ni
0-50 10
50-100 25
100-150 37
150-200 22
200-250 6
Totale 100
Sardegna
Finanziamenti (migliaia di Euro) ni
0-50 57
50-100 3
100-150 7
150-200 8
200-250 25
Totale 100
25
Sardegna
Finanziamenti (migliaia di Euro) ni Ni pi xi xi ni Xi qi pi+1- pi qi+1+ qi (pi+1- pi)(qi+1+ qi)
0 0 0 0000 0 0 0 0000 0570 0149 0085
0-50 57 57 0570 25 1425 1425 0149 0030 0322 0010
50-100 3 60 0600 75 225 1650 0173 0070 0437 0031
100-150 7 67 0670 125 875 2525 0264 0080 0675 0054
150-200 8 75 0750 175 1400 3925 0411 0250 1411 0353
200-250 25 100 1000 225 5625 9550 1000 - - -
Totale 100 9550 0532
Concentrazione dei finanziamenti in Sardegna
26
Concentrazione dei finanziamenti in Campania
Campania
Finanziamenti (migliaia di Euro) ni Ni pi xi xi ni Xi qi pi+1- pi qi+1+ qi (pi+1- pi)(qi+1+ qi)
0 0 0 0000 0 0 0 0000 0100 0021 0002
0-50 10 10 0100 25 250 250 0021 0250 0199 0050
50-100 25 35 0350 75 1875 2125 0178 0370 0743 0275
100-150 37 72 0720 125 4625 6750 0565 0220 1452 0319
150-200 22 94 0940 175 3850 10600 0887 0060 1887 0113
200-250 6 100 1000 225 1350 11950 1000 - - -
Totale 100 11950 0759
27
00
01
02
03
04
05
06
07
08
09
10
00 01 02 03 04 05 06 07 08 09 10
pi
qi
Equidistribuzione Sardegna Campania
4680R~sar 2410R
~cam La concentrazione egrave piugrave
elevata in Sardegna
La curva di Lorenz conferma questo risultato
28
Riferimenti
bull C Gini (1912) Variabilitagrave e mutabilitagrave Contributo allo studio delle distribuzioni e relazioni statistiche Studi economici-giuridici dela Regia Universitagrave di Cagliari anno III
bull Lorenz M O (1905) Methods of measuring the concentration of wealth Publications of the American Statistical Association (Publications of the American Statistical Association Vol 9 No 70) 9 (70) 209ndash219
bull Per ulteriori riferimenti si possono consultare utilmente le pagine di Wikipedia relative allrsquoindice di Gini e alla curva di Lorenz
16
Variabili statistiche discrete
Finora abbiamo considerato N osservazioni non raggruppate Per ricavare lrsquoindice o la curva di concentrazione a partire da una distribuzione di frequenze assolute possiamo usare le seguenti versioni ldquoponderaterdquo di Fi e Qi
dove x1hellipxk sono k valori distinti ordinati in modo non decrescente con numerositagrave n1 hellipnk
17
Variabili statistiche discrete
1
1
1
1
)(
k
ii
k
iii
F
QFR
Con le coppie (Fi Qi) si puograve ottenere un indice analogo ad R
In generale RneR sugli stessi dati Infatti con lrsquoindice sopra la situazione di massima concentrazione si ha quando tutto il carattere appartiene alla k-esima classe (e non allrsquo N-esimo individuo come nel caso di R)
Unendo le coppie (Fi Qi
) si ottiene la stessa curva di concentrazione che si otterrebbe utilizzando con i dati unitari Infatti si puograve dimostrare che la pendenza della curva non cambia passando tra individui che hanno lo stesso ammontare di carattere Lrsquounica differenza egrave che ora per ottenere la spezzata si devono congiungere kltN punti
18
Nel caso in cui si disponga dellrsquoinformazione sullrsquoammontare totale di carattere in un intervallo egrave consigliabile discretizzare gli intervalli in modo ldquocoerenterdquo con tale informazione
Esempio se nellrsquointervallo [515) di numerositagrave Ni=10 il carattere totale egrave pari a 60 egrave preferibile discretizzare lrsquointervallo assumendo come punto ldquomediordquo il valore 6 e non il valore 10 (al quale corrisponderebbe un reddito totale di 100 e non di 60) Si noti che devono essere note le numerositagrave degli intervalli per poter procedere in questo modo
Nel caso in cui si disponga dellrsquoinformazione sullrsquoammontare totale di carattere in un intervallo egrave consigliabile discretizzare gli intervalli in modo ldquocoerenterdquo con tale informazione
Esempio se nellrsquointervallo [515) di numerositagrave Ni=10 il carattere totale egrave pari a 60 egrave preferibile discretizzare lrsquointervallo assumendo come punto ldquomediordquo il valore 6 e non il valore 10 (al quale corrisponderebbe un reddito totale di 100 e non di 60) Si noti che devono essere note le numerositagrave degli intervalli per poter procedere in questo modo
Se si desidera ricavare lrsquoindice o la curva di concentrazione per una variabile continua per intervallo il modo piugrave semplice di procedere consiste nel ldquodiscretizzarerdquo la variabile considerando le frequenze ldquoconcentraterdquo nei punti medi degli intervalli Si puograve poi procedere come nel caso precedente
Se si desidera ricavare lrsquoindice o la curva di concentrazione per una variabile continua per intervallo il modo piugrave semplice di procedere consiste nel ldquodiscretizzarerdquo la variabile considerando le frequenze ldquoconcentraterdquo nei punti medi degli intervalli Si puograve poi procedere come nel caso precedente
Variabili statistiche continue per intervallo
19
Se X egrave una variabile statistica continua non negativa con densitagrave f(x) e media finita μ le espressioni delle frequenze e delle intensitagrave cumulate diventano
Se X egrave una variabile statistica continua non negativa con densitagrave f(x) e media finita μ le espressioni delle frequenze e delle intensitagrave cumulate diventano
Variabili statistiche continue
Nota Talvolta si esprimono F e Q in funzione della frequenza cumulata r In tal caso si ha x = F-1( r ) da cui le nuove variabili
20
Il valore di R per un carattere con distribuzione continua si puograve ottenere come nel caso discreto rapportando lrsquoarea di concentrazione al suo valore massimo pari ad 12
Il valore di R per un carattere con distribuzione continua si puograve ottenere come nel caso discreto rapportando lrsquoarea di concentrazione al suo valore massimo pari ad 12
Variabili statistiche continue
Lrsquoindice di Gini egrave quindi pari a due volte lrsquoarea di concentrazione
Nota essendo Amax =12 si ha R=Ř
ConfrontiPuograve essere interessante confrontare la concentrazione di due caratteri
(o equivalentemente dello stesso carattere in due istanti diversi o in due ambiti territoriali diversi)
Esempio 1 il reddito risulta piugrave concentrato in Italia o in Francia
Esempio 2 la concentrazione del reddito in Italia era maggiore negli anni lsquo80 o negli anni lsquo90
Un modo semplice per stabilire quale carattere egrave maggiormente concentrato egrave quello di confrontare graficamente le curve di concentrazione nei due ambiti territoriali (o temporali) e stabilire quale si trova al di sopra
21
bull Non egrave detto che una delle due curve sia al di sopra dellrsquoaltra le curve si possono intersecare Si puograve tuttavia mostrare che se il carattere varia linearmente tra gli ambiti considerati allora le curve non si intersecano
bull In generale si puograve effettuare il confronto usando lrsquoindice di Gini
bull Poicheacute G=2A=1-2Area_sotto_la_curva_Lorenz il confronto attraverso lrsquoindici di Gini equivale al confronto tra le aree al di sotto delle curve di Lorenz dei due caratteri
Confronti
Confronti
Esempio la concentrazione del reddito nel mondo usando lrsquoindice R
23
Fonte CIA The world Factbook 2009
24
Esempio di Confronto Tra DistribuzioniSi riportano di seguito le distribuzioni dei finanziamenti concessi da un istituto bancario per lrsquoacquisto della prima casa a giovani coppie residenti in Campania ed in Sardegna
a) In quale regione risulta piugrave elevata la concentrazione dei finanziamenti concessi
b) Confrontare graficamente i diversi livelli di concentrazione dei finanziamenti nelle due regioni
Campania
Finanziamenti (migliaia di Euro) ni
0-50 10
50-100 25
100-150 37
150-200 22
200-250 6
Totale 100
Sardegna
Finanziamenti (migliaia di Euro) ni
0-50 57
50-100 3
100-150 7
150-200 8
200-250 25
Totale 100
25
Sardegna
Finanziamenti (migliaia di Euro) ni Ni pi xi xi ni Xi qi pi+1- pi qi+1+ qi (pi+1- pi)(qi+1+ qi)
0 0 0 0000 0 0 0 0000 0570 0149 0085
0-50 57 57 0570 25 1425 1425 0149 0030 0322 0010
50-100 3 60 0600 75 225 1650 0173 0070 0437 0031
100-150 7 67 0670 125 875 2525 0264 0080 0675 0054
150-200 8 75 0750 175 1400 3925 0411 0250 1411 0353
200-250 25 100 1000 225 5625 9550 1000 - - -
Totale 100 9550 0532
Concentrazione dei finanziamenti in Sardegna
26
Concentrazione dei finanziamenti in Campania
Campania
Finanziamenti (migliaia di Euro) ni Ni pi xi xi ni Xi qi pi+1- pi qi+1+ qi (pi+1- pi)(qi+1+ qi)
0 0 0 0000 0 0 0 0000 0100 0021 0002
0-50 10 10 0100 25 250 250 0021 0250 0199 0050
50-100 25 35 0350 75 1875 2125 0178 0370 0743 0275
100-150 37 72 0720 125 4625 6750 0565 0220 1452 0319
150-200 22 94 0940 175 3850 10600 0887 0060 1887 0113
200-250 6 100 1000 225 1350 11950 1000 - - -
Totale 100 11950 0759
27
00
01
02
03
04
05
06
07
08
09
10
00 01 02 03 04 05 06 07 08 09 10
pi
qi
Equidistribuzione Sardegna Campania
4680R~sar 2410R
~cam La concentrazione egrave piugrave
elevata in Sardegna
La curva di Lorenz conferma questo risultato
28
Riferimenti
bull C Gini (1912) Variabilitagrave e mutabilitagrave Contributo allo studio delle distribuzioni e relazioni statistiche Studi economici-giuridici dela Regia Universitagrave di Cagliari anno III
bull Lorenz M O (1905) Methods of measuring the concentration of wealth Publications of the American Statistical Association (Publications of the American Statistical Association Vol 9 No 70) 9 (70) 209ndash219
bull Per ulteriori riferimenti si possono consultare utilmente le pagine di Wikipedia relative allrsquoindice di Gini e alla curva di Lorenz
17
Variabili statistiche discrete
1
1
1
1
)(
k
ii
k
iii
F
QFR
Con le coppie (Fi Qi) si puograve ottenere un indice analogo ad R
In generale RneR sugli stessi dati Infatti con lrsquoindice sopra la situazione di massima concentrazione si ha quando tutto il carattere appartiene alla k-esima classe (e non allrsquo N-esimo individuo come nel caso di R)
Unendo le coppie (Fi Qi
) si ottiene la stessa curva di concentrazione che si otterrebbe utilizzando con i dati unitari Infatti si puograve dimostrare che la pendenza della curva non cambia passando tra individui che hanno lo stesso ammontare di carattere Lrsquounica differenza egrave che ora per ottenere la spezzata si devono congiungere kltN punti
18
Nel caso in cui si disponga dellrsquoinformazione sullrsquoammontare totale di carattere in un intervallo egrave consigliabile discretizzare gli intervalli in modo ldquocoerenterdquo con tale informazione
Esempio se nellrsquointervallo [515) di numerositagrave Ni=10 il carattere totale egrave pari a 60 egrave preferibile discretizzare lrsquointervallo assumendo come punto ldquomediordquo il valore 6 e non il valore 10 (al quale corrisponderebbe un reddito totale di 100 e non di 60) Si noti che devono essere note le numerositagrave degli intervalli per poter procedere in questo modo
Nel caso in cui si disponga dellrsquoinformazione sullrsquoammontare totale di carattere in un intervallo egrave consigliabile discretizzare gli intervalli in modo ldquocoerenterdquo con tale informazione
Esempio se nellrsquointervallo [515) di numerositagrave Ni=10 il carattere totale egrave pari a 60 egrave preferibile discretizzare lrsquointervallo assumendo come punto ldquomediordquo il valore 6 e non il valore 10 (al quale corrisponderebbe un reddito totale di 100 e non di 60) Si noti che devono essere note le numerositagrave degli intervalli per poter procedere in questo modo
Se si desidera ricavare lrsquoindice o la curva di concentrazione per una variabile continua per intervallo il modo piugrave semplice di procedere consiste nel ldquodiscretizzarerdquo la variabile considerando le frequenze ldquoconcentraterdquo nei punti medi degli intervalli Si puograve poi procedere come nel caso precedente
Se si desidera ricavare lrsquoindice o la curva di concentrazione per una variabile continua per intervallo il modo piugrave semplice di procedere consiste nel ldquodiscretizzarerdquo la variabile considerando le frequenze ldquoconcentraterdquo nei punti medi degli intervalli Si puograve poi procedere come nel caso precedente
Variabili statistiche continue per intervallo
19
Se X egrave una variabile statistica continua non negativa con densitagrave f(x) e media finita μ le espressioni delle frequenze e delle intensitagrave cumulate diventano
Se X egrave una variabile statistica continua non negativa con densitagrave f(x) e media finita μ le espressioni delle frequenze e delle intensitagrave cumulate diventano
Variabili statistiche continue
Nota Talvolta si esprimono F e Q in funzione della frequenza cumulata r In tal caso si ha x = F-1( r ) da cui le nuove variabili
20
Il valore di R per un carattere con distribuzione continua si puograve ottenere come nel caso discreto rapportando lrsquoarea di concentrazione al suo valore massimo pari ad 12
Il valore di R per un carattere con distribuzione continua si puograve ottenere come nel caso discreto rapportando lrsquoarea di concentrazione al suo valore massimo pari ad 12
Variabili statistiche continue
Lrsquoindice di Gini egrave quindi pari a due volte lrsquoarea di concentrazione
Nota essendo Amax =12 si ha R=Ř
ConfrontiPuograve essere interessante confrontare la concentrazione di due caratteri
(o equivalentemente dello stesso carattere in due istanti diversi o in due ambiti territoriali diversi)
Esempio 1 il reddito risulta piugrave concentrato in Italia o in Francia
Esempio 2 la concentrazione del reddito in Italia era maggiore negli anni lsquo80 o negli anni lsquo90
Un modo semplice per stabilire quale carattere egrave maggiormente concentrato egrave quello di confrontare graficamente le curve di concentrazione nei due ambiti territoriali (o temporali) e stabilire quale si trova al di sopra
21
bull Non egrave detto che una delle due curve sia al di sopra dellrsquoaltra le curve si possono intersecare Si puograve tuttavia mostrare che se il carattere varia linearmente tra gli ambiti considerati allora le curve non si intersecano
bull In generale si puograve effettuare il confronto usando lrsquoindice di Gini
bull Poicheacute G=2A=1-2Area_sotto_la_curva_Lorenz il confronto attraverso lrsquoindici di Gini equivale al confronto tra le aree al di sotto delle curve di Lorenz dei due caratteri
Confronti
Confronti
Esempio la concentrazione del reddito nel mondo usando lrsquoindice R
23
Fonte CIA The world Factbook 2009
24
Esempio di Confronto Tra DistribuzioniSi riportano di seguito le distribuzioni dei finanziamenti concessi da un istituto bancario per lrsquoacquisto della prima casa a giovani coppie residenti in Campania ed in Sardegna
a) In quale regione risulta piugrave elevata la concentrazione dei finanziamenti concessi
b) Confrontare graficamente i diversi livelli di concentrazione dei finanziamenti nelle due regioni
Campania
Finanziamenti (migliaia di Euro) ni
0-50 10
50-100 25
100-150 37
150-200 22
200-250 6
Totale 100
Sardegna
Finanziamenti (migliaia di Euro) ni
0-50 57
50-100 3
100-150 7
150-200 8
200-250 25
Totale 100
25
Sardegna
Finanziamenti (migliaia di Euro) ni Ni pi xi xi ni Xi qi pi+1- pi qi+1+ qi (pi+1- pi)(qi+1+ qi)
0 0 0 0000 0 0 0 0000 0570 0149 0085
0-50 57 57 0570 25 1425 1425 0149 0030 0322 0010
50-100 3 60 0600 75 225 1650 0173 0070 0437 0031
100-150 7 67 0670 125 875 2525 0264 0080 0675 0054
150-200 8 75 0750 175 1400 3925 0411 0250 1411 0353
200-250 25 100 1000 225 5625 9550 1000 - - -
Totale 100 9550 0532
Concentrazione dei finanziamenti in Sardegna
26
Concentrazione dei finanziamenti in Campania
Campania
Finanziamenti (migliaia di Euro) ni Ni pi xi xi ni Xi qi pi+1- pi qi+1+ qi (pi+1- pi)(qi+1+ qi)
0 0 0 0000 0 0 0 0000 0100 0021 0002
0-50 10 10 0100 25 250 250 0021 0250 0199 0050
50-100 25 35 0350 75 1875 2125 0178 0370 0743 0275
100-150 37 72 0720 125 4625 6750 0565 0220 1452 0319
150-200 22 94 0940 175 3850 10600 0887 0060 1887 0113
200-250 6 100 1000 225 1350 11950 1000 - - -
Totale 100 11950 0759
27
00
01
02
03
04
05
06
07
08
09
10
00 01 02 03 04 05 06 07 08 09 10
pi
qi
Equidistribuzione Sardegna Campania
4680R~sar 2410R
~cam La concentrazione egrave piugrave
elevata in Sardegna
La curva di Lorenz conferma questo risultato
28
Riferimenti
bull C Gini (1912) Variabilitagrave e mutabilitagrave Contributo allo studio delle distribuzioni e relazioni statistiche Studi economici-giuridici dela Regia Universitagrave di Cagliari anno III
bull Lorenz M O (1905) Methods of measuring the concentration of wealth Publications of the American Statistical Association (Publications of the American Statistical Association Vol 9 No 70) 9 (70) 209ndash219
bull Per ulteriori riferimenti si possono consultare utilmente le pagine di Wikipedia relative allrsquoindice di Gini e alla curva di Lorenz
18
Nel caso in cui si disponga dellrsquoinformazione sullrsquoammontare totale di carattere in un intervallo egrave consigliabile discretizzare gli intervalli in modo ldquocoerenterdquo con tale informazione
Esempio se nellrsquointervallo [515) di numerositagrave Ni=10 il carattere totale egrave pari a 60 egrave preferibile discretizzare lrsquointervallo assumendo come punto ldquomediordquo il valore 6 e non il valore 10 (al quale corrisponderebbe un reddito totale di 100 e non di 60) Si noti che devono essere note le numerositagrave degli intervalli per poter procedere in questo modo
Nel caso in cui si disponga dellrsquoinformazione sullrsquoammontare totale di carattere in un intervallo egrave consigliabile discretizzare gli intervalli in modo ldquocoerenterdquo con tale informazione
Esempio se nellrsquointervallo [515) di numerositagrave Ni=10 il carattere totale egrave pari a 60 egrave preferibile discretizzare lrsquointervallo assumendo come punto ldquomediordquo il valore 6 e non il valore 10 (al quale corrisponderebbe un reddito totale di 100 e non di 60) Si noti che devono essere note le numerositagrave degli intervalli per poter procedere in questo modo
Se si desidera ricavare lrsquoindice o la curva di concentrazione per una variabile continua per intervallo il modo piugrave semplice di procedere consiste nel ldquodiscretizzarerdquo la variabile considerando le frequenze ldquoconcentraterdquo nei punti medi degli intervalli Si puograve poi procedere come nel caso precedente
Se si desidera ricavare lrsquoindice o la curva di concentrazione per una variabile continua per intervallo il modo piugrave semplice di procedere consiste nel ldquodiscretizzarerdquo la variabile considerando le frequenze ldquoconcentraterdquo nei punti medi degli intervalli Si puograve poi procedere come nel caso precedente
Variabili statistiche continue per intervallo
19
Se X egrave una variabile statistica continua non negativa con densitagrave f(x) e media finita μ le espressioni delle frequenze e delle intensitagrave cumulate diventano
Se X egrave una variabile statistica continua non negativa con densitagrave f(x) e media finita μ le espressioni delle frequenze e delle intensitagrave cumulate diventano
Variabili statistiche continue
Nota Talvolta si esprimono F e Q in funzione della frequenza cumulata r In tal caso si ha x = F-1( r ) da cui le nuove variabili
20
Il valore di R per un carattere con distribuzione continua si puograve ottenere come nel caso discreto rapportando lrsquoarea di concentrazione al suo valore massimo pari ad 12
Il valore di R per un carattere con distribuzione continua si puograve ottenere come nel caso discreto rapportando lrsquoarea di concentrazione al suo valore massimo pari ad 12
Variabili statistiche continue
Lrsquoindice di Gini egrave quindi pari a due volte lrsquoarea di concentrazione
Nota essendo Amax =12 si ha R=Ř
ConfrontiPuograve essere interessante confrontare la concentrazione di due caratteri
(o equivalentemente dello stesso carattere in due istanti diversi o in due ambiti territoriali diversi)
Esempio 1 il reddito risulta piugrave concentrato in Italia o in Francia
Esempio 2 la concentrazione del reddito in Italia era maggiore negli anni lsquo80 o negli anni lsquo90
Un modo semplice per stabilire quale carattere egrave maggiormente concentrato egrave quello di confrontare graficamente le curve di concentrazione nei due ambiti territoriali (o temporali) e stabilire quale si trova al di sopra
21
bull Non egrave detto che una delle due curve sia al di sopra dellrsquoaltra le curve si possono intersecare Si puograve tuttavia mostrare che se il carattere varia linearmente tra gli ambiti considerati allora le curve non si intersecano
bull In generale si puograve effettuare il confronto usando lrsquoindice di Gini
bull Poicheacute G=2A=1-2Area_sotto_la_curva_Lorenz il confronto attraverso lrsquoindici di Gini equivale al confronto tra le aree al di sotto delle curve di Lorenz dei due caratteri
Confronti
Confronti
Esempio la concentrazione del reddito nel mondo usando lrsquoindice R
23
Fonte CIA The world Factbook 2009
24
Esempio di Confronto Tra DistribuzioniSi riportano di seguito le distribuzioni dei finanziamenti concessi da un istituto bancario per lrsquoacquisto della prima casa a giovani coppie residenti in Campania ed in Sardegna
a) In quale regione risulta piugrave elevata la concentrazione dei finanziamenti concessi
b) Confrontare graficamente i diversi livelli di concentrazione dei finanziamenti nelle due regioni
Campania
Finanziamenti (migliaia di Euro) ni
0-50 10
50-100 25
100-150 37
150-200 22
200-250 6
Totale 100
Sardegna
Finanziamenti (migliaia di Euro) ni
0-50 57
50-100 3
100-150 7
150-200 8
200-250 25
Totale 100
25
Sardegna
Finanziamenti (migliaia di Euro) ni Ni pi xi xi ni Xi qi pi+1- pi qi+1+ qi (pi+1- pi)(qi+1+ qi)
0 0 0 0000 0 0 0 0000 0570 0149 0085
0-50 57 57 0570 25 1425 1425 0149 0030 0322 0010
50-100 3 60 0600 75 225 1650 0173 0070 0437 0031
100-150 7 67 0670 125 875 2525 0264 0080 0675 0054
150-200 8 75 0750 175 1400 3925 0411 0250 1411 0353
200-250 25 100 1000 225 5625 9550 1000 - - -
Totale 100 9550 0532
Concentrazione dei finanziamenti in Sardegna
26
Concentrazione dei finanziamenti in Campania
Campania
Finanziamenti (migliaia di Euro) ni Ni pi xi xi ni Xi qi pi+1- pi qi+1+ qi (pi+1- pi)(qi+1+ qi)
0 0 0 0000 0 0 0 0000 0100 0021 0002
0-50 10 10 0100 25 250 250 0021 0250 0199 0050
50-100 25 35 0350 75 1875 2125 0178 0370 0743 0275
100-150 37 72 0720 125 4625 6750 0565 0220 1452 0319
150-200 22 94 0940 175 3850 10600 0887 0060 1887 0113
200-250 6 100 1000 225 1350 11950 1000 - - -
Totale 100 11950 0759
27
00
01
02
03
04
05
06
07
08
09
10
00 01 02 03 04 05 06 07 08 09 10
pi
qi
Equidistribuzione Sardegna Campania
4680R~sar 2410R
~cam La concentrazione egrave piugrave
elevata in Sardegna
La curva di Lorenz conferma questo risultato
28
Riferimenti
bull C Gini (1912) Variabilitagrave e mutabilitagrave Contributo allo studio delle distribuzioni e relazioni statistiche Studi economici-giuridici dela Regia Universitagrave di Cagliari anno III
bull Lorenz M O (1905) Methods of measuring the concentration of wealth Publications of the American Statistical Association (Publications of the American Statistical Association Vol 9 No 70) 9 (70) 209ndash219
bull Per ulteriori riferimenti si possono consultare utilmente le pagine di Wikipedia relative allrsquoindice di Gini e alla curva di Lorenz
19
Se X egrave una variabile statistica continua non negativa con densitagrave f(x) e media finita μ le espressioni delle frequenze e delle intensitagrave cumulate diventano
Se X egrave una variabile statistica continua non negativa con densitagrave f(x) e media finita μ le espressioni delle frequenze e delle intensitagrave cumulate diventano
Variabili statistiche continue
Nota Talvolta si esprimono F e Q in funzione della frequenza cumulata r In tal caso si ha x = F-1( r ) da cui le nuove variabili
20
Il valore di R per un carattere con distribuzione continua si puograve ottenere come nel caso discreto rapportando lrsquoarea di concentrazione al suo valore massimo pari ad 12
Il valore di R per un carattere con distribuzione continua si puograve ottenere come nel caso discreto rapportando lrsquoarea di concentrazione al suo valore massimo pari ad 12
Variabili statistiche continue
Lrsquoindice di Gini egrave quindi pari a due volte lrsquoarea di concentrazione
Nota essendo Amax =12 si ha R=Ř
ConfrontiPuograve essere interessante confrontare la concentrazione di due caratteri
(o equivalentemente dello stesso carattere in due istanti diversi o in due ambiti territoriali diversi)
Esempio 1 il reddito risulta piugrave concentrato in Italia o in Francia
Esempio 2 la concentrazione del reddito in Italia era maggiore negli anni lsquo80 o negli anni lsquo90
Un modo semplice per stabilire quale carattere egrave maggiormente concentrato egrave quello di confrontare graficamente le curve di concentrazione nei due ambiti territoriali (o temporali) e stabilire quale si trova al di sopra
21
bull Non egrave detto che una delle due curve sia al di sopra dellrsquoaltra le curve si possono intersecare Si puograve tuttavia mostrare che se il carattere varia linearmente tra gli ambiti considerati allora le curve non si intersecano
bull In generale si puograve effettuare il confronto usando lrsquoindice di Gini
bull Poicheacute G=2A=1-2Area_sotto_la_curva_Lorenz il confronto attraverso lrsquoindici di Gini equivale al confronto tra le aree al di sotto delle curve di Lorenz dei due caratteri
Confronti
Confronti
Esempio la concentrazione del reddito nel mondo usando lrsquoindice R
23
Fonte CIA The world Factbook 2009
24
Esempio di Confronto Tra DistribuzioniSi riportano di seguito le distribuzioni dei finanziamenti concessi da un istituto bancario per lrsquoacquisto della prima casa a giovani coppie residenti in Campania ed in Sardegna
a) In quale regione risulta piugrave elevata la concentrazione dei finanziamenti concessi
b) Confrontare graficamente i diversi livelli di concentrazione dei finanziamenti nelle due regioni
Campania
Finanziamenti (migliaia di Euro) ni
0-50 10
50-100 25
100-150 37
150-200 22
200-250 6
Totale 100
Sardegna
Finanziamenti (migliaia di Euro) ni
0-50 57
50-100 3
100-150 7
150-200 8
200-250 25
Totale 100
25
Sardegna
Finanziamenti (migliaia di Euro) ni Ni pi xi xi ni Xi qi pi+1- pi qi+1+ qi (pi+1- pi)(qi+1+ qi)
0 0 0 0000 0 0 0 0000 0570 0149 0085
0-50 57 57 0570 25 1425 1425 0149 0030 0322 0010
50-100 3 60 0600 75 225 1650 0173 0070 0437 0031
100-150 7 67 0670 125 875 2525 0264 0080 0675 0054
150-200 8 75 0750 175 1400 3925 0411 0250 1411 0353
200-250 25 100 1000 225 5625 9550 1000 - - -
Totale 100 9550 0532
Concentrazione dei finanziamenti in Sardegna
26
Concentrazione dei finanziamenti in Campania
Campania
Finanziamenti (migliaia di Euro) ni Ni pi xi xi ni Xi qi pi+1- pi qi+1+ qi (pi+1- pi)(qi+1+ qi)
0 0 0 0000 0 0 0 0000 0100 0021 0002
0-50 10 10 0100 25 250 250 0021 0250 0199 0050
50-100 25 35 0350 75 1875 2125 0178 0370 0743 0275
100-150 37 72 0720 125 4625 6750 0565 0220 1452 0319
150-200 22 94 0940 175 3850 10600 0887 0060 1887 0113
200-250 6 100 1000 225 1350 11950 1000 - - -
Totale 100 11950 0759
27
00
01
02
03
04
05
06
07
08
09
10
00 01 02 03 04 05 06 07 08 09 10
pi
qi
Equidistribuzione Sardegna Campania
4680R~sar 2410R
~cam La concentrazione egrave piugrave
elevata in Sardegna
La curva di Lorenz conferma questo risultato
28
Riferimenti
bull C Gini (1912) Variabilitagrave e mutabilitagrave Contributo allo studio delle distribuzioni e relazioni statistiche Studi economici-giuridici dela Regia Universitagrave di Cagliari anno III
bull Lorenz M O (1905) Methods of measuring the concentration of wealth Publications of the American Statistical Association (Publications of the American Statistical Association Vol 9 No 70) 9 (70) 209ndash219
bull Per ulteriori riferimenti si possono consultare utilmente le pagine di Wikipedia relative allrsquoindice di Gini e alla curva di Lorenz
20
Il valore di R per un carattere con distribuzione continua si puograve ottenere come nel caso discreto rapportando lrsquoarea di concentrazione al suo valore massimo pari ad 12
Il valore di R per un carattere con distribuzione continua si puograve ottenere come nel caso discreto rapportando lrsquoarea di concentrazione al suo valore massimo pari ad 12
Variabili statistiche continue
Lrsquoindice di Gini egrave quindi pari a due volte lrsquoarea di concentrazione
Nota essendo Amax =12 si ha R=Ř
ConfrontiPuograve essere interessante confrontare la concentrazione di due caratteri
(o equivalentemente dello stesso carattere in due istanti diversi o in due ambiti territoriali diversi)
Esempio 1 il reddito risulta piugrave concentrato in Italia o in Francia
Esempio 2 la concentrazione del reddito in Italia era maggiore negli anni lsquo80 o negli anni lsquo90
Un modo semplice per stabilire quale carattere egrave maggiormente concentrato egrave quello di confrontare graficamente le curve di concentrazione nei due ambiti territoriali (o temporali) e stabilire quale si trova al di sopra
21
bull Non egrave detto che una delle due curve sia al di sopra dellrsquoaltra le curve si possono intersecare Si puograve tuttavia mostrare che se il carattere varia linearmente tra gli ambiti considerati allora le curve non si intersecano
bull In generale si puograve effettuare il confronto usando lrsquoindice di Gini
bull Poicheacute G=2A=1-2Area_sotto_la_curva_Lorenz il confronto attraverso lrsquoindici di Gini equivale al confronto tra le aree al di sotto delle curve di Lorenz dei due caratteri
Confronti
Confronti
Esempio la concentrazione del reddito nel mondo usando lrsquoindice R
23
Fonte CIA The world Factbook 2009
24
Esempio di Confronto Tra DistribuzioniSi riportano di seguito le distribuzioni dei finanziamenti concessi da un istituto bancario per lrsquoacquisto della prima casa a giovani coppie residenti in Campania ed in Sardegna
a) In quale regione risulta piugrave elevata la concentrazione dei finanziamenti concessi
b) Confrontare graficamente i diversi livelli di concentrazione dei finanziamenti nelle due regioni
Campania
Finanziamenti (migliaia di Euro) ni
0-50 10
50-100 25
100-150 37
150-200 22
200-250 6
Totale 100
Sardegna
Finanziamenti (migliaia di Euro) ni
0-50 57
50-100 3
100-150 7
150-200 8
200-250 25
Totale 100
25
Sardegna
Finanziamenti (migliaia di Euro) ni Ni pi xi xi ni Xi qi pi+1- pi qi+1+ qi (pi+1- pi)(qi+1+ qi)
0 0 0 0000 0 0 0 0000 0570 0149 0085
0-50 57 57 0570 25 1425 1425 0149 0030 0322 0010
50-100 3 60 0600 75 225 1650 0173 0070 0437 0031
100-150 7 67 0670 125 875 2525 0264 0080 0675 0054
150-200 8 75 0750 175 1400 3925 0411 0250 1411 0353
200-250 25 100 1000 225 5625 9550 1000 - - -
Totale 100 9550 0532
Concentrazione dei finanziamenti in Sardegna
26
Concentrazione dei finanziamenti in Campania
Campania
Finanziamenti (migliaia di Euro) ni Ni pi xi xi ni Xi qi pi+1- pi qi+1+ qi (pi+1- pi)(qi+1+ qi)
0 0 0 0000 0 0 0 0000 0100 0021 0002
0-50 10 10 0100 25 250 250 0021 0250 0199 0050
50-100 25 35 0350 75 1875 2125 0178 0370 0743 0275
100-150 37 72 0720 125 4625 6750 0565 0220 1452 0319
150-200 22 94 0940 175 3850 10600 0887 0060 1887 0113
200-250 6 100 1000 225 1350 11950 1000 - - -
Totale 100 11950 0759
27
00
01
02
03
04
05
06
07
08
09
10
00 01 02 03 04 05 06 07 08 09 10
pi
qi
Equidistribuzione Sardegna Campania
4680R~sar 2410R
~cam La concentrazione egrave piugrave
elevata in Sardegna
La curva di Lorenz conferma questo risultato
28
Riferimenti
bull C Gini (1912) Variabilitagrave e mutabilitagrave Contributo allo studio delle distribuzioni e relazioni statistiche Studi economici-giuridici dela Regia Universitagrave di Cagliari anno III
bull Lorenz M O (1905) Methods of measuring the concentration of wealth Publications of the American Statistical Association (Publications of the American Statistical Association Vol 9 No 70) 9 (70) 209ndash219
bull Per ulteriori riferimenti si possono consultare utilmente le pagine di Wikipedia relative allrsquoindice di Gini e alla curva di Lorenz
ConfrontiPuograve essere interessante confrontare la concentrazione di due caratteri
(o equivalentemente dello stesso carattere in due istanti diversi o in due ambiti territoriali diversi)
Esempio 1 il reddito risulta piugrave concentrato in Italia o in Francia
Esempio 2 la concentrazione del reddito in Italia era maggiore negli anni lsquo80 o negli anni lsquo90
Un modo semplice per stabilire quale carattere egrave maggiormente concentrato egrave quello di confrontare graficamente le curve di concentrazione nei due ambiti territoriali (o temporali) e stabilire quale si trova al di sopra
21
bull Non egrave detto che una delle due curve sia al di sopra dellrsquoaltra le curve si possono intersecare Si puograve tuttavia mostrare che se il carattere varia linearmente tra gli ambiti considerati allora le curve non si intersecano
bull In generale si puograve effettuare il confronto usando lrsquoindice di Gini
bull Poicheacute G=2A=1-2Area_sotto_la_curva_Lorenz il confronto attraverso lrsquoindici di Gini equivale al confronto tra le aree al di sotto delle curve di Lorenz dei due caratteri
Confronti
Confronti
Esempio la concentrazione del reddito nel mondo usando lrsquoindice R
23
Fonte CIA The world Factbook 2009
24
Esempio di Confronto Tra DistribuzioniSi riportano di seguito le distribuzioni dei finanziamenti concessi da un istituto bancario per lrsquoacquisto della prima casa a giovani coppie residenti in Campania ed in Sardegna
a) In quale regione risulta piugrave elevata la concentrazione dei finanziamenti concessi
b) Confrontare graficamente i diversi livelli di concentrazione dei finanziamenti nelle due regioni
Campania
Finanziamenti (migliaia di Euro) ni
0-50 10
50-100 25
100-150 37
150-200 22
200-250 6
Totale 100
Sardegna
Finanziamenti (migliaia di Euro) ni
0-50 57
50-100 3
100-150 7
150-200 8
200-250 25
Totale 100
25
Sardegna
Finanziamenti (migliaia di Euro) ni Ni pi xi xi ni Xi qi pi+1- pi qi+1+ qi (pi+1- pi)(qi+1+ qi)
0 0 0 0000 0 0 0 0000 0570 0149 0085
0-50 57 57 0570 25 1425 1425 0149 0030 0322 0010
50-100 3 60 0600 75 225 1650 0173 0070 0437 0031
100-150 7 67 0670 125 875 2525 0264 0080 0675 0054
150-200 8 75 0750 175 1400 3925 0411 0250 1411 0353
200-250 25 100 1000 225 5625 9550 1000 - - -
Totale 100 9550 0532
Concentrazione dei finanziamenti in Sardegna
26
Concentrazione dei finanziamenti in Campania
Campania
Finanziamenti (migliaia di Euro) ni Ni pi xi xi ni Xi qi pi+1- pi qi+1+ qi (pi+1- pi)(qi+1+ qi)
0 0 0 0000 0 0 0 0000 0100 0021 0002
0-50 10 10 0100 25 250 250 0021 0250 0199 0050
50-100 25 35 0350 75 1875 2125 0178 0370 0743 0275
100-150 37 72 0720 125 4625 6750 0565 0220 1452 0319
150-200 22 94 0940 175 3850 10600 0887 0060 1887 0113
200-250 6 100 1000 225 1350 11950 1000 - - -
Totale 100 11950 0759
27
00
01
02
03
04
05
06
07
08
09
10
00 01 02 03 04 05 06 07 08 09 10
pi
qi
Equidistribuzione Sardegna Campania
4680R~sar 2410R
~cam La concentrazione egrave piugrave
elevata in Sardegna
La curva di Lorenz conferma questo risultato
28
Riferimenti
bull C Gini (1912) Variabilitagrave e mutabilitagrave Contributo allo studio delle distribuzioni e relazioni statistiche Studi economici-giuridici dela Regia Universitagrave di Cagliari anno III
bull Lorenz M O (1905) Methods of measuring the concentration of wealth Publications of the American Statistical Association (Publications of the American Statistical Association Vol 9 No 70) 9 (70) 209ndash219
bull Per ulteriori riferimenti si possono consultare utilmente le pagine di Wikipedia relative allrsquoindice di Gini e alla curva di Lorenz
bull Non egrave detto che una delle due curve sia al di sopra dellrsquoaltra le curve si possono intersecare Si puograve tuttavia mostrare che se il carattere varia linearmente tra gli ambiti considerati allora le curve non si intersecano
bull In generale si puograve effettuare il confronto usando lrsquoindice di Gini
bull Poicheacute G=2A=1-2Area_sotto_la_curva_Lorenz il confronto attraverso lrsquoindici di Gini equivale al confronto tra le aree al di sotto delle curve di Lorenz dei due caratteri
Confronti
Confronti
Esempio la concentrazione del reddito nel mondo usando lrsquoindice R
23
Fonte CIA The world Factbook 2009
24
Esempio di Confronto Tra DistribuzioniSi riportano di seguito le distribuzioni dei finanziamenti concessi da un istituto bancario per lrsquoacquisto della prima casa a giovani coppie residenti in Campania ed in Sardegna
a) In quale regione risulta piugrave elevata la concentrazione dei finanziamenti concessi
b) Confrontare graficamente i diversi livelli di concentrazione dei finanziamenti nelle due regioni
Campania
Finanziamenti (migliaia di Euro) ni
0-50 10
50-100 25
100-150 37
150-200 22
200-250 6
Totale 100
Sardegna
Finanziamenti (migliaia di Euro) ni
0-50 57
50-100 3
100-150 7
150-200 8
200-250 25
Totale 100
25
Sardegna
Finanziamenti (migliaia di Euro) ni Ni pi xi xi ni Xi qi pi+1- pi qi+1+ qi (pi+1- pi)(qi+1+ qi)
0 0 0 0000 0 0 0 0000 0570 0149 0085
0-50 57 57 0570 25 1425 1425 0149 0030 0322 0010
50-100 3 60 0600 75 225 1650 0173 0070 0437 0031
100-150 7 67 0670 125 875 2525 0264 0080 0675 0054
150-200 8 75 0750 175 1400 3925 0411 0250 1411 0353
200-250 25 100 1000 225 5625 9550 1000 - - -
Totale 100 9550 0532
Concentrazione dei finanziamenti in Sardegna
26
Concentrazione dei finanziamenti in Campania
Campania
Finanziamenti (migliaia di Euro) ni Ni pi xi xi ni Xi qi pi+1- pi qi+1+ qi (pi+1- pi)(qi+1+ qi)
0 0 0 0000 0 0 0 0000 0100 0021 0002
0-50 10 10 0100 25 250 250 0021 0250 0199 0050
50-100 25 35 0350 75 1875 2125 0178 0370 0743 0275
100-150 37 72 0720 125 4625 6750 0565 0220 1452 0319
150-200 22 94 0940 175 3850 10600 0887 0060 1887 0113
200-250 6 100 1000 225 1350 11950 1000 - - -
Totale 100 11950 0759
27
00
01
02
03
04
05
06
07
08
09
10
00 01 02 03 04 05 06 07 08 09 10
pi
qi
Equidistribuzione Sardegna Campania
4680R~sar 2410R
~cam La concentrazione egrave piugrave
elevata in Sardegna
La curva di Lorenz conferma questo risultato
28
Riferimenti
bull C Gini (1912) Variabilitagrave e mutabilitagrave Contributo allo studio delle distribuzioni e relazioni statistiche Studi economici-giuridici dela Regia Universitagrave di Cagliari anno III
bull Lorenz M O (1905) Methods of measuring the concentration of wealth Publications of the American Statistical Association (Publications of the American Statistical Association Vol 9 No 70) 9 (70) 209ndash219
bull Per ulteriori riferimenti si possono consultare utilmente le pagine di Wikipedia relative allrsquoindice di Gini e alla curva di Lorenz
Confronti
Esempio la concentrazione del reddito nel mondo usando lrsquoindice R
23
Fonte CIA The world Factbook 2009
24
Esempio di Confronto Tra DistribuzioniSi riportano di seguito le distribuzioni dei finanziamenti concessi da un istituto bancario per lrsquoacquisto della prima casa a giovani coppie residenti in Campania ed in Sardegna
a) In quale regione risulta piugrave elevata la concentrazione dei finanziamenti concessi
b) Confrontare graficamente i diversi livelli di concentrazione dei finanziamenti nelle due regioni
Campania
Finanziamenti (migliaia di Euro) ni
0-50 10
50-100 25
100-150 37
150-200 22
200-250 6
Totale 100
Sardegna
Finanziamenti (migliaia di Euro) ni
0-50 57
50-100 3
100-150 7
150-200 8
200-250 25
Totale 100
25
Sardegna
Finanziamenti (migliaia di Euro) ni Ni pi xi xi ni Xi qi pi+1- pi qi+1+ qi (pi+1- pi)(qi+1+ qi)
0 0 0 0000 0 0 0 0000 0570 0149 0085
0-50 57 57 0570 25 1425 1425 0149 0030 0322 0010
50-100 3 60 0600 75 225 1650 0173 0070 0437 0031
100-150 7 67 0670 125 875 2525 0264 0080 0675 0054
150-200 8 75 0750 175 1400 3925 0411 0250 1411 0353
200-250 25 100 1000 225 5625 9550 1000 - - -
Totale 100 9550 0532
Concentrazione dei finanziamenti in Sardegna
26
Concentrazione dei finanziamenti in Campania
Campania
Finanziamenti (migliaia di Euro) ni Ni pi xi xi ni Xi qi pi+1- pi qi+1+ qi (pi+1- pi)(qi+1+ qi)
0 0 0 0000 0 0 0 0000 0100 0021 0002
0-50 10 10 0100 25 250 250 0021 0250 0199 0050
50-100 25 35 0350 75 1875 2125 0178 0370 0743 0275
100-150 37 72 0720 125 4625 6750 0565 0220 1452 0319
150-200 22 94 0940 175 3850 10600 0887 0060 1887 0113
200-250 6 100 1000 225 1350 11950 1000 - - -
Totale 100 11950 0759
27
00
01
02
03
04
05
06
07
08
09
10
00 01 02 03 04 05 06 07 08 09 10
pi
qi
Equidistribuzione Sardegna Campania
4680R~sar 2410R
~cam La concentrazione egrave piugrave
elevata in Sardegna
La curva di Lorenz conferma questo risultato
28
Riferimenti
bull C Gini (1912) Variabilitagrave e mutabilitagrave Contributo allo studio delle distribuzioni e relazioni statistiche Studi economici-giuridici dela Regia Universitagrave di Cagliari anno III
bull Lorenz M O (1905) Methods of measuring the concentration of wealth Publications of the American Statistical Association (Publications of the American Statistical Association Vol 9 No 70) 9 (70) 209ndash219
bull Per ulteriori riferimenti si possono consultare utilmente le pagine di Wikipedia relative allrsquoindice di Gini e alla curva di Lorenz
24
Esempio di Confronto Tra DistribuzioniSi riportano di seguito le distribuzioni dei finanziamenti concessi da un istituto bancario per lrsquoacquisto della prima casa a giovani coppie residenti in Campania ed in Sardegna
a) In quale regione risulta piugrave elevata la concentrazione dei finanziamenti concessi
b) Confrontare graficamente i diversi livelli di concentrazione dei finanziamenti nelle due regioni
Campania
Finanziamenti (migliaia di Euro) ni
0-50 10
50-100 25
100-150 37
150-200 22
200-250 6
Totale 100
Sardegna
Finanziamenti (migliaia di Euro) ni
0-50 57
50-100 3
100-150 7
150-200 8
200-250 25
Totale 100
25
Sardegna
Finanziamenti (migliaia di Euro) ni Ni pi xi xi ni Xi qi pi+1- pi qi+1+ qi (pi+1- pi)(qi+1+ qi)
0 0 0 0000 0 0 0 0000 0570 0149 0085
0-50 57 57 0570 25 1425 1425 0149 0030 0322 0010
50-100 3 60 0600 75 225 1650 0173 0070 0437 0031
100-150 7 67 0670 125 875 2525 0264 0080 0675 0054
150-200 8 75 0750 175 1400 3925 0411 0250 1411 0353
200-250 25 100 1000 225 5625 9550 1000 - - -
Totale 100 9550 0532
Concentrazione dei finanziamenti in Sardegna
26
Concentrazione dei finanziamenti in Campania
Campania
Finanziamenti (migliaia di Euro) ni Ni pi xi xi ni Xi qi pi+1- pi qi+1+ qi (pi+1- pi)(qi+1+ qi)
0 0 0 0000 0 0 0 0000 0100 0021 0002
0-50 10 10 0100 25 250 250 0021 0250 0199 0050
50-100 25 35 0350 75 1875 2125 0178 0370 0743 0275
100-150 37 72 0720 125 4625 6750 0565 0220 1452 0319
150-200 22 94 0940 175 3850 10600 0887 0060 1887 0113
200-250 6 100 1000 225 1350 11950 1000 - - -
Totale 100 11950 0759
27
00
01
02
03
04
05
06
07
08
09
10
00 01 02 03 04 05 06 07 08 09 10
pi
qi
Equidistribuzione Sardegna Campania
4680R~sar 2410R
~cam La concentrazione egrave piugrave
elevata in Sardegna
La curva di Lorenz conferma questo risultato
28
Riferimenti
bull C Gini (1912) Variabilitagrave e mutabilitagrave Contributo allo studio delle distribuzioni e relazioni statistiche Studi economici-giuridici dela Regia Universitagrave di Cagliari anno III
bull Lorenz M O (1905) Methods of measuring the concentration of wealth Publications of the American Statistical Association (Publications of the American Statistical Association Vol 9 No 70) 9 (70) 209ndash219
bull Per ulteriori riferimenti si possono consultare utilmente le pagine di Wikipedia relative allrsquoindice di Gini e alla curva di Lorenz
25
Sardegna
Finanziamenti (migliaia di Euro) ni Ni pi xi xi ni Xi qi pi+1- pi qi+1+ qi (pi+1- pi)(qi+1+ qi)
0 0 0 0000 0 0 0 0000 0570 0149 0085
0-50 57 57 0570 25 1425 1425 0149 0030 0322 0010
50-100 3 60 0600 75 225 1650 0173 0070 0437 0031
100-150 7 67 0670 125 875 2525 0264 0080 0675 0054
150-200 8 75 0750 175 1400 3925 0411 0250 1411 0353
200-250 25 100 1000 225 5625 9550 1000 - - -
Totale 100 9550 0532
Concentrazione dei finanziamenti in Sardegna
26
Concentrazione dei finanziamenti in Campania
Campania
Finanziamenti (migliaia di Euro) ni Ni pi xi xi ni Xi qi pi+1- pi qi+1+ qi (pi+1- pi)(qi+1+ qi)
0 0 0 0000 0 0 0 0000 0100 0021 0002
0-50 10 10 0100 25 250 250 0021 0250 0199 0050
50-100 25 35 0350 75 1875 2125 0178 0370 0743 0275
100-150 37 72 0720 125 4625 6750 0565 0220 1452 0319
150-200 22 94 0940 175 3850 10600 0887 0060 1887 0113
200-250 6 100 1000 225 1350 11950 1000 - - -
Totale 100 11950 0759
27
00
01
02
03
04
05
06
07
08
09
10
00 01 02 03 04 05 06 07 08 09 10
pi
qi
Equidistribuzione Sardegna Campania
4680R~sar 2410R
~cam La concentrazione egrave piugrave
elevata in Sardegna
La curva di Lorenz conferma questo risultato
28
Riferimenti
bull C Gini (1912) Variabilitagrave e mutabilitagrave Contributo allo studio delle distribuzioni e relazioni statistiche Studi economici-giuridici dela Regia Universitagrave di Cagliari anno III
bull Lorenz M O (1905) Methods of measuring the concentration of wealth Publications of the American Statistical Association (Publications of the American Statistical Association Vol 9 No 70) 9 (70) 209ndash219
bull Per ulteriori riferimenti si possono consultare utilmente le pagine di Wikipedia relative allrsquoindice di Gini e alla curva di Lorenz
26
Concentrazione dei finanziamenti in Campania
Campania
Finanziamenti (migliaia di Euro) ni Ni pi xi xi ni Xi qi pi+1- pi qi+1+ qi (pi+1- pi)(qi+1+ qi)
0 0 0 0000 0 0 0 0000 0100 0021 0002
0-50 10 10 0100 25 250 250 0021 0250 0199 0050
50-100 25 35 0350 75 1875 2125 0178 0370 0743 0275
100-150 37 72 0720 125 4625 6750 0565 0220 1452 0319
150-200 22 94 0940 175 3850 10600 0887 0060 1887 0113
200-250 6 100 1000 225 1350 11950 1000 - - -
Totale 100 11950 0759
27
00
01
02
03
04
05
06
07
08
09
10
00 01 02 03 04 05 06 07 08 09 10
pi
qi
Equidistribuzione Sardegna Campania
4680R~sar 2410R
~cam La concentrazione egrave piugrave
elevata in Sardegna
La curva di Lorenz conferma questo risultato
28
Riferimenti
bull C Gini (1912) Variabilitagrave e mutabilitagrave Contributo allo studio delle distribuzioni e relazioni statistiche Studi economici-giuridici dela Regia Universitagrave di Cagliari anno III
bull Lorenz M O (1905) Methods of measuring the concentration of wealth Publications of the American Statistical Association (Publications of the American Statistical Association Vol 9 No 70) 9 (70) 209ndash219
bull Per ulteriori riferimenti si possono consultare utilmente le pagine di Wikipedia relative allrsquoindice di Gini e alla curva di Lorenz
27
00
01
02
03
04
05
06
07
08
09
10
00 01 02 03 04 05 06 07 08 09 10
pi
qi
Equidistribuzione Sardegna Campania
4680R~sar 2410R
~cam La concentrazione egrave piugrave
elevata in Sardegna
La curva di Lorenz conferma questo risultato
28
Riferimenti
bull C Gini (1912) Variabilitagrave e mutabilitagrave Contributo allo studio delle distribuzioni e relazioni statistiche Studi economici-giuridici dela Regia Universitagrave di Cagliari anno III
bull Lorenz M O (1905) Methods of measuring the concentration of wealth Publications of the American Statistical Association (Publications of the American Statistical Association Vol 9 No 70) 9 (70) 209ndash219
bull Per ulteriori riferimenti si possono consultare utilmente le pagine di Wikipedia relative allrsquoindice di Gini e alla curva di Lorenz
28
Riferimenti
bull C Gini (1912) Variabilitagrave e mutabilitagrave Contributo allo studio delle distribuzioni e relazioni statistiche Studi economici-giuridici dela Regia Universitagrave di Cagliari anno III
bull Lorenz M O (1905) Methods of measuring the concentration of wealth Publications of the American Statistical Association (Publications of the American Statistical Association Vol 9 No 70) 9 (70) 209ndash219
bull Per ulteriori riferimenti si possono consultare utilmente le pagine di Wikipedia relative allrsquoindice di Gini e alla curva di Lorenz