31
WHIP Work Histories Italian Panel roberto leombruni Laboratorio Revelli e Università di Torino Moncalieri, 10 maggio 2007

WHIP Work Histories Italian Panel WHIP Work Histories Italian Panel roberto leombruni Laboratorio Revelli e Università di Torino roberto leombruni Laboratorio

Embed Size (px)

Citation preview

Page 1: WHIP Work Histories Italian Panel WHIP Work Histories Italian Panel roberto leombruni Laboratorio Revelli e Università di Torino roberto leombruni Laboratorio

WHIPWork Histories Italian Panel

WHIPWork Histories Italian Panel

roberto leombruniLaboratorio Revelli e Università di Torino

roberto leombruniLaboratorio Revelli e Università di Torino

Moncalieri, 10 maggio 2007Moncalieri, 10 maggio 2007

Page 2: WHIP Work Histories Italian Panel WHIP Work Histories Italian Panel roberto leombruni Laboratorio Revelli e Università di Torino roberto leombruni Laboratorio

Indice della presentazioneIndice della presentazione

L’uso di dati amministrativi a fini scientifici

Introduzione a Whip

Dati e metadati: la “fabbrica” di Whip

L’uso di Whip per studi sul mercato del lavoro

L’uso di dati amministrativi a fini scientifici

Introduzione a Whip

Dati e metadati: la “fabbrica” di Whip

L’uso di Whip per studi sul mercato del lavoro

Page 3: WHIP Work Histories Italian Panel WHIP Work Histories Italian Panel roberto leombruni Laboratorio Revelli e Università di Torino roberto leombruni Laboratorio

L’uso di dati amministrativi a fini scientificiL’uso di dati amministrativi a fini scientifici

Tre tipi di dati per lo studio dei fenomeni

sociali:

• Dati survey (field study)

• Dati sperimentali

• Dati amministrativi

Tre tipi di dati per lo studio dei fenomeni

sociali:

• Dati survey (field study)

• Dati sperimentali

• Dati amministrativi

(poco diffusi)

[ l’uso di dati amministrativi . intro ][ l’uso di dati amministrativi . intro ] [ 1 / 6 ][ 1 / 6 ]

Page 4: WHIP Work Histories Italian Panel WHIP Work Histories Italian Panel roberto leombruni Laboratorio Revelli e Università di Torino roberto leombruni Laboratorio

[ l’uso di dati amministrativi . intro ][ l’uso di dati amministrativi . intro ] [ 2 / 6 ][ 2 / 6 ]

Dati survey Dati amministrativi

Viene rilevato esattamente il fenomeno di interesse

Alta standardizzazione delle definizioni e delle codifiche a livello internazionale

Elevato know how nel loro uso da parte della comunità scientifica

Vengono raccolti a fini amministrativi, e non tutti gli aspetti interessanti per il ricercatore vengono rilevati

Poco confrontabili a livello internazionale

Spesso i ricercatori “non sanno usarli”

Il fenomeno di interesse viene rilevato solo se c’è una domanda di ricerca

Molto costosi, in soldi e response burden

scarsa estensione campionaria

scarsa profondità temporale

Vengono raccolti a prescindere da interessi di ricerca: si può interrogare la storia!

Enormemente più economici che qualunque indagine CAPI/CATI

Page 5: WHIP Work Histories Italian Panel WHIP Work Histories Italian Panel roberto leombruni Laboratorio Revelli e Università di Torino roberto leombruni Laboratorio

Principali esperienze italiane e internazionaliPrincipali esperienze italiane e internazionaliLeader, nonché pionieri, sono la Finlandia e altri paesi nordici. Circa il 96% dei dati raccolti da Statistics Finland ha origine amministrativa. Archivi su tutta la popolazione, che coprono tematiche dal lavoro, alla famiglia, alla salute.

Su base campionaria, dati su lavoratori e imprese sono utilizzati per scopi di ricerca ormai nei principali paesi sviluppati, presso gli Istituti nazionali di statistica (es: l’Insee in Francia), gli Istituti previdenziali (es: la SSA negli Stati Uniti), centri di ricerca (ex: lo IAB in Germania).

A livello OCSE, importante lavoro della Short-Term Economic Statistics (STES) Taskforce on Administrative Data, per l’armonizzazione e standardizzazione delle metodologie

In Italia, oltre a Whip e a panel “cugini” (quali CLAP o il panel Isfol-La Sapienza), sono da citare importanti esperienze per l’analisi di mercati del lavoro locali:

. Il progetto Aspo (Archivio statistico provinciale per l’occupazione)

. Il progetto AMeRIcA (Anagrafe Milanese e Redditi Individuali)

. Il progetto GIOVE (dati dei centri per l’impiego)

Leader, nonché pionieri, sono la Finlandia e altri paesi nordici. Circa il 96% dei dati raccolti da Statistics Finland ha origine amministrativa. Archivi su tutta la popolazione, che coprono tematiche dal lavoro, alla famiglia, alla salute.

Su base campionaria, dati su lavoratori e imprese sono utilizzati per scopi di ricerca ormai nei principali paesi sviluppati, presso gli Istituti nazionali di statistica (es: l’Insee in Francia), gli Istituti previdenziali (es: la SSA negli Stati Uniti), centri di ricerca (ex: lo IAB in Germania).

A livello OCSE, importante lavoro della Short-Term Economic Statistics (STES) Taskforce on Administrative Data, per l’armonizzazione e standardizzazione delle metodologie

In Italia, oltre a Whip e a panel “cugini” (quali CLAP o il panel Isfol-La Sapienza), sono da citare importanti esperienze per l’analisi di mercati del lavoro locali:

. Il progetto Aspo (Archivio statistico provinciale per l’occupazione)

. Il progetto AMeRIcA (Anagrafe Milanese e Redditi Individuali)

. Il progetto GIOVE (dati dei centri per l’impiego)

[ l’uso di dati amministrativi . intro ][ l’uso di dati amministrativi . intro ] [ 3 / 6 ][ 3 / 6 ]

Page 6: WHIP Work Histories Italian Panel WHIP Work Histories Italian Panel roberto leombruni Laboratorio Revelli e Università di Torino roberto leombruni Laboratorio

Definizione di dati amministrativiDefinizione di dati amministrativi

Secondo la STES Taskforce on Administrative Data i dati amministrativi son definiti dalle seguenti caratteristiche:Secondo la STES Taskforce on Administrative Data i dati amministrativi son definiti dalle seguenti caratteristiche:

[ l’uso di dati amministrativi . definizione e sfide ][ l’uso di dati amministrativi . definizione e sfide ] [ 4 / 6 ][ 4 / 6 ]

• L’agente che fornisce i dati all’agenzia statistica e l’unità cui i dati si riferiscono sono di solito diversi, al contrario che nelle indagini survey( non chiedo direttamente ad A, ma chiedo a B di riferirmi su A);

• I dati sono raccolti per un preciso scopo, non statistico, che potrebbe incidere sul trattamento della unità di indagine;

• lo scopo è una copertura completa della popolazione;

• il controllo dei metodi con cui i dati amministrativi sono raccolti e processati sono in capo alla agenzia amministrativa (e non all’agenzia statistica)( problema di comunicazione: non so come B abbia “intervistato” A).

• L’agente che fornisce i dati all’agenzia statistica e l’unità cui i dati si riferiscono sono di solito diversi, al contrario che nelle indagini survey( non chiedo direttamente ad A, ma chiedo a B di riferirmi su A);

• I dati sono raccolti per un preciso scopo, non statistico, che potrebbe incidere sul trattamento della unità di indagine;

• lo scopo è una copertura completa della popolazione;

• il controllo dei metodi con cui i dati amministrativi sono raccolti e processati sono in capo alla agenzia amministrativa (e non all’agenzia statistica)( problema di comunicazione: non so come B abbia “intervistato” A).

Aggiungiamo:

• L’agente che raccoglie i dati non è estraneo rispetto al fenomeno in esame

Aggiungiamo:

• L’agente che raccoglie i dati non è estraneo rispetto al fenomeno in esame

Page 7: WHIP Work Histories Italian Panel WHIP Work Histories Italian Panel roberto leombruni Laboratorio Revelli e Università di Torino roberto leombruni Laboratorio

Sfide, per i produttori di dati amministrativiSfide, per i produttori di dati amministrativi

Sempre secondo la STES, le principali sfide cui si trovano di fronte i produttori di dati amministrativi:Sempre secondo la STES, le principali sfide cui si trovano di fronte i produttori di dati amministrativi:

[ l’uso di dati amministrativi . definizione e sfide ][ l’uso di dati amministrativi . definizione e sfide ] [ 5 / 6 ][ 5 / 6 ]

• Timeliness (tempestività): i dati amministrativi sono in genere disponibili troppo lentamente perché possano essere usati direttamente per produrre statistiche di breve termine, vale a dire come “termometro” per gli operatori, pubblici e privati;

• Qualità: le principali criticalità rispetto alla qualità dei dati riguarda:

questioni di definizione sistemi di classificazione utilizzati validazione dei dati;

• Copertura informativa: anche se garantiscono una copertura, di solito, sulla intera popolazione oggetto di studio, vengono rilevate solo le variabili pertinenti l’attività gestionale dell’agenzia. La sfida, è quella di recepire nel disegno della raccolta dei dati le esigenze principali degli altri operatori;

• Timeliness (tempestività): i dati amministrativi sono in genere disponibili troppo lentamente perché possano essere usati direttamente per produrre statistiche di breve termine, vale a dire come “termometro” per gli operatori, pubblici e privati;

• Qualità: le principali criticalità rispetto alla qualità dei dati riguarda:

questioni di definizione sistemi di classificazione utilizzati validazione dei dati;

• Copertura informativa: anche se garantiscono una copertura, di solito, sulla intera popolazione oggetto di studio, vengono rilevate solo le variabili pertinenti l’attività gestionale dell’agenzia. La sfida, è quella di recepire nel disegno della raccolta dei dati le esigenze principali degli altri operatori;

Page 8: WHIP Work Histories Italian Panel WHIP Work Histories Italian Panel roberto leombruni Laboratorio Revelli e Università di Torino roberto leombruni Laboratorio

Sfide, per gli utilizzatori di dati amministrativiSfide, per gli utilizzatori di dati amministrativi

La principale sfida cui si trovano di fronte gli utilizzatori di dati amministrativi è quella di sviluppare un know how analogo a quello a disposizione nell’uso dei dati survey. Le principali criticalità:

La principale sfida cui si trovano di fronte gli utilizzatori di dati amministrativi è quella di sviluppare un know how analogo a quello a disposizione nell’uso dei dati survey. Le principali criticalità:

[ l’uso di dati amministrativi . definizione e sfide ][ l’uso di dati amministrativi . definizione e sfide ] [ 6 / 6 ][ 6 / 6 ]

• Problemi di selezione: in una survey la rappresentatività dei dati è garantita dal disegno della rilevazione, e dalle metodologie per svolgere la rilevazione stessa. Su entrambi i punti c’è una amplissima letteratura scientifica, ed esistono standard e metodologie ampiamente condivise.

• Mappatura delle informazioni: essendoci una diversità tra l’informazione raccolta (ad esempio: la retribuzione base per il calcolo dei contributi) e l’informazione di interesse per lo studioso (ad esempio: la retribuzione lorda, o costo del lavoro), la prima va mappata nella seconda.

• Conversione delle codifiche: una mappatura analoga, anche a parità di variabile osservata, è necessaria tra le codifiche utilizzate nella raccolta, e le codifiche standard utilizzate nella letteratura scientifica

• Problemi di selezione: in una survey la rappresentatività dei dati è garantita dal disegno della rilevazione, e dalle metodologie per svolgere la rilevazione stessa. Su entrambi i punti c’è una amplissima letteratura scientifica, ed esistono standard e metodologie ampiamente condivise.

• Mappatura delle informazioni: essendoci una diversità tra l’informazione raccolta (ad esempio: la retribuzione base per il calcolo dei contributi) e l’informazione di interesse per lo studioso (ad esempio: la retribuzione lorda, o costo del lavoro), la prima va mappata nella seconda.

• Conversione delle codifiche: una mappatura analoga, anche a parità di variabile osservata, è necessaria tra le codifiche utilizzate nella raccolta, e le codifiche standard utilizzate nella letteratura scientifica

Page 9: WHIP Work Histories Italian Panel WHIP Work Histories Italian Panel roberto leombruni Laboratorio Revelli e Università di Torino roberto leombruni Laboratorio

microdati che registrano tutti i principali eventi

delle storie lavorative individuali

microdati che registrano tutti i principali eventi

delle storie lavorative individuali

[ cos’è WHIP ][ cos’è WHIP ]

WHIP sta per Work Histories Italian PanelWHIP sta per Work Histories Italian Panel

lavoro autonomolavoro autonomo pensionepensionelavoro dipendentelavoro dipendente disoccupazionedisoccupazione

19851985 20042004

[ 1 / 6 ][ 1 / 6 ]

Page 10: WHIP Work Histories Italian Panel WHIP Work Histories Italian Panel roberto leombruni Laboratorio Revelli e Università di Torino roberto leombruni Laboratorio

WHIP è basato principalmente su dati amministrativi forniti

dall’INPS al Laboratorio Revelli in base a una convenzione tra

l’istituto previdenziale e l’Università di Torino.

Un’altra fonte importante per Whip sono i dati amministrativi

forniti dall’INAIL, in base a una convenzione analoga, relativi

agli infortuni sul lavoro e alle malattie professionali.

Il campionamento è sistematico, in base a quattro date di

nascita. Ne risulta un campione di circa 1:90 individui (4/365),

seguiti con grande dettaglio a partire dal 1985, e con minor

dettaglio per gli anni precedenti (dato riassuntivo degli Estratti

Conto).

Fonte dei dati e copertura campionariaFonte dei dati e copertura campionaria

[ cos’è WHIP ][ cos’è WHIP ] [ 2 / 6 ][ 2 / 6 ]

Page 11: WHIP Work Histories Italian Panel WHIP Work Histories Italian Panel roberto leombruni Laboratorio Revelli e Università di Torino roberto leombruni Laboratorio

[ cos’è WHIP ][ cos’è WHIP ]

struttura della banca datistruttura della banca dati

individuiindividui

impreseimprese

lavoro dipendentelavoro dipendente

serie dipendentiserie dipendenti

pensionipensioni

lavoro autonomolavoro autonomo

prestazioni socialiprestazioni sociali

anagraficheanagrafiche episodiepisodi dati annualidati annuali

infortuni / MPinfortuni / MP

dati annui RLdati annui RL

[ 3 / 6 ][ 3 / 6 ]

Page 12: WHIP Work Histories Italian Panel WHIP Work Histories Italian Panel roberto leombruni Laboratorio Revelli e Università di Torino roberto leombruni Laboratorio

Dinamiche di impresa

Come si colloca nel “mercato” delle banche dati statistiche

Come si colloca nel “mercato” delle banche dati statistiche

Retribuzioni

Occupazionee mobilità

[ cos’è WHIP ][ cos’è WHIP ] [ 4 / 6 ][ 4 / 6 ]

Page 13: WHIP Work Histories Italian Panel WHIP Work Histories Italian Panel roberto leombruni Laboratorio Revelli e Università di Torino roberto leombruni Laboratorio

I principali competitoriI principali competitori

Rilevazione Trimestrale delle forze di lavoro (Istat)

Indagine sui bilanci delle famiglie italiane (Banca d’Italia)

Indagine sull’occupazione, gli orari di lavoro e le retribuzioni presso le grandi imprese dell’industria e dei servizi (Istat)

Indagine sulle retribuzioni e orari contrattuali (Istat)

...banche dati varie sulle imprese...

[ cos’è WHIP . I “competitori” ][ cos’è WHIP . I “competitori” ] [ 5 / 6 ][ 5 / 6 ]

Page 14: WHIP Work Histories Italian Panel WHIP Work Histories Italian Panel roberto leombruni Laboratorio Revelli e Università di Torino roberto leombruni Laboratorio

2000200019991999 20012001

[ cos’è WHIP . la danza dei sette veli… ][ cos’è WHIP . la danza dei sette veli… ] [ 6 / 6 ][ 6 / 6 ]

Page 15: WHIP Work Histories Italian Panel WHIP Work Histories Italian Panel roberto leombruni Laboratorio Revelli e Università di Torino roberto leombruni Laboratorio

2000200019991999 20012001

[ cos’è WHIP . la danza dei sette veli… ][ cos’è WHIP . la danza dei sette veli… ] [ 6 / 6 ][ 6 / 6 ]

Page 16: WHIP Work Histories Italian Panel WHIP Work Histories Italian Panel roberto leombruni Laboratorio Revelli e Università di Torino roberto leombruni Laboratorio

2000200019991999 20012001

[ cos’è WHIP . la danza dei sette veli… ][ cos’è WHIP . la danza dei sette veli… ] [ 6 / 6 ][ 6 / 6 ]

Page 17: WHIP Work Histories Italian Panel WHIP Work Histories Italian Panel roberto leombruni Laboratorio Revelli e Università di Torino roberto leombruni Laboratorio

2000200019991999 20012001

[ cos’è WHIP . la danza dei sette veli… ][ cos’è WHIP . la danza dei sette veli… ] [ 6 / 6 ][ 6 / 6 ]

Page 18: WHIP Work Histories Italian Panel WHIP Work Histories Italian Panel roberto leombruni Laboratorio Revelli e Università di Torino roberto leombruni Laboratorio

2000200019991999 20012001

[ cos’è WHIP . la danza dei sette veli… ][ cos’è WHIP . la danza dei sette veli… ] [ 6 / 6 ][ 6 / 6 ]

Page 19: WHIP Work Histories Italian Panel WHIP Work Histories Italian Panel roberto leombruni Laboratorio Revelli e Università di Torino roberto leombruni Laboratorio

2000200019991999 20012001

[ cos’è WHIP . la danza dei sette veli… ][ cos’è WHIP . la danza dei sette veli… ] [ 6 / 6 ][ 6 / 6 ]

Page 20: WHIP Work Histories Italian Panel WHIP Work Histories Italian Panel roberto leombruni Laboratorio Revelli e Università di Torino roberto leombruni Laboratorio

Rilevazione Trimestrale delle Forze di Lavoro

PeriodicitàTrimestrale

CoperturaCostituisce la principale fonte statistica sul mercato del lavoro in Italia. Da essa vengono derivate le stime ufficiali a livello aggregato degli occupati e delle persone in cerca di lavoro. L’universo di riferimento dell’indagine è costituito da tutti i componenti delle famiglie residenti in Italia, anche se temporaneamente emigrati all’estero. Sono esclusi i membri permanenti delle convivenze (collegi, convitti, conventi, caserme, ecc.). L'unità di rilevazione è la famiglia di fatto. Questa va intesa come un insieme di persone legate da vincoli di matrimonio, parentela, affinità, adozione, tutela o da vincoli affettivi, coabitanti ed aventi dimora abituale nello stesso comune (anche se non residenti secondo l’anagrafe nello stesso domicilio). L'indagine viene svolta trimestralmente a gennaio, aprile, luglio e ottobre di ogni anno al fine di cogliere la stagionalità dei fenomeni rilevati.(estratto da www.istat.it)

[ cos’è WHIP . schede ][ cos’è WHIP . schede ]

Page 21: WHIP Work Histories Italian Panel WHIP Work Histories Italian Panel roberto leombruni Laboratorio Revelli e Università di Torino roberto leombruni Laboratorio

Indagine sui bilanci delle famiglie italiane

PeriodicitàBiennale

CoperturaL'indagine sui bilanci delle famiglie italiane nasce negli anni '60 con l'obiettivo di raccogliere informazioni sui redditi e i risparmi delle famiglie italiane. Nel corso degli anni l'oggetto della rilevazione si è andato estendendo includendo anche la ricchezza e altri aspetti inerenti i comportamenti economici e finanziari delle famiglie, come ad esempio l'uso dei mezzi di pagamento.Nelle ultime indagini il campione è formato da circa 8.000 famiglie (24.000 individui), distribuite in circa 300 comuni italiani.I risultati dell'indagine vengono regolarmente pubblicati nei Supplementi al Bollettino Statistico della Banca. I dati raccolti presso le famiglie, in forma anonima, sono disponibili gratuitamente per elaborazioni e ricerche.

[ cos’è WHIP . schede ][ cos’è WHIP . schede ]

Page 22: WHIP Work Histories Italian Panel WHIP Work Histories Italian Panel roberto leombruni Laboratorio Revelli e Università di Torino roberto leombruni Laboratorio

Indagine sull'occupazione, gli orari di lavoro e le retribuzioni presso le grandi imprese dell'industria e dei servizi

PeriodicitàMensile

CoperturaI dati vengono diffusi sotto forma di indici (dicembre 2000=100) delle retribuzioni orarie e per dipendente. Essi vengono ricavati dall’indagine sulle imprese con 500 e più addetti del settore industriale (estrazione minerali, attività manufatturiere, energia, gas e acqua e costruzioni) e di quello dei servizi (commercio, alberghi e attività pubbliche, trasporti e comunicazioni, servizi di produzione).L’indice delle retribuzioni lorde per dipendente viene calcolato per le seguenti tre categorie: operai e apprendisti, impiegati e intermedi e totale dei lavoratori (esclusi i dirigenti). La retribuzione lorda considerata comprende tutti i pagamenti, regolari e irregolari, comprensivi dei contributi previdenziali, delle tasse e della liquidazione e al netto dei pagamenti fatti per conto di enti di previdenza sociale.(estratto da www.istat.it)

[ cos’è WHIP . schede ][ cos’è WHIP . schede ]

Page 23: WHIP Work Histories Italian Panel WHIP Work Histories Italian Panel roberto leombruni Laboratorio Revelli e Università di Torino roberto leombruni Laboratorio

Indagine sulle retribuzioni e orari contrattuali

PeriodicitàMensile

CoperturaI dati vengono diffusi sotto forma di indici (dicembre 2000=100) delle retribuzioni orarie e per dipendente. Essi vengono definiti sulla base dei più rappresentativi contratti collettivi nazionali di lavoro e, per i soli settori dell’agricoltura e delle costruzioni, anche utilizzando contratti provinciali. I numeri indice delle retribuzioni contrattuali per dipendente forniscono una misura delle variazioni dei compensi che spetterebbero, nell’arco di un anno, al lavoratore dipendente sulla base dei contenuti dei contratti nazionali di lavoro e della normativa in vigore. La retribuzione viene espressa in forma “mensilizzata”, cioè calcolata come dodicesimo della retribuzione spettante, nell’arco di un anno. Gli indici delle retribuzioni contrattuali prendono a riferimento i rapporti di lavoro dipendente a tempo pieno, senza considerare alcuna detrazione per eventuali periodi di assenza, né altre motivazioni che giustifichino una riduzione dei compensi previsti contrattualmente. (estratto da www.istat.it)

[ cos’è WHIP . schede ][ cos’è WHIP . schede ]

Page 24: WHIP Work Histories Italian Panel WHIP Work Histories Italian Panel roberto leombruni Laboratorio Revelli e Università di Torino roberto leombruni Laboratorio

[ What is WHIP ] . the source data[ What is WHIP ] . the source data ( 1 / 2 )( 1 / 2 )

l’offerta di dati è consistente: about 700.000 individuals observed; around 1.400 million observations (records per variables)

the coverage is wide: INPS administrates pensions and social security benefits of all italian workers but those employed in the public sector, and some categories of professionals working as self-employed.

no survey-like attrition: no individuals lost due to missing records...

...but: if an individual go black, nothing is recorded

certified information: high average quality of the information recorded

the information is collected for administrative purposes, not for research ones

l’offerta di dati è consistente: about 700.000 individuals observed; around 1.400 million observations (records per variables)

the coverage is wide: INPS administrates pensions and social security benefits of all italian workers but those employed in the public sector, and some categories of professionals working as self-employed.

no survey-like attrition: no individuals lost due to missing records...

...but: if an individual go black, nothing is recorded

certified information: high average quality of the information recorded

the information is collected for administrative purposes, not for research ones

…alcuni pro e contro……alcuni pro e contro…

Page 25: WHIP Work Histories Italian Panel WHIP Work Histories Italian Panel roberto leombruni Laboratorio Revelli e Università di Torino roberto leombruni Laboratorio

[ What is WHIP ] . the source data[ What is WHIP ] . the source data ( 2 / 2 )( 2 / 2 )

How long is the distance between INPS’ source data

and a database designed for scientific purposes?

How long is the distance between INPS’ source data

and a database designed for scientific purposes?

data encoding is tipically different: a scientist looks at international classifications, INPS’ staff has to refer to the classifications contained in protocols and rules

data normalization: the categories in which the informations is organized are tipically different

no purpose, no quality: when a not-strictly-needed (for INPS) information is recorded, its quality can be very low; but we need quality standards to be met for all information contained in the database

extremely important (for research issues) information is not recorded:

job start - job end actually, the job itselfa time-invariant firm idthe education level, the family status, …

data encoding is tipically different: a scientist looks at international classifications, INPS’ staff has to refer to the classifications contained in protocols and rules

data normalization: the categories in which the informations is organized are tipically different

no purpose, no quality: when a not-strictly-needed (for INPS) information is recorded, its quality can be very low; but we need quality standards to be met for all information contained in the database

extremely important (for research issues) information is not recorded:

job start - job end actually, the job itselfa time-invariant firm idthe education level, the family status, …

Page 26: WHIP Work Histories Italian Panel WHIP Work Histories Italian Panel roberto leombruni Laboratorio Revelli e Università di Torino roberto leombruni Laboratorio

data reception docs collection

data cleansing

data normalization

Inps’ archives sample docsdocs

longitudinal identificationof firms

longitudinal identificationof job spells

“the factory”“the factory”

work historiesdatabase

on linedocumentation

InputsInputs

OutputsOutputs

[ What is WHIP ] . the Whip building procedure[ What is WHIP ] . the Whip building procedure ( 1 / 3 )( 1 / 3 )

Page 27: WHIP Work Histories Italian Panel WHIP Work Histories Italian Panel roberto leombruni Laboratorio Revelli e Università di Torino roberto leombruni Laboratorio

snaphot on the multi-to-multi relation between contributive records and jobssnaphot on the multi-to-multi relation between contributive records and jobs

[ What is WHIP ] . the Whip building procedure[ What is WHIP ] . the Whip building procedure ( 2 / 3 )( 2 / 3 )

year #records multiple records within job

1985 150544 4,7%1986 150686 5,2%1987 153052 6,9%1988 156779 8,1%1989 159849 8,9%1990 165975 9,4%1991 166427 9,5%1992 163017 9,0%1993 154316 8,8%1994 152669 9,2%1995 156097 9,3%1996 158730 10,7%1997 158429 10,0%1998 141219 9,9%1999 157774 10,0%

Page 28: WHIP Work Histories Italian Panel WHIP Work Histories Italian Panel roberto leombruni Laboratorio Revelli e Università di Torino roberto leombruni Laboratorio

[ What is WHIP ] . the Whip building procedure[ What is WHIP ] . the Whip building procedure ( 3 / 3 )( 3 / 3 )

snaphot on the impact of thelongitudinal identification of firms (LIF)

on job histories

snaphot on the impact of thelongitudinal identification of firms (LIF)

on job histories

Page 29: WHIP Work Histories Italian Panel WHIP Work Histories Italian Panel roberto leombruni Laboratorio Revelli e Università di Torino roberto leombruni Laboratorio

WHIP structureWHIP structure

individualsindividuals

firmsfirms

job spellsjob spells

firms’ yearly datafirms’ yearly data

jobs yearly datajobs yearly data

pensionspensions

self employmentself employment

s.s. benefitss.s. benefits

registersregisters episodesepisodes yearly datayearly data

[ What is WHIP ] . here it is[ What is WHIP ] . here it is

Page 30: WHIP Work Histories Italian Panel WHIP Work Histories Italian Panel roberto leombruni Laboratorio Revelli e Università di Torino roberto leombruni Laboratorio

[ documentation and distribution policy ][ documentation and distribution policy ]

WHIP’s datahouse:

http://www.laboratoriorevelli.it/whip

WHIP’s datahouse:

http://www.laboratoriorevelli.it/whip

Page 31: WHIP Work Histories Italian Panel WHIP Work Histories Italian Panel roberto leombruni Laboratorio Revelli e Università di Torino roberto leombruni Laboratorio

Future prospectsFuture prospects

[ future prospects ][ future prospects ] ( 1 / 2 )( 1 / 2 )

next releases: extension of the period covered to pre-1985 work history, to 2003, plus linkage to ISEE records;

sample extension: the replica of WHIP as is with an upgrade from 4/365 to 24/365 would grant a representativeness to the province level

WHIP building procedure extension: there are many directions in which the building procedure can be improved. Firms’ tranformations identification, labour cost measure, eligibility imputation, …

integration: possible fruitful linkages with INAIL (under construction), CPI, INPDAP…

microsimulations: the availability of large, administrative based datasets can/should be the gateway to a wider use of microsimulations as a knowledge support for the policy maker

next releases: extension of the period covered to pre-1985 work history, to 2003, plus linkage to ISEE records;

sample extension: the replica of WHIP as is with an upgrade from 4/365 to 24/365 would grant a representativeness to the province level

WHIP building procedure extension: there are many directions in which the building procedure can be improved. Firms’ tranformations identification, labour cost measure, eligibility imputation, …

integration: possible fruitful linkages with INAIL (under construction), CPI, INPDAP…

microsimulations: the availability of large, administrative based datasets can/should be the gateway to a wider use of microsimulations as a knowledge support for the policy maker