10
8-Econometria, a.a. 2011-12. Modelli per Panel Data Lezione 8 Modelli per Panel Data Per rappresentare dati rilevati in diverse unità statistiche e in diversi istanti è naturale introdurre nelle notazioni un doppio indice (per esempio per indicare l’unità statistica e t il tempo). Un modello econometrico lineare che coinvolge tali dati prende allora la seguente forma i it it it y = + x β u , per 1, , i m = , 1, , t T = . Costruzione del vettore delle osservazioni (di ciascun processo): Per varie ragioni talvolta e` opportuno disporre le osservazioni di ciascun processo, che in modo naturale sono disposte in una matrice , in un vettore di dimensione . Evidentemente questa operazione puo` essere realizzata in vari modi. Qui procede come segue: m T × mT Se [ ] it z e` la matrice delle osservazioni di un processo si pone 11 12 1 1 ( , , , , , , , ) mT T m mT z z z z z = z R , pertanto il vettore colonna , di dimensione , e` costituio da gruppi di dimensione T in ciascuno dei quali sono incolonnate le osservazioni della corrispondente unita` statistica (in gretl: stacked time series) z mT m In questo capitolo saranno presentate procedure di stima del parametro β che utilizzano la particolare struttura che i dati e gli errori, potrebbero avere. Definizione: I dati { } 1, , 1, , , i it it t T y = = x m T si dicono panel-data se sono stati rilevati in m unità statistiche, che rimangono le stesse al variare di ( 1, , ) t = ; si dicono invece pooled-data se si riferiscono a differenti unità statistiche ( unità statistiche per ogni istante t , che non rimangono le stesse al variare di t ). mT m Osservazione: Nel caso in cui i dati siano del tipo pooled, il metodo OLS consente la costruzione di uno stimatore di β , le cui proprietà dipendono sia da quelle degli errori che da quelle del processo delle osservazioni. Quanto segue mostra che il metodo OLS è spesso inappropriato quando si è in presenza di panel data, nel senso che o con opportuni e semplici accorgimenti si possono costruire stimatori piu` efficienti di quelli OLS oppure, venendo meno la esogeneita` delle variabili indipendenti, si perdono tutte le proprietà statistiche di tali stimatori. In queste lezione saranno descritte procedure per modelli per panel-data in cui T è fissato (piccolo), mentre o è finito oppure tende all’infinito. m 1

Modelli per Panel Data - dm.uniba.itbasile/pagina_web_2012/Econometria/Econometria... · disponibili anche le distribuzione di probabilità degli stimatori utilizzabili per la costruzione

  • Upload
    phamnhu

  • View
    220

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Modelli per Panel Data - dm.uniba.itbasile/pagina_web_2012/Econometria/Econometria... · disponibili anche le distribuzione di probabilità degli stimatori utilizzabili per la costruzione

8-Econometria, a.a. 2011-12. Modelli per Panel Data

Lezione 8

Modelli per Panel Data

Per rappresentare dati rilevati in diverse unità statistiche e in diversi istanti è naturale introdurre

nelle notazioni un doppio indice (per esempio per indicare l’unità statistica e t il tempo). Un

modello econometrico lineare che coinvolge tali dati prende allora la seguente forma

i

it it ity ′= +x β u , per 1, ,i m= … , 1, ,t T= … .

Costruzione del vettore delle osservazioni (di ciascun processo): Per varie ragioni talvolta e`

opportuno disporre le osservazioni di ciascun processo, che in modo naturale sono disposte in una

matrice , in un vettore di dimensione . Evidentemente questa operazione puo` essere

realizzata in vari modi. Qui procede come segue:

m T× mT

Se [ ]itz e` la matrice delle osservazioni di un processo si pone

11 12 1 1( , , , , , , , ) mTT m mTz z z z z ′= ∈z R… … … ,

pertanto il vettore colonna , di dimensione , e` costituio da gruppi di dimensione T in

ciascuno dei quali sono incolonnate le osservazioni della corrispondente unita` statistica (in gretl:

stacked time series)

z mT m

In questo capitolo saranno presentate procedure di stima del parametro β che utilizzano la

particolare struttura che i dati e gli errori, potrebbero avere.

Definizione: I dati 1, ,1, ,

, iit itt T

y ==

x ……

m

T

si dicono panel-data se sono stati rilevati in m unità statistiche,

che rimangono le stesse al variare di ( 1, , )t = … ; si dicono invece pooled-data se si riferiscono a

differenti unità statistiche ( unità statistiche per ogni istante t , che non rimangono le stesse al

variare di t ).

mT m

Osservazione: Nel caso in cui i dati siano del tipo pooled, il metodo OLS consente la costruzione

di uno stimatore di β , le cui proprietà dipendono sia da quelle degli errori che da quelle del

processo delle osservazioni.

Quanto segue mostra che il metodo OLS è spesso inappropriato quando si è in presenza di

panel data, nel senso che o con opportuni e semplici accorgimenti si possono costruire stimatori

piu` efficienti di quelli OLS oppure, venendo meno la esogeneita` delle variabili indipendenti, si

perdono tutte le proprietà statistiche di tali stimatori. In queste lezione saranno descritte procedure

per modelli per panel-data in cui T è fissato (piccolo), mentre o è finito oppure tende

all’infinito.

m

1

Page 2: Modelli per Panel Data - dm.uniba.itbasile/pagina_web_2012/Econometria/Econometria... · disponibili anche le distribuzione di probabilità degli stimatori utilizzabili per la costruzione

8-Econometria, a.a. 2011-12. Modelli per Panel Data

La struttura degli errori nel modello di regressione in presenza di panel data: E’ ragionevole

immaginare che gli errori abbiano la seguente rappresentazione (struttura) itu

it i itu v ε= + ,

dove la componente è legata alle caratteristiche dell’unità statistica i (riassume l’influenza che

ha l’unità statistica sulla variabile dipendente)

iv( )1 , mentre itε è la componente casuale.

Anche nell’ipotesi che i due processi itε e iv siano con media nulla e tra loro non

correlati (ipotesi abbastanza ragionevole in taluni casi), gli errori e per sono correlati ,

. . .i i d

itu isu t s≠ ( ) 2

cosicché le stime OLS non sono certamente buone (certamente non efficienti, sia per campioni finiti

che asintoticamente); inoltre potrebbe accadere che sia correlata con (circostanza affatto

inverosimile) e in tal caso si perde anche la consistenza delle stime OLS.

iv itx

Modello con le componenti degli errori: La precedente osservazione consente di scrivere il

modello lineare, in presenza di Panel-Data, nella forma

(*) it it i ity v ε′= + +x β , per 1, ,i m= … , 1, ,t T= … .

Definizione: Un modello con componenti degli errori, si dice ad effetti fissati se nella procedura

di stima, l’errore (per ), indipendentemente dalla sua natura (deterministica o

aleatoria), è trattata come costante (non nota), si dice invece ad effetti aleatori se l’errore è una

variabile aleatoria e nella procedura di stima è trattata come tale.

iv 1, ,i = … m

m

v

iv

Osservazione:

• Per un modello con componenti degli errori, essere ad effetti fissati o ad effetti aleatori non

è una propria caratteristica, ma dipende dal tipo di procedura utilizzata nella procedura di stima. Nei

seguenti due punti si segnalano alcune situazioni generali in cui generalmente il modello è

considerato ad effetti fissati oppure ad effetti aleatori.

• Si considera il modello ad effetti fissati (e dunque sarà trattato come parametro non noto)

quando (per ) o è realmente deterministico (e dunque è una costante dipendente da )

oppure è una variabile aleatoria correlata con . (Se è

iv

iv 1, ,i = … i

itx 2. . .( , )iv i i d νμ σ∼ allora, si osserva

1 Generalmente riassume tutte le variabili esogene del modello, caratteristiche dell’unità statistica (che non dipendono da ) e per le quali non sono disponibili le osservazioni. Per esempio se si è interessati all’effetto che l’istruzione (educ) ha sul salario (wage), tra le variabili indipendenti (o di controllo) dovrebbe essere inserita anche una misura delle capacità personali (ability) per le quale però non sono disponibili le osservazioni e che comunque rimane ragionevolmente costante nel tempo. Notare che non e` escluso che le variabili possano essere deterministiche.

ivt

iv2 Infatti per t si ha s≠ ( )( ) 2E( ) Eit is it i is i vu u v vε ε σ⎡ ⎤= + + =⎣ ⎦ .

2

Page 3: Modelli per Panel Data - dm.uniba.itbasile/pagina_web_2012/Econometria/Econometria... · disponibili anche le distribuzione di probabilità degli stimatori utilizzabili per la costruzione

8-Econometria, a.a. 2011-12. Modelli per Panel Data

innanzitutto che non è restrittivo assumere 0νμ = , è suffficiente infatti modificare l’intercetta

aggiungendo νμ , inoltre le stime di sono interpretate come osservazioni e allora consentono di

costruire una stima di

iv

2vσ . Generalmente nei problemi econometrici le stime di non hanno alcun

interesse e pertanto non sono riportate nel quadro riassuntivo delle procedure di stima).

iv

• Si considera il modello ad effetti aleatori, quando la componente caratteristica dell’unità

statistica , è una variabile aleatoria che (oltre a non essere correlata con

iv

i itε ) è non correlata con le

variabili indipendenti del modello. itx

• Alla luce di quanto affermato nei precedenti due punti si osserva immediatamente che i

modelli ad effetti aleatori sono anche modelli ad effetti fissati, pertanto e` prevedibile che le

procedure di stima per modelli ad effetti aleatori forniscano stime piu` efficienti di quelle per effetti

fissati, naturalmente nel caso in cui sono utilizzabili entrambe le procedure.

Modelli ad Effetti Fissati

Si considera il modello it it i ity v ε′= + +x β , per 1, ,i m= … e 1, ,t T= … , e dunque ciascun e`

interpretato come un parametro non noto. Notare che in questa prima fase non si fa alcuna ipotesi

sugli errori, ipotesi che saranno necessarie quando si rivolge l’attenzione alle proprietà statistiche

degli stimatori.

iv

Procedura di Stima del parametro (e anche di ): Si introduce una variabile muta β iv jd per

ciascuna delle unità statistica, dunque per ogni m 1, ,j m= … si ha:

1 per e per 1, ,0 per e per 1, ,

jit

i j t Td

i j t T= =⎧

= ⎨ ≠ =⎩

……

e si denota con d il vettore di lunghezza delle variabili mute (le cui osservazioni sono ). Se

si pone η , il modello originario ha la seguente rappresentazione vettoriale

m itd

(1( , , ) mmv v ′ )∈R…=

it it it ity ε′ ′= + +x β d η ,

e la seguente rappresentazione matriciale

= + +y Xβ Dη ε ,

Osservazione: Se nel modello originario è presente l’intercetta, dalla matrice deve essere

eliminata la prima colonna i cui elementi sono tutti uguali ad 1, altrimenti ci sarebbe collinearità

nella matrice delle osservazioni delle variabili indipendenti poiche` la somma degli elementi in

ciascuna riga di D e` uguale a 1.

X

Definizione: Lo stimatore OLS di β del precedente modello lineare, dicesi stimatore ad effetti

3

Page 4: Modelli per Panel Data - dm.uniba.itbasile/pagina_web_2012/Econometria/Econometria... · disponibili anche le distribuzione di probabilità degli stimatori utilizzabili per la costruzione

8-Econometria, a.a. 2011-12. Modelli per Panel Data

fissati o anche stimatore within-group, e si denota con il simbolo (o anche ). Talvolta è

indicato anche con la sigla LSDV (Least Square Dummy Variables).

ˆFEβ ˆ

Osservazione: Dal precedente modello si ottengono anche le stime OLS degli “parametri” ai

quali si fara` riferimento solo marginalmente in queste lezioni. Notare che il numero di parametri

cresce con m e dunque con il numero di unità statistiche considerate.

m iv

iv

Costruzione e rappresentazione dello stimatore : ˆFEβ

Osservazione preliminare: Fissato 1, ,j m= … e denotato con il vettore (colonna) delle

osservazioni della variabile muta

jD

jd e dunque vec( )jitD d j ′⎡ ⎤= ⎣ ⎦ ,( )3 allora

• è ortogonale a per e jD kD j k≠ ( )jD D j′ è la matrice diagonale di ordine in cui

soltanto

mT

j esimo− blocco diagonale (che ha dimensione T ) ha elementi (diagonali) diversi da 0 e

tutti uguali a T .

• per ogni si ha che il vettore ( mT∈z R ) ( )1( ) ( )j

j j j jD

P D D D D−

′ ′⎡ ⎤= ⎣ ⎦z z ha come coordinate

1

1 T

jtt

zT =∑ nell’ j esimo− blocco di dimensione T e tutte le altre uguali a 0.

• Il vettore è costituito dagli m blocchi di dimensione T , il cui i e(M I P= −Dz )D z simo−

blocco (per ) ha coordinate 1, ,i = … m it iz z ⋅− per 1, ,t T= … , dove si è posto 1

1T

=T

i itt

z z⋅=∑ .

• I vettori e , le cui coordinate sono descritte nei precedenti punti, sono

rispettivamente il vettore dei valori previsti e il vettore dei residui del modello .

PDz M Dz

= +z Dγ resid

Ora se si considera la proiezione 1( )M −′ ′= −D I D D D D in e il modello mTR

(**) M M M= +D Dy Xβ εD ,

la cui rappresentazione vettoriale e`

(**) ( ) ( ) ( )it i it i it iy y ε ε⋅ ⋅ ⋅′− = − + −x x β per 1, ,i m= … e 1, ,t T= … , ( )4

per il teorema FWL si ha:

3 Le componenti sono tutte 0 fatta eccezione di quelle del gruppo j che sono uguali ad 1. 4 Le osservazioni utili (e quindi i gradi di liberta`) per questo modello sono ( 1m T )− in quanto si ha

1( )

T

it it

y y ⋅=

0− =∑

1( )

T

it it

⋅=

− =∑ x x 0 e 1

( )T

it it

ε ε ⋅=

− =∑ 0 m per , di cio` se ne dovra` tener conto nella stima della varianza. 1, ,i = …

4

Page 5: Modelli per Panel Data - dm.uniba.itbasile/pagina_web_2012/Econometria/Econometria... · disponibili anche le distribuzione di probabilità degli stimatori utilizzabili per la costruzione

8-Econometria, a.a. 2011-12. Modelli per Panel Data

• lo stimatore si ottiene con il metodo OLS da quest’ultimo modello e dunque ˆFEβ

( ) 1

1

1 1 1 1

1

1 1 1 1

ˆ '

1 1( )( ) ( )(( 1) ( 1)

1 1( ) ( )( 1) ( 1)

FE

m T m T

it i it i it i it ii t i t

m T m T

it i it it i iti t i t

M M

)y ym T m T

ym T m T

⋅ ⋅ ⋅= = = =

⋅ ⋅= = = =

′=

⎡ ⎤′= − − −⎢ ⎥− −⎣ ⎦

⎡ ⎤′= − −⎢ ⎥− −⎣ ⎦

∑∑ ∑∑

∑∑ ∑∑

D Dβ X X X y

x x x x x x

x x x x x

⋅−

• i residui nei due modelli (*) e (**) sono gli stessi

• lo stimatore utilizza soltanto le variazioni presenti in ciascun gruppo (unita` statistica) e

per questa ragione è denominato anche stimatore within-groups. Pertanto se all’interno di

ˆFEβ

ciascuno degli gruppi (individuati dall’indice i e costituito da T osservazioni) di una variabile

indipendente del modello non c’è variazione, il corrispondente parametro non e` identificato (non

potra` essere stimato).

m

Proprietà statistiche degli stimatori ad effetti fissati:

Proprietà finite (sono soltanto elencate in quanto si deducono facilmente da quelle note per gli

stimatori OLS):

1) Se le variabili indipendenti sono strettamente esogene (cioe` E( | ) 0itε =X ) allora e`

corretto ( );

ˆFEβ

ˆE( | )FE =β X β

2) Se le variabili indipendenti sono strettamente esogene e 2. . .(0, )it i i d εε σ∼ allora

• 1 2ˆvar( | ) ( )FE M εσ−′= Dβ X X X ,

• e` efficiente nella classe degli stimatori corretti e lineari in ˆFEβ y ;

• Una stima corretta di 2εσ e` 2

1 1

1 ˆ( 1)

m T

iti t

sm T k

2ε= =

=− − ∑∑ , dove i residui possono essere

calcolati anche attraverso il modello (**).

3) Se le variabili indipendenti sono strettamente esogene e 2. . .(0, )it n i d εε σ∼ allora sono

disponibili anche le distribuzione di probabilità degli stimatori utilizzabili per la costruzione di test

e di stime di intervallo.

Proprietà asintotiche (per ): m →∞

4) Sempre nelle ipotesi di stretta esogeneita` delle variabili indipendenti, nelle ipotesi che i dati

nelle unita` statistiche siano del tipo cross-section (cioe` le variabili nelle diverse unita`

statistiche sono indipendenti), allora

m

5

Page 6: Modelli per Panel Data - dm.uniba.itbasile/pagina_web_2012/Econometria/Econometria... · disponibili anche le distribuzione di probabilità degli stimatori utilizzabili per la costruzione

8-Econometria, a.a. 2011-12. Modelli per Panel Data

• è consistente, asintoticamente normale (e efficiente in ipotesi di omoschedasticita`), con

la stima della varianza asintotica che si ottiene dal modello (**).

ˆFEβ

Osservazione: Un rapido sguardo al modello (**) è sufficiente per convincersi che per la validità

della precedente proprietà non è sufficiente la sola ipotesi di esogeneità delle variabili indipendenti;

in realtà la consistenza di segue dalla condizione ˆFEβ [ ]E ( )it i itε⋅− =x x 0 che è soddisfatta se si ha

E( ) per ogni , e per ogni is it t s iε =x 0 ;

notare che questa condizione esclude la possibilità che tra le variabili indipendenti ci possa essere

qualche ritardo della variabile dipendente. I metodi di stima per tali modelli non saranno presentati

in queste lezioni.

Vantaggi e svantaggi dello stimatore ad effetti fissati:

• Consente di stimare parametri del modello anche in presenza di variabili non osservabili

che però non dipendono dal tempo (è certamente uno degli aspetti più interessanti nell’utilizzo dei

panel-data).

• Si calcola facilmente anche se è molto grande; (si devono soltanto calcolare le medie

rispetto al parametro per ciascuna unita` statistica);

m

t

• Non è possibile stimare coefficienti delle variabili che non presentano alcuna variazione

all’interno di ciascun degli m gruppi.

• L`ultima rappresentazione dello stimatore mostra che esso puo` essere ottenuto anche

con il metodo delle variabili strumentali (per alcune interessanti conseguenze vedi paragrafo 10.2.5

di M. Verbeek, A guide to modern econometrics). Il metodo di stima delle variabili strumentali

sara` presentato nel prossimo capitolo.

ˆFEβ

Modello ad Effetti Aleatori

Il modello ha l’usuale rappresentazione con le componenti degli errori e dunque

it it i ity v ε′= + +x β , per 1, ,i m= … e 1, ,t T= … ,

e si suppone

2. . .(0, ), . . .(0, )i iti i d i i d 2ν εν σ ε σ∼ ∼ e non correlati tra loro.

Notare che si sta supponendo tra l’altro che le variabili indipendenti sono strettamente esogene.

Stimatore ad effetti aleatori e sua costruzione: Per comodità si riscrive il modello nella forma

it it ity = +x β u , per 1, ,i m= … , 1, ,t T= … ,

e si osserva che

6

Page 7: Modelli per Panel Data - dm.uniba.itbasile/pagina_web_2012/Econometria/Econometria... · disponibili anche le distribuzione di probabilità degli stimatori utilizzabili per la costruzione

8-Econometria, a.a. 2011-12. Modelli per Panel Data

2var( )it vu ε2σ σ= + e

2 per e cov( , )

0 per v

it jsi j t

u ui j

σ⎧ s= ≠= ⎨

≠⎩,

pertanto la matrice di covarianza degli errori è

( )mT mT×

⎡ ⎤⎢ ⎥⎢ ⎥=⎢ ⎥⎢ ⎥⎣ ⎦

Σ 0 00 Σ 0

Ω

0 0 Σ

,

con 2

2 2 22

( )

vT v T

T Tε ε

ε

σσ σ σσ×

⎛ ⎞′= + +⎜

⎝ ⎠I IΣ ′⎟ιι = ιι . Ricordare che il vettore delle osservazioni è stato

ordinato secondo gruppi, ciascuno con T elementi, e che m ι è il vettore di dimensione T le cui

coordinate sono uguali ad 1.

In definitiva si ha 2 2 2( /v )ε εσ σ σ=Ω Δ ,

essendo 2 2( /v )εσ σΔ la matrice a blocchi diagonale, in cui ciascun blocco (di dimensione T ) è m

2

2v

σσ

′+I ιι .

Definizione: Lo stimatore FGLS di (vedi Lezione 7) dicesi stimatore ad effetti aleatori e si denota

con il simbolo .

β

ˆREβ

La seguente proposizione ha un ruolo fondamentale nella costruzione di . ˆREβ

Proposizione: Posto e n mT= n Pλ= − DΨ I con 1/ 22

21 1vTε

σλσ

−⎛ ⎞

= − +⎜ ⎟⎝ ⎠

si ha 1 2 2( /v )εσ σ−=ΨΨ Δ .

Dimostrazione: Osservato che è la matrice di blocchi diagonali in cui ciascun blocco e` PD mT′ιι ,

e` sufficiente verificare che 2 2( ) ( / )v nεσ σ =ΨΨ Δ I (o 2

22( ) ( )v

T TT ε

σλσ

′ ′ T− + =I Iιι ιι I ). Tale verifica si

fa con un calcolo diretto, che non presenta alcuna difficoltà.

Osservazione:

i) Se il parametro λ definito nella precedente proposizione è noto (e dunque lo è anche 2 2/v εσ σ )

allora lo stimatore GLS di β (e quindi ) si ottiene stimando con il metodo OLS il modello ˆREβ

( ) ( )P Pλ λ− = − +D DI y I Xβ resid .

7

Page 8: Modelli per Panel Data - dm.uniba.itbasile/pagina_web_2012/Econometria/Econometria... · disponibili anche le distribuzione di probabilità degli stimatori utilizzabili per la costruzione

8-Econometria, a.a. 2011-12. Modelli per Panel Data

ii) Per 0λ = , e quindi per 2vσ , il precedente modello diventa = +y Xβ resid e da esso si ottiene

. ˆOLSβ

iii) Per 1λ = , e quindi per T grande oppure 2εσ piccolo rispetto a 2

νσ , il modello diventa

sostanzialmente ( ) e da esso si ottiene . ( )P P−D DI− = +I y Xβ resid

2

ˆFEβ

iv) Se è nota una stima consistente di 2 /v εσ σ (per ), allora lo stimatore FGLS (e la stima

della sua varianza asintotica) del modello ad effetti aleatori si individua con il metodo OLS dal

modello di regressione

m →∞

ˆ ˆ( ) ( )P Pλ λ− = − +D DI y I Xβ resid

Osservazione: Un modo diretto per la costruzione di λ utilizza la stima del modello ad effetti

fissati che fornisce sia che 2ˆ sεσ = 2 2

1

1 ˆ ˆˆ (m

v iim

2)σ η η=

= −∑ . Il calcolo di 2ˆvσ presenta pero`

l`inconveniente di dover individuare le stime m ˆiη che sono molte e non hanno alcuna altra utilità:

Un`altra procedura (più semplice della precedente) per costruire una stima consistente di 2ˆvσ .

Si considera il modello

P P P= +D D Dy Xβ u ,

che, dopo aver osservato che il vettore delle osservazioni di ciascuna variabile ha le coordinate

costanti in ognuno degli gruppi e coincidenti con la media nel gruppo, si puo` scrivere in forma

vettoriale

m

( ) ( )i i i i iy u⋅ ⋅ ⋅ ⋅⎛ ⎞′ ′= + = +⎜ ⎟⎝ ⎠

x β x β w per 1, ,i m= … .

Per tale modello si ha

• ( )2

2 2E( | )w iwTεσ 2

vσ σ= =X + , (segue dalle proprietà degli errori del modello ad effetti

aleatori, dopo aver osservato che e` 1 1 1

1 1 1( )T T T

i it it i it it t t

w u v vT T T

ε ε= = =

⎛ ⎞= = + = +⎜ ⎟

⎝ ⎠∑ ∑ ∑ 1, ,= … per i m ).

• la corrispondente stima di β , denominata stima tra gruppi (between group), è

11

1 1

ˆ ˆ( ) ( )m m

BG b i i i ii i

P P y−

−⋅ ⋅ ⋅ ⋅

= =

⎡ ⎤⎛ ⎞ ⎛ ⎞′ ′ ′= = =⎢ ⎥⎜ ⎟ ⎜ ⎟⎝ ⎠ ⎝ ⎠⎢ ⎥⎣ ⎦∑ ∑D Dβ β X X X y x x x

• è uno stimatore consistente per β per ; ˆBGβ m →∞

8

Page 9: Modelli per Panel Data - dm.uniba.itbasile/pagina_web_2012/Econometria/Econometria... · disponibili anche le distribuzione di probabilità degli stimatori utilizzabili per la costruzione

8-Econometria, a.a. 2011-12. Modelli per Panel Data

• ( )2 21

1

1ˆm

w wi

sm k

σ=

= =−

2w∑ e` uno stimatore (corretto e) consistente per ( )2

2 2w vT

εσσ σ= + e allora

una stima consistente di 2vσ è

22 2 ˆˆ ˆv w T

εσσ σ= − .

• può accadere che la stima di 2vσ (costruita con la procedura ora descritta) sia negativa;

questo è un segnale che o forse non è sufficientemente grande oppure il modello non è

correttamente specificato.

m

Il Test di Hausman sugli effetti aleatori

Un problema che si pone in presenza di un modello lineare per panel data con errori

omoschedastici, è quello di stabilire quale tipo di stima utilizzare per β . Se non è

sufficientemente grande, gli unici stimatori possibili sono se il modello è ad effetti aleatori

(essendo in tal caso E( ) oppure (se sono presenti nel modello gli effetti dovuti alle

unità statistiche che sono o deterministici oppure aleatori e correlati con le variabili indipendenti),

se invece m è grande la scelta dovrà essere fatta tra gli stimatori e . A tal fine potrebbe

essere utile il test sull’ipotesi

m

ˆOLSβ

| ) 0itu =X ˆFEβ

ˆFEβ ˆ

REβ

0

1

: modello ad effetti aleatori: modello ad effetti fissati

HH

⎧⎨⎩

,

che si passa a costruire.

Il test di Hausman – Si osserva innanzitutto:

1) Nell’ipotesi , per β ci sono due stimatori e , i quali sono entrambi 0H ˆREβ ˆ

FEβ

n − consistenti, però il primo è asintoticamente più efficiente;

2) Nell’ipotesi soltanto lo stimatore è 1H ˆFEβ n − consistente (l’altro non è consistente).

E’ allora naturale, al fine di costruire un test sulla precedente ipotesi, considerare la distanza tra i

due stimatori (se è vera ci si attende che sia piccola), ma per costruire tale distanza è

indispensabile la varianza di . Si può provare con un calcolo diretto (la prova qui non è

stata riportata) che nell’ipotesi sussiste la seguente uguaglianza

0H

ˆ ˆFE RE−β β

0H

ˆ ˆ ˆ ˆvar( ) var( ) var( )FE RE FE RE− = −β β β β .( )5

Ha senso allora considerare la statistica, denominata statistica di Hausman,

( ) 5 In realtà Hausman enunciò un principio, denominato principio di Hausman, e ne provò la validità in contesti molto più generali della presente situazione, che giustificano l’uguaglianza come conseguenza delle condizioni 1) e 2).

9

Page 10: Modelli per Panel Data - dm.uniba.itbasile/pagina_web_2012/Econometria/Econometria... · disponibili anche le distribuzione di probabilità degli stimatori utilizzabili per la costruzione

8-Econometria, a.a. 2011-12. Modelli per Panel Data

( ) ( )1

ˆ ˆ ˆ ˆ ˆ ˆvar( ) var( )FE RE FE RE FE REH−′ ⎡ ⎤= − − −⎢ ⎥⎣ ⎦

β β β β β β

che ha distribuzione asintotica 2kχ (essendo le variabili presenti nel modello, escluse quelle che

non presentano variabilità in ciascuno dei T gruppi). Le informazioni fin qui raccolte consentono di

costruire un test sull’ipotesi in esame.

k

Nota:

1) Può accadere che non sia definita positiva; una tale circostanza può

essere un segnale che il valore di non sia sufficientemente grande.

ˆvar( ) var( )FE RE−β β

m

2) La seguente osservazione riportata in B.H. Baltagi, Econometric Analysis of Panel Data,

(pag.76) consente di implementare il test di Hausman con un usuale test su un modello lineare.

Infatti sia assegnato il modello (che soltanto per semplicità è presentato nella seguente forma)

,it it ity x uα β= + + it i it u v ε+ , =

dal quale, posto 1

1 T

i itt

x xT⋅

=

= ∑ e 1 1

1 T m

itt i

x xmT⋅⋅

= =

= ∑∑ , si ottiene immediatamente il modello

( ) ( )it it i i ity y x x x x u uβ β⋅⋅ ⋅ ⋅ ⋅⋅ ⋅⋅− = − + − + − .

Si prova:

i) La stima OLS del modello

1 2( ) ( )it it i iy y x x x x residβ β⋅⋅ ⋅ ⋅ ⋅⋅− = − + − + ,

dà rispettivamente gli stimatori ˆFEβ e ˆ

BGβ , cioè 1ˆ

OLS FEβ β= e 2ˆ ˆ

OLS REβ β= ;

ii) L’usuale test sull’ipotesi 0 1:H 2β β= coincide con il test di Hausman.

Osservazione: Il vettore delle osservazioni delle variabili del precedente modello si costruiscono

facilmente ricordando che

• ity y⋅⋅− è il vettore dei residui della regressione di ity sulla sola costante;

• it ix x ⋅− è il vettore dei residui della regressione di itx su tutte le variabili mute delle

unità statistiche.

10