Il Metodo (di stima) delle Variabili Strumentalibasile/pagina_web_2013/Econometria/Econometria... · procedura di stima che sfrutta la struttura Panel dei dati. Va ribadito, come

7-Econometria, a.a. 2014-15

Capitolo 7

7-1 Modelli econometrici con variabili endogene (tra le variabili indipendenti)

7-2 Il metodo (di stima) delle variabili strumentali

7-3 Lo stimatore 2SLS

7-4 Test sulle ipotesi: il modello IVGNR

7-5 Il test di Sargan sulle restrizioni di sovraidentificazione

7-6 Il test di Durbin-Wu-Hausman (sulla presenza di variabili endogene tra i regressori)

7-7 Il Metodo dei Momenti Generalizzato (GMM): una breve introduzione

7-8 Proprieta` finite degli stimatori IV: un esercizio

7-1 Modelli econometrici con variabili endogene (tra le variabili indipendenti)

Nei metodi di stima finora presentati, per i modelli lineari (risp. non lineari) del tipo

(risp. ), l’ipotesi sugli errori t ty ′= +x β tu t( )t ty x u= +β E( | ) 0t tu =x , ha avuto un ruolo

fondamentale. Essa era ottenuta come conseguenza di E( | ) 0t tu Ω = e t t∈Ωx . La prima condizione

esprime la circostanza che il modello e` correttamente specificato, la seconda che le variabili

indipendenti presenti nel modello sono esogene o predeterminate.

Qui di seguito sono presentate tre (differenti) situazioni, abbastanza frequenti nelle applicazioni,

che portano in modo naturale alla endogeneità di alcune variabili indipendenti di un modello

correttamente specificato.

1 – Errori nelle variabili: Si assume che il modello corretamente specificato sia 0 0 0

t0 1t tx uβ β= + + 0 2. . .(0, )tu i i d, y σ∼ ,

ma che il processo delle osservazioni ,t ty x verifichi le seguenti condizioni:

0t ty y vt= + , 0

t t tx x w= + ,

con tv e tw processi , indipendenti tra loro e indipendenti da . . .i i d 0tu . Allora il modello

econometrico per il DGP è 0

0 1 1 0 1( )t t t t t ty x u v w xβ β β β β= + + + − = + + tu ,

e si verifica senza alcuna difficoltà che mentre (lèrrore sulla variabile dipendente) ha il solo

effetto di aumentare la varianza degli errori e dunque di peggiorare la precisione della stima dei

parametri, introduce una correlazione tra l’errore e la variabile indipendente

tv

tw tu tx , che (come è

ben noto) ha come grave conseguenza la non consistenza delle stime (o equivalentemente la non

identificabilità del modello). La presenza dell’endogeneità indotta dgli errori sulle osservazioni è

1


abbastanza naturale nei modelli econometrici in quanto i dati a disposizione sono di natura non

sperimentale, ma spesso è trascurata.

2 – Omissione di variabili rilevanti: L’omissione di una variabile rilevante in un modello, e quindi

il suo inserimento nell’errore, (talvolta tale omisssione è obbligata per la mancanza di osservazioni

su di essa) quando e` correlata con qualche altra variabile indipendente, rende endogene queste

ultime. Una situazione del tipo ora descritta è già apparsa in 6.2, dove e` stata proposta una

procedura di stima che sfrutta la struttura Panel dei dati. Va ribadito, come e` stato gia` detto nella

nota conclusiva del paragrafo 6.3, che tali stime sono esattamente le stesse di quelle che si

ottengono con i metodi che saranno presentati in questo capitolo.

3 – Simultaneità: La seguente ovvia affermazione “La dipendenza funzionale di una variabile da

un’altra non implica la dipendenza causale in una delle due direzioni”, giustifica la seguente

Definizione: Due variabili (economiche) si dicono simultanee se tra esse c’è una dipendenza

funzionale (implicita oppure esplicita) e non c’è alcuna dipendenza causale.

In definitiva in ogni modello (univariato) in cui sono presenti due o più variabili simultanee, tra

le variabili indipendenti c’è necessariamente qualche variabile endogena. Va segnalato che in

generale non è facile stabilire la eventuale simultaneità di due variabili.

Il seguente esempio chiarisce la situazione ora descritta e fornisce qualche idea su come

affrontare il problema della stima.

Esempio (Il modello per un mercato competitivo di un bene): Uno dei primi modelli presentati

nel corso di microeconomia è quello relativo al mercato di un bene, in cui si assume che sussista

una dipendenza lineare tra quantità e prezzo. Naturalmente la rappresentazione analitica della

relazione funzionale è differente (almeno nelle restrizioni sui parametri) a seconda che tale

relazione è vista dal lato della domanda o da quello dell’offerta. Si ha infatti:

1 2

1 2

(equazione dell'offerta) (equazione della domanda)

s

d

q pq p

α αβ β

⎧ = +⎨

= +⎩, con 2 0α > e 2 0β < ,

inoltre, in un mercato competitivo, si può assumere che forze interne al mercato spingono verso

l’equilibrio e dunque deve aversi . Ora se sono disponibili osservazioni

(notare che è la quantità di equilibrio) il modello econometrico si può scrivere nella forma

(s dq q q= = ) n ( , )t tq p

tq

(*) 1 2

1 2

(equazione dell'offerta) (equazione della domanda)

t t t

t t t

q p uq p v

α αβ β

= + +⎧⎨ = + +⎩

e la richiesta legittima (e certamente di grande interesse) è quella di stimare i parametri del modello.

Risolvendo il precedente sistema rispetto a e si ha tp tq

2


1 1

2 2 2 2

2 22 1 1 2

2 2 2 2

t tt

t tt

v up

v uq

β αα β α β

α βα β α βα β α β

−−⎧ = +⎪ − −⎪⎨ −−⎪ = +⎪ − −⎩

;

dalla prima uguaglianza si deduce immediatamente che, salvo casi eccezionali e poco significativi,

la variabile (essendo correlata sia con che con ) è endogena in ciascuna delle due equazioni

in (*) e pertanto nessuna delle due equazioni è in grado di fornire stime consistenti dei parametri

(naturalmnete con i metodi a disposizione fino a questo momento e come si vedrà con nessun altro

metodo se non sono disponibili altre informazioni).

tp tu tv

Si assume ora, che un’attenta analisi del mercato porti alla seguente specificazione

dell’equazione della domanda

1 2 3( )dt t t tq q p xβ β β tv= = + + + ,

con tx variabile esogena (per esempio tx potrebbe tener conto di eventuali interventi del governo

per sostenere la domanda) e quindi non correlata con gli errori (delle due equazioni). Questa volta

risolvendo rispetto a e si ha tp tq

31 1

2 2 2 2 2 2

2 3 2 22 1 1 2

2 2 2 2 2 2

t tt t

t tt t

v up x

v uq x

ββ αα β α β α β

α β α βα β α βα β α β α β

−−⎧ = + +⎪ − − −⎪⎨ −−⎪ = + +⎪ − − −⎩

,

ed essendo evidentemente tx non correlata con gli errori, entrambe le equazioni (di quest’ultimo

modello) consentono di stimare in modo consistente i parametri, in particolare i coefficienti di tx e

quindi il loro rapporto, che è evidentemente uguale a 2α .

Osservazione: Nella procedura ora descritta sembra avere un ruolo fondamentale la specificazione

dell’equazione della domanda (e in particolare il modo con il quale tx agisce su ) ma il

seguente argomento mostra che non è così; ciò che conta è che

( )dt tq q=

tx sia esogena nell’equazione

dell’offerta e che essa sia correlata con . Infatti, se si considera l’aspettazione nell’equazione

dell’offerta si ottiene

tq

1 2E( ) E( )t tq pα α= + ,

mentre (sempre nell’equazione dell’offerta) se si moltiplica per tx e si calcola l’aspettazione, si

ottiene

1 2E( ) E( ) E( )t t t t tq x x p xα α= + ,

e dunque, se e` [ ]cov( , ) E( ) E( )E( ) 0t t t t t tx p x p x p= − ≠ , si ha

3


2

1 E( )E( ) E( )

1 E( )E( ) E( )

t

t t

t

t t

q

t

t

x x qp

x x p

α = ,

la cui versione empirica e` evidentemente la stima trovata precedentemente.

top

7-2 Il metodo (di stima) delle variabili strumentali

Sia 1,,t t t

y=

x … un D.G.P. e

t ty ut′= +x β con E( | ) 0t tu Ω = ,

un suo modello lineare correttamente specificato (si noti che qui non si richiede che ); si

segnala che qui si fa riferimento a dati del tipo time-series, naturalmente l’adattamento delle ipotesi

e dei risultati ai dati del tipo cross-section non presenta alcun particolare problema.

t ∈Ωx t

Ipotesi sul modello (l’elenco sarà aggiornato quando se ne presenta la necessità):

IV-1) Esiste un processo vettoriale tw di dimensione , con k t t∈Ωw , (che verifica alcune

ragionevoli condizioni che saranno rese esplicite in seguito) e per il quale, fissato , sono

disponibili le osservazioni per ; con si denota la matrice (

n∈N

1, ,t n= … W n k× ) delle osservazioni. I

processi, con le precedenti caratterisiche, sono denominati processi degli strumenti.

Osservazione: L’uguaglianza E( )t tu =w 0 (che è conseguenza di E( | ) 0t tu Ω = ) porta, come ormai

e’ solito, a considerare la sua versione empirica, e dunque l’equazione (vettoriale in ) con

incognite

kR k

(*) ( )1

1 ( ) ( )n

t t tt

yn =

′ ′− = ⇔ − =∑w x β 0 W y Xβ 0 .

Definizione: L’unica (eventuale) soluzione dell’equazione (*) dicesi stima di β con il metodo

delle variabili strumentali e sara` denotata con il simbolo (si omette di evidenziare nella

notazione la dipendenza da che peraltro e` rilevante).

ÎVβ

tw

Al fine di assicurare non solo lèsistenza di , ma anche la validità di alcune buone proprietà

statistiche, sono naturali le seguenti ulteriori ipotesi sul processo

ÎVβ

, ,t t ty x w :

IV-2) , ,t t ty x w è un processo stazionario ed ergodico (da cui 1

1 ( E( )n p

t t t ttn =

′ ′=→∑ wxw x Σ w x ));

4


IV-3) (Condizione di identificabilita`) La matrice (quadrata di ordine ) è invertibilek wxΣ ( )1

(conseguentemente anche le matrici ( )E( )t t′=wΣ w w e ( )E( )t t′=xΣ x x sono invertibili( )2 ).

IV-4) Il processo t tuw è una differenza martingala, ( )3 o piu` in generale e` valida qualche

versione del teorema del limite centrale. ( )4

Osservazione: Da IV-4 e dal teorema del limite centrale, segue ( ) ( ,Avar( ))d

n u N u→w 0 w con

2 2

1

1lim ( E( ) ) se e` non correlato, Avar( )

, con E( ) se e` autocorrelato (cfr. ).

n

t t t t t t u t tn t

j j t t j t t j t tj

p u u un

uu u u

→∞=

+∞

− −=−∞

⎧ ′ ′= =⎪⎪= ⎨⎪ ′Γ Γ =⎪⎩

∑

∑

ww w w w Σ ww

w w w 3 - 9, prop. 2.

Rappresentazione e proprietà dello stimatore : La prova non e` riportata in quanto non

differisce da quella delle corrispondenti proprieta` degli stimatori OLS (cfr. 3-3).

ÎVβ

1) 1 1

1 1 1 1

1 1 1 1ˆn n n n

IV t t t t t t t tt t t t

yn n n n

− −

= = = =

⎛ ⎞ ⎛ ⎞′= = +⎜ ⎟ ⎜ ⎟⎝ ⎠ ⎝ ⎠∑ ∑ ∑ ∑β w x w β w x w u′ (o equivalentemente, se si

utilizza la rappresentazione matriciale del modello, 1 1ˆ ( ) ( )IV− −′ ′ ′= = +β W X W y β W X W u′

)

));

2) è consistente; (segue dalle sole ipotesi IV-1 e IV-2); ˆ ˆ( IV=β β

3) ˆ ˆ( ) ( ,Avar(d

n N− →β β 0 β)) con ( ) ( )1Âvar( ) Avar( )u 1− −′= wx wxβ Σ w Σ (segue da IV-3 con i

soliti argomenti);

4) ( ) ( )1 1Âvar( ) Avar( )u− −

′= wx wxβ Σ w Σ , dove 2

1

1 Âvar( )n

t t tt

u un =

′= ∑w w w con ˆˆt t t Iu y V′= − x β e

( ) 1 In sostanza si richiede che la matrice quadrata sia invertibile; infatti se una delle due variabili ha media

nulla si ha cov , mentre se entrambe le variabili hanno 1 come prima coordinata, un semplice calcolo mostra

che le due matrici hanno lo stesso determinante.

cov( , )x w

( , ) = wxx w Σ

( )2 Si comincia con l’osservare che se si ha (omettendo gli indici) ,k∈ ≠c R c 0 ( )E( ) E( )′ ′ ′ ′= ⇒ = ⇒c wx 0 c wx 0 c = 0 .

Ora se fosse singolare esisterebbe tale che wΣ ,k∈ ≠c R c 0 [ ] ( )( )2E 0 E ⎡ ⎤′ ′ ′ 0= ⇔ ⎣ ⎦c ww c c w = donde 0′ =c w e

quindi , che e` assurdo. E( )′ ′ =c wx 0 ( )3 E` utile ricordare che una condizione sufficiente perche` t tuw sia una differenza martingala e`

. 1 1E( | , , , ) 0t t t tu u − − =w w …( )4 In presenza di autocorrelazione negli errori, tra le coordinate di non ci possono essere ritardi della variabile dipendente, che invece possono trovarsi tra le coordinate di .

tw

tx

5


1

1 n

t ttn n=

′⎛′= =⎜⎝ ⎠

∑wxW XΣ w x ⎞

⎟

2

. Tale stimatore per la varianza asintotica di dicesi stimatore di

White (o stimatore robusto all’eteroschesaticità (HC))

ÎVβ

5) Se gli errori sono omoschedastici (cioè 2E( | )t tu σΩ = e quindi anche 2 2E( | )t tu σ=w ), si

ha 2 2 2σ1

1Avar( ) lim E( )( )n

t t t tt

u pn

σ σ=

⎛ ⎞′ ′= = =⎜ ⎟⎝ ⎠

∑ ww w w w w Σ e 2

1

1ˆr( )n

t tt

un

σ=

⎛ ⎞′Ava = ⎜ ⎟⎝ ⎠∑w w w con

2

1

1ˆn

tt

un

σ=

= ∑ 2ˆ , e allora dalla precedente proprietà 4 segue

( ) ( )1 12ˆ Âvar( ) σ

− −′= wx w wxβ Σ Σ Σ .

Osservazione:

1) La rappresentazione della varianza asintotica di , in particolare la presenza di ÎVβ ( ) 1−

wxΣ ,

mostra che la elevata correlazione tra e influenza positivamente la efficienza dello

stimatore.

tw tx

2) La procedura ora descritta lascia non risolti i seguenti due problemi

• individuare (almeno) un processo degli strumenti;

• effettuare una ragionevole scelta in presenza di piu` processi degli strumenti.

top

7-3 Il metodo dei minimi quadrati a due stadi (2SLS)

Si fa sempre riferimento al modello considerato in 7-2, e dunque a

t ty ut′= +x β con E( | ) 0t tu Ω = .

Definizione: Dicesi processo delle variabili strumentali del modello, il processo vettoriale tw

(di dimensione l ) sufficientemente rappresentativo di tΩ .

E` doveroso segnalare che non ci sono procedure standard e univoche che portano ad

individuare il processo delle variabili strumentali, e` allora fondamentale sia la conoscenza del

problema economico, sia l’esperienza; comunque di tale processo fanno certamente parte le

coordinate di (che si ritengono) esogene (la motivazione di quest’ultima affermazione e`

rinviata). Va comunque segnalato, anche se raramente ha una effettiva utilita`, che se ogni

sua trasformazione non lineare e ogni suo ritardo appartengono a

tx

tx ∈Ωt

tΩ , inoltre ad appartengono i

ritardi di nel caso in cui gli errori sono non correlati.

tΩ

ty

6


D’ora innanzi si assume che e` disponibile il processo delle variabili strumentali tw di

dimensione l (del quale naturalmente e` diponibile il processo delle osservazioni).

Definizione: Il modello si dice

a) sottoidentificato se l k< ;

b) esattamente identificato se ; l k=

c) sovraidentificato se . l k>

Nel caso a) non e` possibile costruire uno stimatore consistente di β (a meno che non si

impongano delle restrizioni sui parametri), mentre nel caso b) il metodo delle variabili strumentali,

descritto in 7-2, consente la costruzione di uno (solo) stimatore consistente di . Nel caso c),

sembra che il problema sia quello di dover scegliere opportunamente strumenti tra gli

disponibili.

β

k ( )l k>

Qui si descrive una procedura per la costruzione di uno stimatore nei modelli sovraidentificati

che, almeno in alcuni casi, e` il piu` efficiente; in 7-5 e` presentato un differente e piu` generale

approccio al metodo di stima che lascia intravedere percorsi per ulteriori generalizzazioni.

Ipotesi (sul modello e sul processo delle variabili strumentali): Sono valide le ipotesi da IV-2) a

IV-4) di 7-2, con la ovvia modifica in IV-3) dove la matrice , che ora ha dimensione wxΣ l k× , deve

avere rango (massimo) k ; qui pero` si deve richiedere che la matrice (quadrata di ordine l ) e`

invertibile.

wΣ

Descrizione della procedura. La costruzione si sviluppa in due passi il primo dei quali seleziona

un processo degli strumenti (di dimensione ). La bonta` della stima ottenuta e` verificata a

posteriori quando si mostra la sua efficienza almeno in un caso particolare. In realtà c’e` anche una

giustificazione a priori presentata brevemente nella nota in basso.

k

( )5

Primo Passo (costruzione della matrice delle osservazioni di k strumenti): Intanto sia n∈N

sufficientemente grande, si denoti con ( )n l×W la matrice delle osservazioni di (le variabili tw l

5 La osservazione 1 che chiude il paragrafo 7-2, suggerisce come scelta per il processo degli strumenti E( )t t

∗ =x x wt ,

per la quale pero` non sono disponibili le osservazioni (non e` infatti nota la sua rappresentazione analitica come

funzione di ). Se invece tw E( )t tx w fosse lineare (in ) (in sostanza si fa questa ipotesi) allora i coefficienti

potrebbero essere stimati (in modo consistente) con il metodo dei minimi quadrati e allora la sua matrice delle

osservazioni sarebbe

tw

PWX .

7


strumentali del modello) e sia 1

( )ˆ ( ( ) )

n kP −

×)′ ′= =WX X W W W W X ;

essa sarà utilizzata come matrice delle osservazione del processo degli strumenti nel secondo passo.

Osservazione: Ciascuna colonna di è il vettore dei valori previsti nella stima OLS della

corrispondente colonna di su . Evidentemente le colonne di che sono anche colonne di

rimangono inalterate e quindi si ritrovano in .

X

X W X

W X

Secondo Passo (stima con il metodo delle variabili strumentali): Con il metodo delle variabili

strumentali descritto in 7-2, con come matrice delle osservazione del processo degli strumenti

(dopo aver osservato che sono evidentemente soddisfatte tutte le ipotesi richieste al processo degli

strumenti), si costruisce lo stimatore di

X

β , denominato stimatore delle variabili strumentali

generalizzato, che e` denotato con il simbolo ; pertanto (vedi la proprieta` 1 in 7.2) si ha ˆGIVβ

( ) ( )1

1 1ˆ ( ) ( ( )GIV P P P P P P−

− −⎛ ⎞⎡ ⎤′ ′ ′ ′ ′ ′= = = +⎜ ⎟⎢ ⎥⎣ ⎦⎝ ⎠W W W W W Wβ X X X y X X X y β X X X u)

W

.

Si osservi che la matrice (per sufficientemente grande) e` invertibile in quanto le matrici

e sono entrambe di rango massimo .

P′ WX X n

′X W ′W X k

Osservazione: Essendo e P P P=W W P P′=W W

id

, dalla precedente rappresentazione di segue

immediatamente che esso si ottiene anche come stima OLS dal modello di regressione

ˆGIVβ

P res= +Wy Xβ .

La procedura che ha portato alla costruzione dello stimatore , giustifica la terminologia

ormai di uso comune, introdotta nella seguente

ˆGIVβ

Definizione: Lo stimatore dicesi Stimatore dei Minimi Quadrati a Due Stadi (brevemente

2SLS o TSLS) ed e` denotato piu` frequentemente con il simbolo .

ˆGIVβ

2ˆ

SLSβ

Osservazione: Se e` l si ha . E` sufficiente osservare che nella rappresentazione di

le matrici e

k= 2ˆ ˆ

SLS IV=β β

2ˆ

SLSβ ′W X ′X W sono (quadrate e) invertibili.

Proprietà dello Stimatore : Sono le stesse proprietà elencate in 7-2 per lo stimatore , si

deve soltanto tener presente che il processo degli strumenti ora e` la cui matrice delle

osservazioni e` o se si vuole definita da , con

2ˆ

SLSβ ÎVβ

ˆ tx

( )( )1ˆ P −′ ′= = =WX X W W W W X WJW ˆ t t′= Wx J w

8


( ) 1

( )l k

−

×

′=WJ W W W′X . In particolare si ha (si omette l’indice ) 2SLS

• ˆ ˆ( ) ( ,Avar(d

n N− →β β 0 β)) con ( ) ( )1 1ˆ ˆ

ˆ Âvar( ) Avar( )u− −′= xx xxβ Σ x Σ ;

• ( ) ( )1 1

ˆ ˆˆ Âvar( ) Avar( )u

− −′= xx xxβ Σ x Σ , 2

1

1ˆ ˆ Âvar( )n

t t tt

u un =

ˆ′= ∑x x x , ˆ1

1 ˆn

t tt

Pn n=

′⎛ ⎞′= =⎜ ⎟⎝ ⎠

∑ Wxx

X XΣ x x

2

;

• Se gli errori sono omoschedastici (cioè 2E( | )t tu σΩ = ), essendo ˆ ˆPn′

= =Wxx x

X XΣ Σ si ha

( ) ( )11 1

2 2ˆ ˆ ˆ

ˆ ˆ Âvar( ) Pn

σ σ−

− − ′⎛ ⎞⎛ ⎞′= =⎜ ⎟ ⎜ ⎟⎝ ⎠ ⎝ ⎠W

xx x xxX Xβ Σ Σ Σ .

Nella seguente proposizione si trova una giustificazione (a posteriori) della scelta del processo

degli strumenti per la costruzione dello stimatore di β .

Proposizione: Fermo restando le ipotesi che consentono la costruzione dello stimatore 2SLS, si

assume ulteriormente 2E( | )t tu 2σΩ = , (omoschedasticità condizionata degli errori). Allora lo

stimatore è efficiente nella classe degli stimatori costruiti con il metodo delle variabili

strumentali, il cui processo ( dimensionale) degli strumenti è combinazione lineare del processo

( dimensionale) delle variabili strumentali.

2ˆ

SLSβ

k

l ( )6

Dimostrazione. Si segnala che la prova e` del tutto simile a quella che mostra che la stima OLS, in

presenza di omoschedasticita`, e` la piu` efficiente (asintoticamente) nella classe degli stimatori con

il metodo dei momenti (cfr. 3-8).

Le stime della varianza asintotica degli stimatori e sono rispettivamente ( )ˆ ( )IV tJβ w 2

ˆSLSβ

( ) ( )( ) ( ) ( )

1 11 12 2ˆ ˆ

n n nσ σ

− −− − ′ ′ ′ ′ ′⎛ ⎞ ⎛ ⎞⎛′ = ⎜ ⎟ ⎜ ⎟⎜

⎝ ⎠ ⎝ ⎠⎝J J Jw x w w x

J W X J W WJ X WJΣ Σ Σ ⎞⎟⎠

e

6 Più precisamente: ha la minima varianza asintotica tra (tutti) gli stimatori costruiti con il metodo delle variabili strumentali, che utilizzano come processo degli strumenti, processi che sono combinazione lineare del processo

2ˆ

SLSβ

tw ,

cioè processi del tipo ( ) ( )t ′=Jw J w t , con matrice ( , , )t t ty=J J w x l k× (che dipende da ) tale che 1, ,( , , )t t t ty =w x … n

( )tJw sia un processo ( k -dimensionale) di strumenti (verificanti cioè le condizioni da IV-2 a IV-5) di 7-2. Cio` accade

per esempio se sono verificate le seguenti due condizioni:

i) ( ) ( )

1

1limn

t tn tp

n n→∞=

′ ′⎡ ′=⎢⎣ ⎦

∑ J JJ W WJ w w ⎤⎥ esiste ed è non singolare ;

ii) Esiste il limite in probabilità di ( ) (e quindi nJn′ ′J W u converge a 0 , essendo convergente a 0 la sequenza

n′W u ).

9


1 12 2ˆ ˆP P P P

n n n nσ σ

− −′ ′ ′ ′⎛ ⎞ ⎛ ⎞⎛ ⎞ ⎛ ⎞=⎜ ⎟ ⎜ ⎟⎜ ⎟ ⎜ ⎟⎝ ⎠ ⎝ ⎠⎝ ⎠ ⎝ ⎠

W W W WX X X X X X X X 1−

,

allora l’asserto sarà provato (passando al limite in probabilità per ), se si prova che n →∞

( ) ( ) ( )( )1 1P − −′ ′ ′ ′ ′ ′≤WX X J W X J W WJ X WJ 1−

o equivalentemente (vedi l’ultimo punto in prop. 1 di 2-3)

( )( ) ( ) ( )( ) ( ) ( )( )( )

1

0

P

P P P P

−′ ′ ′ ′ ′ ′≤

′ ′ ′⇔ ≤ ⇔ ≤ −

W

WJ W W WJ

X WJ J W WJ J W X X X

X X X X X X.

La validità dell’ultima disuguaglianza (cioè che la matrice ( )P P′ −W WJX X

J

)

è semidefinita

positiva), segue dalle seguenti proprietà:

i) è una proiezione; P P−W W

Infatti si osserva dapprima che evidentemente si ha , donde ( ) (⊂WJ WS S P P P=W WJ WJ e

considerando la trasposizione , pertanto P P P=WJ W WJ

( )( )P P P P P P P P P P P P− − = − − + = −W WJ W WJ W WJ W W WJ WJ W WJ

J

)X

ii) La proiezione è ortogonale; P P−W W

segue dalla sua simmetria.

iii) La matrice è semidefinita positiva; (P P′ −W WJX

Infatti per ogni si ha k∈λ R

( ) ( ) ( ) ( ) 0P P P P P P P P′′ ′ ′ ′− = − − = −W WJ W WJ W WJ W WJλ X Xλ λ X Xλ Xλ ≥ .

Osservazione:

• La stima della varianza asintotica dello stimatore 2SLS (sia in presenza di errori

omoschedastici che eteroschedastici) utilizza il processo dei residui 2ˆ

t t SLSy ′− x β , che vanno

calcolati al termine della procedura di stima (essi sono evidentemente diversi dai residui ottenuti

dalle due procedure OLS utilizzate per la costruzione di ). 2ˆ

SLSβ

• Lo stimatore minimizza la funzione obiettivo 2ˆ

SLSβ

[ ] [ ] [ ]1( ) ( ) ( ) ( ) ( )Q P −⎛ ⎞′′ ′ ′ ′= − − = − −⎜ ⎟⎝ ⎠Wβ y Xβ y Xβ W y Xβ W W W y Xβ .

Infatti si ha

[ ]( ) ( )Q P P P∂ ′ ′ ′= ⇔ − = ⇔ =∂ W Wβ 0 y Xβ X 0 X Wy X Xββ

10


e quindi è (l’unico) punto stazionario di (funzione quadratica che ha certamente un

punto di minimo).

2ˆ

SLSβ ( )Q β

• Se il processo delle variabili strumentali ha dimensione (dunque il processo e` esattamente

identificato) allora

k

( )2ˆ ˆ

SLS IV=β β annulla la funzione obiettivo.

Infatti, dalla definizione di , si ha ÎVβ ˆ( )IV′ − =W y Xβ 0 .

top

7-4 Test sulle ipotesi: Il modello IVGNR

L’asintotica normalità dello stimatore 2SLS (indipendentemente dalle eventuali ipotesi sugli

errori), consente di costruire test su ipotesi (lineari o nonlineari) sui parametri del modello mediante

la statistica di Wald, che comunque presenta difficolta` di tipo numerico per il suo calcolo.

Nel caso di ipotesi lineari la costruzione dei test presenta minori difficolta` di tipo numerico,

come appare chiaramente nella procedura che si passa a descrivere.

Proposizione: Il modello di regressione ausiliario di Gauss-Newton (cfr. 4-4 per la definizione, le

notazioni ed alcuni dettagli) per il modello lineare t ty tu′= +x β , con le variabili strumentali ed

errori omoschedastici denominato modello IVGNR, ha la seguente rappresentazione

tw

P− = +Wy Xβ Xb error .

Dimostrazione: Considerata la funzione obiettivo ( ) ( ) ' ( )Q P= − −Wβ y Xβ y Xβ , il suo gradiente

( )( ) 2 ( )Q P∂ ′= = − −′∂ Wβg β X y Xββ

e la sua matrice hessiana 2 ( )( ) 2Q P∂ ′= =

′∂ ∂ WβH β X X

β β, la sequenza

minimizzante si ottiene con una procedura ricorsiva da 11 ( ) ( )j j jP P−+ ′ ′= + −W Wβ β X X X y Xβ . Il

termine che aggiorna la sequenza e` evidentemente la stima OLS di b nel modello lineare

e dunque l’asserto. j P res− = +Wy Xβ Xb id

)0

Osservazione: Essendo la funzione obiettivo quadratica, il punto di minimo (o equivalentemente il

punto stazionario) si ottiene fissando arbitrariamente ed effettuando un solo passo; in tal modo si

ottiene sia la stima e sia la stima della sua varianza asintotica (in presenza di

eteroschedasticita` si deve considerare lo stimatore di White).

0β

(2 1 0ˆ ˆ

SLS = = +β β β b

Il test IVGNR per l’ipotesi 0 2:H =β 0 (essendo 1 2

1 2[k k

]′ ′ ′=β β β ) – Si trascrive il modello

originario e quello ridotto con i corrispondenti modelli IVGNR.

Importante: Il processo delle variabili strumentali deve essere lo stesso per i due modelli e sia W

11


la matrice delle osservazioni.

Modello non ridotto (U): ; 1 1 2 2= + +y X β X β u

Modello IVGNR (U): 1 1 2 2 1 1 2 2P P− − = + +W Wy X β X β X b X b resid

Modello ridotto (R): ; 1 1= +y X β u

Modello IVGNR (R): 1 1 1 1P− = +Wy X β X b resid

Si considera lo stimatore 2SLS di dal modello ridotto, sia 1β 1β ( )1 1= −u y X β il vettore dei

residui (dal punto di vista teorico puo` essere un qualunque elemento di in quanto il punto

di minimo e` raggiunto in un solo passo con qualunque valore iniziale) e il modello IVGNR del

modello non ristretto calcolato per , cioè

1β 1kR

1( , )=β β 0 ( ) 1 1 1 1 2 2P P= − = + +W Wu y X β X b X b resid ;

allora l’ipotesi è equivalente 0H 0 2:H ′ =b 0 e un test su quest’ultima ipotesi si costruisce

immediatamente (avendo cura di tener conto della eventuale presenza dell’eteroschedasticita`).

Il test in presenza di errori omoschedastici: In questo caso, come si potra` notare, nella

costruzione del test (di Wald ed LM) si utilizzano soltanto le stime OLS di opportuni modelli

lineari.

a) Il test LM: Si considera il coefficiente di determinazione 2R nella stima del modello

e si confronta con 1 1 1 1 2 2P P− = + +W Wy X β X b X b resid 2nR2

2,1k αχ − .

b) Il test di Wald: Intanto la statistica di Wald ( per l’ipotesi

coincide con essendo

)W ( )0 2 0 2: :H H′ = ⇔ =b 0 β 0

2k F [ ] 2//

SSR SSR kF

SSR n−

=R U

U e (risp. ) e` la somma dei quadrati

dei residui del modello IVGNR(U) (risp. IVGNR(R)), inoltre si ha

SSRU SSRR

• , differenza dei valori minimi delle funzione obiettivo del

modello R (risp. ) (cfr. (8.63) in Davidson-Mac Kinnon);

1 2ˆ( ) ( )SLSSSR SSR Q Q− = −R U β β

U

• Una stima consistente della varianza 2σ (che potra` sostituire senza alterare le

proprieta` asintotiche dello stimatore) si ottiene dalla stima 2SLS del modello originario;

/SSR nU

• I valori minimi delle due funzione obiettivo, quando non forniti dal software, si calcolano

facilmente considerando la somma dei quadrati dei valori previsti nei modelli di regressione

ausiliari ˆ− = +y Xβ Wγ resid (risp. ).1− = +y Xβ Wγ resid ( )7

top

)7 Infatti, per il primo modello, il vettore dei valori previsti e` 1 ˆ( ) (−′ ′ −W W W W y Xβ e allora la somma dei quadrati delle sue coordinate e` ( )1 1

2ˆ ˆ ˆ( ) ( ) ( ) ( ) ( ) ( ) ( SLSP Q− −′ ′ ′ ′ ′ ′− − = − Wy Xβ W W W W W W W W y Xβ y Xβ y Xβ βˆ ˆ )− = .

12


7-5 Il test di Sargan sulle restrizioni di sovraidentificazione

Una difficoltà che si presenta nella stima di modelli con variabili endogene tra le variabili

indipendenti, e` quella di individuare validi strumenti (cioe` il processo delle variabili strumentali), i

quali come e` ben noto devono essere ortogonali (non correlati) agli errori e devono essere

sufficientemente correlati con le variabili endogene.

Non ci sarebbe alcun problema nel costruire un test sulla assenza di correlazione tra gli

strumenti e gli errori, se fossero disponibili le osservazioni degli errori. La usuale strategia di

utilizzare i residui, costruiti con uno stimatore consistente, come osservazioni degli errori non e`

praticabile nei modelli esattamente identificati, in quanto le condizioni di ortogonalità (i gradi di

liberta`) sono tutte necessarie per la costruzione dello stimatore e quindi dei residui.

k

Nei modelli sovraidentificati delle condizioni di ortogonalità presenti, soltanto k sono

necessarie per stimare il modello, e allora le rimanenti l

l

k− condizioni potranno essere utilizzate

(come sara` mostrato) per testare la validità delle condizioni di ortogonalità.

Sia con E( , t ty u′= +x β t | ) 0t tu Ω = 1,t = … un modello econometrico correttamente specificato

e sovraidentificato (sia tw il processo delle variabili strumentali ),

con le usuali ipotesi sul processo

(dim( ) ) dim( ))t tl k= > =w x

, ,t t ty x w . Soltanto per ragioni di semplicita` inizialmente si

assume che gli errori siano omoschedastici e dunque che 2E( | )t tu 2σΩ = per ogni t .

Definizione: Il numero intero dicesi grado di sovraidentificazione del modello. l k−

Osservazione: Nel processo di stima 2SLS si utilizzano le variabili strumentali la cui matrice

delle osservazioni è . Sia una matrice

k

PWX ∗W (n l k)× − ortogonale a (di dimensione PWX n k× )

tale che e si denoti con ( ) ( , )P ∗= WW XS S W t∗w il processo che ha come matrice delle

osservazione

∗W

( )8 . La restrizione di sovraidentificazione diventa allora . ( )E( | ) 0 E( )t t t tu u∗ ∗= ⇒ =w w 0

L’ipotesi di sovraidentificazione, sulla quale si vuole costruire il test, puo` essere formulata nel

modo seguente:

a)

( ) 0

1

: le componenti di sono tutte esogene : componenti di sono endogene

t

t

HH j l k

⎧⎪⎨ ≤ −⎪⎩

ww

,

o in forma più debole

( )8 E` importante segnalare che, come si potra` osservare nel seguito, la rappresentazione della matrice non sara` utilizzata.

∗W

13


b) ( )0

1

: E( ) E( ): E( )

t t t t

t t

H u uH u

∗

∗

⎧ = ⇔ =⎨

≠⎩

w 0 ww 0

0.

Costruzione della statistica di Sargan:

Osservazione: Se fossero disponibili le osservazioni di t∗w e di , la statistica “ distanza (pesata)

da del parametro empirico

tu

0 ( )1 *

1

1 ( )n

t tt

u nn

∗ −

=

′=∑w W E( )t tu∗wu di ” consentirebbe di costruire un

test, pero` la costruzione della matrice delle osservazioni di t∗w e` abbastanza costosa

numericamente, mentre le osservazioni sugli errori non sono disponibili. Il primo inconveniente si

supera facilmente utilizzando al posto di tw t∗w (vedi l’equivalenza in b) per l’ipotesi ), mentre

il secondo inconveniente si supera, in modo ormai standard, sostituendo gli errori con i residui.

0H

Si considera la statistica

( ) ( )1

1 2 1 22 2

ˆˆ ˆ ( )ˆ ˆ ˆˆ ˆ

n SLSP Qn n n nn

σσ σ

−− − ⎛ ⎞′′⎛ ⎞′′ ′ = =⎜ ⎟⎜ ⎟ ⎜ ⎟⎝ ⎠ ⎝ ⎠

Wu u βW WW u W u

denominata statistica di Sargan.

Proposizione: La statistica di Sargan, nell’ipotesi , converge in distribuzione verso una 0H 2l kχ − .

Dimostrazione: Essendo 2

1

1 ( , )n d

t tt

n u Nn n

σ=

′⎡ ⎤⎛ ⎞=⎜ ⎟⎢ ⎥⎝ ⎠⎣ ⎦→∑ w

W uw 0 Σ e 2ˆp

nσ

′ → wW W Σ2σ (il vettore

ha dimensione l ) si ha tw

( ) ( )1

1 2 1ˆd

ln n n nn

σ 2χ−

− −′⎛ ⎞′⎜ ⎟⎝ ⎠

→W WWu Wu ;

inoltre, poiche` i residui sono stati costruiti utilizzando la stima consistente di un parametro

vettoriale di dimensione , si ha k

( ) ( )1

1 2 1ˆ ˆ ˆd

l kn n n nn

σ 2χ−

− −−

′⎛ ⎞′⎜ ⎟⎝ ⎠

→W WWu Wu .

Gli argomenti che giustificano l’ultima affermazione non sono stati riportati perché sono

essenzialmente di natura tecnica, comunque una prova indiretta è data in ii) della osservazione che

segue. La stessa procedura e` stata utilizzata in 7-7 per individuare la distribuzione asintotica della

statistica di Hansen.

Il test di Sargan (con livello di significatività α ):

“Si rifiuta l’ipotesi se 0H 2 22 ,

ˆ ˆ( ) /n SLS l kQ 1 ασ χ − −>β ”.

14


Osservazione:

i) La procedura ora descritta è valida anche in ipotesi di eteroschedasticità, con la sola variante di

dover utilizzare lo stimatore di White per la stima della varianza asintotica, 2E( )u t tu t′=wΣ w w , di

1

1 n

t tt

un =∑w . Naturalmente in tal caso non sara` piu valida la rappresentazione della statistica di

Sargan mediante la funzione obiettivo.

ii) La statistica di Sargan (in ipotesi di omoschedasticita`) coincide con la statistica utilizzata nella

verifica della ipotesi

c) 0*

1

: , E( | ) 0 : , E( | ) 0

t t t t t

t t t t t t

H y u uH y u u

′= + =⎧⎨ ′= + + =⎩

x β wx β w γ w

che si puo` scrivere anche nella forma

d) 0

1

::

HH

=⎧⎨ ≠⎩

γ 0γ 0

per il modello * , E( | ) 0t t t t t ty u u′= + + =x β w γ w ;

(ricordare che il test su ques’ultima ipotesi, se gli errori sono omoschedastici, utilizza la statistica

differenza dei valori minimi delle funzioni obiettivo del modello ridotto e di quello non ridotto

diviso per la stima della varianza; vedi l’ultima osservazione in 7.4). Infatti il modello t t t ty u∗′= + +x β w γ , nellìpotesi E( | ) 0t tu =w , è esattamente identificato ( )9 e

dunque il valore della corrispondente funzione obiettivo nella stima IV è 0,( )10 mentre il valore della

funzione obiettivo per il modello ridotto è . 2ˆ( )n SLSQ β

iii) La statistica di Sargan coincide con il parametro [ ]( )2 /nR n ESS TSS= del modello

(come al solito ˆ = +u Wb error 2c2R R= quando nel modello e` presente l’intercetta).

La prova è immediata non appena si costruisce il test con il modello IVGNR per l’ipotesi

. 0 :H =γ 0

iv) Vari autori suggeriscono di realizzare sempre il precedente test, in presenza di

sovraidentificazione. Segnalano anche un usuale errore nella interpretazione dell’esito del test; più

precisamente, il rifiuto dell’ipotesi nulla (rifiuto della restrizione di sovraidentificazione) può avere

origine da una delle seguenti situazioni (che sono rispettivamente l’interpretazione dell’ipotesi

nelle precedenti due ipotesi statistiche b) e d) che portano alla costruzione del test di Sargan):

1H

− Il modello è correttamente specificato, ma alcuni strumenti sono correlati con gli errori e quindi

( ) 9 Il numero delle variabili endogene presenti nel modello è uguale al numero delle variabili strumentali.

( )10 In questo caso è noto il valore della funzione obiettivo, ma non quello della stima in quanto le osservazioni per t∗w

non sono disponibili.

15


non sono validi strumenti (decisione che si tende a privilegiare);

− Il modello non è correttamente specificato e alcune variabili, utilizzate come strumenti, sono in

realtà dei regressori e pertanto andrebbero inserite nell’equazione (decisione che si tende a non

prendere in considerazione).

top

7-6 Il test di Durbin-Wu-Hausman (sulla presenza di variabili endogene tra i regressori)

I metodi descritti finora in questo capitolo sono utili (e necessari) in presenza di variabili

endogene tra le variabili indipendenti, ma se così non dovesse essere essi non solo sono inutili ma in

un certo senso sono anche dannosi. E` evidente allora l’importanza di poter disporre di opportuni

test (uno sara` costruito in questo paragrafo) quando si nutrano dubbi sull’effettiva endogeneità di

alcune variabili indipendenti del modello.

E` assegnato il modello lineare t ty ut′= +x β con E( | ) 0t tu Ω = , , assogettato alle

seguenti ipotesi

1,t = …

• 2E( | )t tu 2σΩ = (omoschedasticita` degli errori);

• il processo tw delle variabili strumentali ha dimensione ( dim tl k≥ = x ) ) (e non coincide

con tx );

• per il processo , ,t t ty x w valgono le usuali ipotesi che assicurano la validita` delle proprietà`

asintotiche degli stimatori;

e si considera l’ipotesi statistica:

0

1

: , E( | : , E( |

t t t t t

t t t t t

H y u uH y u u

′ ) 0) 0

= + =⎧⎨ ′= + =⎩

x β xx β w

.

Osservazione:

i) Se (tutti) i regressori sono validi strumenti, lo stimtore OLS e` (asintoticamente) il piu`

efficiente nella classe degli stimatori ( n − consistenti) costruiti con il metodo dei momenti, e a tale

classe appartiene evidentemente lo stimatore 2SLS;

ii) Se tra i regressori c’è qualche variabile endogena, allora la stima 2SLS è n − consistente,

mentre la stima OLS non è consistente;

iii) Dalle precedenti due osservazioni e dal principio di Hausmann (cfr. nota 5 in 6-5) segue

. 2 2ˆ ˆ ˆ ˆvar( ) var( ) var( )SLS OLS SLS OLS− = −β β β β

Al fine di costruire un test sulla precedente ipotesi, le proprietà i) e ii) suggeriscono di utilizzare

come statistica la distanza pesata tra i due stimatori, la cui distribuzione asintotica potra` essere

16


individuata data la validita` di iii).

Si considera allora la statistica di Hausman

( ) ( )1

2 2 2ˆ ˆ ˆ ˆ ˆ ˆvar( ) var( )SLS OLS SLS OLS SLS OLSH

− ′⎡ ⎤= − − −⎢ ⎥⎣ ⎦β β β β β β

e per essa si puo` dimostrare che (nell’ipotesi , e quindi nell’ipotesi che tutte le coordinate di

sono esogene) converge in distribuzione (come è naturale) verso una chi-quadro, ma i suoi gradi

di libertà (e qui c’è un elemento di soggettività) sono pari al numero di variabili che non sono

certamente esogene.

0H

tx

Osservazione:

• Per eliminare l’elemento di soggettività nella formulazione del test, alcuni autori

suggeriscono di considerare, nella costruzione della statistica H , soltanto le componenti degli

stimatori dei parametri relativi alle variabili delle quali non si è certi della effettiva esogeneità.

• Non e` difficile provare che il test di Hausman, nella formulazione suggerita dalla precedente

osservazione, è identico al test di Durbin-Wu che ora si passa a descrivere (vedi Davidson-

MacKinnon, Econometric Theory and Method, pag. 338).

Si considera la decomposizione [ ]=X Z Y , essendo la matrice delle osservazioni delle

variabili certamente esogene e la matrice delle osservazioni dei rimanenti repressori, e si

verifica l’ipotesi

Z

Y

0

1

::

HH

=⎧⎨ ≠⎩

δ 0δ 0

per il modello ausiliario

P= + +Wy Xβ Yδ resid (o equivalentemente M= + +Wy Xβ Yδ resid ). top

7-7 Il Metodo dei Momenti Generalizzato (GMM): una breve introduzione

La seguente ovvia osservazione suggerisce un percorso alternativo a quello presentato in 7-2 per

costruire uno stimatore di , che come si potra` notare e` molto piu` generale e puo` essere

utilizzato in contesti molto diversi da quelli fin qui presi in esame (cfr. nota 1 in 4-1).

β

Osservazione: Lo stimatore (delle variabili strumentali) costruito in 7-1, minimizza la distanza

da di

ÎVβ

01

1 (n

t t tt

yn =

′−∑w x β) , per qualunque funzione distanza in , (in particolare per le distanze

definite da una matrice simmetrica definita positiva) in quanto e` uno zero di

kR

1

1 ( )n

t t tt

yn =

′−∑w x β .

Il modello, le notazioni e lo stimatore GMM: E` assegnato il modello

17


t ty ut′= +x β con E( | ) 0t tu Ω =

e sia ( ) t t∈Ωw il processo delle variabili strumentali di dimensione (dunque il modello e`

sovraidentificato).

l k>

Si pone ( , , ) ( )t t t t ty ′= −g x w β w x β e 1

1( ) ( , , )n

n ttn =

= ∑g β tg x w β per ogni e si osserva che n

[ ]1

( )

( ) 1 nn

t tt

l kn n=

×

∂ ′⎛ ⎞′= − = −⎜ ⎟∂ ⎝ ⎠∑

g β W Xw xβ

.

Sia ( )( )ˆ n

nΩ una sequenza di matrici simmetriche definite positive di ordine l , con che

dipende eventualmente da

( )ˆ nΩ

1, ,, ,t t t t

y=

x w … n e posto ( )ˆ ˆ n=Ω Ω , si considera il funzionale (funzione

obiettivo)

[ ] [ ]ˆ ˆ( , ) ( ) ( )n nJ n ′=β Ω g β Ω g βn .

Definizione: Se la funzione ha un unico punto di minimo, ˆ( , )nJ β Ω ( )ˆ ˆ( ) k∈β Ω R , allora esso dicesi

stima GMM di β relativa alla matrice . Ω

Osservazione:

• (per un fissato ) esiste se e soltanto se ha un unico punto stazionario; ˆ ˆ( )β Ω n ˆ( , )nJ β Ω

• 1 1

ˆ( , ) 1 1ˆ ( )n n

t t t t tt t

Jy

n n= =

⎡ ⎤ ′∂ ⎡ ⎤ ⎡ ⎤⎣ ⎦ ′ ′= ⇔ − =⎢ ⎥ ⎢ ⎥∂ ⎣ ⎦ ⎣ ⎦∑ ∑

β Ω0 w x Ω w x β 0

β

1 1 1 1

1 1 1 1ˆ ˆn n n n

t t t t t t t tt t t t

yn n n n= = = =

′ ′⎡ ⎤ ⎡ ⎤ ⎡ ⎤ ⎡′ ′⇔ =⎢ ⎥ ⎢ ⎥ ⎢ ⎥ ⎢⎣ ⎦ ⎣ ⎦ ⎣ ⎦ ⎣ ⎦∑ ∑ ∑ ∑w x Ω w w x Ω w x β⎤′ ⎥ .

• Dai precedenti due punti segue la rappresentazione di , quando esiste, e la condizione per

la sua esistenza:

ˆ ˆ( )β Ω

1

1 1 1 1

1 1 1 1ˆ ˆ ˆ ˆ( )n n n n


yn n n n

−

= = = =

⎛ ⎞ ⎛ ⎞′ ′⎡ ⎤ ⎡ ⎤ ⎡ ⎤ ⎡⎜ ⎟ ⎜ ⎟′ ′ ′= ⎢ ⎥ ⎢ ⎥ ⎢ ⎥ ⎢⎜ ⎟ ⎜ ⎟⎣ ⎦ ⎣ ⎦ ⎣ ⎦ ⎣⎝ ⎠ ⎝ ⎠∑ ∑ ∑ ∑β Ω w x Ω w x w x Ω w ⎤

⎥⎦

( ) ( ) ( ) ( )

1

1 1 1 1

1

1 1 1 1ˆ ˆ

ˆ ˆ

n n n n


un n n n

−

= = = =

−

⎛ ⎞ ⎛′ ′ ⎞⎡ ⎤ ⎡ ⎤ ⎡ ⎤ ⎡ ⎤⎜ ⎟ ⎜′ ′ ′= + ⎟⎢ ⎥ ⎢ ⎥ ⎢ ⎥ ⎢ ⎥⎜ ⎟ ⎜ ⎟⎣ ⎦ ⎣ ⎦ ⎣ ⎦ ⎣ ⎦⎝ ⎠ ⎝

⎡ ⎤′ ′′ ′ ′ ′= + ⎢ ⎥⎣ ⎦

∑ ∑ ∑ ∑β w x Ω w x w x Ω w

β W X Ω W X W X Ω W u

⎠

Ipotesi: Le ipotesi sui processi (da G1 a G3) sono simili a quelle gia` formulate quando sono stati

18


introdotti gli altri metodi di stima in questo capitolo, comunque qui sono riportate per completezza.

G1 – Il processo , ,t t tyx w e` stazionario ed ergodico;

G2 – (Condizione di identificabilita`) La matrice ( )E( )t t′ = wxw x Σ di ordine ha rango

massimo (e quindi come gia` osservato nella nota 1 in 7-2) le matrici

l k×

k ( )E( )t t′=wΣ w w e

sono non singolari); ( E( )t t′=xΣ x x )

G3 – Il processo t tuw e` una differenza maringala e ( )2E( )t t t uu ′ = ww w Σ e` non singolare (e

dunque per il teorema del limite centrale 1

1 ( , )n d

t t ut

n u Nn =

→∑ ww 0 Σ );

G4 – La sequenza ( )( )ˆ n

nΩ converge in probabilità a una matrice Ω (quadrata di ordine )

invertibile.

l

Proprietà dello stimatore : Dalla sua rappresentazione si ottiene immediatamente (gli

argomenti sono del tutto simili a quelli utilizzati precedentemente in varie circostanze)

ˆ ˆ( )β Ω

1) e` consistente; ˆ ˆ( )β Ω

2) ( )ˆ ˆ ˆ ˆ( ) ( ,Avar( ( )))d

n N− →β Ω β 0 β Ω con

[ ] [ ]1 1ˆ Âvar( ( )) u− −′ ′ ′= wx wx wx w wx wx wxβ Ω Σ ΩΣ Σ ΩΣ ΩΣ Σ ΩΣ ,

per la quale una stima consistente e` immediatamente disponibile non appena si costruisce una

stima consistente per . 2E( )u t tu ′=wΣ w wt

Osservazione:

1) Dalla rappresentazione di , con argomenti del tutto simili a quelli adoperati in 3-8,

segue che essa (come funzione di ) e` minimizzata per

ˆ Âvar( ( ))β Ω

Ω 1u−= wΩ Σ e il valore minimo e`

, pertanto la costruzione di una stima consistente per ha un ruolo fondamentale

(oltre a quello gia` segnalato) anche nella costruzione di un buon stimatore che e` denominato

stimatore GMM efficiente.

11u

−−′⎡⎣ wx w wxΣ Σ Σ ⎤⎦ uwΣ

2) Considerate le due sequenze ( )( )ˆ n

nΩ con ( )ˆ n

lI≡Ω e (1

( ) 1ˆ ˆn

n

−−′⎛ ⎞= =⎜ ⎟

⎝ ⎠w

W WΩ )Σ rispettivamente

convergono a lI e e pertanto i corrispondenti stimatori sono entrambi 1−wΣ ˆ ˆ( )β Ω -consistentin

inoltre si ha . ( )1 12

ˆ ˆˆ( ) ( ) SLSP P− −′ ′= =w W Wβ Σ X X X y β

19


Costruzione di una stima consistente di 2E( )u t tu t′=wΣ w w ) e dello stimatore GMM efficiente. Si

esaminano i seguenti due casi:

Caso a) – Gli errori del modello sono eteroschedastici;

Caso b) – Gli errori sono omoschedastici ( 2E( )t tu σΩ = ).

Caso a) – Sia un fissato intero, si considera (uno dei due stimatori costruiti nel punto 2)

della precedente osservazione) e si costruiscono i residui . Con argomenti ormai

standard (cfr. per esempio 3-4) si prova che ( )

n ( )ˆ ˆ( nβ Ω )

)ˆ ˆˆ ( nt t tu y ′= − x β Ω

2

1

1ˆ ˆn

u tt

un =

t t′= ∑wΣ w w e` una stima consistente di .

Lo stimatore GMM efficiente e` allora .

uwΣ

1ˆ ˆ( )u−wβ Σ

Caso b) – Ora si ha ( )2 2E( ) E( )u t t t t tu σ′ ′= = =w wΣ w w w w Σ2σ e si vede immediatamente che

( )1 12

ˆ ˆ ˆˆ ˆ( ) ( )u S− −= =w wβ Σ β Σ β LS .

A questo punto e` irrilevante rappresentare la stima consistente di , che peraltro si scrive

immediatamente, ma si osserva che (in presenza di omoschedasticita`) si ha

2σ wΣ

12

2ˆ Âvar( )SLS

Pn

σ−′⎛ ⎞= ⎜ ⎟

⎝ ⎠WX Xβ e 2 2

21

1 ˆˆ ( )n

t t SLSt

yn

σ=

′= −∑ x β .

Osservazione:

1) In questo paragrafo non si e` fatto alcun cenno al caso in cui nel processo t tuw e` presente

l’autocorrelazione. In realtà in questo caso non c’e` alcuna difficoltà aggiuntiva, si dovra`

semplicemente sostituire con e stimare quest’ultimo in modo consistente per

esempio con lo stimatore di Newey-West (o HAC).

uwΣ Avar( )uw

2) I software econometrici nel caso a) utilizzano una procedura ricorsiva; qui e` stato descritto

soltanto il primo passo; nel secondo passo si utilizza (al posto di e così via. 1ˆ ˆ( u−wβ Σ ) )( )ˆ ˆ( nβ Ω

La statistica di Hansen e il test sulle restrizioni di sovraidentificazione. Essendo

• 1

1( ) ( , )n

n t tt

n n u Nn =

⎡ ⎤= →⎢ ⎥

⎣ ⎦∑ wg β w 0 Σu

l

;

• ˆp

u u→w wΣ Σ

si ha [ ] [ ]1 2ˆ( ) ( )d

n u nn χ−′ →wg β Σ g β ,

donde per il valore minimo del funzionale obiettivo (denominato statistica di Hansen) si ha

20


( )1 1 1 1ˆ ˆ ˆˆ ˆ ˆ ˆ( ( )) ( ( )) ( ( ))d

n u n u u n u lJ n 2kχ− − − −

−′⎡ ⎤ ⎡ ⎤= ⎣ ⎦ ⎣ ⎦→w w w wβ Σ g β Σ Σ g β Σ ,

(la prova e` omessa, comunque e` opportuno osservare che in quest’ultima rappresentazione si sono

persi k gradi di liberta` pari al numero di parametri stimati (in modo consistente)).

Test di Hansen (sulle restrizioni di sovraidentificazione): Un elevato valore di , per

esempio

1ˆ ˆ( ( ))n uJ −wβ Σ

1 2,1

ˆ ˆ( ( ))n u l kJ αχ−− −>wβ Σ (per un α assegnato), deriva certamente da un eventuale errore di

specificazione, in particolare dalla non ortogonalità di qualcuno degli strumenti se si e` certi della

validità delle altre ipotesi.

l

top

7-8 Proprieta` finite degli stimatori IV: un esercizio

Sull’argomento “proprieta` finite degl stimatori IV”, comunque di grande interesse, ci sono

soltanto risultati parziali e relativamente complessi. Il seguente esempio, preso da Davidson &

MacKinnon, Econometric Theory and Methods, ha il solo scopo di lasciare intuire cosa puo`

accadere agli stimatori IV in presenza di campioni finiti (di dimensione non sufficientemente

grande).

Sia tw un processo (non e` necessaria alcuna ipotesi su di esso fin quando interessano le

proprietà` finite degli stimatori, che saranno sempre condizionate a tw ), ,t tu v un processo di

variabili indipendenti, tutte con distribuzione bivariata normale con media nulla ( ),

varianza unitaria ( ) e coefficiente di correlazione , e

indipendente dal processo, e si considera il DGP

E( ) E( ) 0t tu v= =

var( ) var( ) 1t tu v= = ( )corr( , )t tu vρ =

, ,t t ty x w per il quale

t t u

t t v

y x t

t

ux w v

β σπ σ

= +⎧⎨ = +⎩

,

e` un suo modello completamente specificato.

Problema: Fissato intero naturale e un processo delle osservazioni n 1, ,t tw

= … n, considerato lo

stimatore lo stimatore di β (al variare del parametro ] [1,1ρ ∈ − ) che ha buone proprieta`

asintotiche, individuare (alcune) sue proprieta` quando lo si considera condizionato a

(come funzione di 1( , )nw w ′=w … 1( , , )nx x ′=x … e 1( , , )ny y ′=y … ).

Soluzione: Si esaminano separatamente i casi 0ρ = e 0ρ ≠ .

Primo caso ( 0ρ = ): Il vettore e` strettamente esogeno, allora lo stimatore (efficiente) di x β e` lo

stimatore OLS (che e` indipendente da ) per il quale sussistono (tra le altre) le seguenti proprietà: w

21


i) ( )ˆ Ê( ) E( )β β β= ⇒ =x β ;

ii) 2 1ˆ ( ; ( ) / )uN nβ β σ −′x x x∼ ;

Secondo caso ( 0ρ ≠ ):

Osservazione:

• Si ha t tu v tρ ε= + con E( ) 0t tvε = (ovvia conseguenza della normalita` della variabile )

e dalla indipendenza delle variabili del processo segue

( , )t tu v

E( ) 0=ε v .

• Nella prima equazione la variabile tx e` endogena ( [ ] ( )E( ) E ( ) 0t t t v t t vx u w v uπ σ σ ρ= + = ≠ ) e

e` un valido strumento (e` correlata con tw tx e non correlata con ). tu

In questo caso uno stimatore di β , con buone proprieta` asintotiche, si costruisce con il metodo

delle variabili strumentali. Per non appesantire le notazioni, si pone ÎVβ β= w e allora si ha

( ) ( )1 1uβ β σ− −′ ′ ′= = +w x w ′y w x w u

(notare che e` un vettore costante e che se moltiplicato per , la rappresentazione di w 1/ 21/( )′w w β

non cambia, pertanto si puo` si puo` assumere che 1′ =w w ), donde, utilizzando la rappresentazione

tx e , si ha tu

( ) 1 ( )( ) uu v

v

σ ρβ β σ π σ βπ σ

− ′ +′ ′= + + = +′+

w v εw w v w uw v

.

Le proprietà` statistiche dello stimatore β .

Osservazione: Intanto essendo combinazione lineare di si ha x v =β x β v , inoltre

• dalla rappresentazione di β , essendo E( ) 0=ε v , si ha

( ) ( )E ( ) E ( ) E u u

v v

za z

σ ρ σ ρβ β β βπ σ σ⎡ ⎤′⎡ ⎤− = − = =⎢ ⎥⎣ ⎦ ′+ +⎣ ⎦

w vx v vw v

avendo posto e z ′= w v / va π σ= .

• La variabile , in quanto combinazione lineare della normale multivariata (non dimenticare

che qui w e` un vettore costante di norma 1), ha distribuzione normale, inoltre si ha

e .

z v

E( ) E(′w v) 0z = = =( )var( ) var( ) 1nz I′ ′= =w v w w w

Ora se esistesse il valore atteso di β , denotata eon ( )zϕ la densita` della normale standard, si

avrebbe

22


( )E( ) E E ( ) ( )u

v

z z dza z

σ ρβ β β β ϕσ

+∞

−∞

⎡ ⎤− = − =⎣ ⎦ +∫v ,

ma quest’ultimo integrale non esiste (osservare che z a= − e` una singolarita` del prim’ordine per

la funzione integranda), pertanto lo stimatore β non ha valore atteso.

Osservazione: Qui non ci sono informazioni sulla distribuzione di β che evidentemente non puo`

essere una di quelle note; una sua versione empirica puo` essere individuata con il metodo di Monte

Carlo in quanto il modello e` completamente specificato.

top

23

Documents

Il Metodo (di stima) delle Variabili Strumentalibasile/pagina_web_2013/Econometria/Econometria... · procedura di stima che sfrutta la struttura Panel dei dati. Va ribadito, come