Upload
ngonhu
View
246
Download
3
Embed Size (px)
Citation preview
7-Econometria, a.a. 2014-15
Capitolo 7
7-1 Modelli econometrici con variabili endogene (tra le variabili indipendenti)
7-2 Il metodo (di stima) delle variabili strumentali
7-3 Lo stimatore 2SLS
7-4 Test sulle ipotesi: il modello IVGNR
7-5 Il test di Sargan sulle restrizioni di sovraidentificazione
7-6 Il test di Durbin-Wu-Hausman (sulla presenza di variabili endogene tra i regressori)
7-7 Il Metodo dei Momenti Generalizzato (GMM): una breve introduzione
7-8 Proprieta` finite degli stimatori IV: un esercizio
7-1 Modelli econometrici con variabili endogene (tra le variabili indipendenti)
Nei metodi di stima finora presentati, per i modelli lineari (risp. non lineari) del tipo
(risp. ), l’ipotesi sugli errori t ty ′= +x β tu t( )t ty x u= +β E( | ) 0t tu =x , ha avuto un ruolo
fondamentale. Essa era ottenuta come conseguenza di E( | ) 0t tu Ω = e t t∈Ωx . La prima condizione
esprime la circostanza che il modello e` correttamente specificato, la seconda che le variabili
indipendenti presenti nel modello sono esogene o predeterminate.
Qui di seguito sono presentate tre (differenti) situazioni, abbastanza frequenti nelle applicazioni,
che portano in modo naturale alla endogeneità di alcune variabili indipendenti di un modello
correttamente specificato.
1 – Errori nelle variabili: Si assume che il modello corretamente specificato sia 0 0 0
t0 1t tx uβ β= + + 0 2. . .(0, )tu i i d, y σ∼ ,
ma che il processo delle osservazioni ,t ty x verifichi le seguenti condizioni:
0t ty y vt= + , 0
t t tx x w= + ,
con tv e tw processi , indipendenti tra loro e indipendenti da . . .i i d 0tu . Allora il modello
econometrico per il DGP è 0
0 1 1 0 1( )t t t t t ty x u v w xβ β β β β= + + + − = + + tu ,
e si verifica senza alcuna difficoltà che mentre (l`errore sulla variabile dipendente) ha il solo
effetto di aumentare la varianza degli errori e dunque di peggiorare la precisione della stima dei
parametri, introduce una correlazione tra l’errore e la variabile indipendente
tv
tw tu tx , che (come è
ben noto) ha come grave conseguenza la non consistenza delle stime (o equivalentemente la non
identificabilità del modello). La presenza dell’endogeneità indotta dgli errori sulle osservazioni è
1
7-Econometria, a.a. 2014-15
abbastanza naturale nei modelli econometrici in quanto i dati a disposizione sono di natura non
sperimentale, ma spesso è trascurata.
2 – Omissione di variabili rilevanti: L’omissione di una variabile rilevante in un modello, e quindi
il suo inserimento nell’errore, (talvolta tale omisssione è obbligata per la mancanza di osservazioni
su di essa) quando e` correlata con qualche altra variabile indipendente, rende endogene queste
ultime. Una situazione del tipo ora descritta è già apparsa in 6.2, dove e` stata proposta una
procedura di stima che sfrutta la struttura Panel dei dati. Va ribadito, come e` stato gia` detto nella
nota conclusiva del paragrafo 6.3, che tali stime sono esattamente le stesse di quelle che si
ottengono con i metodi che saranno presentati in questo capitolo.
3 – Simultaneità: La seguente ovvia affermazione “La dipendenza funzionale di una variabile da
un’altra non implica la dipendenza causale in una delle due direzioni”, giustifica la seguente
Definizione: Due variabili (economiche) si dicono simultanee se tra esse c’è una dipendenza
funzionale (implicita oppure esplicita) e non c’è alcuna dipendenza causale.
In definitiva in ogni modello (univariato) in cui sono presenti due o più variabili simultanee, tra
le variabili indipendenti c’è necessariamente qualche variabile endogena. Va segnalato che in
generale non è facile stabilire la eventuale simultaneità di due variabili.
Il seguente esempio chiarisce la situazione ora descritta e fornisce qualche idea su come
affrontare il problema della stima.
Esempio (Il modello per un mercato competitivo di un bene): Uno dei primi modelli presentati
nel corso di microeconomia è quello relativo al mercato di un bene, in cui si assume che sussista
una dipendenza lineare tra quantità e prezzo. Naturalmente la rappresentazione analitica della
relazione funzionale è differente (almeno nelle restrizioni sui parametri) a seconda che tale
relazione è vista dal lato della domanda o da quello dell’offerta. Si ha infatti:
1 2
1 2
(equazione dell'offerta) (equazione della domanda)
s
d
q pq p
α αβ β
⎧ = +⎨
= +⎩, con 2 0α > e 2 0β < ,
inoltre, in un mercato competitivo, si può assumere che forze interne al mercato spingono verso
l’equilibrio e dunque deve aversi . Ora se sono disponibili osservazioni
(notare che è la quantità di equilibrio) il modello econometrico si può scrivere nella forma
(s dq q q= = ) n ( , )t tq p
tq
(*) 1 2
1 2
(equazione dell'offerta) (equazione della domanda)
t t t
t t t
q p uq p v
α αβ β
= + +⎧⎨ = + +⎩
e la richiesta legittima (e certamente di grande interesse) è quella di stimare i parametri del modello.
Risolvendo il precedente sistema rispetto a e si ha tp tq
2
7-Econometria, a.a. 2014-15
1 1
2 2 2 2
2 22 1 1 2
2 2 2 2
t tt
t tt
v up
v uq
β αα β α β
α βα β α βα β α β
−−⎧ = +⎪ − −⎪⎨ −−⎪ = +⎪ − −⎩
;
dalla prima uguaglianza si deduce immediatamente che, salvo casi eccezionali e poco significativi,
la variabile (essendo correlata sia con che con ) è endogena in ciascuna delle due equazioni
in (*) e pertanto nessuna delle due equazioni è in grado di fornire stime consistenti dei parametri
(naturalmnete con i metodi a disposizione fino a questo momento e come si vedrà con nessun altro
metodo se non sono disponibili altre informazioni).
tp tu tv
Si assume ora, che un’attenta analisi del mercato porti alla seguente specificazione
dell’equazione della domanda
1 2 3( )dt t t tq q p xβ β β tv= = + + + ,
con tx variabile esogena (per esempio tx potrebbe tener conto di eventuali interventi del governo
per sostenere la domanda) e quindi non correlata con gli errori (delle due equazioni). Questa volta
risolvendo rispetto a e si ha tp tq
31 1
2 2 2 2 2 2
2 3 2 22 1 1 2
2 2 2 2 2 2
t tt t
t tt t
v up x
v uq x
ββ αα β α β α β
α β α βα β α βα β α β α β
−−⎧ = + +⎪ − − −⎪⎨ −−⎪ = + +⎪ − − −⎩
,
ed essendo evidentemente tx non correlata con gli errori, entrambe le equazioni (di quest’ultimo
modello) consentono di stimare in modo consistente i parametri, in particolare i coefficienti di tx e
quindi il loro rapporto, che è evidentemente uguale a 2α .
Osservazione: Nella procedura ora descritta sembra avere un ruolo fondamentale la specificazione
dell’equazione della domanda (e in particolare il modo con il quale tx agisce su ) ma il
seguente argomento mostra che non è così; ciò che conta è che
( )dt tq q=
tx sia esogena nell’equazione
dell’offerta e che essa sia correlata con . Infatti, se si considera l’aspettazione nell’equazione
dell’offerta si ottiene
tq
1 2E( ) E( )t tq pα α= + ,
mentre (sempre nell’equazione dell’offerta) se si moltiplica per tx e si calcola l’aspettazione, si
ottiene
1 2E( ) E( ) E( )t t t t tq x x p xα α= + ,
e dunque, se e` [ ]cov( , ) E( ) E( )E( ) 0t t t t t tx p x p x p= − ≠ , si ha
3
7-Econometria, a.a. 2014-15
2
1 E( )E( ) E( )
1 E( )E( ) E( )
t
t t
t
t t
q
t
t
x x qp
x x p
α = ,
la cui versione empirica e` evidentemente la stima trovata precedentemente.
top
7-2 Il metodo (di stima) delle variabili strumentali
Sia 1,,t t t
y=
x … un D.G.P. e
t ty ut′= +x β con E( | ) 0t tu Ω = ,
un suo modello lineare correttamente specificato (si noti che qui non si richiede che ); si
segnala che qui si fa riferimento a dati del tipo time-series, naturalmente l’adattamento delle ipotesi
e dei risultati ai dati del tipo cross-section non presenta alcun particolare problema.
t ∈Ωx t
Ipotesi sul modello (l’elenco sarà aggiornato quando se ne presenta la necessità):
IV-1) Esiste un processo vettoriale tw di dimensione , con k t t∈Ωw , (che verifica alcune
ragionevoli condizioni che saranno rese esplicite in seguito) e per il quale, fissato , sono
disponibili le osservazioni per ; con si denota la matrice (
n∈N
1, ,t n= … W n k× ) delle osservazioni. I
processi, con le precedenti caratterisiche, sono denominati processi degli strumenti.
Osservazione: L’uguaglianza E( )t tu =w 0 (che è conseguenza di E( | ) 0t tu Ω = ) porta, come ormai
e’ solito, a considerare la sua versione empirica, e dunque l’equazione (vettoriale in ) con
incognite
kR k
(*) ( )1
1 ( ) ( )n
t t tt
yn =
′ ′− = ⇔ − =∑w x β 0 W y Xβ 0 .
Definizione: L’unica (eventuale) soluzione dell’equazione (*) dicesi stima di β con il metodo
delle variabili strumentali e sara` denotata con il simbolo (si omette di evidenziare nella
notazione la dipendenza da che peraltro e` rilevante).
ˆIVβ
tw
Al fine di assicurare non solo l`esistenza di , ma anche la validità di alcune buone proprietà
statistiche, sono naturali le seguenti ulteriori ipotesi sul processo
ˆIVβ
, ,t t ty x w :
IV-2) , ,t t ty x w è un processo stazionario ed ergodico (da cui 1
1 ( E( )n p
t t t ttn =
′ ′=→∑ wxw x Σ w x ));
4
7-Econometria, a.a. 2014-15
IV-3) (Condizione di identificabilita`) La matrice (quadrata di ordine ) è invertibilek wxΣ ( )1
(conseguentemente anche le matrici ( )E( )t t′=wΣ w w e ( )E( )t t′=xΣ x x sono invertibili( )2 ).
IV-4) Il processo t tuw è una differenza martingala, ( )3 o piu` in generale e` valida qualche
versione del teorema del limite centrale. ( )4
Osservazione: Da IV-4 e dal teorema del limite centrale, segue ( ) ( ,Avar( ))d
n u N u→w 0 w con
2 2
1
1lim ( E( ) ) se e` non correlato, Avar( )
, con E( ) se e` autocorrelato (cfr. ).
n
t t t t t t u t tn t
j j t t j t t j t tj
p u u un
uu u u
→∞=
+∞
− −=−∞
⎧ ′ ′= =⎪⎪= ⎨⎪ ′Γ Γ =⎪⎩
∑
∑
ww w w w Σ ww
w w w 3 - 9, prop. 2.
Rappresentazione e proprietà dello stimatore : La prova non e` riportata in quanto non
differisce da quella delle corrispondenti proprieta` degli stimatori OLS (cfr. 3-3).
ˆIVβ
1) 1 1
1 1 1 1
1 1 1 1ˆn n n n
IV t t t t t t t tt t t t
yn n n n
− −
= = = =
⎛ ⎞ ⎛ ⎞′= = +⎜ ⎟ ⎜ ⎟⎝ ⎠ ⎝ ⎠∑ ∑ ∑ ∑β w x w β w x w u′ (o equivalentemente, se si
utilizza la rappresentazione matriciale del modello, 1 1ˆ ( ) ( )IV− −′ ′ ′= = +β W X W y β W X W u′
)
));
2) è consistente; (segue dalle sole ipotesi IV-1 e IV-2); ˆ ˆ( IV=β β
3) ˆ ˆ( ) ( ,Avar(d
n N− →β β 0 β)) con ( ) ( )1ˆAvar( ) Avar( )u 1− −′= wx wxβ Σ w Σ (segue da IV-3 con i
soliti argomenti);
4) ( ) ( )1 1ˆAvar( ) Avar( )u− −
′= wx wxβ Σ w Σ , dove 2
1
1 ˆAvar( )n
t t tt
u un =
′= ∑w w w con ˆˆt t t Iu y V′= − x β e
( ) 1 In sostanza si richiede che la matrice quadrata sia invertibile; infatti se una delle due variabili ha media
nulla si ha cov , mentre se entrambe le variabili hanno 1 come prima coordinata, un semplice calcolo mostra
che le due matrici hanno lo stesso determinante.
cov( , )x w
( , ) = wxx w Σ
( )2 Si comincia con l’osservare che se si ha (omettendo gli indici) ,k∈ ≠c R c 0 ( )E( ) E( )′ ′ ′ ′= ⇒ = ⇒c wx 0 c wx 0 c = 0 .
Ora se fosse singolare esisterebbe tale che wΣ ,k∈ ≠c R c 0 [ ] ( )( )2E 0 E ⎡ ⎤′ ′ ′ 0= ⇔ ⎣ ⎦c ww c c w = donde 0′ =c w e
quindi , che e` assurdo. E( )′ ′ =c wx 0 ( )3 E` utile ricordare che una condizione sufficiente perche` t tuw sia una differenza martingala e`
. 1 1E( | , , , ) 0t t t tu u − − =w w …( )4 In presenza di autocorrelazione negli errori, tra le coordinate di non ci possono essere ritardi della variabile dipendente, che invece possono trovarsi tra le coordinate di .
tw
tx
5
7-Econometria, a.a. 2014-15
1
1 n
t ttn n=
′⎛′= =⎜⎝ ⎠
∑wxW XΣ w x ⎞
⎟
2
. Tale stimatore per la varianza asintotica di dicesi stimatore di
White (o stimatore robusto all’eteroschesaticità (HC))
ˆIVβ
5) Se gli errori sono omoschedastici (cioè 2E( | )t tu σΩ = e quindi anche 2 2E( | )t tu σ=w ), si
ha 2 2 2σ1
1Avar( ) lim E( )( )n
t t t tt
u pn
σ σ=
⎛ ⎞′ ′= = =⎜ ⎟⎝ ⎠
∑ ww w w w w Σ e 2
1
1ˆr( )n
t tt
un
σ=
⎛ ⎞′Ava = ⎜ ⎟⎝ ⎠∑w w w con
2
1
1ˆn
tt
un
σ=
= ∑ 2ˆ , e allora dalla precedente proprietà 4 segue
( ) ( )1 12ˆ ˆAvar( ) σ
− −′= wx w wxβ Σ Σ Σ .
Osservazione:
1) La rappresentazione della varianza asintotica di , in particolare la presenza di ˆIVβ ( ) 1−
wxΣ ,
mostra che la elevata correlazione tra e influenza positivamente la efficienza dello
stimatore.
tw tx
2) La procedura ora descritta lascia non risolti i seguenti due problemi
• individuare (almeno) un processo degli strumenti;
• effettuare una ragionevole scelta in presenza di piu` processi degli strumenti.
top
7-3 Il metodo dei minimi quadrati a due stadi (2SLS)
Si fa sempre riferimento al modello considerato in 7-2, e dunque a
t ty ut′= +x β con E( | ) 0t tu Ω = .
Definizione: Dicesi processo delle variabili strumentali del modello, il processo vettoriale tw
(di dimensione l ) sufficientemente rappresentativo di tΩ .
E` doveroso segnalare che non ci sono procedure standard e univoche che portano ad
individuare il processo delle variabili strumentali, e` allora fondamentale sia la conoscenza del
problema economico, sia l’esperienza; comunque di tale processo fanno certamente parte le
coordinate di (che si ritengono) esogene (la motivazione di quest’ultima affermazione e`
rinviata). Va comunque segnalato, anche se raramente ha una effettiva utilita`, che se ogni
sua trasformazione non lineare e ogni suo ritardo appartengono a
tx
tx ∈Ωt
tΩ , inoltre ad appartengono i
ritardi di nel caso in cui gli errori sono non correlati.
tΩ
ty
6
7-Econometria, a.a. 2014-15
D’ora innanzi si assume che e` disponibile il processo delle variabili strumentali tw di
dimensione l (del quale naturalmente e` diponibile il processo delle osservazioni).
Definizione: Il modello si dice
a) sottoidentificato se l k< ;
b) esattamente identificato se ; l k=
c) sovraidentificato se . l k>
Nel caso a) non e` possibile costruire uno stimatore consistente di β (a meno che non si
impongano delle restrizioni sui parametri), mentre nel caso b) il metodo delle variabili strumentali,
descritto in 7-2, consente la costruzione di uno (solo) stimatore consistente di . Nel caso c),
sembra che il problema sia quello di dover scegliere opportunamente strumenti tra gli
disponibili.
β
k ( )l k>
Qui si descrive una procedura per la costruzione di uno stimatore nei modelli sovraidentificati
che, almeno in alcuni casi, e` il piu` efficiente; in 7-5 e` presentato un differente e piu` generale
approccio al metodo di stima che lascia intravedere percorsi per ulteriori generalizzazioni.
Ipotesi (sul modello e sul processo delle variabili strumentali): Sono valide le ipotesi da IV-2) a
IV-4) di 7-2, con la ovvia modifica in IV-3) dove la matrice , che ora ha dimensione wxΣ l k× , deve
avere rango (massimo) k ; qui pero` si deve richiedere che la matrice (quadrata di ordine l ) e`
invertibile.
wΣ
Descrizione della procedura. La costruzione si sviluppa in due passi il primo dei quali seleziona
un processo degli strumenti (di dimensione ). La bonta` della stima ottenuta e` verificata a
posteriori quando si mostra la sua efficienza almeno in un caso particolare. In realtà c’e` anche una
giustificazione a priori presentata brevemente nella nota in basso.
k
( )5
Primo Passo (costruzione della matrice delle osservazioni di k strumenti): Intanto sia n∈N
sufficientemente grande, si denoti con ( )n l×W la matrice delle osservazioni di (le variabili tw l
5 La osservazione 1 che chiude il paragrafo 7-2, suggerisce come scelta per il processo degli strumenti E( )t t
∗ =x x wt ,
per la quale pero` non sono disponibili le osservazioni (non e` infatti nota la sua rappresentazione analitica come
funzione di ). Se invece tw E( )t tx w fosse lineare (in ) (in sostanza si fa questa ipotesi) allora i coefficienti
potrebbero essere stimati (in modo consistente) con il metodo dei minimi quadrati e allora la sua matrice delle
osservazioni sarebbe
tw
PWX .
7
7-Econometria, a.a. 2014-15
strumentali del modello) e sia 1
( )ˆ ( ( ) )
n kP −
×)′ ′= =WX X W W W W X ;
essa sarà utilizzata come matrice delle osservazione del processo degli strumenti nel secondo passo.
Osservazione: Ciascuna colonna di è il vettore dei valori previsti nella stima OLS della
corrispondente colonna di su . Evidentemente le colonne di che sono anche colonne di
rimangono inalterate e quindi si ritrovano in .
X
X W X
W X
Secondo Passo (stima con il metodo delle variabili strumentali): Con il metodo delle variabili
strumentali descritto in 7-2, con come matrice delle osservazione del processo degli strumenti
(dopo aver osservato che sono evidentemente soddisfatte tutte le ipotesi richieste al processo degli
strumenti), si costruisce lo stimatore di
X
β , denominato stimatore delle variabili strumentali
generalizzato, che e` denotato con il simbolo ; pertanto (vedi la proprieta` 1 in 7.2) si ha ˆGIVβ
( ) ( )1
1 1ˆ ( ) ( ( )GIV P P P P P P−
− −⎛ ⎞⎡ ⎤′ ′ ′ ′ ′ ′= = = +⎜ ⎟⎢ ⎥⎣ ⎦⎝ ⎠W W W W W Wβ X X X y X X X y β X X X u)
W
.
Si osservi che la matrice (per sufficientemente grande) e` invertibile in quanto le matrici
e sono entrambe di rango massimo .
P′ WX X n
′X W ′W X k
Osservazione: Essendo e P P P=W W P P′=W W
id
, dalla precedente rappresentazione di segue
immediatamente che esso si ottiene anche come stima OLS dal modello di regressione
ˆGIVβ
P res= +Wy Xβ .
La procedura che ha portato alla costruzione dello stimatore , giustifica la terminologia
ormai di uso comune, introdotta nella seguente
ˆGIVβ
Definizione: Lo stimatore dicesi Stimatore dei Minimi Quadrati a Due Stadi (brevemente
2SLS o TSLS) ed e` denotato piu` frequentemente con il simbolo .
ˆGIVβ
2ˆ
SLSβ
Osservazione: Se e` l si ha . E` sufficiente osservare che nella rappresentazione di
le matrici e
k= 2ˆ ˆ
SLS IV=β β
2ˆ
SLSβ ′W X ′X W sono (quadrate e) invertibili.
Proprietà dello Stimatore : Sono le stesse proprietà elencate in 7-2 per lo stimatore , si
deve soltanto tener presente che il processo degli strumenti ora e` la cui matrice delle
osservazioni e` o se si vuole definita da , con
2ˆ
SLSβ ˆIVβ
ˆ tx
( )( )1ˆ P −′ ′= = =WX X W W W W X WJW ˆ t t′= Wx J w
8
7-Econometria, a.a. 2014-15
( ) 1
( )l k
−
×
′=WJ W W W′X . In particolare si ha (si omette l’indice ) 2SLS
• ˆ ˆ( ) ( ,Avar(d
n N− →β β 0 β)) con ( ) ( )1 1ˆ ˆ
ˆ ˆAvar( ) Avar( )u− −′= xx xxβ Σ x Σ ;
• ( ) ( )1 1
ˆ ˆˆ ˆAvar( ) Avar( )u
− −′= xx xxβ Σ x Σ , 2
1
1ˆ ˆ ˆAvar( )n
t t tt
u un =
ˆ′= ∑x x x , ˆ1
1 ˆn
t tt
Pn n=
′⎛ ⎞′= =⎜ ⎟⎝ ⎠
∑ Wxx
X XΣ x x
2
;
• Se gli errori sono omoschedastici (cioè 2E( | )t tu σΩ = ), essendo ˆ ˆPn′
= =Wxx x
X XΣ Σ si ha
( ) ( )11 1
2 2ˆ ˆ ˆ
ˆ ˆ ˆAvar( ) Pn
σ σ−
− − ′⎛ ⎞⎛ ⎞′= =⎜ ⎟ ⎜ ⎟⎝ ⎠ ⎝ ⎠W
xx x xxX Xβ Σ Σ Σ .
Nella seguente proposizione si trova una giustificazione (a posteriori) della scelta del processo
degli strumenti per la costruzione dello stimatore di β .
Proposizione: Fermo restando le ipotesi che consentono la costruzione dello stimatore 2SLS, si
assume ulteriormente 2E( | )t tu 2σΩ = , (omoschedasticità condizionata degli errori). Allora lo
stimatore è efficiente nella classe degli stimatori costruiti con il metodo delle variabili
strumentali, il cui processo ( dimensionale) degli strumenti è combinazione lineare del processo
( dimensionale) delle variabili strumentali.
2ˆ
SLSβ
k
l ( )6
Dimostrazione. Si segnala che la prova e` del tutto simile a quella che mostra che la stima OLS, in
presenza di omoschedasticita`, e` la piu` efficiente (asintoticamente) nella classe degli stimatori con
il metodo dei momenti (cfr. 3-8).
Le stime della varianza asintotica degli stimatori e sono rispettivamente ( )ˆ ( )IV tJβ w 2
ˆSLSβ
( ) ( )( ) ( ) ( )
1 11 12 2ˆ ˆ
n n nσ σ
− −− − ′ ′ ′ ′ ′⎛ ⎞ ⎛ ⎞⎛′ = ⎜ ⎟ ⎜ ⎟⎜
⎝ ⎠ ⎝ ⎠⎝J J Jw x w w x
J W X J W WJ X WJΣ Σ Σ ⎞⎟⎠
e
6 Più precisamente: ha la minima varianza asintotica tra (tutti) gli stimatori costruiti con il metodo delle variabili strumentali, che utilizzano come processo degli strumenti, processi che sono combinazione lineare del processo
2ˆ
SLSβ
tw ,
cioè processi del tipo ( ) ( )t ′=Jw J w t , con matrice ( , , )t t ty=J J w x l k× (che dipende da ) tale che 1, ,( , , )t t t ty =w x … n
( )tJw sia un processo ( k -dimensionale) di strumenti (verificanti cioè le condizioni da IV-2 a IV-5) di 7-2. Cio` accade
per esempio se sono verificate le seguenti due condizioni:
i) ( ) ( )
1
1limn
t tn tp
n n→∞=
′ ′⎡ ′=⎢⎣ ⎦
∑ J JJ W WJ w w ⎤⎥ esiste ed è non singolare ;
ii) Esiste il limite in probabilità di ( ) (e quindi nJn′ ′J W u converge a 0 , essendo convergente a 0 la sequenza
n′W u ).
9
7-Econometria, a.a. 2014-15
1 12 2ˆ ˆP P P P
n n n nσ σ
− −′ ′ ′ ′⎛ ⎞ ⎛ ⎞⎛ ⎞ ⎛ ⎞=⎜ ⎟ ⎜ ⎟⎜ ⎟ ⎜ ⎟⎝ ⎠ ⎝ ⎠⎝ ⎠ ⎝ ⎠
W W W WX X X X X X X X 1−
,
allora l’asserto sarà provato (passando al limite in probabilità per ), se si prova che n →∞
( ) ( ) ( )( )1 1P − −′ ′ ′ ′ ′ ′≤WX X J W X J W WJ X WJ 1−
o equivalentemente (vedi l’ultimo punto in prop. 1 di 2-3)
( )( ) ( ) ( )( ) ( ) ( )( )( )
1
0
P
P P P P
−′ ′ ′ ′ ′ ′≤
′ ′ ′⇔ ≤ ⇔ ≤ −
W
WJ W W WJ
X WJ J W WJ J W X X X
X X X X X X.
La validità dell’ultima disuguaglianza (cioè che la matrice ( )P P′ −W WJX X
J
)
è semidefinita
positiva), segue dalle seguenti proprietà:
i) è una proiezione; P P−W W
Infatti si osserva dapprima che evidentemente si ha , donde ( ) (⊂WJ WS S P P P=W WJ WJ e
considerando la trasposizione , pertanto P P P=WJ W WJ
( )( )P P P P P P P P P P P P− − = − − + = −W WJ W WJ W WJ W W WJ WJ W WJ
J
)X
ii) La proiezione è ortogonale; P P−W W
segue dalla sua simmetria.
iii) La matrice è semidefinita positiva; (P P′ −W WJX
Infatti per ogni si ha k∈λ R
( ) ( ) ( ) ( ) 0P P P P P P P P′′ ′ ′ ′− = − − = −W WJ W WJ W WJ W WJλ X Xλ λ X Xλ Xλ ≥ .
Osservazione:
• La stima della varianza asintotica dello stimatore 2SLS (sia in presenza di errori
omoschedastici che eteroschedastici) utilizza il processo dei residui 2ˆ
t t SLSy ′− x β , che vanno
calcolati al termine della procedura di stima (essi sono evidentemente diversi dai residui ottenuti
dalle due procedure OLS utilizzate per la costruzione di ). 2ˆ
SLSβ
• Lo stimatore minimizza la funzione obiettivo 2ˆ
SLSβ
[ ] [ ] [ ]1( ) ( ) ( ) ( ) ( )Q P −⎛ ⎞′′ ′ ′ ′= − − = − −⎜ ⎟⎝ ⎠Wβ y Xβ y Xβ W y Xβ W W W y Xβ .
Infatti si ha
[ ]( ) ( )Q P P P∂ ′ ′ ′= ⇔ − = ⇔ =∂ W Wβ 0 y Xβ X 0 X Wy X Xββ
10
7-Econometria, a.a. 2014-15
e quindi è (l’unico) punto stazionario di (funzione quadratica che ha certamente un
punto di minimo).
2ˆ
SLSβ ( )Q β
• Se il processo delle variabili strumentali ha dimensione (dunque il processo e` esattamente
identificato) allora
k
( )2ˆ ˆ
SLS IV=β β annulla la funzione obiettivo.
Infatti, dalla definizione di , si ha ˆIVβ ˆ( )IV′ − =W y Xβ 0 .
top
7-4 Test sulle ipotesi: Il modello IVGNR
L’asintotica normalità dello stimatore 2SLS (indipendentemente dalle eventuali ipotesi sugli
errori), consente di costruire test su ipotesi (lineari o nonlineari) sui parametri del modello mediante
la statistica di Wald, che comunque presenta difficolta` di tipo numerico per il suo calcolo.
Nel caso di ipotesi lineari la costruzione dei test presenta minori difficolta` di tipo numerico,
come appare chiaramente nella procedura che si passa a descrivere.
Proposizione: Il modello di regressione ausiliario di Gauss-Newton (cfr. 4-4 per la definizione, le
notazioni ed alcuni dettagli) per il modello lineare t ty tu′= +x β , con le variabili strumentali ed
errori omoschedastici denominato modello IVGNR, ha la seguente rappresentazione
tw
P− = +Wy Xβ Xb error .
Dimostrazione: Considerata la funzione obiettivo ( ) ( ) ' ( )Q P= − −Wβ y Xβ y Xβ , il suo gradiente
( )( ) 2 ( )Q P∂ ′= = − −′∂ Wβg β X y Xββ
e la sua matrice hessiana 2 ( )( ) 2Q P∂ ′= =
′∂ ∂ WβH β X X
β β, la sequenza
minimizzante si ottiene con una procedura ricorsiva da 11 ( ) ( )j j jP P−+ ′ ′= + −W Wβ β X X X y Xβ . Il
termine che aggiorna la sequenza e` evidentemente la stima OLS di b nel modello lineare
e dunque l’asserto. j P res− = +Wy Xβ Xb id
)0
Osservazione: Essendo la funzione obiettivo quadratica, il punto di minimo (o equivalentemente il
punto stazionario) si ottiene fissando arbitrariamente ed effettuando un solo passo; in tal modo si
ottiene sia la stima e sia la stima della sua varianza asintotica (in presenza di
eteroschedasticita` si deve considerare lo stimatore di White).
0β
(2 1 0ˆ ˆ
SLS = = +β β β b
Il test IVGNR per l’ipotesi 0 2:H =β 0 (essendo 1 2
1 2[k k
]′ ′ ′=β β β ) – Si trascrive il modello
originario e quello ridotto con i corrispondenti modelli IVGNR.
Importante: Il processo delle variabili strumentali deve essere lo stesso per i due modelli e sia W
11
7-Econometria, a.a. 2014-15
la matrice delle osservazioni.
Modello non ridotto (U): ; 1 1 2 2= + +y X β X β u
Modello IVGNR (U): 1 1 2 2 1 1 2 2P P− − = + +W Wy X β X β X b X b resid
Modello ridotto (R): ; 1 1= +y X β u
Modello IVGNR (R): 1 1 1 1P− = +Wy X β X b resid
Si considera lo stimatore 2SLS di dal modello ridotto, sia 1β 1β ( )1 1= −u y X β il vettore dei
residui (dal punto di vista teorico puo` essere un qualunque elemento di in quanto il punto
di minimo e` raggiunto in un solo passo con qualunque valore iniziale) e il modello IVGNR del
modello non ristretto calcolato per , cioè
1β 1kR
1( , )=β β 0 ( ) 1 1 1 1 2 2P P= − = + +W Wu y X β X b X b resid ;
allora l’ipotesi è equivalente 0H 0 2:H ′ =b 0 e un test su quest’ultima ipotesi si costruisce
immediatamente (avendo cura di tener conto della eventuale presenza dell’eteroschedasticita`).
Il test in presenza di errori omoschedastici: In questo caso, come si potra` notare, nella
costruzione del test (di Wald ed LM) si utilizzano soltanto le stime OLS di opportuni modelli
lineari.
a) Il test LM: Si considera il coefficiente di determinazione 2R nella stima del modello
e si confronta con 1 1 1 1 2 2P P− = + +W Wy X β X b X b resid 2nR2
2,1k αχ − .
b) Il test di Wald: Intanto la statistica di Wald ( per l’ipotesi
coincide con essendo
)W ( )0 2 0 2: :H H′ = ⇔ =b 0 β 0
2k F [ ] 2//
SSR SSR kF
SSR n−
=R U
U e (risp. ) e` la somma dei quadrati
dei residui del modello IVGNR(U) (risp. IVGNR(R)), inoltre si ha
SSRU SSRR
• , differenza dei valori minimi delle funzione obiettivo del
modello R (risp. ) (cfr. (8.63) in Davidson-Mac Kinnon);
1 2ˆ( ) ( )SLSSSR SSR Q Q− = −R U β β
U
• Una stima consistente della varianza 2σ (che potra` sostituire senza alterare le
proprieta` asintotiche dello stimatore) si ottiene dalla stima 2SLS del modello originario;
/SSR nU
• I valori minimi delle due funzione obiettivo, quando non forniti dal software, si calcolano
facilmente considerando la somma dei quadrati dei valori previsti nei modelli di regressione
ausiliari ˆ− = +y Xβ Wγ resid (risp. ).1− = +y Xβ Wγ resid ( )7
top
)7 Infatti, per il primo modello, il vettore dei valori previsti e` 1 ˆ( ) (−′ ′ −W W W W y Xβ e allora la somma dei quadrati delle sue coordinate e` ( )1 1
2ˆ ˆ ˆ( ) ( ) ( ) ( ) ( ) ( ) ( SLSP Q− −′ ′ ′ ′ ′ ′− − = − Wy Xβ W W W W W W W W y Xβ y Xβ y Xβ βˆ ˆ )− = .
12
7-Econometria, a.a. 2014-15
7-5 Il test di Sargan sulle restrizioni di sovraidentificazione
Una difficoltà che si presenta nella stima di modelli con variabili endogene tra le variabili
indipendenti, e` quella di individuare validi strumenti (cioe` il processo delle variabili strumentali), i
quali come e` ben noto devono essere ortogonali (non correlati) agli errori e devono essere
sufficientemente correlati con le variabili endogene.
Non ci sarebbe alcun problema nel costruire un test sulla assenza di correlazione tra gli
strumenti e gli errori, se fossero disponibili le osservazioni degli errori. La usuale strategia di
utilizzare i residui, costruiti con uno stimatore consistente, come osservazioni degli errori non e`
praticabile nei modelli esattamente identificati, in quanto le condizioni di ortogonalità (i gradi di
liberta`) sono tutte necessarie per la costruzione dello stimatore e quindi dei residui.
k
Nei modelli sovraidentificati delle condizioni di ortogonalità presenti, soltanto k sono
necessarie per stimare il modello, e allora le rimanenti l
l
k− condizioni potranno essere utilizzate
(come sara` mostrato) per testare la validità delle condizioni di ortogonalità.
Sia con E( , t ty u′= +x β t | ) 0t tu Ω = 1,t = … un modello econometrico correttamente specificato
e sovraidentificato (sia tw il processo delle variabili strumentali ),
con le usuali ipotesi sul processo
(dim( ) ) dim( ))t tl k= > =w x
, ,t t ty x w . Soltanto per ragioni di semplicita` inizialmente si
assume che gli errori siano omoschedastici e dunque che 2E( | )t tu 2σΩ = per ogni t .
Definizione: Il numero intero dicesi grado di sovraidentificazione del modello. l k−
Osservazione: Nel processo di stima 2SLS si utilizzano le variabili strumentali la cui matrice
delle osservazioni è . Sia una matrice
k
PWX ∗W (n l k)× − ortogonale a (di dimensione PWX n k× )
tale che e si denoti con ( ) ( , )P ∗= WW XS S W t∗w il processo che ha come matrice delle
osservazione
∗W
( )8 . La restrizione di sovraidentificazione diventa allora . ( )E( | ) 0 E( )t t t tu u∗ ∗= ⇒ =w w 0
L’ipotesi di sovraidentificazione, sulla quale si vuole costruire il test, puo` essere formulata nel
modo seguente:
a)
( ) 0
1
: le componenti di sono tutte esogene : componenti di sono endogene
t
t
HH j l k
⎧⎪⎨ ≤ −⎪⎩
ww
,
o in forma più debole
( )8 E` importante segnalare che, come si potra` osservare nel seguito, la rappresentazione della matrice non sara` utilizzata.
∗W
13
7-Econometria, a.a. 2014-15
b) ( )0
1
: E( ) E( ): E( )
t t t t
t t
H u uH u
∗
∗
⎧ = ⇔ =⎨
≠⎩
w 0 ww 0
0.
Costruzione della statistica di Sargan:
Osservazione: Se fossero disponibili le osservazioni di t∗w e di , la statistica “ distanza (pesata)
da del parametro empirico
tu
0 ( )1 *
1
1 ( )n
t tt
u nn
∗ −
=
′=∑w W E( )t tu∗wu di ” consentirebbe di costruire un
test, pero` la costruzione della matrice delle osservazioni di t∗w e` abbastanza costosa
numericamente, mentre le osservazioni sugli errori non sono disponibili. Il primo inconveniente si
supera facilmente utilizzando al posto di tw t∗w (vedi l’equivalenza in b) per l’ipotesi ), mentre
il secondo inconveniente si supera, in modo ormai standard, sostituendo gli errori con i residui.
0H
Si considera la statistica
( ) ( )1
1 2 1 22 2
ˆˆ ˆ ( )ˆ ˆ ˆˆ ˆ
n SLSP Qn n n nn
σσ σ
−− − ⎛ ⎞′′⎛ ⎞′′ ′ = =⎜ ⎟⎜ ⎟ ⎜ ⎟⎝ ⎠ ⎝ ⎠
Wu u βW WW u W u
denominata statistica di Sargan.
Proposizione: La statistica di Sargan, nell’ipotesi , converge in distribuzione verso una 0H 2l kχ − .
Dimostrazione: Essendo 2
1
1 ( , )n d
t tt
n u Nn n
σ=
′⎡ ⎤⎛ ⎞=⎜ ⎟⎢ ⎥⎝ ⎠⎣ ⎦→∑ w
W uw 0 Σ e 2ˆp
nσ
′ → wW W Σ2σ (il vettore
ha dimensione l ) si ha tw
( ) ( )1
1 2 1ˆd
ln n n nn
σ 2χ−
− −′⎛ ⎞′⎜ ⎟⎝ ⎠
→W WWu Wu ;
inoltre, poiche` i residui sono stati costruiti utilizzando la stima consistente di un parametro
vettoriale di dimensione , si ha k
( ) ( )1
1 2 1ˆ ˆ ˆd
l kn n n nn
σ 2χ−
− −−
′⎛ ⎞′⎜ ⎟⎝ ⎠
→W WWu Wu .
Gli argomenti che giustificano l’ultima affermazione non sono stati riportati perché sono
essenzialmente di natura tecnica, comunque una prova indiretta è data in ii) della osservazione che
segue. La stessa procedura e` stata utilizzata in 7-7 per individuare la distribuzione asintotica della
statistica di Hansen.
Il test di Sargan (con livello di significatività α ):
“Si rifiuta l’ipotesi se 0H 2 22 ,
ˆ ˆ( ) /n SLS l kQ 1 ασ χ − −>β ”.
14
7-Econometria, a.a. 2014-15
Osservazione:
i) La procedura ora descritta è valida anche in ipotesi di eteroschedasticità, con la sola variante di
dover utilizzare lo stimatore di White per la stima della varianza asintotica, 2E( )u t tu t′=wΣ w w , di
1
1 n
t tt
un =∑w . Naturalmente in tal caso non sara` piu valida la rappresentazione della statistica di
Sargan mediante la funzione obiettivo.
ii) La statistica di Sargan (in ipotesi di omoschedasticita`) coincide con la statistica utilizzata nella
verifica della ipotesi
c) 0*
1
: , E( | ) 0 : , E( | ) 0
t t t t t
t t t t t t
H y u uH y u u
′= + =⎧⎨ ′= + + =⎩
x β wx β w γ w
che si puo` scrivere anche nella forma
d) 0
1
::
HH
=⎧⎨ ≠⎩
γ 0γ 0
per il modello * , E( | ) 0t t t t t ty u u′= + + =x β w γ w ;
(ricordare che il test su ques’ultima ipotesi, se gli errori sono omoschedastici, utilizza la statistica
differenza dei valori minimi delle funzioni obiettivo del modello ridotto e di quello non ridotto
diviso per la stima della varianza; vedi l’ultima osservazione in 7.4). Infatti il modello t t t ty u∗′= + +x β w γ , nell`ipotesi E( | ) 0t tu =w , è esattamente identificato ( )9 e
dunque il valore della corrispondente funzione obiettivo nella stima IV è 0,( )10 mentre il valore della
funzione obiettivo per il modello ridotto è . 2ˆ( )n SLSQ β
iii) La statistica di Sargan coincide con il parametro [ ]( )2 /nR n ESS TSS= del modello
(come al solito ˆ = +u Wb error 2c2R R= quando nel modello e` presente l’intercetta).
La prova è immediata non appena si costruisce il test con il modello IVGNR per l’ipotesi
. 0 :H =γ 0
iv) Vari autori suggeriscono di realizzare sempre il precedente test, in presenza di
sovraidentificazione. Segnalano anche un usuale errore nella interpretazione dell’esito del test; più
precisamente, il rifiuto dell’ipotesi nulla (rifiuto della restrizione di sovraidentificazione) può avere
origine da una delle seguenti situazioni (che sono rispettivamente l’interpretazione dell’ipotesi
nelle precedenti due ipotesi statistiche b) e d) che portano alla costruzione del test di Sargan):
1H
− Il modello è correttamente specificato, ma alcuni strumenti sono correlati con gli errori e quindi
( ) 9 Il numero delle variabili endogene presenti nel modello è uguale al numero delle variabili strumentali.
( )10 In questo caso è noto il valore della funzione obiettivo, ma non quello della stima in quanto le osservazioni per t∗w
non sono disponibili.
15
7-Econometria, a.a. 2014-15
non sono validi strumenti (decisione che si tende a privilegiare);
− Il modello non è correttamente specificato e alcune variabili, utilizzate come strumenti, sono in
realtà dei regressori e pertanto andrebbero inserite nell’equazione (decisione che si tende a non
prendere in considerazione).
top
7-6 Il test di Durbin-Wu-Hausman (sulla presenza di variabili endogene tra i regressori)
I metodi descritti finora in questo capitolo sono utili (e necessari) in presenza di variabili
endogene tra le variabili indipendenti, ma se così non dovesse essere essi non solo sono inutili ma in
un certo senso sono anche dannosi. E` evidente allora l’importanza di poter disporre di opportuni
test (uno sara` costruito in questo paragrafo) quando si nutrano dubbi sull’effettiva endogeneità di
alcune variabili indipendenti del modello.
E` assegnato il modello lineare t ty ut′= +x β con E( | ) 0t tu Ω = , , assogettato alle
seguenti ipotesi
1,t = …
• 2E( | )t tu 2σΩ = (omoschedasticita` degli errori);
• il processo tw delle variabili strumentali ha dimensione ( dim tl k≥ = x ) ) (e non coincide
con tx );
• per il processo , ,t t ty x w valgono le usuali ipotesi che assicurano la validita` delle proprietà`
asintotiche degli stimatori;
e si considera l’ipotesi statistica:
0
1
: , E( | : , E( |
t t t t t
t t t t t
H y u uH y u u
′ ) 0) 0
= + =⎧⎨ ′= + =⎩
x β xx β w
.
Osservazione:
i) Se (tutti) i regressori sono validi strumenti, lo stimtore OLS e` (asintoticamente) il piu`
efficiente nella classe degli stimatori ( n − consistenti) costruiti con il metodo dei momenti, e a tale
classe appartiene evidentemente lo stimatore 2SLS;
ii) Se tra i regressori c’è qualche variabile endogena, allora la stima 2SLS è n − consistente,
mentre la stima OLS non è consistente;
iii) Dalle precedenti due osservazioni e dal principio di Hausmann (cfr. nota 5 in 6-5) segue
. 2 2ˆ ˆ ˆ ˆvar( ) var( ) var( )SLS OLS SLS OLS− = −β β β β
Al fine di costruire un test sulla precedente ipotesi, le proprietà i) e ii) suggeriscono di utilizzare
come statistica la distanza pesata tra i due stimatori, la cui distribuzione asintotica potra` essere
16
7-Econometria, a.a. 2014-15
individuata data la validita` di iii).
Si considera allora la statistica di Hausman
( ) ( )1
2 2 2ˆ ˆ ˆ ˆ ˆ ˆvar( ) var( )SLS OLS SLS OLS SLS OLSH
− ′⎡ ⎤= − − −⎢ ⎥⎣ ⎦β β β β β β
e per essa si puo` dimostrare che (nell’ipotesi , e quindi nell’ipotesi che tutte le coordinate di
sono esogene) converge in distribuzione (come è naturale) verso una chi-quadro, ma i suoi gradi
di libertà (e qui c’è un elemento di soggettività) sono pari al numero di variabili che non sono
certamente esogene.
0H
tx
Osservazione:
• Per eliminare l’elemento di soggettività nella formulazione del test, alcuni autori
suggeriscono di considerare, nella costruzione della statistica H , soltanto le componenti degli
stimatori dei parametri relativi alle variabili delle quali non si è certi della effettiva esogeneità.
• Non e` difficile provare che il test di Hausman, nella formulazione suggerita dalla precedente
osservazione, è identico al test di Durbin-Wu che ora si passa a descrivere (vedi Davidson-
MacKinnon, Econometric Theory and Method, pag. 338).
Si considera la decomposizione [ ]=X Z Y , essendo la matrice delle osservazioni delle
variabili certamente esogene e la matrice delle osservazioni dei rimanenti repressori, e si
verifica l’ipotesi
Z
Y
0
1
::
HH
=⎧⎨ ≠⎩
δ 0δ 0
per il modello ausiliario
P= + +Wy Xβ Yδ resid (o equivalentemente M= + +Wy Xβ Yδ resid ). top
7-7 Il Metodo dei Momenti Generalizzato (GMM): una breve introduzione
La seguente ovvia osservazione suggerisce un percorso alternativo a quello presentato in 7-2 per
costruire uno stimatore di , che come si potra` notare e` molto piu` generale e puo` essere
utilizzato in contesti molto diversi da quelli fin qui presi in esame (cfr. nota 1 in 4-1).
β
Osservazione: Lo stimatore (delle variabili strumentali) costruito in 7-1, minimizza la distanza
da di
ˆIVβ
01
1 (n
t t tt
yn =
′−∑w x β) , per qualunque funzione distanza in , (in particolare per le distanze
definite da una matrice simmetrica definita positiva) in quanto e` uno zero di
kR
1
1 ( )n
t t tt
yn =
′−∑w x β .
Il modello, le notazioni e lo stimatore GMM: E` assegnato il modello
17
7-Econometria, a.a. 2014-15
t ty ut′= +x β con E( | ) 0t tu Ω =
e sia ( ) t t∈Ωw il processo delle variabili strumentali di dimensione (dunque il modello e`
sovraidentificato).
l k>
Si pone ( , , ) ( )t t t t ty ′= −g x w β w x β e 1
1( ) ( , , )n
n ttn =
= ∑g β tg x w β per ogni e si osserva che n
[ ]1
( )
( ) 1 nn
t tt
l kn n=
×
∂ ′⎛ ⎞′= − = −⎜ ⎟∂ ⎝ ⎠∑
g β W Xw xβ
.
Sia ( )( )ˆ n
nΩ una sequenza di matrici simmetriche definite positive di ordine l , con che
dipende eventualmente da
( )ˆ nΩ
1, ,, ,t t t t
y=
x w … n e posto ( )ˆ ˆ n=Ω Ω , si considera il funzionale (funzione
obiettivo)
[ ] [ ]ˆ ˆ( , ) ( ) ( )n nJ n ′=β Ω g β Ω g βn .
Definizione: Se la funzione ha un unico punto di minimo, ˆ( , )nJ β Ω ( )ˆ ˆ( ) k∈β Ω R , allora esso dicesi
stima GMM di β relativa alla matrice . Ω
Osservazione:
• (per un fissato ) esiste se e soltanto se ha un unico punto stazionario; ˆ ˆ( )β Ω n ˆ( , )nJ β Ω
• 1 1
ˆ( , ) 1 1ˆ ( )n n
t t t t tt t
Jy
n n= =
⎡ ⎤ ′∂ ⎡ ⎤ ⎡ ⎤⎣ ⎦ ′ ′= ⇔ − =⎢ ⎥ ⎢ ⎥∂ ⎣ ⎦ ⎣ ⎦∑ ∑
β Ω0 w x Ω w x β 0
β
1 1 1 1
1 1 1 1ˆ ˆn n n n
t t t t t t t tt t t t
yn n n n= = = =
′ ′⎡ ⎤ ⎡ ⎤ ⎡ ⎤ ⎡′ ′⇔ =⎢ ⎥ ⎢ ⎥ ⎢ ⎥ ⎢⎣ ⎦ ⎣ ⎦ ⎣ ⎦ ⎣ ⎦∑ ∑ ∑ ∑w x Ω w w x Ω w x β⎤′ ⎥ .
• Dai precedenti due punti segue la rappresentazione di , quando esiste, e la condizione per
la sua esistenza:
ˆ ˆ( )β Ω
1
1 1 1 1
1 1 1 1ˆ ˆ ˆ ˆ( )n n n n
t t t t t t t tt t t t
yn n n n
−
= = = =
⎛ ⎞ ⎛ ⎞′ ′⎡ ⎤ ⎡ ⎤ ⎡ ⎤ ⎡⎜ ⎟ ⎜ ⎟′ ′ ′= ⎢ ⎥ ⎢ ⎥ ⎢ ⎥ ⎢⎜ ⎟ ⎜ ⎟⎣ ⎦ ⎣ ⎦ ⎣ ⎦ ⎣⎝ ⎠ ⎝ ⎠∑ ∑ ∑ ∑β Ω w x Ω w x w x Ω w ⎤
⎥⎦
( ) ( ) ( ) ( )
1
1 1 1 1
1
1 1 1 1ˆ ˆ
ˆ ˆ
n n n n
t t t t t t t tt t t t
un n n n
−
= = = =
−
⎛ ⎞ ⎛′ ′ ⎞⎡ ⎤ ⎡ ⎤ ⎡ ⎤ ⎡ ⎤⎜ ⎟ ⎜′ ′ ′= + ⎟⎢ ⎥ ⎢ ⎥ ⎢ ⎥ ⎢ ⎥⎜ ⎟ ⎜ ⎟⎣ ⎦ ⎣ ⎦ ⎣ ⎦ ⎣ ⎦⎝ ⎠ ⎝
⎡ ⎤′ ′′ ′ ′ ′= + ⎢ ⎥⎣ ⎦
∑ ∑ ∑ ∑β w x Ω w x w x Ω w
β W X Ω W X W X Ω W u
⎠
Ipotesi: Le ipotesi sui processi (da G1 a G3) sono simili a quelle gia` formulate quando sono stati
18
7-Econometria, a.a. 2014-15
introdotti gli altri metodi di stima in questo capitolo, comunque qui sono riportate per completezza.
G1 – Il processo , ,t t tyx w e` stazionario ed ergodico;
G2 – (Condizione di identificabilita`) La matrice ( )E( )t t′ = wxw x Σ di ordine ha rango
massimo (e quindi come gia` osservato nella nota 1 in 7-2) le matrici
l k×
k ( )E( )t t′=wΣ w w e
sono non singolari); ( E( )t t′=xΣ x x )
G3 – Il processo t tuw e` una differenza maringala e ( )2E( )t t t uu ′ = ww w Σ e` non singolare (e
dunque per il teorema del limite centrale 1
1 ( , )n d
t t ut
n u Nn =
→∑ ww 0 Σ );
G4 – La sequenza ( )( )ˆ n
nΩ converge in probabilità a una matrice Ω (quadrata di ordine )
invertibile.
l
Proprietà dello stimatore : Dalla sua rappresentazione si ottiene immediatamente (gli
argomenti sono del tutto simili a quelli utilizzati precedentemente in varie circostanze)
ˆ ˆ( )β Ω
1) e` consistente; ˆ ˆ( )β Ω
2) ( )ˆ ˆ ˆ ˆ( ) ( ,Avar( ( )))d
n N− →β Ω β 0 β Ω con
[ ] [ ]1 1ˆ ˆAvar( ( )) u− −′ ′ ′= wx wx wx w wx wx wxβ Ω Σ ΩΣ Σ ΩΣ ΩΣ Σ ΩΣ ,
per la quale una stima consistente e` immediatamente disponibile non appena si costruisce una
stima consistente per . 2E( )u t tu ′=wΣ w wt
Osservazione:
1) Dalla rappresentazione di , con argomenti del tutto simili a quelli adoperati in 3-8,
segue che essa (come funzione di ) e` minimizzata per
ˆ ˆAvar( ( ))β Ω
Ω 1u−= wΩ Σ e il valore minimo e`
, pertanto la costruzione di una stima consistente per ha un ruolo fondamentale
(oltre a quello gia` segnalato) anche nella costruzione di un buon stimatore che e` denominato
stimatore GMM efficiente.
11u
−−′⎡⎣ wx w wxΣ Σ Σ ⎤⎦ uwΣ
2) Considerate le due sequenze ( )( )ˆ n
nΩ con ( )ˆ n
lI≡Ω e (1
( ) 1ˆ ˆn
n
−−′⎛ ⎞= =⎜ ⎟
⎝ ⎠w
W WΩ )Σ rispettivamente
convergono a lI e e pertanto i corrispondenti stimatori sono entrambi 1−wΣ ˆ ˆ( )β Ω -consistentin
inoltre si ha . ( )1 12
ˆ ˆˆ( ) ( ) SLSP P− −′ ′= =w W Wβ Σ X X X y β
19
7-Econometria, a.a. 2014-15
Costruzione di una stima consistente di 2E( )u t tu t′=wΣ w w ) e dello stimatore GMM efficiente. Si
esaminano i seguenti due casi:
Caso a) – Gli errori del modello sono eteroschedastici;
Caso b) – Gli errori sono omoschedastici ( 2E( )t tu σΩ = ).
Caso a) – Sia un fissato intero, si considera (uno dei due stimatori costruiti nel punto 2)
della precedente osservazione) e si costruiscono i residui . Con argomenti ormai
standard (cfr. per esempio 3-4) si prova che ( )
n ( )ˆ ˆ( nβ Ω )
)ˆ ˆˆ ( nt t tu y ′= − x β Ω
2
1
1ˆ ˆn
u tt
un =
t t′= ∑wΣ w w e` una stima consistente di .
Lo stimatore GMM efficiente e` allora .
uwΣ
1ˆ ˆ( )u−wβ Σ
Caso b) – Ora si ha ( )2 2E( ) E( )u t t t t tu σ′ ′= = =w wΣ w w w w Σ2σ e si vede immediatamente che
( )1 12
ˆ ˆ ˆˆ ˆ( ) ( )u S− −= =w wβ Σ β Σ β LS .
A questo punto e` irrilevante rappresentare la stima consistente di , che peraltro si scrive
immediatamente, ma si osserva che (in presenza di omoschedasticita`) si ha
2σ wΣ
12
2ˆ ˆAvar( )SLS
Pn
σ−′⎛ ⎞= ⎜ ⎟
⎝ ⎠WX Xβ e 2 2
21
1 ˆˆ ( )n
t t SLSt
yn
σ=
′= −∑ x β .
Osservazione:
1) In questo paragrafo non si e` fatto alcun cenno al caso in cui nel processo t tuw e` presente
l’autocorrelazione. In realtà in questo caso non c’e` alcuna difficoltà aggiuntiva, si dovra`
semplicemente sostituire con e stimare quest’ultimo in modo consistente per
esempio con lo stimatore di Newey-West (o HAC).
uwΣ Avar( )uw
2) I software econometrici nel caso a) utilizzano una procedura ricorsiva; qui e` stato descritto
soltanto il primo passo; nel secondo passo si utilizza (al posto di e così via. 1ˆ ˆ( u−wβ Σ ) )( )ˆ ˆ( nβ Ω
La statistica di Hansen e il test sulle restrizioni di sovraidentificazione. Essendo
• 1
1( ) ( , )n
n t tt
n n u Nn =
⎡ ⎤= →⎢ ⎥
⎣ ⎦∑ wg β w 0 Σu
l
;
• ˆp
u u→w wΣ Σ
si ha [ ] [ ]1 2ˆ( ) ( )d
n u nn χ−′ →wg β Σ g β ,
donde per il valore minimo del funzionale obiettivo (denominato statistica di Hansen) si ha
20
7-Econometria, a.a. 2014-15
( )1 1 1 1ˆ ˆ ˆˆ ˆ ˆ ˆ( ( )) ( ( )) ( ( ))d
n u n u u n u lJ n 2kχ− − − −
−′⎡ ⎤ ⎡ ⎤= ⎣ ⎦ ⎣ ⎦→w w w wβ Σ g β Σ Σ g β Σ ,
(la prova e` omessa, comunque e` opportuno osservare che in quest’ultima rappresentazione si sono
persi k gradi di liberta` pari al numero di parametri stimati (in modo consistente)).
Test di Hansen (sulle restrizioni di sovraidentificazione): Un elevato valore di , per
esempio
1ˆ ˆ( ( ))n uJ −wβ Σ
1 2,1
ˆ ˆ( ( ))n u l kJ αχ−− −>wβ Σ (per un α assegnato), deriva certamente da un eventuale errore di
specificazione, in particolare dalla non ortogonalità di qualcuno degli strumenti se si e` certi della
validità delle altre ipotesi.
l
top
7-8 Proprieta` finite degli stimatori IV: un esercizio
Sull’argomento “proprieta` finite degl stimatori IV”, comunque di grande interesse, ci sono
soltanto risultati parziali e relativamente complessi. Il seguente esempio, preso da Davidson &
MacKinnon, Econometric Theory and Methods, ha il solo scopo di lasciare intuire cosa puo`
accadere agli stimatori IV in presenza di campioni finiti (di dimensione non sufficientemente
grande).
Sia tw un processo (non e` necessaria alcuna ipotesi su di esso fin quando interessano le
proprietà` finite degli stimatori, che saranno sempre condizionate a tw ), ,t tu v un processo di
variabili indipendenti, tutte con distribuzione bivariata normale con media nulla ( ),
varianza unitaria ( ) e coefficiente di correlazione , e
indipendente dal processo, e si considera il DGP
E( ) E( ) 0t tu v= =
var( ) var( ) 1t tu v= = ( )corr( , )t tu vρ =
, ,t t ty x w per il quale
t t u
t t v
y x t
t
ux w v
β σπ σ
= +⎧⎨ = +⎩
,
e` un suo modello completamente specificato.
Problema: Fissato intero naturale e un processo delle osservazioni n 1, ,t tw
= … n, considerato lo
stimatore lo stimatore di β (al variare del parametro ] [1,1ρ ∈ − ) che ha buone proprieta`
asintotiche, individuare (alcune) sue proprieta` quando lo si considera condizionato a
(come funzione di 1( , )nw w ′=w … 1( , , )nx x ′=x … e 1( , , )ny y ′=y … ).
Soluzione: Si esaminano separatamente i casi 0ρ = e 0ρ ≠ .
Primo caso ( 0ρ = ): Il vettore e` strettamente esogeno, allora lo stimatore (efficiente) di x β e` lo
stimatore OLS (che e` indipendente da ) per il quale sussistono (tra le altre) le seguenti proprietà: w
21
7-Econometria, a.a. 2014-15
i) ( )ˆ ˆE( ) E( )β β β= ⇒ =x β ;
ii) 2 1ˆ ( ; ( ) / )uN nβ β σ −′x x x∼ ;
Secondo caso ( 0ρ ≠ ):
Osservazione:
• Si ha t tu v tρ ε= + con E( ) 0t tvε = (ovvia conseguenza della normalita` della variabile )
e dalla indipendenza delle variabili del processo segue
( , )t tu v
E( ) 0=ε v .
• Nella prima equazione la variabile tx e` endogena ( [ ] ( )E( ) E ( ) 0t t t v t t vx u w v uπ σ σ ρ= + = ≠ ) e
e` un valido strumento (e` correlata con tw tx e non correlata con ). tu
In questo caso uno stimatore di β , con buone proprieta` asintotiche, si costruisce con il metodo
delle variabili strumentali. Per non appesantire le notazioni, si pone ˆIVβ β= w e allora si ha
( ) ( )1 1uβ β σ− −′ ′ ′= = +w x w ′y w x w u
(notare che e` un vettore costante e che se moltiplicato per , la rappresentazione di w 1/ 21/( )′w w β
non cambia, pertanto si puo` si puo` assumere che 1′ =w w ), donde, utilizzando la rappresentazione
tx e , si ha tu
( ) 1 ( )( ) uu v
v
σ ρβ β σ π σ βπ σ
− ′ +′ ′= + + = +′+
w v εw w v w uw v
.
Le proprietà` statistiche dello stimatore β .
Osservazione: Intanto essendo combinazione lineare di si ha x v =β x β v , inoltre
• dalla rappresentazione di β , essendo E( ) 0=ε v , si ha
( ) ( )E ( ) E ( ) E u u
v v
za z
σ ρ σ ρβ β β βπ σ σ⎡ ⎤′⎡ ⎤− = − = =⎢ ⎥⎣ ⎦ ′+ +⎣ ⎦
w vx v vw v
avendo posto e z ′= w v / va π σ= .
• La variabile , in quanto combinazione lineare della normale multivariata (non dimenticare
che qui w e` un vettore costante di norma 1), ha distribuzione normale, inoltre si ha
e .
z v
E( ) E(′w v) 0z = = =( )var( ) var( ) 1nz I′ ′= =w v w w w
Ora se esistesse il valore atteso di β , denotata eon ( )zϕ la densita` della normale standard, si
avrebbe
22
7-Econometria, a.a. 2014-15
( )E( ) E E ( ) ( )u
v
z z dza z
σ ρβ β β β ϕσ
+∞
−∞
⎡ ⎤− = − =⎣ ⎦ +∫v ,
ma quest’ultimo integrale non esiste (osservare che z a= − e` una singolarita` del prim’ordine per
la funzione integranda), pertanto lo stimatore β non ha valore atteso.
Osservazione: Qui non ci sono informazioni sulla distribuzione di β che evidentemente non puo`
essere una di quelle note; una sua versione empirica puo` essere individuata con il metodo di Monte
Carlo in quanto il modello e` completamente specificato.
top
23