Temi: Endogeneità, variabili strumentali interne

Main Reading in addition to Main Reading in addition to Greene chapter (14.7 4th edition)Greene chapter (14.7 4th edition)

Bond, 2002, IFS wp & J of Portoguese Economics

Theoretical dynamic modelPersistent time seriesEndogeneous regressors

◦IV estimations with internal instruments

Ratio del modello dinamicoConfronto tra vari modelli dinamiciGMM: robustezza della ipotesi dinamica su

YUso IV interne Bias del modello dinamico in campioni


Some preliminary hints on dynamic modelsSome preliminary hints on dynamic models

Yit = yt-1 +xitβ + i + uit, last 2 terms are vit error term Problem: yt-1 correlated with i we estimate

inconsistent B even if u iid Violation of strict exogeneity. E(ut/yt+k) ≠0 * yt-1 is related to ut-1 etc.. The covariance of vit across

units causes violation Problem: T is often too short to get consistent

properties (Greene book) that can mitigate endogeneity induced biases

Bias of order 1/T; large sample results on N growing.. Average of n inconsistent estimator will be still

inconsistent.. Models other than LSDV are needed

We use IV estimators, same We use IV estimators, same theory, different frameworktheory, different framework

Soluzioni IV GMM  metodo IV applicato a differenze prime IV con strumenti interni, di fatto si utilizzano i ritardi della

dipendente (e delle altre covariate)

Trasformazione in DIFFERENZE PRIME + IVCon lagged Y le differenze non mi

risolvono tutti i problemi Problema / aiuto ! Il software fa tutto.. Ma occorre

conoscere la teoria

GMM is a generelized IV estimatorGMM is a generelized IV estimator

◦GMM include IV, ma anche FE e RE….modello generale, anche OLS è GMM

Tutte X endogene, Z strumenti, se X esogena X è strumento di se stessa

Biv= (Z’X)-1Z’yLo stimatore IV non ha proprietà note

in campioni finiti, è consistente ma c’è bias in campioni finiti (Greene)

Semi inconsistenza LSDV nel Semi inconsistenza LSDV nel dinamico. dinamico.

Ma si veda paper Judson e Owen 1999, Economic Letters, in panel bilanciati LSDV può ben performare anche vs GMM

Panel bilanciati spesso rari

Vari stimatori GMM dinamiciVari stimatori GMM dinamici

Anderson Hsiaoivreg d.(n w k ys) yr1977-yr1984 Arellano Bondxtabond n w k ys yr1977-yr1984,

Blundell Blond……. Vediamo teoria e poi


Anderson Hsiao estimator (oldest), si veda GreeneAnderson Hsiao estimator (oldest), si veda Greene

FirsDiff: Yit – yit-1 = (yit-1 – yit-2) + (uit – uit-1) which is y = yt-1 + u

Eliminato errore idiosincratico in ogni casoMa rimane auto correlation in errors to test..Ma abbiamo ancora correlazione e violazione

esogeneità date le relazioni tra storia di y e errore u.

IV good one could be yt-2 o yt-2 yt-3.. Iv interni si ricercano tra i ritardi Metodo meno ‘artigianale’ di IV esterni, più automatico

gestito dal software poi posso/devo strumentare anche X (nel within non posso

usare ritardi come IV, rimane endogeneità)

IV in dynamic models: which?IV in dynamic models: which?

Without group effects, there is a ‘simple’ IV estimator available

We can use differences (yit-1 – yit-2) or levels (yit-2, yit-3, etc..) as IV

One main question is whether differences or levels are better

Arellano (1989) shows levels are preferable..But others have shown that in dynamic models there

is a lot of info to be used from the relationships between levels and differences

Remember IV estimators are inefficient, pros and cons

HS IV estimatorHS IV estimator

Con Yt-1 abbiamo difatto una endogeneità indotta dalle differenze prime…

  Strumento Yt-2 o ritardo della differenza prima di Y

….non correlato con errore trasformato!!!!   Monte Carlo tests dimostrano che finite sample bias

è piccolo, anche rispetto a Arellano Bond.. MA HS ormai poco utilizzato, un solo strumento, S.E.

alti, molto impreciso…. È un modello base, storico

GMM large family that GMM large family that generalise alla modelsgeneralise alla models

IV issue is the key one

Arellano Blond estimators (90’s)Arellano Blond estimators (90’s)

One step, two step . xtabond n w k ys yr1978-yr1984, nocons twostep vce(robust) Warning: gmm two-step standard errors are biased; robust

standard errors are recommended. Instruments for differenced equation Standard: D.w D.k D.ys D.yr1978 D.yr1979 D.yr1980

D.yr1981 D.yr1982 D.yr1983 D.

One step consistente ma meno efficiente del 2 steps, SE sotto stimati

  NB Applicando un 2 step (residui dalla prima one step, implementiamo un AB 2 steps) correggiamo usano matrice varcov

New routine XTABOND2New routine XTABOND2

Xtabond2, molto usata, supera una serie di limiti: non riusciamo a escludere i ritardi secondi della dipendente, quelli remoti si, recenti no,

 stima qualunque modello panel lineare…….grazie alla sintassi…………Rudman spiega nei papers come funziona xtabond2

consente di ridurre numerosi strumenti  sintassi piu complessa (es. Includere ritardata)  tende a dare enfasi al termine Yt-1 come ***

  Xtabond2 y l.y w k x years nolevelq noco twostep robust iv(w k x years: esogeni)

gmm(l.y)  xtabond2 presenta test serial correlation e sargan tests e Hansen tests (robust, ma

debole se troppi strumenti..)

Si possono imporre meno restrizioni, se riduco esogene.

Applica BB (noleveleq applica AB invece), system GMM option

Numero IV è il problemaNumero IV è il problema

restringere numero strumenti (anni), e scegliere alcune X esogene, migliora le fit.

Scarsa evidenza dinamica in AB può dipendere da weak instruments

Abbiamo tests per weak instr.

New XTPDSYS command New XTPDSYS command

Simile a xtabond, è xtdpdsys, applica Blundell Blond   postestimation — Postestimation tools for xtdpdsys   The following postestimation commands are of special interest

after xtdpdsys: command description estat abond test for autocorrelation estat sargan Sargan test of overidentifying restrictions

Blundell Blond impongono restrizioni………..assenza di correlazione negli errore come in AB, però modellano condizione iniziale su Y

  Modello bi equazionale, una in livelli una in

differenze……   In differenze usa strumenti di AB In livelli usa strumenti in differenze prime…sono

validi strumenti se vale mean stationarity, non sono correlate con i

mean stationarity

Complexity of IV setsComplexity of IV sets

Problema da testare è l’uso di strumentiTrade off, ma parsimonia raccomandataDa gestire al margine…non facile.

GMM rationale is then higher when T is low / N high and we have endogenous regressors.

T high, we can use within and LSDV corrected (Judson and Owen , 1999, Economic letters)

If N*T large, within and LSDV can be used consistently

Only if X exogenous

GMM problem! Finite sample bias GMM problem! Finite sample bias (low N*T driven by low N)(low N*T driven by low N)

Robustezza GMMRobustezza GMM

Test ‘induttivo’◦Il B del modello GMM deve essere compreso tar

quello del modello OLS con yt-1 e del modello within con yt-1

Un Byt-1 significativo almeno al 10% giustifica uso GMM (ratio teorica deve esistere sempre)

Test di specificazione◦Hansen, sargan◦Problema di over identification ed eccessivo uso

degli strumenti. Usare parsimonia, trade off marginali da gestire

Sargan testsSargan tests

Validità (ESOGENE)◦ TESTING? Non possiamo testare tutto nel complesso, ma

controllare validità sovra identificazioni….test over identyfing restrictions…….

◦ se sono valide dovremmo avere assenza di signif diversa da 0 SARGAN TEST: se vicino non rifiutiamo hp

validità strumenti Rilevanza: strumenti buoni previsori…

estat abond   Arellano-Bond test for zero autocorrelation in first-differenced errors +-----------------------+ |Order | z Prob > z| |------+----------------| | 1 |-2.5915 0.0096 | | 2 |-.75236 0.4518 | non possiamo rifiutare HO assenza di correlazione +-----------------------+ H0: no autocorrelation

estat sargan Sargan test of overidentifying restrictions H0: overidentifying restrictions are valid   chi2(27) = 87.26388 Prob > chi2 = 0.0000, in ambito di one test sargan over rejects, quindi ci affidiamo a

ESTAT A BOND come valutazione........

In generale, uso parco degli strumenti……….

 Finite sample bias con alti strumenti,

in campioni finiti hanno un bias….GMM tendono ad avere un bias piu alto in campioni finiti con numero strumenti elevato…


System GMM System GMM

Use IV difference for levels and level IV for differences

This is the system of level and differences

Non GMM estimatorsNon GMM estimatorsEasier, more performing but limited

GMM vs Kiviet or corrected LSDVGMM vs Kiviet or corrected LSDV

Lsdvc routine in STATA applies the LSDVC corrected estimator.

Preferable when panel is balanced and exogenous regressors (rare cases)

Reference: Judson and Owen, 1999, Economic letters; G. Bruno papers

Summing upSumming up

Differenze non mi risolvono tutti problemi endogen. Nel dinamico

Uso strumenti t-2, etc.. In differenze o livelli o entrambi

Modelli within consistenti se var esogene XCon endogeneità X, non consistenti nemmeno se

N*T altoDevo usare GMM (non within tranformation) i

‘momenti’ di esogeneità rispetto alle lagged Y e X mi definiscono il set delle IV

Summing upSumming up

Da modelli storici ma limitati come Anderson Hsiao a vari Arellano Blond ai GMM SYS

Trade off: necessito strumenti ma anche di uso parco strumenti, test su numero e forza strumenti

Comparare sempre GMM con OLS e WiThinPosso usare LSDVC corretto se panel bialnciato

ed X esogene, usa HS AB BB come stimatori di base
