II. Exploiter des données à plusieurs...

Preview:

Citation preview

Claudio Araujo 29/09/2013

CERDI – Ecole d’Economie UdA 1

MicroéconométrieII. Exploiter des données à plusieurs dimensions

Modèles basiques de panel

Claudio Araujo

CERDI, Université d’Auvergne

Clermont-Ferrand, France

www.cerdi.org

http://www.cerdi.org/claudio-araujo/perso/

1. Principales caractéristiques des

données longitudinales

• Structure des données– Données ou séries temporelles (time series)

– Données en coupe transversales (cross sections)

– Données en coupe transversales regroupées (pooled cross sections)

– Données longitudinales issues d’un panel (panel data)

• Avantages et limites des données de panel– Augmentation de la taille de l’échantillon

– Double (multi) dimension : caractères individuels et temporels

– Interprétation plus fine des résultats

– Prise en compte de l’hétérogénéité inobservée

Claudio Araujo 29/09/2013

CERDI – Ecole d’Economie UdA 2

2. Modélisation des données de panel

• Modèle économétrique linéaire générale

– Comment représenter un modèle de panel ?

– Peut-on estimer ce modèle ?

– Faut-il imposer des contraintes à ce modèle ?

– Quelles options pour contrôler les effets spécifiques ?

• Régression groupée (RG)

• Modèle à effets fixes (EF)

• Modèle à effets aléatoires (EA)

• Modèle Between

3. Méthodes d’estimation

• Utilisation des moindres carrés ordinaires (MCO)

• Estimation des modèles à effets fixes

– Approche par les variables muettes (MVM)

– Approche par l’utilisation du théorème de Frisch-Waugh (within)

• Estimation des modèles à effets aléatoires

– Estimation de la matrice variance-covariance quand celle-ci est inconnue : le moindres carrés (quasi) généralisés (MCQG)

– Estimation par le maximum de vraisemblance

Claudio Araujo 29/09/2013

CERDI – Ecole d’Economie UdA 3

4. Justification et tests d’hypothèses

• Test d’absence d’effets spécifiques fixes

• Test d’absence d’effets spécifiques aléatoires

• Choix entre les effets spécifiques fixes et aléatoires

– Selon le mode de sélection de l’échantillon

– Selon les caractéristiques des variables ou le type de modèle économétrique

– Test d’Hausman

• Le problème de l’hétéroscédasticité et de l’autocorrélation en panel

• Principales notions du chapitre– Données longitudinales (panel, pooling), données en coupe

transversale, séries chronologiques

– Modèles à effets fixes et aléatoires

– Opérateurs within et between

– Estimation par la méthode de moindres carrés quasi généralisés

– Tests d’absence d’effets spécifiques

• Travaux pratiques– Calculer des opérateurs à double indice

– Estimer des modèles basique de panel

– Programmer, tester et interpreter le test d’Hausman

– Tester l’autocorrélation en panel

– Commentaire d’articles d’économie du développement, utilisant des techniques de données de panel

Microéconométrie

Claudio Araujo 29/09/2013

CERDI – Ecole d’Economie UdA 4

Textes pour discussions et/ou lecture

• Impact des conflits sur le secteur alimentaire

– Ali H. and E. Lin, 2010, “Wars, foodcost and

countervailing policies: A panel data approach”, Food

Policy, 35, pp. 378-390

• Effet des infrastructure sur la croissance

– Veganzones M-A., 2000, « Infrastructures,

investissement et croissance : un bilan de dix années

de recherches », Etudes et documents du CERDI, ED

2000.07

Microéconométrie

Complément au cours

Anciennes diapos

Claudio Araujo 29/09/2013

CERDI – Ecole d’Economie UdA 5

Variabilité totale

Variabilité inter-temporelle (« between

time-periods »)

Variabilité intra-individuelle-temporelle

(« double within »)

Variabilité inter-individuelle (« between – group »)

Information disponible entermes de décomposition dela variabilité totale desobservations

Exemples : Différents types de variabilité

Différences structurelles (culture, ethnie, grilles de salaires, …)Inter – individuelle

Évolutions macro-économiques (reformes nationales, cadre législatif, effets de la conjoncture, évolution des

salaires, …)Inter – temporelle

Comportement propre à chaque individu – caractéristiques personnelles (diplôme, expérience, secteur d’activité, taille de

l’entreprise, …)

Intra – individuelle – temporelle

Claudio Araujo 29/09/2013

CERDI – Ecole d’Economie UdA 6

x

y

Exemple 1 Exemple 2 Exemple 3

Impact de l’hétérogénéité inobservéeCas d’une régression simple. i = 1, 2, 3, 4

Hétérogénéité saisie au niveau de l’ordonnée à l’origine

En rouge : régression ignorant l’hétérogénéité

inobservée

y

xExemple 4 Exemple 5

4

3

1 21

2

3

4Hétérogénéité saisie au

niveau des pentes

Individu 1droite de régression

Observation : Ne pas confondre l’hétérogénéité entre les individus (hétérogénéité des comportements)et le comportement hétérogène d’un

individu (hétérogénéité des situations)

Hétérogénéité de situation (comportement d’un individu)

y

x

Claudio Araujo 29/09/2013

CERDI – Ecole d’Economie UdA 7

Modélisation de l’hétérogénéité

• Modèle économétrique linéaire général

∑=

++=K

kitkitkititit xy

1

ηβα ( ) ( ) ( ) ( )1111 ××++××+=

NTNTKKNTNTXY ηβ

• Terme d’erreursi = 1, …, N ; t = 1, …, T

ittiitε+θ+ν=η

Caractéristiques individuelles

Caractéristiques temporelles

• Peut-on estimer ce modèle ? Le nombre de paramètres a estimer > taille de l’échantillon

1) E(εεεεi t ) = 02) E(εεεεi t )

2 = σσσσ2εεεε

3) E(εεεεi t εεεεj t ) = 0 , ∀∀∀∀ i ≠≠≠≠ j4) E(εεεεi t εεεεi s ) = 0 , ∀∀∀∀ t ≠≠≠≠ s

5) E(xi t εεεεi t ) = 0

Trois contraintesTous les

coefficients sont identiques

Ordonnée à l’origine & coefficients de pente différents entre les

individus

ααααit = ααααββββk i t = ββββk

RG MCO

ααααi t = αααα iββββk i t = ββββk

ααααi t = αααα iββββk i t = ββββk i

Ordonnée à l’origine différente entre les

individus

Cas particulier de l’hétérogénéité individuelle

Caractère MCC

MCADéterministe

MEFAléatoire

MEA

Claudio Araujo 29/09/2013

CERDI – Ecole d’Economie UdA 8

Régression Groupée (RG)

y

x

Droite estimée

i = 1

i = 2

i = 3

• Illustrations graphiques

16

• Illustrations graphiquesy

x

ννννi

i = 1

i = 2

i = 3

y

x

i = 1

i = 2

i = 3

Modèle à Effets Fixes (MEF)

Modèle à Coefficients Fixes & Composés (MCC-F)

x

yi = 1

i = 2

i = 3

Modèle à Coefficients Composés (MCC)

Claudio Araujo 29/09/2013

CERDI – Ecole d’Economie UdA 9

• Illustrations graphiques

y

x

Droite estimée

i = 1

i = 2

i = 3« écarts » aléatoires

Modèle à Effets Aléatoires (MEA)

y

x

i = 1i = 2

i = 3

Droite estimée

Modèle à Coefficients Aléatoires (MCA)

Opérateur between

( ) ( ) ( )1

1

1

1 ×

××==

⊗=NT

N

N

TN

NTNTNTY

y

y

y

y

YT

JIYB

M

M

M

• Calcul des opérateurs inter et intra dans le cas particulierd’effet individuel

Opérateur within

( )( ) [ ]( )11

11

111

1 ×

××−=

=

⊗−=

NT

NNT

NN

TT

NNTNTNTNT

YY

yy

yy

yy

yy

YTJIIYW

M

M

M

N, T Y BY WYJean, 2002 20 22.6 - 2.6Jean, 2003 25 22.6 2.4Jean, 2004 23 22.6 0.4Marie, 2002 18 17 1Marie, 2003 15 17 - 2Marie, 2004 18 17 1

Claudio Araujo 29/09/2013

CERDI – Ecole d’Economie UdA 10

Modèle à effets aléatoires – MEA (RE)

• L’effet spécifique est pris en compte au niveau de la

perturbation stochastique qui comporte trois termes d’erreurs :

individuel, temporel et idiosyncratique.

• Ce modèle est connu sous le nom : modèle à erreurs (ou à

variance) composées – MEC

• Structure du MEC

( )321

it

iti

K

kkitkit xy

ηενβα +++= ∑

=1( )

43421it

itti

K

kkitkit xy

ηεθνβα ++++= ∑

=1

double effets spécifiques

effets spécifiques individuels

( )

( )

( )TTTT

JI 22

2222

2

2

2222

νε

εννν

ν

ν

ννεν

×σ+σ=

σ+σσσ

σ

σ

σσσ+σ

L

OOM

MOO

L

Matrice des variances–covariances des écarts (cas d’effets spécifiques individuels)

En empilant les donnée pour l’ensemble des observations :

( )( )TNNTN

NTNTJIIAI ⊗+=⊗=Ω

×

22νε σσ

Claudio Araujo 29/09/2013

CERDI – Ecole d’Economie UdA 11

Opérateur between

individuel

Opérateur within individuel temporel

+⊗−⊗+

−⊗+

−⊗+

=ΩNTJ

NIJ

TJI

NTJ

NIJ

NTJ

TJI

NTJ NTTNTNNTTNNTTNNT

4321 κκκκ

Opérateur moyenne générale

Opérateur between temporel

222θνε σσσ NT ++

2εσ

22νε σσ T+

22θε σσ N+

( )

⊗Ι−Ισ+

⊗Ισ+σ=Ω ενε T

JTJT T

NNTT

N222

Après décomposition spectrale de la matriceΩ, on obtient :

Ou (dans le cas de double effets) :

• Comment estimer ce modèle ?

• Par le MV :

• Par le MCG :

– En remplaçant la matriceΩ on retrouve :

– φ : rapport entre les variances intra et inter

( ) Y'XX'Xˆmcg

111 −−− ΩΩ=β

( ) ( )BY'XWY'XBX'XWX'Xˆmcg

φ+φ+=β −1

22

2

νε

ε

σ+σ

σ=φ

T

( ) ( ) ( ) ( ) ( ) ( )ββσφσπε

ε XyXyNNTNTL −Ω′−−+−−= −1

21ln

2ln

22ln

2ln

Claudio Araujo 29/09/2013

CERDI – Ecole d’Economie UdA 12

• Méthodes d’estimation des composants de la variance – MCQG

• Méthode de « Wallace–Hussain », 1969 : suggèrent calculerσε et σν àpartir des résidus obtenus par les MCO

• Méthode de « Amemiya » (Wansbeek & Kapteyn), 1971 : suggèrentcalculerσε et σν à partir des résidus obtenus par l’estimation du modèleLSDV

• Méthode de « Nerlorve », 1971 : suggère calculerσν à partir descoefficients du MVM etσε à partir des résidus du modèlewithin.

• Méthode de « Swamy–Arora », 1972 : suggèrent procèder en 2 étapes :i) estimation intra et inter pour obtenir la valeur deφ ; ii) transformationdes données et estimation du modèle

• Modèle à estimer

( ) ( )[ ] ( ) i

K

kitkikitkiit xxyy ηφηφβαφ ∑

=−−+−−+=−−

1

111

(1 - √φ) : facteur de transformation des données

Méthodes d’estimation des composants de la variance

Méthode de « Wallace–Hussain », 1969

Méthode de « Amemiya » (Wansbeek & Kapteyn), 1971

Méthode de « Swamy–Arora », 1972

Remplacer les perturbations η par les résidus obenus à partirde l’estimation MCO

Remplacer les perturbations η par les résidus obenus à partir

de l’estimation du modèle LSDV

Procéder en 2 étapes :

estimation intra et inter

Claudio Araujo 29/09/2013

CERDI – Ecole d’Economie UdA 13

φ inconnu. Solution : MCQG.Méthode d’estimation réalisée en deux temps

Estimer afin d’obtenir la valeur de φ (estimation intra et estimation inter)it

η

1

Utiliser la valeur de φ pour transformer les données et estimer le modèle

2

Remarques :

Lorsque φ = 1 ⇒ MCO sur échantillon totale

Lorsque φ = 0 ⇒ Modèle Intra

02====σσσσννννˆ

22εεεενννν σσσσ>>>>σσσσ ˆˆ ∞∞∞∞→→→→T

Méthode de « Swamy–Arora »

Estimation de σ²ν par :

Estimateur de la variance (sans correction ddl) :

Coefficients du modèle MVM :

( )1

ˆˆ2

1

−−∑=

N

N

i i γγ

Autre Méthode : « Nerlove » 1971

NTww εεσεˆ'ˆˆ2 =

Estimation par le ML

( ) ( ) ( ) ( ) ( ) ( )ββσφσπε

ε XyXyNNTNTL −Ω′−−+−−= −1

21ln

2ln

22ln

2ln

φφφφ = Variance intra / Variance inter