8/18/2019 kjhgfdgh
1/10
Compartimentul 4
Modele eteroscedastice
1) Efectul eteroscedasticităţii.
Una dintre ipotezele care se referă la modelul regresiei liniare ţine de perturbaţiavariabilei aleatore în fiecare moment de timp. În cazul când aceste perturbaţii ui urmează o
distribuţie independentă cu o dispersie variantă constantă σ 2 , atunci spunem că variabila
reziduală este omoscedastică (din greacă, unde semnificaţia înseamnă o egală împrăştiere în
raport cu valorile variabilei independente xi.
!ontrariul acestei ipoteze poartă numele de eteroscedasticitate, care se manifestă prin
faptul că dispersia valorilor ui este variabilă în raport cu observaţiile succesive.
"şa dar modelul #eteroscedastic se prezintă astfel$
y=X β +u, E(ui )=0
Var(ui )=σ i2 , ( ∀ i=%,n )
&om analiza situaţiile când variabilele aleatoare nu sunt autocorelate.
'atricea de covarianţă a erorilor va avea următoarea formă$
σ
σσ
=
ΕΕΕ
ΕΕΕΕΕΕ
=Ε=Ω
u
u
u
nnn%n
n%
n%%%%
)
u
n
%
**
****
uu(uu(uu(
uu(uu(uu(uu(uu(uu(
uu(
+bservăm că varianţiile erorilor nu mai sunt constante pe prima diagonală a matricei de
covarianţă. "ceasta se întâmplă în deosib când operăm cu date rezultate din observaţii efectuate
asupra mai multor unităţi pentru aceiaşi perioadă sau când observaţiile sunt reprezentate de
valorile medii.enomenul de eteroscedasticitate poate fi diminuat prin efectuarea de observaţii în
diferite momente de timp asupra unuia şi aceluiaşi obiect economic.
Însă o sc#imbare considerabilă a variabilei corectate în timp la fel poate duce la
modificarea varianţiei variabilelor reziduale.
!onsecinţele eteroscedasticităţii sunt identice cu cele de autocorelare a erorilor, adică$
- estimatorul este nedeplasat (/"0/ 12"2/
- estimatorul '!''3 n-are mai mult o varianţă minimală.
44
8/18/2019 kjhgfdgh
2/10
!auzele eteroscedasticitătii sunt multiple$
- observaţiile reprezintă valorile medii ale variabilelor măsurate5
- pentru diferite valori ale variabilei explicative se observă repetarea unei şi aceleaşi
valori a variabilei explicate5
- perturbaţiile sunt legate de valorile cuprinse de variabila explicativă, într-un model cureprezentare înstantanee a datelor.
Corectarea eteroscedasticitâţii
6eşi în anumite condiţii estimatorul '!''3 poate fi consistent, el nu este totuşi în
general eficient. 6eaceea o estimaţie eficientă a lui β necesită luarea în consideraţie a matricei
Ω. 3entru aceasta se calculează estimatorul '!''37 (7eneralizate, care este liniar
nedeplasat de dispersie minimă$
Var
y
( (
(
β σ
β
=
=
− −
− − −
% %
% % %
Χ Ω Χ
Χ Ω Χ Χ Ω
Τ
Τ Τ 0u există o metodologie unică de corecţie, însă se aplică
diverse metode în funcţie de cauzele care au adus la eteroscedasticitate.
8egula generală consistă în determinarea unei transformări a datelor a variabilelor care să
ducă în fine la un model cu varianţe constante (#omoscedastice.
6e exemplu, se cere să estimăm modelul Y i =β 0+β 1 X i+ ui pentru care cunoaştem numai
relaţia între medii$ iii uY 99 %* + Χ+= β β
&arianţa Var un
n
n
n
i u
u
i
i
( = = =
Ω σ
%
%*
*
%
%
6eoarece modelul este eteroscedastic, vom aplica estimatorul '!''37
( ( ( ( β = =− − − − − − Χ Ω Χ Χ Ω Υ Χ Χ Χ ΥΤ Τ Τ Τu u V V % % % % % %
4:
8/18/2019 kjhgfdgh
3/10
unde V
n
n
ni
− =
%
%
, de unde ( ) Χ ΧΤV
n n x
n x n x
i i i
i i i i
− =
∑ ∑∑ ∑
%
şi
( ) Χ Υ Υ
Χ ΥΤV
n
n
i i
i i i
− =
∑∑
% care ne permit obţinerea rezultatelor de care
avem nevoie.
/e poate de notat &-% ;''), dar atunci M
n
n
nk
=
%
şi ( ) ( )[ ] ( ) ( )[ ] ( ) ( )β = =− −
ΜΧ ΜΧ ΜΧ ΜΥ Χ Μ ΜΧ Χ Μ ΜΥΤ ΤT T T T
% %
"celeaşi rezultate se pot obţine şi aplicând regresia ponderată, adică prin multiplicarea
vectorului de observaţii a variabilei endogene < şi a vectorului variabilei exogene cu matricea
'. "plicând apoi '!''3 pentru datele transformate a=ungem la aceleaşi rezultate.
>stimatorul nedeplasat pentru varianta erorilor are forma
( ) ( ) ( )
( ) ( )
(
σ β β β β
β β β β β
u
i i
i i
i i i
U U
n k n k n k
V
n k
V V
n k
nn
n
n k
% % %
* %
= ′−
= −
′−
− =
− ′
′ −
− =
− −
−
= ′ −
−
=
−
−
− − −
∑∑∑
ΜΥ ΜΧ ΜΥ ΜΧ Υ Χ Μ Μ Υ Χ
Υ Χ Υ Χ Υ Υ Χ Υ Υ
Υ Χ ΥΤ
>stimaţia varianţei coeficienţilor se face cu a=utorul testului t. 'atricea varianţiei şicovarianţei coeficienţilor$
( )
[ ] ( )
cov
Ω Χ Χ
Χ Χ
Τ
β
β ε
β
β α
α
σ
β β σ σ
β
σ
α
σ
=
= = ⋅ ′
= =
− −
−
∗ ∗
u
calc
V
t V
t t
i
i
% %
* %
%
%
*
%
%
4?
8/18/2019 kjhgfdgh
4/10
6acă ( )tabt t k ni
calc
i
α
β σ
β −〉=
9
9
atunci reţinem ipoteza că βi, are o influenţă pozitivă.
3. Teste de detectare a eteroscedasticităţii
2n primul rând vom verifica 1) testul de egalitate a varianţelor erorilor. 2poteza 2o o
vom formula în felul următor$ 2*$ σ σ σ %
= = = = i m (i=1,m) numărul de grupe de
observaţii.
"lgoritmul de calcul.
3asul %. !alculăm varianţa empirică pentru fiecare grupă.
(
σ i
ij i
j
m
in
%
%=
−
−=
∑ Υ Υ
3asul . !alculăm varianţa totală
( )
( )
( )
σ
σ σ
n
i i
i
m
i
i
m
i i
i i i
i
m
i
i
m
n
n
v
v
cu v n i v v n
%
%
% %
%
%
% %
=−
−=
= − = = −
=
=
= =
∑
∑∑
∑ ∑
3asul @. !alculăm χ empiric şi verificăm testul.
!antitatea ′ = −=
∑! v"n v "ni i ii
m
σ σ
%
urmează o lege normală χ cu (m#1)
grade de libertate (An - logaritmul natural.
În acelaşi timp estimaţia poate fi ameliorată divizând B la o constantă la scară !$
$ m v v
atunci ! !$
mii
m
= + − − = ′ → −=∑% %@ % % % %%
( , ( χ
6acă !%χ0,&' (m#1), atunci ipoteza 2* este respinsă, modelul este eteroscedastic.
"lt test care prezintă interes este elaborat de S.Goldfeld şi .!uandt.
"cest test este variabil în cazul în care una din variabile este cauza eteroscedasticităţii şi
numărul de observaţii este important.
"lgoritmul testului include @ paşi.
3asul %. +rdonăm observaţiile în descreştere pentru variabila explicativă xi, care se
consideră #eteroscedasticităţii.
4C
8/18/2019 kjhgfdgh
5/10
3asul . >xcludem ! observaţii centrale din datele ordonate, iar valoarea lui ! o alegem
aproximativ a D parte din eşantion C" n#4
3asul @. !alculăm regresiile pentru ambele subeşantioane şi verificăm testul şi sumele
pătratelor reziduurilor celor două regresii //>% şi //>.
( )
( )
((E y y
((E y y
i i
t
n
i i
i n
n
%
%
%
D%
%
%
= −
= −
=
=
+
∑
∑
(
(
"lcătuim raportul$
( ) )
((E n
((E n n
calc = −
− −
%
%
D
E
şi-l comparăm cu
) n n
n
% D
* *F
− −
−,
.
. 6acă (calcG(tab, atunci
ipoteza 2o este respinsă şi modelul este eteroscedastic.
@ Testul Gleis$er.
)estul 7leis=er permite nu numai descoperirea unei eventuale eterosc#edasticităţi, dar şi
identificare formei care o îmbracă această eteroscedasticitate. "cest test este fondat pe relaţie
între reziduu şi estimatorul '!''3 efectuate asupra modelului de bază şi variabilei
explicative presupuse a fi cauza eteroscedasticităţii.
"lgoritmul testului conţine D paşi$
*aul 1. 8egresionăm cu a=utorul '!''3 Y j în dependenţă de X j
&ectorul reziduurilor u j atunci devine cunoscut.
*aul 2. 8egresionăm valorile absolute u j ale reziduurilor în raport cu x j
7leis=er sugerează de testat diferite forme de relaţii. 3rima forma generală propusă este
u x v j j j= + +α α * % . cu eteroscedasticitate de tipul
ju xk j =σ
ju
j j j
xk ti-ul ./
ticitat/a/t/r0c/.acuv xu 10rma 2lta
j
E%
%*$
=++=
σ
α α
%
%*@
−
−
=
++=
ju
j j j
xk
v xu/t/ 10rma
jσ
α α
*aul 3. 2poteza omoscedasticităţii este respinsă dacă coeficientul α 1 din una din
specificaţii este semnificativ diferit de zero. 6acă toate @ teste t /tudent calculate sunt
superioare t teoretic tabelar atunci #eteroscedasticitatea este detectată.
*aul 4. !orectarea eteroscedasticităţii."dmitem că modelul este eteroscedastic. !um vom corecta efecteleH
:*
8/18/2019 kjhgfdgh
6/10
3resupunem că am reţinut prima forma$
σ u j j k x =
"plicarea regresiei ponderate cu a=utorul factorului lEI= conduce la un model
#omoscedastic$
y
x x
u
xin car/
u
X X k
j
j j
j
j
j
j j
u j= + +
= =
β β σ * %
%Ε
"vând în vedere că testul 7leis=er a pus în evidenţă o relaţie de tipul σ u j j k x = , pentru a
înlătura eteroscedasticitatea vom aplica regresia ponderată asupra datelor brute divizându-le la
x j . +bţinem
%* %, k
X x
uun./
x
u
x
x
x x ju
l j
j
j
j
j
j
j j
j ==
Ε ++=
Υσ β
β
Studiul de ca% & 're%olvat)
În tabelul D.% ce urmează au fost grupate valorile observate ce se referă la doi indicatori$
costul mediu < şi outputul I a unei firme (tabelul D.%
Tabelul 4.1
(olumul producţiei lansate unităţi
'*i)
Costul de producţie +i lei
D,4 D,4 D,: D,? F,* F,%D F,* F, F,D F,D F,F F,44 F,4 F,? F,C 4,@ 4,@ 4,D? 4,@ 4,F 4,? :, :,D :,F
%* :,D :,4 :,% ?, ?,D ?,?
"nalizat dependenţa costului de producţie şi volumul producţiei lansate.
8>J+A&"8>$
% 8egresăm < în funcţie de I pentru întregul eşantion. +bţinem$
:%
8/18/2019 kjhgfdgh
7/10
., ,
( . ( ,
Y X = +@ ?4@ * @C
*%:: * *4: (%.
,CD((@*
%
,D,%%?,?D,?,?%,:4,:D,:(%*%,F*,F?,D:,D4,D4,D(
,4%D:,D%(@*:?,%%CC
,:?,%%CC
,%@@,4@*$D,%?4
,D,%?4
,D*(@*
,4@*
,%@*%**4D@4%4D(4
,%?*%*?4D(4
=⋅−=
=++++++++++++=
=−=
=
==
=
=−=
==
=++++=
=++++⋅=
∑∑∑∑
∑∑∑
∑∑ ∑
∑∑∑
Y X XY xy
XY
Y y
Y
Y
Y
X X x
X X
X
X
,4%D:,D%
,?4@@,@4@C%4:,*%@@,4
,@C%4:,*D*
CD
*
%
==
=⋅−=
===
∑
∑∑
y!
b
x
xyb
.CD*4,*,??D:,*
,%::(,*
,*(4:,*%
,D%@CF,*%:%@4,*
,%:%@4,*(@*
,:C?*,D
,?%4:,@4CD@C%4:,*
%(
(
(
(
((
%
(
(
%%
*
%
===
=⋅=
=⋅=
==
=−=
=−==
=⋅=⋅=
∑∑
∑
∑
∑
5!
! 5
xn
X ( (
x( (
(
!(
!!/!
xyb!
b
b
6eci, regresia calculată explică ??,FK a variaţiei variabilei ste semnificativ şi coeficientul b*, deoarece t b
(
b
b
*
*
* @ ?4@
*%::
%?= = =,
,
, .
:
8/18/2019 kjhgfdgh
8/10
!alculăm regresiile lui < în funcţie de I pentru primele %% şi ultimele %%
observaţii, în conformitate cu sc#ema ce rezultă din testul 7oldfield şi Buandt. 8emarcăm, că
acest test poate fi aplicat numai în cazurile dependenţei liniare, şi anume, când sursa încălcării
#omoscedasticităţii are forma a τ τ τ λ λ τ u i u i
x au X
= = =, ( , adică atunci, când dispersia
variabilei aleatoare de perturbaţie este proporţională pătratului uneia din variabilele explicative
(cauzele Ii.
3entru primele %% observaţii avem regresia
*4,*(%C%@,*(
F*,*@*,DL9 %( X Y += cu
.4D,*
,4?%?,*@?*,*9(
%%
%
%%
%(
!
! 5
xyb!un./ i!/Y Y ((E ( t i
==
=====−== ∑∑
3entru ultimele %% observaţii
%:**,*(FFDD,%(
D%?@,*:@@@,@L9(
X Y +=
D*@,*:DFD,D
?@4@,%%,?@4@, %( =−=−===
!
!
!
! 5!
@ În cazul #omoscedasticităţii şi al distribuţiei normale a erorilor, raportul sumelor
pătratelor reziduurilor pentru fiecare din cele două regresii trebuie să verifice repartiţia is#er$
)
!
!
) C C
%
%
C%
C
?@4@
* @?*: D4 * *F C C @ @C
,
(
(
,
,, ( , 5 5 ,= = = > =
2poteza #eteroscidasticităţii este deci acceptabilă.
@ 6eoarece Var u X i i i( ,= =τ λ λ
fiind o constantă nenulă, se poate corecta efectul
#eteroscidasticităţii, împărţind fiecare termen al regresiei prin I i, apoi reestimând regresia cu
a=utorul variabilelor transformate. În acest caz$
:@
8/18/2019 kjhgfdgh
9/10
i
i
i
*
%iii%*
i
i
x
u
x
b bIEux b b(
I
<++=++= . 0otăm
X
Y Y
x X ==∗ M5
% +bţinem dependenţa
liniară Y b b X i∗ ∗= + +% * ε în care termenul eroare devine #omoscedastic. 6eci$
i
ii
ii
ii /
IIu(&ar
x%
Iu(&ar (&ar =λ=λ===ε .
>stimările prin '!''3, plecând de la variabilele transformate, vor fi deci nedeplasate,
consistente şi eficiente. &om avea$
*D,*(*?CF,*(
@F,**4,D9$
@@4@,*
(
(
%*
%
+=
=−=
−==
∗∗
∗
∗∗
∗
∗∗
∑
∑∑∑
X Y ./ci i
./ X bY b
X
X X
x
y xb
.%D%4(4,*9
,D%::,%*5FFCD,%*
,CC@@,*,C?44,*FFCD,%*
D%::,%*
,4*?,%D*(D(,*@F@:,*5@?F,DF
*?CF,**4(,D
%
(
(
%
(
%(
*%
=−==
===
====
====
∑
∑ ∗!!u!
! y!un./
5!
! 5
t t bb
!aracteristicile (criteriile arată, că modelul obţinut este mai bun decât cel iniţial$
8 ;*,C?44 este mai mare decât 8 ;*,??D: (ce se referă la modelul iniţial. >rorile standard a
coeficienţilor sunt mai mici pentru modelul ( faţă de modelul (%.8espectiv sunt mai mari valorile testelor t şi .
Studiul de ca% , 'propus).
/e consideră @* de firme dintr-un anumit sector industrial şi se doreşte să se analizeze
salariul mediu < pentru fiecare firmă, în funcţie de efectivul de salariaţi I. +bservaţiile au fost
grupate şi prezentate în tabel D..3entru formarea varianţei proprii, se propune de adunat la fiecare valoare
8/18/2019 kjhgfdgh
10/10
% 6e estimat modelul dependenţei < în funcţie de I.
6e testat #eteroscedasticitatea erorilor5 de utilizat testul 7oldfield-Buandt,
înlăturând c≈ 0,2'n observaţii, unde n-numărul de observări.
@ În prezenţa #eteroscedasticităţii şi presupunând că dispersia erorilor este
proporţională cu x, de transformat modelul iniţial de tipul Y=β +β 1 X+u În modelul
X
Y Y
X X X Y au
X
u
X X
Y ==++=++=
∗∗∗∗ ε ε β β β
β 55
%5
*%%
*
cu scopul de a obţine estimatori nedeplasaţi, consistenţi şi eficienţi. 6e comparat estimaţiile
obţinute cu rezultatele de la primul punct.
D 6e prezentat un raport al studiului.
:F
Recommended