kjhgfdgh

Embed Size (px)

Citation preview

  • 8/18/2019 kjhgfdgh

    1/10

    Compartimentul 4

     Modele eteroscedastice

    1) Efectul eteroscedasticităţii.

    Una dintre ipotezele care se referă la modelul regresiei liniare ţine de perturbaţiavariabilei aleatore în fiecare moment de timp. În cazul când aceste perturbaţii ui urmează o

    distribuţie independentă cu o dispersie variantă constantă σ 2 , atunci spunem că variabila

    reziduală este omoscedastică (din greacă, unde semnificaţia înseamnă o egală împrăştiere în

    raport cu valorile variabilei independente xi.

    !ontrariul acestei ipoteze poartă numele de eteroscedasticitate, care se manifestă prin

    faptul că dispersia valorilor ui este variabilă în raport cu observaţiile succesive.

    "şa dar modelul #eteroscedastic se prezintă astfel$

     y=X β +u, E(ui )=0

    Var(ui )=σ i2 , ( ∀  i=%,n )

    &om analiza situaţiile când variabilele aleatoare nu sunt autocorelate.

    'atricea de covarianţă a erorilor va avea următoarea formă$

         

     

     

     

     

    σ

    σσ

    =

         

     

     

     

     

    ΕΕΕ

    ΕΕΕΕΕΕ

    =Ε=Ω

    u

    u

    u

    nnn%n

    n%

    n%%%%

    )

    u

    n

    %

    **

    ****

    uu(uu(uu(

    uu(uu(uu(uu(uu(uu(

    uu(

    +bservăm că varianţiile erorilor nu mai sunt constante pe prima diagonală a matricei de

    covarianţă. "ceasta se întâmplă în deosib când operăm cu date rezultate din observaţii efectuate

    asupra mai multor unităţi pentru aceiaşi perioadă sau când observaţiile sunt reprezentate de

    valorile medii.enomenul de eteroscedasticitate poate fi diminuat prin efectuarea de observaţii în

    diferite momente de timp asupra unuia şi aceluiaşi obiect economic.

    Însă o sc#imbare considerabilă a variabilei corectate în timp la fel poate duce la

    modificarea varianţiei variabilelor reziduale.

    !onsecinţele eteroscedasticităţii sunt identice cu cele de autocorelare a erorilor, adică$

    - estimatorul este nedeplasat (/"0/ 12"2/

    - estimatorul '!''3 n-are mai mult o varianţă minimală.

    44

  • 8/18/2019 kjhgfdgh

    2/10

    !auzele eteroscedasticitătii sunt multiple$

    - observaţiile reprezintă valorile medii ale variabilelor măsurate5

    - pentru diferite valori ale variabilei explicative se observă repetarea unei şi aceleaşi

    valori a variabilei explicate5

    - perturbaţiile sunt legate de valorile cuprinse de variabila explicativă, într-un model cureprezentare înstantanee a datelor.

    Corectarea eteroscedasticitâţii 

    6eşi în anumite condiţii estimatorul '!''3 poate fi consistent, el nu este totuşi în

    general eficient. 6eaceea o estimaţie eficientă a lui β  necesită luarea în consideraţie a matricei

    Ω. 3entru aceasta se calculează estimatorul '!''37 (7eneralizate, care este   liniar

    nedeplasat de dispersie minimă$

    Var 

     y

    (   (

    (

    β σ 

    β 

    =

    =

    − −

    − − −

    % %

    % % %

     Χ Ω Χ

     Χ Ω Χ Χ Ω

    Τ

    Τ Τ 0u există o metodologie unică de corecţie, însă se aplică

    diverse metode în funcţie de cauzele care au adus la eteroscedasticitate.

    8egula generală consistă în determinarea unei transformări a datelor a variabilelor care să

    ducă în fine la un model cu varianţe constante (#omoscedastice.

    6e exemplu, se cere să estimăm modelul Y i =β 0+β 1 X i+ ui pentru care cunoaştem numai

    relaţia între medii$ iii   uY  99 %*   + Χ+=   β β 

    &arianţa Var un

    n

    n

    n

    i u

    u

    i

    i

    (  = = =

     

     

     

     

            

    Ω   σ 

    %

    %*

    *

    %

    %

    6eoarece modelul este eteroscedastic, vom aplica estimatorul '!''37

    ( ( ( ( β   = =− − − − − − Χ Ω Χ Χ Ω Υ Χ Χ Χ ΥΤ Τ Τ Τu u   V V % % % % % %

    4:

  • 8/18/2019 kjhgfdgh

    3/10

    unde V 

    n

    n

    ni

    − =

    %

    %

    , de unde ( ) Χ ΧΤV 

    n n x

    n x n x

    i i i

    i i i i

    − =

    ∑ ∑∑ ∑

    %

    şi

    ( ) Χ Υ  Υ

     Χ ΥΤV 

    n

    n

    i i

    i i i

    − =

    ∑∑

    %  care ne permit obţinerea rezultatelor de care

    avem nevoie.

    /e poate de notat &-% ;''), dar atunci  M 

    n

    n

    nk 

    =

    %

    şi ( ) ( )[ ]   ( ) ( )[ ]   ( ) ( )β   = =−   −

    ΜΧ ΜΧ ΜΧ ΜΥ Χ Μ ΜΧ Χ Μ ΜΥΤ ΤT T    T T 

    %   %

     

    "celeaşi rezultate se pot obţine şi aplicând regresia ponderată, adică prin multiplicarea

    vectorului de observaţii a variabilei endogene < şi a vectorului variabilei exogene cu matricea

    '. "plicând apoi '!''3 pentru datele transformate a=ungem la aceleaşi rezultate.

    >stimatorul nedeplasat pentru varianta erorilor are forma

    ( ) ( ) ( )

    ( ) ( )

    (  

     

    σ β β β β  

    β β    β β β 

    u

    i i

    i i

    i i i

    U U 

    n k n k n k  

    n k 

    V V 

    n k 

    nn

    n

    n k 

    % % %

    * %

    =  ′−

      =  −

      ′−

    −  =

      −  ′

    ′   −

    −  =

    − −

      =  ′   −

      =

    − 

    − − −

    ∑∑∑

    ΜΥ ΜΧ ΜΥ ΜΧ Υ Χ Μ Μ Υ Χ

     Υ Χ Υ Χ   Υ Υ Χ Υ Υ

      Υ Χ ΥΤ

    >stimaţia varianţei coeficienţilor se face cu a=utorul testului t. 'atricea varianţiei şicovarianţei coeficienţilor$

    ( )

    [ ]   ( )

        cov

    Ω Χ Χ

     Χ Χ

    Τ

    β 

    β    ε 

    β 

    β   α 

    α 

    σ 

    β β σ σ  

    β 

    σ 

    α 

    σ 

    =

    = = ⋅   ′

    = =

    −  −

    ∗ ∗

    u

    calc

    t V 

    t t 

    i

    i

    %   %

    * %

    %

    %

    *

    %

    %

    4?

  • 8/18/2019 kjhgfdgh

    4/10

    6acă ( )tabt t  k ni

    calc

    i

    α 

    β σ 

    β −〉=

    9

    9

     atunci reţinem ipoteza că βi, are o influenţă pozitivă.

    3. Teste de detectare a eteroscedasticităţii

    2n primul rând vom verifica 1) testul de egalitate a varianţelor erorilor. 2poteza 2o o

    vom formula în felul următor$ 2*$ σ σ σ %

    = = = = i m   (i=1,m) numărul de grupe de

    observaţii.

    "lgoritmul de calcul.

    3asul %. !alculăm varianţa empirică pentru fiecare grupă.

    (

    σ i

    ij i

     j

    m

    in

    %

    %=

    −=

    ∑   Υ Υ

    3asul . !alculăm varianţa totală

    ( )

    ( )

    ( )

    σ 

    σ σ 

    n

    i i

    i

    m

    i

    i

    m

    i i

    i i i

    i

    m

    i

    i

    m

    n

    n

    v

    v

    cu v n i v v n

    %

    %

    % %

    %

    %

    % %

    =−

    −=

    = − = = −

    =

    =

    = =

    ∑∑

    ∑ ∑

    3asul @. !alculăm χ  empiric şi verificăm testul.

    !antitatea ′ = −=

    ∑! v"n v "ni i ii

    m

    σ σ 

    %

    urmează o lege normală χ  cu (m#1)

    grade de libertate (An - logaritmul natural.

    În acelaşi timp estimaţia poate fi ameliorată divizând B la o constantă la scară !$

    $ m v v

    atunci ! !$ 

    mii

    m

    = + −   −           =   ′ → −=∑% %@ % % % %%

    ( , (  χ 

    6acă !%χ0,&' (m#1), atunci ipoteza 2* este respinsă, modelul este eteroscedastic.

    "lt test care prezintă interes este elaborat de S.Goldfeld şi .!uandt.

     "cest test este variabil în cazul în care una din variabile este cauza eteroscedasticităţii şi

    numărul de observaţii este important.

    "lgoritmul testului include @ paşi.

    3asul %. +rdonăm observaţiile în descreştere pentru variabila explicativă xi, care se

    consideră #eteroscedasticităţii.

    4C

  • 8/18/2019 kjhgfdgh

    5/10

    3asul . >xcludem ! observaţii centrale din datele ordonate, iar valoarea lui ! o alegem

    aproximativ a D parte din eşantion C" n#4 

    3asul @. !alculăm regresiile pentru ambele subeşantioane şi verificăm testul şi sumele

     pătratelor reziduurilor celor două regresii //>% şi //>.

    ( )

    ( )

    ((E y y

    ((E y y

    i i

    n

    i i

    i  n

    n

    %

    %

    %

    D%

    %

    %

    = −

    = −

    =

    =

    +

    (

    (

    "lcătuim raportul$

    ( ) ) 

    ((E n

    ((E n n

    calc =  −

    −   −        

    %

    %

    D

    E

     şi-l comparăm cu

     ) n n

    n

    %   D

    * *F

    − −

     

    −,

    .

    . 6acă (calcG(tab, atunci

    ipoteza 2o este respinsă şi modelul este eteroscedastic.

    @ Testul Gleis$er.

    )estul 7leis=er permite nu numai descoperirea unei eventuale eterosc#edasticităţi, dar şi

    identificare formei care o îmbracă această eteroscedasticitate. "cest test este fondat pe relaţie

    între reziduu şi estimatorul '!''3 efectuate asupra modelului de bază şi variabilei

    explicative presupuse a fi cauza eteroscedasticităţii.

    "lgoritmul testului conţine D paşi$

     *aul 1. 8egresionăm cu a=utorul '!''3 Y  j în dependenţă de X  j

    &ectorul reziduurilor u j atunci devine cunoscut.

     *aul 2. 8egresionăm valorile absolute u j ale reziduurilor în raport cu x j

    7leis=er sugerează de testat diferite forme de relaţii. 3rima forma generală propusă este

        u x v  j j j= + +α α * % . cu eteroscedasticitate de tipul

      ju   xk   j =σ 

      ju

      j  j  j

     xk ti-ul ./

     ticitat/a/t/r0c/.acuv xu  10rma 2lta

      j

    E%

    %*$

    =++=

    σ 

    α α 

    %

    %*@

    =

    ++=

      ju

      j  j  j

     xk 

    v xu/t/  10rma

      jσ 

    α α 

     *aul 3. 2poteza omoscedasticităţii este respinsă dacă coeficientul α 1  din una din

    specificaţii este semnificativ diferit de zero. 6acă toate @ teste t /tudent calculate sunt

    superioare t teoretic tabelar atunci #eteroscedasticitatea este detectată.  

     *aul 4. !orectarea eteroscedasticităţii."dmitem că modelul este eteroscedastic. !um vom corecta efecteleH

    :*

  • 8/18/2019 kjhgfdgh

    6/10

    3resupunem că am reţinut prima forma$

    σ u j j k x =

    "plicarea regresiei ponderate cu a=utorul factorului lEI= conduce la un model

    #omoscedastic$

     y

     x x

    u

     xin car/

    u

     X X k 

     j

     j j

     j

     j

     j

     j j

    u j= + +

       

     

     

         = =

    β β σ * %

    "vând în vedere că testul 7leis=er a pus în evidenţă o relaţie de tipul σ u j j k x = , pentru a

    înlătura eteroscedasticitatea vom aplica regresia ponderată asupra datelor brute divizându-le la

     x  j . +bţinem

    %* %,   k 

     X  x

    uun./

     x

    u

     x

     x

     x x   ju

    l   j

      j

      j

      j

      j

      j

      j  j

      j ==  

     

     

     

     Ε ++=

     Υσ β 

    β 

    Studiul de ca% & 're%olvat)

    În tabelul D.% ce urmează au fost grupate valorile observate ce se referă la doi indicatori$

    costul mediu < şi outputul I a unei firme (tabelul D.%

    Tabelul 4.1

    (olumul producţiei lansate unităţi

    '*i)

    Costul de producţie +i lei

    D,4 D,4 D,: D,? F,* F,%D F,* F, F,D F,D F,F F,44 F,4 F,? F,C 4,@ 4,@ 4,D? 4,@ 4,F 4,? :, :,D :,F

    %* :,D :,4 :,% ?, ?,D ?,?

    "nalizat dependenţa costului de producţie şi volumul producţiei lansate.

    8>J+A&"8>$

    % 8egresăm < în funcţie de I pentru întregul eşantion. +bţinem$

    :%

  • 8/18/2019 kjhgfdgh

    7/10

    ., ,

    ( . ( ,

    Y X = +@ ?4@ * @C

    *%:: * *4: (%.

    ,CD((@*

    %

    ,D,%%?,?D,?,?%,:4,:D,:(%*%,F*,F?,D:,D4,D4,D(

    ,4%D:,D%(@*:?,%%CC

    ,:?,%%CC

    ,%@@,4@*$D,%?4

    ,D,%?4

    ,D*(@*

    ,4@*

    ,%@*%**4D@4%4D(4

    ,%?*%*?4D(4

    =⋅−=

    =++++++++++++=

    =−=

    =

    ==

    =

    =−=

    ==

    =++++=

    =++++⋅=

    ∑∑∑∑

    ∑∑∑

    ∑∑ ∑

    ∑∑∑

    Y  X  XY  xy

     XY 

    Y  y

     X  X  x

     X  X 

     X 

     X 

    ,4%D:,D%

    ,?4@@,@4@C%4:,*%@@,4

    ,@C%4:,*D*

    CD

    *

    %

    ==

    =⋅−=

    ===

    ∑∑

     y!

    b

     x

     xyb

    .CD*4,*,??D:,*

    ,%::(,*

    ,*(4:,*%

    ,D%@CF,*%:%@4,*

    ,%:%@4,*(@*

    ,:C?*,D

    ,?%4:,@4CD@C%4:,*

    %(

    (

    (

    (

    ((

    %

    (

    (

    %%

    *

    %

    ===

    =⋅=

    =⋅=

    ==

    =−=

    =−==

    =⋅=⋅=

    ∑∑

     5!

    ! 5

     xn

     X  ( ( 

     x( ( 

    !( 

    !!/!

     xyb!

    b

    b

    6eci, regresia calculată explică ??,FK a variaţiei variabilei ste semnificativ şi coeficientul b*, deoarece t b

    b

    b

    *

    *

    * @ ?4@

    *%::

    %?= = =,

    ,

    , .

    :

  • 8/18/2019 kjhgfdgh

    8/10

    !alculăm regresiile lui < în funcţie de I pentru primele %% şi ultimele %%

    observaţii, în conformitate cu sc#ema ce rezultă din testul 7oldfield şi Buandt. 8emarcăm, că

    acest test poate fi aplicat numai în cazurile dependenţei liniare, şi anume, când sursa încălcării

    #omoscedasticităţii are forma a τ τ τ λ λ τ  u i u i

     x au X 

    = = =, ( , adică atunci, când dispersia

    variabilei aleatoare de perturbaţie este proporţională pătratului uneia din variabilele explicative

    (cauzele Ii.

    3entru primele %% observaţii avem regresia

    *4,*(%C%@,*(

    F*,*@*,DL9 %(   X    Y       +=  cu

    .4D,*

    ,4?%?,*@?*,*9(

    %%

    %

    %%

    %(

    !

    ! 5

     xyb!un./ i!/Y Y ((E (  t i

    ==

    =====−==   ∑∑

    3entru ultimele %% observaţii

    %:**,*(FFDD,%(

    D%?@,*:@@@,@L9(

      X    Y      +=

    D*@,*:DFD,D

    ?@4@,%%,?@4@, %(   =−=−===

    !

    !

    !

    ! 5!

    @ În cazul #omoscedasticităţii şi al distribuţiei normale a erorilor, raportul sumelor

     pătratelor reziduurilor pentru fiecare din cele două regresii trebuie să verifice repartiţia is#er$

     ) 

    !

    !

     ) C C

    %

    %

    C%

    C

    ?@4@

    * @?*: D4 * *F C C @ @C

    ,

    (

    (

    ,

    ,, ( , 5 5 ,= = = > =

    2poteza #eteroscidasticităţii este deci acceptabilă.

    @ 6eoarece Var u X  i i i( ,= =τ λ λ 

    fiind o constantă nenulă, se poate corecta efectul

    #eteroscidasticităţii, împărţind fiecare termen al regresiei prin I i, apoi reestimând regresia cu

    a=utorul variabilelor transformate. În acest caz$

    :@

  • 8/18/2019 kjhgfdgh

    9/10

    i

    i

    i

    *

    %iii%*

    i

    i

    x

    u

    x

     b bIEux b b(

    I

    <++=++= . 0otăm

     X 

    Y Y 

     x X    ==∗ M5

    %  +bţinem dependenţa

    liniară Y b b X   i∗ ∗= + +% *   ε    în care termenul eroare devine #omoscedastic. 6eci$

    i

    ii

    ii

    ii /

    IIu(&ar 

    x%

    Iu(&ar (&ar    =λ=λ===ε .

    >stimările prin '!''3, plecând de la variabilele transformate, vor fi deci nedeplasate,

    consistente şi eficiente. &om avea$

    *D,*(*?CF,*(

    @F,**4,D9$

    @@4@,*

    (

    (

    %*

    %

    +=

    =−=

    −==

    ∗∗

    ∗∗

    ∗∗

    ∑∑∑

       X     Y    ./ci i

    ./   X     bY    b

       X     

       X        X     

      x

       y  xb

    .%D%4(4,*9

    ,D%::,%*5FFCD,%*

    ,CC@@,*,C?44,*FFCD,%*

    D%::,%*

    ,4*?,%D*(D(,*@F@:,*5@?F,DF

    *?CF,**4(,D

    %

    (

    (

    %

    (

    %(

    *%

    =−==

    ===

    ====

    ====

    ∑   ∗!!u!

    ! y!un./

     5!

    ! 5

    t t  bb

    !aracteristicile (criteriile arată, că modelul obţinut este mai bun decât cel iniţial$

    8 ;*,C?44 este mai mare decât 8 ;*,??D: (ce se referă la modelul iniţial. >rorile standard a

    coeficienţilor sunt mai mici pentru modelul ( faţă de modelul (%.8espectiv sunt mai mari valorile testelor t şi .

    Studiul de ca% , 'propus).

    /e consideră @* de firme dintr-un anumit sector industrial şi se doreşte să se analizeze

    salariul mediu < pentru fiecare firmă, în funcţie de efectivul de salariaţi I. +bservaţiile au fost

    grupate şi prezentate în tabel D..3entru formarea varianţei proprii, se propune de adunat la fiecare valoare

  • 8/18/2019 kjhgfdgh

    10/10

    % 6e estimat modelul dependenţei < în funcţie de I.

    6e testat #eteroscedasticitatea erorilor5 de utilizat testul 7oldfield-Buandt,

    înlăturând c≈ 0,2'n observaţii, unde n-numărul de observări.

    @ În prezenţa #eteroscedasticităţii şi presupunând că dispersia erorilor este

     proporţională cu x, de transformat modelul iniţial de tipul Y=β +β 1 X+u  În modelul

     X  

    Y  Y  

     X   X   X  Y   au

     X  

    u

     X   X  

    Y  ==++=++=

    ∗∗∗∗  ε ε β β β 

    β 55

    %5

    *%%

    *

    cu scopul de a obţine estimatori nedeplasaţi, consistenţi şi eficienţi. 6e comparat estimaţiile

    obţinute cu rezultatele de la primul punct.

    D 6e prezentat un raport al studiului.

    :F