1 AULA 05 Anlise de regress£o mltipla: infer .2 – Os objetivos de realizar transforma§µes

  • View
    213

  • Download
    0

Embed Size (px)

Text of 1 AULA 05 Anlise de regress£o mltipla: infer .2 – Os objetivos de realizar...

1

AULA 05

Anlise de regresso mltipla:

inferncia

Ernesto F. L. Amaral

19 de julho de 2013

Anlise de Regresso Linear (MQ 2013)

www.ernestoamaral.com/mq13reg.html

Fonte:

Wooldridge, Jeffrey M. Introduo econometria: uma abordagem moderna. So Paulo: Cengage Learning, 2008. Captulo 4 (pp.110-157).

2

Os objetivos de realizar transformaes de variveis

independentes e dependente so:

Alcanar distribuio normal da varivel dependente.

Estabelecer correta relao entre varivel dependente e

independentes.

Fazer uma transformao de salrio, especialmente

tomando o log, produz uma distribuio que est mais

prxima da normal.

Sempre que y assume apenas alguns valores, no podemos

ter uma distribuio prxima de uma distribuio normal.

Essa uma questo emprica. (Wooldridge, 2008: 112)

TRANSFORMAO QUESTO EMPRICA

3

Varivel dependente em alguns modelos:

Lineares (MQO): deve ter nvel de mensurao de razo

(contnua) e distribuio normal (logaritmo reduz

concentrao esquerda de variveis com valores positivos

diferentes de zero).

Logsticos e probit: varivel dicotmica.

Multinomiais: varivel nominal com mais de duas categorias.

Poisson: varivel contagem com concentrao em zero.

Varivel independente:

Se for contnua, deve ter distribuio normal (logaritmo).

Se for contnua, tambm podemos calcular o quadrado (x2) e

incluir junto com varivel independente original (x).

Se for categrica, buscamos distribuio uniforme entre

categorias, mas nem sempre possvel (categoria de

referncia geralmente possui vrios casos).

EXEMPLOS DE TRANSFORMAES

4

As hipteses BLUE, adicionadas hiptese da normalidade

(erro no-observado normalmente distribudo na

populao), so conhecidas como hipteses do modelo

linear clssico (MLC).

Distribuio normal homoscedstica com uma nica varivel

explicativa:

MODELO LINEAR CLSSICO

Fonte: Wooldridge, 2008: 111.

5

Podemos fazer testes de hipteses sobre um nico

parmetro da funo de regresso populacional.

Os j so caractersticas desconhecidas da populao.

Na maioria das aplicaes, nosso principal interesse testar

a hiptese nula (H0: j = 0).

Como j mede o efeito parcial de xj sobre o valor esperado

de y, aps controlar todas as outras variveis independentes,

a hiptese nula significa que, uma vez que x1, x2, ..., xk foram

considerados, xj no tem nenhum efeito sobre o valor

esperado de y.

O teste de hiptese na regresso mltipla semelhante ao

teste de hiptese para a mdia de uma populao normal.

difcil obter os coeficientes, erros-padro e valores crticos,

mas os programas economtricos (nosso amigo Stata)

calculam estas estimativas automaticamente.

TESTES DE HIPTESE

6

A estatstica t a razo entre o coeficiente estimado (j) e

seu erro padro: ep(j).

O erro padro sempre positivo, ento a razo t sempre

ter o mesmo sinal que o coeficiente estimado.

Valor estimado de beta distante de zero evidncia contra a

hiptese nula, mas devemos ponderar pelo erro amostral.

Como o erro-padro de j uma estimativa do desvio-

padro de j, o teste t mede quantos desvios-padro

estimados j est afastado de zero.

Isso o mesmo que testar se a mdia de uma populao

zero, usando a estatstica t padro.

A regra de rejeio depende da hiptese alternativa e do

nvel de significncia escolhido do teste.

Sempre testamos hiptese sobre parmetros populacionais,

e no sobre estimativas de uma amostra particular.

TESTE t

7

Dado o valor observado da estatstica t, qual o menor nvel

de significncia ao qual a hiptese nula seria rejeitada?

No h nvel de significncia correto.

O p-valor a probabilidade da hiptese nula no ser

rejeitada:

p-valores pequenos so evidncias contra hiptese nula.

p-valores grandes fornecem pouca evidncia contra H0.

Se o nvel de significncia do teste, ento H0 rejeitada

se p-valor < .

H0 no rejeitada ao nvel de 100*%.

p-VALORES DOS TESTES t

8

H1: j > 0 OU H1: j < 0

Devemos decidir sobre um nvel de significncia

(geralmente de 5%).

Corremos o risco de rejeitar erroneamente H0, quando ela

verdadeira, em 5% das vezes (erro tipo I igual ao ).

Um valor suficientemente grande de t, com um nvel de

significncia de 5%, o 95 percentil de uma distribuio t

com n-k-1 graus de liberdade (ponto c).

Regra de rejeio que H0 rejeitada em favor de H1, se

t>c (H1:j>0) ou t

9

REGRA DE REJEIO DE H0 (UNILATERAL)

Fonte: Wooldridge, 2008: 117.

H0: j 0

t j > c

p-valor = P(T > t)

p-valor = P(T > |t|)

Como Stata calcula p-valor bilateral,

s dividir por 2 para obter o p-valor

unilateral.

10

REGRA DE REJEIO DE H0 (UNILATERAL)

Fonte: Wooldridge, 2008: 119.

H0: j >= 0 ou H0: j = 0

H1: j < 0

t j < - c

p-valor = P(T < t)

p-valor = P(T > |t|)

Como Stata calcula p-valor bilateral, s

dividir por 2 para obter o p-valor unilateral.

11

H1: j 0

Essa hiptese relevante quando o sinal de j no bem

determinado pela teoria.

Usar as estimativas da regresso para nos ajudar a formular

as hipteses nula e alternativa no permitido, porque a

inferncia estatstica clssica pressupe que formulamos as

hipteses nula e alternativa sobre a populao antes de

olhar os dados.

Quando a alternativa bilateral, estamos interessados no

valor absoluto da estatstica t: |t|>c.

Para um nvel de significncia de 5% e em um teste bi-

caudal, c escolhido de forma que a rea em cada cauda da

distribuio t seja igual a 2,5%.

Se H0 rejeitada, xj estatisticamente significante (ou

estatisticamente diferente de zero) ao nvel de 5%.

TESTE: HIPTESES ALTERNATIVAS BILATERAIS

12

REGRA DE REJEIO DE H0 (BILATERAL)

Fonte: Wooldridge, 2008: 122.

H0: j = 0

H1: j 0

|t j| > c

p-valor=P(|T| > |t|)

13

EXEMPLO DE NO-REJEIO DE H0 (BILATERAL)

Fonte: Wooldridge, 2008: 127.

p-valor

= P(|T| > |t|)

= P(|T| > 1,85)

= 2P(T > 1,85)

= 2(0,0359)

= 0,0718

p-valor >

0,0718 > 0,05

H0 : j=0 no rejeitada

14

Poderamos supor que uma varivel dependente (log do

nmero de crimes) necessariamente ser relacionada

positivamente com uma varivel independente (log do

nmero de estudantes matriculados na universidade).

A hiptese alternativa testar se o aumento de 1% nas

matrculas aumentar o crime em mais de 1%:

H0: j = 1

H1: j > 1

t = (estimativa - valor hipottico) / (erro-padro)

Neste exemplo, t = (j - 1) / ep(j)

Observe que adicionar 1 na hiptese nula, significa subtrair

1 no teste t.

Rejeitamos H0 se t > c, em que c o valor crtico unilateral.

TESTES DE OUTRAS HIPTESES SOBRE j

15

DECISO SOBRE HIPTESES

Hipteses p < p >

Hiptese nula

(H0) Rejeita No rejeita

Hiptese alternativa

(H1) Aceita No aceita

p-valor: a

probabilidade de

no rejeitar a

hiptese nula.

Como Stata

calcula p-valor

bilateral, divida

por 2 para obter

p-valor unilateral.

Nvel de significncia

()

Nvel de confiana

(NC)

0,10 (10%) 90%

0,05 (5%) 95%

0,01 (1%) 99%

0,001 (0,1%) 99,9%

16

Ao testar H0, chegamos a uma concluso de rejeit-la ou de

deixar de rejeit-la.

Tais concluses podem estar corretas ou erradas.

: probabilidade de erro tipo I (probabilidade de rejeitar

hiptese nula quando ela verdadeira).

: probabilidade de erro tipo II (probabilidade de deixar de

rejeitar hiptese nula quando ela falsa).

ERROS TIPO I E TIPO II

17

Os intervalos de confiana (IC), ou estimativas de intervalo,

permitem avaliar uma extenso dos valores provveis do

parmetro populacional, e no somente estimativa pontual:

Valor inferior: j - c*ep(j)

Valor superior: j + c*ep(j)

A constante c o 97,5 percentil de uma distribuio tn-k-1.

Quando n-k-1>120, podemos usar a distribuio normal

para construir um IC de 95% (c=1,96).

Se amostras aleatrias fossem repetidas, ento valor

populacional estaria dentro do IC em 95% das amostras.

Esperamos ter uma amostra que seja uma das 95% de

todas amostras em que estimativa de intervalo contm beta.

Se a hiptese nula for H0:j=aj, H0 rejeitada contra H1:jaj,

ao nvel de significncia de 5%, se aj no est no IC.

INTERVALOS DE CONFIANA

18

importante levar em considerao a magnitude das

estimativas dos coeficientes, alm do tamanho das

estatsticas t.

A significn