50
Estatística II Ricardo Bruno N. dos Santos Professor Adjunto da Faculdade de Economia e do PPGE (Economia) UFPA UNIVERSIDADE FEDERAL DO PARÁ INSTITUTO DE CIÊNCIAS SOCIAIS APLICADAS FACULDADE DE ECONOMIA

Tópico 4 regressão linear simples 02

Embed Size (px)

Citation preview

Page 1: Tópico 4   regressão linear simples 02

Estatística II

Ricardo Bruno N. dos SantosProfessor Adjunto da Faculdade de Economia

e do PPGE (Economia) UFPA

UNIVERSIDADE FEDERAL DO PARÁINSTITUTO DE CIÊNCIAS SOCIAIS APLICADAS

FACULDADE DE ECONOMIA

Page 2: Tópico 4   regressão linear simples 02

O Modelo Clássico de Regressão

Linear Normal (MCRLN)Até o momento foi verificado como estimar os valores

dos 𝛽′𝑠 e para o MRLS. Porém existe uma etapa muitoimportante, que são os testes de hipóteses. São tais testesque tornam possível a inferência estatística, ou seja, nos dãoum grau de “tranquilidade” para afirmar se nossasestimativas da FRA são realmente próximas a FRP.

Para que tal aspecto seja válido, devemos consideraruma pressuposição fundamental sobre os resíduos, devemosconsiderar e provar que os mesmos são normais.

Page 3: Tópico 4   regressão linear simples 02

A hipótese de normalidade de 𝒖𝒊

Foi verificado que:

Média: 𝐸 𝑢𝑖 = 0

Variância: 𝐸 𝑢𝑖 − 𝐸 𝑢𝑖2 = 𝐸 𝑢𝑖

2 = 𝜎2

Covariância: 𝐸 𝑢𝑖 − 𝐸 𝑢𝑖 𝑢𝑗 − 𝐸 𝑢𝑗

= 𝐸 𝑢𝑖𝑢𝑗 = 0

Todas as hipóteses acima podem ser representadas deforma compacta, pelo indicativo que os resíduos possuemuma distribuição normal com média 0 e variância constante:

𝒖𝒊~𝑵 𝟎, 𝝈𝟐

Page 4: Tópico 4   regressão linear simples 02

A hipótese de normalidade de 𝒖𝒊

Por que usar a normalidade:

1) Pelo fato dos resíduos 𝑢𝑖 serem uma influênciacombinada (sobre a variável independente) de um conjuntode variáveis independentes não incluídas no modelo, porémcom pouca influência sobre a variável dependente. A maiorparte das distribuições quando apresentam crescimento noseu número de observações tornam-se normais, e como oresíduo representa variáveis não incluídas no modelo,imagina-se que, segundo o TEOREMA DO LIMITE CENTRAL(TLC), a soma de tais variáveis levem a uma distribuiçãonormal.

Page 5: Tópico 4   regressão linear simples 02

A hipótese de normalidade de 𝒖𝒊

2) Mesmo não sendo grande o número de variáveis e que asmesmas não sejam independentes, a sua soma pode ainda sernormal.

3) Como os 𝛽′𝑠 são funções lineares de 𝑢𝑖, então podemosconcluir que os estimadores tendem a uma normal.

4) A facilidade do uso da distribuição normal, por conterapenas dois parâmetros (média e variância), tornou seu uso muitofrequente, bem como o direcionamento para vários estudos eresultados baseados nessas pressuposições.

5) Mesmo com uma amostra inferior a 100 observaçõesainda podemos relaxar a hipótese de normalidade, para tanto,usa-se outras distribuições como a t, F e 2 (qui-quadrado), quepossuem o comportamento de uma normal, quando aplicado oTLC.

Page 6: Tópico 4   regressão linear simples 02

Propriedade dos estimadores de MQO

sobre a hipótese de normalidadeConsiderando que os resíduos possuem uma

distribuição normal, então podemos afirmar sobre osestimadores que:

1) São não viesados

2) Tem variância mínima.

COMBINANDO 1 COM 2 TEREMOS ESTIMADORES EFICIENTES

3) São Consistentes; à medida que o tamanho da amostraaumenta indefinidamente, os estimadores convergem para osverdadeiros valores da população. (Ou seja FRA≈FRP).

Page 7: Tópico 4   regressão linear simples 02

Propriedade dos estimadores de MQO

sobre a hipótese de normalidade4) 𝛽1 ( que é uma função linear de 𝑢_𝑖 ) apresenta

distribuição normal com

Média: E 𝛽1 = 𝛽1

Variância: 𝑣𝑎𝑟 𝛽1 : 𝜎 𝛽1

2 = 𝑋𝑖

2

𝑛 𝑥𝑖2 𝜎2

Ou seja 𝛽1~𝑁 𝛽1, 𝜎 𝛽1

2

Pelas propriedades da distribuição normal, a variável Z, queé definida como:

𝑍 = 𝛽1 − 𝛽1

𝜎 𝛽1

Que por sua vez segue uma distribuição normal padrão,com média zero e variância =1.

𝑍~𝑁(0,1)

Page 8: Tópico 4   regressão linear simples 02

Propriedade dos estimadores de MQO

sobre a hipótese de normalidade5) Como 𝛽2 (sendo uma função linear de 𝑢𝑖 ) tem

distribuição normal com

Média: E 𝛽2 = 𝛽2

Variância: 𝑣𝑎𝑟 𝛽2 : 𝜎 𝛽2

2 =𝜎2

𝑥𝑖2

Ou seja 𝛽2~𝑁 𝛽2, 𝜎 𝛽2

2

Pelas propriedades da distribuição normal, a variável Z,que é definida como:

𝑍 = 𝛽2 − 𝛽2

𝜎 𝛽2

Page 9: Tópico 4   regressão linear simples 02

Propriedade dos estimadores de MQO

sobre a hipótese de normalidadeGeometricamente podemos representar as

distribuições dos estimadores a partir dos seguintes gráficos:

Page 10: Tópico 4   regressão linear simples 02

Propriedade dos estimadores de MQO

sobre a hipótese de normalidade6) (n-2)( 𝜎2/𝜎2 ) segue a distribuição de 2 (qui-

quadrado) com (n-2) graus de liberdade. Essa informação nosajuda a fazer inferência sobre o verdadeira 𝜎2 com base noseu valor estimado.

7) A distribuição dos ’s são independentes de 𝜎2.

8) 𝛽1 e 𝛽2 possuem a variância mínima dentro dasclasses dos estimadores não viesados, sejam lineares ou não.

Page 11: Tópico 4   regressão linear simples 02

MRLS: Estimação de intervalo e testes de

hipóteses

A principal ideia da estimação de intervalos lembremosdo resultado da Propensão Marginal a Consumir encontrada apartir dos dados da Tabela 3.2. O valor de 𝛽2 = 0,51, querepresenta uma única estimativa (pontual) do valordesconhecido da população 𝛽2. A pergunta é: Até que pontoessa estimativa é CONFIÁVEL? Em Estatística, a confiabilidadede um estimador pontual é medida por seu ERRO PADRÃO.

Em vez de considerar apenas a estimativa pontual,podemos construir um intervalo em torno de um estimadorpontual, de dois ou três erros padrão de cada lado doestimador pontual, de modo que este intervalo tenha, porexemplo, 95% DE PROBABILIDADE DE INCLUIR O VERDADEIROVALOR DO PARÂMETRO. Essa é a ideia que está por trás daestimação de intervalo.

Page 12: Tópico 4   regressão linear simples 02

MRLS: Estimação de intervalo e testes de

hipóteses

Um exemplo disso seria supormos que temos doisnúmeros positivos e , sendo situado entre 0 e 1, oelemento a ser encontrado é de que a probabilidade de que o

intervalo aleatório ( 𝛽2 − 𝛿, 𝛽2 + 𝛿) contenha o verdadeirovalor de 𝛽2 seja de 1 − 𝛼. Assim:

Pr 𝛽2 − 𝛿 ≤ 𝛽2 ≤ 𝛽2 + 𝛿 = 1 − 𝛼, onde:

1 − 𝛼: Coeficiente de confiança; (se =5%, teremos95% de confiança de estar corretos).

: Nível de significância.

𝛽2 − 𝛿: Limite inferior de confiança

𝛽2 + 𝛿: Limite superior de confiança.

Page 13: Tópico 4   regressão linear simples 02

MRLS: Estimação de intervalo e testes de

hipóteses

Intervalos de confiança para 𝜷𝟏 e 𝜷𝟐Verificamos que, dada a hipótese de normalidade dos

resíduos, teríamos:

𝑍 = 𝛽2 − 𝛽2

𝑒𝑝 𝛽2

=

𝛽2 − 𝛽2 𝑥𝑖2

𝜎Assim poderíamos afirmar que:

𝑡 = 𝛽2 − 𝛽2

𝑒𝑝 𝛽2

=𝐸𝑠𝑡𝑖𝑚𝑎𝑑𝑜𝑟 − 𝑃𝑎𝑟â𝑚𝑒𝑡𝑟𝑜

𝑒𝑟𝑟𝑜 𝑝𝑎𝑑𝑟ã𝑜 𝑒𝑠𝑡𝑖𝑚𝑎𝑑𝑜 𝑑𝑜 𝑒𝑠𝑡𝑖𝑚𝑎𝑑𝑜𝑟

Page 14: Tópico 4   regressão linear simples 02

MRLS: Estimação de intervalo e testes de

hipóteses

Intervalos de confiança para 𝜷𝟏 e 𝜷𝟐Nesse caso, em vez de usar uma distribuição normal,

podemos utilizar a distribuição t para estabelecer umintervalo de confiança para 𝛽2 como abaixo:

Pr(−𝑡𝛼/2 ≤ 𝑡 ≤ 𝑡𝛼/2)= 1 − 𝛼

Assim teríamos:

Pr(−𝑡𝛼/2 ≤ 𝛽2−𝛽2

𝑒𝑝 𝛽2≤ 𝑡𝛼/2)= 1 − 𝛼

Que reorganizado nos fornece:

Pr[ 𝛽2 − 𝑡𝛼2𝑒𝑝 𝛽2 ≤ 𝛽2 ≤ 𝛽2 + 𝑡𝛼

2𝑒𝑝 𝛽2 ] = 1 − 𝛼

Assim o intervalo será: 𝛽2 ± 𝑡𝛼

2𝑒𝑝 𝛽2

Page 15: Tópico 4   regressão linear simples 02

MRLS: Estimação de intervalo e testes de

hipóteses

Intervalos de confiança para 𝜷𝟏 e 𝜷𝟐A linha de raciocínio anterior também vale para 𝛽1,

logo:

Pr[ 𝛽1 − 𝑡𝛼2𝑒𝑝 𝛽1 ≤ 𝛽1 ≤ 𝛽1 + 𝑡𝛼

2𝑒𝑝 𝛽1 ] = 1 − 𝛼

Assim o intervalo será: 𝛽1 ± 𝑡𝛼

2𝑒𝑝 𝛽1

Page 16: Tópico 4   regressão linear simples 02

MRLS: Estimação de intervalo e testes de

hipóteses

Intervalos de confiança para 𝜷𝟏 e 𝜷𝟐Vamos consideras os valores encontrados para a

estimativa da PMC da tabela 3.2. Considere os valores de 𝛽2 = 0,509, como temos 10 observações, então o grau de

liberdade será 8. Supondo que =5%, a tabela t mostra para 8graus de liberdade o valor crítico de 𝑡𝛼/2 = 2,306

Substituindo os valores até então encontrados naequação abaixo teremos:

𝛽2 ± 𝑡𝛼2𝑒𝑝 𝛽2

= 0,509 + 2,306 ∗ 0,0357428 = 0,5914= 0,509 − 2,306 ∗ 0,0357428 = 0,4266

Logo: 0,4266 ≤ 𝛽2 ≤ 0,5914

Page 17: Tópico 4   regressão linear simples 02

MRLS: Estimação de intervalo e testes de

hipóteses

Intervalos de confiança para 𝜷𝟏 e 𝜷𝟐Assim, com uma confiança de 95% de estarmos certos,

ou seja, em 95 de 100 casos, os intervalos de 𝛽2 conterão overdadeiro 𝛽2.

Para o 𝛽1 teremos:= 24,45 + 2,306 ∗ 6,41 = 39,23

= 24,45 − 2,306 ∗ 6,41 = 9,67

Logo: 9,67 ≤ 𝛽1 ≤ 39,23

Page 18: Tópico 4   regressão linear simples 02

MRLS: Estimação de intervalo e testes de

hipóteses

Intervalos de confiança para 𝝈𝟐.O intervalo de confiança para a variância dos resíduos

estará pautado em um distribuição do tipo qui-quadrado onde:

2 = 𝑛 − 2 𝜎2

𝜎2

Que pode ser utilizada para estabelecer o intervalo deconfiança, onde:

Pr 1−

𝛼2

2 ≤ 2 ≤ 𝛼2

2 = 1 − 𝛼

onde o valor da distribuição 2 no meio dessa dupla desigualdade

é dado pela 1ª Equação acima onde 1−𝛼/22 e 𝛼/2

2 são dois valores

de 2 (os valores críticos de 2) obtidos na tabela de qui-quadradopara n-2 gl, de modo que eles excluem 100(/2)% das áreascaudais da distribuição de qui-quadrado.

Page 19: Tópico 4   regressão linear simples 02

MRLS: Estimação de intervalo e testes de

hipóteses

Intervalos de confiança para 𝝈𝟐

Consultado a tabela qui-quadrado para (n-2) graus de

liberdade (8), teremos o seguintes valores:0,0252 = 17,5346

e 0,9752 = 2,1797. Tais valores mostram que a probabilidade

de que um valor 2 superior a 17,5346 e de 2,5% e o de2,1797 é de 97,5%. Portanto, o intervalo entre esses doisvalores é o intervalo de confiança de 95% para 2, como ográfico a seguir, mas antes, verifiquemos como se consulta ovalor na tabela qui-quadrado.

No slide seguinte temos a apresentação do gráfico da2.

Page 20: Tópico 4   regressão linear simples 02

MRLS: Estimação de intervalo e testes de

hipóteses

Intervalos de confiança para 𝝈𝟐

Page 21: Tópico 4   regressão linear simples 02

MRLS: Estimação de intervalo e testes de

hipóteses

Intervalos de confiança para 𝝈𝟐

Se substituirmos o 2 = 𝑛 − 2 𝜎2

𝜎2 em Pr 1−

𝛼

2

2 ≤

Page 22: Tópico 4   regressão linear simples 02

MRLS: Estimação de intervalo e testes de

hipóteses

Intervalos de confiança para 𝝈𝟐

8 ∗42,1591

2,1797= 154,734

8 ∗42,1591

17,5346= 19,2347

Assim teremos: 19,23 ≤ 𝜎2 ≤ 154,73

Ou seja, se estabelecermos limites de confiança de 95%em 𝜎2 e se mantivermos a priori que esses limites incluem overdadeiro 𝜎2, estaremos certos 95% das vezes a longo prazo.

Page 23: Tópico 4   regressão linear simples 02

MRLS: Estimação de intervalo e testes de

hipóteses

Os testes de hipótesesA pergunto é: Quais as hipóteses devem ser feitas sobre os

estimadores ’s?

Devemos saber se esses estimadores são ou não diferentesde zero, ou seja, estabelecemos a hipótese nula e alternativareferente a um valor específico dos betas, a referência então serádizer que os betas são não significativos, ou seja, serão zero.

𝐻0: 𝛽 = 0𝐻1: 𝛽 ≠ 0

O 𝛽2 observado é compatível com 𝐻0? Para respondermosa essa pergunta, voltemos ao intervalo (0,4266;0,5914) conterão,com 95% de probabilidade de não cometer o erro tipo I, overdadeiro valor de 𝛽2 . Quando um teste especifica uma diferençaela pode ser para mais ou para menos, o que indica dois pontosdistintos, esse é um tipo de TESTE BICAULDAL ou BILATERAL.

Page 24: Tópico 4   regressão linear simples 02

MRLS: Estimação de intervalo e testes de

hipóteses

Os testes de hipótesesConsequentemente, a longo prazo (em repetidas

amostras), esses intervalos proporcionam faixas ou limitesdentro dos quais o verdadeiro 𝛽2 pode situar-se com umcoeficiente de confiança de, por exemplo, 95%. O intervalo deconfiança oferece um conjunto de hipóteses nulas plausíveis.Se 𝛽2 sob 𝐻0 cair no intervalo de confiança de 100(1-)%,NÃO REJEITAREMOS a hipótese nula; se estiver situada foradesse intervalo, poderemos rejeita-la. Podemos ver essa faixano gráfico a seguir.

Page 25: Tópico 4   regressão linear simples 02

MRLS: Estimação de intervalo e testes de

hipóteses

Os testes de hipótesesTeste UNILATERAL ou UNICAUDAL: quando se tem

certeza de que o coeficiente terá um determinadocomportamento, por exemplo, sabemos que o coeficiente deinclinação da regressão de demanda do consumidor énegativo, portanto podemos estabelecer uma hipótese sobre𝛽2 onde:

𝐻0: 𝛽2 < 0

Essa é uma forte expectativa teórica (a priori) sobre ocomportamento da demanda do consumidor, que indica queaumentos dos preços provocam queda na quantidadedemandada de um bem.

Page 26: Tópico 4   regressão linear simples 02

MRLS: Estimação de intervalo e testes de

hipóteses

Os testes de hipóteses: a significância do testeApesar de válida, a abordagem do intervalo de

confiança é demorada e visualmente complicada de semostrar, uma forma rápida e eficiente de se testar hipótesesestatísticas são pelos testes de significância. O maisconhecido e comum teste é o teste t de student.

Considerando a premissa da normalidade verificou-seque:

𝑡 = 𝛽2 − 𝛽2

𝑒𝑝 𝛽2

Page 27: Tópico 4   regressão linear simples 02

MRLS: Estimação de intervalo e testes de

hipóteses

Os testes de hipóteses: a significância do testeO teste é feito se avaliando o valor calculado pela

função anterior comparado com o valor tabelado, se o valorcalculado for maior que o tabelado, teremos a rejeição dahipótese nula H0. Vamos mostrar através de um infográfico ocálculo da estatística t e sua comparação com o valortabelado para o modelo de regressão da propensão marginala consumir:

A hipótese aqui testada é a de que Beta 2 é igual a zero,assim:

𝐻𝑜: 𝛽2 = 0, ou seja, trata-se de uma hipótese bicaudal.

Vejamos o procedimento de rejeição ou não de talhipótese:

Page 28: Tópico 4   regressão linear simples 02

MRLS: Estimação de intervalo e testes de

hipóteses

Os testes de hipóteses: a significância do teste

1º Qual a Hipótese?𝐻0: 𝛽2 = 0

O valor do t calculado é:

𝑡𝑐𝑎𝑙𝑐 =0,51

0,0357= 14,29

O 𝑡𝑡𝑎𝑏𝑒𝑙𝑎𝑑𝑜 éPara 10% = 1,86Para 5% = 2,306Para 1%= 3,355

A CONCLUSÃO:Como o valor de t Tabelado é

Maior que o Calculado, rejeitamos a Hipótese nula

𝐻0 de que o 𝛽2 = 0

Page 29: Tópico 4   regressão linear simples 02

MRLS: Estimação de intervalo e testes de

hipóteses

Os testes de hipóteses: a significância do testeA hipótese pode ser feita também sobre algum tipo de

restrição, vamos usar um exemplo hipotético, imagine que ocoeficiente 𝛽2 de uma função seja = 2,3; e seu erro padrãoseja de 0,32, assim teríamos

𝑡 =2,3

0,32= 7,19, que é significativa, ou seja, rejeita-se

H0. Agora imagine que exista uma restrição para essa variávelafirmando que na verdade ela é igual a 0,5, assim nossahipótese mudaria para, considere n=13 e =5%:

𝐻0: 𝛽2 = 0,5; originando a seguinte restrição:𝐻0: 𝛽2 − 0,5 = 0

Page 30: Tópico 4   regressão linear simples 02

MRLS: Estimação de intervalo e testes de

hipóteses

Os testes de hipóteses: a significância do testeDessa forma passamos a testar:

𝑡 = 𝛽2 − 0,5

𝑒𝑝 𝛽2

Assim teríamos:

𝑡 =2,3 − 0,5

0,32= 5,625

Pelo resultado acima ainda rejeitamos H0, logo,podemos concluir que 𝛽2 ≠ 0,5.

O gráfico para uma situação como essa seria algo dotipo:

Page 31: Tópico 4   regressão linear simples 02

MRLS: Estimação de intervalo e testes de

hipóteses

Os testes de hipóteses: a significância do teste

Page 32: Tópico 4   regressão linear simples 02

MRLS: Estimação de intervalo e testes de

hipóteses

Os testes de hipóteses: a significância do teste

Page 33: Tópico 4   regressão linear simples 02

MRLS: Estimação de intervalo e testes de

hipóteses

Os testes de hipóteses: a significância do testeVamos considerar agora o mesmo exemplo, porém na

ótica do teste unilateral para fixarmos tal aplicação econceito.

Vamos supor agora que a inclinação seja maior que 0,5,ou seja, a hipótese a ser testada agora é:

𝐻0: 𝛽2 ≤ 0,5𝐻1: 𝛽2 > 0,5

Ou seja, a hipótese agora remete apenas a um lado dadistribuição, agora ela possui característica unilateral. Oprocedimento para o cálculo de tal hipótese ainda permaneceo mesmo, a única coisa que muda será o valorcorrespondente do , considerando o nível de 5%, teremos:

Page 34: Tópico 4   regressão linear simples 02
Page 35: Tópico 4   regressão linear simples 02

MRLS: Estimação de intervalo e testes de

hipóteses

Os testes de hipóteses: a significância do testeTeste de significância para o 𝝈𝟐.

Vamos tomar como exemplo o valor calculado para avariância dos resíduos estimado no modelo da PMC. 𝜎2 =42,1591 e o grau de liberdade 8. Se postularmos que𝐻0: 𝜎2 = 85 e 𝐻1: 𝜎2 ≠ 85 a equação envolvendo o qui-

quadrado 𝑛 − 2 𝜎2

𝜎2 = 2 nos fornece o teste estatístico para

𝐻0. Substituindo os valores nos parâmetros da fórmula doqui-quadrado, verificamos que, para 𝐻0 , 2 = 3,97 . Seassumirmos =5%, os valores críticos de 2 serão 2,1797 e17,5346. Como o valor do 2 = 3,97 encontra-se dentrodeste intervalo não rejeitamos, portanto, a hipótese nula.

Page 36: Tópico 4   regressão linear simples 02

MRLS: Estimação de intervalo e testes de

hipóteses

Os testes de hipóteses: a significância do testePara avaliar o teste qui-quadrado sobre a variância dos

resíduos devemos considerar:

Page 37: Tópico 4   regressão linear simples 02

MRLS: Análise de Regressão e Análise de

Variância

Verificamos que

𝑦𝑖2 = 𝑦𝑖

2 + 𝑢𝑖2

= 𝛽22 𝑥𝑖

2 + 𝑢𝑖2

Ou seja, SQT=SQE+SQR

Todos esses resultados podem ser organizados em umatabela, que é a tabela da ANOVA.

Page 38: Tópico 4   regressão linear simples 02

MRLS: Análise de Regressão e Análise de

Variância

Page 39: Tópico 4   regressão linear simples 02

MRLS: Análise de Regressão e Análise de

Variância

Se preenchermos a tabela anterior com os dadosobtidos no exemplo da seção 3.6, poderemos encontrar umaimportante estatística do MRLS que é a estatística F, assim,teremos os seguintes resultados:

Page 40: Tópico 4   regressão linear simples 02

Aplicação da análise da regressão: o problema

da previsão

Um dos últimos procedimentos do MRLS é verificar a suaprevisão, iremos trabalhar nesse caso com a previsão média eindividual, tendo em vista que são as mais comuns de seremutilizadas, os procedimentos para tal uso necessitam que o alunotenha fixado os conceitos vistos anteriormente sobre variância,erro padrão e intervalo de confiança.

Vamos então utilizar o mesmo exemplo da propensãomarginal a consumir da seção 3.6, onde o seguinte modelo haviasido estimado:

𝑌0 = 24,4545 + 0,5091𝑋0

O termo sublinhado zero indica que estamos na etapainicial da previsão, ou seja, é o modelo cru. Agora imagine quequeiramos estimar o valor de Y quando X=20, assim:

Page 41: Tópico 4   regressão linear simples 02

Aplicação da análise da regressão: o problema

da previsão

𝑌20 = 24,4545 + 0,5091 20= 34,6365

Algo interessante a ser notado nesse resultado é que,quando a renda for 20 unidades monetárias, o consumo seráde 34,6365 unidades. Mas em termos de impactos teríamosque analisar da seguinte forma: um aumento de 20 unidadesmonetárias gera um aumento no consumo de 34,6365-24,4545= 10,182 unidades.

Temos que subtrair o intercepto para fazer a análise deimpacto, pois este se trata de um consumo médio quandonão existe variação, ou seja, o mesmo não pode sercomputado.

Page 42: Tópico 4   regressão linear simples 02

Aplicação da análise da regressão: o problema

da previsão

Para trabalhar essa estimativa em termos de intervadode confiança, teríamos que estimar a variância de Y, ou seja,𝑣𝑎𝑟 𝑌0 , onde, considerando uma distribuição normal,teremos:

𝑣𝑎𝑟 𝑌0 = 𝜎21

𝑛+

𝑋0 − 𝑋 2

𝑥𝑖2

Claro que a 𝜎2 deve ser substituída pelo seu valorestimado, ou seja, 𝜎2, o que nos gera:

𝑡 = 𝑌0 − 𝛽1 + 𝛽2𝑋0

𝑒𝑝 𝑌0

Page 43: Tópico 4   regressão linear simples 02

Aplicação da análise da regressão: o problema

da previsão

Com isso, o intervalo de confiança a ser formado será o:

Pr 𝛽1 + 𝛽2𝑋0 − 𝑡𝛼2𝑒𝑝 𝑌0 ≤ 𝛽1 + 𝛽2𝑋0 ≤ 𝛽1 + 𝛽2𝑋0 + 𝑡𝛼

2𝑒𝑝 𝑌0 = 1 − 𝛼

Em que o 𝑒𝑝 𝑌0 = 𝑣𝑎𝑟( 𝑌0)

Já verificamos que:

𝜎2 = 𝑢𝑖

2

𝑛 − 2=

337.2727

8= 42,1591 𝜎 = 6,493

𝑥𝑖2 = 33000

𝑋 = 170

Page 44: Tópico 4   regressão linear simples 02

Aplicação da análise da regressão: o problema

da previsão

Assim temos:

𝑣𝑎𝑟 𝑌0 = 42,15911

10+

20 − 170 2

33000

= 32,96

ep 𝑌0 = 5,74

Com isso podemos calcular o intervalo de confiançapara a projeção que será de:

34,6365 − 2,306 5,74 ≤ 𝐸 𝑌0 𝑋 = 20 ≤ 34,6365 + 2,306(5,74)

21,397 ≤ 𝐸 𝑌0 𝑋 = 20 ≤ 47,876

Page 45: Tópico 4   regressão linear simples 02

Aplicação da análise da regressão: o problema

da previsão

Para a individual teremos o seguinte comportamentono cálculo da variância de Y

𝑣𝑎𝑟 𝑌0 − 𝑌0 = 𝐸 𝑌0 − 𝑌02

= 𝜎2 1 +1

𝑛+

𝑋0 − 𝑋 2

𝑥𝑖2

E t será

𝑡 =𝑌0 − 𝑌0

𝑒𝑝 𝑌0 − 𝑌0

No caso do nosso exemplo verificamos que suavariância pontual será de 75,12, assim o intervalo deconfiança para 95% para 𝑌0 correspondente a 𝑋0 = 20 é:

(14,65 ≤ 𝑌0|𝑋0 = 20 ≤ 54,623)

Page 46: Tópico 4   regressão linear simples 02

Aplicação da análise da regressão: o problema

da previsão

O objetivo é que no final tenhamos um gráficosemelhante ao que se encontra a seguir:

Page 48: Tópico 4   regressão linear simples 02

Aplicação da análise da regressão: Teste de

Normalidade

Um dos principais pressupostos dentro do Modelo deRegressão linear é a de que os resíduos sejam normais. Logoapós a estimação do modelo de regressão o teste denormalidade pode ser feito, ou pode ser feitoespecificamente, com a variável em questão, nesse caso, osresíduos.

O teste mais comum de normalidade é o Jarque-Bera(JB). Ele faz o calculo baseado na assimetria (S) e na curtose(K) das variáveis.

As características das distribuições normais são de S=0e K=3.

Page 49: Tópico 4   regressão linear simples 02

Aplicação da análise da regressão: Teste de

Normalidade

O teste de JB é dado pela seguinte expressão:

𝐽𝐵 = 𝑛𝑆2

6+

𝐾 − 3 2

24

Note que se o pressuposto da normalidade sejaatendido S=0 e K=3, o valor do JB será zero, logo estamostestando na estatística de Jarque-Bera a seguinte hipótese:

𝐻0: 𝑁𝑜𝑟𝑚𝑎𝑙𝑖𝑑𝑎𝑑𝑒

Portanto, o principal resultado da estatística JB é nãorejeitar a hipótese nula.

Vamos ao exemplo da seção 3.6 (PMC) no Gretl.

Page 50: Tópico 4   regressão linear simples 02

FIM DO TÓPICO

4