33
Exemplo Regressão Linear Simples Gilberto A. Paula Departamento de Estatística IME-USP, Brasil [email protected] 1 o Semestre 2013 G. A. Paula (IME-USP) Área e Preço de Imóveis 1 o Semestre 2013 1 / 33

Exemplo Regressão Linear Simples - IME-USPgiapaula/slides_exemplo_vimoveis.pdf · Exemplo Regressão Linear Simples Gilberto A. Paula Departamento de Estatística IME-USP, Brasil

Embed Size (px)

Citation preview

Page 1: Exemplo Regressão Linear Simples - IME-USPgiapaula/slides_exemplo_vimoveis.pdf · Exemplo Regressão Linear Simples Gilberto A. Paula Departamento de Estatística IME-USP, Brasil

Exemplo Regressão Linear Simples

Gilberto A. Paula

Departamento de EstatísticaIME-USP, Brasil

[email protected]

1o Semestre 2013

G. A. Paula (IME-USP) Área e Preço de Imóveis 1o Semestre 2013 1 / 33

Page 2: Exemplo Regressão Linear Simples - IME-USPgiapaula/slides_exemplo_vimoveis.pdf · Exemplo Regressão Linear Simples Gilberto A. Paula Departamento de Estatística IME-USP, Brasil

Área e Preço de Imóveis

Sumário

1 Área e Preço de Imóveis

2 Análise de Dados Preliminar

3 Ajuste Preliminar Regressão Linear Simples

4 Ajuste Alternativo Regressão Linear Simples

5 Interpretações

6 Curvas Ajustadas

7 Bandas de Confiança

8 Conclusões

9 Referências

G. A. Paula (IME-USP) Área e Preço de Imóveis 1o Semestre 2013 2 / 33

Page 3: Exemplo Regressão Linear Simples - IME-USPgiapaula/slides_exemplo_vimoveis.pdf · Exemplo Regressão Linear Simples Gilberto A. Paula Departamento de Estatística IME-USP, Brasil

Área e Preço de Imóveis

Área e Preço de Imóveis

Descrição dos Dados

Vamos considerar neste exemplo uma amostra aleatória de 50 imóveisem que foi observado para cada um o preço de venda (em mil USD) ea área total (em mil pés quadrados)a numa região de Eugene, EUA(Gray, 1989). O objetivo principal do estudo é tentar explicar (ouprever) o preço de venda do imóvel dada a área total.

a1ft2 = 0, 092903m2

G. A. Paula (IME-USP) Área e Preço de Imóveis 1o Semestre 2013 3 / 33

Page 4: Exemplo Regressão Linear Simples - IME-USPgiapaula/slides_exemplo_vimoveis.pdf · Exemplo Regressão Linear Simples Gilberto A. Paula Departamento de Estatística IME-USP, Brasil

Análise de Dados Preliminar

Sumário

1 Área e Preço de Imóveis

2 Análise de Dados Preliminar

3 Ajuste Preliminar Regressão Linear Simples

4 Ajuste Alternativo Regressão Linear Simples

5 Interpretações

6 Curvas Ajustadas

7 Bandas de Confiança

8 Conclusões

9 Referências

G. A. Paula (IME-USP) Área e Preço de Imóveis 1o Semestre 2013 4 / 33

Page 5: Exemplo Regressão Linear Simples - IME-USPgiapaula/slides_exemplo_vimoveis.pdf · Exemplo Regressão Linear Simples Gilberto A. Paula Departamento de Estatística IME-USP, Brasil

Análise de Dados Preliminar

Medidas Resumo

Descrição

Medida Área Total Preço Vendan 50 50Média 1,900 74,30D.Padrão 0,627 26,48CV 33% 36%

Mínimo 0,800 30,601o Quartil 1,500 57,00Mediana 1,945 68,403o Quartil 2,240 85,57Máximo 4,000 165,00

G. A. Paula (IME-USP) Área e Preço de Imóveis 1o Semestre 2013 5 / 33

Page 6: Exemplo Regressão Linear Simples - IME-USPgiapaula/slides_exemplo_vimoveis.pdf · Exemplo Regressão Linear Simples Gilberto A. Paula Departamento de Estatística IME-USP, Brasil

Análise de Dados Preliminar

Boxplot Área Total do Imóvel

1.0

1.5

2.0

2.5

3.0

3.5

4.0

Áre

a d

o Im

óve

l

G. A. Paula (IME-USP) Área e Preço de Imóveis 1o Semestre 2013 6 / 33

Page 7: Exemplo Regressão Linear Simples - IME-USPgiapaula/slides_exemplo_vimoveis.pdf · Exemplo Regressão Linear Simples Gilberto A. Paula Departamento de Estatística IME-USP, Brasil

Análise de Dados Preliminar

Boxplot Preço de Venda do Imóvel

40

60

80

10

01

20

14

01

60

Pre

ço d

e V

en

da

do

Im

óve

l

G. A. Paula (IME-USP) Área e Preço de Imóveis 1o Semestre 2013 7 / 33

Page 8: Exemplo Regressão Linear Simples - IME-USPgiapaula/slides_exemplo_vimoveis.pdf · Exemplo Regressão Linear Simples Gilberto A. Paula Departamento de Estatística IME-USP, Brasil

Análise de Dados Preliminar

Dispersão Área Total e Preço de Venda

1.0 1.5 2.0 2.5 3.0 3.5 4.0

4060

8010

012

014

016

0

Área do Imóvel

Preç

o de

Ven

da

G. A. Paula (IME-USP) Área e Preço de Imóveis 1o Semestre 2013 8 / 33

Page 9: Exemplo Regressão Linear Simples - IME-USPgiapaula/slides_exemplo_vimoveis.pdf · Exemplo Regressão Linear Simples Gilberto A. Paula Departamento de Estatística IME-USP, Brasil

Ajuste Preliminar Regressão Linear Simples

Sumário

1 Área e Preço de Imóveis

2 Análise de Dados Preliminar

3 Ajuste Preliminar Regressão Linear Simples

4 Ajuste Alternativo Regressão Linear Simples

5 Interpretações

6 Curvas Ajustadas

7 Bandas de Confiança

8 Conclusões

9 Referências

G. A. Paula (IME-USP) Área e Preço de Imóveis 1o Semestre 2013 9 / 33

Page 10: Exemplo Regressão Linear Simples - IME-USPgiapaula/slides_exemplo_vimoveis.pdf · Exemplo Regressão Linear Simples Gilberto A. Paula Departamento de Estatística IME-USP, Brasil

Ajuste Preliminar Regressão Linear Simples

Regressão Linear Simples

Descrição

Nota-se indícios de aumento do preço de venda do imóvel com oaumento da área total do imóvel, sugerindo inicialmente o seguintemodelo de regressão linear simples:

yi = β1 + β2 × areai + ǫi ,

para i = 1, . . . , 50, em que yi denota o preço de venda do i-ésimo

imóvel e ǫiiid∼ N(0, σ2).

G. A. Paula (IME-USP) Área e Preço de Imóveis 1o Semestre 2013 10 / 33

Page 11: Exemplo Regressão Linear Simples - IME-USPgiapaula/slides_exemplo_vimoveis.pdf · Exemplo Regressão Linear Simples Gilberto A. Paula Departamento de Estatística IME-USP, Brasil

Ajuste Preliminar Regressão Linear Simples

Resíduos Modelo Ajustado

−2 −1 0 1 2

−20

24

Percentil da N(0,1)

Res

iduo

Stu

dent

izad

o

G. A. Paula (IME-USP) Área e Preço de Imóveis 1o Semestre 2013 11 / 33

Page 12: Exemplo Regressão Linear Simples - IME-USPgiapaula/slides_exemplo_vimoveis.pdf · Exemplo Regressão Linear Simples Gilberto A. Paula Departamento de Estatística IME-USP, Brasil

Ajuste Preliminar Regressão Linear Simples

Distribuição Empírica Resíduos

−2 0 2 4 6

0.0

0.1

0.2

0.3

0.4

0.5

0.6

Resíduo Studentizado

Den

sida

de

G. A. Paula (IME-USP) Área e Preço de Imóveis 1o Semestre 2013 12 / 33

Page 13: Exemplo Regressão Linear Simples - IME-USPgiapaula/slides_exemplo_vimoveis.pdf · Exemplo Regressão Linear Simples Gilberto A. Paula Departamento de Estatística IME-USP, Brasil

Ajuste Alternativo Regressão Linear Simples

Sumário

1 Área e Preço de Imóveis

2 Análise de Dados Preliminar

3 Ajuste Preliminar Regressão Linear Simples

4 Ajuste Alternativo Regressão Linear Simples

5 Interpretações

6 Curvas Ajustadas

7 Bandas de Confiança

8 Conclusões

9 Referências

G. A. Paula (IME-USP) Área e Preço de Imóveis 1o Semestre 2013 13 / 33

Page 14: Exemplo Regressão Linear Simples - IME-USPgiapaula/slides_exemplo_vimoveis.pdf · Exemplo Regressão Linear Simples Gilberto A. Paula Departamento de Estatística IME-USP, Brasil

Ajuste Alternativo Regressão Linear Simples

Regressão Linear Simples

Descrição

Nota-se pelos gráficos de resíduos indícios de afastamentos dadistribuição dos erros com indicação para assimetria à direita. Assim,sugerimos como alternativa, o seguinte modelo de regressão linearsimples:

logyi = β1 + β2 × areai + ǫi ,

para i = 1, . . . , 50, em que yi denota o preço de venda do i-ésimo

imóvel e ǫiiid∼ N(0, σ2).

G. A. Paula (IME-USP) Área e Preço de Imóveis 1o Semestre 2013 14 / 33

Page 15: Exemplo Regressão Linear Simples - IME-USPgiapaula/slides_exemplo_vimoveis.pdf · Exemplo Regressão Linear Simples Gilberto A. Paula Departamento de Estatística IME-USP, Brasil

Ajuste Alternativo Regressão Linear Simples

Resíduos Modelo Ajustado

−2 −1 0 1 2

−20

24

Percentil da N(0,1)

Res

iduo

Stu

dent

izad

o

G. A. Paula (IME-USP) Área e Preço de Imóveis 1o Semestre 2013 15 / 33

Page 16: Exemplo Regressão Linear Simples - IME-USPgiapaula/slides_exemplo_vimoveis.pdf · Exemplo Regressão Linear Simples Gilberto A. Paula Departamento de Estatística IME-USP, Brasil

Ajuste Alternativo Regressão Linear Simples

Diagnóstico Modelo Ajustado

0 10 20 30 40 50

0.0

0.2

0.4

0.6

0.8

1.0

Indice

Med

ida

h

50

0 10 20 30 40 50

0.0

0.1

0.2

0.3

0.4

0.5

Índice

Dis

tânc

ia d

e C

ook

50

0 10 20 30 40 50

−20

24

Índice

Res

íduo

Pad

roni

zado

49

4.0 4.5 5.0

−20

24

Valor Ajustado

Res

íduo

Pad

roni

zado

49

G. A. Paula (IME-USP) Área e Preço de Imóveis 1o Semestre 2013 16 / 33

Page 17: Exemplo Regressão Linear Simples - IME-USPgiapaula/slides_exemplo_vimoveis.pdf · Exemplo Regressão Linear Simples Gilberto A. Paula Departamento de Estatística IME-USP, Brasil

Ajuste Alternativo Regressão Linear Simples

Diagnóstico Modelo Ajustado

Identificação Pontos Discrepantes

Pelos gráficos de diagnóstico temos que a observação #50 éidentificada como ponto de alavanca e ponto influente, enquanto aobservação #49 é identificada como ponto aberrante.

G. A. Paula (IME-USP) Área e Preço de Imóveis 1o Semestre 2013 17 / 33

Page 18: Exemplo Regressão Linear Simples - IME-USPgiapaula/slides_exemplo_vimoveis.pdf · Exemplo Regressão Linear Simples Gilberto A. Paula Departamento de Estatística IME-USP, Brasil

Ajuste Alternativo Regressão Linear Simples

Identificação pontos Discrepantes

1.0 1.5 2.0 2.5 3.0 3.5 4.0

4060

8010

012

014

016

0

Área do Imóvel

Preç

o de

Ven

da

49

50

G. A. Paula (IME-USP) Área e Preço de Imóveis 1o Semestre 2013 18 / 33

Page 19: Exemplo Regressão Linear Simples - IME-USPgiapaula/slides_exemplo_vimoveis.pdf · Exemplo Regressão Linear Simples Gilberto A. Paula Departamento de Estatística IME-USP, Brasil

Ajuste Alternativo Regressão Linear Simples

Resíduos Modelo Ajustado sem Ponto Aberrante

−2 −1 0 1 2

−4−3

−2−1

01

23

Percentil da N(0,1)

Res

iduo

Stu

dent

izad

o

G. A. Paula (IME-USP) Área e Preço de Imóveis 1o Semestre 2013 19 / 33

Page 20: Exemplo Regressão Linear Simples - IME-USPgiapaula/slides_exemplo_vimoveis.pdf · Exemplo Regressão Linear Simples Gilberto A. Paula Departamento de Estatística IME-USP, Brasil

Ajuste Alternativo Regressão Linear Simples

Estimativas

Descrição

As estimativas dos parâmetros são descritas na tabela abaixo.

Efeito Estimativa Erro padrão valor-t valor-PConstante 3,280 0,064 50,91 0,00Área 0,510 0,032 15,82 0,00R2 0,84R2-ajustado 0,84s 0,14F 250,30 (1 e 48 g.l.) 0,00

Todos os efeitos são significativos ao nível de 1%.

G. A. Paula (IME-USP) Área e Preço de Imóveis 1o Semestre 2013 20 / 33

Page 21: Exemplo Regressão Linear Simples - IME-USPgiapaula/slides_exemplo_vimoveis.pdf · Exemplo Regressão Linear Simples Gilberto A. Paula Departamento de Estatística IME-USP, Brasil

Interpretações

Sumário

1 Área e Preço de Imóveis

2 Análise de Dados Preliminar

3 Ajuste Preliminar Regressão Linear Simples

4 Ajuste Alternativo Regressão Linear Simples

5 Interpretações

6 Curvas Ajustadas

7 Bandas de Confiança

8 Conclusões

9 Referências

G. A. Paula (IME-USP) Área e Preço de Imóveis 1o Semestre 2013 21 / 33

Page 22: Exemplo Regressão Linear Simples - IME-USPgiapaula/slides_exemplo_vimoveis.pdf · Exemplo Regressão Linear Simples Gilberto A. Paula Departamento de Estatística IME-USP, Brasil

Interpretações

Interpretações

Valor Predito

Pelo modelo ajustado o preço predito para um imóvel com área total xfica aproximadamente dado por

µ̂(x) = e3,28+0,51x .

Por exemplo, para um imóvel com x = 2, 0 mil pés quadrados o valorpredito de venda é dado por µ̂(x) = e3,28+0,51x2,0 ∼= 73, 70 mil USD.

G. A. Paula (IME-USP) Área e Preço de Imóveis 1o Semestre 2013 22 / 33

Page 23: Exemplo Regressão Linear Simples - IME-USPgiapaula/slides_exemplo_vimoveis.pdf · Exemplo Regressão Linear Simples Gilberto A. Paula Departamento de Estatística IME-USP, Brasil

Interpretações

Interpretações

Variação Valor Predito

Quanto varia o valor predito de venda de um imóvel se há umaumento de x = 1, 0 mil pés quadrados na área total?Essa variação fica aproximadamente dada por

µ̂(x + 1)µ̂(x)

= e0,51

= 1, 665 (66, 5%).

Portanto, para um aumento de mil pés quadrados na área total doimóvel, espera-se aumento no preço de venda do imóvel deaproximadamente 66,5 %.

G. A. Paula (IME-USP) Área e Preço de Imóveis 1o Semestre 2013 23 / 33

Page 24: Exemplo Regressão Linear Simples - IME-USPgiapaula/slides_exemplo_vimoveis.pdf · Exemplo Regressão Linear Simples Gilberto A. Paula Departamento de Estatística IME-USP, Brasil

Interpretações

Interpretações

Estimativa IntervalarEstimativa intervalar de 95% para a variação no valor predito de vendado imóvel quando há aumento de mil pés quadrados na área total

e0,51±2,01×0,032 = e0,51±0,0643

= [1, 561; 1, 776][56, 1%; 77, 6%].

Portanto, para um aumento de mil pés quadrados na área total,espera-se aumento no preço de venda entre 56,1% e 77,6%.

G. A. Paula (IME-USP) Área e Preço de Imóveis 1o Semestre 2013 24 / 33

Page 25: Exemplo Regressão Linear Simples - IME-USPgiapaula/slides_exemplo_vimoveis.pdf · Exemplo Regressão Linear Simples Gilberto A. Paula Departamento de Estatística IME-USP, Brasil

Curvas Ajustadas

Sumário

1 Área e Preço de Imóveis

2 Análise de Dados Preliminar

3 Ajuste Preliminar Regressão Linear Simples

4 Ajuste Alternativo Regressão Linear Simples

5 Interpretações

6 Curvas Ajustadas

7 Bandas de Confiança

8 Conclusões

9 Referências

G. A. Paula (IME-USP) Área e Preço de Imóveis 1o Semestre 2013 25 / 33

Page 26: Exemplo Regressão Linear Simples - IME-USPgiapaula/slides_exemplo_vimoveis.pdf · Exemplo Regressão Linear Simples Gilberto A. Paula Departamento de Estatística IME-USP, Brasil

Curvas Ajustadas

Comparação Curvas Ajustadas

1.0 1.5 2.0 2.5 3.0 3.5 4.0

5010

015

020

0

Área Total

Preç

o de

Ven

da

todos ptos

sem #49

sem #50

G. A. Paula (IME-USP) Área e Preço de Imóveis 1o Semestre 2013 26 / 33

Page 27: Exemplo Regressão Linear Simples - IME-USPgiapaula/slides_exemplo_vimoveis.pdf · Exemplo Regressão Linear Simples Gilberto A. Paula Departamento de Estatística IME-USP, Brasil

Bandas de Confiança

Sumário

1 Área e Preço de Imóveis

2 Análise de Dados Preliminar

3 Ajuste Preliminar Regressão Linear Simples

4 Ajuste Alternativo Regressão Linear Simples

5 Interpretações

6 Curvas Ajustadas

7 Bandas de Confiança

8 Conclusões

9 Referências

G. A. Paula (IME-USP) Área e Preço de Imóveis 1o Semestre 2013 27 / 33

Page 28: Exemplo Regressão Linear Simples - IME-USPgiapaula/slides_exemplo_vimoveis.pdf · Exemplo Regressão Linear Simples Gilberto A. Paula Departamento de Estatística IME-USP, Brasil

Bandas de Confiança

Banda de Confiança para a Média

0 1 2 3 4

5010

015

020

0

Área do Imóvel

Preç

o de

Ven

da

G. A. Paula (IME-USP) Área e Preço de Imóveis 1o Semestre 2013 28 / 33

Page 29: Exemplo Regressão Linear Simples - IME-USPgiapaula/slides_exemplo_vimoveis.pdf · Exemplo Regressão Linear Simples Gilberto A. Paula Departamento de Estatística IME-USP, Brasil

Bandas de Confiança

Banda de Confiança para Nova Observação

0 1 2 3 4

050

100

150

200

250

300

Área do Imóvel

Preç

o de

Ven

da

G. A. Paula (IME-USP) Área e Preço de Imóveis 1o Semestre 2013 29 / 33

Page 30: Exemplo Regressão Linear Simples - IME-USPgiapaula/slides_exemplo_vimoveis.pdf · Exemplo Regressão Linear Simples Gilberto A. Paula Departamento de Estatística IME-USP, Brasil

Conclusões

Sumário

1 Área e Preço de Imóveis

2 Análise de Dados Preliminar

3 Ajuste Preliminar Regressão Linear Simples

4 Ajuste Alternativo Regressão Linear Simples

5 Interpretações

6 Curvas Ajustadas

7 Bandas de Confiança

8 Conclusões

9 Referências

G. A. Paula (IME-USP) Área e Preço de Imóveis 1o Semestre 2013 30 / 33

Page 31: Exemplo Regressão Linear Simples - IME-USPgiapaula/slides_exemplo_vimoveis.pdf · Exemplo Regressão Linear Simples Gilberto A. Paula Departamento de Estatística IME-USP, Brasil

Conclusões

Conclusões

Considerações Finais

Este é um exemplo em que através de análise de resíduos verifica-sefortes indícios de afastamentos das suposições feitas para o modeloinicial.Através de uma transformação logarítmica na resposta chega-se a ummodelo linear simples que apresenta um ajuste superior aoapresentado inicialmente. Duas observações aparecem comodiscrepantes, contudo a eliminação das mesmas não leva a mudançasinferenciais importantes.

G. A. Paula (IME-USP) Área e Preço de Imóveis 1o Semestre 2013 31 / 33

Page 32: Exemplo Regressão Linear Simples - IME-USPgiapaula/slides_exemplo_vimoveis.pdf · Exemplo Regressão Linear Simples Gilberto A. Paula Departamento de Estatística IME-USP, Brasil

Referências

Sumário

1 Área e Preço de Imóveis

2 Análise de Dados Preliminar

3 Ajuste Preliminar Regressão Linear Simples

4 Ajuste Alternativo Regressão Linear Simples

5 Interpretações

6 Curvas Ajustadas

7 Bandas de Confiança

8 Conclusões

9 Referências

G. A. Paula (IME-USP) Área e Preço de Imóveis 1o Semestre 2013 32 / 33

Page 33: Exemplo Regressão Linear Simples - IME-USPgiapaula/slides_exemplo_vimoveis.pdf · Exemplo Regressão Linear Simples Gilberto A. Paula Departamento de Estatística IME-USP, Brasil

Referências

Referências

Referência

Gray, J. B. (1989). On the use of regression diagnostics. TheStatistician 38, 97-105.

G. A. Paula (IME-USP) Área e Preço de Imóveis 1o Semestre 2013 33 / 33