Upload
nguyennguyet
View
218
Download
0
Embed Size (px)
Exemplo Regressão Linear Simples
Gilberto A. Paula
Departamento de EstatísticaIME-USP, Brasil
1o Semestre 2013
G. A. Paula (IME-USP) Área e Preço de Imóveis 1o Semestre 2013 1 / 33
Área e Preço de Imóveis
Sumário
1 Área e Preço de Imóveis
2 Análise de Dados Preliminar
3 Ajuste Preliminar Regressão Linear Simples
4 Ajuste Alternativo Regressão Linear Simples
5 Interpretações
6 Curvas Ajustadas
7 Bandas de Confiança
8 Conclusões
9 Referências
G. A. Paula (IME-USP) Área e Preço de Imóveis 1o Semestre 2013 2 / 33
Área e Preço de Imóveis
Área e Preço de Imóveis
Descrição dos Dados
Vamos considerar neste exemplo uma amostra aleatória de 50 imóveisem que foi observado para cada um o preço de venda (em mil USD) ea área total (em mil pés quadrados)a numa região de Eugene, EUA(Gray, 1989). O objetivo principal do estudo é tentar explicar (ouprever) o preço de venda do imóvel dada a área total.
a1ft2 = 0, 092903m2
G. A. Paula (IME-USP) Área e Preço de Imóveis 1o Semestre 2013 3 / 33
Análise de Dados Preliminar
Sumário
1 Área e Preço de Imóveis
2 Análise de Dados Preliminar
3 Ajuste Preliminar Regressão Linear Simples
4 Ajuste Alternativo Regressão Linear Simples
5 Interpretações
6 Curvas Ajustadas
7 Bandas de Confiança
8 Conclusões
9 Referências
G. A. Paula (IME-USP) Área e Preço de Imóveis 1o Semestre 2013 4 / 33
Análise de Dados Preliminar
Medidas Resumo
Descrição
Medida Área Total Preço Vendan 50 50Média 1,900 74,30D.Padrão 0,627 26,48CV 33% 36%
Mínimo 0,800 30,601o Quartil 1,500 57,00Mediana 1,945 68,403o Quartil 2,240 85,57Máximo 4,000 165,00
G. A. Paula (IME-USP) Área e Preço de Imóveis 1o Semestre 2013 5 / 33
Análise de Dados Preliminar
Boxplot Área Total do Imóvel
1.0
1.5
2.0
2.5
3.0
3.5
4.0
Áre
a d
o Im
óve
l
G. A. Paula (IME-USP) Área e Preço de Imóveis 1o Semestre 2013 6 / 33
Análise de Dados Preliminar
Boxplot Preço de Venda do Imóvel
40
60
80
10
01
20
14
01
60
Pre
ço d
e V
en
da
do
Im
óve
l
G. A. Paula (IME-USP) Área e Preço de Imóveis 1o Semestre 2013 7 / 33
Análise de Dados Preliminar
Dispersão Área Total e Preço de Venda
1.0 1.5 2.0 2.5 3.0 3.5 4.0
4060
8010
012
014
016
0
Área do Imóvel
Preç
o de
Ven
da
G. A. Paula (IME-USP) Área e Preço de Imóveis 1o Semestre 2013 8 / 33
Ajuste Preliminar Regressão Linear Simples
Sumário
1 Área e Preço de Imóveis
2 Análise de Dados Preliminar
3 Ajuste Preliminar Regressão Linear Simples
4 Ajuste Alternativo Regressão Linear Simples
5 Interpretações
6 Curvas Ajustadas
7 Bandas de Confiança
8 Conclusões
9 Referências
G. A. Paula (IME-USP) Área e Preço de Imóveis 1o Semestre 2013 9 / 33
Ajuste Preliminar Regressão Linear Simples
Regressão Linear Simples
Descrição
Nota-se indícios de aumento do preço de venda do imóvel com oaumento da área total do imóvel, sugerindo inicialmente o seguintemodelo de regressão linear simples:
yi = β1 + β2 × areai + ǫi ,
para i = 1, . . . , 50, em que yi denota o preço de venda do i-ésimo
imóvel e ǫiiid∼ N(0, σ2).
G. A. Paula (IME-USP) Área e Preço de Imóveis 1o Semestre 2013 10 / 33
Ajuste Preliminar Regressão Linear Simples
Resíduos Modelo Ajustado
−2 −1 0 1 2
−20
24
Percentil da N(0,1)
Res
iduo
Stu
dent
izad
o
G. A. Paula (IME-USP) Área e Preço de Imóveis 1o Semestre 2013 11 / 33
Ajuste Preliminar Regressão Linear Simples
Distribuição Empírica Resíduos
−2 0 2 4 6
0.0
0.1
0.2
0.3
0.4
0.5
0.6
Resíduo Studentizado
Den
sida
de
G. A. Paula (IME-USP) Área e Preço de Imóveis 1o Semestre 2013 12 / 33
Ajuste Alternativo Regressão Linear Simples
Sumário
1 Área e Preço de Imóveis
2 Análise de Dados Preliminar
3 Ajuste Preliminar Regressão Linear Simples
4 Ajuste Alternativo Regressão Linear Simples
5 Interpretações
6 Curvas Ajustadas
7 Bandas de Confiança
8 Conclusões
9 Referências
G. A. Paula (IME-USP) Área e Preço de Imóveis 1o Semestre 2013 13 / 33
Ajuste Alternativo Regressão Linear Simples
Regressão Linear Simples
Descrição
Nota-se pelos gráficos de resíduos indícios de afastamentos dadistribuição dos erros com indicação para assimetria à direita. Assim,sugerimos como alternativa, o seguinte modelo de regressão linearsimples:
logyi = β1 + β2 × areai + ǫi ,
para i = 1, . . . , 50, em que yi denota o preço de venda do i-ésimo
imóvel e ǫiiid∼ N(0, σ2).
G. A. Paula (IME-USP) Área e Preço de Imóveis 1o Semestre 2013 14 / 33
Ajuste Alternativo Regressão Linear Simples
Resíduos Modelo Ajustado
−2 −1 0 1 2
−20
24
Percentil da N(0,1)
Res
iduo
Stu
dent
izad
o
G. A. Paula (IME-USP) Área e Preço de Imóveis 1o Semestre 2013 15 / 33
Ajuste Alternativo Regressão Linear Simples
Diagnóstico Modelo Ajustado
0 10 20 30 40 50
0.0
0.2
0.4
0.6
0.8
1.0
Indice
Med
ida
h
50
0 10 20 30 40 50
0.0
0.1
0.2
0.3
0.4
0.5
Índice
Dis
tânc
ia d
e C
ook
50
0 10 20 30 40 50
−20
24
Índice
Res
íduo
Pad
roni
zado
49
4.0 4.5 5.0
−20
24
Valor Ajustado
Res
íduo
Pad
roni
zado
49
G. A. Paula (IME-USP) Área e Preço de Imóveis 1o Semestre 2013 16 / 33
Ajuste Alternativo Regressão Linear Simples
Diagnóstico Modelo Ajustado
Identificação Pontos Discrepantes
Pelos gráficos de diagnóstico temos que a observação #50 éidentificada como ponto de alavanca e ponto influente, enquanto aobservação #49 é identificada como ponto aberrante.
G. A. Paula (IME-USP) Área e Preço de Imóveis 1o Semestre 2013 17 / 33
Ajuste Alternativo Regressão Linear Simples
Identificação pontos Discrepantes
1.0 1.5 2.0 2.5 3.0 3.5 4.0
4060
8010
012
014
016
0
Área do Imóvel
Preç
o de
Ven
da
49
50
G. A. Paula (IME-USP) Área e Preço de Imóveis 1o Semestre 2013 18 / 33
Ajuste Alternativo Regressão Linear Simples
Resíduos Modelo Ajustado sem Ponto Aberrante
−2 −1 0 1 2
−4−3
−2−1
01
23
Percentil da N(0,1)
Res
iduo
Stu
dent
izad
o
G. A. Paula (IME-USP) Área e Preço de Imóveis 1o Semestre 2013 19 / 33
Ajuste Alternativo Regressão Linear Simples
Estimativas
Descrição
As estimativas dos parâmetros são descritas na tabela abaixo.
Efeito Estimativa Erro padrão valor-t valor-PConstante 3,280 0,064 50,91 0,00Área 0,510 0,032 15,82 0,00R2 0,84R2-ajustado 0,84s 0,14F 250,30 (1 e 48 g.l.) 0,00
Todos os efeitos são significativos ao nível de 1%.
G. A. Paula (IME-USP) Área e Preço de Imóveis 1o Semestre 2013 20 / 33
Interpretações
Sumário
1 Área e Preço de Imóveis
2 Análise de Dados Preliminar
3 Ajuste Preliminar Regressão Linear Simples
4 Ajuste Alternativo Regressão Linear Simples
5 Interpretações
6 Curvas Ajustadas
7 Bandas de Confiança
8 Conclusões
9 Referências
G. A. Paula (IME-USP) Área e Preço de Imóveis 1o Semestre 2013 21 / 33
Interpretações
Interpretações
Valor Predito
Pelo modelo ajustado o preço predito para um imóvel com área total xfica aproximadamente dado por
µ̂(x) = e3,28+0,51x .
Por exemplo, para um imóvel com x = 2, 0 mil pés quadrados o valorpredito de venda é dado por µ̂(x) = e3,28+0,51x2,0 ∼= 73, 70 mil USD.
G. A. Paula (IME-USP) Área e Preço de Imóveis 1o Semestre 2013 22 / 33
Interpretações
Interpretações
Variação Valor Predito
Quanto varia o valor predito de venda de um imóvel se há umaumento de x = 1, 0 mil pés quadrados na área total?Essa variação fica aproximadamente dada por
µ̂(x + 1)µ̂(x)
= e0,51
= 1, 665 (66, 5%).
Portanto, para um aumento de mil pés quadrados na área total doimóvel, espera-se aumento no preço de venda do imóvel deaproximadamente 66,5 %.
G. A. Paula (IME-USP) Área e Preço de Imóveis 1o Semestre 2013 23 / 33
Interpretações
Interpretações
Estimativa IntervalarEstimativa intervalar de 95% para a variação no valor predito de vendado imóvel quando há aumento de mil pés quadrados na área total
e0,51±2,01×0,032 = e0,51±0,0643
= [1, 561; 1, 776][56, 1%; 77, 6%].
Portanto, para um aumento de mil pés quadrados na área total,espera-se aumento no preço de venda entre 56,1% e 77,6%.
G. A. Paula (IME-USP) Área e Preço de Imóveis 1o Semestre 2013 24 / 33
Curvas Ajustadas
Sumário
1 Área e Preço de Imóveis
2 Análise de Dados Preliminar
3 Ajuste Preliminar Regressão Linear Simples
4 Ajuste Alternativo Regressão Linear Simples
5 Interpretações
6 Curvas Ajustadas
7 Bandas de Confiança
8 Conclusões
9 Referências
G. A. Paula (IME-USP) Área e Preço de Imóveis 1o Semestre 2013 25 / 33
Curvas Ajustadas
Comparação Curvas Ajustadas
1.0 1.5 2.0 2.5 3.0 3.5 4.0
5010
015
020
0
Área Total
Preç
o de
Ven
da
todos ptos
sem #49
sem #50
G. A. Paula (IME-USP) Área e Preço de Imóveis 1o Semestre 2013 26 / 33
Bandas de Confiança
Sumário
1 Área e Preço de Imóveis
2 Análise de Dados Preliminar
3 Ajuste Preliminar Regressão Linear Simples
4 Ajuste Alternativo Regressão Linear Simples
5 Interpretações
6 Curvas Ajustadas
7 Bandas de Confiança
8 Conclusões
9 Referências
G. A. Paula (IME-USP) Área e Preço de Imóveis 1o Semestre 2013 27 / 33
Bandas de Confiança
Banda de Confiança para a Média
0 1 2 3 4
5010
015
020
0
Área do Imóvel
Preç
o de
Ven
da
G. A. Paula (IME-USP) Área e Preço de Imóveis 1o Semestre 2013 28 / 33
Bandas de Confiança
Banda de Confiança para Nova Observação
0 1 2 3 4
050
100
150
200
250
300
Área do Imóvel
Preç
o de
Ven
da
G. A. Paula (IME-USP) Área e Preço de Imóveis 1o Semestre 2013 29 / 33
Conclusões
Sumário
1 Área e Preço de Imóveis
2 Análise de Dados Preliminar
3 Ajuste Preliminar Regressão Linear Simples
4 Ajuste Alternativo Regressão Linear Simples
5 Interpretações
6 Curvas Ajustadas
7 Bandas de Confiança
8 Conclusões
9 Referências
G. A. Paula (IME-USP) Área e Preço de Imóveis 1o Semestre 2013 30 / 33
Conclusões
Conclusões
Considerações Finais
Este é um exemplo em que através de análise de resíduos verifica-sefortes indícios de afastamentos das suposições feitas para o modeloinicial.Através de uma transformação logarítmica na resposta chega-se a ummodelo linear simples que apresenta um ajuste superior aoapresentado inicialmente. Duas observações aparecem comodiscrepantes, contudo a eliminação das mesmas não leva a mudançasinferenciais importantes.
G. A. Paula (IME-USP) Área e Preço de Imóveis 1o Semestre 2013 31 / 33
Referências
Sumário
1 Área e Preço de Imóveis
2 Análise de Dados Preliminar
3 Ajuste Preliminar Regressão Linear Simples
4 Ajuste Alternativo Regressão Linear Simples
5 Interpretações
6 Curvas Ajustadas
7 Bandas de Confiança
8 Conclusões
9 Referências
G. A. Paula (IME-USP) Área e Preço de Imóveis 1o Semestre 2013 32 / 33
Referências
Referências
Referência
Gray, J. B. (1989). On the use of regression diagnostics. TheStatistician 38, 97-105.
G. A. Paula (IME-USP) Área e Preço de Imóveis 1o Semestre 2013 33 / 33