Upload
hoangxuyen
View
223
Download
0
Embed Size (px)
Citation preview
Exemplo Preferência de Automóveis
Gilberto A. Paula
Departamento de EstatísticaIME-USP, Brasil
2o Semestre 2016
G. A. Paula (IME-USP) Preferência Automóveis 2o Semestre 2016 1 / 29
Preferência Automóveis
Sumário
1 Preferência Automóveis
2 Análise de Dados Preliminar
3 Modelo Binomial
4 Resultados Modelo Ajustado
5 Conclusões
6 Referências
G. A. Paula (IME-USP) Preferência Automóveis 2o Semestre 2016 2 / 29
Preferência Automóveis
Preferência Automóveis
Descrição dos Dados
Como ilustração de exemplo de modelo binomial para dados nãoagrupados, vamos considerar os dados sobre
G. A. Paula (IME-USP) Preferência Automóveis 2o Semestre 2016 3 / 29
Preferência Automóveis
Preferência Automóveis
Descrição dos Dados
Como ilustração de exemplo de modelo binomial para dados nãoagrupados, vamos considerar os dados sobre
preferência de automóveis (1: americano, 0: japonês)
G. A. Paula (IME-USP) Preferência Automóveis 2o Semestre 2016 3 / 29
Preferência Automóveis
Preferência Automóveis
Descrição dos Dados
Como ilustração de exemplo de modelo binomial para dados nãoagrupados, vamos considerar os dados sobre
preferência de automóveis (1: americano, 0: japonês)
de uma amostra aleatória de 263 consumidores (Foster, Stine eWaterman, 1998, pp. 338-339).
G. A. Paula (IME-USP) Preferência Automóveis 2o Semestre 2016 3 / 29
Preferência Automóveis
Preferência Automóveis
Descrição dos Dados
A probabilidade de preferência por carro americano será relacionadacom as seguintes variáveis explicativas do comprador(a):
G. A. Paula (IME-USP) Preferência Automóveis 2o Semestre 2016 4 / 29
Preferência Automóveis
Preferência Automóveis
Descrição dos Dados
A probabilidade de preferência por carro americano será relacionadacom as seguintes variáveis explicativas do comprador(a):
idade (em anos);
G. A. Paula (IME-USP) Preferência Automóveis 2o Semestre 2016 4 / 29
Preferência Automóveis
Preferência Automóveis
Descrição dos Dados
A probabilidade de preferência por carro americano será relacionadacom as seguintes variáveis explicativas do comprador(a):
idade (em anos);
sexo (0: masculino; 1: feminino);
G. A. Paula (IME-USP) Preferência Automóveis 2o Semestre 2016 4 / 29
Preferência Automóveis
Preferência Automóveis
Descrição dos Dados
A probabilidade de preferência por carro americano será relacionadacom as seguintes variáveis explicativas do comprador(a):
idade (em anos);
sexo (0: masculino; 1: feminino);
estado civil (0:casado(a), 1:solteiro(a)).
G. A. Paula (IME-USP) Preferência Automóveis 2o Semestre 2016 4 / 29
Análise de Dados Preliminar
Sumário
1 Preferência Automóveis
2 Análise de Dados Preliminar
3 Modelo Binomial
4 Resultados Modelo Ajustado
5 Conclusões
6 Referências
G. A. Paula (IME-USP) Preferência Automóveis 2o Semestre 2016 5 / 29
Análise de Dados Preliminar
Descrição dos Dados
Preferência segundo o Sexo
Masculino FemininoAmericano 61 (42,4%) 54 (45,4%)Japonês 83 (57,6%) 65 (54,6%)Total 144 119
G. A. Paula (IME-USP) Preferência Automóveis 2o Semestre 2016 6 / 29
Análise de Dados Preliminar
Descrição dos Dados
Preferência segundo o Sexo
Masculino FemininoAmericano 61 (42,4%) 54 (45,4%)Japonês 83 (57,6%) 65 (54,6%)Total 144 119
Preferência segundo o Estado Civil
Casado SolteiroAmericano 83 (48,8%) 32 (34,4%)Japonês 87 (51,2%) 65 (65,6%)Total 170 93
G. A. Paula (IME-USP) Preferência Automóveis 2o Semestre 2016 6 / 29
Análise de Dados Preliminar
Boxplots da Idade segundo a Preferência
Japonês Americano
2030
4050
60
Idad
e do
Com
prad
or
G. A. Paula (IME-USP) Preferência Automóveis 2o Semestre 2016 7 / 29
Modelo Binomial
Sumário
1 Preferência Automóveis
2 Análise de Dados Preliminar
3 Modelo Binomial
4 Resultados Modelo Ajustado
5 Conclusões
6 Referências
G. A. Paula (IME-USP) Preferência Automóveis 2o Semestre 2016 8 / 29
Modelo Binomial
Modelo Binomial
Descrição
Denotaremos por yi a preferência do i-ésimo comprador
G. A. Paula (IME-USP) Preferência Automóveis 2o Semestre 2016 9 / 29
Modelo Binomial
Modelo Binomial
Descrição
Denotaremos por yi a preferência do i-ésimo comprador
0: automóvel japonês;
G. A. Paula (IME-USP) Preferência Automóveis 2o Semestre 2016 9 / 29
Modelo Binomial
Modelo Binomial
Descrição
Denotaremos por yi a preferência do i-ésimo comprador
0: automóvel japonês;
1: automóvel americano.
G. A. Paula (IME-USP) Preferência Automóveis 2o Semestre 2016 9 / 29
Modelo Binomial
Modelo Binomial
Descrição
Denotaremos por yi a preferência do i-ésimo comprador
0: automóvel japonês;
1: automóvel americano.
Vamos propor o seguinte modelo binomial para explicar aprobabilidade de preferência por automóvel americano:
G. A. Paula (IME-USP) Preferência Automóveis 2o Semestre 2016 9 / 29
Modelo Binomial
Modelo Binomial
Descrição
Denotaremos por yi a preferência do i-ésimo comprador
0: automóvel japonês;
1: automóvel americano.
Vamos propor o seguinte modelo binomial para explicar aprobabilidade de preferência por automóvel americano:
yiind∼ Be(πi),
G. A. Paula (IME-USP) Preferência Automóveis 2o Semestre 2016 9 / 29
Modelo Binomial
Modelo Binomial
Descrição
Denotaremos por yi a preferência do i-ésimo comprador
0: automóvel japonês;
1: automóvel americano.
Vamos propor o seguinte modelo binomial para explicar aprobabilidade de preferência por automóvel americano:
yiind∼ Be(πi),
log(
πi1−πi
)
= β1 + β2 × Idadei + β3 × Sexoi + β4 × ECivili ,
G. A. Paula (IME-USP) Preferência Automóveis 2o Semestre 2016 9 / 29
Modelo Binomial
Modelo Binomial
Descrição
Denotaremos por yi a preferência do i-ésimo comprador
0: automóvel japonês;
1: automóvel americano.
Vamos propor o seguinte modelo binomial para explicar aprobabilidade de preferência por automóvel americano:
yiind∼ Be(πi),
log(
πi1−πi
)
= β1 + β2 × Idadei + β3 × Sexoi + β4 × ECivili ,
em que πi denota a probabilidade do i-ésimo comprador preferirautomóvel americano, para i = 1, . . . , 263,
G. A. Paula (IME-USP) Preferência Automóveis 2o Semestre 2016 9 / 29
Resultados Modelo Ajustado
Sumário
1 Preferência Automóveis
2 Análise de Dados Preliminar
3 Modelo Binomial
4 Resultados Modelo Ajustado
5 Conclusões
6 Referências
G. A. Paula (IME-USP) Preferência Automóveis 2o Semestre 2016 10 / 29
Resultados Modelo Ajustado
Modelo Binomial
Estimativas
Efeito Estimativa E.Padrão E/E.PadrãoConstante -1,653 0,708 -2,33Idade 0,050 0,022 2,27SexoF -0,094 0,256 -0,37ECivilS -0,518 0,272 -1,90
G. A. Paula (IME-USP) Preferência Automóveis 2o Semestre 2016 11 / 29
Resultados Modelo Ajustado
Modelo Binomial
Estimativas
Efeito Estimativa E.Padrão E/E.PadrãoConstante -1,653 0,708 -2,33Idade 0,050 0,022 2,27SexoF -0,094 0,256 -0,37ECivilS -0,518 0,272 -1,90
A variável sexo é não significativa.
G. A. Paula (IME-USP) Preferência Automóveis 2o Semestre 2016 11 / 29
Resultados Modelo Ajustado
Modelo Binomial
Estimativas
Efeito Estimativa E.Padrão E/E.PadrãoConstante -1,600 0,692 -2,31Idade 0,050 0,021 2,38ECivilS -0,526 0,272 -1,93
G. A. Paula (IME-USP) Preferência Automóveis 2o Semestre 2016 12 / 29
Resultados Modelo Ajustado
Modelo Binomial
Estimativas
Efeito Estimativa E.Padrão E/E.PadrãoConstante -1,600 0,692 -2,31Idade 0,050 0,021 2,38ECivilS -0,526 0,272 -1,93
Interação
O teste de ausência de interação entre idade e estado civil forneceu oseguinte valor para a estatística da razão de verossimilhançasξRV = 0, 81 com nível descritivo P=0,368. Portanto não rejeitamos aausência de interação entre idade e estado civil.
G. A. Paula (IME-USP) Preferência Automóveis 2o Semestre 2016 12 / 29
Resultados Modelo Ajustado
Diagnóstico Modelo Final
0.3 0.4 0.5 0.6 0.7
0.02
0.04
0.06
0.08
0.10
Valor Ajustado
Med
ida
h99
223
G. A. Paula (IME-USP) Preferência Automóveis 2o Semestre 2016 13 / 29
Resultados Modelo Ajustado
Diagnóstico Modelo Final
0 50 100 150 200 250
0.00
0.05
0.10
0.15
0.20
0.25
Índice
Dis
tânc
ia d
e C
ook
99
G. A. Paula (IME-USP) Preferência Automóveis 2o Semestre 2016 14 / 29
Resultados Modelo Ajustado
Resíduos Modelo Final
−3 −2 −1 0 1 2 3
−2−1
01
2
Percentil da N(0,1)
Com
pone
nte
do D
esvi
o
G. A. Paula (IME-USP) Preferência Automóveis 2o Semestre 2016 15 / 29
Resultados Modelo Ajustado
Pontos Discrepantes
Sem observação #99
Efeito Estimativa z-valor VariaçãoConstante -1,942 -2,65 -21,4%Idade 0,060 2,65 22,4%ECivilS -0,474 -1,72 9,9%
G. A. Paula (IME-USP) Preferência Automóveis 2o Semestre 2016 16 / 29
Resultados Modelo Ajustado
Pontos Discrepantes
Sem observação #99
Efeito Estimativa z-valor VariaçãoConstante -1,942 -2,65 -21,4%Idade 0,060 2,65 22,4%ECivilS -0,474 -1,72 9,9%
Este comprador tem 60 anos, comprou carro japonês e é solteiro. Suaeliminação aumenta a significância da idade e diminiui a significânciado estado civil.
G. A. Paula (IME-USP) Preferência Automóveis 2o Semestre 2016 16 / 29
Resultados Modelo Ajustado
Pontos Discrepantes
Sem observação #223
Efeito Estimativa z-valor VariaçãoConstante -1,463 -2,07 8,6%Idade 0,045 2,05 -8,1%ECivilS -0,550 -2,02 -4,6%
G. A. Paula (IME-USP) Preferência Automóveis 2o Semestre 2016 17 / 29
Resultados Modelo Ajustado
Pontos Discrepantes
Sem observação #223
Efeito Estimativa z-valor VariaçãoConstante -1,463 -2,07 8,6%Idade 0,045 2,05 -8,1%ECivilS -0,550 -2,02 -4,6%
Este comprador tem 54 anos, comprou carro americano e é solteiro.Sua eliminação diminui a significância da idade e aumenta um poucoa significância do estado civil.
G. A. Paula (IME-USP) Preferência Automóveis 2o Semestre 2016 17 / 29
Resultados Modelo Ajustado
Modelo Ajustado
Preferência por Automóvel Americano
A probabilidade ajustada de preferência por automóvel americano ficaexpressa na forma
G. A. Paula (IME-USP) Preferência Automóveis 2o Semestre 2016 18 / 29
Resultados Modelo Ajustado
Modelo Ajustado
Preferência por Automóvel Americano
A probabilidade ajustada de preferência por automóvel americano ficaexpressa na forma
π̂ =exp(−1, 600 + 0, 050 × Idade − 0, 526 × ECivil)
1 + exp(−1, 600 + 0, 050 × Idade − 0, 526 × ECivil).
G. A. Paula (IME-USP) Preferência Automóveis 2o Semestre 2016 18 / 29
Resultados Modelo Ajustado
Probabilidade Ajustada
20 30 40 50 60
0.2
0.4
0.6
0.8
Idade
Prob
abilid
ade
Ajus
tada
Casado
Solteiro
G. A. Paula (IME-USP) Preferência Automóveis 2o Semestre 2016 19 / 29
Resultados Modelo Ajustado
Interpretações
Efeito Idade
A probabilidade de preferência por automóvel americano aumentacom a idade do comprador.
G. A. Paula (IME-USP) Preferência Automóveis 2o Semestre 2016 20 / 29
Resultados Modelo Ajustado
Interpretações
Efeito Idade
A probabilidade de preferência por automóvel americano aumentacom a idade do comprador.
Razão de ChancesA razão de chances entre um comprador casado e um compradorsolteiro preferir automóvel americano é estimada por
ψ̂ = exp(0, 526)
= 1, 69.
G. A. Paula (IME-USP) Preferência Automóveis 2o Semestre 2016 20 / 29
Resultados Modelo Ajustado
Interpretações
Efeito Idade
A probabilidade de preferência por automóvel americano aumentacom a idade do comprador.
Razão de ChancesA razão de chances entre um comprador casado e um compradorsolteiro preferir automóvel americano é estimada por
ψ̂ = exp(0, 526)
= 1, 69.
Ou seja, um comprador casado tem uma chance 69% maior depreferir automóvel americano em relação a um comprador solteiro.
G. A. Paula (IME-USP) Preferência Automóveis 2o Semestre 2016 20 / 29
Resultados Modelo Ajustado
Interpretações
Estimativa IntervalarEstimativa intervalar de 90% para a razão de chances entre umcomprador casado e um comprador solteiro preferir automóvelamericano
G. A. Paula (IME-USP) Preferência Automóveis 2o Semestre 2016 21 / 29
Resultados Modelo Ajustado
Interpretações
Estimativa IntervalarEstimativa intervalar de 90% para a razão de chances entre umcomprador casado e um comprador solteiro preferir automóvelamericano
e0,526±1,65×0,272 = e0,526±0,449
= [1, 080; 2, 651][8, 0%; 165, 1%].
G. A. Paula (IME-USP) Preferência Automóveis 2o Semestre 2016 21 / 29
Resultados Modelo Ajustado
Interpretações
Estimativa IntervalarEstimativa intervalar de 90% para a razão de chances entre umcomprador casado e um comprador solteiro preferir automóvelamericano
e0,526±1,65×0,272 = e0,526±0,449
= [1, 080; 2, 651][8, 0%; 165, 1%].
Portanto, um comprador casado tem uma chance entre 8% e 165,1%maior de preferir automóvel americano em relação a um compradorsolteiro.
G. A. Paula (IME-USP) Preferência Automóveis 2o Semestre 2016 21 / 29
Resultados Modelo Ajustado
Modelo Ajustado
Preferência por Automóvel Japonês
A probabilidade ajustada de preferência por automóvel japonês ficaexpressa na forma
G. A. Paula (IME-USP) Preferência Automóveis 2o Semestre 2016 22 / 29
Resultados Modelo Ajustado
Modelo Ajustado
Preferência por Automóvel Japonês
A probabilidade ajustada de preferência por automóvel japonês ficaexpressa na forma
1 − π̂ =exp(1, 600 − 0, 050 × Idade + 0, 526 × ECivil)
1 + exp(1, 600 − 0, 050 × Idade + 0, 526 × ECivil).
G. A. Paula (IME-USP) Preferência Automóveis 2o Semestre 2016 22 / 29
Resultados Modelo Ajustado
Probabilidade Ajustada
20 30 40 50 60
0.0
0.2
0.4
0.6
0.8
1.0
Idade
Prob
abilid
ade
Ajus
tada
Casado
Solteiro
G. A. Paula (IME-USP) Preferência Automóveis 2o Semestre 2016 23 / 29
Resultados Modelo Ajustado
Interpretações
Efeito Idade
A probabilidade de preferência por automóvel japonês diminui com aidade do comprador.
G. A. Paula (IME-USP) Preferência Automóveis 2o Semestre 2016 24 / 29
Resultados Modelo Ajustado
Interpretações
Efeito Idade
A probabilidade de preferência por automóvel japonês diminui com aidade do comprador.
Razão de ChancesA razão de chances entre um comprador solteiro e um compradorcadado preferir automóvel japonês é estimada por
ψ̂ = exp(0, 526)
= 1, 69.
G. A. Paula (IME-USP) Preferência Automóveis 2o Semestre 2016 24 / 29
Resultados Modelo Ajustado
Interpretações
Efeito Idade
A probabilidade de preferência por automóvel japonês diminui com aidade do comprador.
Razão de ChancesA razão de chances entre um comprador solteiro e um compradorcadado preferir automóvel japonês é estimada por
ψ̂ = exp(0, 526)
= 1, 69.
Ou seja, um comprador solteiro tem uma chance 69% maior depreferir automóvel japonês em relação a um comprador casado.
G. A. Paula (IME-USP) Preferência Automóveis 2o Semestre 2016 24 / 29
Resultados Modelo Ajustado
Interpretações
Estimativa IntervalarEstimativa intervalar de 90% para a razão de chances entre umcomprador solteiro e um comprador casado preferir automóvel japonês
G. A. Paula (IME-USP) Preferência Automóveis 2o Semestre 2016 25 / 29
Resultados Modelo Ajustado
Interpretações
Estimativa IntervalarEstimativa intervalar de 90% para a razão de chances entre umcomprador solteiro e um comprador casado preferir automóvel japonês
e0,526±1,65×0,272 = e0,526±0,449
= [1, 080; 2, 651][8, 0%; 165, 1%].
G. A. Paula (IME-USP) Preferência Automóveis 2o Semestre 2016 25 / 29
Resultados Modelo Ajustado
Interpretações
Estimativa IntervalarEstimativa intervalar de 90% para a razão de chances entre umcomprador solteiro e um comprador casado preferir automóvel japonês
e0,526±1,65×0,272 = e0,526±0,449
= [1, 080; 2, 651][8, 0%; 165, 1%].
Portanto, um comprador solteiro tem uma chance entre 8% e 165,1%maior de preferir automóvel japonês em relação a um compradorcasado.
G. A. Paula (IME-USP) Preferência Automóveis 2o Semestre 2016 25 / 29
Conclusões
Sumário
1 Preferência Automóveis
2 Análise de Dados Preliminar
3 Modelo Binomial
4 Resultados Modelo Ajustado
5 Conclusões
6 Referências
G. A. Paula (IME-USP) Preferência Automóveis 2o Semestre 2016 26 / 29
Conclusões
Conclusões
Considerações Finais
G. A. Paula (IME-USP) Preferência Automóveis 2o Semestre 2016 27 / 29
Conclusões
Conclusões
Considerações Finais
Neste exemplo em que ajustamos a probabilidade de umcomprador preferir automóvel de marca americana em relação amarca japonesa, notamos que a idade do comprador e o estadocivil são variáveis importantes.
G. A. Paula (IME-USP) Preferência Automóveis 2o Semestre 2016 27 / 29
Conclusões
Conclusões
Considerações Finais
Neste exemplo em que ajustamos a probabilidade de umcomprador preferir automóvel de marca americana em relação amarca japonesa, notamos que a idade do comprador e o estadocivil são variáveis importantes.
Os dois pontos influentes, referentes a dois compradores comperfil atípico, embora mudem de forma desproporcinal asestimativas não mudam a inferência ao nível de 10%.
G. A. Paula (IME-USP) Preferência Automóveis 2o Semestre 2016 27 / 29
Conclusões
Conclusões
Considerações Finais
Neste exemplo em que ajustamos a probabilidade de umcomprador preferir automóvel de marca americana em relação amarca japonesa, notamos que a idade do comprador e o estadocivil são variáveis importantes.
Os dois pontos influentes, referentes a dois compradores comperfil atípico, embora mudem de forma desproporcinal asestimativas não mudam a inferência ao nível de 10%.
Não há indícios de que a distribuição das respostas não sejaBernoulli.
G. A. Paula (IME-USP) Preferência Automóveis 2o Semestre 2016 27 / 29
Referências
Sumário
1 Preferência Automóveis
2 Análise de Dados Preliminar
3 Modelo Binomial
4 Resultados Modelo Ajustado
5 Conclusões
6 Referências
G. A. Paula (IME-USP) Preferência Automóveis 2o Semestre 2016 28 / 29
Referências
Referências
Referência
Foster, D. P.; Stine, R. A. e Waterman, R. P. (1998). BusinessAnalysis using Regression. New York: Springer.
G. A. Paula (IME-USP) Preferência Automóveis 2o Semestre 2016 29 / 29