Exemplo Preferência de Automóveis - IME-USPgiapaula/slides_exemplo_prefauto.pdf · A...

Preview:

Citation preview

Exemplo Preferência de Automóveis

Gilberto A. Paula

Departamento de EstatísticaIME-USP, Brasil

giapaula@ime.usp.br

2o Semestre 2016

G. A. Paula (IME-USP) Preferência Automóveis 2o Semestre 2016 1 / 29

Preferência Automóveis

Sumário

1 Preferência Automóveis

2 Análise de Dados Preliminar

3 Modelo Binomial

4 Resultados Modelo Ajustado

5 Conclusões

6 Referências

G. A. Paula (IME-USP) Preferência Automóveis 2o Semestre 2016 2 / 29

Preferência Automóveis

Preferência Automóveis

Descrição dos Dados

Como ilustração de exemplo de modelo binomial para dados nãoagrupados, vamos considerar os dados sobre

G. A. Paula (IME-USP) Preferência Automóveis 2o Semestre 2016 3 / 29

Preferência Automóveis

Preferência Automóveis

Descrição dos Dados

Como ilustração de exemplo de modelo binomial para dados nãoagrupados, vamos considerar os dados sobre

preferência de automóveis (1: americano, 0: japonês)

G. A. Paula (IME-USP) Preferência Automóveis 2o Semestre 2016 3 / 29

Preferência Automóveis

Preferência Automóveis

Descrição dos Dados

Como ilustração de exemplo de modelo binomial para dados nãoagrupados, vamos considerar os dados sobre

preferência de automóveis (1: americano, 0: japonês)

de uma amostra aleatória de 263 consumidores (Foster, Stine eWaterman, 1998, pp. 338-339).

G. A. Paula (IME-USP) Preferência Automóveis 2o Semestre 2016 3 / 29

Preferência Automóveis

Preferência Automóveis

Descrição dos Dados

A probabilidade de preferência por carro americano será relacionadacom as seguintes variáveis explicativas do comprador(a):

G. A. Paula (IME-USP) Preferência Automóveis 2o Semestre 2016 4 / 29

Preferência Automóveis

Preferência Automóveis

Descrição dos Dados

A probabilidade de preferência por carro americano será relacionadacom as seguintes variáveis explicativas do comprador(a):

idade (em anos);

G. A. Paula (IME-USP) Preferência Automóveis 2o Semestre 2016 4 / 29

Preferência Automóveis

Preferência Automóveis

Descrição dos Dados

A probabilidade de preferência por carro americano será relacionadacom as seguintes variáveis explicativas do comprador(a):

idade (em anos);

sexo (0: masculino; 1: feminino);

G. A. Paula (IME-USP) Preferência Automóveis 2o Semestre 2016 4 / 29

Preferência Automóveis

Preferência Automóveis

Descrição dos Dados

A probabilidade de preferência por carro americano será relacionadacom as seguintes variáveis explicativas do comprador(a):

idade (em anos);

sexo (0: masculino; 1: feminino);

estado civil (0:casado(a), 1:solteiro(a)).

G. A. Paula (IME-USP) Preferência Automóveis 2o Semestre 2016 4 / 29

Análise de Dados Preliminar

Sumário

1 Preferência Automóveis

2 Análise de Dados Preliminar

3 Modelo Binomial

4 Resultados Modelo Ajustado

5 Conclusões

6 Referências

G. A. Paula (IME-USP) Preferência Automóveis 2o Semestre 2016 5 / 29

Análise de Dados Preliminar

Descrição dos Dados

Preferência segundo o Sexo

Masculino FemininoAmericano 61 (42,4%) 54 (45,4%)Japonês 83 (57,6%) 65 (54,6%)Total 144 119

G. A. Paula (IME-USP) Preferência Automóveis 2o Semestre 2016 6 / 29

Análise de Dados Preliminar

Descrição dos Dados

Preferência segundo o Sexo

Masculino FemininoAmericano 61 (42,4%) 54 (45,4%)Japonês 83 (57,6%) 65 (54,6%)Total 144 119

Preferência segundo o Estado Civil

Casado SolteiroAmericano 83 (48,8%) 32 (34,4%)Japonês 87 (51,2%) 65 (65,6%)Total 170 93

G. A. Paula (IME-USP) Preferência Automóveis 2o Semestre 2016 6 / 29

Análise de Dados Preliminar

Boxplots da Idade segundo a Preferência

Japonês Americano

2030

4050

60

Idad

e do

Com

prad

or

G. A. Paula (IME-USP) Preferência Automóveis 2o Semestre 2016 7 / 29

Modelo Binomial

Sumário

1 Preferência Automóveis

2 Análise de Dados Preliminar

3 Modelo Binomial

4 Resultados Modelo Ajustado

5 Conclusões

6 Referências

G. A. Paula (IME-USP) Preferência Automóveis 2o Semestre 2016 8 / 29

Modelo Binomial

Modelo Binomial

Descrição

Denotaremos por yi a preferência do i-ésimo comprador

G. A. Paula (IME-USP) Preferência Automóveis 2o Semestre 2016 9 / 29

Modelo Binomial

Modelo Binomial

Descrição

Denotaremos por yi a preferência do i-ésimo comprador

0: automóvel japonês;

G. A. Paula (IME-USP) Preferência Automóveis 2o Semestre 2016 9 / 29

Modelo Binomial

Modelo Binomial

Descrição

Denotaremos por yi a preferência do i-ésimo comprador

0: automóvel japonês;

1: automóvel americano.

G. A. Paula (IME-USP) Preferência Automóveis 2o Semestre 2016 9 / 29

Modelo Binomial

Modelo Binomial

Descrição

Denotaremos por yi a preferência do i-ésimo comprador

0: automóvel japonês;

1: automóvel americano.

Vamos propor o seguinte modelo binomial para explicar aprobabilidade de preferência por automóvel americano:

G. A. Paula (IME-USP) Preferência Automóveis 2o Semestre 2016 9 / 29

Modelo Binomial

Modelo Binomial

Descrição

Denotaremos por yi a preferência do i-ésimo comprador

0: automóvel japonês;

1: automóvel americano.

Vamos propor o seguinte modelo binomial para explicar aprobabilidade de preferência por automóvel americano:

yiind∼ Be(πi),

G. A. Paula (IME-USP) Preferência Automóveis 2o Semestre 2016 9 / 29

Modelo Binomial

Modelo Binomial

Descrição

Denotaremos por yi a preferência do i-ésimo comprador

0: automóvel japonês;

1: automóvel americano.

Vamos propor o seguinte modelo binomial para explicar aprobabilidade de preferência por automóvel americano:

yiind∼ Be(πi),

log(

πi1−πi

)

= β1 + β2 × Idadei + β3 × Sexoi + β4 × ECivili ,

G. A. Paula (IME-USP) Preferência Automóveis 2o Semestre 2016 9 / 29

Modelo Binomial

Modelo Binomial

Descrição

Denotaremos por yi a preferência do i-ésimo comprador

0: automóvel japonês;

1: automóvel americano.

Vamos propor o seguinte modelo binomial para explicar aprobabilidade de preferência por automóvel americano:

yiind∼ Be(πi),

log(

πi1−πi

)

= β1 + β2 × Idadei + β3 × Sexoi + β4 × ECivili ,

em que πi denota a probabilidade do i-ésimo comprador preferirautomóvel americano, para i = 1, . . . , 263,

G. A. Paula (IME-USP) Preferência Automóveis 2o Semestre 2016 9 / 29

Resultados Modelo Ajustado

Sumário

1 Preferência Automóveis

2 Análise de Dados Preliminar

3 Modelo Binomial

4 Resultados Modelo Ajustado

5 Conclusões

6 Referências

G. A. Paula (IME-USP) Preferência Automóveis 2o Semestre 2016 10 / 29

Resultados Modelo Ajustado

Modelo Binomial

Estimativas

Efeito Estimativa E.Padrão E/E.PadrãoConstante -1,653 0,708 -2,33Idade 0,050 0,022 2,27SexoF -0,094 0,256 -0,37ECivilS -0,518 0,272 -1,90

G. A. Paula (IME-USP) Preferência Automóveis 2o Semestre 2016 11 / 29

Resultados Modelo Ajustado

Modelo Binomial

Estimativas

Efeito Estimativa E.Padrão E/E.PadrãoConstante -1,653 0,708 -2,33Idade 0,050 0,022 2,27SexoF -0,094 0,256 -0,37ECivilS -0,518 0,272 -1,90

A variável sexo é não significativa.

G. A. Paula (IME-USP) Preferência Automóveis 2o Semestre 2016 11 / 29

Resultados Modelo Ajustado

Modelo Binomial

Estimativas

Efeito Estimativa E.Padrão E/E.PadrãoConstante -1,600 0,692 -2,31Idade 0,050 0,021 2,38ECivilS -0,526 0,272 -1,93

G. A. Paula (IME-USP) Preferência Automóveis 2o Semestre 2016 12 / 29

Resultados Modelo Ajustado

Modelo Binomial

Estimativas

Efeito Estimativa E.Padrão E/E.PadrãoConstante -1,600 0,692 -2,31Idade 0,050 0,021 2,38ECivilS -0,526 0,272 -1,93

Interação

O teste de ausência de interação entre idade e estado civil forneceu oseguinte valor para a estatística da razão de verossimilhançasξRV = 0, 81 com nível descritivo P=0,368. Portanto não rejeitamos aausência de interação entre idade e estado civil.

G. A. Paula (IME-USP) Preferência Automóveis 2o Semestre 2016 12 / 29

Resultados Modelo Ajustado

Diagnóstico Modelo Final

0.3 0.4 0.5 0.6 0.7

0.02

0.04

0.06

0.08

0.10

Valor Ajustado

Med

ida

h99

223

G. A. Paula (IME-USP) Preferência Automóveis 2o Semestre 2016 13 / 29

Resultados Modelo Ajustado

Diagnóstico Modelo Final

0 50 100 150 200 250

0.00

0.05

0.10

0.15

0.20

0.25

Índice

Dis

tânc

ia d

e C

ook

99

G. A. Paula (IME-USP) Preferência Automóveis 2o Semestre 2016 14 / 29

Resultados Modelo Ajustado

Resíduos Modelo Final

−3 −2 −1 0 1 2 3

−2−1

01

2

Percentil da N(0,1)

Com

pone

nte

do D

esvi

o

G. A. Paula (IME-USP) Preferência Automóveis 2o Semestre 2016 15 / 29

Resultados Modelo Ajustado

Pontos Discrepantes

Sem observação #99

Efeito Estimativa z-valor VariaçãoConstante -1,942 -2,65 -21,4%Idade 0,060 2,65 22,4%ECivilS -0,474 -1,72 9,9%

G. A. Paula (IME-USP) Preferência Automóveis 2o Semestre 2016 16 / 29

Resultados Modelo Ajustado

Pontos Discrepantes

Sem observação #99

Efeito Estimativa z-valor VariaçãoConstante -1,942 -2,65 -21,4%Idade 0,060 2,65 22,4%ECivilS -0,474 -1,72 9,9%

Este comprador tem 60 anos, comprou carro japonês e é solteiro. Suaeliminação aumenta a significância da idade e diminiui a significânciado estado civil.

G. A. Paula (IME-USP) Preferência Automóveis 2o Semestre 2016 16 / 29

Resultados Modelo Ajustado

Pontos Discrepantes

Sem observação #223

Efeito Estimativa z-valor VariaçãoConstante -1,463 -2,07 8,6%Idade 0,045 2,05 -8,1%ECivilS -0,550 -2,02 -4,6%

G. A. Paula (IME-USP) Preferência Automóveis 2o Semestre 2016 17 / 29

Resultados Modelo Ajustado

Pontos Discrepantes

Sem observação #223

Efeito Estimativa z-valor VariaçãoConstante -1,463 -2,07 8,6%Idade 0,045 2,05 -8,1%ECivilS -0,550 -2,02 -4,6%

Este comprador tem 54 anos, comprou carro americano e é solteiro.Sua eliminação diminui a significância da idade e aumenta um poucoa significância do estado civil.

G. A. Paula (IME-USP) Preferência Automóveis 2o Semestre 2016 17 / 29

Resultados Modelo Ajustado

Modelo Ajustado

Preferência por Automóvel Americano

A probabilidade ajustada de preferência por automóvel americano ficaexpressa na forma

G. A. Paula (IME-USP) Preferência Automóveis 2o Semestre 2016 18 / 29

Resultados Modelo Ajustado

Modelo Ajustado

Preferência por Automóvel Americano

A probabilidade ajustada de preferência por automóvel americano ficaexpressa na forma

π̂ =exp(−1, 600 + 0, 050 × Idade − 0, 526 × ECivil)

1 + exp(−1, 600 + 0, 050 × Idade − 0, 526 × ECivil).

G. A. Paula (IME-USP) Preferência Automóveis 2o Semestre 2016 18 / 29

Resultados Modelo Ajustado

Probabilidade Ajustada

20 30 40 50 60

0.2

0.4

0.6

0.8

Idade

Prob

abilid

ade

Ajus

tada

Casado

Solteiro

G. A. Paula (IME-USP) Preferência Automóveis 2o Semestre 2016 19 / 29

Resultados Modelo Ajustado

Interpretações

Efeito Idade

A probabilidade de preferência por automóvel americano aumentacom a idade do comprador.

G. A. Paula (IME-USP) Preferência Automóveis 2o Semestre 2016 20 / 29

Resultados Modelo Ajustado

Interpretações

Efeito Idade

A probabilidade de preferência por automóvel americano aumentacom a idade do comprador.

Razão de ChancesA razão de chances entre um comprador casado e um compradorsolteiro preferir automóvel americano é estimada por

ψ̂ = exp(0, 526)

= 1, 69.

G. A. Paula (IME-USP) Preferência Automóveis 2o Semestre 2016 20 / 29

Resultados Modelo Ajustado

Interpretações

Efeito Idade

A probabilidade de preferência por automóvel americano aumentacom a idade do comprador.

Razão de ChancesA razão de chances entre um comprador casado e um compradorsolteiro preferir automóvel americano é estimada por

ψ̂ = exp(0, 526)

= 1, 69.

Ou seja, um comprador casado tem uma chance 69% maior depreferir automóvel americano em relação a um comprador solteiro.

G. A. Paula (IME-USP) Preferência Automóveis 2o Semestre 2016 20 / 29

Resultados Modelo Ajustado

Interpretações

Estimativa IntervalarEstimativa intervalar de 90% para a razão de chances entre umcomprador casado e um comprador solteiro preferir automóvelamericano

G. A. Paula (IME-USP) Preferência Automóveis 2o Semestre 2016 21 / 29

Resultados Modelo Ajustado

Interpretações

Estimativa IntervalarEstimativa intervalar de 90% para a razão de chances entre umcomprador casado e um comprador solteiro preferir automóvelamericano

e0,526±1,65×0,272 = e0,526±0,449

= [1, 080; 2, 651][8, 0%; 165, 1%].

G. A. Paula (IME-USP) Preferência Automóveis 2o Semestre 2016 21 / 29

Resultados Modelo Ajustado

Interpretações

Estimativa IntervalarEstimativa intervalar de 90% para a razão de chances entre umcomprador casado e um comprador solteiro preferir automóvelamericano

e0,526±1,65×0,272 = e0,526±0,449

= [1, 080; 2, 651][8, 0%; 165, 1%].

Portanto, um comprador casado tem uma chance entre 8% e 165,1%maior de preferir automóvel americano em relação a um compradorsolteiro.

G. A. Paula (IME-USP) Preferência Automóveis 2o Semestre 2016 21 / 29

Resultados Modelo Ajustado

Modelo Ajustado

Preferência por Automóvel Japonês

A probabilidade ajustada de preferência por automóvel japonês ficaexpressa na forma

G. A. Paula (IME-USP) Preferência Automóveis 2o Semestre 2016 22 / 29

Resultados Modelo Ajustado

Modelo Ajustado

Preferência por Automóvel Japonês

A probabilidade ajustada de preferência por automóvel japonês ficaexpressa na forma

1 − π̂ =exp(1, 600 − 0, 050 × Idade + 0, 526 × ECivil)

1 + exp(1, 600 − 0, 050 × Idade + 0, 526 × ECivil).

G. A. Paula (IME-USP) Preferência Automóveis 2o Semestre 2016 22 / 29

Resultados Modelo Ajustado

Probabilidade Ajustada

20 30 40 50 60

0.0

0.2

0.4

0.6

0.8

1.0

Idade

Prob

abilid

ade

Ajus

tada

Casado

Solteiro

G. A. Paula (IME-USP) Preferência Automóveis 2o Semestre 2016 23 / 29

Resultados Modelo Ajustado

Interpretações

Efeito Idade

A probabilidade de preferência por automóvel japonês diminui com aidade do comprador.

G. A. Paula (IME-USP) Preferência Automóveis 2o Semestre 2016 24 / 29

Resultados Modelo Ajustado

Interpretações

Efeito Idade

A probabilidade de preferência por automóvel japonês diminui com aidade do comprador.

Razão de ChancesA razão de chances entre um comprador solteiro e um compradorcadado preferir automóvel japonês é estimada por

ψ̂ = exp(0, 526)

= 1, 69.

G. A. Paula (IME-USP) Preferência Automóveis 2o Semestre 2016 24 / 29

Resultados Modelo Ajustado

Interpretações

Efeito Idade

A probabilidade de preferência por automóvel japonês diminui com aidade do comprador.

Razão de ChancesA razão de chances entre um comprador solteiro e um compradorcadado preferir automóvel japonês é estimada por

ψ̂ = exp(0, 526)

= 1, 69.

Ou seja, um comprador solteiro tem uma chance 69% maior depreferir automóvel japonês em relação a um comprador casado.

G. A. Paula (IME-USP) Preferência Automóveis 2o Semestre 2016 24 / 29

Resultados Modelo Ajustado

Interpretações

Estimativa IntervalarEstimativa intervalar de 90% para a razão de chances entre umcomprador solteiro e um comprador casado preferir automóvel japonês

G. A. Paula (IME-USP) Preferência Automóveis 2o Semestre 2016 25 / 29

Resultados Modelo Ajustado

Interpretações

Estimativa IntervalarEstimativa intervalar de 90% para a razão de chances entre umcomprador solteiro e um comprador casado preferir automóvel japonês

e0,526±1,65×0,272 = e0,526±0,449

= [1, 080; 2, 651][8, 0%; 165, 1%].

G. A. Paula (IME-USP) Preferência Automóveis 2o Semestre 2016 25 / 29

Resultados Modelo Ajustado

Interpretações

Estimativa IntervalarEstimativa intervalar de 90% para a razão de chances entre umcomprador solteiro e um comprador casado preferir automóvel japonês

e0,526±1,65×0,272 = e0,526±0,449

= [1, 080; 2, 651][8, 0%; 165, 1%].

Portanto, um comprador solteiro tem uma chance entre 8% e 165,1%maior de preferir automóvel japonês em relação a um compradorcasado.

G. A. Paula (IME-USP) Preferência Automóveis 2o Semestre 2016 25 / 29

Conclusões

Sumário

1 Preferência Automóveis

2 Análise de Dados Preliminar

3 Modelo Binomial

4 Resultados Modelo Ajustado

5 Conclusões

6 Referências

G. A. Paula (IME-USP) Preferência Automóveis 2o Semestre 2016 26 / 29

Conclusões

Conclusões

Considerações Finais

G. A. Paula (IME-USP) Preferência Automóveis 2o Semestre 2016 27 / 29

Conclusões

Conclusões

Considerações Finais

Neste exemplo em que ajustamos a probabilidade de umcomprador preferir automóvel de marca americana em relação amarca japonesa, notamos que a idade do comprador e o estadocivil são variáveis importantes.

G. A. Paula (IME-USP) Preferência Automóveis 2o Semestre 2016 27 / 29

Conclusões

Conclusões

Considerações Finais

Neste exemplo em que ajustamos a probabilidade de umcomprador preferir automóvel de marca americana em relação amarca japonesa, notamos que a idade do comprador e o estadocivil são variáveis importantes.

Os dois pontos influentes, referentes a dois compradores comperfil atípico, embora mudem de forma desproporcinal asestimativas não mudam a inferência ao nível de 10%.

G. A. Paula (IME-USP) Preferência Automóveis 2o Semestre 2016 27 / 29

Conclusões

Conclusões

Considerações Finais

Neste exemplo em que ajustamos a probabilidade de umcomprador preferir automóvel de marca americana em relação amarca japonesa, notamos que a idade do comprador e o estadocivil são variáveis importantes.

Os dois pontos influentes, referentes a dois compradores comperfil atípico, embora mudem de forma desproporcinal asestimativas não mudam a inferência ao nível de 10%.

Não há indícios de que a distribuição das respostas não sejaBernoulli.

G. A. Paula (IME-USP) Preferência Automóveis 2o Semestre 2016 27 / 29

Referências

Sumário

1 Preferência Automóveis

2 Análise de Dados Preliminar

3 Modelo Binomial

4 Resultados Modelo Ajustado

5 Conclusões

6 Referências

G. A. Paula (IME-USP) Preferência Automóveis 2o Semestre 2016 28 / 29

Referências

Referências

Referência

Foster, D. P.; Stine, R. A. e Waterman, R. P. (1998). BusinessAnalysis using Regression. New York: Springer.

G. A. Paula (IME-USP) Preferência Automóveis 2o Semestre 2016 29 / 29