Upload
trinhkhanh
View
218
Download
0
Embed Size (px)
Citation preview
• Quando tornamos um modelo econômico com mais de uma variável explanatória em um modelo estatístico correspondente, nós dizemos que ele é um modelo de regressão múltipla.
• Grande parte dos resultados desenvolvidos para o modelo de regressão simples pode ser estendido naturalmente para esse caso geral. Existem pequenas mudanças na interpretação dos parâmetros , os graus de liberdade para a distribuição t mudarão e nós necessitaremos modificar as hipóteses concernentes as características das variáveis explanatórias (x).
Capítulo 7
O Modelo de Regressão Linear Múltipla
7.1 Especificação do Modelo e os Dados
7.1.1 O Modelo Econômico
•Cada semana, o gerente de uma rede de lanchonetes deve decidir quanto gastar com propaganda e que promoções deveria oferecer.
•Como se altera a receita total à medida que o nível de gastos com propaganda muda? Um aumento nos gastos com propaganda elevaria a receita total? Se afirmativo, o aumento na receita total é suficiente para justificar uma elevação nos gastos com propaganda?
•O gerente também está interessado na estratégia de preços. Reduzir os preços aumentará ou diminuirá a receita total? Se uma redução de preço levar a uma diminuição da receita total, então a demanda é inelástica; se uma redução de preço levar a um aumento da receita total, então a demanda é elástica.
•Nós, inicialmente, assumimos que a receita total, RT, é linearmente relacionada com o preço (p) e com os gastos em propaganda (a). Assim, o modelo econômico é:
1 2 3RT p a (7.1.1)
RT = representa a receita total para determinada semana p = representa o preço naquela semana a = nível de gastos com propaganda durante aquela semana. Tanto RT como a são mensurados em termos de milhares de unidades monetárias.
• Vamos assumir que o gerente construiu uma única série de preços semanal, p, mensurada em unidades monetárias e que representa os preços gerais. • Os itens remanescentes em (7.1.1) são os parâmetros desconhecidos 1, 2 e 3, que descrevem a dependência da receita (RT) em relação aos preços (p) e à propaganda (a).
• No modelo de regressão múltipla, o parâmetro intercepto, 1, é o valor da variável dependente quando cada variável explanatória assume o valor zero. Em muitos casos, esse parâmetro não tem uma interpretação econômica clara, mas ele é quase sempre incluído no modelo de regressão. Ele ajuda a estimação global do modelo e na previsão.
• Os outros parâmetros no modelo mensuram a variação no valor da variável dependente dado a mudança de uma unidade em uma variável explanatória, todas as outras variáveis mantidas constantes.
Por exemplo, em:
2 = a mudança em RT ($ 1000) quando p é aumentado em uma unidade ($1) e a é mantido constante, ou
( mantido constante)a
RT RT
p p
2 =
1 2 3RT p a
• O sinal de 2 pode ser positivo ou negativo. Se um aumento nos preços levar a um aumento da receita, então 2 > 0, e a demanda para a rede de lanchonetes é inelástica. Inversamente, uma demanda elástica em relação ao preço ocorre se um aumento nos preços conduzir a uma queda na receita, que é o caso de 2 < 0.
• O parâmetro 3 descreve a resposta da receita a mudanças no nível de gastos com propaganda; isto é,
3 = a mudança em RT ($1000) quando a é aumentado em uma unidade ($1000), e p é mantido constante 3 =
( mantido constante)p
RT RT
a a
• Nós esperamos que o sinal de 3 seja positivo.
1 2 3RT p a
7.1.2 O Modelo Econométrico
• O modelo econômico (7.1.1) descreve o comportamento esperado de muitas franquias individuais. Como tal, nós deveríamos escrever o modelo como , onde E(RT) é o “valor esperado” da receita total.
• Dados semanais para a receita total, preço e propaganda não seguirão uma relação linear exata. A equação 7.1.1 descreve, não uma reta como nos Capítulos 3-6, mas um plano.
• O plano intercepta o eixo vertical em 1. Os parâmetros 2 e 3 mensuram a inclinação do plano nas direções “eixo do preço” e “eixo da propaganda”, respectivamente.
1 2 3( )E RT p a
• Para permitir a diferenciação entre a receita total observada e o valor esperado da receita total, nós acrescentamos um termo de erro aleatório, • Esse erro aleatório representa todos os fatores que fazem a receita total semanal diferir do seu valor esperado. Esses fatores podem incluir o clima, o comportamento dos concorrentes, um relatório de uma agência importante sobre os efeitos mortais do consumo de gorduras, etc. • Denotando as t’s observações semanais pelo índice t, nós temos
( )e RT E RT
1 2 3( )t t t t t tRT E RT e p a e (7.1.2)
7.1.2a O Modelo Geral • No modelo de regressão múltipla geral, uma variável dependente yt é relacionada com um número de variáveis explanatórias através de uma equação linear que pode ser escrita como:
1 2 2 3 3t t t K tK ty x x x e (7.1.3)
• Os coeficientes 1, 2,…, K são parâmetros desconhecidos.
• O parâmetro mede o efeito de uma mudança na variável sobre o valor esperado de yt, E(yt), todas as outras variáveis mantidas constantes.
• O parâmetro 1 é o termo de intercepto. A “variável” xt1 = 1.
• A equação da receita total pode ser visualizada como um caso especial de (7.1.3) onde:
K = 3, yt = RTt, xt1 = 1, xt2 = pt e xt3 = at. Assim, nós podemos escrever (7.1.2) como:
ktkx
1 2 2 3 3t t t ty x x e (7.1.4)
7.1.2b As Hipóteses do Modelo
Para fazer o modelo estatístico em (7.1.4) completo, hipóteses sobre a distribuição do erro aleatório, et, precisam ser feitas.
1. E[et] = 0. Cada erro aleatório tem uma distribuição de probabilidade com média zero. Nós estamos assumindo que nosso modelo, em média, é correto.
2. var(et) = . A variância é um parâmetro des-conhecido e ele mede a incerteza do modelo estatístico. Ela é a mesma para cada observação. Erros com essa propriedade são chamados de homocedásticos.
3. cov(et, es) = 0. A covariância entre dois erros aleatórios correspondentes a duas observações diferentes é zero. Assim, qualquer par de erros não é correlacionada.
22
4. Em algumas ocasiões, nós assumiremos adicionalmente que os erros aleatórios et possuem distribuição de probabilidade normal; isto é, . 2~ 0,te N
As propriedades estatísticas de yt decorrem das do et.
1. Essa hipótese diz que o valor médio de yt muda para cada observação e é dado pela função de regressão .
1 2 2 3 3( )t t tE y x x
2. var(yt) = var(et) = . 2
3. cov(yt, ys) = cov(et, es) = 0.
4. é equivalente a assumir que
2
1 2 2 3 3~ ( ),t t ty N x x
2~ 0,te N
• Adicionalmente às hipóteses sobre o termo de erro (e conseqüentemente sobre a variável dependente), nós fazemos duas hipóteses sobre as variáveis explanatórias. • A primeira é que as variáveis explanatórias não são aleatórias. • A segunda hipótese é que nenhuma das variáveis explanatórias é uma função linear exata de qualquer uma das outras. Essa hipótese é equivalente a assumir que nenhuma variável é redundante. Como veremos, se essa hipótese é violada, uma condição chamada “multicolinearidade exata”, o procedimento de mínimos quadrados falha.
Hipóteses do Modelo de Regressão Múltipla
1 2 2 , 1, ,t t K tK ty x x e t T RM1.
1 2 2( ) ( ) 0t t K tK tE y x x E e RM2.
RM3. var(yt) = var(et) = . 2
RM4. cov(yt, ys) = cov(et, es) = 0
RM5. Os valores de xtk não são aleatórios e não são funções lineares exata de outras variáveis explanatórias.
RM6. 2 2
1 2 2~ ( ), ~ (0, )t t K tK ty N x x e N
7.2 Estimação dos Parâmetros do Modelo de Regressão Múltipla
Nós discutiremos estimação no contexto do modelo da equação 7.1.4, o qual é
1 2 2 3 3t t t ty x x e (7.2.1)
7.2.1 Procedimento de Estimação de Mínimos Quadrados
• Com o princípio de mínimos quadrados, nós minimizamos a soma de quadrados das diferenças entre os valores observados de yt e seu valor esperado:
1 2 2 3 3t t tE y x x • Matematicamente, nós minimizamos a soma de quadrados da função S(1, 2, 3), que é uma função dos parâmetros desconhecidos, dado os dados,
2
1 2 3
1
2
1 2 2 3 3
1
, ,T
t t
t
T
t t t
t
S y E y
y x x
(7.2.2)
• Dados as observações amostrais yt, minimizar a função da soma de quadrados é basicamente um exercício de cálculo. • Com o propósito de fornecer expressões para as estimativas de mínimos quadrados, é conveniente expressar cada uma das variáveis em termos de desvios em relação a suas médias; isto é, seja * * *
2 2 2 3 3 3, ,t t t t t ty y y x x x x x x • As estimativas de mínimos quadrados b1, b2 e b3 são:
1 2 2 3 3
* * *2 * * * *
2 3 3 2 3
2 2*2 *2 * *
2 3 2 3
* * *2 * * * *
3 2 2 3 2
3 2*2 *2 * *
2 3 2 3
t t t t t t t
t t t t
t t t t t t t
t t t t
b y b x b x
y x x y x x xb
x x x x
y x x y x x xb
x x x x
(7.2.3)
• Encaradas como uma maneira geral de utilizar dados amostrais, referimo-nos às fórmulas em (7.2.3) como regras ou procedimentos de estimação e são chamadas de estimadores de mínimos quadrados dos parâmetros desconhecidos. • Como seus valores não são conhecidos até os dados serem observados e as estimativas calculadas, os estimadores de mínimos quadrados são variáveis aleatórias.
Quando aplicadas a uma amostra de dados específica, as regras produzem as estimativas de mínimos quadrados, que são valores numéricos.
Observações semanais sobre receitas, preços e gastos
7.2.2 Estimativas de Mínimos Quadrados Utilizando os Dados da Rede de Lanchonetes
Para os dados da Rede de Lanchonetes, nós obtemos as seguintes estimativas de mínimos quadrados:
1
2
3
104,79
6,642
2,984
b
b
b
(R7.1)
A função de regressão que nós estamos estimando é
1 2 2 3 3t t tE y x x (7.2.4)
A reta da regressão ajustada é
1 2 2 3 3
2 3
ˆ
104,79 6,642 2,984
t t t
t t
y b b x b x
x x
(R7.2)
Em termos das variáveis econômicas originais
ˆ 104,79 6,642 2,984t t tRT p a (R7.3)
Baseados nos resultados, o que nós podemos dizer?
1. O coeficiente negativo de pt sugere que a demanda é elástica em relação ao preço e nós estimamos que um aumento em $1 no preço levará a uma queda na receita semanal de $6.642. Ou, colocando positivamente, uma redução no preço de $1 levará a um aumento na receita de $6.642.
2. O coeficiente da propaganda é positivo e nós estimamos que um aumento no gasto com propaganda de $1.000 resultará em uma elevação da receita total de $2.984.
3. O intercepto estimado implica que se tanto o preço como o gasto com propaganda forem zero, a ganho de receita total seria de $104.790. Isso é obviamente incorreto. Nesse modelo, assim como em outros, o intercepto é incluído no modelo para melhorar a capacidade de previsão dele e dar uma especificação matemática mais completa .
• A equação estimada também pode ser utilizada para a previsão. Suponha que o gerente esteja interessado em prever a receita total para um preço de $2 e um gasto com propaganda de $10.000. A previsão é dada por
ˆ 104,785 6,6419 2 2,9843 10
121,34
tRT
(R7.4)
Assim, o valor previsto da receita total para os valores específicos de p e a é aproximadamente $121.340.
Observação O sinal negativo do preço implica que a redução desse aumentará a receita total. Se tomarmos isso literalmente, porque nós não deveríamos ir reduzindo o preço até zero? Obviamente que não conseguiríamos manter a elevação da receita total. Isso aponta para um importante ponto: modelos de regressão estimados descrevem a relação entre as variáveis econômicas para valores semelhantes dos encontrados na amostra de dados. A extrapolação dos resultados para valores extremos não é geralmente uma boa idéia. Em geral, predizer valores da variável dependente para valores das variáveis explanatórias distantes dos valores amostrais é um convite para o desastre
7.2.3 Estimação da Variância de Erro 2
• Os resíduos de mínimos quadrados para o modelo na equação 7.2.1 são:
1 2 2 3 3ˆ ˆt t t t t te y y y b x b x b (7.2.5)
Um estimador de , que é o que vamos utilizar, é 2
22 ˆˆ te
T K
(7.2.6)
onde K é o número de parâmetros sendo estimados no modelo de regressão múltipla.
• No exemplo da rede de lanchonetes, nós temos K = 3. A estimativa para nossa amostra de dados na Tabela 7.1 é
22 ˆ 1805,168ˆ 36,84
52 3
te
T K
(R7.5)
7.3 Propriedades Amostrais do Estimador de Mínimos Quadrados
• As propriedades amostrais do estimador de mínimos quadrados nos dizem como as estimativas variam de amostra para amostra.
O Teorema de Gauss-Markov: Para o modelo de regressão múltipla, se as hipóteses RM1-RM5 são mantidas, então os estimadores de mínimos quadrados são os melhores estimadores lineares não tendenciosos (BLUE – Best Linear Unbiased Estimators) dos parâmetros no modelo de regressão múltipla.
• Se nós formos capazes de assumir que os erros são normalmente distribuídos, então yt também será uma variável aleatória normalmente distribuída. • Os estimadores de mínimos quadrados também terão distribuição de probabilidade normal, já que eles são funções lineares de yt. • Se os erros não forem normalmente distribuídos, então os estimadores de mínimos quadrados serão aproximadamente normalmente distribuídos em grandes amostras, onde TK for maior que, talvez, 50.
7.3.1 As Variâncias e Covariâncias dos Estimadores de Mínimos Quadrados
• Como os estimadores de mínimos quadrados não são tendenciosos, quanto menor for a variância, maior será a probabilidade de eles produzirem estimativas “próximas” dos verdadeiros valores dos parâmetros. • Para K = 3, nós podemos expressar as variâncias e covariâncias em uma forma algébrica que seja proveitosa para elucidar o comportamento do estimador de mínimos quadrados. Por exemplo, nós podemos mostrar que:
2
2 2
2 2 23
var( )(1 )t
bx x r
(7.3.1)
onde r23 é o coeficiente de correlação simples entre os T valores de xt2 e xt3,
2 2 3 3
232 2
2 2 3 3
t t
t t
x x x xr
x x x x
(7.3.2)
Para outras variâncias e covariâncias existem fórmulas de natureza similar. É importante compreender os fatores que afetam a variância de b2:
1. Quanto maior for 2 , maior será a variância dos estimadores de mínimos quadrados. Isso é esperado já que 2 mede a incerteza global na especificação do modelo. Se 2 for grande, então os valores dos dados podem ser fortemente dispersos da função de regressão, existe uma menor quantidade de informação nos dados sobre os valores dos parâmetros.
1 2 2 3 3t t tE y x x
2. Quanto maior for o tamanho da amostra T , menor será a variância. A soma no denominador é
2
2 2
1
( )T
t
t
x x
Quanto maior for o tamanho da amostra T , maior será essa soma e, assim, menor será a variância.
Um maior número de observações produz uma estimação do parâmetro mais precisa.
3. Para estimar 2 de forma precisa, nós gostaríamos de possuir uma grande variação de xt2,
2
2 2
1
( )T
t
t
x x
A intuição aqui é que é mais fácil mensurar 2, a variação em y esperada dada uma mudança em x2, quando existe uma maior variação nos valores de x2 que nós observamos.
4. No denominador da var(b2) existe o termo , onde r23 é a correlação entre os valores amostrais de xt2 e xt3. Lembre-se que o coeficiente de correlação mensura a associação linear existente entre duas variáveis. Se os valores de xt2 e xt3 forem correlacionados, então o termo será menor do que 1. 2
231 r
2
231 r
• Quanto maior for a correlação entre xt2 e xt3, maior será a variância do estimador de mínimos quadrados b2. A razão para isso é que a variação em xt2 acrescenta uma maior precisão para a estimação quando ela não está associada à variação nas outras variáveis explanatórias.
• Idealmente, variáveis “independentes” apresentam uma variação que é “independente” da variação de outras variáveis explanatórias. Quando a variação em uma variável explanatória está associada à variação em outra variável explanatória, é difícil distinguir separadamente seus efeitos. No Capítulo 8, nós discutimos “multicolinearidade”, que é a situação onde as variáveis explanatórias estão correlacionadas entre si. A multicolinearidade conduz a um aumento das variâncias dos estimadores de mínimos quadrados.
• É comum apresentar as variâncias e covariâncias dos estimadores de mínimos quadrados numa matriz, com as variâncias na diagonal principal e as covariâncias fora da diagonal principal. Para um modelo com K=3, a matriz é
1 1 2 1 3
1 2 3 1 2 2 2 3
1 3 2 3 3
var cov , cov ,
cov , , cov , var cov ,
cov , cov , var
b b b b b
b b b b b b b b
b b b b b
(7.3.3)
Utilizando a estimativa = 36,84, as variâncias e covariâncias para b1, b2, b3 no exemplo da rede de lanchonetes são
2̂
1 2 3
42,026 19,863 0,16111
ˆcov , , 19,863 10,184 0,05402
0,16111 0,05402 0,02787
b b b
(7.3.4)
Assim, nós temos
1 1 2
2 1 3
3 2 3
ˆ ˆvar 42,026 cov , 19,863
ˆ ˆvar 10,184 cov , 0,16111
ˆ ˆvar 0,02787 cov , 0,05402
b b b
b b b
b b b
7.3.2 As Propriedades dos Estimadores de Mínimos Quadrados Admitindo Distribuição Normal dos Erros
Se nós acrescentarmos RM6 – que os erros aleatórios et têm distribuição de probabilidade normal –, então a variável dependente yt é normalmente distribuída,
2 2
1 2 2~ ( ), ~ (0, )t t K tK ty N x x e N
Como os estimadores de mínimos quadrados são funções lineares da variável dependente, segue que os estimadores de mínimos quadrados são normalmente distribuídos também,
~ , vark k kb N b (7.3.6)
• Nós podemos transformar a variável aleatória normal bk na variável normal padronizada z,
~ 0,1 , para 1, 2, ,
var
k k
k
bz N k K
b
(7.3.7)
• Quando nós substituímos 2 pelo seu estimador , nós obtemos a estimativa da var(bk), o qual nós denotamos como . Quando a var(bk) é substituída pela em (7.3.7), nós obtemos uma variável aleatória com distribuição t ao invés de uma variável normal; isto é,
2̂
ˆvar kb ˆvar kb
~
ˆvar
k k
T K
k
bt t
b
(7.3.8)
ˆep( ) var( )k kb b
• Nesse capítulo, existem K coeficientes desconhecidos no modelo geral e o número de graus de liberdade para a estatística t é (T-K)
• A raiz quadrada do estimador da variância é chamada de “erro padrão” de bk, o qual pode ser escrito como
ˆvar kb
(7.3.9)
Conseqüentemente, nós expressaremos usualmente a variável aleatória t como
~
ep( )
k k
T K
k
bt t
b
(7.3.10)
7.4 Estimação de Intervalos
• As estimativas de intervalos de parâmetros desconhecidos são baseadas numa sentença probabilística que é
1ep( )
k kc c
k
bP t t
b
(7.4.1)
Onde tc é o valor crítico para a distribuição t com (TK) graus de liberdade, tal que P(t tc) = /2.
• Rearranjando a equação 7.4.1, nós obtemos
ep( ) ep( ) 1k c k k k c kP b t b b t b (7.4.2)
• Os limites do intervalo definem um estimador de intervalo de 100(1-)% de confiança para k.
[ ep( ), ep( )]k c k k c kb t b b t b (7.4.3)
• Se esse estimador de intervalo é utilizado em muitas amostra extraídas da população, então 95% deles conterão o verdadeiro parâmetro k.
• Retornando à equação usada para descrever como a receita da rede de lanchonetes depende do preço e dos gastos com propaganda, nós temos
1 1 1
2 2 2
3 3 3
52 3
ˆ104,79 ep var 6,483
ˆ6,642 ep var 3,191
ˆ2,984 ep var 0,1669
T K
b b b
b b b
b b b
Nós usaremos essas informações para construir estimativas de intervalos para
2
3
a resposta da receita para uma mudança no preço
a resposta da receita para uma mudança no gasto da propaganda
• Os graus de liberdade são dados por (T-K) = (52-3) = 49.
• O valor crítico é tc = 2,01.
• Uma estimativa de intervalo de 95% para 2 é dado por
( 13,06, 0,23) (7.4.4)
• Essa estimativa de intervalos sugere que a diminuição de $1 no preço levará a um aumento da receita entre $230 e $13.060. • Esse é um amplo intervalo de confiança e não é muito informativo.
• Outro modo de descrever essa situação é afirmar que a estimativa pontual de b2 = 6,642 não é muito confiável.
• Um intervalo mais estreito só pode ser obtido pela redução da variância do estimador. Um modo é obter maiores quantidades de dados e dados mais precisos. Alternativamente, nós podemos introduzir algum tipo de informação não amostral nos coeficientes.
• Uma estimativa de intervalos de 95% para 3, a resposta da receita para os gastos com propaganda, é
(2,65, 3,32) (7.4.5)
• Esse intervalo é relativamente estreito e informativo. Nós estimamos que uma elevação nos gasto com propaganda de $1000 levará a um aumento na receita total de $2.650 à $3.320.
7.5 Teste de Hipótese para um Único Coeficiente
7.5.1 Teste da Significância de um Único Coeficiente
• Para saber se os dados contém alguma evidência de que y está relacionado com xk, nós testamos a hipótese nula
0 : 0kH contra a hipótese alternativa
1 : 0kH
• Para conduzir o teste, nós utilizamos a estatística do teste (7.3.10), o qual, se a hipótese nula for verdadeira, é
( )~
ep
kT K
k
bt t
b
• Para a hipótese alternativa de “desigualdade”, nós utilizamos um teste bicaudal e rejeitamos H0 se o valor t calculado for maior ou igual a tc, ou menor ou igual a tc.
• No exemplo da rede de lanchonetes nós testamos, seguindo nosso formato padrão de teste, se a receita está relacionado com o preço:
0 2: 0H
1 2: 0H
1.
2.
3. A estatística do teste, se a hipótese nula for verdadeira, é
2
( )
2
~ep
T K
bt t
b
4. Com 49 graus de liberdade e um nível de significância de 5%, os valores críticos que levam a ter uma probabilidade de 0,025 em cada calda da distribuição são tc = 2,01 e tc = 2,01. Assim, nós rejeitamos a hipótese nula se t 2,01 ou se t 2,01. Na notação em módulo, nós rejeitamos a hipótese nula se |t| 2,01.
5. O valor calculado da estatística t é
6,6422,08
3,191t
Como 2,08 < 2,01, nós rejeitamos a hipótese nula e aceitamos a alternativa.
• O valor-p é dado por P[|t(49)| > 2,08] = 2 0,021 = 0,042. Utilizando este procedimento nós rejeitamos H0 porque 0,042 < 0,05.
• Para testar se a receita está relacionada com os gastos com propaganda, nós temos
0 3: 0H
1 3: 0H
3. A estatística do teste, se a hipótese nula for verdadeira, é
1.
2.
3
( )
3
~ep
T K
bt t
b
4. Nós rejeitamos a hipótese nula se |t| 2,01.
5. O valor da estatística do teste é
2,98417,88
0,1669t
Como 17,88 > tc = 2,01, os dados admitem a conjuntura de que a receita está relacionada com os gastos em propaganda.
7.5.2 Teste de Hipótese Unicaudal para um Único Coeficiente
7.5.2a Teste para a Elasticidade da Demanda
•Em relação à elasticidade da demanda, nós desejamos saber se: •2 0: uma queda no preço leva a uma redução na receita total (a demanda é inelástica em relação ao preço) •2 < 0: uma queda no preço leva a um aumento na receita total (a demanda é elástica em relação ao preço)
0 2: 0 (demanda é unitária ou inelástica)H
1 2: 0 (demanda é elástica)H
3. Para construir uma estatística de teste, consideramos como hipótese nula a igualdade 2 = 0. Se a hipótese nula for verdadeira, então a estatística t é
~
ep( )
k
T K
k
bt t
b
1.
2.
5. O valor da estatística do teste é
2
2
6,6422,08
ep 3,191
bt
b
(R7.10)
Como t = 2,08 < tc = 1,68, nós rejeitamos H0: 2 0 e concluímos que H1: 2 < 0 (a demanda é elástica) é mais compatível com os dados. A evidência amostral dá base para a proposição de que uma redução no preço trará um aumento na receita total.
•O valor-p é dado por P[t(49) < 2,08] e rejeita-se H0 se o valor-p é menor do que 0,05. Utilizando um software, nós encontramos que P[t(49) < 2,08] = 0,021. Como 0,021 < 0,05, chega-se na mesma conclusão.
4. A região de rejeição consiste nos valores da distribuição t que são improváveis de ocorrer se a hipótese nula for verdadeira. Definindo “improvável” em termos de nível de significância de 5%, respondemos essa questão encontrando um valor crítico tc tal que P[t(T-K) tc ] = 0,05. Então, nós rejeitamos H0, se t tc . Dado uma amostra de T=52 observações, os graus de liberdade são T K = 49 e o valor crítico t é tc = 1,68.
• A outra hipótese de interesse é se um aumento nos gastos com propaganda trazem um aumento na receita total que é suficiente para cobrir os gastos feitos. Isso ocorrerá se 3 > 1. Elaborando o teste, nós temos:
0 3: 1 H
1 3: 1 H
1.
2.
3. Nós calculamos um valor para a estatística t como se a hipótese nula fosse 3 = 1. Utilizando (7.3.10) nós temos, se a hipótese nula for verdadeira,
3
3
1~
ep( )T K
bt t
b
4. Nesse caso, se o nível de significância for = 0,05, nós rejeitamos H0 se t tc = 1,68
5. O valor da estatística do teste é:
3 3
3
2,984 111,89
ep 0,1669
bt
b
Como 11,89 é muito maior do que 1,68, nós rejeitamos H0 e aceitamos a alternativa 3 > 1 como a mais compatível com os dados.
• Também, o valor-p nesse caso é essencialmente igual a zero (menor do que 1012). Assim, nós possuímos evidências estatísticas de que uma elevação nos gastos com propaganda serão justificados pelo aumento na receita.
7.6 Mensuração da Qualidade do Ajustamento
• O coeficiente de determinação é
2
2
2
2
2
ˆ
ˆ1 1
t
t
t
t
y ySQRR
SQT y y
eSQE
SQT y y
(7.6.1)
•Para o exemplo da rede de lanchonetes, a Tabela de Análise da Variância inclui as seguintes informações:
Tabela 7.4 Tabela Parcial ANOVA
Fonte GL Soma de Quadrados
Explicada 2 11776,18 Não Explicada 49 1805,168 Total 51 13581,35
Utilizando a soma de quadrados, nós temos
22
2
ˆ 1805,1681 1 0,867
13581,35
t
t
eR
y y
(R7.12)
•A interpretação de é que 86.7% da variação na receita total é explicada pela variação no preço e pela variação no nível de gastos com propaganda. •Uma dificuldade com o é que ele pode ser aumentado pela inclusão de novas variáveis, mesmo se as variáveis acrescentadas não apresentarem qualquer justificativa econômica. Algebricamente, isso é um fato de que à medida que se acrescenta mais variáveis, a SQE diminui (ela pode permanecer inalterada, mas isso é raro acontecer) e assim o sobe. Se o modelo contém T1 variáveis, o = 1. •Uma medida alternativa para mensurar a qualidade do ajustamento é chamada de ajustado, e tem, geralmente, como símbolo ; ele é usualmente apresentado pelos programas de regressão. Ele é calculado como
2R
2R
2R
2R
2R
2R
2 /( )1
/( 1)
SQE T KR
SQT T
• Para o exemplo da rede de lanchonetes, o valor da medida descritiva é .
• Essa medida nem sempre sobe quando uma variável é acrescentada.
• Enquanto é resolvido um problema, essa medida corrigida da qualidade do ajustamento infelizmente introduz outro. Ela perde sua interpretação; não significa mais a porcentagem da variação explicada.
• É importante uma nota final. O parâmetro de intercepto
é onde o “plano” da regressão cruza o eixo y, como mostrado na Figura 7.1. Se, por razões teóricas, você estiver certo que o plano da regressão passa pela origem, então e podemos omiti-lo do modelo.
2 0,8617R
2R
1
1 0
•Se o modelo não contém um parâmetro de intercepto, então a medida R2 dada em (7.6.1) não é mais apropriada. A razão para isso é que, sem um termo de intercepto no modelo,
2 2 2ˆ ˆ
t t ty y y y e
SQT SQR SQE
• Nessas condições não faz sentido falar da proporção da variação total que é explicada pela regressão.