Click here to load reader
View
217
Download
0
Embed Size (px)
Anlise de Regresso Mltipla com informao qualitativa: variveis binrias (dummy)
1
variveis binrias (dummy)
Como descrever informaes qualitativas?
Fatores qualitativos podem ser incorporados a modelos de regresso.
Neste caso, classificamos os dados conforme algumas caractersticas qualitativas.
2
Exemplos: ser homem ou ser mulher; ser branco ou negro; morar no Rio ou em Niteri.... etc.
Estas variveis qualitativas podem ser regressoresou variveis dependentes.
Existem formas de incorpor-las ao modeloeconomtrico.
Variveis binrias ou dummyNestes casos, as informaes relevantes podem ser captadas pela definio de uma varivel binria (varivel zero-um)
Definio de uma dummy: identificar o Definio de uma dummy: identificar o evento que assumir o valor um e o evento que assumir o valor zero.
sempre bom denominar a varivel pelo evento que igual a um: Ser homem igual a 1 chamar a varivel de
homem 3
Variveis binrias ou dummy
Como fica o banco de dados?
4
Exemplo: com uma varivel binria
Somente dois fatores afetam os salrios: gnero e escolaridade
Qual a diferena entre o salrio hora do homem e da mulher, dado o mesmo nvel educacional?
5
6
Exemplo 2:
Se educao, experincia e permanncia foram caractersticas relevantes para a produtividade, a hiptese nula para no existncia de diferena entre homens e mulheres seria:
A alternativa seria que existe discriminao contra mulheres:
7
0: 0 =oH
0: 0
Banco de dados: wage1.gdt
Rode o modelo acima
Quanto a mulher ganha , em mdia, a Quanto a mulher ganha , em mdia, a menos que o homem?
8
Modelo 1: MQO, usando as observaes 1-526 Varivel dependente: wage
Coeficiente Erro Padro razo-t p-valor
const -1,56794 0,724551 -2,1640 0,03092 ** female -1,81085 0,264825 -6,8379
Banco de dados: wage1.gdt
Rode o mesmo modelo acima, mas excluindo todos controles com exceo da dummy feminino. Qual o salrio hora mdio dos homens?
O que o intercepto?
Teste de comparao das mdias
10
Modelo 2: MQO, usando as observaes 1-526 Varivel dependente: wage
Coeficiente Erro Padro razo-t p-valor
const 7,09949 0,210008 33,8058
Banco de dados: GPA1.gdtEfeitos de se possuir computadores na avaliao de cursos superiores
PC = 1 se o aluno tem computador em casa.
hsGPA: nota no final do ensino mdio
ACT: nota do exame vestibular ACT: nota do exame vestibular
Qual o efeito sobre a nota mdia final prevista no curso superior?
O que acontece com o efeito se retirar hsGPA e ACT? Interprete o significado do coeficiente de PC.
12
Modelo 1: MQO, usando as observaes 1-141 Varivel dependente: colGPA
Coeficiente Erro Padro razo-t p-valor
const 1,26352 0,333126 3,7929 0,00022 *** PC 0,157309 0,0572875 2,7460 0,00684 *** hsGPA 0,447242 0,0936475 4,7758
Modelo 2: MQO, usando as observaes 1-141 Varivel dependente: colGPA
Coeficiente Erro Padro razo-t p-valor
const 2,98941 0,0395018 75,6779
Avaliao de polticas
Qual efeito de um programa econmico ou social sobre os indivduos, empresas, etc...
Dois grupos de estudo: Dois grupos de estudo: Grupo de controle: no participa do programa
Grupo de tratamento: participa do programa
Escolha dos grupos de controle e tratamento no aleatria.
15
Avaliao de polticas
Definio do grupo de controle e tratamento: Grupo de Tratamento: pessoas (do pblico- alvo) que sero atendidas pelo projeto.que sero atendidas pelo projeto.
Grupo de Controle: pessoas com caractersticas similares, mas que no sero atendidas pelo projeto.
16
Banco de dados. JTRAIN.GDTEfeitos da concesso de subsdios sobre as horas de treinamento
Dados de 1988 indstrias de Michigan
hrsemp: horas de treinamento por empregado no nvel da empresa.
Subs = 1 se a indstria recebeu subsdio17
Varivel dependente na forma log
Regresso dos preos dos imveis
Banco de dados Hprice1.gdt
Dummy colonial: igual a 1 se o imvel tiver estilo colonial. Qual a sua interpretao?
18
Reestimar o exemplo 2
Use log(salrio hora)
Inclua termos quadrticos para experincia e tempo de permanncia.e tempo de permanncia.
Quanto as mulheres ganham a menos que os homens?
Qual a diferena percentual exata entre homens e mulheres?
19
20
Reestimar o exemplo 2
)297,0exp(/
)297,0exp())/exp(log(
297,0)/log(
297,0)log()log(
=
=
=
=
salariohsalariom
salariohsalariom
salariohsalariom
salariohsalariom
21
257,01)297,0exp(
1
)297,0exp(/
==
=
=
salarioh
salariohsalariom
salarioh
salariom
salarioh
salariohsalariom
salariohsalariom
Dummies para mltiplas categorias
Suponha que seus dados sejam sobre pessoas que trabalham nos setores primrio, secundrio e tercirio da economia.
Para compar-los, inclua 2 variveis dummies:
22
Para compar-los, inclua 2 variveis dummies:
prim = 1 se a pessoa trabalha no setor primrio e= 0 caso contrrio; e sec = 1 se ela trabalha no setor secundrio e = 0 caso contrrio.
Dummies para mltiplas categorias
Suponha que seus dados sejam sobre pessoas que trabalham nos setores primrio, secundrio e tercirio da economia.
Para compar-los, inclua 2 variveis dummies:
23
Para compar-los, inclua 2 variveis dummies:
prim = 1 se a pessoa trabalha no setor primrio e= 0 caso contrrio; e sec = 1 se ela trabalha no setor secundrio e = 0 caso contrrio.
Categorias mltiplas (cont.)
Qualquer varivel expressa em categorias pode ser transformada em uma varivel dummy.
Como o caso base representado pelo
24
Como o caso base representado pelo intercepto, se h n categorias, devem havern 1 dummies.Se h muitas categorias, pode-se agrupar algumas delas.
Exemplo: Equao do log salrio hora
Modelo que considere as diferenas salariais entre quatro grupos: Homens casados (marrmale)
Homens solteiros (grupo base)
25
Homens solteiros (grupo base) Mulheres casadas (marrfem) Mulheres solteiras (singfem)
O prmio por ser casado no o mesmo para homens e mulheres!!!
Exemplo: Equao do log salrio hora
26
Lembre do grupo base!!!!
As estimativas das trs variveis medem a diferena proporcional nos salrios relativamente aos homens solteiros.
Exemplo: Equao do log salrio hora
Os homens casados ganham cerca de 21,3% mais que os homens solteiros.Uma mulher casada deve ganhar 19,8% a menos que um homem solteiro.
27
que um homem solteiro.Diferena proporcional estimada entre as mulheres solteiras e as casadas (-0,110-(-0,198)) = 0,088. Mulheres solteiras ganham 8,8% a mais que as mulheres casadas.
Interao entre dummiesInteragir dummies como subdividir o grupo. Exemplo: ter dummies para homens assim como para prim e sec.Adicione homem*prim e homem*sec, para um total de 5 dummies e 6 categorias.
28
total de 5 dummies e 6 categorias.O caso base : mulher no tercirio. prim para mulheres no setor primrio e sec para mulheres no setor secundrio.As interaes refletem homens no primrio e homens no secundrio.
Mais sobre dummies de interaoFormalmente, o modelo y = 0 + 1homem + 2prim + 3sec + 4homem*prim + 5homem*sec+ 1x + u. Ento, por exemplo:Se homem = 0, prim = 0 e sec = 0:y = + x + u
29
y = 0 + 1x + u
Se homem = 0, prim = 1 e sec = 0:y = 0 + 2prim + 1x + u
Se homem = 1, prim = 0 e sec = 1:y = 0 + 1homem + 3prim + 5homem*sec + 1x + u
Exemplo:
30
Outra forma de encontramos diferencias de salrio entre homens casados, homens solteiros, mulheres casadas e mulheres solteiras.
Outras interaes com dummies
Podemos tambm interagir uma dummy, d, com uma varivel contnua, x:
y = 0 + 1d + 1x + 2d*x + u.
31
y = 0 + 1d + 1x + 2d*x + u.
Se d = 0, ento y = 0 + 1x + u.
Se d = 1, ento y = (0 + 1) + (1+ 2) x + u.
Temos uma mudana na inclinao.
y
y = 0 +1x
Exemplo de 0 > 0 e 1 < 0
d = 0
32x
y = (0 + 0) + (1 + 1) xd = 1
Exemplo:
Queremos verificar se o retorno da educao o mesmo para homens e mulheres:
mede a diferena nos interceptos entre homens e mulheres
o
33
homens e mulheres
mede a diferena no retorno da educao entre homens e mulheres.
1
interao
34
35
O retorno estimado da educao dos homens 8,2%.
Para as mulheres, o retorno 0,082-0,0056 = 0,0764 (7,6%).
Esta diferena de retorno pouco significativa. Logo, no podemos rejeitar a hiptese nula de que o retorno para homens e mulheres igual.
Teste para diferenas entre grupos
Testar se uma funo de regresso diferente para um grupo em relao a outro pode ser pensado simplesmente como um teste para a significncia conjunta da dummy e suas interaes com todas as outras variveis x.
36
com todas as outras variveis x.A hiptese nula que os modelos no sodiferentes para os grupos.Ento, estimam-se os modelos com e sem todas as interaes e calcula-se a estatstica F.Mas quando h muitas interaes, h um procedimento mais fcil.
Teste para diferenas entre grupos
Suponha que temos dois grupos e queremos testar se
interceptos e inclinaes so diferentes para estes do