Click here to load reader

Análise de Regressão Múltipla com informação qualitativa ... · PDF fileVariáveis binárias ou dummy Nestes casos, as informações relevantes podem ser captadas pela definição

  • View
    217

  • Download
    0

Embed Size (px)

Text of Análise de Regressão Múltipla com informação qualitativa ......

  • Anlise de Regresso Mltipla com informao qualitativa: variveis binrias (dummy)

    1

    variveis binrias (dummy)

  • Como descrever informaes qualitativas?

    Fatores qualitativos podem ser incorporados a modelos de regresso.

    Neste caso, classificamos os dados conforme algumas caractersticas qualitativas.

    2

    Exemplos: ser homem ou ser mulher; ser branco ou negro; morar no Rio ou em Niteri.... etc.

    Estas variveis qualitativas podem ser regressoresou variveis dependentes.

    Existem formas de incorpor-las ao modeloeconomtrico.

  • Variveis binrias ou dummyNestes casos, as informaes relevantes podem ser captadas pela definio de uma varivel binria (varivel zero-um)

    Definio de uma dummy: identificar o Definio de uma dummy: identificar o evento que assumir o valor um e o evento que assumir o valor zero.

    sempre bom denominar a varivel pelo evento que igual a um: Ser homem igual a 1 chamar a varivel de

    homem 3

  • Variveis binrias ou dummy

    Como fica o banco de dados?

    4

  • Exemplo: com uma varivel binria

    Somente dois fatores afetam os salrios: gnero e escolaridade

    Qual a diferena entre o salrio hora do homem e da mulher, dado o mesmo nvel educacional?

    5

  • 6

  • Exemplo 2:

    Se educao, experincia e permanncia foram caractersticas relevantes para a produtividade, a hiptese nula para no existncia de diferena entre homens e mulheres seria:

    A alternativa seria que existe discriminao contra mulheres:

    7

    0: 0 =oH

    0: 0

  • Banco de dados: wage1.gdt

    Rode o modelo acima

    Quanto a mulher ganha , em mdia, a Quanto a mulher ganha , em mdia, a menos que o homem?

    8

  • Modelo 1: MQO, usando as observaes 1-526 Varivel dependente: wage

    Coeficiente Erro Padro razo-t p-valor

    const -1,56794 0,724551 -2,1640 0,03092 ** female -1,81085 0,264825 -6,8379

  • Banco de dados: wage1.gdt

    Rode o mesmo modelo acima, mas excluindo todos controles com exceo da dummy feminino. Qual o salrio hora mdio dos homens?

    O que o intercepto?

    Teste de comparao das mdias

    10

  • Modelo 2: MQO, usando as observaes 1-526 Varivel dependente: wage

    Coeficiente Erro Padro razo-t p-valor

    const 7,09949 0,210008 33,8058

  • Banco de dados: GPA1.gdtEfeitos de se possuir computadores na avaliao de cursos superiores

    PC = 1 se o aluno tem computador em casa.

    hsGPA: nota no final do ensino mdio

    ACT: nota do exame vestibular ACT: nota do exame vestibular

    Qual o efeito sobre a nota mdia final prevista no curso superior?

    O que acontece com o efeito se retirar hsGPA e ACT? Interprete o significado do coeficiente de PC.

    12

  • Modelo 1: MQO, usando as observaes 1-141 Varivel dependente: colGPA

    Coeficiente Erro Padro razo-t p-valor

    const 1,26352 0,333126 3,7929 0,00022 *** PC 0,157309 0,0572875 2,7460 0,00684 *** hsGPA 0,447242 0,0936475 4,7758

  • Modelo 2: MQO, usando as observaes 1-141 Varivel dependente: colGPA

    Coeficiente Erro Padro razo-t p-valor

    const 2,98941 0,0395018 75,6779

  • Avaliao de polticas

    Qual efeito de um programa econmico ou social sobre os indivduos, empresas, etc...

    Dois grupos de estudo: Dois grupos de estudo: Grupo de controle: no participa do programa

    Grupo de tratamento: participa do programa

    Escolha dos grupos de controle e tratamento no aleatria.

    15

  • Avaliao de polticas

    Definio do grupo de controle e tratamento: Grupo de Tratamento: pessoas (do pblico- alvo) que sero atendidas pelo projeto.que sero atendidas pelo projeto.

    Grupo de Controle: pessoas com caractersticas similares, mas que no sero atendidas pelo projeto.

    16

  • Banco de dados. JTRAIN.GDTEfeitos da concesso de subsdios sobre as horas de treinamento

    Dados de 1988 indstrias de Michigan

    hrsemp: horas de treinamento por empregado no nvel da empresa.

    Subs = 1 se a indstria recebeu subsdio17

  • Varivel dependente na forma log

    Regresso dos preos dos imveis

    Banco de dados Hprice1.gdt

    Dummy colonial: igual a 1 se o imvel tiver estilo colonial. Qual a sua interpretao?

    18

  • Reestimar o exemplo 2

    Use log(salrio hora)

    Inclua termos quadrticos para experincia e tempo de permanncia.e tempo de permanncia.

    Quanto as mulheres ganham a menos que os homens?

    Qual a diferena percentual exata entre homens e mulheres?

    19

  • 20

  • Reestimar o exemplo 2

    )297,0exp(/

    )297,0exp())/exp(log(

    297,0)/log(

    297,0)log()log(

    =

    =

    =

    =

    salariohsalariom

    salariohsalariom

    salariohsalariom

    salariohsalariom

    21

    257,01)297,0exp(

    1

    )297,0exp(/

    ==

    =

    =

    salarioh

    salariohsalariom

    salarioh

    salariom

    salarioh

    salariohsalariom

    salariohsalariom

  • Dummies para mltiplas categorias

    Suponha que seus dados sejam sobre pessoas que trabalham nos setores primrio, secundrio e tercirio da economia.

    Para compar-los, inclua 2 variveis dummies:

    22

    Para compar-los, inclua 2 variveis dummies:

    prim = 1 se a pessoa trabalha no setor primrio e= 0 caso contrrio; e sec = 1 se ela trabalha no setor secundrio e = 0 caso contrrio.

  • Dummies para mltiplas categorias

    Suponha que seus dados sejam sobre pessoas que trabalham nos setores primrio, secundrio e tercirio da economia.

    Para compar-los, inclua 2 variveis dummies:

    23

    Para compar-los, inclua 2 variveis dummies:

    prim = 1 se a pessoa trabalha no setor primrio e= 0 caso contrrio; e sec = 1 se ela trabalha no setor secundrio e = 0 caso contrrio.

  • Categorias mltiplas (cont.)

    Qualquer varivel expressa em categorias pode ser transformada em uma varivel dummy.

    Como o caso base representado pelo

    24

    Como o caso base representado pelo intercepto, se h n categorias, devem havern 1 dummies.Se h muitas categorias, pode-se agrupar algumas delas.

  • Exemplo: Equao do log salrio hora

    Modelo que considere as diferenas salariais entre quatro grupos: Homens casados (marrmale)

    Homens solteiros (grupo base)

    25

    Homens solteiros (grupo base) Mulheres casadas (marrfem) Mulheres solteiras (singfem)

    O prmio por ser casado no o mesmo para homens e mulheres!!!

  • Exemplo: Equao do log salrio hora

    26

    Lembre do grupo base!!!!

    As estimativas das trs variveis medem a diferena proporcional nos salrios relativamente aos homens solteiros.

  • Exemplo: Equao do log salrio hora

    Os homens casados ganham cerca de 21,3% mais que os homens solteiros.Uma mulher casada deve ganhar 19,8% a menos que um homem solteiro.

    27

    que um homem solteiro.Diferena proporcional estimada entre as mulheres solteiras e as casadas (-0,110-(-0,198)) = 0,088. Mulheres solteiras ganham 8,8% a mais que as mulheres casadas.

  • Interao entre dummiesInteragir dummies como subdividir o grupo. Exemplo: ter dummies para homens assim como para prim e sec.Adicione homem*prim e homem*sec, para um total de 5 dummies e 6 categorias.

    28

    total de 5 dummies e 6 categorias.O caso base : mulher no tercirio. prim para mulheres no setor primrio e sec para mulheres no setor secundrio.As interaes refletem homens no primrio e homens no secundrio.

  • Mais sobre dummies de interaoFormalmente, o modelo y = 0 + 1homem + 2prim + 3sec + 4homem*prim + 5homem*sec+ 1x + u. Ento, por exemplo:Se homem = 0, prim = 0 e sec = 0:y = + x + u

    29

    y = 0 + 1x + u

    Se homem = 0, prim = 1 e sec = 0:y = 0 + 2prim + 1x + u

    Se homem = 1, prim = 0 e sec = 1:y = 0 + 1homem + 3prim + 5homem*sec + 1x + u

  • Exemplo:

    30

    Outra forma de encontramos diferencias de salrio entre homens casados, homens solteiros, mulheres casadas e mulheres solteiras.

  • Outras interaes com dummies

    Podemos tambm interagir uma dummy, d, com uma varivel contnua, x:

    y = 0 + 1d + 1x + 2d*x + u.

    31

    y = 0 + 1d + 1x + 2d*x + u.

    Se d = 0, ento y = 0 + 1x + u.

    Se d = 1, ento y = (0 + 1) + (1+ 2) x + u.

    Temos uma mudana na inclinao.

  • y

    y = 0 +1x

    Exemplo de 0 > 0 e 1 < 0

    d = 0

    32x

    y = (0 + 0) + (1 + 1) xd = 1

  • Exemplo:

    Queremos verificar se o retorno da educao o mesmo para homens e mulheres:

    mede a diferena nos interceptos entre homens e mulheres

    o

    33

    homens e mulheres

    mede a diferena no retorno da educao entre homens e mulheres.

    1

    interao

  • 34

  • 35

    O retorno estimado da educao dos homens 8,2%.

    Para as mulheres, o retorno 0,082-0,0056 = 0,0764 (7,6%).

    Esta diferena de retorno pouco significativa. Logo, no podemos rejeitar a hiptese nula de que o retorno para homens e mulheres igual.

  • Teste para diferenas entre grupos

    Testar se uma funo de regresso diferente para um grupo em relao a outro pode ser pensado simplesmente como um teste para a significncia conjunta da dummy e suas interaes com todas as outras variveis x.

    36

    com todas as outras variveis x.A hiptese nula que os modelos no sodiferentes para os grupos.Ento, estimam-se os modelos com e sem todas as interaes e calcula-se a estatstica F.Mas quando h muitas interaes, h um procedimento mais fcil.

  • Teste para diferenas entre grupos

    Suponha que temos dois grupos e queremos testar se

    interceptos e inclinaes so diferentes para estes do

Search related