69
REGRESSÃO LINEAR Parte II Vitor Vieira Vasconcelos BH1350 – M étodos e Técnicas de Análise da I nformação para o Planejamento Julho de 2016

Regressão Linear Múltipla

Embed Size (px)

Citation preview

  • REGRESSO LINEARParte II

    Vitor Vieira Vasconcelos

    BH1350 Mtodos e Tcnicas de Anlise da Informao para o PlanejamentoJulho de 2016

  • Anlise de regresso uma ferramenta estatsticaque utiliza a relao entre duas ou mais variveis talque uma varivel possa ser explicada (Y varivelresposta/ dependente) pela outra ou outras (X variveis indicadoras/ preditoras/ explicativas/independentes).

    Y = aX + b

    NETER J. et al. Applied Linear Statistical Models. Boston, MA: McGraw-Hill, 1996.

    ANLISE DE REGRESSO

  • Um modelo de regresso contendo somente uma varivel preditora (X) denominado modelo de regresso simples.

    Um modelo com mais de uma varivel preditora (X) denominado modelo de regresso mltiplo.

    Modelos de Regresso

  • onde:Yi o valor da varivel resposta na i-sima observao;0 e 1 so parmetros;Xi uma constante conhecida; o valor da varivel

    preditora na i-sima observao;i um termo de erro aleatrio com mdia zero e varincia

    constante 2 (E(i)=0 e 2 (i)= 2 )i e j so no correlacionados (independentes) para i j

    (2 (i,j)= 0 )

    Regresso Linear Simples

    Sadai = (Modeloi) + erroi

    Lembrando:

  • Yii

    X

    Y

    0

    1 Coeficienteangular

    Y = E(Y) = 0 + 1 X

    InclinaoPopulacional

    InterceptoPopulacional

    Erro Aleatrio

    Varivel Preditora

    Varivel Resposta Yi=0+1Xi +i

    i=b0+b1Xii =Yi-i

    Modelo estimado

    Resduo

    Regresso Linear Simples

  • Yi=0+1Xi1 + 2Xi2 ++ pXip + i

    Yi o valor da varivel resposta na i-sima observao0, , p so parmetrosXi1 ,,Xip so os valores das variveis preditoras na i-sima

    observaoi um termo de erro aleatrio com distribuio normal, mdia

    zero e varincia constante 2 (E(i )=0 e 2 (i )= 2 )i e j so no correlacionados (independentes) para i j

    Regresso Linear Mltipla

  • 0

    Plano de Regresso

    (1,33;1,67)

    E(Yi) = 20,00

    Yi

    i

    Fonte: Slide de Paulo Jos Ogliari, Informtica, UFSC. Em http://www.inf.ufsc.br/~ogliari/cursoderegressao.html

    Superfcie de Resposta: Funo de Regresso na Regresso Linear

    Mltipla

  • O parmetro 0 o intercepto do plano deregresso. Se a abrangncia do modelo inclui X1=0 eX2=0 ento 0=10 representa a resposta mdia E(Y)neste ponto. Em outras situaes, 0 no temqualquer outro significado como um termoseparado no modelo de regresso.

    Significado dos Coeficientes de regresso: 0, 1, 2,.., p

    Fonte: Slide de Paulo Jos Ogliari, Informtica, UFSC. Em http://www.inf.ufsc.br/~ogliari/cursoderegressao.html

  • Parmetro 1 indica a mudana na resposta mdiaE(Y) por unidade de acrscimo em X1 quando X2 mantido constante. Da mesma forma 2 indica amudana na resposta mdia por unidade deaumento em X2 quando X1 mantido constante.

    Ceteris Paribus

    Fonte: Slide de Paulo Jos Ogliari, Informtica, UFSC. Em http://www.inf.ufsc.br/~ogliari/cursoderegressao.html

    Significado dos Coeficientes de regresso: 0, 1, 2,.., p

  • Conceitualmente, a interpretao de SQTotal, SQResduos e SQModelo permanece a mesma

    SQT = SQM + SQR

    Soma dos Quadrados

  • Quando existem vrios previsores (X), utilizamos um coeficiente de correlao mltiplo, denominado RMltiplo.

    R Mltiplo: a correlao (R) entre os valores observados de Y e os de Y previstos pelo modelo de regresso mltiplo

    Valores Grandes de R mltiplo Alta correlao entre os valores previstos e observados da varivel de sada.

    R Mltiplo & R2

  • Resumindo: R Mltiplo uma medida do qual bem o modelo prev os dados observados.

    E o R2 resultante?

    Pode ser interpretado da mesma forma que na regresso simples: a quantidade de variao em Yque pode ser capturada pelo modelo.

    R Mltiplo & R2

  • Se estamos interessados em construir um modelo complexo com vrios previsores (X1, X2, ..., Xn),

    como decidir qual deles considerar???

    1. Avalie a importncia terica de cada varivel includa no modelo

    2. Explore a relao entre Y e os previsores

    3. Utilize um mtodo de seleo dos previsores: Hierrquico (entrada em blocos), Entrada Forada (Enter), Mtodos por passos (Stepwise)

    Mtodos de Regresso

  • 1. HIERRQUICO (ENTRADA EM BLOCOS)

    Previsores selecionados com base em trabalhos anteriores. Pesquisador decide em que ordem devem ser colocados no modelo.

    2. ENTRADA FORADA (ENTER)

    Todos os previsores so forados no modelo ao mesmo tempo. Deve basear-se em boas razes tericas para incluir os previsores escolhidos. Diferentemente da hierrquica, pesquisador no toma decises sobre a ordem em que variveis sero acrescentadas.

    Mtodos de Regresso

  • 3. MTODOS POR PASSOS (Stepwise)

    Deciso sobre a ordem em que os previsores so acrescentados ao modelo baseada em critrios matemticos.

    Mtodo Forward (Para frente)

    Modelo inicial contem apenas a constante (b0). Ento procura-se o previsor que melhor prev a varivel de sada (maior coef. de correlao) e se ele aumenta significativamente o ajuste do modelo, ele mantido. Procura-se ento um segundo previsor e verificada sua capacidade de melhor significativamente o ajuste do modelo... E assim por diante.

    Mtodos de Regresso

  • 3. MTODOS POR PASSOS (Stepwise)

    Deciso sobre a ordem em que os previsores so acrescentados ao modelo baseada em critrios matemticos.

    Mtodo Passo a Passo (Stepwise)

    Semelhante ao Forward. No entanto, cada vez que um previsor adicionado ao modelo, um teste de remoo feito sobre o previsor menos til. Assim, a equao de regresso acessada constantemente para ver se algum previsor redundante pode ser removido.

    Mtodos de Regresso

  • 3. MTODOS POR PASSOS (Stepwise)

    Deciso sobre a ordem em que os previsores so acrescentados ao modelo baseada em critrios matemticos.

    ** Mtodo Backward (Para trs) **

    Oposto do mtodo Forward (para frente). Inicia considerando todos os previsores no modelo e vai retirando os previsores que no contribuem significativamente para o qual bem o modelo explica a varivel de sada (Y).

    prefervel em relao ao mtodo Forward, j que o Forwardpromove um maior risco de eliminar um previsor que de fato contribui para o modelo.

    Mtodos de Regresso

  • Seja seletivo na incluso de variveis no modelo!

    Priorize justificativas tericas, baseadas em estudos anteriores, literatura...

    Como regra geral, quanto menos, melhor!!!

    Mtodos de Regresso

  • O quo acurado meu modelo de regresso???

    (1) O modelo representa bem os meus dados, ou ele influenciado por um nmero pequeno de casos (valores atpicos e casos influentes)?

    (2) O modelo pode ser generalizado para outras amostras?

  • O quo acurado meu modelo de regresso???

    (1) O modelo representa bem os meus dados, ou ele influenciado por um nmero pequeno de casos (valores atpicos e casos influentes)?

    (2) O modelo pode ser generalizado para outras amostras?

  • Diagnsticos: Valores AtpicosUm valor atpico (outlier) um caso que difere

    substancialmente da maioria dos dados

    Podem introduzir tendenciosidade no modelo, pois afetaro os valores dos coeficientes de regresso estimados

    importante detectar os valores atpicos para ver se o modelo tendencioso!

  • Diagnsticos: Valores AtpicosRESDUOS: Diferena entre valores previstos pelo modelo e os valores observados na amostra

    Resduos apresentam o erro que est presente no modelo.

    Modelo com bom ajuste Resduos pequenos

    Se qualquer caso destacar-se por ter um grande resduo, ele poder ser ATPICO

    MAS COMO ESTABELECER O QUE SERIA

    UM GRANDE RESDUO???

  • Diagnsticos: Valores AtpicosConverter os resduos (Yobservado Yestimado) em escores-z. Ou seja, padronizar os resduos.

    LEMBRETE: Escore-z

    REGRAS GERAIS PARA RESDUOS PADRONIZADOS:

    - Resduos padronizados com valor maior do que 3,29 (3) so preocupantes porque, em uma amostra, dificilmente acontecem por acaso

    - Se mais do que 1% da nossa amostra padronizada apresenta erros maiores do que 2,58 (2,5), h evidncias de que o nvel de erro dentro do nosso modelo inaceitvel (modelo no se ajusta bem).

    - Se mais do que 5% da nossa amostra tem resduos padronizados maiores do que 1,96 (2), tambm h evidncias de que nosso modelo uma representao ruim dos dados.

    Numa amostranormalmente

    distribuda:

    95% dos escores-z esto entre -1,96 e +1,96

    99% esto entre -2,58 e +2,58

    99,9% esto entre -3,29 e +3,29

  • Diagnsticos: Casos InfluentesAlm de procurar valores atpicos olhando para os erros do

    modelo, tambm possvel buscar os casos que influenciam demasiadamente os parmetros do modelo

    Se retirssemos determinados casos, teramos coeficientes de regresso diferentes???

    Objetivo da anlise: determinar se o modelo de regresso estvel para toda a amostra ou se ele pode estar sendo influenciado somente por poucos casos (atpicos).

  • Diagnsticos: Casos InfluentesAlguns mtodos para determinao de casos influentes:

    1. VALOR PREVISTO AJUSTADO

    Calcula-se um novo modelo sem o caso em questo e usa-se este novo modelo para prever o valor que este caso teria.

    Se o caso no tem grande influncia: Pouca diferena entre valor previsto (pelo modelo que considera o caso) e valor previsto ajustado (pelo modelo que NO considera o caso) Modelo Estvel

    DFFIT Diferena entre valor previsto ajustado e valor previsto original

    (DFFit padronizado)

  • Diagnsticos: Casos InfluentesAlguns mtodos para determinao de casos influentes:

    2. DFBETA (DFBETA PADRONIZADO)

    Diferena entre 1 parmetro estimado utilizando todos os casos e estimado quando um caso excludo. calculado para cada caso e para cada um dos parmetros do modelo.

    Valores do DFBETA padronizado acima de 1 indicam casos que substancialmente influenciam os parmetros do modelo

  • Diagnsticos: Casos InfluentesAlguns mtodos para determinao de casos influentes:

    3. DISTNCIA DE COOK

    Medida da influncia global de um caso sobre o modelo.

    4. INFLUNCIA (LEVERAGE) Valores Chapu (Hat Values)

    Mede o quanto um valor observado influencia o valor previsto na sada.

    Os valores de influncia variam entre 0 (caso sem influncia) e 1 (caso com total influncia sobre a previso)

  • Diferena entre Resduos e Estatsticas de Influncia

    O Caso 8, que um valor atpico muito influente, mas apresenta um resduo bem pequeno (est prximo da linha que foi ajustada aos dados).

    Por isso importante analisar tanto os resduos quanto as estatsticas de influncia.

  • O quo acurado meu modelo de regresso???

    (1) O modelo representa bem os meus dados, ou ele influenciado por um nmero pequeno de casos (valores atpicos e casos influentes)?

    (2) O modelo pode ser generalizado para outras amostras?

  • Quando realizamos uma anlise de regresso, estimamos os parmetros de uma equao a partir dos dados de nossa amostra.

    Mas ser que podemos generalizar nosso modelo, ou seja, tirar concluses (fazer inferncias) para alm da

    nossa amostra?

    Para generalizar um modelo de regresso, devemos estar seguros de que certas suposies foram satisfeitas, e para testar se o modelo de fato generalizvel, podemos fazer uma validao cruzada.

    Se acharmos que nosso modelo no generalizvel, devemos restringir qualquer concluso baseada no modelo amostra utilizada

    Generalizao

  • Para tirar concluses sobre uma populao com base em um modelo de regresso realizado sobre uma amostra, algumas suposies devem ser verdadeiras.

    1. Tipos de VariveisVariveis explicativas (X) devem ser quantitativas ou categricas; enquanto a varivel de resposta (Y) deve ser quantitativa, contnua e no limitada.

    No limitada significa que no deve haver restries na variabilidade da sada. Se a sada uma medida que varia de 1 a 10 e os dados coletados variam entre 3 e 7, ento esses dados so restritos.

    Suposies

  • 2. Distribuio NormalPara um valor fixo da varivel aleatria X, Y uma varivel aleatria com distribuio Normal (com mdia e varincias finitas);

    Yi ~ N(E(y/x); 2)

    OBS: Os previsores (X) no precisam ser normalmente distribudos

    Resduos do modelo devero ser normalmente distribudos, com mdia zero (varivel aleatria)

    Suposies

  • 3. Linearidade

    Todos os valores mdios de Y (E(y/x)=Y/x) permanecem sobre uma reta, para um particular valor de X.

    E(y/x)=y/x = 0 + 1x

    Em outras palavras, assumimos que o relacionamento que estamos modelando do tipo linear

    Suposies

  • Esclarecimentos sobre a linearidade do modelo

    O Termo linear representa a forma como os parmetros entram no modelo.

    O modelo Yi=0+1X1i+2X2i2 embora graficamente represente uma parbola, um modelo linear em 0, 1 e 2 .

    J o modelo Yi=0e1Xi no um modelo linear em 0 e 1 .

  • 4. IndependnciaOs valores de Yi e Yj so estatisticamente independentes (falta de autocorrelao).

    Resduos do modelo devero ser independentes (falta de autocorrelao).

    Teste de Durbin-Watson pode ser aplicado sobre os resduos da regresso, para testar a correlao serial entre erros. A estatsticateste pode variar entre 0 e 4, com 2 indicando que os erros no socorrelacionados. Se maior que 2, indicao de correlao negativaentre resduos adjacentes. Se menor que 2, indicao de correlaopositiva.

    Suposies

  • Resduos IndependentesResduos

    Autocorrelacionados

  • 5. HomocedasticidadeA varincia de Y igual, qualquer que seja X.

    A cada nvel de X, a varincia do termo residual deve ser constante.

    Quando as varincias so desiguais, diz-se que existeheterocedasticidade.

    Suposies

  • A figura mostra a distribuio de Y para vrios valores de X.Mostra onde cai a observao Y1. Mostra que o erro adiferena entre Y1 e E(Y1). Observe que as distribuies deprobabilidade apresentam a mesma variabilidade.

    Fonte: Slide de Paulo Jos Ogliari, Informtica, UFSC. Em http://www.inf.ufsc.br/~ogliari/cursoderegressao.html

  • Resumo da situao: para qualquer valor Xi, a mdia de Yi i =0 + 1Xi + ... + nXn. As mdias esto sobre a linha reta paratodos os valores de X. Devido aos erros aleatrios, os valores deYi se distribuem ao redor da reta.

    Fonte: Slide de Paulo Jos Ogliari, Informtica, UFSC. Em http://www.inf.ufsc.br/~ogliari/cursoderegressao.html

  • 6. Multicolinearidade

    As variveis previsoras (X) includas no modelo no devem apresentar correlao muito alta entre si.

    Exemplo (extremo) : Se existir uma colinearidade (c0rrelao) perfeita entre X1 e X2, torna-se impossvel obter uma estimativa nica dos coeficientes de regresso. Existir um nmero infinito de coeficientes que funcionaro igualmente bem!

    A medida que a colinearidade aumenta, tambm aumenta o erro padro dos coeficientes b, o que afeta a significncia estatstica destes coeficientes. Ou seja, aumentam a probabilidade de que um bom previsor (X) seja declarado no significativo e excludo do modelo

    Suposies

  • 6. Multicolinearidade

    Como identificar???

    Analisar correlao entre variveis previsoras (X): matriz de correlao

    Diagnstico FIV (Fator de Inflao da Varincia)

    Indica se um previsor tem um relacionamento linear forte com outro(s) previsor(es).

    Suposies

  • Populao Domiclios Renda Familiar

    Taxa

    de

    Empr

    ego

    Ren

    da

    Fam

    iliar

    Ren

    da

    Fam

    iliar

    Dom

    icli

    os

  • Multicolinearidade

  • Resumo:

    1. Variveis explicativas (X) quantitativas ou categricas; e varivel de resposta (Y) quantitativa, contnua e no limitada.

    2. Distribuio Normal de Y e dos erros

    3. Linearidade

    4. Independncia de autocorrelao em Y e nos erros

    5. Homocedasticidade

    6. Multicolinearidade

    Suposies

  • Quando as suposies so consideradas, o modelo que obtemosde uma amostra pode ser aplicado para a populao de interesse(os coeficientes da equao no so tendenciosos).

    Modelo no tendencioso Nos diz que, em mdia, o modelo de regresso obtido a partir de uma amostra o mesmo que o modelo populacional.

    Entretanto, mesmo quando as suposies so satisfeitas, possvel que um modelo obtido a partir de uma amostra no sejaigual ao modelo populacional.

    Suposies

  • Existem maneiras de determinar o quo bem nosso modelo podeprever a sada em uma amostra diferente.

    Validao Cruzada tcnica para determinar a preciso de um modelo entre diferentes amostras.

    Se o modelo aplicado a uma amostra distinta e existe uma grandediferena na sua capacidade de previso, ento o modelo no

    generalizvel.

    DIVISO DOS DADOS: Dividir ao acaso o conjunto de dados emdois, determinar a equao de regresso em cada uma das 2 metades e comparar os modelos resultantes.

    Validao Cruzada

  • Ateno!!!Os prximos slides so bem

    importantes!

  • 1. Seleo e Preparao das Variveis

    Selecionar variveis previsoras (X) para as quais existem razestericas para esperar que prevejam bem o resultado.

    Diagramas de Disperso e Matriz de Correlaes

    Verificar as correlaes entre variveis: As variveis X devem sercorrelacionadas com Y, mas no entre si primeira anlise de multicolinearidade

    Verificar se as relaes entre X e Y so lineares Transformaespodem ser necessrias para linearizar relaes.

    Etapas da Anlise de Regresso

  • Diagramas de Disperso: Por que so to importantes?

    Quarteto de Anscombe: Esses quatro conjuntos de dados possuem as mesmas propriedades estatsticas...

    I II III IVx y x y x y x y

    10,0 8,04 10,0 9,14 10,0 7,46 8,0 6,588,0 6,95 8,0 8,14 8,0 6,77 8,0 5,7613,0 7,58 13,0 8,74 13,0 12,74 8,0 7,719,0 8,81 9,0 8,77 9,0 7,11 8,0 8,8411,0 8,33 11,0 9,26 11,0 7,81 8,0 8,4714,0 9,96 14,0 8,10 14,0 8,84 8,0 7,046,0 7,24 6,0 6,13 6,0 6,08 8,0 5,254,0 4,26 4,0 3,10 4,0 5,39 19,0 12,5012,0 10,84 12,0 9,13 12,0 8,15 8,0 5,567,0 4,82 7,0 7,26 7,0 6,42 8,0 7,915,0 5,68 5,0 4,74 5,0 5,73 8,0 6,89

    Propriedade ValorMdia de x 9,00

    Varincia de x 10,00Mdia de y 7,50

    Varincia de y 3,75Correlao 0,898Regresso

    linear y = 2,50 + 0,500x

    Slides: Marcos P

    F.J. Anscombe, "Graphs in Statistical Analysis," American Statistician, 27 (February 1973), 17-21.

  • Diagramas de Disperso: Por que so to importantes?

    Slides: Marcos P

    ... mas so bem diferentes graficamente.

  • 1. Seleo e Preparao das Variveis

    Selecionar variveis previsoras (X) para as quais existem razestericas para esperar que prevejam bem o resultado.

    Diagramas de Disperso e Matriz de Correlaes

    Verificar as correlaes entre variveis: As variveis X devem sercorrelacionadas com Y, mas no entre si primeira anlise de multicolinearidade

    Verificar se as relaes entre X e Y so lineares Transformaespodem ser necessrias para linearizar relaes.

    Etapas da Anlise de Regresso

  • Transformaes quando a distribuio dos erros aproximadamente normal e com varincia constante. Deve-se realizar uma transformao apenas na varivel X.

    Padres de relao entre X e Y:

    Transformaes para no-linearidade do modelo

    XX

    XX

    =

    =

    '

    log10'

    )exp('

    2'

    XXXX

    ==

  • 1. Seleo e Preparao das Variveis

    2. Escolha e Ajuste do Modelo de Regresso

    Uma estratgia seria executar a regresso para todos osprevisores (X) selecionados e examinar a sada para ver quaiscontribuem substancialmente para o modelo.

    Uma vez determinada quais so as variveis importantes, execute novamente a anlise incluindo somente essasvariveis e utilize as estimativas dos parmetros resultantespara definir o modelo de regresso.

    Etapas da Anlise de Regresso

  • 1. Seleo e Preparao das Variveis

    2. Escolha e Ajuste do Modelo de Regresso

    Se a anlise inicial revelar que existem 2 ou mais previsoressignificativos, pode-se considerar a execuo de uma anlisestepwise, ao invs de uma entrada forada (Enter) a fim de encontrar a contribuio individual de cada previsor.

    Etapas da Anlise de Regresso

  • 1. Seleo e Preparao das Variveis

    2. Escolha e Ajuste do Modelo de Regresso

    3. Diagnstico para verificar se o modelo ajustado adequado

    Ajuste do modelo (R2, Teste F, Testes t para coef.)

    Multicolinearidade (FIV)

    Anlise dos Resduos

    Etapas da Anlise de Regresso

  • Se modelo for adequado, resduos devem refletir as propriedades impostas pelo termo de erro do modelo.

    LINEARIDADE DO MODELO

    Anlise dos Resduos

    No Linearidade

    0

    X

    Res

    duo

  • NORMALIDADE DOS RESDUOS: Suposio essencial paraque os resultados do ajuste do modelo sejam confiveis.

    Anlise dos Resduos

    Outros diagnsticos: Shapiro-Wilk, Anderson-Darling, Kolmogorov-Smirnov

  • HOMOCEDASTICIDADE (Varincia Constante)

    Anlise dos Resduos

    Outros diagnsticos: Teste de Breush-Pagan.

    0

    X

    Varincia No ConstanteR

    esd

    uo

  • PRESENA DE OUTLIERS

    Grfico resduos padronizados vs. Valores Ajustados

    Anlise dos Resduos

    Pontos Influentes: DFFITS, DFBETA, Distncia de Cook.

    -0,4

    -0,2

    0

    0,2

    0,4

    0,6

    0,8

    1

    150 155 160 165 170 175 180 185

    X

    Res

    duos

    Pad

    roni

    zado

    s

    Grf2

    -0.1696266546

    -0.0698989019

    -0.0600693077

    -0.1106245625

    -0.1472892613

    0.166985996

    -0.0809941879

    -0.0753388472

    -0.0688066131

    -0.2577014824

    0.8664075394

    X

    Resduos Padronizados

    Plan1

    Altura (cm)Peso (kg)

    1747378.006-0.300232159177.705767840979.5236-1.81783215913.3045137588-0.1696266546

    1616664.564-1.277683168263.286316831864.0354-0.74908316820.5611255928-0.0698989019

    1706473.870.244257307774.114257307774.758-0.64374269230.4144046539-0.0600693077

    1809484.211.276473540285.486473540286.672-1.18552645981.4054729869-0.1106245625

    1827986.2781.198350219187.476350219189.0548-1.57844978092.491503711-0.1472892613

    1647267.6661.733133103769.399133103767.60961.78953310373.20242872920.166985996

    1566259.394-2.183587639657.210412360458.0784-0.86798763960.7534025425-0.0809941879

    1686471.802-0.234181243371.567818756772.3752-0.80738124330.651864472-0.0753388472

    1769080.0741.09502252681.16902252681.9064-0.7373774740.5437255392-0.0688066131

    1758179.04-1.086700649577.953299350580.715-2.76170064957.6269904773-0.2577014824

    17579.049080.7159.28586.2112250.8664075394

    10.7166657463

    RESUMO DOS RESULTADOS

    Estatstica de regresso

    R mltiplo0.9941211196

    R-Quadrado0.9882768005

    R-quadrado ajustado0.9868114006

    Erro padro1.0929712355

    Observaes10

    ANOVA

    glSQMQFF de significao

    Regresso1805.6379153266805.6379153266674.4075631590.0000000052

    Resduo89.55668897371.1945861217

    Total9815.1946043003

    CoeficientesErro padroStat tvalor-P95% inferiores95% superioresInferior 95,0%Superior 95,0%

    Interseo-117.71357506587.4110370089-15.88354975480.0000002471-134.8034681061-100.6236820254-134.8034681061-100.6236820254

    Varivel X 11.12690773890.043393746325.96935815840.00000000521.02684151581.22697396191.02684151581.2269739619

    Plan1

    Altura (cm)

    Peso (kg)

    Plan2

    X

    Y

    Plan3

    X

    Resduos Padronizados

    Altura (cm)Peso (kg)

    17473

    16166

    17064

    18094

    18279

    16472

    15662

    16864

    17690

    17581

    Media170.674.5

    D. padrao8.4011.26

    CV4.9215.11

    RESUMO DOS RESULTADOS

    Estatstica de regresso

    R mltiplo0.7712134719

    R-Quadrado0.5947702193

    R-quadrado ajustado0.5441164967

    Erro padro7.6006954036

    Observaes10

    ANOVA

    glSQMQFF de significao

    Regresso1678.3354350567678.335435056711.7418856660.0089992881

    Resduo8462.164564943357.7705706179

    Total91140.5

    CoeficientesErro padroStat tvalor-P95% inferiores95% superioresInferior 95,0%Superior 95,0%

    Interseo-101.908575031551.5375273363-1.97736640270.0833878754-220.754403042516.9372529794-220.754403042516.9372529794

    Altura (cm)1.03404791930.30176699733.42664349850.00899928810.33817152571.72992431290.33817152571.7299243129

    RESULTADOS DE RESDUOSRESULTADOS DE PROBABILIDADE

    ObservaoPrevisto(a) Peso (kg)ResduosResduos padroPercentilPeso (kg)

    178.0157629256-5.0157629256-0.6999385824562

    264.57313997481.42686002520.19911514921564

    373.8795712484-9.8795712484-1.37867223742564

    484.22005044149.77994955861.36477025173566

    586.2881462799-7.2881462799-1.01704463544572

    667.67528373274.32471626730.60350455525573

    759.40290037832.59709962170.36241948726579

    871.8114754098-7.8114754098-1.09007405387581

    980.08385876429.91614123581.38377549798590

    1079.04981084491.95018915510.27214456769594

    Altura (cm)

    Resduos

    Altura (cm) Plotagem de resduos

    Peso (kg)

    Previsto(a) Peso (kg)

    Altura (cm)

    Peso (kg)

    Altura (cm) Plotagem de ajuste de linha

    Percentil da amostra

    Peso (kg)

    Plotagem de probabilidade normal

  • INDEPENDNCIA

    Grfico resduos padronizados vs. Valores Ajustados

    Anlise dos Resduos

    Outros Diagnsticos: Teste de Durbin-Watson

    Autocorrelao espacial: Mapa dos resduos, ndice de Moran

    X

    0

    Erros Correlacionados

    Res

    duo

  • Anlise dos Resduos

    Quais dessas plotagens mostram normalidade dos resduos?Quais os problemas das outras?

    Bus

    sab;

    Mor

    ettin

    , 200

    2:45

    6

    Slide: Marcos P

  • MODELO ADEQUADO

    Anlise dos Resduos

  • Executando uma Regresso Mltipla no SPSS

    REGRESSO LINEARParte IINmero do slide 2Nmero do slide 3Nmero do slide 4Nmero do slide 5Nmero do slide 6Nmero do slide 7Nmero do slide 8Nmero do slide 9Nmero do slide 10Nmero do slide 11Nmero do slide 12Nmero do slide 13Nmero do slide 14Nmero do slide 15Nmero do slide 16Nmero do slide 17Nmero do slide 18Nmero do slide 19Nmero do slide 20Nmero do slide 21Nmero do slide 22Nmero do slide 23Nmero do slide 24Nmero do slide 25Nmero do slide 26Nmero do slide 27Nmero do slide 28Nmero do slide 29Nmero do slide 30Nmero do slide 31Nmero do slide 32Nmero do slide 33Nmero do slide 34Nmero do slide 35Nmero do slide 36Nmero do slide 37Nmero do slide 38Nmero do slide 39Nmero do slide 40Nmero do slide 41Nmero do slide 42Nmero do slide 43Nmero do slide 44Nmero do slide 45Nmero do slide 46Nmero do slide 47Nmero do slide 48Nmero do slide 49Nmero do slide 50Nmero do slide 51Nmero do slide 52Nmero do slide 53Nmero do slide 54Nmero do slide 55Nmero do slide 56Nmero do slide 57Nmero do slide 58Nmero do slide 59Nmero do slide 60Nmero do slide 61Nmero do slide 62Nmero do slide 63Nmero do slide 64Nmero do slide 65Nmero do slide 66Nmero do slide 67Nmero do slide 68Nmero do slide 69