Regress£o Linear Simples - .Regress£o Linear Simples ... • Tendncia quadrtica: ∠Tendncia

  • View
    218

  • Download
    0

Embed Size (px)

Text of Regress£o Linear Simples - .Regress£o Linear Simples ... • Tendncia...

1

Regresso Linear Simples

Frases

Por serem mais precisos que as palavras, os nmeros so particularmente adequados para transmitir concluses cientficas

Pagano e Gauvre, 2004

Roteiro

1. Modelagem de Relao2. Modelo Linear3. Estimao dos Parmetros4. Inferncia sobre os Parmetros5. Avaliao do Modelo6. Aplicao7. Referncias

2

Modelagem de Relao

Regresso e Correlao

Regresso:Usa varivel(eis) explicativa(s) para explicar ou predizer comportamento de varivel resposta (quando houver sentido).

Correlao:Trata simetricamente duas variveis

Regresso

Varivel resposta (Y) :Varivel resposta cujo comportamento se quer explicar

Varivel(eis) explicativa(s) (Xi):So de interesse caso ajudem a entender, explicar ou predizer o comportamento de Y.

O enfoque da regresso natural quando Y aleatria e Xi controlada ou no-aleatria.

3

Varivel explicativa Varivel independente Regressor Preditor Varivel exgena Varivel de controle ou

estmulos

Varivel explicada Varivel dependente Regredido Predito Varivel endgena Varivel resposta

x Y

Exemplo 1 Vendas/Renda Varivel resposta: Vendas no varejo ($) Varivel explicativa: Renda disponvel ($)

Renda Disponvel ($)

Ve

nd

as

no

Va

rejo

($

)

130001200011000100009000

7000

6500

6000

5500Tendncia linear

Exemplo 2 Absoro de Oxignio

Varivel resposta: Absoro de Oxignio Varivel explicativa: Ventilao

Ventilao

Ab

sor

o

de

Oxi

g

nio

45004000350030002500200015001000500

160

140

120

100

80

60

40

20

0

Tendncia exponencial

4

Exemplo 3 Comprimentos de Fgados

Varivel resposta: Comprimento do fgado (mm) Varivel explicativa: Tempo de gestao (sem.)

Tempo de Gest a o (s em.)

Com

prim

en

to d

o f

ga

do (

mm

)

40353025201510

70

60

50

40

30

20

10

Tendncia no-linear

Modelo de Regresso

Relao de regresso:Tendncia + disperso residual

Tendncia: Suavizao dos dados Explica a maior parte das diferenas de Y

Valores atpicos:Observaes muito diferente do restante dos dados

Relaes Fortes e Fracas

Relao Forte:A disperso pequena em rela o amplitude dos valores da curva de tendncia

Em dados observacionais, rela es fortes no so necessariamente causais

5

Intervalo de Predio

Tempo de Gestao (sem.)

Com

prim

en

to d

o f

ga

do (

mm

)

40353025201510

70

60

50

40

30

20

10

Para 25 semanas: comprimento fgado entre 23 e 41 mm

Grande disperso em torno da tendncia

Intervalos de predioamplos

Relao fraca Predio imprecisa

Outros Padres (1)

Os padres da tendncia variam

Tempo (horas)

Conc

entr

a

o (m

iu/m

L)

50403020100

1000

800

600

400

200

0

Concentrao de quinase de creatinina no sangue

Outros Padres (2)

Preo ( $ 1.000)

Pe

so

(1

.00

0 lb

)

1750015000125001000075005000

5000

4500

4000

3500

3000

2500

2000

Nacion

ais

Importa

dos

Importante descobrir o que define os grupos

6

Outros Padres (3)

Compr imento da p tala

Larg

ura

da

p

tala

7654321

2,5

2,0

1,5

1,0

0,5

0,0

Variedades diferentes de Flores

Resumo de Tendncia Abordagens

Ajuste de funes matemticas:

Y = f(X)

Tcnicas de suavizao:Lowess, ncleo-estimador, spline

Ajuste de Funes

Tendncia linear:

Para cada mudana de uma unidade em X, Ymuda uma quantidade fixa.

Tendncia quadrtica:

Tendncia levemente curva

XY 10 +=

2210 XXY ++=

7

Tendncia exponencial:

Cada mudana de uma unidade em X, Y muda uma % fixa

Se a tendncia exponencial, o grfico de log(Y)vs X tm tendncia linear

XeY 10=

x

lnY

4,03,53,02,52,01,51,0

9

8

7

6

5

4

3

2

1

x

Y

4,03,53,02,52,01,51, 0

4000

3000

2000

1000

0

Passos na Construo de um Modelo Estatstico

Especificar um modelo estatstico: frmula e premissas

Estimar os parmetros do modelo a partir dos dados amostrais

Examinar os resduos e testar a adequao do modelo

Usar o modelo

Se modelo no for aprovado

Modelo Linear

8

Tipos

Simples: Uma varivel independente (explicativa)

Mltipla: Duas ou mais variveis independentes

Objetivos

Encontrar equao matemtica que permita: Descrever e compreender a relao entre 2 ou

mais variveis aleatrias Projetar ou estimar uma nova observao

Ajustar uma reta a partir dos dados amostrais

Utilidades

Busca de rela es de Causa e Efeito;

Predio de valores;

Estabelecer explicao sobre popula o a partir de uma amostra

9

Regresso Linear Simples

Busca-se a equao de uma reta que permita:

Descrever e compreender a relao entre duas variveis

Projetar e estimar uma das variveis em funo da outra.

Regresso Linear Simples (2)

A partir de valores observados de X e Y, modelar a tendncia atravs de uma equao do tipo:

ii XY 10 +=

Funo Linear

f(x) se modifica a uma taxa constante em relao sua varivel independente

0 e 1 so constantes 0 : intercepto-y 1 : coeficiente angular

x

y

x

y

x

y

ii XY 10 +=

10

Intercepto e Coeficiente Angular

variao de yvariao de x1 =

x

y

(x1 ,y1)

(x2 ,y2)

x2-x1 = ? x

y2-y1 = ? y 1 = tg

0: interseco da reta com o eixo y

Interpretao dos Parmetros

1 : declividade da retadefine o aumento ou diminuio da varivel Y por unidade de variao de X

0 = intercepto em ydefine o valor mdio de Y sem a interferncia de X (com X=0).

Exemplo

1: a cada reduo de 1% na alquota h 1,9 % de aumento de arrecadao

0=0: Se no h reduo na alquota no h de aumento de arrecadao

% Reduo A lquota de ICMS

% A

um

en

to d

e A

rre

cad

a

o

54321

10

9

8

7

6

5

4

3

2

1

Aumento de Arrecadao (%) em re lao Reduo Alquota de ICMS (%)

Arrec adao = 0 + 1,93273 ICMS

11

A Reta de Regresso

Para um mesmo valor Xi podem existir um ou mais valores de Yi amostrados

Para esse mesmo valor Xi haver um valor ajustado Yi

Para cada valor Xi existir um dado desvio di dos valores de Yi

H observaes que no so pontos da reta.

^

^

Ajuste da Reta

Qual a reta que se ajusta melhor aos dados?ou seja quais os valores de 0 e 1 ?

Escolher 0 e 0 de maneira a tornar mnima a distncia entre a reta e os pontos

X

Y

4,03,53,02,52,01,51,0

9

8

7

6

5

4

3

2

1

Mtodo dos M nimos Quadrados

Critrio:Valores dos parmetros que minimizam a soma dos quadrados dos desvios

2

1

)(=

n

iii YY

12

Mtodo dos M nimos Quadrados (2)

Minimizao em relao a 0 e 1 :

( ){ } +== 2102 iii xYdS

00

=S

01

=S

yi

xi

di

Mtodo dos M nimos Quadrados (3)

Resultados das derivadas parciais:

Calculando por medidas estatsticas :

( ) ( ) ( )( )221

ii

iiii

x xn.

yx yxn. =

nxby

= ii 0

xx

xy

S

S = 1

XY = 10

X

YXY

X

XY

ss

rss

= =21

Estimativa de Mnimos Quadros

Dadas observaes (X1, Y1), ... , (Xn, Yn) os coeficientes da reta que melhor se ajusta aos dados so:

que so chamados estimativas de mnimos quadrados do intercepto e da declividade

A reta de mnimos quadrados dada por:

11 = 00 = e

ii X = Y 10 +

13

Exemplo Lei de Consumo Keynesiano

Na mdia, h disposio do indivduo aumentar seu consumo quando sua renda aumenta, mas no tanto quanto o aumento em sua renda.

A propenso marginal para consumir maior que 0 mas menor que 1

Consumo Familiar

RendaFamiliar

($) ($)

Y X X2 X.Y Y2

70 80 6.400 5.600 4.90065 100 10.000 6.500 4.22590 120 14.400 10.800 8.10095 140 19.600 13.300 9.025

110 160 25.600 17.600 12.100115 180 32.400 20.700 13.225120 200 40.000 24.000 14.400140 220 48.400 30.800 19.600155 240 57.600 37.200 24.025150 260 67.600 39.000 22.500

1.110 1.700 322.000 205.500 132.100

170=x111=y

000.33)170(10000.322 2 ==xxS800.16)111)(170(10500.205 ==xyS

5091,0000.33800.16

1 ==

45,24)170)(5091,0(1110 ==

XY 5091,