11
, VI – MÉTODO DE REGRESSÃO LINEAR VI.1 EQUAÇÃO DE RETA Toda reta pode ser definida a partir de dois pontos. A equação que define uma reta a partir de dois pontos é dada por: y = Ax + B onde: A e B são constantes; x = variável do eixo horizontal (ordenadas) y = variável do eixo vertical (abcissas) y y 2 y 1 x 1 x 2 x Figura 1 Equação de reta Como A e B são constantes, podemos escrever: y 1 = Ax 1 + B y 2 = Ax 2 + B Resolvendo o sistema de duas equações e duas incógnitas acima temos: A = y 2 - y 1 x 2 - x 1 B = x 2 y 1 - x 1 y 2 x 2 - x 1 Na equação de reta y = Ax + B, A é o coeficiente angular da reta, ou seja, sua inclinação; quando x=0, o valor B é onde a reta cruza o eixo y. Se tivermos pontos obtidos através de medidas, podemos encontrar uma reta que passa por dois destes pontos. Exemplo: Foi medida a temperatura de um objeto ao longo do tempo: tempo [horas] 1 2 3 4 5 Temperatura 35 46 54 65 76 1

Método de Regressão Linear

Embed Size (px)

DESCRIPTION

Método de Regressão Linear

Citation preview

Page 1: Método de Regressão Linear

,

VI – MÉTODO DE REGRESSÃO LINEAR

VI.1 EQUAÇÃO DE RETA

Toda reta pode ser definida a partir de dois pontos. A equação que define uma reta a partir de dois pontos é dada por:

y = Ax + B

onde: A e B são constantes;x = variável do eixo horizontal (ordenadas)y = variável do eixo vertical (abcissas)

y

y2

y1

x1 x2 x Figura 1 Equação de reta

Como A e B são constantes, podemos escrever:

y1 = Ax1 + By2 = Ax2 + B

Resolvendo o sistema de duas equações e duas incógnitas acima temos:

A = y2 - y1

x2 - x1

B = x2y1 - x1y2

x2 - x1

Na equação de reta y = Ax + B,

A é o coeficiente angular da reta, ou seja, sua inclinação;quando x=0, o valor B é onde a reta cruza o eixo y.

Se tivermos pontos obtidos através de medidas, podemos encontrar uma reta que passa por dois destes pontos. Exemplo: Foi medida a temperatura de um objeto ao longo do tempo:

tempo [horas] 1 2 3 4 5Temperatura [oC] 35 46 54 65 76

Os dados foram colocados no gráfico ao lado. Como notamos que a relação entre os valores é aparentemente linear, podemos escolher dois pontospara estabelecer a equação de reta, ou seja, qual a relação entre a temperaturado objeto e o tempo.

Neste caso o eixo x é o eixo dos tempos e o y da Temperatura.

1

Page 2: Método de Regressão Linear

,

Figura 2

2

Page 3: Método de Regressão Linear

,

Para determinar os valores de A e B, escolhemos dois pontos obtidos, por ex. as medidas feitas á 1 hora e 4 horas (35 e 65 graus):

A = 65 – 35 = 30 = 10 4 – 1 3

B = 4. 35 – 1 . 65 = 140 – 65 = 75 = 25 4 – 1 3 3

A equação que relaciona a temperatura do objeto com o tempo resulta:

T = 10 t + 25 (Reta 1)

Através desta relação, podemos estimar o valor da temperatura para outros pontos, sem precisar realizar mais medidas. Qual seria temperatura nos seguintes tempos:

tempo [h] 0 0,5 1 2 3 3,5 4 4,5 5 5,5 6 6,5Temp [oC]

Podemos notar que existem diferenças entre alguns valores medidos e os calculados (como no caso de 2h, 3h e 5h).

Se para o cálculo dos coeficientes A e B, tivéssemos tomado os pontos 3h e 5 h, a equação de reta seria:

T = 11 t + 21 (Reta 2)

Neste exemplo, com apenas 5 medidas, podemos determinar várias equações de reta. Na prática, quando temos muitos pontos medidos, devido às dificuldades de leitura, erros e desvios, as equações possíveis podem ser muitas, ficando difícil decidir qual a que mais se aproxima do fenômeno físico. Na prática, a equação de reta somente nos indica a tendência do comportamento físico do experimento, pois nunca temos certeza se os pontos escolhidos para determiná-la são os melhores.

VI.2 REGRESSÃO LINEAR

Às vezes, trabalhamos com experimentos com muitas variáveis, sujeitos a diversos erros de medida.

No gráfico abaixo, são mostrados os pontos obtidos de uma dada experiência. Estimamos que o comportamento físico do fenômeno é linear. Porém, como determinar, qual equação matemática, que melhor representa este fenômeno?. (Vale observar, que este fenômeno pode ser físico ou estatístico, como por exemplo tendências de mercado, produtividade de máquinas e pessoas, etc...)

Figura 3 Dados de um experimento

Para determinar a equação de reta que melhor representa o comportamento deste fenômeno, utilizamos uma análise matemática chamada REGRESSÃO LINEAR. Obteremos uma curva aproximadora, significando uma média ponderada dos pontos obtidos experimentalmente.

3

Page 4: Método de Regressão Linear

, 4

Page 5: Método de Regressão Linear

,

A reta a ser determinada, é da mesma forma que a determinada através de dois pontos, ou seja:

y = Ax + B

o que muda é a forma de cálculo das constantes A e B. Na regressão linear, todos os pontos disponíveis são utilizados para o cálculo destas constantes, e não apenas dois como na equação de reta descrita anteriormente. Os coeficientes A e B são dados por:

Onde: n é o número de medidas x.y é a somatória das medidas x vezes as medidas y x é a soma de todas as medidas x y é a soma de todas as medidas y x2 é a soma do quadrado de todas as medidas x( x)2 é a soma de todas as medidas x elevada ao quadrado

Exemplo: Obtenção da melhor reta para os dados da medida de temperatura. Os dados obtidos da experiência foram:

tempo [horas] 1 2 3 4 5Temperatura [Graus Celsius] 35 46 54 65 76

Com estes dados, montamos a tabela I:

TABELA Ix (tempo) y (temperatura) x.y x2

1 35 35 12 46 92 43 54 162 94 65 260 165 76 380 25

x = 1 + 2+ 3 +4 +5 = 15 y = 35 + 46 + 54 + 65 + 76 = 276

x.y = 35 + 92 + 162 + 260 + 380 = 929 x2 = 1 + 4 + 9 + 16 + 25 = 55

(x)2 = (15)2 = 225 n = 5 ( 5 medidas)

An x y x y

n x x

. .

( )2 2 =(5. ) . )

(5. )

( ),

929 15 276

55 225

4645 4140

275 225

505

5010 1

By x x xy

n x x

. .

( . ) ( )

2

2 2

( . ) ( . )

(5. ),

27655 15929

55 225

1245

5024 9

A equação que melhor representa a leitura da temperatura em função do tempo é:

T = 10,1 t + 24,9

5

Page 6: Método de Regressão Linear

,

TABELA IItempo [h] 1 2 3 4 5

Temperatura obtida da equação

35 45,1 55,2 65,3 75,4

Temperatura medida

35 46 54 65 76

Desvio (medida obtida)

0 0,9 -1,2 -0,3 0,6

A soma dos desvios é igual a zero. Ou seja, a reta obtida por regressão linear, passa eqüidistante aos pontos obtidos experimentalmente.

VI.3 COEFICIENTE DE CORRELAÇÃO LINEAR ( r )

É um número adimensional (não tem unidade) que mostra a colinearidade entre os dados.

-| r | 1

Quando r = 1, os pontos representam uma reta perfeita Quando r = 0 , os pontos não tem nenhuma relação entre si.

Qaunto maior o coeficiente de correlação r, mais confiável será a aproximação do fenômeno estudado pela equação de reta y = Ax + B.

O coeficiente de correlação linear é dado pela fórmula:

No exemplo acima:

y2 = 16258

Como já sabíamos, os dados têm uma colinearidade bastante grande, quase perfeita, o que significa que a aproximação por uma reta é válida.

6

Page 7: Método de Regressão Linear

,

Quando o coeficiente de correlação linear é muito baixo, próximo de zero, podemos usar outras formas de equação para explicar o fenômeno estudado.

Podemos utilizar a aproximação por uma curva do tipo:

y = Cx2 + Dx + E

Neste caso, a curva de aproximação seria uma parábola, como indicado na figura 4.

Figura 4 Dados de um experimento – Aproximação por uma parábola

Existem outras formas de aproximação, por exemplo log y = Ax + B.

A melhor aproximação é aquela onde o coeficiente de correlação é mais próximo de 1.

Estas tentativas são feitas usando softwares, como o Excel e outros.

Bibliogafia:

Probabilidade e EstatísticaMurray R. SpiegelColeção ShaunEd McGraw-Hill,1977

7

Page 8: Método de Regressão Linear

,

Exercícios:

1- Determine a equação e trace a reta para os valores:

2- Na tabela abaixo é dada a distância percorrida (s) por um veículo em função do tempo: (Como estamos relacionando velocidade en função do tempo, o tempo é o eixo x)

s (Km) 30 50 70 90t (h) 2 4 6 8

a) Calcule a equação da reta b) Qual a unidade do coeficiente a?c) Qual a unidade do coeficiente b?d) O tempo começou a ser marcado a partir de quantos Km percorridos?e) Qual a velocidade do veículo?

3 Determine a equação e obtenha o valor do resistor R através da reta abaixo.. (Lembre-se que R = V/I ou seja

1/A )

3- Utilizando a tabela abaixo :

núm 1 2 3 4 5 6 7 8 9 10V(V) 17 22 24 17 15 27 23 19 20 18

I (mA) 100 115 144 50 70 150 130 90 110 80

a) Marque os pontos experimentais num gráfico.b) Calcule a equação da reta utilizando dois pontos quaisquer. Trace esta reta num gráfico.c) Calcule a equação de reta por regressão linear .Trace esta reta num gráfico.d) Calcule os desvios. Confira se a soma dos desvios é igual a zero.e) Qual equação representa melhor os dados experimentais?f) Qual a unidade do coeficiente A?g) Qual a unidade do coeficiente B?h) Estes dados são referentes a uma medida de tensão sobre um resistor em série com uma fonte DC. Como seria

este circuito?

8

a)X510y128

b)X13y42

c)X14y-12

d)X04y0-2

Page 9: Método de Regressão Linear

,

4) A tabela abaixo mostra a idade X e a pressão sistólica para um grupo de 12 mulheres.

núm 1 2 3 4 5 6 7 8 9 10 11 12Idade (x) 56 42 72 36 63 47 55 49 38 42 68 60

Pressão (y) 147 125 160 118 149 128 150 145 115 140 152 155

a) Supondo que a relação pode ser linear (como no gráfico abaixo), determine a equação de reta utilizando o método de regressão linear.

b) Qual a pressão estimada de uma mulher de 45 anos?c) Determine o coeficiente de correlação linear. Justifique se a aproximação dos dados através de uma relação

linear é confiável.

5) A partir de um estudo, obtivemos uma série de resultados que relacionam o custo de uma peça em Reais (C) em função da quantidade de peças produzida (P)

Num cálculo rápido, utilizando o método de dois pontos, obtivemos a equação:

C= -4 P + 380 eq1

Num cálculo com mais tempo, utilizando regressão linear, chegamos à equação:

C = -6,8 P + 340 eq 2

Obs: A quantidade máxima de peças que pode ser produzida é de 30 peças.

a) (0,5)Qual o custo estimado para a produção de 15 peças pela equação 1?b) (0,5)Qual o custo estimado para a produção de 15 peças pela equação 2?c) (0,5)Qual dos custos calculados é mais confiável? Justifique a resposta.d) (1,0) Esboce as duas curvas num mesmo gráfico. Indique a mais confiável.e) (0,5) Um dos valores da equação por regressão, representa os custos fixos, aqueles relacionados a aluguel,

salários, etc. Qual o valor do custo fixo? Justifique.

9