Text of Prof. Ivan Balducci FOSJC / Unesp CORRELAÇÃO linear de Pearson ( r )
Slide 1
Prof. Ivan Balducci FOSJC / Unesp CORRELAO linear de Pearson ( r )
Slide 2
Correlao: H um Relacionamento entre as variveis? Elas vo juntas? Aumentando uma varivel, ento aumenta tambm a outra? Ex de variveis X... Horas de estudo Y... Notas na Prova
Slide 3
Exemplo 1: Notas vs Horas de estudo Varivel independente o nmero de horas estudadas. A nota do aluno a var. dependente. A nota do aluno depende do n de horas que ele estuda? Essas variveis se relacionam? 752F 683E 885D 571C 632B 826A Nota Horas estudadas Aluno
Slide 4
Diagrama de Disperso Por conveno, a varivel independente considerada no eixo horizontal x. A dependente considerada no eixo vertical y.
Slide 5
Exemplo de Diagrama de Disperso HorasNotas 157 263 275 368 588 682 C1: Horas de Estudo ; C2: Notas dos Alunos
Slide 6
Correlao Positiva Linear x x y yy x (a) Positiva (b) Forte positiva (c) Perfeita positiva
Slide 7
Correlao Negativa Linear x x y yy x (d) Negative (e) Strong negative (f) Perfect negative
Slide 8
Correlao No Linear x x y y (g) Nenhuma Correlao (h) Correlao No linear
Slide 9
Exemplos Quanto Intensidade do Relacionamento
Slide 10
Definio: Coeficiente Correlao Linear r Mede a fora do relacionamento linear entre valores pareados x e y na amostra
Slide 11
n xy ( x)( y) n( x 2 ) ( x) 2 n( y 2 ) ( y) 2 r = Calculadoras Cientficas (estatstica) podem calcular r Frmula do Coeficiente de Correlao Linear
Slide 12
Notao: Coeficiente de Correlao Linear n nmero de pares de dados presentes. soma. x soma de todos os valores de x. x 2 indica que cada x deve ser elevado ao quadrado e ento aqueles quadrados somados. ( x ) 2 indica que x deve ser somado e o total elevado ao quadrado. xy indica que cada x deve ser primeiro multiplicadopor seu correspondente y. Aps obter todos os produtos, somamos. r coeficiente correlao linear para a amostra
Slide 13
Exemplo 2: Idade vs Presso Dados de idade e presso sangunea. Calculamos: x, y, xy, x 2 e y 2. 2310449001064015270F 1124432039947634819345Soma 198814489944714167E 204493721872314361D 182253136756013556C 144002304576012048B 163841849550412843A BP 2 age 2 Age* BP Blood Pressure AgeAluno
Slide 14
Exemplo 2: Clculo de r Substitumos na frmula e resolvemos para r: r= {(6*47634)-(345*819)}/{[(6*20399)- 345 2 ][(6*112443)-819 2 ]} 0.5. r= 0.897 = 0.90 aprox. O coeficiente de correlao sugere um relacionamento forte positivo entre a idade e a presso sangunea.
Slide 15
interpretao do r A correlao 0.9 H um relacionamento positivo e forte entre idade e presso sangunea
Slide 16
Propriedades de r 1. 1 r 1 2. Valor de r no muda se todos os valores de ambas variveis mudam (so convertidos) para a diferentes escalas 3. Trocando todos os valores x e y no mudaro r 4. r mede a fora de um relacionamento linear
Slide 17
Erros Comuns sobre Correlao 1. Evite concluir que uma correlao entre duas variveis implica em causalidade. 2. Nenhum relacionamento linear no implica nenhum relacionamento. H uma possibilidade de um relacionamento no linear.
Slide 18
Correlao O que se pode dizer sobre a intensidade do relacionamento entre x e y ? A magnitude refere-se fora de associao entre x e y. Por exemplo: Correlao Interpretao r = 0.00 No h relacionamento entre x e y r = 0.20 Baixo, relacionamento entre x e y r = 0.40 Moderado relacianamento entre x e y r = 0.70 Alto relacionamento entre x e y r = 1.00 Perfeita correspondncia entre x e y
Slide 19
Correlao Quanto direo da relao entre x e y ? A direo se refere ao como os altos e baixos valores em x e y esto associados. Por exemplo: Positiva NegativaNenhuma Correlao Correlao Correlao r = +1.0 r = -1.0 r = 0.00 x xx y y y
Slide 20
Regresso
Slide 21
Regresso Analisa o relacionamento entre uma dependente varivel e uma independente varivel. Tenta explicar o relacionamento por ajustar uma linha (relacionamento linear). estabelecida uma equao: Y = a + bx dependente independente
Slide 22
Linha de Regresso e Equao de Regresso Varivel Dependente (Y) Varivel Independente (X) Intercepto = a Inclinao = b Regresso equao: Y = a + b.X
Slide 23
Modelo Regresso Linear Uma linha reta que melhor ajusta ou descreve os dados dada pela equao: Y = a + bX a = o intercepto em Y (valor de Y quando X = 0) b = a inclinao da linha (taxa de mudana)
Slide 24
Exemplo 1: n de Frangos vs Batata frita Predizer o consumo french fries em funo do n de frangos consumidos Jantarn Frangos n fries 11 15 23 30 37 40 42 29 54 35 6 3 32
Slide 25
Exemplo 1: n de Frangos vs Batata frita a = 18,34 b = 3,55 r = 0,87
Slide 26
Exemplo 2: Relacionamento Altura e Teor da droga das folhas Y: varivel Dependente teor da droga X: varivel Independente altura da folha
Slide 27
Equao de Regresso Pode-se predizer o teor da droga a partir da posio da folha varivel Dependente Independente teor da droga posio da folha
Slide 28
X: Altura (m)Y:Droga (mg/g folha seca) 1.381 1.965 2.461 2.669 3.077 3.744 4.145 4.346 4.939 5.649 6.231 6.828 7.046 7.431 8.638 Exemplo 2: Altura das folhas e o teor das drogas
Slide 29
Avaliao Grfica Inicial Fazemos um grfico para garantir que no estamos diante de algum relacionamento no linear
Slide 30
Importante Traar o Diagrama de Disperso
Slide 31
Quarteto de Anscombe Em todos os 4 casos: Y =3+0,5X e r xy =0,816
Slide 32
Teor da droga versus Altura da folha Droga ( mg/g) Altura (m ) razovel considerar linear Exemplo 2
Slide 33
Escolhendo a linha de melhor ajuste Desvio do ponto linha
Slide 34
Equao de Regresso Teor (mg/g) = 79,3 - 6,30 x Altura (m) O sinal menos indica um negativo relacionamento entre concentrao da droga e altura. A figura apresenta uma inclinao negativa Exemplo 5
Slide 35
Predizendo o teor da droga Predizer a concentrao da droga em uma folha situada a uma altura de 5 m da rvore Teor = 79,3 - 6,30 x Altura = 79,3 - 6,30 x 5 = 79,3 - 31,5 = 47,8 Concentrao Prevista da droga = 47,8 mg/g Exemplo 2
Slide 36
Extrapolao Predizer o teor da droga em uma folha colhida a 15 m da rvore Teor da droga = 79,3 - 6,30 x Altura = 79,3 - 6,30 x 15 = 79,3 - 94,5 = -15,2 mg/g !?!?! resultado sem sentido Exemplo 2
Slide 37
InterpolaoExtrapolao Interpolao versus Extrapolao Exemplo 2
Slide 38
Interpolao vs Extrapolao A Interpolao, em geral, muito segura. A Extrapolao s vlida quando pode-se garantir relacionamento linear alm da regio de observao. Exemplo 2 (os teores seriam negativos em qualquer folha acima de 12 m)
Slide 39
Correlao baixa moderada forte Termos que devem ser familiares Regresso Linear inclinao interpolao extrapolao Diagrama de disperso