Correla§£o Ordinal Pearson Prof. Ivan Balducci FOSJC / Unesp

  • View
    110

  • Download
    3

Embed Size (px)

Text of Correla§£o Ordinal Pearson Prof. Ivan Balducci FOSJC / Unesp

  • Slide 1
  • Correlao Ordinal Pearson Prof. Ivan Balducci FOSJC / Unesp
  • Slide 2
  • Idias importantes na pesquisa: VARIVEL RELAO A Estatstica preocupa-se com a relao entre as variveis
  • Slide 3
  • Correlao O que se pode dizer sobre a intensidade do relacionamento entre x e y ? A magnitude refere-se fora de associao entre x e y. Por exemplo: Correlao Interpretao r = 0.00 No h relacionamento entre x e y r = 0.20 Baixo relacionamento entre x e y r = 0.40 Moderado relacianamento entre x e y r = 0.70 Alto relacionamento entre x e y r = 1.00 Perfeita correspondncia entre x e y
  • Slide 4
  • Reviso: Pearson Y X Coeficiente de correlao de Pearson no deve ser usado quando o relacionamento entre X e Y no-linear Antes de calcular o coeficiente de correlao Deve-se observar o diagrama de disperso para verificar se o relacionamento linear
  • Slide 5
  • Relacionamento Forte Fraco................ Pearson
  • Slide 6
  • Y X Nenhum Relacionamento Pearson
  • Slide 7
  • Correlao Positiva Linear x x y yy x (a) Positiva (b) Forte positiva (c) Perfeita positiva Pearson
  • Slide 8
  • Correlao Negativa Linear x x y yy x (d) Negative (e) Strong negative (f) Perfect negative Pearson
  • Slide 9
  • Correlao No Linear x x y y (g) Nenhuma Correlao (h) Correlao No linear Pearson
  • Slide 10
  • n xy ( x)( y) n( x 2 ) ( x) 2 n( y 2 ) ( y) 2 r = Calculadoras Cientficas (estatstica) podem calcular r Frmula do Coeficiente de Correlao Linear para dados no rankeados Pearson
  • Slide 11
  • Correlao no Causa O simples fato que duas variveis se correlacionam no significa que uma seja a causa da outra.
  • Slide 12
  • A correlao entre a proporo de Crimes e o nmero de Igrejas na cidade r = +0.89 Significa, ento, que quanto mais igrejas teremos mais crimes? CORRELAO NO CAUSA
  • Slide 13
  • Correlao ordinal de Pearson medida de associao para dados em posio Valor entre 1.00 e +1.00
  • Slide 14
  • n xy ( x)( y) n( x 2 ) ( x) 2 n( y 2 ) ( y) 2 r =r = Calculadoras Cientficas (estatstica) podem calcular r s se entrarmos com os dados rankeados Frmula do Coeficiente de Correlao Linear para dados rankeados Pearson
  • Slide 15
  • Frmula simplificada para o clculo de r Onde r o coeficiente de correlao D a diferena entre posies de valores correspondentes de X e Y N o nmero de pares dos valores dados indica a soma de todos os pares de valores dados A frmula simplificada (aproximada) foi desenvolvida por Spearman em 1906. Ela igual a equao de Pearson para dados rankeados, quando no houver empates n xy ( x)( y) n( x 2 ) ( x) 2 n( y 2 ) ( y) 2 r = Frmula de Pearson
  • Slide 16
  • Valores de r prximos de -1 ou 1 indicam uma forte associao linear e valores prximos de 0 indicam uma falta de associao linear. Interpretao de r Frmula aproximada para o clculo de r (quando houver empates) Frmula exata para o clculo de r (quando no houver empates)
  • Slide 17
  • Exemplo: Dados Sem transformao Suponha que tenhamos as medies mdias da Largura e Profundidade de um rio em 10 posies ao longo de seu curso Queremos saber se as duas variveis esto correlacionadas X: Largura (Width)Y: Profundidade (Depth) 111.1 91.3 151.2 121.0 101.4 80.9 161.4 131.3 201.5 110.8
  • Slide 18
  • Exemplo: Dados Sem transformao 10(153,10) (125)(11.90) 10(1681)(125) 2 10(14,65) (11,90) 2 r = n xy ( x)( y) n( x 2 ) ( x) 2 n( y 2 ) ( y) 2 r = r = 0,571 dados originais Frmula de Pearson Pearson
  • Slide 19
  • Exemplo: dados agora ordenados. Suponha que tenhamos as medies mdias da Width e Depth de um rio em 10 posies ao longo de seu curso Queremos saber se as duas variveis esto correlacionadas X: Largura (Width)Y: Profundidade (Depth) 11 4.51.1 4 9 21.3 6.5 15 81.2 5 12 61.0 3 10 31.4 8 8 10.9 2 16 91.4 9 13 71.3 6.5 20 101.5 10 11 4.50.8 1 Empate. Ex: para a largura, 11 m ocupa a posio 4 e 5, assim cada valor recebe o rank de (4+5)/2 = 4.5
  • Slide 20
  • n xy ( x)( y) n( x 2 ) ( x) 2 n( y 2 ) ( y) 2 r =r = Dados em rank r = 0,530 dados ordenados (rankeados) 10(346) (55)(55) 10(384,5)(55) 2 10(384,5)( ) 2 r =r = = r = 0,530 Pearson
  • Slide 21
  • Exemplo: Uso da frmula simplificada Suponha que tenhamos as medies mdias da Largura e Profundidade de um rio em 10 posies ao longo de seu curso Queremos saber se as duas variveis esto correlacionadas Width Rank Depth Rank D D 2 *11 m 4.5 1.1 m 4 0.5 0.25 9 2 *1.3 6.5 4.5 20.25 15 8 1.2 5 3 9 12 6 1.0 3 3 9 10 3 1.4 8 5 25 8 1 0.9 2 1 1 16 9 1.4 9 0 0 13 7 *1.3 6.5 0.5 0.25 20 10 1.5 10 0 0 *11 4.5 0.8 1 10 3.5.5. 5 12.25 12.25 * empate
  • Slide 22
  • Width Rank Depth Rank D D 2 11 m 4.5 1.1 m 4 0.5 0.25 9 2 1.3 6.5 4.5 20.25 15 8 1.2 5 3 9 12 6 1.0 3 3 9 10 3 1.4 8 5 25 8 1 0.9 2 1 1 16 9 1.5 9 0 0 13 7 1.3 6.5 0.5 0.25 20 10 1.6 10 0 0 11 4.5 0.8 1 3.5 12.25.5 12.25 Quando houver dados iguais, ento, recebem a mesma posio (mdia dos ranks para os dois valores) Ex.: Para a largura, 11 m ocupa a posio 4 e 5, assim cada valor recebe o rank de (4+5)/2 = 4.5 Os dados so classificados (rankeados) do menor (1) ao maior (10)
  • Slide 23
  • Width Rank Depth Rank D D 2 11 m 4.5 1.1 m 4 0.5 0.25 9 2 1.3 6.5 4.5 20.25 15 8 1.2 5 3 9 12 6 1.0 3 3 9 10 3 1.4 8 5 25 8 1 0.9 2 1 1 16 9 1.5 9 0 0 13 7 1.3 6.5 0.5 0.25 20 10 1.6 10 0 0 11 4.5 0.8 1 3.5 12.25 Calculamos a diferena (D) e (D 2 ) entre os ranks para cada par Aplicamos a frmula simplificada (N=10) = 77 Positivo e moderado
  • Slide 24
  • n xy ( x)( y) n( x 2 ) ( x) 2 n( y 2 ) ( y) 2 r = r = 0,530 Na presena de empates diferem os resultados = n xy ( x)( y) n( x 2 ) ( x) 2 n( y 2 ) ( y) 2 r =r = r = 0,571 = Dados em rank Dados originais Frmula de Spearman Pearson Spearman Quanto maior o n de empates maior o desacordo
  • Slide 25
  • Exemplo SEM empates. Competio. Dados ordenados. FotografiasFotgrafo ProdutoSomas N da fotoJoo (X)Pedro (Y)XY 1248 XY = 189 25315 x = 36 3326 y = 36 46636 y 2 = 204 5111 x 2 = 204 64832N = 8 77535 88756 8(189) (36)(36) 8( ) ( ) 2 r =r = =216/335,99 0,6428 = Pearson
  • Slide 26
  • Exemplo. Competio: dados ordenados SEM empates FotografiasFotgrafo Diferena(Diferena) 2 Joo (X)Pedro (Y)dd2d2 12424 25324 33211 46600 51100 648416 77524 88711 Spearman
  • Slide 27
  • OBSERVAES SOBRE O USO DA FRMULA SIMPLIFICADA Frmula desenvolvida por Spearman em 1906 para facilitar as contas da frmula de Pearson
  • Slide 28
  • Dennis Roberts and R. Kunst. A case against the continuing use of the Spearman rank-order correlation formula. Psychological Reports, 66, pp. 339-349 (1990) The use of the Spearman rank-order correlation should stop... Spearmans original formula is only exact where there are no tied values on the original X and Y variables. In this case, and only in this case, is the Spearman formula equivalent to the Pearson formula on the same ranked scores. Of course, there are formulas in the literature that correct this problem and provide a correlation value on the ranks as if there were no ties.
  • Slide 29
  • Lost in this shuffle however, is the fact that if these correction formulas are used, then the result is not a Spearman rank-order correlation value anymore, but rather, the Pearson correlation on the ranks. Unfortunately, the common jargon in this case is to (still) say that we have a Spearman rank-order correlation, corrected for tied ranks. However this terminology is incorrect.
  • Slide 30
  • Of course, the most direct way to have solved this problem would have been to use the Pearson formula on the ranks in the first place (never using the term Spearman) and not attempting to modify in some way the original Spearman formula. In this context, Spearman formula is merely a short-cut expedient to what used to be a more cumbersome way to calculate correlations on ranks with the Pearson formula. However, the rationale for providing a short-cut expedient that was legitimately relevant in earlier times no longer has any validity... Dennis M. Roberts: A Note on the Continuing Use of the Spearman Rank-Order Correlation. The Pennsylvania State University. Febr 1991.
  • Slide 31
  • Correlao ordinal de Pearson Termos que devem ser familiares Empates Correlao ordinal Spearman