33
Análisis de Regresión y Correlación Lineal Simple. Medidas de asociación entre variables cuantitativas Guillermo Bianchi Héctor Quintero

Análisis de regresión simple

Embed Size (px)

DESCRIPTION

Breve descripción de los conceptos básicos del análisis de regresión y de correlación lineal simple.

Citation preview

Page 1: Análisis de regresión simple

Análisis de Regresión y Correlación Lineal Simple.

Medidas de asociación entre variables cuantitativas

Guillermo BianchiHéctor Quintero

Page 2: Análisis de regresión simple

Coeficientes de correlación.

Los coeficientes de correlación miden la relación linealrelación lineal entre variables cuantitativas.

Page 3: Análisis de regresión simple

Coeficientes de correlación.

Método ParamétricoMétodo Paramétrico: Coeficiente de correlación producto momento de Pearson (ρ).

Método No ParamétricoMétodo No Paramétrico, Coeficiente de correlación de Spearman (ρs).

Page 4: Análisis de regresión simple

Coeficiente de correlación producto momento de Pearson

El coeficiente de correlación producto momento de Pearson, ρ , mide el grado de asociación linealasociación lineal que existe entre un par de variables X, Y cuya distribución cuya distribución conjunta es normal bivariadaconjunta es normal bivariada.

Page 5: Análisis de regresión simple

Coeficiente de correlación producto momento de Pearson

Se calcula a partir de la siguiente ecuación:

( ) ( ) ( )

( )( )∑ ∑

∑∑∑

−=

n

xx

n

yxyx

ri

i

iiii

2

2

Page 6: Análisis de regresión simple

Coeficiente de correlaciónρ ∈ [-1, 1]

0

0,25

0,5

0,75

1

0 0,25 0,5 0,75 1

0

2

4

6

0 0,2 0,4 0,6 0,8 1

0

2

4

6

0 0,2 0,4 0,6 0,8 1

r = -0.99

r = 0.99

r = 0.02

Page 7: Análisis de regresión simple

Prueba de hipótesis sobre ρ

Problema: determinar si ρ es diferente de cero.

Sistema de hipótesis:H0: ρ = 0.

H1: ρ ≠ 0.

Nivel de confianza 95% α=0,05.

Page 8: Análisis de regresión simple

Prueba de hipótesis sobre ρ

Regla de decisión:Si p_valor < α se rechaza H0.

Si p_valor ≥ α no se rechaza H0.

Page 9: Análisis de regresión simple

Coeficiente de correlación No paramétrico de Spearman ρs

El coeficiente de correlación NoParamétrico de Spearman, ρs , mide el grado de asociación linealasociación lineal que existe entre un par de variables X, Y cuantitativas, independientemente del independientemente del tipo de distribución conjunta que tipo de distribución conjunta que presenten.presenten.

Page 10: Análisis de regresión simple

Coeficiente de correlación No paramétrico de Spearman ρs

Se calcula a partir de los rangos o posiciones relativas de los valores, mediante la ecuación:

)1(

61

2

−−=

∑nn

di

i

Page 11: Análisis de regresión simple

Coeficiente de correlación No paramétrico de Spearman ρs

Su valor se encuentra entre -1, correlación negativa perfecta y +1, correlación positiva perfecta.

Valores cercanos a cero indican independencia entre variables.

Page 12: Análisis de regresión simple

Análisis de Regresión.

Es una técnica estadística con la que se pretende modelar la relación linealmodelar la relación lineal que existe entre dos o más variables con distribución normal.

Page 13: Análisis de regresión simple

Análisis de Regresión.

El regresión lineal simple permitirá estimar el mejor modelo lineal que permite predecir el comportamiento de una variable dependiente, Y , a partir de una variable independiente, X .

Page 14: Análisis de regresión simple

Modelo de regresión lineal simple

Modelo probabilístico lineal

donde: ee es el error aleatorio

1βes el la ordenada en el origen

es la pendiente

),0(~, 210 σββ NeexY ++=

Page 15: Análisis de regresión simple

Regresión lineal simple

0

2

4

6

0 2 4 6 8

β0

β1

Page 16: Análisis de regresión simple

Relación entre variables

( ) xxYE xY 10|| ββµ +==

Dicha relación viene dada por:

donde:

1βes el la ordenada en el origen

es la pendiente

Page 17: Análisis de regresión simple

Modelo de regresión lineal simple

Page 18: Análisis de regresión simple

Estimación de los coeficiente de regresión. Método mínimos cuadrados ordinarios

Suponga que se desea estimar el modelo para una muestra de n observaciones. El modelo de regresión puede expresarse como:

nnexY iii ,...,2,1,10 =++= ββ

Page 19: Análisis de regresión simple

Estimación de los coeficiente de regresión Método mínimos cuadrados ordinarios

El método busca los coeficientes que minimizan la suma de los cuadrados de las desviaciones de las observaciones con respecto a la recta de regresión.

( ) ( )2

110

1

2 ∑∑==

−−==n

iii

n

ii xyeL ββ

ii exY =+− )( 10 ββ

Page 20: Análisis de regresión simple

Método de mínimos cuadrados Los estimadores de los coeficientes de

regresión deben satisfacer:

( ) 021

101

10=−−−=

∂∂ ∑

=i

n

iii xxy

L βββ ββ

( ) 021

100

10=−−−=

∂∂ ∑

=

n

iii xy

L βββ ββ

Page 21: Análisis de regresión simple

Estimadores de mínimos cuadrados

xy 10ˆˆ ββ −=La ordenada en el origen

La pendientexx

xy2n

1iin

1i

2i

n

1ii

n

1iin

1iii

1 S

S

n

xx

n

yxyx

ˆ =

−=

∑=∑

=

∑=

∑=∑

Page 22: Análisis de regresión simple

Supuestos del análisis de regresión lineal simple

La relación entre las variables es lineal. Los errores son independientes y están

normalmente distribuidos. La varianza de los errores es

independiente de la magnitud de los valores de X.

Page 23: Análisis de regresión simple

Prueba de hipótesis sobre β1

Problema: determinar si β1 es diferente de un valor β1,0

Sistema de hipótesis:H0: β1 = β1,0

H1: β1 ≠ β1,0

Nivel de confianza 95% α=0,05.

Page 24: Análisis de regresión simple

Prueba de hipótesis sobre β1

Regla de decisión:Si p_valor < α se rechaza H0.

Si p_valor ≥ α no se rechaza H0.

Page 25: Análisis de regresión simple

Prueba de hipótesis sobre β0

Problema: determinar si β0 es diferente de cero.

Sistema de hipótesis:H0: β0 = 0.

H1: β0 ≠ 0.

Nivel de confianza 95% α=0,05.

Page 26: Análisis de regresión simple

Prueba de hipótesis sobre βo

Regla de decisión:Si p_valor < α se rechaza H0.

Si p_valor ≥ α no se rechaza H0.

Page 27: Análisis de regresión simple

Evaluación de los supuestos del análisis de regresión lineal simple

Gráficos de residuos. Curva de distribución normal para los

residuos. Residuos estandarizados, Studentizados

y distancia de Cook.

Page 28: Análisis de regresión simple

Análisis de residuos

Page 29: Análisis de regresión simple

Coeficiente de determinación R2

Permite conocer el porcentaje de varianza de la variable dependiente, Y, que se puede explicar a partir de la varianza de la variable independiente, X.

yyS

SSER −=12

Page 30: Análisis de regresión simple

Abusos comunes de la regresión lineal simple

Page 31: Análisis de regresión simple

Abusos comunes.Extrapolación.

Page 32: Análisis de regresión simple

Abusos comunes.Generalización.

Page 33: Análisis de regresión simple

Curva de calibración

Curva de calibración

y = 0,0151x + 0,0195

R2 = 0,9817

0

0,1

0,2

0,3

0,4

0 5 10 15 20 25

Concentración

Se

ñal