27
Análisis estadístico básico (II) Magdalena Cladera Munar [email protected] Departament d’Economia Aplicada Universitat de les Illes Balears

Análisis estadístico básico (II) - uib.cat · REFERENCIAS Alegre, J. y Cladera, M. (2003). Introducción a la Estadística Descriptiva para Economistas.Materials Didàctics UIB,

Embed Size (px)

Citation preview

Análisis estadístico básico (II)

Magdalena Cladera [email protected]

Departament d’Economia AplicadaUniversitat de les Illes Balears

CONTENIDOS

Covarianza y correlación.

Regresión lineal simple.

REFERENCIAS

Alegre, J. y Cladera, M. (2003). Introducción a la Estadística Descriptiva para Economistas. Materials Didàctics UIB, 101. Palma de Mallorca.

Newbold, P. (1997). Estadística para los Negocios y la Economía. Prentice-Hall. Madrid.

Peña, D. y Romo, D. (1997). Introducción a la Estadística para las Ciencias Sociales. McGrawHill. Madrid.

Pardo, A. y Ruíz, M. A. (2001). SPSS 10.0. Guía para el análisis de datos. Accesible en: http://www.uca.es/serv/ai/formacion/spss/Inicio.pdf.

Pérez, C. (2001). Técnicas Estadísticas con SPSS, Prentice Hall, Madrid.

Instrumentos estadísticos:

Relación lineal entre dos variables cuantitativas. Representación gráfica.Medidas de relación lineal: Covarianza i Coeficiente de

correlación de Pearson.Ajuste lineal entre dos variables. Interpretación gráfica y

bondad de ajuste lineal.

Relación lineal entre variables cuantitativas

Relación lineal: relación entre dos variables que puede representarse aproximadamente como una línea recta.

La asociación no implica causalidad.

Dos tipos de asociación lineal: positiva y negativa.

Relación lineal entre variables cuantitativas

Gráfica 1. Relación lineal exacta positiva.

X

3210-1-2-3Y

3

2

1

0

-1

-2

-3

Gráfica 2. Relación lineal exacta negativa.

X

3210-1-2-3Y

3

2

1

0

-1

-2

-3

Relaciones no lineales

Relación lineal entre variables cuantitativas

Gráfica 3.

X

3210-1-2-3Y

10

0

-10

-20

-30

Gráfica 4.

X

3210-1-2-3Y

40

20

0

-20

-40

-60

-80

-100

Relaciones lineales

Relación lineal entre variables cuantitativas

Gráfica 1. Relación lineal exacta positiva.

X

3210-1-2-3Y

3

2

1

0

-1

-2

-3

Gráfica 2. Relación lineal exacta negativa.

X

3210-1-2-3Y

3

2

1

0

-1

-2

-3

Gráfica 5. Relación lineal positiva no exacta.

X

6000500040003000200010000-1000

Y

6000

5000

4000

3000

2000

1000

0

-1000

-2000

Estadístico de covarianza

Covarianza positiva (Sxy>0) ⇒ Asociación lineal positiva.

Covarianza negativa (Sxy<0) ⇒ Asociación lineal negativa.

Covarianza nula (Sxy=0) ⇒ Asociación lineal inexistente.

Relación lineal entre variables cuantitativas

( )( )YX

n

YX

n

yYxXs

n

iii

n

iii

XY −=−−

=∑∑== 11

Estadístico de covarianza positivo

Relación lineal entre variables cuantitativas

Figura 5.1.

X

131211109876543210

Y

17161514131211109876543210

Estadístico de covarianza nulo

Relación lineal entre variables cuantitativas

Figura 5.6.

X

3210-1-2-3-4

Y

1,5

1,0

,5

0,0

-,5

-1,0

Covarianza. Ejemplo.

Relación lineal entre variables cuantitativas

X

2220181614121086420

Y

24

22

20

18

16

14

12

10

8

6

4

2

0

i X i Yi iiYX 1 12 14,55 174,6 2 10 12,85 128,5 3 11 13,3 146,3 4 13 13,53 175,89 5 15 18,18 272,7 6 14 18,94 265,16 7 12 16,11 193,32 8 11 13,82 152,02 9 19 23,53 447,07

10 20 23,02 460,4 Suma 137 167,83 2415,96Media 13,7 16,783

( )( )671178316713

1096241511 ,,·,,YX

n

YX

n

yYxXs

n

iii

n

iii

XY =−=−=−−

=∑∑==

Por tanto, existe asociación positiva entre ambas variables.

Estadístico de covarianza

Problemas del estadístico de covarianza como medida de asociación:

No tiene un límite superior, con respecto al cual considerar si el grado de asociación.

La covarianza depende de las unidades en que están medidas las variables.

Relación lineal entre variables cuantitativas

Estadístico de covarianza

Propiedades de la covarianza:

Si se suma a la variable X una constante b y a la variable Y una constante c, la covarianza entre las dos nuevas variables transformadas será igual a la covarianza original.

Si se multiplica la variable X por una constante b y la variable Y por una constante c, la covarianza entre las dos nuevas variables transformadas será igual a la covarianza original multiplicada por las constantes bc.

Relación lineal entre variables cuantitativas

( ) ( )( ) ( ) ( )( ) ( )( )

n

yYxX

n

cycYbxbXs

n

iii

n

iii

XY

∑∑==

−−=

+−++−+= 11

( )( ) ( )( )

n

yYxXbc

n

yccYxbbXs

n

iii

n

iii

XY

∑∑==

−−=

−−= 11

Coeficiente de correlación lineal simple (Coeficiente de correlación de Pearson)

Substituyendo la covarianza y las desviaciones típicas:

Relación lineal entre variables cuantitativas

YX

XYXY ss

sr =

( )( )

( ) ( ) ∑∑

∑∑

==

=

==

=

−−

−=

−−

−−==

n

ii

n

ii

n

iii

n

ii

n

ii

n

iii

YX

XYXY

ynYxnX

yxnYX

yYxX

yYxX

sssr

1

22

1

22

1

1

2

1

2

1

Coeficiente de correlación lineal simple (Coeficiente de correlación de Pearson)

Asociación lineal positiva ⇒ Sxy>0 ⇒ rxy>0

Asociación lineal negativa ⇒ Sxy<0 ⇒ rxy<0

Ausencia de asociación lineal ⇒ Sxy=0 ⇒ rxy=0

El coeficiente de correlación toma valores entre –1 y 1.

rxy = 1 Asociación lineal exacta de tipo positivo.

rxy = -1 Asociación lineal exacta de tipo negativo.

rxy = 0 Ausencia de asociación lineal.

Relación lineal entre variables cuantitativas

YX

XYXY ss

sr =

Coeficiente de correlación lineal simple (Coeficiente de correlación de Pearson)

Propiedades del coeficiente de correlación:

El valor del coeficiente de correlación entre dos variables no se modifica si una (o ambas) variables se multiplica por una constante.

El coeficiente de correlación toma valores en el intervalo –1 y 1. Los valores máximo y mínimo se alcanzan cuando se da una relación lineal exacta entre las dos variables, de tipo positivo o de tipo negativo, respectivamente.

Valores del coeficiente próximos a 1 indican la existencia de una asociación positiva fuerte entre las variables; valores cercanos a –1 indican la existencia de una asociación negativa fuerte entre las variables; valores cercanos a cero señalan la ausencia de una asociación lineal.

Relación lineal entre variables cuantitativas

Coeficiente de correlación. Ejemplo.

Relación lineal entre variables cuantitativas

X

2220181614121086420

Y

24

22

20

18

16

14

12

10

8

6

4

2

0

i X i Yi iiYX 2iX

2iY

1 12 14,55 174,6 144 211,70 2 10 12,85 128,5 100 165,12 3 11 13,3 146,3 121 176,89 4 13 13,53 175,89 169 183,06 5 15 18,18 272,7 225 330,51 6 14 18,94 265,16 196 358,72 7 12 16,11 193,32 144 259,53 8 11 13,82 152,02 121 190,99 9 19 23,53 447,07 361 553,66

10 20 23,02 460,4 400 529,92 Suma 137 167,83 2415,96 1981 2960,12Media 13,7 16,783

SXY = 11,67

SX = 23371310

1981 221

2

,,Xn

Xn

ii

=−=−∑=

SY = 7937831610

122960 221

2

,,,Yn

Yn

ii

=−=−∑=

950793233

6711 ,,·,

,ss

srYX

XYXY ===

Por tanto, existe asociación positiva muy fuerte entre ambas variables.

Objetivo: analizar las relaciones de dependencia entre una variable dependiente y un conjunto de variables explicativas.

Especificación:

Relación lineal entre variables cuantitativas

Yi = f(X1i, X2i, X3i, ..., Xki, β)

Yi = β1 + β2X2i + β3X3i + β4X4i + ... + βkXki + ui

Y: variable dependiente o endógena.

Xj: variables explicativas, exógenas o regresores.

βj: parámetros, coeficientes de regresión.

u: término de error, término de perturbación o perturbación aleatoria.

Modelo Simple: Yi = β1 + β2Xi + ui

Modelo Múltiple: Yi = β1 + β2X2i + β3X3i + β4X4i + ... + βkXki + ui

Forma funcional lineal

Modelo Simple:

Yi = α + βXi + ui

Relación lineal entre variables cuantitativas

Ejemplo. Función de consumo sanitario

Relación lineal entre variables cuantitativas

0

1000

2000

3000

4000

5000

25000 35000 45000 55000

Con

sum

o

Renta

Función de consumo sanitario

Observaciones muestrales

Ci = α + βRi + ui

E(Ci) = α + βRi

Ejemplo. Función de consumo sanitario

Relación lineal entre variables cuantitativas

Ci= 300,72+0,0677·Ri

0

1000

2000

3000

4000

5000

25000 30000 35000 40000 45000 50000 55000

Co

nsum

o

Renta

Función de consumo sanitario

Observaciones muestrales Lineal (Observaciones muestrales)

Ci = α + βRi + ui

E(Ci) = α + βRi

Obtención de α y β estimados por Mínimos Cuadrados Ordinarios (MCO)

Yi = α + βXi + ui

Relación lineal entre variables cuantitativas

50556065707580859095

100

15 20 25 30 35

X

Y

ei

ei

xˆyˆ βα −=( )( )

( ) xSSxy

xnX

yxnYX

xX

yYxXˆ

n

i

n

iii

n

ii

n

iii

i

22

1

2

1

1

2

1 =−

−=

−−=

=

=

=

Obtención de α y β estimados por Mínimos Cuadrados Ordinarios (MCO)

Yi = α + βXi + ui

Relación lineal entre variables cuantitativas

y = 11,364+2,8155x

50556065707580859095

100

15 20 25 30 35

X

Y

ei

ei

xˆyˆ βα −=( )( )

( ) xSSxy

xnX

yxnYX

xX

yYxX

n

i

n

iii

n

ii

n

iii

i

22

1

2

1

1

2

1ˆ =−

−=

−−=

=

=

=

Ejemplo. Función de consumo sanitario

Relación lineal entre variables cuantitativas

0

1000

2000

3000

4000

5000

25000 35000 45000 55000

Con

sum

o

Renta

Función de consumo sanitario

Observaciones muestrales Lineal (Observaciones muestrales)

72300,ˆ =α 06770,ˆ =β

Muestra de 25 famílias:

Consumo Renta 2275 30000 3049 30000 2050 30000 2362 30000 2457 30000 2850 35000 2499 35000 2763 35000 2869 35000 2177 35000 3184 40000 3013 40000 3464 40000 2295 40000 2224 40000 3196 45000 3617 45000 3084 45000 2951 45000 4006 45000 3977 50000 3288 50000 4085 50000 3547 50000 3907 50000

Ejemplo. Función de consumo sanitario

Relación lineal entre variables cuantitativas

Ci= 300,72+0,0677·Ri

0

1000

2000

3000

4000

5000

25000 35000 45000 55000

Con

sum

o

Renta

Función de consumo sanitario

Observaciones muestrales Lineal (Observaciones muestrales)

72300,ˆ =α 06770,ˆ =β

Muestra de 25 famílias:

Consumo Renta 2275 30000 3049 30000 2050 30000 2362 30000 2457 30000 2850 35000 2499 35000 2763 35000 2869 35000 2177 35000 3184 40000 3013 40000 3464 40000 2295 40000 2224 40000 3196 45000 3617 45000 3084 45000 2951 45000 4006 45000 3977 50000 3288 50000 4085 50000 3547 50000 3907 50000

Bondad de ajuste

Relación lineal entre variables cuantitativas

A) B)

( )( )∑∑

−== 2

222

yYxXˆ

VTVER

i

10 2 ≤≤R

OEXPLICATIV es NOmodeloElR ⇔=02

Y de variación la todaEXPLICAmodeloElR ⇔=12

Ejemplo. Función de consumo sanitario

Relación lineal entre variables cuantitativas

Ci= 300,72+0,0677·RiR2 = 0,6169

0

1000

2000

3000

4000

5000

25000 35000 45000 55000

Con

sum

o

Renta

Función de consumo sanitario

Observaciones muestrales Lineal (Observaciones muestrales)

72300,ˆ =α 06770,ˆ =β

Muestra de 25 famílias:

Consumo Renta 2275 30000 3049 30000 2050 30000 2362 30000 2457 30000 2850 35000 2499 35000 2763 35000 2869 35000 2177 35000 3184 40000 3013 40000 3464 40000 2295 40000 2224 40000 3196 45000 3617 45000 3084 45000 2951 45000 4006 45000 3977 50000 3288 50000 4085 50000 3547 50000 3907 50000