Upload
chucho
View
87
Download
5
Embed Size (px)
DESCRIPTION
Estadistica Descriptiva-Inferencial
Citation preview
CORRELACIÓN Y REGRESIÓN LINEAL SIMPLE
En este capítulo se establecerá una relación cuantitativa entre dos omás variables relacionadas, para posteriormente tratar de predeciry/o explicar el valor de una variable respecto a la otra, así como elgrado de relación entre las variables
• EL ANÁLISIS DE CORRELACIÓN: Es un grupode técnicas que permiten medir la magnitud de larelación entre dos variables.
• EL DIAGRAMA DE DISPERSIÓN: Es undiagrama que refleja la relación entre las variables,por ejemplo
EJEMPLO:
Consideremos la siguiente información respecto a la cantidadde comerciales de televisión que aparecen durante en el fin desemana con el numero de ventas en un negocio en la semanasiguiente
Cantidad de comerciales (x) 2 5 3 4 3 4 2
Volumen de ventas en cientos de dólares (y) 40 60 41 54 38 49 38
0
10
20
30
40
50
60
70
0 1 2 3 4 5 6
La correlación puede ser de diferentes formas
En el caso particular de la correlación lineal
EL COEFICIENTE DECORRELACIÓN
Es un número denotado por la letra 𝒓, que se define como
𝒓 = 𝒙𝒊 − 𝒙 (𝒚𝒊 − 𝒚)
𝒙𝒊 − 𝒙𝟐 𝒚𝒊 − 𝒚
𝟐𝒅𝒐𝒏𝒅𝒆 − 𝟏 ≤ 𝒓 ≤ 𝟏
Este número 𝒓 indica la magnitud de relación entre lasvariables
EL ANÁLISIS DE REGRESIÓN:
Es una técnica estadística para el modelado y lainvestigación de la relación entre dos o másvariables que permite determinar una función quese ajuste a los puntos de un diagrama dedispersión con la finalidad de poder predecir enforma aproximada una de las variables a través dela otra.
La regresión lineal consiste en ajustar la nube de puntos a una recta de ecuación
𝑦 = 𝑎 + 𝑏𝑥
Donde
• 𝑏 = 𝒙𝒊− 𝒙 (𝒚𝒊− 𝒚)
𝒙𝒊− 𝒙𝟐
• 𝑎 = 𝑦 − 𝑏 𝑥
EJEMPLO:Los datos siguientes son los sueldos mensuales“y” , promedios de calificaciones “x”, paraestudiantes que obtuvieron su licenciatura enadministración, con especialización en sistemasde información. Para estos datos, halle laecuación de regresión
• 𝑏 = 𝑥𝑖− 𝑥 (𝑦𝑖− 𝑦)
𝑥𝑖− 𝑥2 =
430
0.74= 581.08
• 𝑎 = 𝑦 − 𝑏 𝑥 = 3650 − 581.08 3.2 = 1790.54
𝑦 = 𝑎 + 𝑏𝑥
𝑦 = 1790.54 + 581.08𝑥
y = 581.08x + 1790.5
R² = 0.7459
0
500
1000
1500
2000
2500
3000
3500
4000
4500
0 0.5 1 1.5 2 2.5 3 3.5 4
Sueldo
Sueldo
Lineal (Sueldo)
VARIABLE ESTADISTICABIDIMENSIONAL
Una variable Estadística es bidimensional si se realiza unaobservación simultanea de dos características obteniendo deesta forma pares que denotaremos como (𝑥𝑖 , 𝑦𝑖) quecorresponderán la variable (𝑋, 𝑌)
EJEMPLO:
Consideremos el siguiente conjunto de datos grado de instrucción yedad, del personal que trabaja en determina empresa
X: Grado de instrucción Valores:Primaria,secundaria, superior
Y: Edad Valores: 24, 35, 40, 52
Y
X 24 35 40 52
Primaria 2 0 1 2
Secundaria 1 10 6 4
Superior 6 5 7 9
9 15 14 15
podemos representar gráficamente el conjunto de datos comosigue
Primaria
Secundaria
Superior
0
2
4
6
8
10
12
14
16
2435
4052
Primaria
Secundaria
Superior
REPRESENTACION DE LA INFORMACION MEDIANTE CUADROS BIDIMENSIONALES
Dada una variable bidimensional (𝑋, 𝑌) que toma los valores
𝑣𝑎𝑙𝑜𝑟𝑒𝑠 𝑑𝑒 𝑋 ∶ 𝑥1, 𝑥2,… , 𝑦𝑚𝑣𝑎𝑙𝑜𝑟𝑒𝑠 𝑑𝑒 𝑌 ∶ 𝑦1, 𝑦2,… , 𝑦𝑝
La distribución de frecuencias de esta variable es un cuadro de doble entrada de los valores (𝑥𝑖 , 𝑦𝑗) con sus respectivas frecuencias 𝑓𝑖𝑗
y
x
y1 y2 … yj … ypTOTAL
x1 f11 f12 … f1j … f1p f 1 .
x2 f21 f22 … f2j … f2p f 2 .
⋮ ⋮ ⋮ ⋮ ⋮ ⋮
xi fi1 fi2 … fij … fip f i .
⋮ ⋮ ⋮ ⋮ ⋮ ⋮
xm fm1 fm2 … fmj … fmp f m .
TOTAL f . 1 f . 2 … f . j … f . p n
DISTRIBUCIONES MARGINALES
𝑓𝑖𝑗 : es el número de veces que se repite el dato (𝑥𝑖 , 𝑦𝑗)
𝑓𝑖∙ =
𝑗=1
𝑝
𝑓𝑖𝑗
𝑓∙𝑗 =
𝑖=1
𝑚
𝑓𝑖𝑗
𝑖=1
𝑚
𝑗=1
𝑝
𝑓𝑖𝑗 = 𝑛
xi f i .x1 f 1 .
x2 f 2 .
⋮ ⋮
xi f i .
⋮ ⋮
xm f m .
TOTAL
𝑖=1
𝑚
𝑓𝑖∙
yj f . j
y1 f . 1
y2 f . 2
⋮ ⋮
yj f . j
⋮ ⋮
yp f . pTOTAL
𝑗=1
𝑝
𝑓∙𝑗
FRECUENCIAS RELATIVAS
FRECUENCIA RELATIVA CONJUNTA: ℎ𝑖𝑗 =𝑓𝑖𝑗
𝑛
FRECUENCIA RELATIVAS MARGINALES:
ℎ𝑖∙ =𝑓𝑖∙
𝑛ℎ∙𝑗 =
𝑓∙𝑗
𝑛
Notemos que
𝑖=1
𝑚
𝑗=1
𝑝
ℎ𝑖𝑗 = 1
y
x
y1 y2 … yp TOTAL
x1 h11 h12 … h1p h 1 .
x2 h21 h22 … h2p h 2 .
⋮ ⋮ ⋮ ⋮ ⋮
xm hm1 hm2 … hmp h m .
TOTAL h. 1 h . 2 … h . p 1
PARAMETROS ESTADISTICOS
MEDIAS MARGINALES:
𝑥 = 𝑖=1𝑚 𝑓𝑖∙𝑥𝑖
𝑛 𝑦 = 𝑗=1𝑝𝑓∙𝑗𝑦𝑗
𝑛
VARIANZAS MARGINALES:
𝑠𝑥2 = 𝑖=1𝑚 𝑓𝑖∙(𝑥𝑖 − 𝑥)
2
𝑛 − 1𝑠𝑦2 = 𝑗=1𝑝𝑓∙𝑗(𝑦𝑗 − 𝑦)
2
𝑛 − 1COVARIANZA:
𝑠𝑥𝑦 =1
𝑛
𝑖=1
𝑚
𝑗=1
𝑝
𝑓𝑖𝑗𝑥𝑖𝑦𝑗 − 𝑥 𝑦
COEFICIENTE DE CORRELACION:
𝑟 =𝑠𝑥𝑦
𝑠𝑥𝑠𝑦