Pronósticos, Series de Tiempo y Regresión
Capítulo 4: Regresión Lineal Múltiple
Temas
Modelo de Regresión Lineal Estimaciones de Mínimos Cuadrados y
Estimación Puntual y Predicción Error Cuadrático Medio y Error Estándar Utilidad del Modelo: R2, R2 Ajustada y la
Prueba F Global Prueba de la Significancia de Una Variable
Independiente Intervalos de Confianza Para Valores
Esperados y de Predicción Temas Avanzados
Modelo de Regresión Lineal
Se emplean más de una variable independiente.
relaciona y con x1, x2, ..., xk
modelo:
kkxxxy xxxyk
22110,...,,| 21
Modelo de Regresión Lineal
Valor medio de y cuando los valores de las variables independientes son x1, x2, ..., xk :
parámetros: β0, β1, β2, ..., βk
término de error:
kkxxxy xxxyk
22110,...,,| 21
Modelo de Regresión Lineal
Suposiciones del modelo de regresión lineal:
1. En cualquier combinación dada de valores de x1, x2, ..., xk , la media de la población de los valores
potenciales de = 0
2. Suposición de la varianza constante
3. Suposición de normalidad
4. Suposición de la independencia
Modelo de Regresión Lineal
Interpretación de los parámetros de regresión β0, β1, β2, ..., βk
Los parámetros relacionan la media de la variable dependiente con
las variables independientes en un sentido global.
β0 : ordenada al origen
β1 : cambio en el consumo medio de combustible a la semana que se
asocia con el incremento de un grado en la temperatura promedio
cuando no cambia el índice de enfriamiento.
β2 : cambio en el consumo medio de combustible a la semana que se
asocia con el incremento de una unidad en el índice de enfriamiento
cuando no cambia la temperatura horaria promedio.
Modelo de Regresión Lineal
Interpretación geométrica del modelo de
regresión
región experimental: combinaciones de los
valores observados de x1, x2, ..., xk
plano de medias
Estimaciones de Mínimos Cuadrados y Estimación Puntual y Predicción Estimación puntual del valor medio y de un
valor individual de la variable dependiente y cuando los valores de las variables independientes son x01, x02, ..., x0k .
Se predice = 0 Esta ecuación se llama la ecuación de
predicción de mínimos cuadrados
kk xbxbxbby 00220110ˆ
Error Cuadrático Medio y Error Estándar Una estimación puntual de σ2 es el error
cuadrático medio:
Una estimación puntual de σ es el error estándar:
12
kn
SSEs
1
kn
SSEs
Utilidad del Modelo: R2, R2 Ajustada y la Prueba F Global En el caso del modelo de regresión lineal múltiple,
1. Variación total = Σ(yi-y)2
2. Variación explicada = Σ(yi-y)2
3. Variación inexplicada = Σ(yi-yi)2
4. Variación total = Variación explicada + Variación inexplicada
5. El coeficiente de determinación múltiple es R2 = (variación explicada)/(variación total)
6. El R2 es la proporción de la variación total en los n valores observados de la variable dependiente que explica el modelo de regresión global
7. Coeficiente de correlación múltiple: R = √R2
Utilidad del Modelo: R2, R2 Ajustada y la Prueba F Global R2 Ajustada
donde R2 es el coeficiente de determinación múltiple n es la cantidad de observaciones y k es la cantidad de variables independientes en
el modelo
1
1
122
kn
n
n
kRR
Utilidad del Modelo: R2, R2 Ajustada y la Prueba F Global
H0: β0 = β1 = β2 =... = βk = 0
Ha: por lo menos uno de los β0, β1,
β2, ..., βk ≠ 0
Estadística F global:
1/exp_
/exp_)(mod
knlicadainVariación
klicadaVariacióneloF
Utilidad del Modelo: R2, R2 Ajustada y la Prueba F Global
Se puede rechazar H0 y aceptar Ha en el nivel
de significancia α si se mantiene alguna de las
condiciones siguientes: Estadística F (modelo) > F[α]
valor p < α donde el punto F[α] se basa en k grados de
libertad pra el numerador y n-(k+1) para el denominador.
Prueba de la Significancia de Una Variable Independiente
Defina la estadística de una prueba
y asuma que las suposiciones de regresión se mantienen.
jb
j
s
bt
Prueba de la Significancia de Una Variable Independiente
Hipótesis alternativa
Condición de punto de rechazo
Valor p
Ha : βj ≠ 0 2 (área bajo la curva t a la derecha de |t|)
Ha : βj > 0 área bajo la curva t a la derecha de t
Ha : βj < 0 área bajo la curva t a la izquierda de t
)1(2/|| kntt
1 kntt
1 kntt
Prueba de la Significancia de Una Variable Independiente
Si se cumplen las suposiciones de la
regresión, un intervalo de confianza de
100(1-α)% para el parámetro de
regresión βj es
jbkn
j stb 12/
Intervalos de Confianza Para Valores Esperados y de Predicción Para calcular el valor de distancia en un
modelo de regresión múltiple, se requiere de álgegra de matrices.
(Véase el Apéndice B.)
Intervalos de Confianza Para Valores Esperados y de Predicción Si se cumplen las suposiciones de la
regresión, un intervalo de confianza de 100(1-α)% para el valor medio de y cuando los valores de las variables independientes son x01, x02, ..., x0k es
..ˆ 12/ dvsty kn
Intervalos de Confianza Para Valores Esperados y de Predicción Si se cumplen las suposiciones de la
regresión, un intervalo de predicción 100(1-α)% para un valor individual de y cuando los valores de las variables independientes son x01, x02, ..., x0k es
..1ˆ 12/ dvsty kn
Temas Avanzados
Modelo de Regresión Cuadrática Interacción Uso de Variables Ficticias para Modelar
Variables Independientes Cualitativas Prueba F Parcial: Prueba de la
Significancia de una Parte de un Modelo de Regresión
Modelo de Regresión Cuadrática El modelo de regresión cuadrática que
relaciona y con x es
2210 xxy
Modelo de Regresión Cuadrática
μy|x μy|x μy|x
μy|x μy|x μy|x
x x x
x x x
Interacción
Se introduce un término de interacción
cuando se cree que una variable (xi)
influye en la relación entre otra variable
(xj) independiente y la variable
dependiente, y.
21322110 xxxxy
Uso de Variables Ficticias para Modelar Variables Independientes Cualitativas Cuando se quiere incluir una variabla
cualitativa, se pueden utilizar variables ficticias (variables indicadoras, dummies).
Toman el valor de 1 o 0. En efecto, esta variable influye en el
intercepto.
Uso de Variables Ficticias para Modelar Variables Independientes Cualitativas Ejemplo para comparar tres
ubicaciones:
DM DDxy 32110
DM DDxy 864.6374.2886859.0978.14ˆ