78
 2012 [LABORATORIO PRIMERA UNIDAD] ANÁLISIS DE REGRESIÓN I

Laboratorio Estadística

  • Upload
    ltpower

  • View
    184

  • Download
    10

Embed Size (px)

DESCRIPTION

laboratorio resuelto estadística

Citation preview

Page 1: Laboratorio Estadística

7/17/2019 Laboratorio Estadística

http://slidepdf.com/reader/full/laboratorio-estadistica-568dae1c033e3 1/78

 

2012

[LABORATORIO PRIMERAUNIDAD] ANÁLISIS DE REGRESIÓN I

Page 2: Laboratorio Estadística

7/17/2019 Laboratorio Estadística

http://slidepdf.com/reader/full/laboratorio-estadistica-568dae1c033e3 2/78

[LABORATORIO PRIMERA UNIDAD]  11 de mayo de 2012

1  UNIVERSIDAD NACIONAL DE TRUJILLO

UNIVERSIDAD NACIONAL DE TRUJILLO

Page 3: Laboratorio Estadística

7/17/2019 Laboratorio Estadística

http://slidepdf.com/reader/full/laboratorio-estadistica-568dae1c033e3 3/78

[LABORATORIO PRIMERA UNIDAD]  11 de mayo de 2012

2  UNIVERSIDAD NACIONAL DE TRUJILLO

2.4.  La tabla B – 3 del apéndice contiene datos sobre el rendimiento de la gasolina, en

millas, de 32 automóviles diferentes.

Nº Automóvil Y = Millas / Galón X1 = Cilindrada (pulg3)

1 Apollo 18.90 350.0

2 Omega 27.00 350.03 Nova 20.00 250.0

4 Monarch 18.25 351.0

5 Duster 20.07 225.0

6 JensonConv. 11.20 440.0

7 Skyhawk 22.12 231.0

8 Monza 21.47 262.0

9 Scirocco 34.70 89.7

10 Corolla SR-5 30.40 96.9

11 Camaro 16.50 350.0

12 Datsun B210 36.50 85.3

13 Capri II 21.50 171.0

14 Pacer 19.70 258.0

15 Babcat 20.30 140.0

16 Granada 17.80 302.0

17 Eldorado 14.39 500.0

18 Imperial 14.89 440.0

19 Nova LN 17.80 350.0

20 Valiant 16.41 318.0

21 Starfire 23.54 231.022 Cordoba 21.47 360.0

23 Trans AM 16.59 400.0

24 Corolla S-5 31.90 96.9

25 Astre 29.40 140.0

26 Mark IV 13.27 460.0

27 Celica GT 23.90 133.6

28 Charger SE 19.73 318.0

29 Cougar 13.90 351.0

30 Elite 13.27 351.0

31 Matador 13.77 360.0

32 Corvette 16.50 350.0

Tabla B.3 - Rendimiento de la gasolina para 32 automóviles

Page 4: Laboratorio Estadística

7/17/2019 Laboratorio Estadística

http://slidepdf.com/reader/full/laboratorio-estadistica-568dae1c033e3 4/78

[LABORATORIO PRIMERA UNIDAD]  11 de mayo de 2012

3  UNIVERSIDAD NACIONAL DE TRUJILLO

a)  Ajustar un modelo de regresión lineal simple que relacione el rendimiento de la

gasolina (millas por galón) y la cilindrada del motor X1 (pulgadas cúbicas).

Nº Automóvil Y = Millas / Galón X1 = Cilindrada (pulg3) Xi2 Yi

2  XiYi

1 Apollo 18.90 350.0 122500.00 357.21 6615.002 Omega 27.00 350.0 122500.00 729.00 9450.00

3 Nova 20.00 250.0 62500.00 400.00 5000.00

4 Monarch 18.25 351.0 123201.00 333.06 6405.75

5 Duster 20.07 225.0 50625.00 402.80 4515.75

6 JensonConv. 11.20 440.0 193600.00 125.44 4928.00

7 Skyhawk 22.12 231.0 53361.00 489.29 5109.72

8 Monza 21.47 262.0 68644.00 460.96 5625.14

9 Scirocco 34.70 89.7 8046.09 1204.09 3112.59

10 Corolla SR-5 30.40 96.9 9389.61 924.16 2945.76

11 Camaro 16.50 350.0 122500.00 272.25 5775.00

12 Datsun B210 36.50 85.3 7276.09 1332.25 3113.45

13 Capri II 21.50 171.0 29241.00 462.25 3676.50

14 Pacer 19.70 258.0 66564.00 388.09 5082.60

15 Babcat 20.30 140.0 19600.00 412.09 2842.00

16 Granada 17.80 302.0 91204.00 316.84 5375.60

17 Eldorado 14.39 500.0 250000.00 207.07 7195.00

18 Imperial 14.89 440.0 193600.00 221.71 6551.60

19 Nova LN 17.80 350.0 122500.00 316.84 6230.00

20 Valiant 16.41 318.0 101124.00 269.29 5218.3821 Starfire 23.54 231.0 53361.00 554.13 5437.74

22 Cordoba 21.47 360.0 129600.00 460.96 7729.20

23 Trans AM 16.59 400.0 160000.00 275.23 6636.00

24 Corolla S-5 31.90 96.9 9389.61 1017.61 3091.11

25 Astre 29.40 140.0 19600.00 864.36 4116.00

26 Mark IV 13.27 460.0 211600.00 176.09 6104.20

27 Celica GT 23.90 133.6 17848.96 571.21 3193.04

28 Charger SE 19.73 318.0 101124.00 389.27 6274.14

29 Cougar 13.90 351.0 123201.00 193.21 4878.90

30 Elite 13.27 351.0 123201.00 176.09 4657.77

31 Matador 13.77 360.0 129600.00 189.61 4957.20

32 Corvette 16.50 350.0 122500.00 272.25 5775.00

Σ  657.14  9111.40 3019001.36 14764.74 167618.14

Page 5: Laboratorio Estadística

7/17/2019 Laboratorio Estadística

http://slidepdf.com/reader/full/laboratorio-estadistica-568dae1c033e3 5/78

[LABORATORIO PRIMERA UNIDAD]  11 de mayo de 2012

4  UNIVERSIDAD NACIONAL DE TRUJILLO

  Realizamos nuestro gráfico de dispersión para visualizar el comportamiento o

relación entre las variables:

 

Sabemos que:

n 32   284.7313

  20.5356

 

Hallamos :

∑    

 

 

y = -0.0459x + 33.602R² = 0.7043

0

510

15

20

25

30

35

40

0 100 200 300 400 500 600

Gráfico de dispersion del rendimiento

de la gasolina (millas por galón) y lacilindrada del motor (pulg3)

Page 6: Laboratorio Estadística

7/17/2019 Laboratorio Estadística

http://slidepdf.com/reader/full/laboratorio-estadistica-568dae1c033e3 6/78

[LABORATORIO PRIMERA UNIDAD]  11 de mayo de 2012

5  UNIVERSIDAD NACIONAL DE TRUJILLO

  Hallamos :

∑   ∑

 

 

 

  Hallamos :

   

 

 

  Hallamos :   

   

  Reemplazamos en nuestro modelo   :

   

 

 

Interpretación:

El rendimiento de la gasolina disminuye en 0,046 millas/galón con respecto a la

cilindrada del motor X1 unidades en pulgadas cúbicas.

Page 7: Laboratorio Estadística

7/17/2019 Laboratorio Estadística

http://slidepdf.com/reader/full/laboratorio-estadistica-568dae1c033e3 7/78

[LABORATORIO PRIMERA UNIDAD]  11 de mayo de 2012

6  UNIVERSIDAD NACIONAL DE TRUJILLO

b)  Formar la tabla de análisis de varianza y prueba de significancia de la regresión.

 

Se desea probar lo siguiente:

 

 

  Entonces hallamos:

 

:  

 

 

 

:

∑  

  

  :  

  

 

  

 

Page 8: Laboratorio Estadística

7/17/2019 Laboratorio Estadística

http://slidepdf.com/reader/full/laboratorio-estadistica-568dae1c033e3 8/78

[LABORATORIO PRIMERA UNIDAD]  11 de mayo de 2012

7  UNIVERSIDAD NACIONAL DE TRUJILLO

 

   

 

 

 

:

 

 

 

 

Armamos la tabla de análisis de varianza con los datos obtenidos

anteriormente: 

F.de V.  SC gl CM F Valor - P

Regresión 894.432 1 894.43271.4545 0.0000Error 375.525 30 12.517

Total 1269.957 31

  Se debe tener en cuenta que:

 

  

 

Interpretación:

Se Rechaza H0: No es significativa, por lo que podemos decir que nuestro modelo

de regresión estimada es significativo implicado por el rendimiento de la gasolina

dado la cilindrada del motor X1.

Page 9: Laboratorio Estadística

7/17/2019 Laboratorio Estadística

http://slidepdf.com/reader/full/laboratorio-estadistica-568dae1c033e3 9/78

[LABORATORIO PRIMERA UNIDAD]  11 de mayo de 2012

8  UNIVERSIDAD NACIONAL DE TRUJILLO

c)  ¿Qué porcentaje de la variabilidad total del rendimiento de la gasolina explica la

relación lineal con la cilindrada del motor?

  Si:

 

 

 

 

Interpretación:

Existe un 70.43% de variabilidad total del rendimiento de la gasolina expresadapor la variable cilindrada del motor en el modelo de regresión lineal estimado.

d)  Determinar un intervalo de confianza de 95% para el rendimiento promedio de

gasolina, si el desplazamiento del motor es 275 pulg3.

  Si:

   

∑  

  Para ello tenemos que tener en cuenta lo siguiente:

 

 :

   

 

:

 

 ( )  

Page 10: Laboratorio Estadística

7/17/2019 Laboratorio Estadística

http://slidepdf.com/reader/full/laboratorio-estadistica-568dae1c033e3 10/78

[LABORATORIO PRIMERA UNIDAD]  11 de mayo de 2012

9  UNIVERSIDAD NACIONAL DE TRUJILLO

     

 

 

 

:

 

( )  

( )  

 

  :

   

  Reemplazamos

    ∑  

 

  Interpretación:

Se estima con un nivel confianza de 95% el rendimiento promedio de gasolina, si

el desplazamiento del motor es 275 pulg3, se encuentra entre 19.7003 y 22.2641

(millas/ galón).

Page 11: Laboratorio Estadística

7/17/2019 Laboratorio Estadística

http://slidepdf.com/reader/full/laboratorio-estadistica-568dae1c033e3 11/78

[LABORATORIO PRIMERA UNIDAD]  11 de mayo de 2012

10  UNIVERSIDAD NACIONAL DE TRUJILLO

e)  Suponer que se desea pronosticar el rendimiento de gasolina que tiene un coche

con motor de 275 pulg3. Determine un estimado puntual para el rendimiento.

Determinar un intervalo de predicción de 95% para el rendimiento.

  Si:

  ∑  

 

Debemos tener en cuenta los siguientes parámetros:

 

:  

   

     

 

 

 

:

 

 

 

 

  :

   

Page 12: Laboratorio Estadística

7/17/2019 Laboratorio Estadística

http://slidepdf.com/reader/full/laboratorio-estadistica-568dae1c033e3 12/78

[LABORATORIO PRIMERA UNIDAD]  11 de mayo de 2012

11  UNIVERSIDAD NACIONAL DE TRUJILLO

  Reemplazamos:

 

∑  

 

  Interpretación:

Se estima con un 95% de confianza que un motor nuevo de 275 pulg3tuviera un

rendimiento de gasolina entre 13.6438 y 28.3206 (millas por galón).

f)  Comparar los dos intervalos obtenidos en las partes de d y e. explicar la diferencia

entre ellos. ¿Cuál es más amplio y por qué?

  Intervalo de la respuesta media:

 

  Intervalo de nuevas observaciones:

 

 

La estimación del intervalo para las nuevas observaciones es más amplio que la

estimación del intervalo para la respuesta media debido a las k nuevas

observaciones futuras y debido a que en la fórmula de la varianza a las nuevas

observaciones se le agrega el 1.

Page 13: Laboratorio Estadística

7/17/2019 Laboratorio Estadística

http://slidepdf.com/reader/full/laboratorio-estadistica-568dae1c033e3 13/78

[LABORATORIO PRIMERA UNIDAD]  11 de mayo de 2012

12  UNIVERSIDAD NACIONAL DE TRUJILLO

2.7 Se cree que la pureza del oxígeno producido con su proceso de fraccionamiento está

relacionada con el porcentaje de hidrocarburos en el condensador principal de la

unidad de procesamiento. A continuación se muestran los datos de veinte muestras.

Pureza (%) Hidrocarburos (%)

Y X86.91 1.02

89.85 1.11

90.28 1.43

86.34 1.11

92.58 1.01

87.33 0.95

86.29 1.11

91.86 0.87

95.61 1.43

89.86 1.02

96.73 1.46

99.42 1.55

98.66 1.55

96.07 1.55

93.65 1.40

87.31 1.15

95.00 1.01

96.85 0.99

85.20 0.9590.56 0.98

a)  Ajustar un modelo de regresión lineal simple a los datos.

NºHidrocarburos(%) Pureza (%)

Xi2  Yi

2  XiYi X Y

1 1.02 86.91 1.0404 7553.3481 88.6482

2 1.11 89.85 1.2321 8073.0225 99.7335

3 1.43 90.28 2.0449 8150.4784 129.1004

4 1.11 86.34 1.2321 7454.5956 95.83745 1.01 92.58 1.0201 8571.0564 93.5058

6 0.95 87.33 0.9025 7626.5289 82.9635

7 1.11 86.29 1.2321 7445.9641 95.7819

8 0.87 91.86 0.7569 8438.2596 79.9182

9 1.43 95.61 2.0449 9141.2721 136.7223

10 1.02 89.86 1.0404 8074.8196 91.6572

Page 14: Laboratorio Estadística

7/17/2019 Laboratorio Estadística

http://slidepdf.com/reader/full/laboratorio-estadistica-568dae1c033e3 14/78

[LABORATORIO PRIMERA UNIDAD]  11 de mayo de 2012

13  UNIVERSIDAD NACIONAL DE TRUJILLO

11 1.46 96.73 2.1316 9356.6929 141.2258

12 1.55 99.42 2.4025 9884.3364 154.101

13 1.55 98.66 2.4025 9733.7956 152.923

14 1.55 96.07 2.4025 9229.4449 148.9085

15 1.40 93.65 1.96 8770.3225 131.11

16 1.15 87.31 1.3225 7623.0361 100.4065

17 1.01 95.00 1.0201 9025 95.95

18 0.99 96.85 0.9801 9379.9225 95.8815

19 0.95 85.20 0.9025 7259.04 80.94

20 0.98 90.56 0.9604 8201.1136 88.7488

Σ  23.65 1836.36 29.03 168992.05 2184.06

  Realizamos nuestro gráfico de dispersión para visualizar el comportamiento o

relación entre las variables:

  Sabemos que:

n 20

   1.1825

  91.8180

y = 11.801x + 77.863R² = 0.3891

84.00

86.00

88.00

90.00

92.00

94.00

96.00

98.00

100.00

102.00

0.00 0.20 0.40 0.60 0.80 1.00 1.20 1.40 1.60 1.80

   %

    d   e   P   u   e   r   z   a

% de Hidrocarburo

Gráfico de dispersion del % deHidrocarburos con respecto al % de pureza.

Series1

Lineal (Series1)

Page 15: Laboratorio Estadística

7/17/2019 Laboratorio Estadística

http://slidepdf.com/reader/full/laboratorio-estadistica-568dae1c033e3 15/78

[LABORATORIO PRIMERA UNIDAD]  11 de mayo de 2012

14  UNIVERSIDAD NACIONAL DE TRUJILLO

  Hallamos :

∑  

 

 

 

  Hallamos :

∑   ∑

 

 

 

  Hallamos :

   

 

 

  Hallamos :   

 

 

  Reemplazamos en nuestro modelo   :

   

 

Page 16: Laboratorio Estadística

7/17/2019 Laboratorio Estadística

http://slidepdf.com/reader/full/laboratorio-estadistica-568dae1c033e3 16/78

[LABORATORIO PRIMERA UNIDAD]  11 de mayo de 2012

15  UNIVERSIDAD NACIONAL DE TRUJILLO

 

Interpretación:

El porcentaje de pureza aumenta en 11.8010 con respecto al porcentaje de

hidrocarburos X1(unidades porcentuales).

b) 

Probar la hipótesis H0: β1 = 0.

  Se desea probar lo siguiente:

   

  Entonces hallamos:

  :  

 148.3130

 

:

 

  

 

:  

 

 

     

Page 17: Laboratorio Estadística

7/17/2019 Laboratorio Estadística

http://slidepdf.com/reader/full/laboratorio-estadistica-568dae1c033e3 17/78

[LABORATORIO PRIMERA UNIDAD]  11 de mayo de 2012

16  UNIVERSIDAD NACIONAL DE TRUJILLO

 

   

 

 

 

:

 

 

 

  Armamos la tabla de análisis de varianza con los datos obtenidos

anteriormente: 

F.de V SC gl CM F Valor - P

Regresión 148.313 1 148.31311.466 0.0033Error 232.834 18 12.935

Total 381.147 19

 

Se debe tener en cuenta que:

 

  

  Interpretación:

Se Rechaza H0: No es significativa, por lo que podemos decir que nuestro modelo

de regresión estimada es significativo implicado por el por el porcentaje de

hidrocarburos X1.

Page 18: Laboratorio Estadística

7/17/2019 Laboratorio Estadística

http://slidepdf.com/reader/full/laboratorio-estadistica-568dae1c033e3 18/78

[LABORATORIO PRIMERA UNIDAD]  11 de mayo de 2012

17  UNIVERSIDAD NACIONAL DE TRUJILLO

c)  Calcular R2.

 

Si:

 

 

  Interpretación:

El 38.91% de la variabilidad total de la pureza del modelo estimado de regresión

lineal explica la relación lineal con el porcentaje de hidrocarburos. 

d)  Determinar un intervalo de confianza de 95% para la pendiente. 

 

Si:

    ∑  

 

Para hallar nuestro intervalo debemos tener en cuenta lo siguientes:

 

∑ 

∑  

∑  

     

   

Page 19: Laboratorio Estadística

7/17/2019 Laboratorio Estadística

http://slidepdf.com/reader/full/laboratorio-estadistica-568dae1c033e3 19/78

[LABORATORIO PRIMERA UNIDAD]  11 de mayo de 2012

18  UNIVERSIDAD NACIONAL DE TRUJILLO

  Reemplazamos los datos obtenidos en la fórmula del intervalo presentado

anteriormente:

   

e) 

Determinar un intervalo de confianza de 95% para la pureza media, cuando el

porcentaje de hidrocarburos es 1.00.

  Si:

    ∑  

 

Para ello tenemos que tener en cuenta lo siguiente:

 

 :    

 

:  

(

)

 

( )  

     

 

 

:

 

( )  

( )  

Page 20: Laboratorio Estadística

7/17/2019 Laboratorio Estadística

http://slidepdf.com/reader/full/laboratorio-estadistica-568dae1c033e3 20/78

[LABORATORIO PRIMERA UNIDAD]  11 de mayo de 2012

19  UNIVERSIDAD NACIONAL DE TRUJILLO

    :

   

  Reemplazamos

    ∑  

 

 

Interpretación:

Se estima con un nivel confianza de 95% la pureza media de gasolina, cuando elporcentaje de hidrocarburos es 1.00, donde se encuentra entre 87.5102 y

91.8185 (unidades porcentuales).

2.12.  Se cree que la cantidad de libras de vapor usadas en una planta por mes está

relacionada con la temperatura ambiente promedio. A continuación se

presentan los consumos y las temperaturas del último año.

Temperatura Uso/1000

Mes Xi Yi

Enero 21 185.79Febrero 24 214.47Marzo 32 288.03Abril 47 424.84Mayo 50 454.68Junio 59 539.03Julio 68 621.55

Agosto 74 675.06Septiembre 62 562.03

Octubre 50 452.93Noviembre 41 369.95Diciembre 30 273.98

Page 21: Laboratorio Estadística

7/17/2019 Laboratorio Estadística

http://slidepdf.com/reader/full/laboratorio-estadistica-568dae1c033e3 21/78

[LABORATORIO PRIMERA UNIDAD]  11 de mayo de 2012

20  UNIVERSIDAD NACIONAL DE TRUJILLO

a)  Ajustar un modelo de regresión lineal simple a los datos.

Temperatura Uso/1000Xi

2  Yi2  XiYi Mes Xi  Yi 

Enero 21 185.79 441 34517.9241 3901.59

Febrero 24 214.47 576 45997.3809 5147.28

Marzo 32 288.03 1024 82961.2809 9216.96

Abril 47 424.84 2209 180489.026 19967.48

Mayo 50 454.68 2500 206733.902 22734

Junio 59 539.03 3481 290553.341 31802.77

Julio 68 621.55 4624 386324.403 42265.4

Agosto 74 675.06 5476 455706.004 49954.44

Septiembre 62 562.03 3844 315877.721 34845.86

Octubre 50 452.93 2500 205145.585 22646.5

Noviembre 41 369.95 1681 136863.003 15167.95

Diciembre 30 273.98 900 75065.0404 8219.4

Σ  558 5062.34 29256 2416234.61 265869.63

 

Realizamos nuestro gráfico de dispersión para visualizar el comportamiento o

relación entre las variables:

y = 9.2085x - 6.3321R² = 0.9999

0

100

200

300

400

500

600

700

800

0 20 40 60 80

Gráfico de dispersión de latemperatura con respecto al uso/1000.

Yi

Lineal (Yi)

Page 22: Laboratorio Estadística

7/17/2019 Laboratorio Estadística

http://slidepdf.com/reader/full/laboratorio-estadistica-568dae1c033e3 22/78

[LABORATORIO PRIMERA UNIDAD]  11 de mayo de 2012

21  UNIVERSIDAD NACIONAL DE TRUJILLO

  Sabemos que:

n 12   46.5000

  421.8617

 

Hallamos :

∑    

 

 

  Hallamos :

∑   ∑  

   

 

Hallamos :

   

 

 

 

Hallamos :   

 

  Reemplazamos en nuestro modelo   :

Page 23: Laboratorio Estadística

7/17/2019 Laboratorio Estadística

http://slidepdf.com/reader/full/laboratorio-estadistica-568dae1c033e3 23/78

[LABORATORIO PRIMERA UNIDAD]  11 de mayo de 2012

22  UNIVERSIDAD NACIONAL DE TRUJILLO

   

 

  Interpretación:

La cantidad de vapor aumenta en 9.2085 libras con respecto al porcentaje de

temperatura. X1. 

b) 

Probar la significancia de la regresión.

  Se desea probar lo siguiente:

   

 

Entonces hallamos:

 

:  

 

 

:

∑  

 

 

:

 

  

 

 

Page 24: Laboratorio Estadística

7/17/2019 Laboratorio Estadística

http://slidepdf.com/reader/full/laboratorio-estadistica-568dae1c033e3 24/78

[LABORATORIO PRIMERA UNIDAD]  11 de mayo de 2012

23  UNIVERSIDAD NACIONAL DE TRUJILLO

  

 

   

 

 

  :

 ∑  

 

 

t tabulado:

 

 

Interpretación:

Por lo tanto se rechaza la H0 = 0, ya que el valor absoluto de mi valor calculado es

mayor que mi valor tabulado t. podemos concluir que nuestro modelo de

regresión lineal es estadísticamente significativo.

c) 

En la administración de la planta se cree que un aumento de 1 grado en la

temperatura ambiente promedio hace aumentar 10000 libas el consumo mensual

de vapor. ¿Estos datos respaldan la afirmación?

  Si:

    ∑  

  Para ello tenemos que tener en cuenta lo siguiente:

Page 25: Laboratorio Estadística

7/17/2019 Laboratorio Estadística

http://slidepdf.com/reader/full/laboratorio-estadistica-568dae1c033e3 25/78

[LABORATORIO PRIMERA UNIDAD]  11 de mayo de 2012

24  UNIVERSIDAD NACIONAL DE TRUJILLO

 

 :    

 

:

 

( )  

     

 

 

:

 

( )

 

( )  

 

  :

   

  Reemplazamos

   

 

() 

 

Interpretación:

Page 26: Laboratorio Estadística

7/17/2019 Laboratorio Estadística

http://slidepdf.com/reader/full/laboratorio-estadistica-568dae1c033e3 26/78

[LABORATORIO PRIMERA UNIDAD]  11 de mayo de 2012

25  UNIVERSIDAD NACIONAL DE TRUJILLO

Se estima que un aumento de 1 grado en la temperatura ambiente promedio

hace aumentar 10000 libas el consumo mensual de vapor el cual se estimo en un

intervalo al 95% de confianza donde se encuentra entre 82.7306 y 88.7746 libras.

Por lo cual se puede decir que si se respaldan.

d)  Determinar un intervalo de predicción de 99% para el uso de vapor en un mes con

temperatura ambiente promedio de 580.

  Si:

  ∑  

 

Debemos tener en cuenta lo siguiente:

 

 

 

 

:

 

 

 

:

∑  

 

Page 27: Laboratorio Estadística

7/17/2019 Laboratorio Estadística

http://slidepdf.com/reader/full/laboratorio-estadistica-568dae1c033e3 27/78

[LABORATORIO PRIMERA UNIDAD]  11 de mayo de 2012

26  UNIVERSIDAD NACIONAL DE TRUJILLO

    :

   

 

Reemplazamos con nuestros datos hallados anteriormente y tenemos nuestro

intervalo:

 

  Interpretación:

Se estima un intervalo de predicción de 99% de confianza para el uso de vapor en

un mes con temperatura ambiente promedio de 580, donde se aprecia

claramente que dicho uso de vapor varía entre 521.2237 y 534.2944 libras. 

Page 28: Laboratorio Estadística

7/17/2019 Laboratorio Estadística

http://slidepdf.com/reader/full/laboratorio-estadistica-568dae1c033e3 28/78

[LABORATORIO PRIMERA UNIDAD]  11 de mayo de 2012

27  UNIVERSIDAD NACIONAL DE TRUJILLO

2.15. Byers y Williams estudiaron el impacto de la temperatura sobre la viscosidad de mezclas

de tolueno y tetralina. La tabla siguiente muestra los datos para mezclas con fracción molar de

tolueno igual a 0.4.

Temperatura °C Viscosidad

(mPa*s)24.9 1.133

35 0.9772

44.9 0.8532

55.1 0.775

65.2 0.6723

75.2 0.6021

85.2 0.542

95.2 0.5074

a. 

Estimar la ecuación de predicción.

Primero graficaremos los datos para ver el comportamiento y elegir el modelo adecuado:

y = -0.476ln(x) + 2.6676

0

0.2

0.4

0.6

0.8

1

1.2

20 30 40 50 60 70 80 90 100

   V   i   s   c   o   s   i    d   a    d    (   m   P   a    *   s    )

Temperatura (°C)

Diagrama de Dispersión deTemperatura (°C) y Viscosidad (mPa*s)

Page 29: Laboratorio Estadística

7/17/2019 Laboratorio Estadística

http://slidepdf.com/reader/full/laboratorio-estadistica-568dae1c033e3 29/78

[LABORATORIO PRIMERA UNIDAD]  11 de mayo de 2012

28  UNIVERSIDAD NACIONAL DE TRUJILLO

Observamos que el modelo que se ajusta mejor a los datos es el logarítmico que tiene la siguiente

ecuación:

 

Para utilizar las fórmulas de un modelo lineal, tenemos que hallar una columna en la tabla con lnX

y la columna de la variable dependiente y:

X Y ln X

Temperatura °C Viscosidad (mPa*s)

1 24.9 1.133 3.21487

2 35 0.9772 3.55535

3 44.9 0.8532 3.80444

4 55.1 0.775 4.00915

5 65.2 0.6723 4.17746

6 75.2 0.6021 4.320157 85.2 0.542 4.44500

8 95.2 0.5074 4.55598

Necesitaremos además las siguientes sumatorias:

∑lnX 32.0824

∑lnX2  130.1528

∑lnX*Y 23.6003

  4.0103

∑Y  6.0622

∑Y2  4.9329

Y     0.7578

Utilizamos las fórmulas:

Para hallar 1:

 

Page 30: Laboratorio Estadística

7/17/2019 Laboratorio Estadística

http://slidepdf.com/reader/full/laboratorio-estadistica-568dae1c033e3 30/78

[LABORATORIO PRIMERA UNIDAD]  11 de mayo de 2012

29  UNIVERSIDAD NACIONAL DE TRUJILLO

Dónde:

∑ ∑  

 

 

Y:

 

 

 

Entonces:

 

 

Para hallar 0:

 

 

 

Entonces remplazando en la ecuación del modelo:

 

INTERPRETACIÓN:  Cada vez que latemperatura aumenta en un °C la viscosidad

disminuye en 0.4762 mPa*s.

Page 31: Laboratorio Estadística

7/17/2019 Laboratorio Estadística

http://slidepdf.com/reader/full/laboratorio-estadistica-568dae1c033e3 31/78

[LABORATORIO PRIMERA UNIDAD]  11 de mayo de 2012

30  UNIVERSIDAD NACIONAL DE TRUJILLO

b. 

Hacer un análisis completo del modelo.

Probar la significancia del modelo:

 

 

 

Para hacer la tabla de ANVA necesitamos:

SCR:

 

 

 

SCT:

 

 

 

SCE:

 

 

 

CMR: 

 

 

 

Page 32: Laboratorio Estadística

7/17/2019 Laboratorio Estadística

http://slidepdf.com/reader/full/laboratorio-estadistica-568dae1c033e3 32/78

[LABORATORIO PRIMERA UNIDAD]  11 de mayo de 2012

31  UNIVERSIDAD NACIONAL DE TRUJILLO

CME: 

 

 

 

Estadístico de prueba F:

 

 

 

Hacemos la tabla de ANVA:

F.V. SC gl CM F

Regresión 0.33856 1 0.338563547.91857

Error 0.00057 6 0.000954

Total 0.33913 7

Hallamos:

 

Si:

   

 

Rechazamos la hipótesis nula, es decir 1 es significativo en el modelo propuesto.

Contraste de la hipótesis usando la probabilidad (p):

 

Si:

 

 

Page 33: Laboratorio Estadística

7/17/2019 Laboratorio Estadística

http://slidepdf.com/reader/full/laboratorio-estadistica-568dae1c033e3 33/78

[LABORATORIO PRIMERA UNIDAD]  11 de mayo de 2012

32  UNIVERSIDAD NACIONAL DE TRUJILLO

Probar la significancia individual de los estimadores:

PARA β0:

 

 

 

Para contrastar la hipótesis necesitamos:

2:

 

 

   (β0):

()  

()  

()  

Estadístico de prueba:

  ()  

√   

 

Hallamos:

 

Page 34: Laboratorio Estadística

7/17/2019 Laboratorio Estadística

http://slidepdf.com/reader/full/laboratorio-estadistica-568dae1c033e3 34/78

[LABORATORIO PRIMERA UNIDAD]  11 de mayo de 2012

33  UNIVERSIDAD NACIONAL DE TRUJILLO

Si:

||    

 

Rechazamos la hipótesis nula, es decir 0 es significativo en el modelo propuesto.

Contraste de la hipótesis usando la probabilidad (p):

 

 

Entonces:

 

 

Si:

 

 

PARA β1:

 

   

Para contrastar la hipótesis necesitamos:

2:

 

 

Page 35: Laboratorio Estadística

7/17/2019 Laboratorio Estadística

http://slidepdf.com/reader/full/laboratorio-estadistica-568dae1c033e3 35/78

[LABORATORIO PRIMERA UNIDAD]  11 de mayo de 2012

34  UNIVERSIDAD NACIONAL DE TRUJILLO

   (β1):

()  

()  

()  

Estadístico de prueba:

  ()  

√  

 

Hallamos:

 

Si:

||    

 

Rechazamos la hipótesis nula, es decir 1 es significativo en el modelo propuesto.

Contraste de la hipótesis usando la probabilidad (p):

 

 

Entonces:

  

Page 36: Laboratorio Estadística

7/17/2019 Laboratorio Estadística

http://slidepdf.com/reader/full/laboratorio-estadistica-568dae1c033e3 36/78

[LABORATORIO PRIMERA UNIDAD]  11 de mayo de 2012

35  UNIVERSIDAD NACIONAL DE TRUJILLO

Si:

 

 

R2:

 

 

 

c. 

Calcular y graficar las bandas de 95% de confianza y de predicción.

Intervalo de confianza para β0: 

⁄  () 

 

Sabemos:

 

 

()  

Entonces:

 

 

INTERPRETACIÓN:  El 99.83% del porcentaje

de variación de “y” es explicada por la

ecuación:

INTERPRETACIÓN:  Se estima al 95% de

confianza que el intervalo del parámetro β0 

está entre 2.5887 y 2.7465.

Page 37: Laboratorio Estadística

7/17/2019 Laboratorio Estadística

http://slidepdf.com/reader/full/laboratorio-estadistica-568dae1c033e3 37/78

[LABORATORIO PRIMERA UNIDAD]  11 de mayo de 2012

36  UNIVERSIDAD NACIONAL DE TRUJILLO

Intervalo de confianza para β1: 

⁄   () 

 

Sabemos:

 

 

()  

Entonces:

 

Intervalo de predicción: 

Agregamos un nuevo valor de x para hacer el intervalo de predicción, para este caso:

 

Hallamos el lnX:

 

Necesitamos:

 

 

 

INTERPRETACIÓN:  Se estima al 95% de

confianza que el intervalo del parámetro β1 

está entre -0.4958 y -0.4567.

Page 38: Laboratorio Estadística

7/17/2019 Laboratorio Estadística

http://slidepdf.com/reader/full/laboratorio-estadistica-568dae1c033e3 38/78

[LABORATORIO PRIMERA UNIDAD]  11 de mayo de 2012

37  UNIVERSIDAD NACIONAL DE TRUJILLO

Además:

 

 

 

 

Entonces:

   

 

2.19. Se tiene el modelo de regresión lineal simple , con   y

 y

 no correlacionado.

a. 

Demostrar que ( ) .

( ) * () ()+ 

Sabemos que:

 

()  

Entonces:

()  

() ( ) 

INTERPRETACIÓN:  Se estima al 95% de

confianza que el intervalo para una nueva

observación x0 = 99°C, y0 estará entre -2.3725

y 3.3223 mPa*s

Page 39: Laboratorio Estadística

7/17/2019 Laboratorio Estadística

http://slidepdf.com/reader/full/laboratorio-estadistica-568dae1c033e3 39/78

[LABORATORIO PRIMERA UNIDAD]  11 de mayo de 2012

38  UNIVERSIDAD NACIONAL DE TRUJILLO

Remplazando en la fórmula:

( ) *( ) ( )+ 

( ) *( )

( ) () 

( )  

b. 

Demostrar que ( ) .

() *() ()+ 

() [( )] 

() [ ( )] ()  

( )  

Page 40: Laboratorio Estadística

7/17/2019 Laboratorio Estadística

http://slidepdf.com/reader/full/laboratorio-estadistica-568dae1c033e3 40/78

[LABORATORIO PRIMERA UNIDAD]  11 de mayo de 2012

39  UNIVERSIDAD NACIONAL DE TRUJILLO

3.5. Véanse los datos de rendimiento de gasolina de la siguiente tabla:

y x1  x6 

Automóvil Millas/galón Cilindrada (pulgadas cúbicas) Carburador (gargantas)

1 Apollo 18.9 350 4

2 Omega 17 350 4

3 Nova 20 250 1

4 Monarch 18.25 351 2

5 Duster 20.07 225 1

6 Jenson Cov. 11.2 440 4

7 Skyhawk 22.12 231 2

8 Monza 21.47 262 2

9 Scirocco 34.7 89.7 2

10 Corolla SR-5 30.4 96.9 2

11 Camaro 16.5 350 412 Datsun B210 36.5 85.3 2

13 Capri II 21.5 171 2

14 Pacer 19.7 258 1

15 Babcat 20.3 140 2

16 Granada 17.8 302 2

17 Eldorado 14.39 500 4

18 Imperial 14.89 440 4

19 Nova LN 17.8 350 4

20 Valiant 16.41 318 2

21 Starfire 23.54 231 2

22 Cordoba 21.47 360 2

23 Trans AM 16.59 400 4

24 Corolla E-5 31.9 96.9 2

25 Astre 29.4 140 2

26 Mark IV 13.27 460 4

27 Celica GT 23.9 133.6 2

28 Charger SE 19.73 318 2

29 Cougar 13.9 351 2

30 Elite 13.27 351 231 Matador 13.77 360 4

32 Corvette 16.5 350 4

Page 41: Laboratorio Estadística

7/17/2019 Laboratorio Estadística

http://slidepdf.com/reader/full/laboratorio-estadistica-568dae1c033e3 41/78

[LABORATORIO PRIMERA UNIDAD]  11 de mayo de 2012

40  UNIVERSIDAD NACIONAL DE TRUJILLO

a. 

Ajustar un modelo de regresión lineal múltiple que relacione el rendimiento de la

gasolina y , en millas por galón, la cilindrada del motor x 1 y la cantidad de gargantas en el

carburador, x 6.

Hacemos los cálculos de las matrices necesarias:

X'X =

32 9111.4 83

9111.4 3019001.36 26189.8

83 26189.8 251

0.2602 -0.00041 -0.0433

(X'X)-1  = -0.00041 0.000004138 -0.000296

-0.0433 -0.000296 0.04921

647.14X'Y = 164118.14

1576.13

Para estimar la matriz  utilizamos la siguiente fórmula:

 

 

Entonces la ecuación del modelo es:

 

INTERPRETACIÓN DE β1:

INTERPRETACIÓN:  Si la cilindrada del motor

aumenta en una pulgada cúbica y el número

de carburadores permanece constante, el

rendimiento de la gasolina disminuye 0.053

millas /galón.

Page 42: Laboratorio Estadística

7/17/2019 Laboratorio Estadística

http://slidepdf.com/reader/full/laboratorio-estadistica-568dae1c033e3 42/78

[LABORATORIO PRIMERA UNIDAD]  11 de mayo de 2012

41  UNIVERSIDAD NACIONAL DE TRUJILLO

INTERPRETACIÓN DE β6:

b.  Formar la tabla de análisis de varianza, y probar la significancia de la regresión.

Para formar la tabla de ANVA necesitamos los siguientes datos:

Hipótesis:

 

 

Error tipo I: 

 

Suma de cuadrados de la regresión: 

 

 

 

Suma de cuadrados del total: 

 

 

  

INTERPRETACIÓN:  Si el número de

carburadores aumenta en una unidad y la

cilindrada del motor permanece constante, elrendimiento de la gasolina disminuye 0.9295

millas /galón.

Page 43: Laboratorio Estadística

7/17/2019 Laboratorio Estadística

http://slidepdf.com/reader/full/laboratorio-estadistica-568dae1c033e3 43/78

[LABORATORIO PRIMERA UNIDAD]  11 de mayo de 2012

42  UNIVERSIDAD NACIONAL DE TRUJILLO

Suma de cuadrados del error: 

 

 

 

Hacemos el cuadro de análisis de varianza:

F.V. SC gl CM F

Regresión 972.8984 2 486.4492 53.305333

Error 264.6457 29 9.1257

Total 1237.5441 31

Estadístico de prueba: 

 

Contraste de la hipótesis: 

Se rechazará H0 si:

   

Hallamos:

 

Entonces:

 

Contraste usando la probabilidad (p): 

 

 

 

INTERPRETACIÓN:  Se pude afirmar con un

95% de confianza que al menos uno de los

estimadores es significativo, por lo que

podemos concluir que el modelo es

significativo.

Page 44: Laboratorio Estadística

7/17/2019 Laboratorio Estadística

http://slidepdf.com/reader/full/laboratorio-estadistica-568dae1c033e3 44/78

[LABORATORIO PRIMERA UNIDAD]  11 de mayo de 2012

43  UNIVERSIDAD NACIONAL DE TRUJILLO

c. 

Calcular R2 y R2adj para el modelo. Compararlas con la R2 y R2

adj de regresión lineal simple,

que relacionaba las millas con la cilindrada en el problema 2.4.

Calculamos R2:

 

 

 

Calculamos R2ajustado:

 

 

 

Comparación con el ejercicio 2.4.: 

 

INTERPRETACIÓN: como no existe diferencia

significativa entre R2  y R2ajustado  podemos

afirmar que todos los términos del modelo

son significativos.

COMPARACIÓN: debido a que R2 es menor cuando se

trabaja con el modelo simple con una sola variable

que cuando se trabaja con un modelo múltiple con 2

variables (x1  y x2), y R2  es la explicación de la

variabilidad de y explicada por la ecuación de

regresión es conveniente trabajar con el modelo de

regresión múltiple con x1 y x2  como variables

independientes.

Page 45: Laboratorio Estadística

7/17/2019 Laboratorio Estadística

http://slidepdf.com/reader/full/laboratorio-estadistica-568dae1c033e3 45/78

[LABORATORIO PRIMERA UNIDAD]  11 de mayo de 2012

44  UNIVERSIDAD NACIONAL DE TRUJILLO

d.  Determinar un intervalo de confianza de 95% para β1.

Para determinar el intervalo necesitamos:

2:

 

 

 

V(β1):

Necesitamos la matriz C:

C = (X'X)-1 =

C00 C01 C06

C10 C11 C16

C60 C61 C66

C = (X'X)-1 =

0.260195 -0.000410 -0.043272

-0.000410 0.000004 -0.000296

-0.043272 -0.000296 0.049206

La fórmula para V(1): ()  

()  

()  

Entonces la fórmula para el intervalo:

 (

Dónde:

 

Entonces:

 

Page 46: Laboratorio Estadística

7/17/2019 Laboratorio Estadística

http://slidepdf.com/reader/full/laboratorio-estadistica-568dae1c033e3 46/78

[LABORATORIO PRIMERA UNIDAD]  11 de mayo de 2012

45  UNIVERSIDAD NACIONAL DE TRUJILLO

e. 

Calcular el estadístico t   para probar   y . ¿Qué conclusiones se

pueden sacar?

Prueba de significancia individual para β1: 

 

 

 

Estadístico de prueba:

  ()  

√   

 

Hallamos:  

Si:

||    

 

Existe evidencia para rechazar H0, es decir 1 no es significativo en el modelo propuesto.

Contraste de la hipótesis usando la probabilidad (p):  

 

INTERPRETACIÓN:  se estima al 95% de

confianza que el valor del parámetro 1 

oscilará entre -0.0656 y -0.0405

Page 47: Laboratorio Estadística

7/17/2019 Laboratorio Estadística

http://slidepdf.com/reader/full/laboratorio-estadistica-568dae1c033e3 47/78

[LABORATORIO PRIMERA UNIDAD]  11 de mayo de 2012

46  UNIVERSIDAD NACIONAL DE TRUJILLO

Entonces:

 

 

Si:

 

 

Prueba de significancia individual para β6: 

 

 

 

Hallamos V(6):

()  

()  

()  

Estadístico de prueba:

 ()  

√   

 

Hallamos:

 

Si:

||    

 

No existe evidencia para rechazar H0, es decir 6 no es significativo en el modelo propuesto.

Page 48: Laboratorio Estadística

7/17/2019 Laboratorio Estadística

http://slidepdf.com/reader/full/laboratorio-estadistica-568dae1c033e3 48/78

[LABORATORIO PRIMERA UNIDAD]  11 de mayo de 2012

47  UNIVERSIDAD NACIONAL DE TRUJILLO

Contraste de la hipótesis usando la probabilidad (p):

 

 

Entonces:

 

 

Si:

 

 

f. 

Determinar un intervalo de predicción de 95% para una nueva observación derendimiento de gasolina cuando x1 = 275 pulg3 y x6 = 2 gargantas.

Hallamos la matriz x0 y su transpuesta:

1

x0 = 275

2

x0' 1 275 2

Hallamos ŷ0:

 

 

Hallamos la V(ŷ0):

 

 

Page 49: Laboratorio Estadística

7/17/2019 Laboratorio Estadística

http://slidepdf.com/reader/full/laboratorio-estadistica-568dae1c033e3 49/78

[LABORATORIO PRIMERA UNIDAD]  11 de mayo de 2012

48  UNIVERSIDAD NACIONAL DE TRUJILLO

Hacemos el intervalo:

⁄ ⁄    

⁄  

g. 

Determinar un intervalo de predicción de 95% para una nueva observación de

rendimiento de gasolina cuando x1 = 275 pulg3 y x

6 = 2 gargantas. 

De item anterior sabemos que:

 

Hallamos la V(ŷ0):

 

La fórmula del intervalo para una nueva predicción es:

⁄   

Sabemos que:

⁄  

El intervalo será:

 

INTERPRETACIÓN:  se estima al 95% de

confianza que la dureza promedio cuando x1 

es 275 pulg3  y x6  es 2 gargantas estará

comprendida entre 18.869 y 21.5059

millas/galón.

INTERPRETACIÓN:  se estima al 95% de

confianza que la dureza para nuevas

observaciones cuando x1 es 275 pulg3 y x6 es

2 gargantas estará comprendida entre

18.869 y 21.5059 millas/galón.

Page 50: Laboratorio Estadística

7/17/2019 Laboratorio Estadística

http://slidepdf.com/reader/full/laboratorio-estadistica-568dae1c033e3 50/78

[LABORATORIO PRIMERA UNIDAD]  11 de mayo de 2012

49  UNIVERSIDAD NACIONAL DE TRUJILLO

3.8. Los datos de la siguiente tabla presentan la eficiencia de un proceso químico, en función de

varias variables controlables del proceso. 

N° y:CO2  X6:Solvente Total X7:Consumo de Hidrógeno

1 36.98 2227.25 2.062 13.74 434.9 1.33

3 10.08 481.19 0.97

4 8.53 247.14 0.62

5 36.42 1645.89 0.22

6 26.59 907.59 0.76

7 19.07 608.05 1.71

8 5.96 380.55 3.93

9 15.52 213.4 1.97

10 56.61 2043.36 5.08

11 26.72 761.48 0.6

12 20.8 566.4 0.9

13 6.99 237.08 0.63

14 45.93 1961.49 2.04

15 43.09 1023.89 1.57

16 15.79 411.3 2.38

17 21.6 2244.77 0.32

18 35.19 978.64 0.4419 26.14 687.62 8.82

20 8.6 468.28 0.02

21 11.63 460.62 1.72

22 9.59 290.42 1.88

23 4.42 233.95 1.43

24 38.89 2088.12 1.35

25 11.19 994.63 1.61

26 75.62 2196.17 4.78

27 36.03 1080.11 5.88

Page 51: Laboratorio Estadística

7/17/2019 Laboratorio Estadística

http://slidepdf.com/reader/full/laboratorio-estadistica-568dae1c033e3 51/78

[LABORATORIO PRIMERA UNIDAD]  11 de mayo de 2012

50  UNIVERSIDAD NACIONAL DE TRUJILLO

a. 

 Ajustar un modelo de regresión múltiple que relaciona el CO2 del producto(y) con el

solvente total (X 6 ) y el consumo de hidrogeno (X 7  )

    

Donde:

   

36.98

13.74

10.08

8.53

36.42

26.5919.07

5.96

15.52

56.61

26.72

20.8

6.99

Y = 45.93

43.09

15.7921.6

35.19

26.14

8.6

11.63

9.59

4.42

38.89

11.19

75.6236.03

Page 52: Laboratorio Estadística

7/17/2019 Laboratorio Estadística

http://slidepdf.com/reader/full/laboratorio-estadistica-568dae1c033e3 52/78

[LABORATORIO PRIMERA UNIDAD]  11 de mayo de 2012

51  UNIVERSIDAD NACIONAL DE TRUJILLO

1 2227.25 2.06

1 434.9 1.33

1 481.19 0.97

1 247.14 0.62

1 1645.89 0.22

1 907.59 0.761 608.05 1.71

1 380.55 3.93

1 213.4 1.97

1 2043.36 5.08

1 761.48 0.6

1 566.4 0.9

1 237.08 0.63

X= 1 1961.49 2.04

1 1023.89 1.57

1 411.3 2.381 2244.77 0.32

1 978.64 0.44

1 687.62 8.82

1 468.28 0.02

1 460.62 1.72

1 290.42 1.88

1 233.95 1.43

1 2088.12 1.35

1 994.63 1.61

1 2196.17 4.781 1080.11 5.88

27 25874.29 55.02

X'X= 25874.29 38111725.38 58043.2026

55.02 58043.2026 218.3418

0.132317504 -6.56168E-05 -0.015899372

(X'X)-1= -6.56168E-05 7.6628E-08 -3.83572E-06

-0.015899372 -3.83572E-06 0.009606136

667.72

X'Y= 898144.97

1691.3233

Page 53: Laboratorio Estadística

7/17/2019 Laboratorio Estadística

http://slidepdf.com/reader/full/laboratorio-estadistica-568dae1c033e3 53/78

[LABORATORIO PRIMERA UNIDAD]  11 de mayo de 2012

52  UNIVERSIDAD NACIONAL DE TRUJILLO

 

 

b. 

Probar la significancia de la regresión. Calcular R2 y R2 Adj  

b.1) Probar la significancia de la regresión:

H0: 1=2=…=k = 0

H1:  j≠0 al menos una j

 

Estadístico de Prueba

⁄ ⁄  

Se rechaza H0 si:

F0 > F(p-1,n-p) 

   

 

667.72

X'Y= 898144.971691.3233

n=27

 

 

 

 

Page 54: Laboratorio Estadística

7/17/2019 Laboratorio Estadística

http://slidepdf.com/reader/full/laboratorio-estadistica-568dae1c033e3 54/78

[LABORATORIO PRIMERA UNIDAD]  11 de mayo de 2012

53  UNIVERSIDAD NACIONAL DE TRUJILLO

   

 

 

 

 

p= 3

  F(0.05,2,24)= 3.402826 

F. de V SC GL CM F0  Valor P

Regresión 5506.287 2 2753.143 27.953 5.39031E-07

Error 2363.825 24 98.493

Total 7870.112 26

  Comparamos:

F0 > F(0.05,2,24)

27.953> 3.402826 

  Interpretación:

Al rechazarse Ho entonces tenemos que al menos una de los regresoresX6(solvente total) o X7(consumo de hidrógeno) contribuye al modelo

Y=2.52663+0.01852X6+2.18572X7 en forma significativa.

Page 55: Laboratorio Estadística

7/17/2019 Laboratorio Estadística

http://slidepdf.com/reader/full/laboratorio-estadistica-568dae1c033e3 55/78

[LABORATORIO PRIMERA UNIDAD]  11 de mayo de 2012

54  UNIVERSIDAD NACIONAL DE TRUJILLO

b.2) Calcular R2

 

SCR= 5506.286737  SCT= SCE + SCR

SCT= 2363.82536 + 5506.286737

SCT=7870.112

 

  Interpretación:  Existe un 69,96% de variabilidad total de la variable Y

expresada por la variable X en el modelo de regresión múltiple estimada.

b.3) Calcular R2Adj 

( )  

 

 

c.  Usar pruebas t para determinar la contribución de X 6 y X 7  al modelo.

c.1) Contribución de X 6: 

   

  Estadístico de Prueba:

   

Page 56: Laboratorio Estadística

7/17/2019 Laboratorio Estadística

http://slidepdf.com/reader/full/laboratorio-estadistica-568dae1c033e3 56/78

[LABORATORIO PRIMERA UNIDAD]  11 de mayo de 2012

55  UNIVERSIDAD NACIONAL DE TRUJILLO

Se rechaza H0 si:

||  

Datos:

 

 

 

C jj=diagonal de la matriz C=(X’X)-1 

0.132317504 -6.56168E-05 -0.015899372

(X'X)-1= -6.56168E-05 7.6628E-08 -3.83572E-06

-0.015899372 -3.83572E-06 0.009606136

   

   

 

Tenemos:

√  

 

  Comparamos:

||  

 

  Interpretación:  El coeficiente 6  es individualmente

significativo al modelo de regresión lineal múltiple. 

Page 57: Laboratorio Estadística

7/17/2019 Laboratorio Estadística

http://slidepdf.com/reader/full/laboratorio-estadistica-568dae1c033e3 57/78

[LABORATORIO PRIMERA UNIDAD]  11 de mayo de 2012

56  UNIVERSIDAD NACIONAL DE TRUJILLO

c.2) Contribución de X 7 : 

 

 

 

Estadístico de Prueba:

   

Se rechaza H0 si:

||  

Desarrollo:

 

 

 

C jj=diagonal de la matriz C=(X’X)-1 

0.132317504 -6.56168E-05 -0.015899372

(X'X)-1= -6.56168E-05 7.6628E-08 -3.83572E-06

-0.015899372 -3.83572E-06 0.009606136

   

   

 

Tenemos:

√  

 

Page 58: Laboratorio Estadística

7/17/2019 Laboratorio Estadística

http://slidepdf.com/reader/full/laboratorio-estadistica-568dae1c033e3 58/78

[LABORATORIO PRIMERA UNIDAD]  11 de mayo de 2012

57  UNIVERSIDAD NACIONAL DE TRUJILLO

  Comparamos:

||  

 

  Interpretación:  El coeficiente β7  es individualmente

significativo al modelo de regresión lineal múltiple. 

d.  Establecer intervalos de confianza de 95% para β6 y β7 

       

 

Para β6:

√  

 

  Para β7:

√   

 

Page 59: Laboratorio Estadística

7/17/2019 Laboratorio Estadística

http://slidepdf.com/reader/full/laboratorio-estadistica-568dae1c033e3 59/78

[LABORATORIO PRIMERA UNIDAD]  11 de mayo de 2012

58  UNIVERSIDAD NACIONAL DE TRUJILLO

e. 

Volver a ajustar el modelo solo con X6 como regresor. Probar la significancia de la

regresión y calcular R2 Y R2Adj. Comentar los resultados. Con base en estos estadísticos.

¿Es satisfactorio el modelo?

N° y :CO2  X6 : Solvente Total

1 36.98 2227.252 13.74 434.9

3 10.08 481.19

4 8.53 247.14

5 36.42 1645.89

6 26.59 907.59

7 19.07 608.05

8 5.96 380.55

9 15.52 213.4

10 56.61 2043.3611 26.72 761.48

12 20.8 566.4

13 6.99 237.08

14 45.93 1961.49

15 43.09 1023.89

16 15.79 411.3

17 21.6 2244.77

18 35.19 978.64

19 26.14 687.62

20 8.6 468.28

21 11.63 460.62

22 9.59 290.42

23 4.42 233.95

24 38.89 2088.12

25 11.19 994.63

26 75.62 2196.17

27 36.03 1080.11

Page 60: Laboratorio Estadística

7/17/2019 Laboratorio Estadística

http://slidepdf.com/reader/full/laboratorio-estadistica-568dae1c033e3 60/78

[LABORATORIO PRIMERA UNIDAD]  11 de mayo de 2012

59  UNIVERSIDAD NACIONAL DE TRUJILLO

   Ajustamos los datos a un Modelo Potencial de Regresión Lineal:

X6  Y Log Y Log X6 

2227.25 36.98 1.56796691 3.34776897

434.9 13.74 1.13798673 2.63838941

471.19 10.08 1.00346053 2.67319606

247.14 8.53 0.93094903 2.392943041645.89 36.42 1.56133994 3.21640081

907.59 26.59 1.42471834 2.9578897

608.05 19.07 1.28035069 2.78393929

380.55 5.96 0.77524626 2.58041173

213.4 15.52 1.19089172 2.32919442

2043.36 56.61 1.75289315 3.31034489

761.48 26.72 1.42683645 2.8816585

566.4 20.8 1.31806333 2.75312324

237.08 6.99 0.84447718 2.37489492

1961.49 45.93 1.66209645 3.2925861

1023.89 43.09 1.63437649 3.0102533

y = 0.0985x0.8016 

R² = 0.7078

0

10

20

30

40

5060

70

80

0 500 1000 1500 2000 2500

   C   O   2

Solvente Total

Eficiencia de un Proceso Químico

Page 61: Laboratorio Estadística

7/17/2019 Laboratorio Estadística

http://slidepdf.com/reader/full/laboratorio-estadistica-568dae1c033e3 61/78

[LABORATORIO PRIMERA UNIDAD]  11 de mayo de 2012

60  UNIVERSIDAD NACIONAL DE TRUJILLO

411.3 15.79 1.19838213 2.61415871

2244.77 21.6 1.33445375 3.35117185

978.64 35.19 1.54641927 2.99062296

687.62 26.14 1.41730558 2.8373485

468.28 8.6 0.93449845 2.67050561

460.62 11.63 1.06557971 2.66334279

290.42 9.59 0.98181861 2.46302652

233.95 4.42 0.64542227 2.36912305

2088.12 38.89 1.58983794 3.31975545

994.63 11.19 1.04883009 2.99766155

2196.17 75.62 1.87863667 3.34166595

1080.11 36.03 1.55666426 3.03346799

∑  ∑   

 

  Desarrollando  :  ∑XY= 101.631286

 

n= 27

     

   

  ∑X2= 223.692245

     

 

Sxx= 2.9869061

Page 62: Laboratorio Estadística

7/17/2019 Laboratorio Estadística

http://slidepdf.com/reader/full/laboratorio-estadistica-568dae1c033e3 62/78

[LABORATORIO PRIMERA UNIDAD]  11 de mayo de 2012

61  UNIVERSIDAD NACIONAL DE TRUJILLO

 

Interpretación:  Si el solvente total aumenta en una unidad, el CO2  del

producto aumentará en 0.0816482.

  Desarrollando  : Para el caso de Potencia:

 

 

 

  Significancia de la regresión:

       

 

Estadístico de Prueba:

 

 

Grados de

libertad

Suma de

cuadrados

Cuadrado

Medio

F Valor crítico

de F(Valor P)

Regresión 1 1.91950462 1.91950462 60.5493936 3.8797E-08

Residuos 25 0.79253668 0.03170147

Total 26 2.7120413

Page 63: Laboratorio Estadística

7/17/2019 Laboratorio Estadística

http://slidepdf.com/reader/full/laboratorio-estadistica-568dae1c033e3 63/78

[LABORATORIO PRIMERA UNIDAD]  11 de mayo de 2012

62  UNIVERSIDAD NACIONAL DE TRUJILLO

       

  Comparando:

 

Interpretación:  Como el Ho> H se dice que existe al menos un coeficiente del

modelo de regresión que influye en el comportamiento de Y (CO2).

  Calcular R2 

 

 

Interpretación: Existe un 70.78% de variabilidad total en el CO2 (Y) en el producto

expresado por el solvente total del producto (X 6) en el modelo de regresión

estimada.

  Calcular R2Adj 

( )  

 

 

  ¿Es satisfactorio el modelo?

El Modelo de Regresión Simple para X (CO2) y el Solvente Total(X6) es satisfactorio

ya que tiene un 70% de significancia.

Page 64: Laboratorio Estadística

7/17/2019 Laboratorio Estadística

http://slidepdf.com/reader/full/laboratorio-estadistica-568dae1c033e3 64/78

[LABORATORIO PRIMERA UNIDAD]  11 de mayo de 2012

63  UNIVERSIDAD NACIONAL DE TRUJILLO

f. 

Establecer un intervalo de confianza de 95% para β6, con el modelo que se ajusto en el

punto e. Comparar la longitud de este intervalo de confianza con la del determinado en

la parte d. ¿Se deduce algo importante acerca de la contribución de X7 al modelo?

    ∑  

   

  Comparamos los intervalos:

 

Intervalo de Regresión Lineal Múltiple(inciso d)

 

  Intervalo de Regresión Lineal Simple(inciso e)

g. 

Comparar los valores del CME obtenidos con los dos modelos que se ajustaron (partes a

y e) ¿Cómo cambio el CME al quitar X7 del modelo? ¿Indica lo anterior algo importante

acerca de la contribución de X7 al modelo?

  CME del inciso a:

 

  CME del inciso e

 

Page 65: Laboratorio Estadística

7/17/2019 Laboratorio Estadística

http://slidepdf.com/reader/full/laboratorio-estadistica-568dae1c033e3 65/78

[LABORATORIO PRIMERA UNIDAD]  11 de mayo de 2012

64  UNIVERSIDAD NACIONAL DE TRUJILLO

  ¿Cómo cambio el CME al quitar X7?

Al obtener el CME del Modelo de Regresión Simple de las variables Y y X6 este

valor disminuyo, lo cual nos dice que X7 no es tan significativo para este modelo;

ya que al estudiar solo X6 tenemos menos error.

 

¿Indica lo anterior algo importante acerca de la contribución de X7 al modelo? 

Nos indica que X7 no contribuye mucho a nuestro Modelo de Regresión Múltiple. 

3.12. Un ingeniero químico estudió el efecto de la cantidad de surfactante y el tiempo sobre la

formación de catrato. Los catratos se usan como medio de conservación en frio. La siguiente

tabla resume los resultados experimentales.

Cant.Surfactante Tiempo(min) Form.Catrato

X1  X2  Y0 10 7.5

0 50 150 85 220 110 28.60 140 31.60 170 340 200 350 230 35.50 260 36.50 290 38.50 10 12.30 30 18

0 62 20.80 90 25.70 150 32.50 210 340 270 35

0.02 10 14.40.02 30 190.02 60 26.40.02 90 28.50.02 120 290.02 210 350.02 30 15.10.02 60 26.40.02 120 270.02 150 290.05 20 210.05 40 27.30.05 130 48.50.05 190 50.40.05 250 52.5

Page 66: Laboratorio Estadística

7/17/2019 Laboratorio Estadística

http://slidepdf.com/reader/full/laboratorio-estadistica-568dae1c033e3 66/78

[LABORATORIO PRIMERA UNIDAD]  11 de mayo de 2012

65  UNIVERSIDAD NACIONAL DE TRUJILLO

0.05 60 34.40.05 90 46.50.05 120 500.05 150 51.9

a. 

Ajustar un modelo de regresión lineal múltiple que relacione la formación de catrato con

estos regresores

    

Donde:

   

1 0 10

1 0 501 0 851 0 1101 0 1401 0 1701 0 2001 0 2301 0 2601 0 2901 0 101 0 30

1 0 621 0 901 0 150

X = 1 0 2101 0 2701 0.02 101 0.02 301 0.02 601 0.02 901 0.02 1201 0.02 2101 0.02 30

1 0.02 601 0.02 1201 0.02 1501 0.05 201 0.05 401 0.05 1301 0.05 1901 0.05 250

Page 67: Laboratorio Estadística

7/17/2019 Laboratorio Estadística

http://slidepdf.com/reader/full/laboratorio-estadistica-568dae1c033e3 67/78

[LABORATORIO PRIMERA UNIDAD]  11 de mayo de 2012

66  UNIVERSIDAD NACIONAL DE TRUJILLO

1 0.05 601 0.05 901 0.05 1201 0.05 150

7.51522

28.631.63435

35.536.538.512.3

1820.825.732.5

Y = 3435

14.419

26.428.52935

15.126.4272921

27.348.550.452.534.446.5

5051.9

36 0.65 4297

X'X = 0.65 0.0265 70.1

4297 70.1 746169

Page 68: Laboratorio Estadística

7/17/2019 Laboratorio Estadística

http://slidepdf.com/reader/full/laboratorio-estadistica-568dae1c033e3 68/78

[LABORATORIO PRIMERA UNIDAD]  11 de mayo de 2012

67  UNIVERSIDAD NACIONAL DE TRUJILLO

0.12183 -1.50687 -0.00056

(X'X)- 1= -1.50687 68.85280 0.00221

-0.00056 0.00221 0.000004

1094.8

X'Y : 24.121

153467.6

 

 

b. 

Probar la significancia de la regresión ¿A qué conclusiones se puede llegar?

H0: β1=β2=…=βk = 0

H1: β j≠0 al menos una j 

  Estadístico de Prueba

⁄ ⁄  

Se rechaza H0 si:

F0 > F(α,p-1,n-p) 

   

n=36

 

 

1094.8

x'y = 24.121

153467.6

 

Page 69: Laboratorio Estadística

7/17/2019 Laboratorio Estadística

http://slidepdf.com/reader/full/laboratorio-estadistica-568dae1c033e3 69/78

[LABORATORIO PRIMERA UNIDAD]  11 de mayo de 2012

68  UNIVERSIDAD NACIONAL DE TRUJILLO

   

 

 

 

  p= 3

 

F(0.05,2,33)= 3.4028 

F. de V SC GL CM F Valor P

Regresión 4007.072 2 2003.536 87.601 6.316E-14

Error 754.744 33 22.871

Total 4761.816 35

  Comparamos:

F0 > F(0.05,2,24)

87.601 > 3.4028; rechazamos H0 

  Interpretación:

Se puede concluir que al menos una de los regresores X1(cantidad de

surfactante) o X2(tiempo) contribuye al modelo Y=11.0870+350.1192

X1+0.1089 X2 en forma significativa.

c. 

Hacer pruebas t para evaluar la contribución de cada regresor al modelo. Comentar los

resultados

c.1) Contribución de β1:

   

  Estadístico de Prueba:

   

Page 70: Laboratorio Estadística

7/17/2019 Laboratorio Estadística

http://slidepdf.com/reader/full/laboratorio-estadistica-568dae1c033e3 70/78

[LABORATORIO PRIMERA UNIDAD]  11 de mayo de 2012

69  UNIVERSIDAD NACIONAL DE TRUJILLO

Se rechaza H0 si: ||  

Desarrollo:

 

  

C jj=diagonal de la matriz C=(X’X)-1 

0.12183 -1.50687 -0.00056

(X'X)-1 = -1.50687 68.85280 0.00221

-0.00056 0.00221 0.000004

   

   

 

Tenemos:

√  

 

  Comparamos:

||  

 

  Interpretación: El coeficiente 1  es individualmente significativo al

modelo de regresión lineal múltiple.

Page 71: Laboratorio Estadística

7/17/2019 Laboratorio Estadística

http://slidepdf.com/reader/full/laboratorio-estadistica-568dae1c033e3 71/78

[LABORATORIO PRIMERA UNIDAD]  11 de mayo de 2012

70  UNIVERSIDAD NACIONAL DE TRUJILLO

c.2) Contribución de β2:   

 

 

Estadístico de Prueba:

   

Se rechaza H0 si: ||  

Desarrollo:

 

  C jj=diagonal de la matriz C=(X’X)-1 

0.12183 -1.50687 -0.00056

(X'X)-1 : -1.50687 68.85280 0.00221

-0.00056 0.00221 0.000004

   

   

  Tenemos:

√  

 

Page 72: Laboratorio Estadística

7/17/2019 Laboratorio Estadística

http://slidepdf.com/reader/full/laboratorio-estadistica-568dae1c033e3 72/78

[LABORATORIO PRIMERA UNIDAD]  11 de mayo de 2012

71  UNIVERSIDAD NACIONAL DE TRUJILLO

  Comparamos:

||  

 

  Interpretación: El coeficiente β2 es individualmente significativo al

modelo de regresión lineal múltiple. 

d. 

Calcular R2 y R2Adj para este modelo. Comparar esos valores con los de R2 y R2

Adj para el

modelo de regresión lineal simple que relaciona la formación de catrato con el tiempo.

Comentar los resultados

d.1) R2

 y R2

Adj para este modelo:

F. de V SC GL CM F Valor P

Regresión 4007.072 2 2003.536 87.601 6.316E-14

Error 754.744 33 22.871

Total 4761.816 35

 

  Interpretación: Existe un 84.15% de variabilidad total en la formación de

catrato expresada por la variable X (cantidad de surfactante y tiempo) en el

modelo de regresión múltiple estimada.

( )  

 

 

Page 73: Laboratorio Estadística

7/17/2019 Laboratorio Estadística

http://slidepdf.com/reader/full/laboratorio-estadistica-568dae1c033e3 73/78

[LABORATORIO PRIMERA UNIDAD]  11 de mayo de 2012

72  UNIVERSIDAD NACIONAL DE TRUJILLO

d.1) R2 y R2Adj para X2:

X2  Y

10 7.5

50 15

85 22

110 28.6

140 31.6

170 34

200 35

230 35.5

260 36.5

290 38.5

10 12.3

30 18

62 20.890 25.7

150 32.5

210 34

270 35

10 14.4

30 19

60 26.4

90 28.5

120 29

210 3530 15.1

60 26.4

120 27

150 29

20 21

40 27.3

130 48.5

190 50.4

250 52.5

60 34.490 46.5

120 50

150 51.9

Page 74: Laboratorio Estadística

7/17/2019 Laboratorio Estadística

http://slidepdf.com/reader/full/laboratorio-estadistica-568dae1c033e3 74/78

[LABORATORIO PRIMERA UNIDAD]  11 de mayo de 2012

73  UNIVERSIDAD NACIONAL DE TRUJILLO

n= 36    119.4   30.41

Sxy= 22791.1

Sxx= 233274.3

 

 

SCR = 2226.701

SCE = 2535.114

SCT = 4761.816

  Hallamos R2 y R2Ajus 

 

  Interpretación: Existe un 46.8% de variabilidad total en la formación de catrato

expresada por el tiempo en el modelo de regresión múltiple estimada.

( )  

 

 

 

Comentario de los resultados:  Como se observa anteriormente el R2  y R2Ajus en el

Modelo de Regresión Lineal Múltiple es mayor que el de Modelo de Regresión Lineal,

por lo que se concluye que el Modelo de Regresión Lineal Múltiple es mayor debido a

que tiene una variable mas y dicha variable proporciona mas variabilidad además que

el Cuadrado Medio del Erros es menor.

Page 75: Laboratorio Estadística

7/17/2019 Laboratorio Estadística

http://slidepdf.com/reader/full/laboratorio-estadistica-568dae1c033e3 75/78

[LABORATORIO PRIMERA UNIDAD]  11 de mayo de 2012

74  UNIVERSIDAD NACIONAL DE TRUJILLO

e. 

Determinar un intervalo de confianza de 95% para el coeficiente de regresión del tiempo

para los dos modelos de la parte d. Comentar las diferencias encontradas

   

    ∑  

e.1) Para  del Modelo de Regresión Lineal Múltiple

√  

 

e.2) Para  del Modelo de Regresión Lineal

   

 

  Comentario de las diferencias encontradas:

Podemos observar que 1 en el Modelo de Regresión Lineal Simple tiene mayoramplitud que el Modelos de Regresión Lineal Múltiple; por lo cual podemos decir

que 1(MRLS) es más conveniente.

3.16. Demostrar que una forma equivalente de hacer la prueba de la significancia de una

regresión lineal múltiple es basar la prueba de R2 como sigue:

H0: β1=β2=…=βk

H1: al menos una β j≠0 

Calcular lo siguiente:

 

Y rechazar H0 si el valor calculado de F0 > F (α,k,n-p), siendo p=k+1

Page 76: Laboratorio Estadística

7/17/2019 Laboratorio Estadística

http://slidepdf.com/reader/full/laboratorio-estadistica-568dae1c033e3 76/78

[LABORATORIO PRIMERA UNIDAD]  11 de mayo de 2012

75  UNIVERSIDAD NACIONAL DE TRUJILLO

 

DEMOSTRACION:

 

⁄ 

⁄ ⁄  

 

 

Tenemos que p = k+1:

 

 

Page 77: Laboratorio Estadística

7/17/2019 Laboratorio Estadística

http://slidepdf.com/reader/full/laboratorio-estadistica-568dae1c033e3 77/78

[LABORATORIO PRIMERA UNIDAD]  11 de mayo de 2012

76  UNIVERSIDAD NACIONAL DE TRUJILLO

3.17. Suponer que se ha ajustado un modelo de regresión lineal con k=2 regresores, a n=25

observaciones, y que R2=0.9

a.  Probar el significado de la regresión con α=0.05. Usar los resultados del problema

anterior

H0: β1=β2=…=βk = 0

H1: β j≠0 al menos una j 

 

Estadístico de Prueba

()  Se rechaza H0 si: F0 > F(α,p-1,n-p) 

Datos:

k=2

p= k+1=3

n= 25

R2=0.9

α=0.05

 

Reemplazando:

 

 

 

 

Comparamos Fo > F

F0 > F(0.05,2,22)

99 

> 3.443, se rechaza H0 

 

Interpretación:

Se puede concluir que al menos una de los regresores X1 o X2 contribuye en el

Modelo de Regresión Lineal Múltiple en forma significativa.

Page 78: Laboratorio Estadística

7/17/2019 Laboratorio Estadística

http://slidepdf.com/reader/full/laboratorio-estadistica-568dae1c033e3 78/78

[LABORATORIO PRIMERA UNIDAD]  11 de mayo de 2012

b. 

¿Cuál es valor mínimo de R2 que haría llegar a la conclusión de que la regresión es

significativa si α=0.05? ¿Sorprende al lector la pequeñez de este valor de R2?

 

  Datos:

 

k=2

 

p= k+1=3

  n= 25

 

α=0.05

   

  Reemplazando:

 

 

  ¿Sorprende al lector la pequeñez de este valor de R2?

Si puesto que este modelo tendría una significancia de tan solo 23.84%.