Download pdf - Libro Estad. Total

ESTADÍSTICA 1. Descriptiva 2. Probabilidad 3. Inferencia 4. Análisis de la

varianza 5. Diseño de

Experimento 6. Regresión

lineal

Departamento de Ingeniería de Organización, Administración de Empresas y Estadística

Escuela Técnica Superior de Ingenieros Industriales

Universidad Politécnica de Madrid

ww

w.e

tsii

.up

m.e

s/in

go

r/e

stad

isti

ca/

LABORATORIO DE ESTADISTICADepartamento de ingenierıa de organizacion,administracion de empresas y estadıstica.Escuela Tecnica Superior de Ingenieros Industriales

Universidad Politecnica de Madrid

ESTADISTICA

1

.

PROGRAMA

1. Estadıstica Descriptiva. Datos: tipos de datos. Distribucion de frecuencias ehistograma. Medidas caracterısticas. Diagrama de cajas. Diagrama de tallos y hojas.Transformaciones de datos. Datos multivariantes. Vector de medias y matriz de varian-zas. Correlacion. Transformaciones.

2. Probabilidad. Experimento aleatorio. Definicion de variable aleatoria discreta. Dis-tribucion de probabilidad. Funcion de distribucion. Variable aleatoria continua. Funcionde densidad. Transformaciones. Esperanza y varianza. Momentos. Proceso de Bernoulli:Distribucion binomial. Proceso de Poisson: Distribucion de Poisson. Distribucion ex-ponencial. Distribucion normal. La distribucion normal como aproximacion de las dis-tribuciones binomial y de Poisson. Distribucion conjunta. Definiciones de distribucionconjunta, marginal y condicionada. Funciones de densidad de varias variables. Esperanza.Covarianza y correlacion. Generalizacion a n variables aleatorias. Independencia. Trans-formaciones lineales. Media de variables aleatorias independientes: el teorema central dellımite.

3. Inferencia. Concepto de inferencia. Distintos problemas de inferencia. Metodos deestimacion: metodo de los momentos, metodo de maxima verosimilitud. Aplicacion a lasdistribuciones binomial, Poisson, exponencial y normal. Distribucion de los estimadores.Distribucion χ2 de Pearson. Comparacion de estimadores. Propiedades deseables de unestimador. Concepto de intervalo de confianza. Intervalo de confianza para la media deuna distribucion normal con varianza conocida. Intervalo de confianza para la media yla varianza de una distribucion normal. La distribucion t de Student. Intervalos de con-fianza en general. Aplicaciones a las distribuciones de Poisson, binomial y exponencial.Contrastes de hipotesis. Contrastes parametricos: hipotesis nula e hipotesis alternativa.Nivel de significacion y region de rechazo. Nivel crıtico p. Errores tipo I y II de uncontraste. Potencia de un contraste. Aplicacion a la normal, binomial y Poisson. Con-trastes de bondad de ajuste (no parametricos): contraste χ2 de Pearson y el contraste deKolmogorov-Smirnov.

4. Analisis de la varianza. Comparacion de dos tratamientos. La hipotesis de normal-idad, independencia y homocedasticidad. Estimacion. Contraste de igualdad de medias.Contraste de igualdad de varianzas. La distribucion F. Comparacion de varios tratamien-tos. Modelo basico. Descomposicion de la variabilidad. Tabla del analisis de la varianza(ADEVA). Contraste de igualdad de medias. Comparaciones multiples. Diagnosis de lashipotesis del modelo de analisis de la varianza. Grafico probabilista normal. Contrastesde homocedasticidad. Aleatorizacion.

5. Diseno de experimentos. El modelo en bloques aleatorizados. Modelo y esti-macion. Descomposicion de la variabilidad. Tabla de analisis de la varianza. Modelocon dos factores. Concepto de interaccion. Descomposicion de la variabilidad. Tabla deanalisis de la varianza. Modelo con mas factores. Cuadrado Latino.

6. Regresion lineal. Hipotesis del modelo. Estimacion de los parametros por maximaverosimilitud (mınimos cuadrados). Distribucion de los estimadores. Contrastes individ-uales de los parametros del modelo. Contraste general de regresion. El coeficiente dedeterminacion. Multicolinealidad: identificacion y sus consecuencias. Prediccion en re-gresion simple y regresion multiple. Variables cualitativas como regresores. Diagnosis delmodelo.

1

.

1. Estadística descriptiva

Curso 2004-05

Estadística

Estadística Descriptiva 2

DatosNúmero Consumo Cilindrada Potencia Peso Aceleración Año País Nº Cilindros

l/100Km cc CV kg segundos

1 15 4982 150 1144 12 70 EEUU 82 16 6391 190 1283 9 70 EEUU 83 24 5031 200 1458 15 70 EEUU 84 9 1491 70 651 21 71 EEUU 45 11 2294 72 802 19 71 EEUU 46 17 5752 153 1384 14 71 EEUU 87 12 2294 90 802 20 72 EEUU 48 17 6555 175 1461 12 72 EEUU 89 18 6555 190 1474 13 72 EEUU 810 12 1147 97 776 14 72 Japón 311 16 5735 145 1360 13 73 EEUU 812 12 1868 91 860 14 73 Europa 413 9 2294 75 847 17 74 EEUU 414 8 1295 67 666 16 74 Europa 415 7 1163 65 612 21 74 Japón 416 7 1360 61 667 19 74 Japón 417 12 3802 90 1070 17 75 EEUU 618 13 3687 95 1261 19 75 EEUU 619 9 1475 71 741 17 75 Europa 420 9 1983 115 890 14 75 Europa 4... ... ... ... ... ... ... ... ...391 7 1753 75 735 15 82 Japón 4


Tipos de datos

• Cuantitativos– Continuos: consumo, potencia,aceleración,

peso

– Discretos: nº de cilindros

• Cualitativos– Ordinales: categoría

– No ordinales: país, gasolina/gasoil


Distribución de frecuencias:consumo l/100 km

------------------------------------------------------------- Limite Limite Punto Frecuencia Frecuencia Clase Inferior Superior Medio Absoluta Relativa ------------------------------------------------------------- 1 0,0 2,5 1,25 0 0,0000 2 2,5 5,0 3,75 6 0,0153 3 5,0 7,5 6,25 65 0,1662 4 7,5 10,0 8,75 126 0,3223 5 10,0 12,5 11,25 64 0,1637 6 12,5 15,0 13,75 62 0,1586 7 15,0 17,5 16,25 36 0,0921 8 17,5 20,0 18,75 26 0,0665 9 20,0 22,5 21,25 4 0,0102 10 22,5 25,0 23,75 2 0,0051 -------------------------------------------------------------Total 391 1,0000


Histograma

0 5 10 15 20 25

consumo

0

30

60

90

120

150


Histogramas para coches

0 2 4 6 8(X 1000)

cilindrada

0

20

40

60

80

100

120

potencia0 40 80 120 160 200 240

0

30

60

90

120

150

peso0 0,4 0,8 1,2 1,6 2

(X 1000)

0

20

40

60

80

aceleracion7 11 15 19 23 27

0

20

40

60

80


Medidas de centro

n

xxxx

xxx

n

n

+++=

L21

21

aritmética Media

,...,,

xxx

xxx

nxxxxx

ixix

GH

n

Hn

nG

ii

≤≤

+++==

>>

111

) todopara0 (si

armónica Media

) todopara0 (si

geométrica Media

21

21

LL


Medidas de dispersión

2

n

12

21

: Varianza

)(

Típica Desviación

,...,,

s

n

xxs

xxx

i i

n

∑ =−

=

90 95 100 105 110

90 95 100 105 110

s = 2

s = 5.4

Media 100


Densidad de la tierra (Cavendish, 1798)

5,5 5,47 5,55 5,75 5,29 5,275,57 4,88 5,34 5,29 5,34 5,855,42 5,62 5,3 5,1 5,26 5,655,61 5,63 5,36 5,86 5,44 5,395,53 4,07 5,79 5,58 5,46

densidad

Media = 5.42 Desv. Típ. = 0.338

4 4,4 4,8 5,2 5,6 6


Desigualdad de Chebychev

2

11)|(|

kksxxfr i −>≤−

235 240 245 250 255

xskx ×− skx ×+

22

22

222

2

22

12

2

11)|(|

1)|(|

)|(|

)(

)()()(

kksxxfr

kksxxfr

skksxxfrn

sk

n

xx

s

n

xx

n

xx

n

xxs

ii

iksxxksxx

i

ksxxi

ksxxin

i i

ii

ii

−>≤−⇔≤>−

>−=>−

≥

−+

−=

−=

∑∑

∑∑∑

>−>−

>−≤−=


Mediana y Cuartiles

12

1

QQ

Cuartiles

par :22

impar:2

1

Mediana

ordenados Datos

,...,,

)(3)(1

)1()(

)(

)()2()1(

21

+−=

+

=

==

=+

+=

≤≤≤

+

rnsp

r

xx

nn

pxx

nn

px

xxx

xxx

sr

pp

p

n

n

L


Mediana y Cuartiles

750250

QQ

Cuartiles

500

)( :Mediana

,...,,

31

31

21

.)Qfr(x.)Qfr(x

.Med)fr(x

Med

xxx

ii

i

n

=≤=≤

=≤

235 240 245 250 255

25% 25%

50%

Q1 Med Q3


Medidas característicasConsumo Cilindrada Potencia Peso Aceleración

Media 11.2 3181.2 104.2 990.7 15.7Desv. Típica 3.9 1714.6 38.3 281.9 2.8

Primer Cuartil 8 1721 75 741.5 14Mediana 10 2474 93 933 16

Tercer Cuartil 13.5 4334 125 1203.5 17Rango Intercuartílico 5.5 2613 50 462 3


Diagrama de caja

0 4 8 12 16 20 24

consumo

Q1 Q2 Q3

LI = Q1 -1.5 RI LS = Q3+1.5 RI

RI = Q3 - Q1

Min {xi : xi ≥ LI}Max {xi : xi ≤ LS}

atípicos


Densidad de la tierra (Cavendish, 1798)5,5 5,47 5,55 5,75 5,29 5,275,57 4,88 5,34 5,29 5,34 5,855,42 5,62 5,3 5,1 5,26 5,655,61 5,63 5,36 5,86 5,44 5,395,53 4,07 5,79 5,58 5,46

4 4,4 4,8 5,2 5,6 6

densidadMedia = 5.42 Desv. Típ. = 0.338


Diagrama de caja múltiple

0 4 8 12 16 20 24

consumo

EEUU

Europa

Japón


Diagrama de caja múltiple

EEUU

Europa

Japón

500 800 1100 1400 1700 2000

peso


Consumo según año de fabricación

70717273747576777879808182

0 4 8 12 16 20 24

consumo


Diagrama de Caja Múltiple

0 4 8 12 16 20 24

OCDE

Europa Oriental

Asia/Pacífico

África

Oriente Medio

America Latina

EEUU

Japón

Grecia

Barbados

Gabón

Producto interior bruto per capitaX1000


Diagrama de tallos y hojas

LO|4,07

1 4| 1 4| 1 4| 1 4| 2 4|8 3 5|1 12 5|222233333 (9) 5|444455555 8 5|666677 2 5|88

• Media 5,419• Des. Típica 0,339• Mínimo 4,07• Máximo 5,86• Cuartil 1 5.3• Mediana 5.46• Cuartil 3 5.61


Medidas características de forma(asimetría y curtosis)

n

xxm

n

xa

n

ik

ik

n

iki

k∑∑ == −

== 11)(

media la a respecto

Momentos

origen al respecto

Momento

4

4

44

3

3

33

)()(

toapuntamien

o curtosis de eCoeficient

asimetría de

eCoeficient

ns

xx

s

mC

ns

xx

s

mC

i

AP

i

AS

∑∑ −=

=

−=

=


Modelo ideal

frec

uenc

ia

230 235 240 245 250 255 2600

200

400

600

800

1000

CAS = 0 CAP = 3

0 100 200 300 400 500 600 700

0

5

10

15

20

25

30

220 230 240 250 260 270 280

0

5

10

15

20

25

30

CAS > 0 CAP < 3


Transformaciones de datos

cambia) no curtosisy (Asimetría

cambia noón distribuci la de "" La forma

sbs

xbay

bxay

xy

ii

=

+=+=

• Transformaciones Lineales

• Transformaciones no-lineales

cambian) curtosisy asimetría de tes(coeficien

óndistribuci la de "" la Cambia

)(

)(

forma

xhy

xhy ii

≠=


X-10 10 30 50 70

0

40

80

120

160

200

240

Y0 1 2 3 4 5 6

0

30

60

90

120

150

ii xy log=

Efecto de la transformación de datos


Transformaciones Box-Cox

-1,5

-1

-0,5

0

0,5

1

1,5

ii

pi

i

xyp

p

xy

log0

1

=⇒=

−=


Datos

knkn

k

k

k

xxxn

xxx

xxx

YYY

L

MOMMM

L

L

L

21

22212

12111

21

2

1

Variables

Ob

serv

a cio

nes x1

x2

xn

M


Vector de Medias

==

=∑ =

n

n

i

ki

i

i

x

x

x

n

x

x

x

MM2

1

12

1

;i

i

xxx


Covarianza

500 800 1100 1400 1700 2000

peso

0

4

8

12

16

20

24

cons

umo

nn y

y

x

x

n

yx

ConsumoPesoCoche

MMM

22

1121

n

yyxxs

n

i iixy

∑ =−−

= 1))((


Matriz de Varianzas

( )

=

−−−−−

−−−−−−−−−−

=

−−−

−

−−

=

∑

∑

=

=

221

22212

11221

12

2211

222

222211

1122112

11

22111

22

11

2

)())(())((

))(()())((

))(())(()(

1

1

kkk

k

k

n

i

kkikkiikkii

kkiiiii

kkiiiii

kkiii

n

i

kki

i

i

sss

sss

sss

xxxxxxxxxx

xxxxxxxxxx

xxxxxxxxxx

n

xxxxxx

xx

xx

xx

n

L

MOMM

L

L

L

MOMM

L

L

LM

S


Gráficos de dispersión: ejemplo coches

consumo

cilindrada

potencia

peso

aceleracion


Matriz de varianzas: ejemplo coches

−−−−−−

−−

=

6,70,3285,734,597.20,5

0,3285,949.78,312.90,461.4515,971

5,738,312.92,465.14,965.583,127

4,597.20,461.4514,965.58694,24,824.5

0,55,9713,1274,824.52,15

E

S

consumo c.c. pot. peso acel.


Propiedades de S2

01~

~~1)~~1

(

0,

: es

~~1

~

12

2211

2222112

1221111

≥==⇒=

==

≥ℜ∈∀

=

−−−

−−−−−−

=

∑ =

n

v

n

nn

positivadasemidefini

n

xxxxxx

xxxxxx

xxxxxx

n

i i

k

kknnn

kk

kk

vvwSww,Xv

w)X(w)X(wXXwwSw

wSww

S

XXS

X

T2T

TTT2T

2T

2

T2

L

MOMM

L

L

Cuadrada k x k

Simétrica

Semidef. positiva


Correlación

500 800 1100 1400 1700 2000

peso

0

4

8

12

16

20

24

cons

umo

nn y

y

x

x

n

yx

VarVarObs

MMM22

1121

21. −−

∑∑∑

==

=

−−

−−==

n

i in

i i

n

i ii

yx

xyxy

yyxx

yyxx

ss

sr

12

12

1

)()(

))((

• Adimensional

• -1 ≤ rxy ≤ +1

• |rxy| = 1 ⇔ yi = a + b xi


Matriz de correlacionesejemplo coches

−−−−−−−−

=

1422,0696,0549,0466,0

422,01863,0934,0885,0

696,0863,01898,0854,0

549,0934,0898,01873,0

466,0885,0854,0873,01

R

consumo c.c. pot. peso Acel.

Las variables están muy correlacionadas


Transformaciones Lineales

aSaa)x)(xx(x

a

a)xa)(xxax(a

xax(axa

xa

2TT

iiT

TTi

Ti

T

TiT

iT

iT

=

−−=

−−=

−−=

−=

====

=

=+++=

∑

∑∑∑

∑∑∑

=

===

===

n

nn

yyyy

n

yys

n

)

nn

yy

x

x

x

aaaxaxaxay

n

i

n

i

n

i iin

i iy

n

i

n

i

n

i i

ki

i

i

kkikiii

1

1112

2

111

2

1

212211

))(()(

)(M

LL


Transformaciones lineales II

T2X

TiiTTTT

ii

ii2Y

iii

ii

AAS

Axxxx

AAxAxxAAx

yyyyS

xAxAAxy

y

Axy

=

−−=

−−=

−−=

====

=+++=

+++=+++=

∑∑

∑

∑∑∑

==

=

===

nn

n

nnn

xaxaxay

xaxaxay

xaxaxay

n

iTn

i

n

iT

n

i

n

i

n

i

kimkimimmi

kimkiii

kikiii

11

1

111

2211

2221212

12121111

))(())((

))((

)(

L

M

L

L

=

ki

i

i

mkmm

k

k

mi

i

i

x

x

x

aaa

aaa

aaa

y

y

y

M

L

MOMM

L

L

M2

1

21

22221

11211

2

1

SX2

Capítulo 1. Descriptiva

1.1 En un departamento cuatro profesores imparten clases en grupos con 10, 18, 22 y 150 alumnosrespectivamente. Si se pregunta a los profesores por el tamaño de su clase ¿cuál sería el valor medioy la desviación típica obtenida? ¿Y si se pregunta a todos los alumnos del departamento?

1.2 ¿Es posible que la varianza de una variable x sea 4, la de y sea 9 y la de z = x + y sea igual a 2?Justificar la respuesta.

1.3 Demostrar que al multiplicar x por k1 e y por k2, el coeficiente de correlación entre ambas no varía(k1 y k2 deben tener el mismo signo).

1.4 Demostrar que si entre dos variables existe una relación exacta y = a+ bx, con b > 0, el coeficientede correlación es uno.

1.5 Demostrar que el coeficiente de correlación es siempre en valor absoluto menor que uno.

1.6 En un proceso de fabricación se han medido tres variables y calculado la matriz de varianzas con elresultado siguiente:

2 3 13 4 21 2 2

¿Podemos afirmar que hay un error en los cálculos? ¿Por qué?

1.7 A la variable x de media x = 100 se le ha aplicado una transformación con el logaritmo decimalobteniéndose la nueva variable y = log10(x). La media de la nueva variable es y = 2.5. ¿Es posibleeste resultado?

1.8 En la figura se presenta el diagrama de tallos y hojas de los residuos obtenidos de un diseño factorial.Representa el diagrama de caja (box plot) de los datos. (Nota.- La rama -6|91 representa los valores-0.69 y -0.61).

2 -6 | 912 -5 |4 -4 | 0010 -3 | 76632018 -2 | 9875431029 -1 | 98654321100

(16) -0 | 997766655443321136 0 | 01556667727 1 | 233347820 2 | 13478914 3 | 234556996 4 | 011355

1

.

2. Probabilidad

Curso 2004 - 2005

Estadística

Probabilidad. 2

Experimento Aleatorio

EL término “experimento aleatorio” se utiliza en la teoría de la probabilidad para referirse a un proceso cuyo resultado no es conocido de antemano con certeza.

“Suma de valores en el lanzamiento de 2 dados.”

Probabilidad. 3

Variable AleatoriaUna variable aleatoria es una función que asigna un número real a cada uno de los resultados de un experimento aleatorio.

Lanzamiento de 2 monedas

X(s) ≡Número de CARAS

s X(s)

CC→ 2

CX → 1

XC → 1

XX → 0

Probabilidad. 4

Variable Aleatoria Discreta

Cuando los valores que toma una variable aleatoria son finitos o infinitos numerablesse dice que es discreta.– Resultado obtenido al lanzar un dado

{1,2,3,4,5,6}

– Número de veces que hay que lanzar una moneda hasta obtener una CARA

{1,2,3,4, ...}

Probabilidad. 5

Distribución de probabilidadSea { x1 , x2 , ..., xn } los valores que puede tomar la variable aleatoria X. Se denomina distribución de probabilidad de la variable aleatoria a P( X=xi ) que cumple:

• P ( X = xi ) ≥ 0

• Σi=1 P ( X = xi ) = 1.

x P(X=x)

0 → 1/4

1 → 1/2

2 → 1/4

Nº de Caras al lanzar 2 monedas

Probabilidad. 6

Distribución de probabilidad

p(X)

x

1/2

1/4

30 1 2

Nº de Caras al lanzar 2 monedas

Probabilidad. 7

Lanzamiento de un dado

x5

P (X = x)

1/6

1 36/16

6/15

6/14

6/13

6/12

6/11

)( xXPx =

2 4 6

Probabilidad. 8

Función de distribución

x FX ( x )

(-∞,0) 0

[0,1) 1/4

[1,2) 3/4

[2,∞) 1

La función de distribución FX ( x ) de una variable aleatoria X se define para todo número real x como:

FX ( x ) = PX ( X ≤ x ).

Ejemplo. X = Número de caras al lanzar 2 monedas

F(x)

x30 1 2

1/4

1/2

3/4

1

Probabilidad. 9

Función de Distribución

Distribución puntual de probabilidad

x

x

30 1 2

1/4

1/2

3/4

1

1/2

1/4

30 1 2

Probabilidad. 10

F(x)

x

p(x)

x

1

1 3 5

5

1/6

1 3

2 4 6

2 4 6

Lanzamiento de un dado

6/16

6/15

6/14

6/13

6/12

6/11

)( xXPx =

Probabilidad. 11

Una función F(x) es una función de distribuciónsi y sólo si cumple las siguientes condiciones:

).()(,0

:derecha lapor continua es c.

e.decrecient nofunción una es b.

.1)(y0)(.a

0xFhxFlimh

F(x)

F(x)

xFlimxFlim

h

xx

=+>∀

==

→

+∞→−∞→

Probabilidad. 12

Variable aleatoria continuaUna variable aleatoria X es continua si su función de distribución FX ( x ) es continua.

F(x)

x0 0,5 1 1,5

1

3/4

1/2

1/4

FX ( x ) = x, x ∈ [0,1)

0

0.25

0.50

0.75

x

Probabilidad. 13

Función de densidadLa función de densidad de probabilidad fX(x)de una variable aleatoria continua X es la función que verifica

Si FX(x) es derivable, además

.,)()( xdttfxFx

XX ∀= ∫ ∞−

).()( xfxFdxd

XX =

Probabilidad. 14

F(x)

x

f(x)

x1.5

0 0.5 1

0 0.5 1 1.5

1

3/4

1/2

1/4

Función de distribución

FX(x) = x, x∈[0,1)

Función de densidad

fX(x) = 1, x∈[0,1]1

Probabilidad. 15

Una función fX (x) es una función de densidadde probabilidad de una variable aleatoria X si y sólo si cumple:

.1)( b.

. todopara 0)( a.

=

≥

∫∞

∞dxxf

xxf

- X

X

Área = 1

Probabilidad. 16

Cálculo de probabilidades

a b

∫=

−=≤≤b

a X

XX

dxxf

aFbFbXaP

)(

)()()(

∫b

a X dxxf )(

)(xf X

Probabilidad. 17

EsperanzaSe define esperanza o media de una variable

aleatoria discreta X y se representa por E[X] al valor

5.361

661

561

461

361

261

1][

dadoun de oLanzamient :Ejemplo

=×+×+×+×+×+×=XE

∑=

==n

iii xXPxXE

1

).(][

x5

1/6

1 3

3.5

Centro de la distribución de probabilidad

Probabilidad. 18x

1,5

0 0,5 1

1

EsperanzaSe define esperanza o media de una variable aleatoria continua X con función de densidad fX(x) y se representa por E[X] al valor

.21

21][

101uniformeón Distribuci :Ejemplo1

0

1

0

2

==×=

≤≤=

∫x

dxxXE

x, (x) f X

∫∞

∞−

= .)(][ dxxfxXE X

Centro de la distribución de probabilidad

Probabilidad. 19

Propiedades de E[X]

• Transformaciones lineales Y = a X+b (a y b constantes)

bXaEbaXE +=+ ][][

Probabilidad. 20

Varianza

Sea X una variable aleatoria con media µ, se denomina varianza a

Var ( X ) = E[ ( X - µ )2 ].

•Variable aleatoria discreta

•Variable aleatoria continua

∑∞

−∞=

=−=x

xXPxXVar ).()(][ 2µ

dxxfxXVar X )()(][ 2∫∞

∞−−= µ

Probabilidad. 21

Propiedades de la varianza

.][

])[()(.122

2

µ

µ

−=

−=

XE

XEXVar

)()(.2 2 XVarabaXVar =+

Probabilidad. 22

Ejemplos

.121

41

3

)2/1(1Var[X]

uniformeón Distribuci

.1235

)5.3()61

661

561

461

361

261

1(][

dadoun deoLanzamient

1

0

3

1

0

22

2222222

=−=

−×=

=

−×+×+×+×+×+×=

∫

x

dxx

XVar

Probabilidad. 23

Desigualdad de Tchebychev

µ µ + k σµ - k σ

2

11

kArea −≥

.1

1)(

][][

aleatoria variablecualquier Para

2

2

kkXP

XVarXE

−>≤−

==

σµ

σµ

Probabilidad. 24

Momentos de una V.A.

][

...

][

][

Origen al respecto Momentos

22

1

pp XE

XE

XE

=

=

==

µ

µ

µµ

])[(

...

])[(

0)][(

media la a respecto Momentos

222

1

pp XE

XE

XE

µα

σµα

µα

−=

=−=

=−=

Distribución conjunta de variables aleatorias

Probabilidad. 26

Definiciones (v. a. discretas)

• Distribución de probabilidad conjunta de dos variables aleatorias X, Y

• Función de distribución conjunta:

===

∀≥==== ∑ ∑

∞=

−∞=

∞=

−∞=

x

x

y

yyYxXP

yxyYxXP

yYxXP .1),(

,,0),(

),(

),(),( yYxXPyxFXY ≤≤=

Probabilidad. 27

Lanzamiento de dos dados

1 2 3 4 5 61 1/36 1/36 1/36 1/36 1/36 1/362 1/36 1/36 1/36 1/36 1/36 1/363 1/36 1/36 1/36 1/36 1/36 1/364 1/36 1/36 1/36 1/36 1/36 1/365 1/36 1/36 1/36 1/36 1/36 1/366 1/36 1/36 1/36 1/36 1/36 1/36

Dado AZUL

Dado ROJO

X = “ Resultado de dado ROJO”

Y = “ Resultado de dado AZUL”

Distribución conjunta de probabilidad

P ( X=i , Y=j ) =1/36, (i,j de 1 a 6)

Probabilidad. 28

Ejemplo

S : SUMA DE DOS DADOS2 3 4 5 6 7 8 9 10 11 12

0 1/36 1/36 1/36 1/36 1/36 1/361 1/18 1/18 1/18 1/18 1/18

D : DIFERENCIA 2 1/18 1/18 1/18 1/18DE DOS DADOS 3 1/18 1/18 1/18

4 1/18 1/185 1/18

Ejemplo: Se lanzan dos dados y se definen las variables aleatorias suma (S) y valor absoluto de la diferencia (D) de los resultados.

Distribución Conjunta P(S= x, D= y)

Probabilidad. 29

Distribuciones Marginales

S : SUMA DE DOS DADOS2 3 4 5 6 7 8 9 10 11 12

0 1/36 1/36 1/36 1/36 1/36 1/36 6/361 1/18 1/18 1/18 1/18 1/18 10/36

D : DIFERENCIA 2 1/18 1/18 1/18 1/18 8/36DE DOS DADOS 3 1/18 1/18 1/18 6/36

4 1/18 1/18 4/365 1/18 2/36

1/36 2/36 3/36 4/36 5/36 6/36 5/36 4/36 3/36 2/36 1/36

Marginal de S Marginal de D

Probabilidad. 30

Distribuciones marginales

∑

∑

∞=

−∞=

∞=

−∞=

====

====

x

x

y

y

yYxXPyYP

yYxXPxXP

),()(

),()(

00,020,040,060,080,1

0,120,140,160,18

1 2 3 4 5 6 7 8 9 10 11 12 13

Suma de dos dados

Probabilidad. 31

Distribuciones condicionadasS : SUMA DE DOS DADOS

2 3 4 5 6 7 8 9 10 11 12 0 1/36 1/36 1/36 1/36 1/36 1/36 6/361 1/18 1/18 1/18 1/18 1/18 10/36

D : DIFERENCIA 2 1/18 1/18 1/18 1/18 8/36DE DOS DADOS 3 1/18 1/18 1/18 6/36

4 1/18 1/18 4/365 1/18 2/36 1/36 2/36 3/36 4/36 5/36 6/36 5/36 4/36 3/36 2/36 1/36

D | S = 8

0 1/51 02 2/53 04 2/55 0

1

Distribución de la diferencia entre los dados condicionada a que la suma es 8.

P(D = y | S=8) = P(D=y, S=8) / P(S=8)

Probabilidad. 32

Independencia

P(X=i, Y=j) = P( X= i ) × P( Y= j )

Dado ROJO

1 2 3 4 5 61 1/36 1/36 1/36 1/36 1/36 1/362 1/36 1/36 1/36 1/36 1/36 1/363 1/36 1/36 1/36 1/36 1/36 1/364 1/36 1/36 1/36 1/36 1/36 1/365 1/36 1/36 1/36 1/36 1/36 1/366 1/36 1/36 1/36 1/36 1/36 1/36

Dado AZUL

si sóloy sintesindependieson aleatorias variables Las X, Y

Probabilidad. 33

Variables aleatorias continuas

:cumple que

conjunta, densidad defunción la),( Siendo

),(),(

yxf

dydxyxfdYcbXaP

XY

dc

ba XY∫ ∫=≤≤≤≤

1),()2

,,0),()1

=

∀≥

∫ ∫∞∞−

∞∞− dydxyxf

yxyxf

XY

XY

Probabilidad. 34

Variables aleatorias continuas

• Función de distribución

• Funciones de densidad marginales

∫ ∫∞− ∞−= x yXYXY dvduvufyxF ),(),(

∫

∫∞∞−

∞∞−

=

=

dxyxfyf

dyyxfxf

XYY

XYX

),()(

),()(

Probabilidad. 35

Las variables aleatorias X, Y tienen como función de densidad conjunta

10,10,6),( 2 <<<<= yxxyyxf XY

10,36)(

10,26)(

Marginales.3

.5

16

6)1(.2

6),(.1

21

02

1

02

1

0

1

02

1

2

320 0

2

<<==

<<==

==

=≤+

==≤≤

∫

∫

∫ ∫

∫∫∫ ∫

−

≤+

yydxxyyf

xxdyxyxf

dxdyxy

dxdyxyYXP

yxdudvuvyYxXP

Y

X

y

yx

x y

y

x = 1-y

Probabilidad. 36

Independencia

.

si sóloy si ntesindependieson aleatorias variablesLas

(y)(x)ff(x,y)f

X, Y

YXXY =

<<=

<<=⇒<<<<=

10,3)(

10,2)(

10,10,6),(.12

2

yyyf

xxxf

yxxyyxf

Y

X

XY

Independientes

<<−==

<<==⇒≤≤≤=

∫

∫

10),log(1

)(

10,11

)(10,

1),(.2

1

0

yydxx

yf

xdyx

xfxy

xyxf

yY

xX

XY

No independientesy

x0 1

1

Probabilidad. 37

Funciones de densidad condicionadas

0)( cuando,)(

),()|(

.0)( cuando,)(

),()|(

|

|

>=

>=

xfxf

yxfxyf

yfyf

yxfyxf

XX

XYXY

YY

XYYX

Probabilidad. 38

Independencia -II

(y)fx)(yf

(x)fy)(xf

X, Y

YXY

XYX

=

=

|

|

si sóloy si ntesindependieson aleatorias variablesLas

|

|

⇒<<==

<<=

<<=⇒<<<<=

10,23

6)|(

10,3)(

10,2)(

10,10,6),(.1

2

2

|

2

2

xxx

xyyxf

yyyf

xxxf

yxxyyxf

YX

Y

X

XY

Independientes

xyx

xyf

xyyx

yxf

yydxx

yf

xdyx

xfxy

xyxf

XY

YX

yY

x

X

XY

≤≤=

≤≤−=

<<−==

<<==⇒≤≤≤=

∫

∫

0,1

)|(

1,)log(

1)|(

10),log(1

)(

10,11

)(10,

1),(.2

|

|

1

0

No independientes

Probabilidad. 39

Covarianza

( ).

,

E[Y]µE[X]µ

dxdyyxf)µ)(yµ(x

)]µ)(Yµ E[(XCov(X,Y)

Cov(X,Y)

X, Y

YX

YX

YX

==

−−=

−−=

∫ ∫∞∞−

∞∞−

y donde

:como define se y por denota se, aleatorias variables dos decovarianza La

∑∑ ==−−=−−=

i jjiYjXi

YX

yYxX)Pµ)(yµ(x

)]µ)(Yµ E[(XCov(X,Y)

),(

:discretas son sv.a' las Si

Probabilidad. 40

Propiedades de la covarianza

Propiedades

• Cov(X,Y)=E[XY] - E[X]E[Y]

•Var (X+Y) = Var(X) + Var(Y) + 2 Cov(X,Y)

La covarianza es una medida de la dependencia lineal entre las dos variables. Si las variables son independientes, Cov(X,Y)=0

( )

( )

( ) 0)(

()

,

=−−=

−−=

−−=

∫ ∫

∫ ∫

∫ ∫

∞∞−

∞∞−

∞∞−

∞∞−

∞∞−

∞∞−

dyy)fµ(ydxx)fµ(x

dxdyyfx)fµ)(yµ(x

dxdyyxf)µ)(yµ(x Cov(X,Y)

YYXX

YXYX

YX

Probabilidad. 41

Medias y Matriz de Varianzas

=

=

=

2

2

][

varianzasde Matriz

][

medias deVector

; aleatorioVector

YXY

XYX

Y

X

UVar

UE

Y

X

σσσσ

µµ

U

X, Y dos variables aleatorias con función de densidad conjunta f (x,y)

),(

][],[)(:

][],[)(:2

2

YXCov

YVarYEyfY

XVarXExfX

XY

YYY

XXX

===→

==→

σσµ

σµ

Probabilidad. 42

Correlación

.)()(

),(

como aleatorias

variablesdos entre n correlació de ecoeficient define Se

YVarXVar

YXCov (X,Y)

X, Y

=ρ

ρ

Propiedades

• -1 ≤ ρ(X,Y) ≤ +1

• Si X e Y son independientes, entonces ρ(X,Y) = 0.

• Y = a + b X ⇔ ρ(X,Y) = 1 (b>0) o ρ(X,Y) = -1 (b<0)

Probabilidad. 43

n variables aleatorias

)x,x(xf nX ,...,21

Para hacer cálculo de probabilidades de un suceso en el que intervenga las variables aleatorias X1, X2, ..., Xn es preciso conocer la distribución de probabilidad conjunta.

Si las variables son continuas se emplea la función de densidad conjunta

=

nX

X

X

M2

1

X

n

x x x

nn

n

dtdtdttttfxxxF

xxxFn n

LL 212121

21

1 1

),...,,(),...,,(

).,...,,( conjuntaón distribuci defunción la o

∫ ∫ ∫∞− ∞− ∞−

−= XX

X

Probabilidad. 44

Vector de Medias y Matriz de Varianzas

≠==

→

=

=

==

→

=

→=

jiXXCov

XVarVar

XE

XE

XE

E

nXXX

ijji

ii

nnn

n

n

nnn

Tn

σσ

σσσ

σσσσσσ

µ

µµ

µ

µµ

),(

)(][

][

][

][

][

aleatoriasvariablesdeVector ,),...,,(

2

221

22212

11221

22

11

2

1

21

L

MOMM

L

L

MM

X

X

X

Probabilidad. 45

Independencia

.,...,

si sóloy si

ntesindependieson ,..., aleatorias variablesLas

221121

21

)(xf)(x)f(xf)x,xf(x

X,XX

nnn

n

L=

Modelos Univariantes

Probabilidad. 47

Proceso de Bernoulli

El resultado de un experimento admite dos categorías: “Aceptable” y “Defectuoso”. – Se repite el experimento n veces.

– La probabilidad de “defectuoso” es la misma p

en todos los experimentos.

– Los experimentos son independientes.

Probabilidad. 48

Ejemplos de procesos de Bernoulli

• Lanzamiento de n monedas. Resultado: cara o cruz.

• Se extraen piezas al azar de un sistema continuo de fabricación. Se clasifican las piezas en aceptables o no.

• Lanzamiento de un dado n veces. En cada lanzamiento se clasifica como 6 o distinto de 6.

Probabilidad. 49

Distribución Binomial (n,p)

X = “ Nº de defectuosas al extraer n piezas”

Proporción defectuosas = p

n

Probabilidad. 50

Distribución de probabilidad binomial (n,p)n=10

↓

64 )1( pp −

4

10

64 )1(4

10)4( ppXP −

==

Probabilidad. 51

Distribución de probabilidad binomial (n,p)

nkppk

nkXP knk ,...,2,1,0,)1()( =−

== −

x0 1 2 3 4 5 6 7 8 9 10

0

0,1

0,2

0,3

0,4

n =10, p=0.2

∑=

− =−

∀≥=n

0k

.1)1( (2)

.0)1(

knk ppk

n

k, k)P(X

Probabilidad. 52

Propiedades de la dist. binomial

)1(][][][

.)(][

22

0

pnpXEXEXVar

npkXPkXEn

k

−=−=

==×= ∑=

0 20 40 60 80 1000

0,02

0,04

0,06

0,08

50

5

n = 100, p = 0.5

Probabilidad. 53

Distribuciones binomiales

0 5 10 15 20 250

0,04

0,08

0,12

0,16

0 5 10 15 20 250

0,04

0,08

0,12

0,16

0,2

0 20 40 60 80 1000

0,02

0,04

0,06

0,08

0,1

0 20 40 60 80 1000

0,02

0,04

0,06

0,08

n = 25, p = 0.5 n = 25, p = 0.2

n = 100 , p = 0.5 n = 100, p = 0.2

12.5

2.5

5

2

50

5

20

4

Probabilidad. 54

EjemploUn contrato estipula la compra de componentes en lotes grandes que deben contener un máximo de 10% de piezas con algún defecto. Para comprobar la calidad se toman 11 unidades y se acepta el lote si hay como máximo 2 piezas defectuosas. ¿Es un buen procedimiento de control?

45.0617.0779.0910.0985.0)(

%25%20%15%10%5

)1(2

11)1(

1

11)1(

0

11

2) P(X P(Aceptar)

muestra laen sdefectuosa de Número X

lote,un en piezas de proporción la Sea

92101110

AceptarP

p

pppppp

p

−

+−

+−

=

≤=≡

Probabilidad. 55

Distribución Geométrica (p)

Y = “Piezas extraídas hasta que aparezca una defectuosa”

nY

Proporción defectuosas = p

Probabilidad. 56

Distribución de probabilidad geométrica (p)

,...3,2,1,)1()( 1 =−== − kppkXP k

123

↓... k

p(1-p)p(1-p)2p

↓(1-p)k-1p

Probabilidad. 57

Propiedades de la v.a. geométrica

0 4 8 12 16 200

0,05

0,1

0,15

0,2

0,25

0,3

p=0.3

2

1][,

1][

p

pYVar

pYE

−==

Probabilidad. 58

Distribución de Poisson• Número de defectos aparecidos en tramos de

longitud fija de hilos de cobre.

• Número de partículas por centímetro cúbico en líquidos con sustancias en suspensión.

• Emisiones radiactivas: número de partículas emitidas en intervalos de tiempo fijo.

• Número de llamadas a una centralita de teléfonos en un día

Probabilidad. 59

Distribución de Poisson

Ejemplo: Fabricación continua de conductor de cobre.

λ ≡ Número medio de defectos cada 100 m

X ≡ Número de defectos en un tramo de 100 m

Probabilidad. 60

Límite de la dist. binomial

,...2,1,0,!

11)1()1(

!

1!)!(

!)(

,)1()(

==

−

−+−−=

−

−=

=−−

=

−

−

∞→

−

∞→

xex

nnn

xnnnlim

x

nnxxnn

limxP

npxnpxp

x

nxXP

x

xn

xn

x

xnx

nX

λλ

λλλ

λλ

λ

L

1→λ−→ e 1→

Probabilidad. 61

Distribución de Poisson

,..2,1,0,!

)( === − xex

xXPx

λλ

0,0000E+00

5,0000E-02

1,0000E-01

1,5000E-01

2,0000E-01

2,5000E-01

0 2 4 6 8 10 12 14 16

λ=3

Probabilidad. 62

Media y Varianza

λλ

λλλ

λλ

λ

λ

λλ

λ

==

=−

=

×=×=

===

∑

∑∑

∞

=

−−

−∞

=

−∞

=

−

][][

)!1(

!!][

,...2,1,0,!

)(

1

1

10

XVarXE

xe

ex

xex

xXE

xex

xXP

x

x

x

x

x

x

x

eλ

Probabilidad. 63

EjemploUna fuente radiactiva emite partículas según la

distribución de Poisson de media 10 partículas por minuto. Se desea calcular:

• Probabilidad de 5 partículas en un minuto

• Probabilidad de 0 partículas en un minuto

• Probabilidad de más de 5 partículas en un minuto.

• Probabilidad de al menos 30 partículas en 5 minutos.

Probabilidad. 64

Ejemplo Poisson

0016.0!

50)30(

50105'

minutos 5en partículas deNº.4

.933.0!

101

)5(1)5(.3

.1554.4)0(.2

0378.0!5

10)5(.1

30

0

50

5

0

10

10

510

==≤

=×=≡

=−=

≤−=>−===

===

∑

∑

=

−

=

−

−

−

x

x

x

x

xeYP

Y

xe

XPXP

EeXP

eXP

λ

Probabilidad. 65

Poisson de media 10

0,0000E+00

2,0000E-02

4,0000E-02

6,0000E-02

8,0000E-02

1,0000E-01

1,2000E-01

1,4000E-01

0 5 10 15 20 25

Probabilidad. 66

Distribución Exponencial

Ejemplo: Fabricación continua de conductor de cobre.

λ ≡ Número medio de defectos cada 100 m

T ≡ “Distancia entre dos defectos consecutivos”

t1 t2 t3 t4 t6t5 t7

T

Probabilidad. 67

Distribución ExponencialT≥ t

0 t

{ }

.0,)(

0,1

)()(

0,

t)[0, intervalo elen defectos 0 )(

≥=

≥−=

≤=≥=

=≥

−

−

−

tetf

te

tTPtF

te

PtTP

tT

t

T

t

λ

λ

λ

λ

Probabilidad. 68

Propiedades (Exponencial)

0 10 20 30 40 50 60

T

0

0,02

0,04

0,06

0,08

0,1

Fun

ción

de

dens

idad .0,)( ≥= − tetf tT

λλ

λ = 0.1

.111

][][][)(][

2202

0

22

λλλ

λλ λλ =−===

−==

∫∫∫

∞ −∞ −

∞

∞−

dtetdtte

TETETVardttftTE

tt

T

Probabilidad. 69

Distribución Normal Campana de Gauss

ℜ∈

−

−= xx

xf X ,2

1exp

2

1)(

2

σµ

σπ

µ

σ

Probabilidad. 70

Medidas Características

µ

σ

3])[(

0])[(

3])[(0])[(

][][

4

4

3

3

443

2

=−

===−

==

=−=−

==

σµ

σµ

σµµ

σµ

XECurtosisCAp

XEAsimetríaCA

XEXE

XVarXE

),( σµNX →

Probabilidad. 71

µ

σ

µ + σµ - σ

µ - 2σ µ +2σ µ - 3σ µ +3σ

0.68

0.955 0.997

Probabilidad. 72

Normal Estándar

dtezzezfz tz

Z ∫ ∞−−− =Φℜ∈= 2/2/ 22

2

1)(,

2

1)(

ππ

0

1)1,0(NZ →

TABLAS

Probabilidad. 73

Estandarización

).()()()(

)1,0(),(

σµ

σµ

σµ

σµ

σµσµ

−Φ=

−≤=

−≤

−=≤

→−

=⇒→

aaZP

aXPaXP

NX

ZNX

z = (a-µ)/σ

N(0,1)

)( zZP ≤

a

N(µ,σ)

)( aXP ≤

µ

Probabilidad. 74

0 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,090,0 .5000 .5040 .5080 .5120 .5160 .5199 .5239 .5279 .5319 .53590,1 .5398 .5438 .5478 .5517 .5557 .5596 .5636 .5675 .5714 .57530,2 .5793 .5832 .5871 .5910 .5948 .5987 .6026 .6064 .6103 .61410,3 .6179 .6217 .6255 .6293 .6331 .6368 .6406 .6443 .6480 .65170,4 .6554 .6591 .6628 .6664 .6700 .6736 .6772 .6808 .6844 .68790,5 .6915 .6950 .6985 .7019 .7054 .7088 .7123 .7157 .7190 .72240,6 .7257 .7291 .7324 .7357 .7389 .7422 .7454 .7486 .7517 .75490,7 .7580 .7611 .7642 .7673 .7704 .7734 .7764 .7794 .7823 .78520,8 .7881 .7910 .7939 .7967 .7995 .8023 .8051 .8078 .8106 .81330,9 .8159 .8186 .8212 .8238 .8264 .8289 .8315 .8340 .8365 .83891,0 .8413 .8438 .8461 .8485 .8508 .8531 .8554 .8577 .8599 .86211,1 .8643 .8665 .8686 .8708 .8729 .8749 .8770 .8790 .8810 .88301,2 .8849 .8869 .8888 .8907 .8925 .8944 .8962 .8980 .8997 .90151,3 .9032 .9049 .9066 .9082 .9099 .9115 .9131 .9147 .9162 .91771,4 .9192 .9207 .9222 .9236 .9251 .9265 .9279 .9292 .9306 .93191,5 .9332 .9345 .9357 .9370 .9382 .9394 .9406 .9418 .9429 .94411,6 .9452 .9463 .9474 .9484 .9495 .9505 .9515 .9525 .9535 .95451,7 .9554 .9564 .9573 .9582 .9591 .9599 .9608 .9616 .9625 .96331,8 .9641 .9649 .9656 .9664 .9671 .9678 .9686 .9693 .9699 .97061,9 .9713 .9719 .9726 .9732 .9738 .9744 .9750 .9756 .9761 .97672,0 .9772 .9778 .9783 .9788 .9793 .9798 .9803 .9808 .9812 .98172,1 .9821 .9826 .9830 .9834 .9838 .9842 .9846 .9850 .9854 .98572,2 .9861 .9864 .9868 .9871 .9875 .9878 .9881 .9884 .9887 .98902,3 .9893 .9896 .9898 .9901 .9904 .9906 .9909 .9911 .9913 .99162,4 .9918 .9920 .9922 .9925 .9927 .9929 .9931 .9932 .9934 .99362,5 .9938 .9940 .9941 .9943 .9945 .9946 .9948 .9949 .9951 .99522,6 .9953 .9955 .9956 .9957 .9959 .9960 .9961 .9962 .9963 .99642,7 .9965 .9966 .9967 .9968 .9969 .9970 .9971 .9972 .9973 .99742,8 .9974 .9975 .9976 .9977 .9977 .9978 .9979 .9979 .9980 .99812,9 .9981 .9982 .9982 .9983 .9984 .9984 .9985 .9985 .9986 .99863,0 .9987 .9987 .9987 .9988 .9988 .9989 .9989 .9989 .9990 .9990

z

N(0,1) )( zZP ≤

z

9750.0)96.1(

Ejemplo.

=≤ZP

TABLA

Normal Estandar

Probabilidad. 75

N(0,1) )( zZP ≤

z

z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,093,1 .9990323 .9990645 .9990957 .9991259 .9991552 .9991836 .9992111 .9992377 .9992636 .99928863,2 .9993128 .9993363 .9993590 .9993810 .9994023 .9994229 .9994429 .9994622 .9994809 .99949903,3 .9995165 .9995335 .9995499 .9995657 .9995811 .9995959 .9996102 .9996241 .9996375 .99965053,4 .9996630 .9996751 .9996868 .9996982 .9997091 .9997197 .9997299 .9997397 .9997492 .99975843,5 .9997673 .9997759 .9997842 .9997922 .9997999 .9998073 .9998145 .9998215 .9998282 .99983463,6 .9998409 .9998469 .9998527 .9998583 .9998636 .9998688 .9998739 .9998787 .9998834 .99988783,7 .9998922 .9998963 .9999004 .9999042 .9999080 .9999116 .9999150 .9999184 .9999216 .99992473,8 .9999276 .9999305 .9999333 .9999359 .9999385 .9999409 .9999433 .9999456 .9999478 .99994993,9 .9999519 .9999538 .9999557 .9999575 .9999592 .9999609 .9999625 .9999640 .9999655 .99996694,0 .9999683 .9999696 .9999709 .9999721 .9999733 .9999744 .9999755 .9999765 .9999775 .9999784

Probabilidad. 76

Ejemplo (Normal)

La longitud X de ciertos tornillos es una variable aleatoria con distribución normal de media 30 mm y desviación típica 0.2 mm. Se aceptan como válidos aquellos que cumplen 29.5 < X < 30.3.

• Proporción de tornillos no aceptables por cortos.

• Proporción de tornillos no aceptables por largos.

• Proporción de tornillos válidos.

Probabilidad. 77

Ejemplo (Solución)

0062.0)5.2()5.2(

)2.0

305.292.030

()5.29(.1

)1,0()2.0,30(

=−Φ=−≤=

−≤

−=≤

→−

=⇒→

ZP

XPXP

NX

ZNXσ

µ

-2.5

0.0062

2.5

0.9938

0.0062

Tablas

Probabilidad. 78

971.00062.00228.01)3.305.29(.3

0228.0)2(1)0.2(

)2.0

304.302.030

()4.30(.2

=−−=<<

=Φ−=≥=

−≥

−=≥

XP

ZP

XPXP

Probabilidad. 79

Binomial-Poisson-Normal

Binomial n,p

Poisson λ

Normal µ,σ

0, →∞→ pn

np=λ

λσ

λµλ

=

=∞→

)1(

2/1

pnp

np

p

n

−=

=→

∞→

σ

µ

Probabilidad. 80

Aproximación Binomial-Normal n=25, p=1/2

0

0.02

0.04

0.06

0.08

0.1

0.12

0.14

0.16

0.18

0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25

Probabilidad. 81

0

0.02

0.04

0.06

0.08

0.1

0.12

0 5 10 15 20 25 30 35 40 45 50

Aproximación de Normal y Binomial n = 50, p=0.5

Probabilidad. 82

Transformaciones Lineales

nn

nn

Tn

Tn

aaaEYE

XaXaXaY

naaa

nXXX

µµµ +++==

=+++=

→=

→=

L

L

2211

2211

21

21

][][

constantes deVector ,),...,,(

aleatorias variables deVector ,),...,,(

Xa

Xa

a

X

T

T

( )

==

nnnn

n

n

n

a

a

a

aaaVarYVarM

L

MOMM

L

L

L 2

1

221

22212

11221

21][][

σσσ

σσσσσσ

aXaT

Probabilidad. 83

Transformaciones Lineales Caso General

=

=

=→=

=

×→

=

→=

mnnn

m

m

nnn

n

n

mnmm

n

n

T

nmnmm

n

n

m

mnmm

n

n

Tn

aaa

aaa

aaa

aaa

aaa

aaa

VarYVar

EYE

X

X

X

aaa

aaa

aaa

Y

Y

Y

nm

aaa

aaa

aaa

nXXX

L

MOMM

L

L

L

MOMM

L

L

L

MOMM

L

L

M

L

MOMM

L

L

M

L

MOMM

L

L

21

22212

12111

221

22212

11221

21

22221

11211

2

1

21

22221

11211

2

1

21

22221

11211

21

][][

][][

constantes de Matriz

aleatorias variables deVector ,),...,,(

σσσ

σσσσσσ

AXA

XAAX

a

X

Probabilidad. 84

Transformaciones Lineales(Independencia)

( )

2222

22

21

21

2

1

2

22

21

21

2211

21

21

00

00

00

][

constantes deVector ,),...,,(

ntesindependie aleatorias variables deVector ,),...,,(

nn

nn

n

nn

Tn

Tn

aaa

a

a

a

aaaYVar

XaXaXaY

naaa

nXXX

σσσ

σ

σσ

+++=

=

+++=

→=

→=

L

M

L

MOMM

L

L

L

L

a

X

Probabilidad. 85

Ejemplo:Calcular la media y la varianza de la suma de 12 variables aleatorias independientes con distribución uniforme en (0,1)

1][][

6][][

0),(12/1][

2/1][

)1,0(,

12

1

12

1

1221

12

2

1

∑

∑

=

=

==

==

+++=

==

=→

=

ii

ii

ji

i

i

i

UVarYVar

UEYE

UUUY

UUCovUVar

UE

UniformeU

U

U

U

U

L

M

Probabilidad. 86

Ejemplo• Un proceso fabrica una proporción p de tornillos

defectuosos. Se define X como la variable “número de tornillos extraídos del proceso hasta que aparecen r defectuosos”. Se pide E[X] y Var[X].

.)1(

][][][][

][][][][

/)1(][

/1]:

221

2

2

2

2

1

p

prXVarXVarXVarXVar

p

rXEXEEXE

ppXVar

pX

XX

X

X

X

r

r

ii

r

i

−=+++=

=+++=

−==

+++=

≡≡≡

L

L

L

1

i

1

X

E[X geométrica aleatoria variable

XX

defectuoso ésimo-i el aparece que hasta extraídos tornillos de Número defectuoso 2º el aparece que hasta extraídos tornillos de Número

defectuoso primer el aparece quehasta extraídostornillos de Número

nuevos

nuevos

Probabilidad. 87

Media de n variables aleatorias independientes

=

=⇒

+++=

∀=∀=

+++=

+++=

+++=

→=

nXVar

XE

n

XXXX

i]Var[Xi]E[Xµ

n

XVarXVarXVarXVar

n

XEXEXEXE

n

XXXX

nXXX

n

ii

n

n

n

Tn

221

2

221

21

21

21

][

][

][][][][

][][][][

,),...,,(

σµ

σ

L

L

L

L

varianza y media misma la tienen variables las Si

ntesindependie aleatorias variables de VectorX

Probabilidad. 88

Teorema Central del Límite

estándar. normalla deón distribucidefunción la es21

(t)

/)( donde

),(/

Entonces . y varianza media de

adprobabilid deón distribuci misma lacon ntesindependie

aleatorias variablesde secuenciauna Sea

2/

21

2

21

2

∫ ∞−−

∞→

=Φ

+++=

∞<<∞−Φ=

≤−

∞<

t x

n

n

n

dxe

nXXXX

tttn

XPlim

,...,X,XX

π

σµσµ

L

Probabilidad. 89

Teorema Central del Límite

:(aprox.) Entonces

varianza

y media de adprobabilid de óndistribuci misma la conntes,independie aleatoriasvariables Sea

2 .

21

∞<σ

µn,...,X,XX

),(2

nNX

σµ→

Probabilidad. 90

-0,2 0 0,2 0,4 0,6 0,8 1 1,20

0,5

1

1,5

Media = 0.5

Var = 0.08

-0,2 0 0,2 0,4 0,6 0,8 1 1,20

1

2

3

4

5

Media = 0.5

Var = 0.08/10101021 XXX

X+++

=L

Xi

Capítulo 2. Probabilidad

2.1 Sea X una variable aleatoria con distribución uniforme en (0, 1). Calcular la probabilidad de queY > 0.8 si Y = e−X2

.

2.2 Se elige un punto al azar interior a la circunferencia de ecuación x2 + y2 = r2. Llamando Z a lavariable aleatoria definida por la distancia entre el punto elegido y el centro de la circunferencia,calcular las funciones de densidad y distribución de Z.

2.3 Si X es una variable aleatoria con media µ. Demostrar que cuando m = µ, E[(X −m)2] es mínima.2.4 La función de densidad de la variable aleatoria X es

f(x) =

½1/(kx), si 25 ≤ x ≤ 500, en el resto.

Obtener k, la media y la varianza de X.

2.5 De acuerdo con la teoría cinética de los gases, la velocidad V de una molécula de masa m de un gasa la temperatura (absoluta) T es una variable aleatoria con la siguiente función de densidad:

f(v) =4

α3√πv2e−v

2/α2 , v ≥ 0

donde α =p2kT/m, siendo k la constante de Boltzmann. Además, E(V ) = 2α/

√π y Var(V ) =

(3/2 − 4/π)α2. Calcular el valor medio de la energía cinética, mV 2/2, de una molécula. ¿ A unamisma temperatura T , qué gas tiene mayor valor medio de energía cinética, uno ligero u otro máspesado?

2.6 La función de distribución de la variable aleatoria X es FX(x). Obtener la función de densidad dela variable aleatoria Y = FX(x).

2.7 Un modelo que habitualmente se utiliza en balística para comprobar la correcta calibración de lasarmas es

f(x) =x

σ2exp

·− x

2

2σ2

¸, x ≥ 0,σ ≥ 0,

donde la variable aleatoria X es la distancia del punto de impacto del proyectil al centro del blancoal que iba dirigido y σ es el parámetro que mide la precisión. Si para una distancia determinada dedisparo la precisión del arma es σ = 10 cm, ¿cuál es la probabilidad de que al lanzar 10 proyectiles,ninguno haya impactado a una distacia menor de 5 cm del centro del blanco?

2.8 Adaptar la demostración de la desigualdad de Chebychev y demostrar la desigualdad de Markov

P (X > a) ≤ 1aE [X]

donde X es una variable aleatoria positiva (P (X > 0) = 1)

2.9 Dada la variable aleatoria X, cuya función de densidad es

f(x) =

½k(1− x2), si 0 < x < 10, en el resto

1

Obtener k, así como la media y la varianza de la variable Y = 3X − 1.

2.10 Supóngase una diana circular con centro en el origen de coordenadas y radio r y X, Y las coor-denadas de un punto elegido al azar (por ejemplo, el lanzamiento de un dardo). Supóngase quecualquier otro punto de la diana tiene la misma probabilidad de ser elegido. Calcule fXY (x, y) yfX(x).

2.11 Un gran almacén guarda cajas que contienen piezas de distinto tipo. La proporción p de piezas detipo A en una caja se puede considerar una variable aleatoria con función de densidad:

f(p) = kp(1− p) con 0 ≤ p ≤ 1

(a) Calcular el valor de k, la media y la varianza de la variable aleatoria p.

(b) Si se toman 10 cajas al azar.¿Cuál es la probabilidad de que ninguna de ellas contenga unaproporción de piezas de tipo A igual o superior al 75% ?

2.12 X e Y son dos variables aleatorias independientes con la misma función de distribución F . Calcularla función de densidad de

U = max(X,Y).

2.13 Obtén la distribución de probabilidad del máximo, del mínimo y de la media de los resultadosobtenidos al lanzar dos dados equilibrados. Se acepta que los resultados de los dados son variablesaleatorias independientes.

2.14 La función de densidad de una variable aleatoria bidemensional viene dada por la expresión:

fXY (x, y) =

½xy + cex, cuando 0 < x < 1 y 0 < y < 10, en el resto

¿Son independientes las variables aleatorias X e Y ?

2.15 Los billetes de banco son fabricados en pliegos. La impresión se realiza por dos máquinas iguales,una de ellas imprime el anverso y la otra el reverso. Sea X e Y , respectivamente, el número dedefectos de impresión en el anverso y reverso de un pliego. Ambas variables son independientes condistribución de Poisson de parámetros λ1 y λ2.

(a) Demostrar que el número total de defectos en un pliego Z = X + Y tiene distribución dePoisson. (Nota.- Utilizar que

Pr{Z = n} =nXk=0

Pr{X = k}Pr{Y = n− k}

y el desarrollo del binomio de Newton para (λ1 + λ2)n.)

(b) Si el número total de defectos en un pliego es Z = n, ¿ cuál es la probabilidad de que hayaexáctamente X = k defectos en el anverso? (Obtener la expresión en función de λ1,λ2, ny k). ¿ De qué distribución de probabilidad se trata?

2.16 La cantidad en miligramos de dos componentes contenidos en un producto es una variable aleatoriabidemensional, cuya función de densidad viene dada por la expresión

2

fXY (x, y) =

½4xy, cuando 0 ≤ x ≤ 1 y 0 ≤ y ≤ 10, en el resto

Calcular la probabilidad de que la cantidad del primer componentes sea menor que 0.3 miligramoscuando la del segundo es 0.8 miligramos.

2.17 La llegada de los clientes a un banco se considera un proceso Poisson con parámetro λ. Sabiendoque en la última hora han llegado 2 clientes, ¿cuál es la probabilidad de que los dos entraran en losprimeros 15 minutos?

2.18 La función de densidad de la variable aleatoria bidemendional (X,Y ), bien dada por la expresión:

fXY (x, y) =

½kxy, cuando 0 < x < y < 10, en el resto

(a) Calcular el valor de k.(b) Calcular P (X < 0.5|Y = 0.5).(c) ¿Son independientes las variables aleatorias X e Y ?

2.19 X e Y son variables aleatorias con coeficiente de correlación lineal ρ = −1. Si las varianzas soniguales, calcular la varianza de Z = X + Y − 1.

2.20 Un equipo de radio tiene dos partes, el receptor y el amplificador. La duración del receptor esuna variable aleatoria exponencial de media 500 horas y la duración del amplificador una variableexponencial de media 1000 horas. ¿Cuál es la probabilidad de que el fallo del equipo (cuando seproduzca) sea debido a un fallo del receptor? (Se supone que las variables son independientes)

2.21 Una máquina en funcionamiento es reemplazada por una nueva máquina bien cuando falla, biencuando alcanza la edad de T años. Si el tiempo de vida de las sucesivas máquinas son variablesaleatorias independientes con la misma función de distribución F y con función de densidad f,demuestra que el número medio esperado de máquinas empleadas en un año es·Z T

0xf(x)dx+ T (1− F (T ))

¸−1.

2.22 SeaX1 una variable aleatoria N(10,1), X2 una variable aleatoria N(20,1), yX3 una variable aleatoriaN(30,4). Se define

Z1 = X1 +X2 −X3

Z2 = X1 +X2 +X3

Z3 = X1 −X2 −X3

Si X1,X2,X3 son independientes, calcular la matriz de varianzas de (Z1, Z2, Z3).

3

2.23 La distribución de probabilidad conjunta de las variables aleatorias Y1 e Y2 es la siguiente:

Y1-1 0 1

-1 1/16 3/16 1/16Y2 0 3/16 0 3/16

1 1/16 3/16 1/16

Calcular su coeficiente de correlación e indicar si son independientes.

2.24 La función de densidad conjunta de X e Y viene dada por

f(x, y) = xy, 0 < x < 1, 0 < y < 2

(a) Obtener las funciones de densidad marginales y decir si X e Y son independientes.(b) Calcular P(X + Y < 1).

2.25 La función de distribución conjunta de dos variables aleatorias X e Y es

F (x, y) = (1− e−ax)(1− e−by), x ≥ 0, y ≥ 0, a > 0, b > 0siendo a y b dos constantes conocidas. Calcula las funciones de distribución marginales de X eY.¿Son variables aleatorias independientes? Calcula P (X < 1, Y ≥ 2), P (X < 1) y P (Y ≥ 2).

2.26 Un ordenador tarda un total de T2 segundos en procesar un mensaje de correo electrónico, estacantidad incluye el tiempo T1 durante el cual el mensaje está en la cola esperando a ser procesado(T2 ≥ T1). La función de densidad conjunta de las variables aleatorias T1, T2 es

fT1T2(t1, t2) = e−t2 , 0 ≤ t1 ≤ t2 <∞

Calcular la probabilidad de que un mensaje haya estado menos de un segundo en la cola si el tiempototal que ha durado su procesamiento ha sido mayor que dos segundos.

2.27 Sea X un valor elegido al azar de la distribución uniforme en el intervalo [0,1]. A continuaciónse toma al azar otro valor Y de la distribución uniforme [X, 1]. Calcular la función de densidadmarginal de Y.

2.28 Una oficina de correos tiene dos ventanillas de atención al público. Tres personas A,B y C llegan enel mismo instante a la oficina de correos y encuentran las dos ventanillas desocupadas. Los tiemposde servicio requeridos por las tres personas son variables aleatorias independientes con distribuciónexponencial de parámetro λ. Los tiempos de servicio de A y B comienzan de inmediato, mientrasque C debe esperar a que termine el primero de los dos. ¿Cuál es la probabilidad de que C no seael último en salir de la oficina de correos?

2.29 Sean X,Y,U y V variables aleatorias, demostrar que si Y = U + V, entonces

Cov(X,Y ) = Cov(X,U) + Cov(X,V ).

2.30 Un laboratorio de análisis realiza pruebas de sangre para detectar la presencia de un tipo de virus.Se sabe que una de cada 100 personas es portadora del virus. Se va a realizar un estudio en uncolegio, para abaratar las pruebas se realiza un análisis combinado que consiste en: En lugar deanalizar la sangre de cada individuo, se toman las muestras de 50 y se analiza la mezcla. Si elresultado del análisis es negativo, se concluye que los 50 individuos están sanos. Si el análisis espositivo, se repite a cada persona de manera individual. El análisis es infalible.

4

(a) Determinar el número esperado de pruebas (análisis) que se tendrá que realizar si se sigueeste tipo de estrategia.

(b) ¿Cuál es la probabilidad de que un individuo determinado sea portador del virus, si elresultado del análisis realizado a su grupo de 50 ha resultado positivo?

2.31 De un lote con una proporción de piezas defectuosas p, se extraen piexas con reposición hasta quese observa la k−ésima defectuosa. Obtener la distribución de probabilidad de la variable aleatoriaX número total de piezas observadas.

2.32 La función de densidad de una variable aleatoria X viene dada por la expresión

f(x) =

½x/8, si 0 ≤ x ≤ 40, en el resto

Se generan secuencialmente valores de esta variable. ¿Cuántos valores de X habrá que generarpor término medio hasta obtener un valor mayor que 3?

2.33 Una pareja decide tener hijos hasta el nacimiento de la primera niña. Calcular la probabilidad deque tengan más de 4 hijos. (Supóngase P (nino) = P (nina) = 0.5)

2.34 Si las llamadas telefónicas a una centralita siguen una distribución de Poisson de parámetro λ = 3llamadas/cinco minutos, calcular la probabilidad de:

(a) Seis llamadas en cinco minutos.(b) Tres llamadas en diez minutos.(c) Más de 15 en un cuarto de hora.(d) Dos en un minuto.

2.35 La variable aleatoria X tiene distribución exponencial con media 1. Obtener la función de distribu-ción y la función de densidad de

W = aX1/b, a > 0, b > 0

2.36 El número de averías diarias de una máquina sigue una distribución de Poisson de media 0.4 averías.Calcular la probabilidad de que haya tres días sucesivos sin averías.

2.37 A un puesto de servicio llegan de manera independiente, por término medio, 10 clientes/hora.Calcular la probabilidad de que lleguen 8 clientes en la próxima media hora sabiendo que en laúltima hora llegaron 14 clientes, y que la variable aleatoria número de clientes que llegan en unhora siguen una distribución de Poisson.

2.38 En una planta industrial dos bombas B1 y B2 en paralelo conducen agua desde un pozo a unadepuradora D, y posteriormente otras dos bombas B3 y B4, también en paralelo, la trasladan a undepósito como indica la figura.

Los tiempos de vida de la depuradora y de las bombas son variables aleatorias independientes condistribución exponencial, siendo 20 mil horas la vida media de la depuradora y 30 mil horasla de cada bomba.

5

Pozo

B2

D

B1 B3

B4

Depósito

- ¡¡µ

-@@R

@@R

¡¡µ

-

-

(a) Calcular la probabilidad de que llegue agua al depósito después de 20 mil horas de fun-cionamiento.

(b) Calcular la probabilidad de que una depuradora que ha trabajado T horas falle antes de las milhoras siguientes. ¿Es razonable que para evitar fallos de la depuradora se renueve ésta cada 20 milhoras? ¿Por qué?

2.39 La distancia D entre dos vehículos consecutivos es una autopista sigue una distribución exponencialcon media 200 metros. ¿Cuál es la probabilidad de que en un tramo de 1 km haya exactamente 5vehículos?

2.40 La función de densidad del tiempo T de funcionamiento de un componente hasta que falla es

f(t) = kβtβ−1 exp(−ktβ), t > 0, k > 0,β > 0.

Cuando un componente falla se puede reparar y queda igual que otro que no hubiera fallado nuncay tuviera la misma edad. Además, el tiempo necesario para reparar el componente se consideradespreciable. Si un componente tiene su primer fallo en el instante t1, calcular la probabilidad deque el segundo fallo se produzca después de t2 con t2 > t1.

2.41 Ricardo es un pescador experto que ha comprobado, después de una larga experiencia practicandosu deporte favorito, que el número de peces capturados por la mañana puede ser representado poruna variable aleatoria de Poisson de media 3 peces a la hora. Quiere ir a pescar el sábado próximo,si empieza a las 7 de la mañana, ¿cuál es la probabilidad de que capture el primer pez antes de las7 h. 15 min.? ¿Cuál es la probabilidad de que capture 5 peces durante dos horas de pesca?

2.42 La variable aleatoria T representa la duración de vida de un componente electrónico. En teoría dela fiabilidad la probabilidad de que un componente falle en el instante t sabiendo que ha duradohasta t se denomina tasa de fallo y se representa por λ(t), siendo su valor en función de t

λ(t) =f(t)

1− F (t) ,

donde f y F son, respectivamente, las funciones de densidad y de distribución de la variablealeatoria T . Obtener la tasa de fallo en caso que T sea una variable aleatoria exponencial demedia 1000 horas e interpolar el resultado.

2.43 Un examen consiste en 25 cuestiones. En cada cuestión, el alumno debe elegir entre 5 solucionespropuestas, de las que una (y sólo una) es cierta. El número mínimo de respuestas correctas quedebe tener un alumno para aprobar es a. El profesor decide fijar a con el siguiente criterio: quela probabilidad de aprobar para un alumno que conteste todas las cuestiones al azar sea menor de0.05. Obtener a. (Una cuestión es respondida al azar si cada uno de los cinco resultados propuestostiene la misma probabilidad de ser escogido).

6

2.44 Obtener la función de densidad de una variable aleatoria χ2 con un grado de libertad. (Si X ;

N(0, 1), Y = X2 es una χ21.)

2.45 Dada una variable aleatoria X, cuya distribución es N(0,σ2), calcular la mediana de la variableY = |X|.

2.46 La longitud L en milímetros de las piezas fabricadas en un proceso es una variable aleatoria quese distribuye según una N(32, 0.3), considerándose aceptables aquellas cuya medida se encuentradentro del intervalo (31.1, 32.6).

(a) Calcular la probabilidad de que una pieza elegida al azar sea aceptable.(b) Si se toma al azar una muestra de tres piezas, ¿cuál es la probabilidad de que la primera

y la tercera sean aceptables y la segunda no lo sea?(c) ¿Cuál es la probabilidad de que en una muestra de tamaño 3 al menos una sea aceptable?(d) Las piezas se embalan en lotes de 500. Calcular la probabilidad de que un lote tenga más

de 15 defectuosas.

2.47 En cierta fabricación mecánica el 96% de las piezas resultan con longitudes admisibles (dentrode tolerancias), un 3% son piezas defectuosas cortas y un 1% son defectuosas largas. Calcular laprobabilidad de:

(a) En un lote de 250 piezas sean admisibles 242 o más.(b) En un lote de 500 sean cortas 10 o menos.(c) En 1000 piezas haya entre 6 y 12 largas. Todas las aproximaciones se calculan la distribu-

ción normal.

2.48 Una máquina rellena sobres de azucar para café. La cantidad de azucar en cada sobre se distribuyecomo una normal de media 8 gramos y desviación típica 0.5 gramos. Los sobres llenos se colocanen cajas de cartón. Cada caja tiene 100 sobres de azucar. El peso conjunto de la caja y los 100sobres vacíos es 30 gramos. Al final del proceso de empaquetado se pesa cada caja llena, si el pesoes menor de 820 gramos se retiran y no se comercializan. ¿Cuál es el porcentaje de cajas llenasque pesan menos de 820 gramos? ¿Cuál es la probabilidad de que una caja con 99 sobres llenos deazucar supere el control? (Se supone despreciable el peso de un sobre vacío)

2.49 En un juego de apuestas una persona paga un euro, elige un número del 1 al 6 y lanza tres dados.La banca le paga tantos euros como número de veces haya salido el número elegido. Sea X los eurosganados o perdidos por el jugador en una jugada, calcula E[X]. ¿A quién beneficia este juego, a labanca o al jugador?

2.50 Una empresa y su proveedor han llegado a un acuerdo en cuanto al plan de muestreo en la compra-venta de lotes de 100.000 unidades. Para comprobar la calidad se tomará una muestra de 400unidades, aceptando el lote cuando haya como máximo c unidades defectuosas. Calcula c para quela probabilidad de aceptar un lote con el 6% de piezas defectuosas sea 0.05.

7

3. Inferencia

Curso 2004-2005

Estadística

Inferencia 2

Probabilidad

Inferencia

Muestra n

Poblaciónp

% DEFECTUOSA

X ≡Nº Defectuosa

¿Conocido pcuanto vale X ?

¿Conocido Xcuanto vale p ?

Inferencia 3

µ

σ

),( σµNX → nXXX ,...,, 21

X

POBLACIÓN

MUESTRA n

Datos Conocidos?,¿ σµParámetros

?

Inferencia 4

240 235 240 240 247 237 243 242 236 239243 237 243 242 245 239 245 245 239 240250 246 244 246 255 242 248 248 241 242253 249 249 249 250 247 251 251 246 243248 246 246 248 249 245 250 249 242 244238 240 245 240 237 242 244 242 243 239242 241 250 243 239 244 246 245 246 240245 246 250 246 243 246 246 248 247 250251 247 247 250 247 251 250 243 252 252247 249 248 248 246 248 246 246 247 250239 240 238 241 242 243 241 241 241 241242 243 240 245 244 245 239 244 243 243246 244 245 243 245 247 244 245 245 249250 248 248 247 248 252 250 249 248 255248 245 246 245 245 249 246 247 246 253

X

Espesores de 150 obleas de Silicio (micras)

Inferencia 5

Histograma para Espesor

Espesor

frec

uenc

ia

230 235 240 245 250 255 2600

10

20

30

40

Inferencia 6

Distintos problemas de inferencia

Dado un modelo para los datos:

• Estimar µ y σ• Dar un intervalo de confianza para µ y σ• Elegir entre (contraste de hipótesis):

µ ≥ 250 o µ < 250

• Comprobar la validez del modelo (contraste de bondad de ajuste).

µ

σ

nXXX ,...,, 21

Inferencia 7

Métodos de Estimación

r

X

rX

f

xfX

θθθ

θθθ

,...,,

osdesconocid Parámetros

conocida

),...,,,(

21

21→

1. Método de los momentos

2. Método de máxima verosimilitud

?,...,,¿,,,

desimple aleatoriamuestra una Dada

2121 rnxxx

X

θθθ→K

Inferencia 8

Métodos de los momentos

),...,,(][

),...,,(][

),...,,(][

),...,,,(,,,

211

2122

21

2

2

21111

1

2121

rrr

r

n

iri

r

r

n

i i

r

n

i i

rXn

gXEn

xa

gXEn

xa

gXEn

xa

xfxxx

θθθα

θθθα

θθθα

θθθ

===

===

===

∑

∑

∑

=

=

=

MM

KDATOS VAR. ALEATORIA

=

==

→

rrr

r

r

r

ag

ag

ag

)ˆ,,ˆ,ˆ(

)ˆ,,ˆ,ˆ(

)ˆ,,ˆ,ˆ(

ˆ,,ˆ,ˆsEstimadore

21

2212

1211

21

θθθ

θθθθθθ

θθθK

M

K

K

K

Inferencia 9

Método de los momentos: Distribución normal

µ

σ ℜ∈

−

−= xx

xf X ,2

1exp

2

1)(

2

σµ

σπ

?,¿ :Parámetros σµ

2222

12

2

11

1

21

][

][

),,(,,,

µσα

µα

σµ

+===

===

∑

∑

=

=

XEn

xa

XEn

xa

xfxxx

n

i i

n

i i

XnK

22

1

22 1ˆ

ˆ

sxxn

xn

ii =−=

=

∑=

σ

µ

Inferencia 10

Método de máxima verosimilitud(Introducción)

Una fuente radiactiva emite partículas según un proceso de Poisson con media λ desconocida. Durante 10 minutos se han contado el número de partículas emitidas:

12, 6, 11, 3, 8, 5, 3, 9, 7, 5

!5!6!12)(

!5!6!12!5!6!12

!5!6!12)5,...,6,12(

6910

6910

561210

5612

1021

×××=

×××=

×××=

×××====

−

−+++

−

−−−

L

LL

L

L

λλ

λλ

λλλ

λ

λλ

λλλ

el

ee

eeeXXXP

Inferencia 11

Función de verosimilitud

2 4 6 8 10

!5!6!12)(

6910

×××= −

L

λλ λel

6,9

9,6ˆ =λ

λ

Estimador máximo-verosímil:

Inferencia 12

Función de verosimilitud

!5!6!12)(

6910

×××= −

L

λλ λel

6,9

9,6ˆ =λEstimador máximo-verosímil:

verosimilitud

0

2E-12

4E-12

6E-12

8E-12

1E-11

1,2E-11

1,4E-11

1,6E-11

1,8E-11

4

4,6

5,2

5,8

6,4 7

7,6

8,2

8,8

9,4 10

lambda

prob

abili

dad

-40

-35

-30

-25

-20

-15

-10

-5

0

log

prob

abili

dad

L(λ) = log l(λ)

Inferencia 13

Estimación por máxima verosimilitud

),...,,(max )ˆ,...,ˆ,ˆ(ˆ,...,ˆ,ˆ

),...,,(),...,,,(log),...,,(log

),...,,,(),...,,,(),...,,,(

),...,;,...,,(

:conjuntaón Distribuci

,...,,:simple aleatoria Muestra

,...,,:osdesconocid Parámetros

conocida

),...,,,(

212121

211

2121

21212211

121

21

21

21

rrr

r

n

iriXn

rnXrXrX

rn

n

r

X

rX

LL

Lxfxxxf

xfxfxf

xxxf

XXX

f

xfX

θθθθθθθθθ

θθθθθθ

θθθθθθθθθθθ

θθθ

θθθ

=⇒

==

==

→

∑=

L

Inferencia 14

Máx. verosimilitud: Distribución normal

ℜ∈

−

−= xx

xf X ,2

1exp

2

1)(

2

σµ

σπ?,¿ :Parámetros σµ

==

⇒

∑ =−+−=∂

∂

=∑ −=∂∂

∑ −−−−=

=

=

=

=

=

=

−−

−−−−−−

∑=

22

12

422

12

12

22

212

)(21

2/

)(21

)(21

)(21

21

21

ˆ

ˆ

0)ˆ(ˆ2

1

ˆ

12

0)ˆ(1

:max

)(2

1log

2)2log(

2

),...,,(log),(

)2(

1

21

21

21

),...,,(

simple aleatoriamuestra:,...,,

1

2

2

2

2

2

22

2

12

s

x

xnL

xL

L

xnn

xxxfL

e

eeexxxf

XXX

ni i

ni i

ni i

n

x

nn

xxxn

n

ni

i

n

σµ

µσσσ

µσµ

µσ

σπ

σµ

σπ

σπσπσπ

µσ

µσ

µσ

µσ L

Inferencia 15

Máx. Verosimilitud: Poisson

xx

nd

dLL

xxnL

xxxe

xe

xe

xe

xXxXxXPxxxp

xxx

xx

exXP

i

ii

n

xn

n

xxx

nnn

n

x

in

=⇒=Σ

+−=

−Σ+−=

==

====

→===

∑

Σ−−−−

−

λλλ

λλ

λλλ

λλλλ

λλ

λλλλ

λ

ˆ0ˆ

)(:)(max

!loglog)()(

!!!!!!

),,,(),...,,(

,...,, :simple aleatoria Muestra

Parámetro,...2,1,0,!

)(

2121

221121

21

21

LL

L

Inferencia 16

Máx. verosimilitud: Binomial(n,p)Proporción defectuosas = ¿ p ?

n

=Defectuosa

Aceptable

es si 1

es si 0

,...,,

:)(Bernoulli Muestra

21

i

n

x

xxx

n

rp

p

rn

p

r

dp

pdL

prnprL(p)

xrpp

pp

xXPxXPxXP

xXxXxXPxxxp

irnr

xnx

nn

nnn

ii

=→=−−

−=

−−+=

=−=

∑−∑=

========

∑−

−

ˆ0ˆ1ˆ

)(

)1log()(log

sdefectuosa de nº el es donde)1(

)1(

)()()(

),...,,(),...,,(

2211

221121

L

Inferencia 17

Distribución de media (normal)

µ

σ

),( σµNX →

nXXX ,...,, 21

nnn

XXXX

nn

XEXEXEXE

n

n

2

2

222

221

21

][Var][Var][Var][Var

][][][][

σσσσ

µµµµ

=+++

=+++

=

=+++

=+++

=

LL

LL

n

XXXX n+++=

L21

),(n

NXσµ→

Inferencia 18

Histograma de Espesores

Espesores

frec

uenc

ia

230 235 240 245 250 255 260

0

200

400

600

800

1000

Distribución de la Media de 5 observaciones

Media

Frec

uenc

ia/P

roba

bilid

ad

230 235 240 245 250 255 260

0

200

400

600

800

1000

1200

Inferencia 19

Distribución de S2 (Normal)

µ

σ

),( σµNX →

nXXX ,...,, 21

n

XXXXXXS n

222

212 )()()( −++−+−

=L

222

22222

21

21

22

1)()(

1][][

1][

1)(

1

σµσµσn

n

nnXEXE

nSE

XXn

XXn

S

i

ni

ni

−=+−+Σ=−Σ=

−=−= ∑∑

2222

222

212

]ˆ[1

ˆ

1

)()()(ˆ

σ=⇒−

=

−−++−+−

=

SESn

nS

n

XXXXXXS nL

Inferencia 20

Distribución χ2

2222

21

21 ntesindependie)1,0(,...,,

nn

n

ZZZ

NZZZ

χ→+++

→

L

indep.) y (

2Var

sPropiedade

22222

2

2

mnmnmn

n

n

n][

n]E[

χχχχχ

χ

χ

+=+⊗

=⊗

=⊗

Inferencia 21

Distribución Chi-cuadrado con 4 g.l.de

nsid

ad

0 4 8 12 16 20

0

0.04

0.08

0.12

0.16

0.2

Inferencia 22

Distribución de S2 (Normal)

4342144 344 2144 344 21

4444 84444 76

21

21

2

2

2

21

2

21

2

21

2

0

112

12

12

12

21

2

)()()(

)()(

))((2)()(

)()(

χχχ

σµ

σσ

µ

µ

µµ

µµ

χσ

µ

↓↓

=

↓

=

=

=

===

==

=

−+

−=

−

−+−=

∑ −−+−+−=

−+−=−

→

−

−

∑∑∑

∑∑

∑∑

∑

n

XXXX

XnXX

XXXXXX

XXXX

X

nn

n

i in

i i

n

i i

ni i

n

i

n

i i

n

i in

i i

nn

ii

21

2

12

2

21

2

12

2

ˆ)1(−

=

−=

→

−=

−

→

−=

∑

∑

ndist

n

i

i

ndist

n

i

i

XXSn

XXnS

χσσ

χσσ

Inferencia 23

Histograma de Espesores

Espesores

frec

uenc

ia

230 235 240 245 250 255 260

0

200

400

600

800

1000

Histograma para Varianzas

varianza muestral

frec

uenc

ia

0 20 40 60 80

0

100

200

300

400

500

Inferencia 24

Distribución de la media (general)

),(][

][

y varianza media misma la tienen variableslas Si

][][][][

][][][][

ntesindependie aleatorias variables deVector ,),...,,(

221

2

221

21

21

21

nNX

nXVar

XE

n

XXXX

i]Var[Xi]E[X

n

XVarXVarXVarXVar

n

XEXEXEXE

n

XXXX

nXXX

n

ii

n

n

n

Tn

σµσµ

σµ

→⇒

=

=⇒

+++=

∀=∀=

+++=

+++=

+++=

→=

L

L

L

L

X

∞<→ ]Var[ :),( ii XxfX θ

∞→n

Inferencia 25

Binomial

))1(

,(ˆ

)1(]ˆ[

]ˆ[ˆ

)1(][

][

es si 1

es si 0

,...,,: Binomial

21

21

n

pppNp

n

pppVar

ppE

n

XXXp

ppXVar

pXEX

XXX

n

n

i

ii

n

−→

−=

=→

+++=

−==

⇒=

∞→

L

Defectuosa

Aceptable

Inferencia 26

Poisson

),(ˆ

]ˆ[

]ˆ[ˆ

][

][

!)(

,...,,:Poisson

21

21

nN

nVar

E

n

XXX

XVar

XE

kekXP

XXX

n

n

i

ik

i

n

λλλ

λλ

λλλ

λλλλ

∞→

−

→

=

=→

+++=

==

⇒==

L

Inferencia 27

Propiedades de los estimadores

• Centrados:

• Varianza mínima:

• Error cuadrático medio mínimo

• Consistentes

)]ˆ[]ˆSesgo[(]ˆ[ θθθθθ −== EE

]'ˆ[Var]ˆ[Var:'ˆ θθθ ≤∀

)ˆ(Var)ˆ(Sesgo

])ˆ[(]ÊCM[2

2

θθ

θθθ

+=

−= E

0]ˆ[Vary ]ˆ[ limlim ==∞→∞→

θθθnn

E

),...,,(ˆˆ:),( de m.a.s ,...,, 2121 nn XXXxfXXX θθθ ≡

Inferencia 28

Ejemplo 1

0]]

:

][:

==

=

∞→∞→XX

XE

limlimnn

Var[yE[

econsistent Es

mínima varianza de Es

centrado Es

µ

µ

∑=

=n

iin X

nXNXXX

121

1:),( de m.a.s ,...,, σµ

Inferencia 29

Ejemplo 2

[ ]

0]Var[y]E[

:econsistent Es

)1(2][)1(2Var

:Varianza

)(Sesgo

1][:centrado es No

222

42

2212

2

22

22

limlim ==

−=⇒−==

−=

−=

∞→∞→

−

SS

n

nSVarnVar

σ

nS

nS

nn

SE

nn

n

σ

σχ

σ

σ

2

1

221 )(

1:),( de m.a.s ,...,, ∑

=−=

n

iin XX

nSNXXX σµ

Intervalos de confianza

Inferencia 31

Concepto de intervalo de confianzaSe ha realizado una encuesta a 400 personas elegidas al azar para estimar la proporción p de votantes de un partido político.

¿ p ?Resultado Encuesta

Sí 220No/Otros 180

Inferencia 32

N(0,1)

Introducción

)1,0()1(

ˆ

))1(

,(ˆ

))1(,(),(.

N

npp

pp

npp

pNnX

p

pnpnpNXpnBXaprox

→−−

−→=

−→ →

Inferencia 33

zα/2-zα/2

α/2 α/2

N(0,1)

2/2/

2/2/

)1(ˆ :de Despejando

1))1(

ˆ(

αα

αα α

z

npp

ppzp

z

npp

ppzP

≤−−≤−

−=≤−−≤−

Nivel de CONFIANZA

1-α

Inferencia 34

npp

zppn

ppzp

z

npp

ppz

z

npp

ppz

)ˆ1(ˆˆ

)ˆ1(ˆˆ

)ˆ1(ˆˆ

)1(ˆ

2/2/

2/2/

2/2/

−+≤≤−−

⇓

≤−−≤−

⇓

≤−−≤−

αα

αα

αα

Nivel de confianza: (1-α) TamañoMuestral

n

Inferencia 35

Ejemplo

0,55

0,550,49 0,61

0,43 0,67

0,51 0,59

0,47 0,63

95 %

99 %

n = 100

n = 400

n = 100n = 400

55,0400

220ˆ ==p

400

45,055,096,155,0

×±∈p

Inferencia 36

1. Normal: Intervalo para µ con σ conocido

),(,...,, 21 σµNXXX n →

nzx

nzx

zn

Xz

Nn

Xn

NX

σµσσ

µσ

µ

σµ

αα

αα

2/2/

2/2/ /

)1,0(/

),(

+≤≤−

≤−≤−

→−

→

zα/2-zα/2

α/2 α/2

N(0,1)

nzx

σµ α 2/±∈

Inferencia 37

2. Normal:Intervalo para µ con σ desconocido

),(,...,, 21 σµNXXX n →

ns

txn

stx

tnS

Xt

tnS

X

Nn

Xn

NX

nn

nn

n

ˆˆ

/ˆ

/ˆ

)1,0(/

),(

2/,12/,1

2/,12/,1

1

αα

αα

µ

µ

µσ

µ

σµ

−−

−−

−

+≤≤−

≤−≤−

→−

→−

→

ns

tx nˆ

2/,1αµ −±∈

tα/2- tα/2

α/2 α/2

tn-1

Inferencia 38

Distribución t de Student

-4,00 -3,00 -2,00 -1,00 0,00 1,00 2,00 3,00 4,00

N(0,1)

t1

t2

t4

p

p

tV/pZ

VZ

V

NZ

→

→

→

ntesindependieson ,

)1,0(2χ

Inferencia 39

3. Normal: Intervalo para σ2

),(,...,, 21 σµNXXX n →

22/

22

22/1

2

22/12

22

2/

212

21

22

ˆ)1(ˆ)1(

1)ˆ)1(

(

ˆ)1(1

)(ˆ

αα

αα

χσ

χ

αχσ

χ

χσ

snsn

SnP

Snn

XXS n

ni i

−≤≤−

−=≤−≤

→−

−−

=

−

−

−=∑

22/1 αχ −

22/αχ

α/2α/2

21−nχ

Inferencia 40

EJEMPLO 1. La resistencia a la compresión de 15 probetas de acero elegidas al azar es:

40,15 65,10 49,50 22,40 38,2060,40 43,40 26,35 31,20 55,6047,25 73,20 35,90 45,25 52,40

152,14

98,275,4515

2,1498,275,45

2,14ˆ75,45

98,215/ˆ

98,2

15/ˆ 14

+≤≤−

==

≤−≤−

→−

µ

µ

µ

sx

SX

tSX

2,98- 2,98

0,005 0,005

t14

99 % confianza: 34,8 ≤ µ ≤ 56,7

Inferencia 41

2142

22

12

2 ˆ14ˆ)1( χσ

χσ

→→−

−SSn

n

0,00 5,00 10,00 15,00 20,00 25,00 30,00 35,00

214χ

0,0050,005

4,07 31,3

07,46,20114

3,316,20114

6,201ˆ

99,0)3,31ˆ14

07,4(

22

2

2

×≤≤×=

=≤≤

σ

σ

s

SP

99% confianza: 90,2 ≤ σ2 ≤ 693,6

Inferencia 42

4. Poisson: Intervalo para λ

nz

nz

zn

zP

n

nX

XXXaprox

n

λλλλλ

αλλλ

λλλ

λλλ

λ

αα

αα

ˆˆ

ˆˆ

1)/

ˆ(

)1,0(Nˆ

),(Nˆ

)(Poisson ,,,

2/2/

2/2/

21

+≤≤−

−=≤−≤−

→−

→=

→K

zα/2-zα/2

α/2 α/2

N(0,1)

Tabla χ2

α

ν: grados de libertad (g.l.)

χν,1-α

EJEMPLO

P(χ9≥ 19,02) = 0,025

g.l. 0,995 0,990 0,975 0,950 0,500 0,050 0,025 0,010 0,0051 ,00004 ,00016 ,00098 ,00393 0,455 3,841 5,024 6,635 7,8792 ,01002 ,0201 0,051 0,103 1,386 5,991 7,378 9,210 10,603 ,0717 0,115 0,216 0,352 2,366 7,815 9,348 11,34 12,844 0,207 0,297 0,484 0,711 3,357 9,488 11,14 13,28 14,865 0,412 0,554 0,831 1,145 4,351 11,07 12,83 15,09 16,756 0,676 0,872 1,237 1,635 5,348 12,59 14,45 16,81 18,557 0,989 1,239 1,690 2,167 6,346 14,07 16,01 18,48 20,288 1,344 1,647 2,180 2,733 7,344 15,51 17,53 20,09 21,959 1,735 2,088 2,700 3,325 8,343 16,92 19,02 21,67 23,59

10 2,156 2,558 3,247 3,940 9,342 18,31 20,48 23,21 25,1911 2,603 3,053 3,816 4,575 10,341 19,68 21,92 24,73 26,7612 3,074 3,571 4,404 5,226 11,340 21,03 23,34 26,22 28,3013 3,565 4,107 5,009 5,892 12,340 22,36 24,74 27,69 29,8214 4,075 4,660 5,629 6,571 13,339 23,68 26,12 29,14 31,3215 4,601 5,229 6,262 7,261 14,339 25,00 27,49 30,58 32,8016 5,142 5,812 6,908 7,962 15,338 26,30 28,85 32,00 34,2717 5,697 6,408 7,564 8,672 16,338 27,59 30,19 33,41 35,7218 6,265 7,015 8,231 9,390 17,338 28,87 31,53 34,81 37,1619 6,844 7,633 8,907 10,117 18,338 30,14 32,85 36,19 38,5820 7,434 8,260 9,591 10,851 19,337 31,41 34,17 37,57 40,0021 8,034 8,897 10,283 11,591 20,337 32,67 35,48 38,93 41,4022 8,643 9,542 10,982 12,338 21,337 33,92 36,78 40,29 42,8023 9,260 10,196 11,689 13,091 22,337 35,17 38,08 41,64 44,1824 9,886 10,856 12,401 13,848 23,337 36,42 39,36 42,98 45,5625 10,520 11,524 13,120 14,611 24,337 37,65 40,65 44,31 46,9326 11,160 12,198 13,844 15,379 25,336 38,89 41,92 45,64 48,2927 11,808 12,878 14,573 16,151 26,336 40,11 43,19 46,96 49,6528 12,461 13,565 15,308 16,928 27,336 41,34 44,46 48,28 50,9929 13,121 14,256 16,047 17,708 28,336 42,56 45,72 49,59 52,3430 13,787 14,953 16,791 18,493 29,336 43,77 46,98 50,89 53,6740 20,707 22,164 24,433 26,509 39,335 55,76 59,34 63,69 66,7750 27,991 29,707 32,357 34,764 49,335 67,50 71,42 76,15 79,4960 35,534 37,485 40,482 43,188 59,335 79,08 83,30 88,38 91,9570 43,275 45,442 48,758 51,739 69,334 90,53 95,02 100,43 104,2180 51,172 53,540 57,153 60,391 79,334 101,88 106,63 112,33 116,3290 59,196 61,754 65,647 69,126 89,334 113,15 118,14 124,12 128,30100 67,328 70,065 74,222 77,929 99,334 124,34 129,56 135,81 140,17120 83,852 86,923 91,573 95,705 119,334 146,57 152,21 158,95 163,65

α

g.l 0,20 0,15 0,10 0,05 0,025 0,01 0,005 0,0025 0,001 0,00051 1,376 1,963 3,078 6,314 12,706 31,821 63,656 127,321 318,289 636,5782 1,061 1,386 1,886 2,920 4,303 6,965 9,925 14,089 22,328 31,6003 0,978 1,250 1,638 2,353 3,182 4,541 5,841 7,453 10,214 12,9244 0,941 1,190 1,533 2,132 2,776 3,747 4,604 5,598 7,173 8,6105 0,920 1,156 1,476 2,015 2,571 3,365 4,032 4,773 5,894 6,8696 0,906 1,134 1,440 1,943 2,447 3,143 3,707 4,317 5,208 5,9597 0,896 1,119 1,415 1,895 2,365 2,998 3,499 4,029 4,785 5,4088 0,889 1,108 1,397 1,860 2,306 2,896 3,355 3,833 4,501 5,0419 0,883 1,100 1,383 1,833 2,262 2,821 3,250 3,690 4,297 4,781

10 0,879 1,093 1,372 1,812 2,228 2,764 3,169 3,581 4,144 4,58711 0,876 1,088 1,363 1,796 2,201 2,718 3,106 3,497 4,025 4,43712 0,873 1,083 1,356 1,782 2,179 2,681 3,055 3,428 3,930 4,31813 0,870 1,079 1,350 1,771 2,160 2,650 3,012 3,372 3,852 4,22114 0,868 1,076 1,345 1,761 2,145 2,624 2,977 3,326 3,787 4,14015 0,866 1,074 1,341 1,753 2,131 2,602 2,947 3,286 3,733 4,07316 0,865 1,071 1,337 1,746 2,120 2,583 2,921 3,252 3,686 4,01517 0,863 1,069 1,333 1,740 2,110 2,567 2,898 3,222 3,646 3,96518 0,862 1,067 1,330 1,734 2,101 2,552 2,878 3,197 3,610 3,92219 0,861 1,066 1,328 1,729 2,093 2,539 2,861 3,174 3,579 3,88320 0,860 1,064 1,325 1,725 2,086 2,528 2,845 3,153 3,552 3,85021 0,859 1,063 1,323 1,721 2,080 2,518 2,831 3,135 3,527 3,81922 0,858 1,061 1,321 1,717 2,074 2,508 2,819 3,119 3,505 3,79223 0,858 1,060 1,319 1,714 2,069 2,500 2,807 3,104 3,485 3,76824 0,857 1,059 1,318 1,711 2,064 2,492 2,797 3,091 3,467 3,74525 0,856 1,058 1,316 1,708 2,060 2,485 2,787 3,078 3,450 3,72526 0,856 1,058 1,315 1,706 2,056 2,479 2,779 3,067 3,435 3,70727 0,855 1,057 1,314 1,703 2,052 2,473 2,771 3,057 3,421 3,68928 0,855 1,056 1,313 1,701 2,048 2,467 2,763 3,047 3,408 3,67429 0,854 1,055 1,311 1,699 2,045 2,462 2,756 3,038 3,396 3,66030 0,854 1,055 1,310 1,697 2,042 2,457 2,750 3,030 3,385 3,64640 0,851 1,050 1,303 1,684 2,021 2,423 2,704 2,971 3,307 3,55150 0,849 1,047 1,299 1,676 2,009 2,403 2,678 2,937 3,261 3,49660 0,848 1,045 1,296 1,671 2,000 2,390 2,660 2,915 3,232 3,46070 0,847 1,044 1,294 1,667 1,994 2,381 2,648 2,899 3,211 3,43580 0,846 1,043 1,292 1,664 1,990 2,374 2,639 2,887 3,195 3,41690 0,846 1,042 1,291 1,662 1,987 2,368 2,632 2,878 3,183 3,402100 0,845 1,042 1,290 1,660 1,984 2,364 2,626 2,871 3,174 3,390

infinito 0,842 1,036 1,282 1,645 1,960 2,327 2,576 2,808 3,091 3,2910,20 0,15 0,10 0,05 0,025 0,01 0,005 0,0025 0,001 0,0005

Tabla

t-Student

α

α

ν: grados de libertad (g.l.)

tν,α

EJEMPLO

P(t9≥ 2,262) = 0,025

Contraste de Hipótesis

Inferencia 46

Contraste de HipótesisSe ha realizado una encuesta a 400 personas elegidas al azar Llamando p a la proporción de votantes del partido político A. Podemos afirmar que p > 0.5.

¿ p ? Resultado Encuesta

Sí 220No/Otros 180

Inferencia 47

Contraste de hipótesis

))1(

,(ˆ

5.0:

5.0:

1

0

n

pppNP

pH

pH

−→

>≤

)1,0(

4005.05.0

5.0ˆ

50 cierto es H Si 0

NP

.p

→×

−

=

5.0:

5.0:

1

0

>=

pH

pH

Inferencia 48

Nivel de significación α

α = P( rechazar H0 | H0 es cierta)

N(0,1)

α

zα

Región de

Aceptación de HoRegión de

Rechazo Ho

Inferencia 49

00

0

H rechaza Se64.12

0.05ión significac de nivel el Elegido

2

4005.05.0

5.055.0550ˆ Muestra

⇒=>=

=

=×−

=⇒=

α

α

zz

z.p

0

0.05

1.64

R.A. Ho

R.R. H0

2

Con un nivel de significación de α = 0.05 ⇒ p > 0.5

Inferencia 50

H0 CIERTA

p=0.5

H0 FALSA

p = 0.6

0.5

0.6

α

β

c

c

cAceptar Ho Rechazar Ho

Probabilidad de Rechazar Ho

Probabilidad de Aceptar Ho

Error II

Error I

Inferencia 51

Tipos de erroresR

EA

LID

AD Ho

CIERTA

HoFALSA

Se Acepta Ho Se Rechaza Ho

RESULTADO CONTRASTE

Ok

Ok

Error tipo I α

Error tipo II β

Inferencia 52

Tipos de Contrastes

5.0:

5.0:

1

0

>=

pH

pH

5.0:

5.0:

1

0

≠=

pH

pH

UNILATERAL BILATERAL

αzα

R.A. Ho

α/2

zα/2-zα/2

α/2 R.A. Ho

R.R.Ho R.R.Ho

Nivel de significación α

R.R.Ho

Inferencia 53

Nivel crítico o p-valor

01

00

:

:

ppH

ppH

>=

))1(

,(ˆn

pppNP

−→

)Pr(

))1(

ˆ

)1(

ˆPr(

cierto) es |ˆˆ(Pr

0

00

0

00

0

0

zZn

pp

pp

npp

pP

HpPvalorp

>=

−−

>−−

=

>=−

Inferencia 54

Ejemplo

Datos: 55.0400

220ˆ ==p

0

Región de Aceptación

Ho

R.R. H005.0=α

2

0228.0

valorp −

1.64

Inferencia 55

Relación entre p-valor y α

0

R.R. H0αα<−valorp

zα

p-valor < α

Se rechaza H0

0

R.R. H0αα≥−valorp

zα

p-valor ≥ α

No se rechaza H0

Inferencia 56

1. Normal: Contraste para µ con σ conocido

),(,...,, 21 σµNXXX n →

n

xz

Nn

X

nNX

H

H

/

)1,0(/

),(

:

:

00

01

00

σµ

σµ

σµ

µµµµ

−=

→−

→

≠=

02/0

02/0

rechaza e

rechaza se No

HSzz

Hzz

⇒>

⇒≤

α

α

zα/2-zα/2

α/2 α/2

N(0,1)R.R. R.R

R. Acept.

1-α

Inferencia 57

2. Normal: Contraste para µ con σ desconocido

),(,...,, 21 σµNXXX n →

ns

xt

tnS

X

nNX

H

H

n

/ˆ

/ˆ

),(

:

:

00

1

01

00

µ

µ

σµ

µµµµ

−=

→−

→

≠=

−tα/2-tα/2

α/2 α/2

tn-1

R.R. R.R

02/0

02/0

rechaza e

rechaza se No

HStt

Htt

⇒>

⇒≤

α

α

R. Acept.

1-α

Inferencia 58

3. Normal: Contraste para σ2

),(,...,, 21 σµNXXX n →

20

220

212

2

122

20

20

20

20

ˆ)1(

ˆ)1(

)(1

1ˆ

:

:

σχ

χσ

σσ

σσ

sn

Sn

XXn

S

H

H

n

n

i i

−=

→−

−−

=

≠

=

−

=∑

[ ][ ] 0

22/1

22/

20

02

2/12

2/20

22/1

21

22/

H echazo,

H rechazo No,

1)(

R

P n

⇒∉

⇒∈

−=≤≤

−

−

−−

αα

αα

αα

χχχ

χχχ

αχχχ

Datos: ŝ2

22/1 αχ −

22/αχ

α/2α/2

21−nχ

R. A. Ho

RRHoRRHo

Inferencia 59

EJEMPLO 1. La resistencia a la compresión de 15 probetas de acero elegidas al azar es:

40,15 65,10 49,50 22,40 38,2060,40 43,40 26,35 31,20 55,6047,25 73,20 35,90 45,25 52,40

88.315/2,14

6075,452,14ˆ75,45

99.0)98,298,2(15/ˆ

60:

60:

0

14

14

1

0

−=−

=⇒==

=≤≤−

→−

≠=

tsx

tP

tS

X

H

H

µ

µµ

2,98- 2,98

0,005 0,005

t14

Como 3.88 > 2.98 ⇒ Se rechaza H0 con α=0.01

α = 0.01

Datos:

Inferencia 60

2142

22

12

2 ˆ14ˆ)1( χσ

χσ

→→−

−SSn

n

0,00 5,00 10,00 15,00 20,00 25,00 30,00 35,00

214χ

0,0050,005

4,07 31,3

1.14200

6,201146,201ˆ 2

02 =

×== χs

Como 4,07 ≤ 14,1 ≤ 31,3 ⇒ No se rechaza H0

200:

200:2

1

20

≠

=

σ

σ

H

H

99,0)3,3107,4( 214 =≤≤ χP

Datos:

Inferencia 61

4. Poisson: Contraste para λ

α

λλλ

λλλ

αλλλλ

λ

αα −=≤≤−

→−

=

→=

≠=

→

1)(

)1,0(Nˆ

),(Nˆ

ión significac de nivel:

:)(Poisson ,,,

2/2/

01

0021

zZzPn

Z

nX

H

HXXX

aprox

nK

zα/2-zα/2

α/2 α/2

N(0,1)R.R. R.R

R. Acept.

1-α

02/0

02/0

rechaza e

rechaza se No

HSzz

Hzz

⇒>

⇒≤

α

α

n

z0

00

ˆ

λλλ −

=

Inferencia 62

?),(¿ σµNX →nXXX ,...,, 21

X

µ

σ

POBLACIÓN

MUESTRA n

Datos Conocidos

Contraste χ2 de bondad de ajuste

¿Tienen los datos distribución Normal?

s

x

ˆˆ

ˆ

==

σµ

Inferencia 63

240 235 240 240 247 237 243 242 236 239243 237 243 242 245 239 245 245 239 240250 246 244 246 255 242 248 248 241 242253 249 249 249 250 247 251 251 246 243248 246 246 248 249 245 250 249 242 244238 240 245 240 237 242 244 242 243 239242 241 250 243 239 244 246 245 246 240245 246 250 246 243 246 246 248 247 250251 247 247 250 247 251 250 243 252 252247 249 248 248 246 248 246 246 247 250239 240 238 241 242 243 241 241 241 241242 243 240 245 244 245 239 244 243 243246 244 245 243 245 247 244 245 245 249250 248 248 247 248 252 250 249 248 255248 245 246 245 245 249 246 247 246 253

X

Espesores de 150 obleas de Silicio (micras)

Inferencia 64

Histograma para Espesor

Espesor

frec

uenc

ia

230 235 240 245 250 255 2600

10

20

30

40

Inferencia 65

Contraste χ2 de bondad de ajuste

∑=

−−

−

−

→−

<≤

<≤

<≤<≤

→=∀→=∀

K

krK

k

kk

KKKiK

kkkik

i

io

Xi

Xi

EEO

EOcxc

EOcxc

EOcxc

EOcxc

fniXH

fniXH

1

21

2

1

1

2221

111

0

1

0

)(

Esperada Fr.Observada Fr.Clases

:cierto es H Si

,...,2,1,:

,...,2,1,:

χ

MMM

MMM

)Pr( 1 kkk

kk

cXcp

npE

<≤==

−

nEOK

kk

K

kk ∑∑

====

11

/

Inferencia 66

Justificación del contraste χ2

21

1

2

)1,0(

)1,0()1(

))1(,(),(

−−=

∞→

→

−⇒→

−

→−

−=

−→ →→

∑ rKaproxK

k k

kk

k

kk

kk

kk

kk

kkkkn

kk

EEO

NE

EO

Npnp

npO

npE

pnpnpNOpnBO

χ

≅ 1

K ≡ Nº de CLASES r ≡ Nº de parámetro estimados

Inferencia 67

Obleas: Frecuencias Observadas

Fr. ObservadaOi

-inf 238 7238 240 16240 242 17242 244 21244 246 34246 248 24248 250 20250 252 7252 +inf 4

150

Clase

Total

micras4ˆ

micras1.245

==

s

x

Inferencia 68

Frecuencias esperadas N(245.1;4)Fr. Observada Fr. Esperada

Oi Ei

-inf 238 7 5,88238 240 16 9,58240 242 17 17,71242 244 21 25,71244 246 34 29,35246 248 24 26,34248 250 20 18,58250 252 7 10,3252 +inf 4 6,54

150 150

Clase

Total

71.251714.0150

1714.0

)775.0275.0(

)4

1.245244

4

1.245

4

1.245242Pr(

)244242Pr(

44

4

=×===

−≤≤−=

−≤

−≤

−=

≤≤=

npE

ZP

X

Xp

Inferencia 69

Contraste de Normalidad

5.854.6

)54.64(

58.9

)58,916(

88.5

)88.57( 22220 =

−++

−+

−= Lχ

Normal:

Normal:

1

0

→/

→

i

i

XH

XH

0,000

0,020

0,040

0,060

0,080

0,100

0,120

0,140

0,160

0,00 5,00 10,00 15,00 20,00

normalidad de hipótesis la rechaza se No59.125.8

95.0)59.12Pr(20

26

⇒<=

=≤

χ

χ

05.0=α

12,59

2037.0=− valorp

Inferencia 70

Se ha lanzado 300 veces un dado y se han obtenido los resultados:

Resultados Observadas1 492 593 494 515 436 49

Total 300

¿Se puede afirmar con α=0.05 que el dado está desequilibrado?

Inferencia 71

0,000

0,020

0,040

0,060

0,080

0,100

0,120

0,140

0,160

0,180

0,00 5,00 10,00 15,00

Resultados Observados Esperados1 49 502 59 503 49 504 51 505 43 506 49 50

Total 300 300

020

25

22220

H Rechaza se No07.1168.295.0)07.11Pr(

68.250

)5049(50

)5059(50

)5049(

⇒<=⇒=≤

=−++−+−=

χχ

χ L

25χ p-valor = 0.749

α=0.05

11.072.68

leequiprobab No:H

leEquiprobab:

6,...,2,1,6/1)Pr(

1 →→

=∀==

X

XH

iiX

o

Capítulo 3. Inferencia

3.1 La variable aleatoria X tiene distribución binomial con parámetros n y p, ambos desconocidos. Si{16,18,22,25,27} es una muestra aleatoria simple de la distribución anterior, estimar por el métodode los momentos n y p.

3.2 Los taxis en servicio de una ciudad están numerados del 1 al N. Se observa una muestra de 10 taxisy se apuntan sus números. Obtener un estimador de N por el método de los momentos.

3.3 Sea X1,X2, . . . ,Xn una muestra aleatoria simple de una variable aleatoria X con función de densi-dad,

fX(x) = 5x4/θ5, 0 ≤ x ≤ θ.

Obtén el estimador por el método de los momentos de θ y determina su sesgo y su varianza.

3.4 Una variable aleatoria discreta puede tomar los valores 0, 1 y 2 con probabilidades 1.5/θ, 2.5/θ y(θ − 4)/θ respectivamente. Se toma una muestra de tamaño 25 con los resultados siguientes (lasegunda fila corresponde a la fracción observada Oi para 0, 1 y 2).

x 0 1 2Oi 17 5 3

Estimar θ por máxima verosimilitud.

3.5 Se ha tomado una muestra de tamaño 10 del tiempo, en minutos, entre el paso de dos autobuses Ten una parada con los siguientes resultados: 9,10,6,4,15,6,1,5,4,10.

Si la función de distribución del tiempo de paso es F (t) = 1− exp(−αt), calcular la probabilidadestimada de esperar al autobús más de 10 minutos.

3.6 La función de distribución de una variable aleatoria es

F (x) =

0 x < 0,(x/β)α 0 ≤ x ≤ β,1 x > β.

donde los parámetros α y β son positivos. Estimar los parámetros de la distribución por el métodode máxima verosimilitud.

3.7 El club de tiro de una determinada ciudad está estudiando la distancia X del punto de impacto delproyectil al centro de la diana de sus 13 mejores tiradores.

Sabiendo que la función de densidad de la variable aleatoria presentada es

f(x) =2x

θ2exp[−x

2

θ2], x ≥ 0, θ ≥ 0,

estimar θ si la distancia en cm al blanco de 10 tiradores fue

2,1 3,2 6,3 5,4 2,2 6,9 7,1 6,6 2,5 9,1

1

y la distancia de los otros tres fue mayor que la distancia máxima permitida en su categoría quees de 11cm.

3.8 Una compañía, para determinar el número de consumidores de un determinado producto en Madrid,ha encuestado a personas elegidas al azar hasta encontrar a 20 que utilicen el producto. Estimar pormáxima verosimilitud la proporción de consumidores en la ciudad si el número total de entrevistadosha sido 115.

3.9 El tiempo de duración de ciertos componentes electrónicos es una variable aleatoria con distribuciónexponencial. Se ha realizado un ensayo con 10 componentes cuyos tiempos de duración han sido:37,45,92,104,109,200,295. Despues de 400 horas, tres componentes seguían funcionando. Con estainformación, estimar por máxima verosimilitud el parámetro de la distribución exponencial.

3.10 Sea X1,X2, ...,Xn una muestra aleatoria simple de la función de densidad

f(x) = 2(θ − x)/θ2, 0 ≤ x ≤ θ.

Obtener por el método de los momentos un estimador insesgado de θ y calcular su varianza.

3.11 Sea X la media aritmética de una muestra aleatoria simple de una distribución N(µ,σ). Se defineX = cX como nuevo estimador para µ. Determinar c (en función de µ y σ) para que el nuevoestimador tenga Error Cuadrático Medio (ECM) mínimo. Calcular c si se sabe que el coeficientede variación σ/µ = 2.

3.12 X1,X2, ...,Xn es una muestra aleatoria simple de una distribución normal con parámetros descono-cidos. Para estimar la varianza se propone el siguiente estimador

S2 = kn−1Xi=1

nXj=i+1

(Xi −Xj)2.

Determinar k para que el estimador sea centrado.

3.13 Para estimar la media σ2 de una población normal se utiliza el estimador bσ2 = kbs2, siendo bs2la varianza muestral corregida y k una constante. Calcular el valor de k que minimiza el errorcuadrático medio. (Utilizar Var[χ2g] = 2g, siendo g el número de grados de libertad).

3.14 Los tiempos de funcionamiento de dos componentes electrónicos distintos siguen distribucionesexponenciales con esperanzas µ y 2µ. Se han obtenido los tiempos de fallo de una muestra de cadatipo de componente, en ambos casos de tamaño n. Obtener el estimador de máxima verosimilitudde µ, calcular su media y su varianza.

3.15 Un sistema de lectura telemática de consumo de energía eléctrica emplea un mensaje de 128-bit. Ocasionalmente las interferencias aleatorias provocan que un bit se invierta produciéndose unerror de transmisión. Se acepta que la probabilidad de que cada bit cambie en una transmisiónes constante e igual a p, y que los cambios son independientes. Estima el valor de p si se hacomprobado que de las últimas 10000 lecturas efectuadas (todas de 128-bit) 340 eran erróneas.

3.16 Se han tomado 12 valores de una variable física X, que se supone normal, resultando

30.2, 30.8, 29.3, 29, 30.9, 30.8, 29.7, 28.9, 30.5, 31.2, 31.3, 28.5.

(a) Construir un intervalo de confianza para la media de la población al 95% de confianza.

2

(b) Construir un intervalo de confianza para la varianza de la población con el mismo nivelde confianza del apartado anterior.

3.17 En la lista adjunta se indica la edad y el área científica en que trece importantes científicos dediversas áreas descubrieron la teoría que les ha dado la fama. Construir con estos datos un intervalode confianza para la edad a la que los científicos realizan su contribución más importante: Galileo(34, astronomía), Franklin (40, electricidad), Lavoisier (31, química), Lyell (33, geología), Darwin(49, biología), Maxwell (33, ecuaciones de la luz), Curie (34, radiactividad), Plank (43, teoríacuántica), Marx (30, socialismo científico), Freud (31, psicoanálisis), Bohr (26, modelo del átomo),Einstein (26, relatividad), Keynes (36, macroeconomía).

3.18 Una muestra de 12 estaciones de servicio de una cadena de gasolineras proporciona un ingreso mediopor persona al mes de 2340 euros con una desviación típica de 815 euros. Calcular un intervalo deconfianza para el ingreso medio por trabajador en esta empresa. Calcular el número de estacionesque debemos estudiar para que el intervalo tenga una amplitud máxima de 500 euros.

3.19 Se han escogido al azar 15 probetas de un determinado acero, cuya resistencia a la compresión sesupone que se distribuye normalmente, y se ha medido ésta en las unidades adecuadas, habiéndoseobservado los resultados siguientes

40.15, 65.10, 49.5, 22.4, 38.2, 60.4, 43.4, 26.35, 31.2, 55.6, 47.25, 73.2, 35.9, 45.25, 52.4.

(a) Estimar la resistencia media del acero y su varianza.(b) Hallar un intervalo de confianza del 99% para la resistencia media.(c) Hallar un intervalo de confianza del 99% para la varianza.(d) ¿Cuántas probetas deberían haberse utilizado en el estudio si se quisiera estimar la re-

sistencia media del acero con una precisión de ±6 unidades y una confianza del 95%?.

3.20 Una compañía de comida precocinada desea lanzar al mercado un nuevo producto. Para conocer laaceptación del mismo realiza previamente una encuesta entre 200 personas elegidas al azar, de lasque 37 manifiestan su disposición a comprarlo. Obtener un intervalo de confianza (α = 0.05) parala proporción p de compradores potenciales de este nuevo producto. ¿Cúal debería ser el tamañomuestral si se quisiera reducir la longitud del intervalo a la mitad.

3.21 Se desea estimar la proporción de niños entre 0 y 14 años que se encuentran adecuadamentevacunados contra la poliomielitis. Si se quiere que la diferencia en valor absoluto entre la estimaciónfinal y el verdadero valor de la proporción sea menor que 0.05 con probabilidad 0.95, ¿ Cúal es eltamaño muestral mínimo requerido?.

3.22 Una roca lunar es enviada a un laboratorio para determinar su nivel de radiactividad θ, nivel que semide por el número medio de partículas emitidas por hora. Después de 15 horas, el equipo Geigerha contabilizado un total de 3.547 partículas emitidas. Aceptando que el número de partículasemitidas sigue una distribución de Poisson, dar un intervalo con 95% de confianza para el nivelde radiactividad de la roca. (Nota.- Utilizar que si Z tiene distribución N(0,1), entonces P (Z ≤1.96) = 0.975).

3.23 Teniendo en cuenta que si X1,X2, . . . ,Xn es una muestra aleatoria simple de una variable aleatoriaexponencial con función de densidad, f(x) = 1

λe−x/λ, x ≥ 0, λ > 0; el estadístico U = 2nX/λ

tiene distribución χ22n, donde X = (X1 +X2 + · · ·+Xn)/n; resolver la cuestión siguiente:

3

El tiempo de funcionamiento de un equipo electrónico es una variable aleatoria con distribución expo-nencial. Se han tomado los tiempos de funcionamiento hasta el fallo de 30 equipos elegidos al azar,obteniéndose 6.2 × 103 horas de media. Calcular un intervalo con 95 % de confianza para la vidamedia de un equipo.

3.24 La velocidad de una molécula según el modelo de Maxwell, es una variable aleatoria con funciónde densidad

f(x) =

4√π× 1

α3x2 exp−(x/α)2, x ≥ 0

0, x ≤ 0.donde α > 0, es el parámetro de la distribución y se verifica que

E(X) =2α√πy V ar(X) =

3

2− 4

πα2.

(a) Calcular el estimador máximo verosímil de α y su varianza asintótica.(b) Calcular el estimador por momentos de α y la varianza de dicho estimador.

(c) Para una muestra de tamaño n=100, para la que se verifica que100Pi=1xi = 342 y que

100Pi=1x2i =

1339, hallar un intervalo de confianza de α con el 95% de confianza utilizando ambosestimadores.

3.25 Los núcleos (radionucleidos) del elemento radiactivo Carbono 14 (C14) se desintegran aleatori-amente. El tiempo que tarda en desintegrarse cada radionucleido es una variable aleatoria condistribución exponencial de media 8, 27× 103 años.

(a) Si inicialmente había 1012 radionucleidos, obtener el número esperado de los radionucleidossin desintegrar al cabo de los 20.000 años.

(b) Obtener, para la variable aleatoria número de radionucleidos sin desintegrar al cabo de20.000 años, un intervalo que contenga al valor de esa variable con probabilidad 0, 95 einterpretar el resultado.

(c) Una pieza arqueológica ha estado enterrada durante 20.000 años al cabo de los cualesse han observado 1010 radionucleidos de C14. Estimar por el método de los momentosel número inicial de radionucleidos N y calcular la media y la varianza del estimadorobtenido.

(d) Determinar el tiempo que debe transcurrir para que el número de radionucleidos inicialesse reduzca a la mitad.

3.26 Un proceso industrial fabrica piezas cuya longitud en mm se distribuye según una N(190, 10). Unamuestra de 5 piezas proporciona los resultados siguientes:

187, 212, 195, 208, 192

(a) Contrastar la hipótesis de que la media del proceso µ es efectivamente 190.(b) Contrastar la hipótesis de que la varianza del proceso σ2 es 100. Tómese α = 0.05 en

todos los contrastes.

4

3.27 Para contrastar unilateralmente que la esperanza µ de una variable aleatoria normal es 10, se tomauna muestra de tamaño 16 y se rechaza la hipótesis en el caso en que la media muestral sea mayorque 11, aceptándose en el caso contrario. Sabiendo que la desviación típica de la población es σ = 2,¿cúal es la probabilidad de error de tipo I de este contraste?. ¿Cúal sería la probabilidad de errorde tipo II del contraste si el valor verdadero de la esperanza fuese 12?.

3.28 Una medicina estándar es efectiva en el 75% de los casos en los que se aplica. Se ha comprobadoun nuevo medicamento en 100 pacientes, observándose su efectividad en 85 de ellos. ¿ Es la nuevamedicina más efectiva que la estándar ? (Contrastar con α = 0.05).

3.29 Un empresario quiere comprar una empresa que fabrica cojinetes. Durante los 5 últimos años laproporción de cojinetes defectuosos se ha mantenido en un 3%. Para verificar esto, se toma unamuestra de 200 cojinetes y obtiene que 9 son defectuosos. ¿Se puede concluir que la proporción decojinetes defectuosos ha aumentado? Calcular la potencia del contraste planteado anteriormente enfunción de p. Calcular la probabilidad de error de tipo II cuando la hipótesis alternativa es p = 0.06,siendo p la proporción de defectuosos.(Nota: Utilícese la aproximación normal y α = 0, 05.).

3.30 Teniendo en cuenta que si X1,X2, . . . ,Xn es una muestra aleatoria simple de una variable aleatoriaexponencial con función de densidad, f(x) = 1

λe−x/λ, x ≥ 0, λ > 0; el estadístico U = 2nX/λ

tiene distribución χ22n, donde X = (X1 +X2 + · · ·+Xn)/n; resolver las cuestiones siguientes:

(a) El tiempo de funcionamiento de un equipo electrónico es una variable aleatoria con dis-tribución exponencial. Se han tomado los tiempos de funcionamiento hasta el fallo de30 equipos elegidos al azar, obteniéndose 6.2× 103 horas de media. Contrastar con nivelde significación igual a 0.05, H0 : λ = 5 × 103 horas, frente a H1 : λ > 5 × 103 horas;indicando: (a) el valor crítico, y (b) la probabilidad de error tipo II cuando λ = 7.5× 103horas. (Es suficiente con proporcionar el valor más proximo obtenido en las tablas dellibro de texto).

(b) Se va a realizar un ensayo con 15 equipos fabricados por una segunda empresa. Si eltiempo de funcionamiento de estos tiene también distribución exponencial. ¿ Cuál es elvalor máximo de la media muestral de estos quince equipos que permitiría concluir conα = 0.05 que son peores que los de la primera empresa? Después de 6000 horas de ensayohan fallado 6 equipos, siendo el promedio de estos seis valores igual a 2350 horas. ¿Esnecesario seguir el ensayo para tomar una decisión ?

3.31 Cibeles Computer S.A. ha realizado un gran pedido de chips para su nueva linea de ordenadorespersonales. En el contrato de suministro se especifica que al menos el 95% de los chips debenser aceptables. Como es imposible comprobarlo al 100%, el control se va a realizar mediante elsiguiente procedimiento: de cada lote (que se supone de gran tamaño) se toman al azar n chips, sila proporción de chips en la muestra que supera el control es mayor que c se acepta el lote y en casocontrario se rechaza. Llamando p a la proporción real de chips aceptables en un lote, determinar ny c si se desea que

P(Aceptar un lote)=0.01 si p=0.85

P(Aceptar un lote)=0.99 si p=0.95.

(Utilizar la aproximación normal y considerar que si Z es una variable aleatoria normal estándar,P (Z ≤ 2.33) = 0.99).

5

3.32 La estatura de 60 niños de una escuela infantil se resume en la siguiente tabla de frecuencias, dóndela última columna muestra la frecuencia esperada bajo la hipótesis de normalidad.

Frecuencia FrecuenciaIntervalo Observada Esperada41,5-43,5 4 4,0843,5-45,5 7 5,5845,5-47,5 12 9,0647,5-49,5 8 11,2749,5-51,5 6 11,2751,5-53,5 11 9,0853,5-55,5 9 5,5855,5-57,5 3 4,08Total 60 60¿Se puede aceptar la hipótesis de normalidad de los datos (α = 0.05) ?

3.33 Se tira 120 veces un dado y se obtienen los resultados de la tabla

VALOR 1 2 3 4 5 6FRECUENCIA 20 14 23 12 26 25

Contrastar la hipótesis de que el dado está equilibrado y que, por tanto, sus caras son equiproba-bles. (Tómese α = 0.05).

3.34 Un modelo sísmico indica que la distribución de los epicentros de sismos en una región debería seguiruna distribución de Poisson en el plano. Un grupo de expertos pretende contrastar si ese modelose cumple, para ello ha representado un mapa de la región dividido en cuadrículas de tamaño 100km2, y ha señalado con puntos las posiciones de los epicentros (véase figura adjunta). Realizar elcontraste χ2 de bondad de ajuste con nivel de significación α = 0, 05 proporcionando el nivel críticoaproximado del contraste.

6

3.35 El Ministerio de defensa está considerando un nuevo sistema de apoyo para el lanzamineto demisiles de corto alcance. El sistema existente tiene errores en el 7% de los lanzamientos y se deseacomprobar si el nuevo sistema tiene una probabilidad de fallo menor. El ensayo va a consistiren realizar 20 lanzamientos y se concluirá que el nuevo sistema es mejor si no se produce ningúnfallo. Llamando p a la probabilidad de fallo del sistema nuevo y aceptando independencia entre losresultados del lanzamiento, obtenga y represente gráficamente la probabilidad de error de tipo IIdel contraste ½

H0 : p = 0.07H1 : p < 0.07

Obtenga la probabilidad de error tipo I. Interprete el resultado y valore si el método de decisiónes adecuado.

3.36 El tiempo de duración T de un componente electrodinámico es una variable aleatoria con distribu-ción exponencial de media µ. Veinte componentes han sido sometidos a un ensayo y el número dehoras que han durado ha sido:

10.99 15.79 24.14 34.43 43.72 51.72 56.12 60.27 77.20 88.4791.07 117.58 130.40 133.12 152.90 159.00 193.62 208.71 308.82 316.07

Teniendo en cuenta que 2T/µ tiene distribución χ2 con dos grados de libertad, realiza el siguientecontraste

H0 : µ = 200 horas,

H1 : µ < 200 horas,

con α = 0.05.

3.37 Para controlar la calidad de un proceso textil se cuenta el número de defectos que aparecen en latela fabricada. Según el fabricante, cuando el proceso funciona correctamente el número de defectosen una bobina de 100 metros cuadrados es una variable aleatoria de Poisson con media 4. Se hainstalado un equipo de visión artificial para realizar el recuento que permite inspeccionar 900 m2

de tela cada hora. ¿Cuál es la probabilidad de que aparezcan más de 50 defectos en una horasi el proceso funciona bien? En una jornada de 16 horas de fabricación se han contabilizado 720defectos, ¿se puede afirmar que ha habido un aumento del número medio de defectos en ese día?(Nivel de significación 0.05).

7

.

4. Análisis de la Varianza

Curso 2004-05

Estadística

2Análisis de la varianza

Comparación de dos tratamientos

A B51,3 29,639,4 47,026,3 25,939,0 13,048,1 33,134,2 22,169,8 34,131,3 19,545,2 43,846,4 24,9

Sea desea comparar dos tratamientos para reducir el nivel de colesterol en la sangre. Se seleccionan 20 individuos y se asignan al azar a dos tipos de dietas A y B. La tabla muestra la reducción conseguida después de dos meses.


Método: 4 pasos

Definición del modelo de distribución de probabilidad:

Hipótesis

Parámetros

Estimación de los parámetros

Diagnosis de las hipótesis

Aplicación


µ1

σ

µ2

σ

11

12

11

ny

y

y

M

22

22

21

ny

y

y

M

Modelo

MODELO

DATOS


Modelo: Hipótesis y Parámetros

Hipótesis básicas:

Normalidad

yij ⇒ N(µi,σ2)

Homocedasticidad

Var [yij] = σ2

Independencia

Cov [yij, ykl] = 0

Parámetros

2

2

1

σ

µµ


Modelo

),0(, 2σµ Nuuy ijijiij →+=

Las observaciones se descomponen en:

Parte predecible

Parte aleatoriaiµ

0

σ

iju


Estimación medias:

2

12

22

1

11

11

2

1

:

:

n

y

y

n

y

y

n

jj

n

jj

∑

∑

=•

=•

=→

=→

µ

µ

A B51,3 29,639,4 47,026,3 25,939,0 13,048,1 33,134,2 22,169,8 34,131,3 19,545,2 43,846,4 24,943,1 29,3


Estimación varianza (residuos)

A B8,2 0,3-3,7 17,7

-16,8 -3,4-4,1 -16,35,0 3,8-8,9 -7,226,7 4,8-11,8 -9,82,1 14,53,3 -4,40,0 0,0

Residuos

2ˆ:

:

),0(,

2

1 1

2

22

2

−=→

−=

−=

→+=

∑∑= =

•

n

e

s

e

yye

yu

Nuuy

i

n

jij

R

ij

iijij

iijij

ijijiij

i

σ

µ

σµ

RESIDUO

95.130ˆ;0 2

1==∑

=R

n

jij se

i


Varianza residual:

1

)(ˆ

1

2112

1

1

12

11

1

−

−=

∑ •

n

yys

y

y

y

j

n

M 1

)(ˆ

2

2222

2

2

22

21

2

−

−=

∑ •

n

yys

y

y

y

j

n

M

σ

µ1 µ2

σ

22

221

1

2

1 1

2

2 ˆ1

1ˆ

1

1

2ˆ s

n

ns

n

n

n

e

s i

n

jij

R

i

−−

+−−

=−

=∑∑= =

2ˆRs


Diferencia de medias:

),(1

2

11

1

12

11

1

nNy

y

y

y

n

σµ→

•M),(

2

2

22

2

22

21

2

nNy

y

y

y

n

σµ→

•M

σ

µ1 µ2

σ

2

21

2121

21

2121

2

2

1

2

2121

11ˆ

)()()1,0(

11

)()(

),(

−••

••

••

→+

−−−⇒

→+

−−−

+−→−

n

R

t

nns

yyN

nn

yynn

Nyyµµ

σ

µµ

σσµµ

•• − 21 yy


Contraste de igualdad de medias

211

210

:

:

µµµµ

≠=

H

H

α/2

02/0

02/0

rechaza e

rechaza se No

HStt

Htt

⇒>

⇒≤

α

α

tα/2-tα/2

α/2

tn-2

R.R. R.R

R. Acept.

1-α

2

21

210

11ˆ

−•• →

+

−= n

R

t

nns

yyt


211

210

:

:

µµµµ

≠=

H

H

0 rechaza e10.269.2 HS⇒>

2.10-2.10

0.025

t18R.R. R.R

69.2

101

101

44.11

3.291.430 =

+

−=t

0.025

Ejemplo: α = 0.05


Ejemplo: α = 0.01

211

210

:

:

µµµµ

≠=

H

H

α/2

0 rechaza se No88.269.2 H⇒≤

2.88-2.88

0.005

t18

R.R. R.R

0.99

69.2

101

101

44.11

3.291.430 =

+

−=t

0.005


211

210

:

:

µµµµ

≠=

H

H

69.2

101

101

44.11

3.291.430 =

+

−=t

Nivel crítico (bilateral)

2.69-2.69

0.0740.074

t18

0147.0)69.2Pr( 18 =>=− tvalorp

•α = 0.05 > p-valor ⇒ Se rechaza H0

•α = 0.01 < p-valor ⇒ No se rechaza H0


Conclusiones (fijado α)

Si |to| > tα/2 se dice que la diferencia de medias es significativa. O simplemente que los tratamientos son distintos (tienen medias distintas)

Si |to| ≤ tα/2 se dice que la diferencia de medias no es significativa. No hay evidencia suficiente para afirmar que las medias de los tratamientos sean diferentes.


No rechazar Ho, no implicaque Ho sea cierta

El resultado |to| ≤ tα/2, (no se rechazaHo) no debe interpretarse como que “se ha demostrado que las dos medias son iguales”.

No-rechazar la hipótesis nula implica que la diferencia entre las medias µ1 - µ2 no es lo suficientemente grande como para ser detectada con el tamaño muestraldado.


Intervalo de confianza para la diferencia de medias:

2

21

2121

11ˆ

)()(−

•• →+

−−−n

R

t

nns

yy µµ

21 µµ −

212/2121

2/

21

21212/

11ˆ)(

1}11

ˆ

)()({Pr

nnstyy

t

nns

yyt

R

R

+±−∈−

−=≤+

−−−≤−

••

••

α

αα

µµ

αµµ

tα/2-tα/2

α/2

tn-2

1-α α/2


Ejemplo: intervalo de confianza

2.10-2.10

0.025

t18

0.025

74.108.13101

101

44.1110.2)3.291.43(

11ˆ)(

21

21

212/2121

±∈−

+××±−∈−

+±−∈− ••

µµ

µµ

µµ α nnstyy R

21 µµ −


Hipótesis de homocedasticidad

1

)(ˆ

1

2112

1

1

12

11

1

−

−=

∑ •

n

yys

y

y

y

j

n

M 1

)(ˆ

2

2222

2

2

22

21

2

−

−=

∑ •

n

yys

y

y

y

j

n

M

σ1

µ1 µ2

σ2

22

211

22

210

:

:

σσ

σσ

≠

=

H

H


Distribución F

212

1

211

1

2112

1

1

12

11

1

1

ˆ)1(

1

)(ˆ

−

•

→−

−

−=

∑

n

j

n

sn

n

yys

y

y

y

χσ

M

212

2

222

2

2222

2

2

22

21

2

2

ˆ)1(

1

)(ˆ

−

•

→−

−

−=

∑

n

j

n

sn

n

yys

y

y

y

χσ

M

1,1

22

22

21

21

2

21

1

21

21

2

1

ˆ

ˆ

)1(

)1(−−

−

−

→=

−

−= nn

n

n

Fs

s

n

nF

σ

σχ

χ


Distribución F

F5,40

F10,40

F20,40

F40,40


Algunas distribuciones F

F10,10

F10,20

F10,40

F10,80


Contraste de igualdad de varianzas

Fα/2F1-α/2

α/2α/2

RRRR1-α

R.A. Ho

[ ][ ] 02/2/10

02/2/10

rechaza Se , Si

rechaza se No , Si

HFFF

HFFF

⇒∉⇒∈

−

−

αα

αα

22

211

22

210

:

:

σσ

σσ

≠

=

H

H

1,121

21

0

22

210

21ˆ

ˆ

, cierto es Si

−−→=

=

nnFs

sF

H σσ


Ejemplo: Contraste de igualdad de varianzas

4.030.248

0.0250.025

RRRR

[ ] 0 rechaza se No 03.4,248.0.371 H⇒∈

22

211

22

210

:

:

σσ

σσ

≠

=

H

H

37.17.111

02.154

7.111ˆ02.154ˆ

0

22

21

==

==

F

ss1.37

Gra

dos

de li

bert

ad d

el d

enom

inad

or: ν 2

Grados de libertad del numerador: ν1α=0.05

Tabla F ααννννανν =≥⇒ )( ,,,,, 212121FFPF

05.0)50.3(: 8,7 =≥FPEjemplo

1 2 3 4 5 6 7 8 9 10 12 15 20 24 30 40 60 100 120 Inf.1 161,4 199,5 215,7 224,6 230,2 234,0 236,8 238,9 240,5 241,9 243,9 245,9 248,0 249,1 250,1 251,1 252,2 253,0 253,3 254,3 12 18,51 19,00 19,16 19,25 19,30 19,33 19,35 19,37 19,38 19,40 19,41 19,43 19,45 19,45 19,46 19,47 19,48 19,49 19,49 19,50 23 10,13 9,55 9,28 9,12 9,01 8,94 8,89 8,85 8,81 8,79 8,74 8,70 8,66 8,64 8,62 8,59 8,57 8,55 8,55 8,53 34 7,71 6,94 6,59 6,39 6,26 6,16 6,09 6,04 6,00 5,96 5,91 5,86 5,80 5,77 5,75 5,72 5,69 5,66 5,66 5,63 45 6,61 5,79 5,41 5,19 5,05 4,95 4,88 4,82 4,77 4,74 4,68 4,62 4,56 4,53 4,50 4,46 4,43 4,41 4,40 4,37 56 5,99 5,14 4,76 4,53 4,39 4,28 4,21 4,15 4,10 4,06 4,00 3,94 3,87 3,84 3,81 3,77 3,74 3,71 3,70 3,67 67 5,59 4,74 4,35 4,12 3,97 3,87 3,79 3,73 3,68 3,64 3,57 3,51 3,44 3,41 3,38 3,34 3,30 3,27 3,27 3,23 78 5,32 4,46 4,07 3,84 3,69 3,58 3,50 3,44 3,39 3,35 3,28 3,22 3,15 3,12 3,08 3,04 3,01 2,97 2,97 2,93 89 5,12 4,26 3,86 3,63 3,48 3,37 3,29 3,23 3,18 3,14 3,07 3,01 2,94 2,90 2,86 2,83 2,79 2,76 2,75 2,71 9

10 4,96 4,10 3,71 3,48 3,33 3,22 3,14 3,07 3,02 2,98 2,91 2,85 2,77 2,74 2,70 2,66 2,62 2,59 2,58 2,54 1011 4,84 3,98 3,59 3,36 3,20 3,09 3,01 2,95 2,90 2,85 2,79 2,72 2,65 2,61 2,57 2,53 2,49 2,46 2,45 2,40 1112 4,75 3,89 3,49 3,26 3,11 3,00 2,91 2,85 2,80 2,75 2,69 2,62 2,54 2,51 2,47 2,43 2,38 2,35 2,34 2,30 1213 4,67 3,81 3,41 3,18 3,03 2,92 2,83 2,77 2,71 2,67 2,60 2,53 2,46 2,42 2,38 2,34 2,30 2,26 2,25 2,21 1314 4,60 3,74 3,34 3,11 2,96 2,85 2,76 2,70 2,65 2,60 2,53 2,46 2,39 2,35 2,31 2,27 2,22 2,19 2,18 2,13 1415 4,54 3,68 3,29 3,06 2,90 2,79 2,71 2,64 2,59 2,54 2,48 2,40 2,33 2,29 2,25 2,20 2,16 2,12 2,11 2,07 1516 4,49 3,63 3,24 3,01 2,85 2,74 2,66 2,59 2,54 2,49 2,42 2,35 2,28 2,24 2,19 2,15 2,11 2,07 2,06 2,01 1617 4,45 3,59 3,20 2,96 2,81 2,70 2,61 2,55 2,49 2,45 2,38 2,31 2,23 2,19 2,15 2,10 2,06 2,02 2,01 1,96 1718 4,41 3,55 3,16 2,93 2,77 2,66 2,58 2,51 2,46 2,41 2,34 2,27 2,19 2,15 2,11 2,06 2,02 1,98 1,97 1,92 1819 4,38 3,52 3,13 2,90 2,74 2,63 2,54 2,48 2,42 2,38 2,31 2,23 2,16 2,11 2,07 2,03 1,98 1,94 1,93 1,88 1920 4,35 3,49 3,10 2,87 2,71 2,60 2,51 2,45 2,39 2,35 2,28 2,20 2,12 2,08 2,04 1,99 1,95 1,91 1,90 1,84 2021 4,32 3,47 3,07 2,84 2,68 2,57 2,49 2,42 2,37 2,32 2,25 2,18 2,10 2,05 2,01 1,96 1,92 1,88 1,87 1,81 2122 4,30 3,44 3,05 2,82 2,66 2,55 2,46 2,40 2,34 2,30 2,23 2,15 2,07 2,03 1,98 1,94 1,89 1,85 1,84 1,78 2223 4,28 3,42 3,03 2,80 2,64 2,53 2,44 2,37 2,32 2,27 2,20 2,13 2,05 2,01 1,96 1,91 1,86 1,82 1,81 1,76 2324 4,26 3,40 3,01 2,78 2,62 2,51 2,42 2,36 2,30 2,25 2,18 2,11 2,03 1,98 1,94 1,89 1,84 1,80 1,79 1,73 2425 4,24 3,39 2,99 2,76 2,60 2,49 2,40 2,34 2,28 2,24 2,16 2,09 2,01 1,96 1,92 1,87 1,82 1,78 1,77 1,71 2526 4,23 3,37 2,98 2,74 2,59 2,47 2,39 2,32 2,27 2,22 2,15 2,07 1,99 1,95 1,90 1,85 1,80 1,76 1,75 1,69 2627 4,21 3,35 2,96 2,73 2,57 2,46 2,37 2,31 2,25 2,20 2,13 2,06 1,97 1,93 1,88 1,84 1,79 1,74 1,73 1,67 2728 4,20 3,34 2,95 2,71 2,56 2,45 2,36 2,29 2,24 2,19 2,12 2,04 1,96 1,91 1,87 1,82 1,77 1,73 1,71 1,65 2829 4,18 3,33 2,93 2,70 2,55 2,43 2,35 2,28 2,22 2,18 2,10 2,03 1,94 1,90 1,85 1,81 1,75 1,71 1,70 1,64 2930 4,17 3,32 2,92 2,69 2,53 2,42 2,33 2,27 2,21 2,16 2,09 2,01 1,93 1,89 1,84 1,79 1,74 1,70 1,68 1,62 3040 4,08 3,23 2,84 2,61 2,45 2,34 2,25 2,18 2,12 2,08 2,00 1,92 1,84 1,79 1,74 1,69 1,64 1,59 1,58 1,51 4050 4,03 3,18 2,79 2,56 2,40 2,29 2,20 2,13 2,07 2,03 1,95 1,87 1,78 1,74 1,69 1,63 1,58 1,52 1,51 1,44 5060 4,00 3,15 2,76 2,53 2,37 2,25 2,17 2,10 2,04 1,99 1,92 1,84 1,75 1,70 1,65 1,59 1,53 1,48 1,47 1,39 6070 3,98 3,13 2,74 2,50 2,35 2,23 2,14 2,07 2,02 1,97 1,89 1,81 1,72 1,67 1,62 1,57 1,50 1,45 1,44 1,35 7080 3,96 3,11 2,72 2,49 2,33 2,21 2,13 2,06 2,00 1,95 1,88 1,79 1,70 1,65 1,60 1,54 1,48 1,43 1,41 1,32 8090 3,95 3,10 2,71 2,47 2,32 2,20 2,11 2,04 1,99 1,94 1,86 1,78 1,69 1,64 1,59 1,53 1,46 1,41 1,39 1,30 90100 3,94 3,09 2,70 2,46 2,31 2,19 2,10 2,03 1,97 1,93 1,85 1,77 1,68 1,63 1,57 1,52 1,45 1,39 1,38 1,28 100120 3,92 3,07 2,68 2,45 2,29 2,18 2,09 2,02 1,96 1,91 1,83 1,75 1,66 1,61 1,55 1,50 1,43 1,37 1,35 1,25 120Inf 3,84 3,00 2,60 2,37 2,21 2,10 2,01 1,94 1,88 1,83 1,75 1,67 1,57 1,52 1,46 1,39 1,32 1,24 1,22 1,00 Inf

1 2 3 4 5 6 7 8 9 10 12 15 20 24 30 40 60 100 120 Inf.

Gra

dos

de li

bert

ad d

el d

enom

inad

or: ν 2



025.0)53.4(: 8,7 =≥FPEjemplo

1 2 3 4 5 6 7 8 9 10 12 15 20 24 30 40 60 100 120 Inf.1 647,8 799,5 864,2 899,6 921,8 937,1 948,2 956,6 963,3 968,6 976,7 984,9 993,1 997,3 1001,4 1005,6 1009,8 1013,2 1014,0 1018,3 12 38,51 39,00 39,17 39,25 39,30 39,33 39,36 39,37 39,39 39,40 39,41 39,43 39,45 39,46 39,46 39,47 39,48 39,49 39,49 39,50 23 17,44 16,04 15,44 15,10 14,88 14,73 14,62 14,54 14,47 14,42 14,34 14,25 14,17 14,12 14,08 14,04 13,99 13,96 13,95 13,90 34 12,22 10,65 9,98 9,60 9,36 9,20 9,07 8,98 8,90 8,84 8,75 8,66 8,56 8,51 8,46 8,41 8,36 8,32 8,31 8,26 45 10,01 8,43 7,76 7,39 7,15 6,98 6,85 6,76 6,68 6,62 6,52 6,43 6,33 6,28 6,23 6,18 6,12 6,08 6,07 6,02 56 8,81 7,26 6,60 6,23 5,99 5,82 5,70 5,60 5,52 5,46 5,37 5,27 5,17 5,12 5,07 5,01 4,96 4,92 4,90 4,85 67 8,07 6,54 5,89 5,52 5,29 5,12 4,99 4,90 4,82 4,76 4,67 4,57 4,47 4,41 4,36 4,31 4,25 4,21 4,20 4,14 78 7,57 6,06 5,42 5,05 4,82 4,65 4,53 4,43 4,36 4,30 4,20 4,10 4,00 3,95 3,89 3,84 3,78 3,74 3,73 3,67 89 7,21 5,71 5,08 4,72 4,48 4,32 4,20 4,10 4,03 3,96 3,87 3,77 3,67 3,61 3,56 3,51 3,45 3,40 3,39 3,33 9

10 6,94 5,46 4,83 4,47 4,24 4,07 3,95 3,85 3,78 3,72 3,62 3,52 3,42 3,37 3,31 3,26 3,20 3,15 3,14 3,08 1011 6,72 5,26 4,63 4,28 4,04 3,88 3,76 3,66 3,59 3,53 3,43 3,33 3,23 3,17 3,12 3,06 3,00 2,96 2,94 2,88 1112 6,55 5,10 4,47 4,12 3,89 3,73 3,61 3,51 3,44 3,37 3,28 3,18 3,07 3,02 2,96 2,91 2,85 2,80 2,79 2,72 1213 6,41 4,97 4,35 4,00 3,77 3,60 3,48 3,39 3,31 3,25 3,15 3,05 2,95 2,89 2,84 2,78 2,72 2,67 2,66 2,60 1314 6,30 4,86 4,24 3,89 3,66 3,50 3,38 3,29 3,21 3,15 3,05 2,95 2,84 2,79 2,73 2,67 2,61 2,56 2,55 2,49 1415 6,20 4,77 4,15 3,80 3,58 3,41 3,29 3,20 3,12 3,06 2,96 2,86 2,76 2,70 2,64 2,59 2,52 2,47 2,46 2,40 1516 6,12 4,69 4,08 3,73 3,50 3,34 3,22 3,12 3,05 2,99 2,89 2,79 2,68 2,63 2,57 2,51 2,45 2,40 2,38 2,32 1617 6,04 4,62 4,01 3,66 3,44 3,28 3,16 3,06 2,98 2,92 2,82 2,72 2,62 2,56 2,50 2,44 2,38 2,33 2,32 2,25 1718 5,98 4,56 3,95 3,61 3,38 3,22 3,10 3,01 2,93 2,87 2,77 2,67 2,56 2,50 2,44 2,38 2,32 2,27 2,26 2,19 1819 5,92 4,51 3,90 3,56 3,33 3,17 3,05 2,96 2,88 2,82 2,72 2,62 2,51 2,45 2,39 2,33 2,27 2,22 2,20 2,13 1920 5,87 4,46 3,86 3,51 3,29 3,13 3,01 2,91 2,84 2,77 2,68 2,57 2,46 2,41 2,35 2,29 2,22 2,17 2,16 2,09 2021 5,83 4,42 3,82 3,48 3,25 3,09 2,97 2,87 2,80 2,73 2,64 2,53 2,42 2,37 2,31 2,25 2,18 2,13 2,11 2,04 2122 5,79 4,38 3,78 3,44 3,22 3,05 2,93 2,84 2,76 2,70 2,60 2,50 2,39 2,33 2,27 2,21 2,14 2,09 2,08 2,00 2223 5,75 4,35 3,75 3,41 3,18 3,02 2,90 2,81 2,73 2,67 2,57 2,47 2,36 2,30 2,24 2,18 2,11 2,06 2,04 1,97 2324 5,72 4,32 3,72 3,38 3,15 2,99 2,87 2,78 2,70 2,64 2,54 2,44 2,33 2,27 2,21 2,15 2,08 2,02 2,01 1,94 2425 5,69 4,29 3,69 3,35 3,13 2,97 2,85 2,75 2,68 2,61 2,51 2,41 2,30 2,24 2,18 2,12 2,05 2,00 1,98 1,91 2526 5,66 4,27 3,67 3,33 3,10 2,94 2,82 2,73 2,65 2,59 2,49 2,39 2,28 2,22 2,16 2,09 2,03 1,97 1,95 1,88 2627 5,63 4,24 3,65 3,31 3,08 2,92 2,80 2,71 2,63 2,57 2,47 2,36 2,25 2,19 2,13 2,07 2,00 1,94 1,93 1,85 2728 5,61 4,22 3,63 3,29 3,06 2,90 2,78 2,69 2,61 2,55 2,45 2,34 2,23 2,17 2,11 2,05 1,98 1,92 1,91 1,83 2829 5,59 4,20 3,61 3,27 3,04 2,88 2,76 2,67 2,59 2,53 2,43 2,32 2,21 2,15 2,09 2,03 1,96 1,90 1,89 1,81 2930 5,57 4,18 3,59 3,25 3,03 2,87 2,75 2,65 2,57 2,51 2,41 2,31 2,20 2,14 2,07 2,01 1,94 1,88 1,87 1,79 3040 5,42 4,05 3,46 3,13 2,90 2,74 2,62 2,53 2,45 2,39 2,29 2,18 2,07 2,01 1,94 1,88 1,80 1,74 1,72 1,64 4050 5,34 3,97 3,39 3,05 2,83 2,67 2,55 2,46 2,38 2,32 2,22 2,11 1,99 1,93 1,87 1,80 1,72 1,66 1,64 1,55 5060 5,29 3,93 3,34 3,01 2,79 2,63 2,51 2,41 2,33 2,27 2,17 2,06 1,94 1,88 1,82 1,74 1,67 1,60 1,58 1,48 6070 5,25 3,89 3,31 2,97 2,75 2,59 2,47 2,38 2,30 2,24 2,14 2,03 1,91 1,85 1,78 1,71 1,63 1,56 1,54 1,44 7080 5,22 3,86 3,28 2,95 2,73 2,57 2,45 2,35 2,28 2,21 2,11 2,00 1,88 1,82 1,75 1,68 1,60 1,53 1,51 1,40 8090 5,20 3,84 3,26 2,93 2,71 2,55 2,43 2,34 2,26 2,19 2,09 1,98 1,86 1,80 1,73 1,66 1,58 1,50 1,48 1,37 90100 5,18 3,83 3,25 2,92 2,70 2,54 2,42 2,32 2,24 2,18 2,08 1,97 1,85 1,78 1,71 1,64 1,56 1,48 1,46 1,35 100120 5,15 3,80 3,23 2,89 2,67 2,52 2,39 2,30 2,22 2,16 2,05 1,94 1,82 1,76 1,69 1,61 1,53 1,45 1,43 1,31 120Inf 5,02 3,69 3,12 2,79 2,57 2,41 2,29 2,19 2,11 2,05 1,94 1,83 1,71 1,64 1,57 1,48 1,39 1,30 1,27 1,00 Inf

1 2 3 4 5 6 7 8 9 10 12 15 20 24 30 40 60 100 120 Inf.

Gra

dos

de li

bert

ad d

el d

enom

inad

or: ν 2



01.0)18.6(: 8,7 =≥FPEjemplo

1 2 3 4 5 6 7 8 9 10 12 15 20 24 30 40 60 100 120 Inf.1 4052,2 4999,3 5403,5 5624,3 5764,0 5859,0 5928,3 5981,0 6022,4 6055,9 6106,7 6157,0 6208,7 6234,3 6260,4 6286,4 6313,0 6333,9 6339,5 6365,6 12 98,50 99,00 99,16 99,25 99,30 99,33 99,36 99,38 99,39 99,40 99,42 99,43 99,45 99,46 99,47 99,48 99,48 99,49 99,49 99,50 23 34,12 30,82 29,46 28,71 28,24 27,91 27,67 27,49 27,34 27,23 27,05 26,87 26,69 26,60 26,50 26,41 26,32 26,24 26,22 26,13 34 21,20 18,00 16,69 15,98 15,52 15,21 14,98 14,80 14,66 14,55 14,37 14,20 14,02 13,93 13,84 13,75 13,65 13,58 13,56 13,46 45 16,26 13,27 12,06 11,39 10,97 10,67 10,46 10,29 10,16 10,05 9,89 9,72 9,55 9,47 9,38 9,29 9,20 9,13 9,11 9,02 56 13,75 10,92 9,78 9,15 8,75 8,47 8,26 8,10 7,98 7,87 7,72 7,56 7,40 7,31 7,23 7,14 7,06 6,99 6,97 6,88 67 12,25 9,55 8,45 7,85 7,46 7,19 6,99 6,84 6,72 6,62 6,47 6,31 6,16 6,07 5,99 5,91 5,82 5,75 5,74 5,65 78 11,26 8,65 7,59 7,01 6,63 6,37 6,18 6,03 5,91 5,81 5,67 5,52 5,36 5,28 5,20 5,12 5,03 4,96 4,95 4,86 89 10,56 8,02 6,99 6,42 6,06 5,80 5,61 5,47 5,35 5,26 5,11 4,96 4,81 4,73 4,65 4,57 4,48 4,41 4,40 4,31 9

10 10,04 7,56 6,55 5,99 5,64 5,39 5,20 5,06 4,94 4,85 4,71 4,56 4,41 4,33 4,25 4,17 4,08 4,01 4,00 3,91 1011 9,65 7,21 6,22 5,67 5,32 5,07 4,89 4,74 4,63 4,54 4,40 4,25 4,10 4,02 3,94 3,86 3,78 3,71 3,69 3,60 1112 9,33 6,93 5,95 5,41 5,06 4,82 4,64 4,50 4,39 4,30 4,16 4,01 3,86 3,78 3,70 3,62 3,54 3,47 3,45 3,36 1213 9,07 6,70 5,74 5,21 4,86 4,62 4,44 4,30 4,19 4,10 3,96 3,82 3,66 3,59 3,51 3,43 3,34 3,27 3,25 3,17 1314 8,86 6,51 5,56 5,04 4,69 4,46 4,28 4,14 4,03 3,94 3,80 3,66 3,51 3,43 3,35 3,27 3,18 3,11 3,09 3,00 1415 8,68 6,36 5,42 4,89 4,56 4,32 4,14 4,00 3,89 3,80 3,67 3,52 3,37 3,29 3,21 3,13 3,05 2,98 2,96 2,87 1516 8,53 6,23 5,29 4,77 4,44 4,20 4,03 3,89 3,78 3,69 3,55 3,41 3,26 3,18 3,10 3,02 2,93 2,86 2,84 2,75 1617 8,40 6,11 5,19 4,67 4,34 4,10 3,93 3,79 3,68 3,59 3,46 3,31 3,16 3,08 3,00 2,92 2,83 2,76 2,75 2,65 1718 8,29 6,01 5,09 4,58 4,25 4,01 3,84 3,71 3,60 3,51 3,37 3,23 3,08 3,00 2,92 2,84 2,75 2,68 2,66 2,57 1819 8,18 5,93 5,01 4,50 4,17 3,94 3,77 3,63 3,52 3,43 3,30 3,15 3,00 2,92 2,84 2,76 2,67 2,60 2,58 2,49 1920 8,10 5,85 4,94 4,43 4,10 3,87 3,70 3,56 3,46 3,37 3,23 3,09 2,94 2,86 2,78 2,69 2,61 2,54 2,52 2,42 2021 8,02 5,78 4,87 4,37 4,04 3,81 3,64 3,51 3,40 3,31 3,17 3,03 2,88 2,80 2,72 2,64 2,55 2,48 2,46 2,36 2122 7,95 5,72 4,82 4,31 3,99 3,76 3,59 3,45 3,35 3,26 3,12 2,98 2,83 2,75 2,67 2,58 2,50 2,42 2,40 2,31 2223 7,88 5,66 4,76 4,26 3,94 3,71 3,54 3,41 3,30 3,21 3,07 2,93 2,78 2,70 2,62 2,54 2,45 2,37 2,35 2,26 2324 7,82 5,61 4,72 4,22 3,90 3,67 3,50 3,36 3,26 3,17 3,03 2,89 2,74 2,66 2,58 2,49 2,40 2,33 2,31 2,21 2425 7,77 5,57 4,68 4,18 3,85 3,63 3,46 3,32 3,22 3,13 2,99 2,85 2,70 2,62 2,54 2,45 2,36 2,29 2,27 2,17 2526 7,72 5,53 4,64 4,14 3,82 3,59 3,42 3,29 3,18 3,09 2,96 2,81 2,66 2,58 2,50 2,42 2,33 2,25 2,23 2,13 2627 7,68 5,49 4,60 4,11 3,78 3,56 3,39 3,26 3,15 3,06 2,93 2,78 2,63 2,55 2,47 2,38 2,29 2,22 2,20 2,10 2728 7,64 5,45 4,57 4,07 3,75 3,53 3,36 3,23 3,12 3,03 2,90 2,75 2,60 2,52 2,44 2,35 2,26 2,19 2,17 2,06 2829 7,60 5,42 4,54 4,04 3,73 3,50 3,33 3,20 3,09 3,00 2,87 2,73 2,57 2,49 2,41 2,33 2,23 2,16 2,14 2,03 2930 7,56 5,39 4,51 4,02 3,70 3,47 3,30 3,17 3,07 2,98 2,84 2,70 2,55 2,47 2,39 2,30 2,21 2,13 2,11 2,01 3040 7,31 5,18 4,31 3,83 3,51 3,29 3,12 2,99 2,89 2,80 2,66 2,52 2,37 2,29 2,20 2,11 2,02 1,94 1,92 1,80 4050 7,17 5,06 4,20 3,72 3,41 3,19 3,02 2,89 2,78 2,70 2,56 2,42 2,27 2,18 2,10 2,01 1,91 1,82 1,80 1,68 5060 7,08 4,98 4,13 3,65 3,34 3,12 2,95 2,82 2,72 2,63 2,50 2,35 2,20 2,12 2,03 1,94 1,84 1,75 1,73 1,60 6070 7,01 4,92 4,07 3,60 3,29 3,07 2,91 2,78 2,67 2,59 2,45 2,31 2,15 2,07 1,98 1,89 1,78 1,70 1,67 1,54 7080 6,96 4,88 4,04 3,56 3,26 3,04 2,87 2,74 2,64 2,55 2,42 2,27 2,12 2,03 1,94 1,85 1,75 1,65 1,63 1,49 8090 6,93 4,85 4,01 3,53 3,23 3,01 2,84 2,72 2,61 2,52 2,39 2,24 2,09 2,00 1,92 1,82 1,72 1,62 1,60 1,46 90100 6,90 4,82 3,98 3,51 3,21 2,99 2,82 2,69 2,59 2,50 2,37 2,22 2,07 1,98 1,89 1,80 1,69 1,60 1,57 1,43 100120 6,85 4,79 3,95 3,48 3,17 2,96 2,79 2,66 2,56 2,47 2,34 2,19 2,03 1,95 1,86 1,76 1,66 1,56 1,53 1,38 120Inf 6,63 4,61 3,78 3,32 3,02 2,80 2,64 2,51 2,41 2,32 2,18 2,04 1,88 1,79 1,70 1,59 1,47 1,36 1,32 1,00 Inf

1 2 3 4 5 6 7 8 9 10 12 15 20 24 30 40 60 100 120 Inf.


¿Existen diferencias entre las cuatro semillas?

Se desea comparar el rendimiento de cuatro semillas A,B,C y D. Un terreno se divide en 24 parcelas similares y se asigna al azar cada semilla a 6 parcelas.

A B C D229.1 233.4 211.1 270.4253.7 233.0 223.1 248.6241.3 219.2 217.5 230.0254.7 200.0 211.8 250.7237.2 224.3 207.6 230.0241.3 202.0 213.7 245.8242.9 218.7 214.1 245.9


Método: 4 pasos

Definición del modelo de distribución de probabilidad:

Hipótesis

Parámetros

Estimación de los parámetros

Diagnosis de las hipótesis

Aplicación


Modelo

µ1

σ

µ2

σ

µK

σ...

11

12

11

ny

y

y

M

22

22

21

ny

y

y

M

KKn

K

K

y

y

y

M2

1

...


Hipótesis del modelo

Normalidadyij ⇒ N(µi,σ2)

HomocedasticidadVar [yij] = σ2

IndependenciaCov [yij, ykl] = 0


Modelo: Hipótesis y Parámetros

Hipótesis básicas:Normalidad

yij ⇒ N(µi,σ2)

Homocedasticidad

Var [yij] = σ2

Independencia

Cov [yij, ykl] = 0

Parámetros

2

2

1

σ

µ

µµ

K

M


Modelo: Forma alternativa

),0(, 2σµ Nuuy ijijiij →+=

Las observaciones se descomponen en:

Parte predecible

Parte aleatoriaiµ

0

σ

iju


Estimación medias:Max. Verosímil

K

n

jKj

KK

n

jj

n

jj

n

y

y

n

y

y

n

y

y

K

∑

∑

∑

=•

=•

=•

=→

=→

=→

1

2

12

22

1

11

11

:

:

:

2

1

µ

µ

µ

M

A B C D229.1 233.4 211.1 270.4253.7 233.0 223.1 248.6241.3 219.2 217.5 230.0254.7 200.0 211.8 250.7237.2 224.3 207.6 230.0241.3 202.0 213.7 245.8242.9 218.7 214.1 245.9


Estimación varianza (residuos)

Kn

e

s

e

yye

yu

Nuuy

K

i

n

jij

R

ij

iijij

iijij

ijijiij

i

−=→

−=

−=

→+=

∑ ∑= =

•

1 1

2

22

2

ˆ:

:

),0(,

σ

µ

σµ

RESIDUO

4.142ˆ2 =Rs

A B C D-13.8 14.8 -3.0 24.510.8 14.4 9.0 2.7-1.6 0.6 3.4 -15.911.8 -18.7 -2.3 4.8-5.7 5.7 -6.5 -15.9-1.6 -16.7 -0.4 -0.10.0 0.0 0.0 0.0

Residuos


Comparación de medias

La comparación de tratamientos con este modelo se reduce a comparar las medias µ1, µ2, ..., µK , en primer lugar con el contraste:

diferente es una menos Al:

:

1

210

H

H Kµµµ === L


Descomposición de la variabilidad

∑ ∑∑∑ ∑

∑ ∑∑ ∑∑ ∑

∑ ∑

∑∑

= =•

=•••

= =••

= =•

= =•••

= =••

= =••••

••••••

••••

−+−=−

−+−=−

=−−

−+−=−

=−+=⇒+=

K

i

n

jiij

K

iii

K

i

n

jij

K

i

n

jiij

K

i

n

ji

K

i

n

jij

K

i

n

jiiji

iijiij

ijiijiijijiij

ii

iii

i

yyyynyy

yyyyyy

yyyy

i,j

yyyyyyn

yyyyyyuy

1 1

2

1

2

1 1

2

1 1

2

1 1

2

1 1

2

1 1

)()()(

)()()(

)0))(( donde(

todopara sumandoy cuadrado al elevando

)()(

, restando:)(µ


Variabilidades

n-KeyyVNE

K-yynVE

n-yyVT

K

i

n

jij

K

i

n

jiij

K

iii

K

i

n

jij

ii

i

∑ ∑∑ ∑

∑

∑ ∑

= == =•

=•••

= =••

=−=

−=

−=

1 1

2

1 1

2

1

2

1 1

2

)(

1)(

1)(

libertad de GradosadesVariabilid

)()1(1 KnKn

VNEVEVT

−+−=−+=


Descomposición: ejemplo

229.1 233.4 211.1 270.4 242.9 218.7 214.1 245.9 -13.8 14.8 -3.0 24.5253.7 233.0 223.1 248.6 242.9 218.7 214.1 245.9 10.8 14.4 9.0 2.7241.3 219.2 217.5 230.0 242.9 218.7 214.1 245.9 -1.6 0.6 3.4 -15.9254.7 200.0 211.8 250.7 242.9 218.7 214.1 245.9 11.8 -18.7 -2.3 4.8237.2 224.3 207.6 230.0 242.9 218.7 214.1 245.9 -5.7 5.7 -6.5 -15.9241.3 202.0 213.7 245.8 242.9 218.7 214.1 245.9 -1.6 -16.7 -0.4 -0.1

-1.3 3.0 -19.3 40.0 12.5 -11.7 -16.3 15.5 -13.8 14.8 -3.0 24.523.3 2.6 -7.3 18.2 12.5 -11.7 -16.3 15.5 10.8 14.4 9.0 2.710.9 -11.2 -12.9 -0.4 12.5 -11.7 -16.3 15.5 -1.6 0.6 3.4 -15.924.3 -30.4 -18.6 20.3 12.5 -11.7 -16.3 15.5 11.8 -18.7 -2.3 4.86.8 -6.1 -22.8 -0.4 12.5 -11.7 -16.3 15.5 -5.7 5.7 -6.5 -15.910.9 -28.4 -16.7 15.4 12.5 -11.7 -16.3 15.5 -1.6 -16.7 -0.4 -0.1

= +

Datos Medias Residuos

= +

••− yyij ••• − yyi •− iij yy

4.230=••y


Variabilidades: ejemplo

204.2847

311.4798)(

2315.7645)(

libertad de GradosadesVariabilid

1 1

2

1

2

1 1

2

===

==−=

==−=

∑ ∑

∑

∑ ∑

= =

=•••

= =••

n-KeVNE

K-yynVE

n-yyVT

K

i

n

jij

K

iii

K

i

n

jij

i

i

20323

4.28471.47985.7645

+=+=


Interpretación gráfica de la descomposición

•− iij yy••• − yyi

•1y

•2y

•3y

•4y

••y ••− yy ij


Distribución de VE

21

22

2

22

1

1

222

2

22

1

1

2

21

22

///

///

),(

llamaremos que Si

),(),(

−•••••••••

•••

•

•

→

−++

−+

−

→

−++

−+

−

→

===

→⇒→

KK

K

KK

K

ii

K

iiiiij

n

yy

n

yy

n

yy

n

y

n

y

n

y

nNy

nNyNy

χσσσ

χσ

µσ

µσ

µ

σµ

µµµµ

σµσµ

L

L

L

µi

σ


Distribución de VNE

221

21

21

2

2

2

222

2

211

2

2

2222

211

1

2

1

222

1

211

1 1

2

2

212

21

2

22

21

ˆ)1(ˆ)1(ˆ)1(ˆ)(

ˆ)1(ˆ)1(ˆ)1(

)()()()(

ˆ

ˆ)1(1

)(

ˆ),(

21

Knnnn

KKR

KK

n

jKKj

n

jj

n

jj

K

i

n

jiij

R

nii

i

n

jiij

iiij

K

i

i

i

snsnsnsKn

Knsnsnsn

Kn

yyyyyy

Kn

yy

s

snn

yy

sNy

K

−−−−

=•

=•

=•

= =•

−=

•

=+++=

−++−+−=−

−−++−+−=

−

−++−+−=

−

−=

→−

→−

−=⇒→

∑∑∑∑ ∑

∑

χχχχσσσσ

χσ

σµ

L

L

L

L


Contraste (Análisis de la Varianza)

00

00

,10

212

1

2

22

2

rechaza Se

rechaza se No

2ˆ)1(

1

2)(

)( :cierto es Ho Siˆ)(

HFF

HFF

F

RsK

K

iyiyin

F

yynsKn

KnK

K

K

iii

KnR

⇒>⇒≤

→−

∑=

••−•=

→−

•→−

•

−−

−=

•••

−

∑

α

α

χσ

χσ

diferente es una menos Al:

:

1

210

H

H Kµµµ === L


Tabla de Análisis de la Varianza

1)(

)(

ˆ)1(

)()1/()(1)(

2

2

2

222

Total

Residual

osTratamient

FVarianzasLibertadCuadradosFuentesdeGradosde Suma

2ˆ

−−

−−

−

−−−−−

∑∑

∑∑

∑∑∑

••

•

•••••••••

nyy

Knyy

sK

yynKyynKyyn

ij

iij

R

iiiiii

Rs


Tabla de Análisis de la Varianza

235.7645Total

4.142204.2847Residual2.113.159931.4798osTratamient

FVarianzasLibertadCuadradosFuentes

deGradosde Suma


tα/2-tα/2

α/2

tn-K

R.R. R.R

R. Acept. H0

1-αα/2

Intervalos de confianza para las medias

inRs

tiyi

Kn

i

R

ii

i

ii

iiiiij

t

n

s

y

N

n

y

nNyNy

ˆ2/

ˆ

)1,0(

),(),(2

2

αµ

µ

σµ

σµσµ

±•∈

−•

•

•

→−

→−

→⇒→



Semilla Media L. Inferior L. SuperiorA 242.9 235.7 250.1B 218.7 211.4 225.8C 214.1 206.9 221.3D 245.9 238.7 253.1


Intervalos de confianza (95%)

Semilla

Ren

dim

ient

o

A B C D200

210

220

230

240

250

260


Diferencia de medias:

),(1

2

11

1

12

11

1

nNy

y

y

y

n

σµ→

•M),(

2

2

22

2

22

21

2

nNy

y

y

y

n

σµ→

•M

σ

µ1 µ2

σ

Kn

R

t

nns

yyN

nn

yynn

Nyy

−••

••

••

→+

−−−⇒

→+

−−−

+−→−

21

2121

21

2121

2

2

1

2

2121

11ˆ

)()()1,0(

11

)()(

),(

µµ

σ

µµ

σσµµ

•• − 21 yy


tα/2-tα/2

α/2

tn-K

R.R. R.R

R. Acept. H0

1-αα/2

Contraste multiples

ji

ji

H

H

µµ

µµ

≠

=

:

:

1

0

02/0

02/0

rechaza e

rechaza se No

HStt

Htt

⇒>

⇒≤

α

α

Kn

jiR

jiij t

nns

yyt −

•• →+

−=

11ˆ

Diagnosis del modelo

Estadística-2002


µ1

σ

µ2

σ

µK

σ...

Modelo

11

12

11

ny

y

y

M

22

22

21

ny

y

y

M

KKn

K

K

y

y

y

M2

1

...



Normalidadyij ⇒ N(µi,σ2)

HomocedasticidadVar [yij] = σ2

IndependenciaCov [yij, ykl] = 0


σ

Residuos: Normales y homocedásticos

),0( 2σ

µ

µ

Nu

yu

uy

ij

iijij

ijiij

→

−=

+=

A B C D-13,8 14,8 -3,0 24,510,8 14,4 9,0 2,7-1,6 0,6 3,4 -15,911,8 -18,7 -2,3 4,8-5,7 5,7 -6,5 -15,9-1,6 -16,7 -0,4 -0,10,0 0,0 0,0 0,0

Residuos

0

•−= iijij yye


Comprobación de la normalidad

Los residuos deben de tener distribución normal. Las observaciones originales también, pero cada grupo con media diferente, por ello es preciso estimar el modelo para descontar a cada observación su media y obtener valores con la misma distribución.

Herramientas de comprobación:Histograma de residuos

Gráfico de probabilidad normal (Q-Q plot)

Contrastes formales (Kolmogorov-Smirnov)


Gráfico probabilista normal

Es un gráfico X-Y de los residuos frente a los percentiles de la distribución normal.

La idea básica es que cuando los residuos tienen distribución normal, los puntos deben formar aproximadamente una línea recta

Pasos:Ordenar los residuos de menor a mayor.

Calcular los percentiles de la distribución normal

Representar

nisn

iY Ri ,...,2,1,ˆ)

5.0(1 =×−

Φ= −

)()2()1( neee ≤≤≤ L

ii Ye ,)(


Gráfico prob. Normal (ejemplo)

Q-Q plot

-30,0

-20,0

-10,0

0,0

10,0

20,0

30,0

-30,0 -20,0 -10,0 0,0 10,0 20,0 30,0

Residuos ordenados

Perc

entil

es

Orden Resid. Probab. Percen. Percen.i eij (i-0.5)/n N(0,1) N(0, )1 -18,7 0,021 -2,04 -24,302 -16,7 0,063 -1,53 -18,303 -15,9 0,104 -1,26 -15,014 -15,9 0,146 -1,05 -12,585 -13,8 0,188 -0,89 -10,586 -6,5 0,229 -0,74 -8,857 -5,7 0,271 -0,61 -7,288 -3,0 0,313 -0,49 -5,839 -2,3 0,354 -0,37 -4,4610 -1,6 0,396 -0,26 -3,1511 -1,6 0,438 -0,16 -1,8812 -0,4 0,479 -0,05 -0,6213 -0,1 0,521 0,05 0,6214 0,6 0,563 0,16 1,8815 2,7 0,604 0,26 3,1516 3,4 0,646 0,37 4,4617 4,8 0,688 0,49 5,8318 5,7 0,729 0,61 7,2819 9,0 0,771 0,74 8,8520 10,8 0,813 0,89 10,5821 11,8 0,854 1,05 12,5822 14,4 0,896 1,26 15,0123 14,8 0,938 1,53 18,3024 24,5 0,979 2,04 24,30

σ



Residuos

Pro

babi

lida

d

-30 -20 -10 0 10 20 300.1

1

5

20

50

80

95

99

99.9


Ejemplos

-3 -1 1 3 50,1

1

520

50

80

95

9999,9

-2,6 -1,6 -0,6 0,4 1,4 2,4 3,40,1

1

520

50

80

95

9999,9

0 3 6 9 12 150,1

1

520

50

80

95

9999,9

0 0,4 0,8 1,2 1,6 20,1

1

520

50

80

95

9999,9

Normal No normal

No normal No normal


Comprobación de la homocedasticidad

En el proceso de estimación se ha supuesto que los distintos tratamientos tienen la misma varianza

HerramientasGráficos de residuos:

Frente a valores previstos

Frente a tratamientos (o factor,etc.)

Contrastes formales:

Bartlett, Cochran, Hartley, Levene


Residuos - Valores previstos

En este modelo los valores previstos corresponden a la media del tratamiento

Los puntos deben aparecer dispuestos al azar en una banda horizontal alrededor del eje horizontal.

Heterocedasticidad: a veces la dispersión aumenta conforme la media crece.

resi

duos

Valores previstos

-30

-20

-10

0

10

20

30

0 5 10 15

resi

duos

valores previstos

-30

-20

-10

0

10

20

30

210 220 230 240 250


Residuos por tratamientos

A B C D-25

-15

-5

5

15

25

Res

iduo

s

Semilla

En cada grupo los residuos aparecen esparcidos con dispersión similar y media cero.

máx

.

mín

.


Residuos por tratamientos

A B C D-25

-15

-5

5

15

25

Res

iduo

s

Semilla

En cada grupo los residuos aparecen esparcidos con dispersión similar y media cero.

máx

.

mín

.

3mín

máx<


Contrastes formales

µ1

σ1

µ2

σ2

µK

σK...

distinta es Alguna :

:

1

222

210

H

H Kσσσ === L


Contraste de Bartlettn1=n2=···=nK=m

1

)(ˆ

2112

1

1

12

11

−

−=

∑ •

m

yys

y

y

y

j

m

M 1

)(ˆ

2222

2

2

22

21

2

−

−=

∑ •

m

yys

y

y

y

j

n

M

µ1

σ1

µ2

σ2

µK

σK...

1

)(ˆ

222

1

−

−=

∑ •

m

yys

y

y

y

KKjK

Km

K

K

M...

KKG

KR

ssss

K

ssss

222

21

2

222

212

ˆˆˆˆ

ˆˆˆˆ

×××=

+++=

L

L2

12

2

ˆ

ˆlog

1 −→

+−

KG

R

s

s

c

Kn χSi Ho cierto )(3

1

Kn

Kc

−+

=


Contraste de Bartlett (general)

Kn

snsnsns KK

R −−++−+−

=22

222112 ˆ)1(ˆ)1(ˆ)1(

ˆL

212

2

ˆ

ˆlog

1 −→

+−

KG

R

s

s

c

Kn χSi Ho cierto

−−

−−= ∑

=

K

i i KnnKc

1

1

1

1

)1(3

1

( ) ( ) ( )Kn nK

nnG

Kssss − −−−×××=

12122

121

2 ˆˆˆˆ 21L


Contraste de Bartlett: ejemplo

A B C D229,1 233,4 211,1 270,4253,7 233,0 223,1 248,6241,3 219,2 217,5 230,0254,7 200,0 211,8 250,7237,2 224,3 207,6 230,0241,3 202,0 213,7 245,8

Medias 242,9 218,7 214,1 245,9

Varianzas 96,8 216,2 29,9 227,2

Datos

1.1092.2279.292.2168.96ˆ

4.1424

2.2279.292.2168.96ˆ

42

2

=×××=

=+++

=

G

R

s

s

91.41.109

4.142log

)60/5(1

20

ˆ

ˆlog

1 2

220

=+

=

+−

=G

R

s

s

c

Knχ

0 4 8 12 160

5 177.0=− valorp

0.010.05

23χ

resi

duos

Valores previstos

-0,43

-0,23

-0,03

0,17

0,37

0,57

0 0,3 0,6 0,9 1,2 1 2 3-0,43

-0,23

-0,03

0,17

0,37

0,57

resi

duos

Tratamientos

-0,33 -0,13 0,07 0,27 0,47

residuos

0,1

15

20

50

80

9599

99,9

prob

abil

idad

Diagnosis: Tres gráficos básicos

Normalidad

Homocedasticidad



-0,33 -0,13 0,07 0,27 0,47

residuos

0,1

15

20

50

80

9599

99,9

prob

abil

idad


Transformaciones para estabilizar la varianza

[ ] ][Var)('][Var

Var)2

1)

aprox.son z de sy varianza media La

))((''2

1))((')(

E[y]en )( paraTaylor de Desarrollo

2

2

yhz

(y)h''(µ h(µE[z]

yhyhhz

yhz

µ

µµµµµ

µ

≈

+≈

−+−+≈

==

)(yhz =


Ejemplo

][Var][Var

E[z]

son de sy varianza media La

2 ybz

b a

z

=

+= µ

byaz +=

bz de depende ]Var[ La

Observación: Esta transformación no altera las características de y: si y no tiene varianza constante, z tampoco.


Ejemplo

][Var1

][Var

Var2

1)log

aprox.son desy varianzamedia La

2

2

yz

(y) (µ E[z]

z

µ

µ

≈

−≈

)log(yz =

kzkµy ≈⇒≈ ]Var[ ]Var[ Si 2

yij heterocedásticas

z ij homocedásticas

)( ijij yhz =


Transformaciones Box-Cox

-1,5

-1

-0,5

0

0,5

1

1,5

0log

1

==

−=

psiyz

p

yz

ijij

pij

ij

1ijy

ijz

p = 1

p < 1

p > 1


Búsqueda de la transformación adecuada

La dispersión aumenta al aumentar la media

p < 1

La dispersión disminuye al aumentar la media

p > 1

resi

duos

Valores previstos

-0,43

-0,23

-0,03

0,17

0,37

0,57

0 0,3 0,6 0,9 1,2

resi

duos

valores previstos

-1,4

-0,9

-0,4

0,1

0,6

1,1

1,6

0 4 8 12 16


Elección de la transformación

Empezar con p=1 (datos sin transformar) y decidir a partir de los gráficos si p>1 o p<1.

Parar cuando los gráficos estén ok

pijij yz =

=⇒−=

=⇒−=

=⇒==⇒=

→<

MMM

2

11

12/1

log0

2/1

1

ijij

ijij

ijij

ijij

yzp

yzp

yzp

yzp

p


Independencia

Es la hipótesis fundamental y con diferencia la más importante de las tres, además es la más difícil de comprobar.La falta de independencia suele ir ligada a factores no controlados por el experimentador y que influyen en los resultados introduciendo errores sistemáticos. La forma más recomendable de evitar errores sistemáticos consiste en aleatorizar.


Aleatorización

La aleatorización evita que se produzcan errores que sistemáticamente aumenten o disminuyan un conjunto de medidas por causas no reconocibles: al aleatorizar se reparten estos errores por igual entre los diferentes tratamientos y se convierten en errores aleatorios, previstos en el modelo.


¿Cómo aleatorizar?

Asignar las unidades experimentales al azar a los distintos tratamientos.

Aleatorizar el orden de ejecución de los experimentos.

Aleatorizar respecto a cualquier otra variable que implique diferenciar a los tratamientos.

“La aleatorización es una precaución contra distorsiones que pueden ocurrir o no ocurrir, y que puedieran ser serias o no si llegaran a ocurrir”

Capítulo 4. Análisis de la varianza

4.1 Se estudian los Km recorridos antes del desgaste de dos tipos de neumáticos con los resultadossiguientes:

Tipo ni xi(Km) bsi(Km)A 121 27465 2500B 121 27572 3000

(a) Calcular, con α = 0.05,un intervalo de confianza paraσ21σ22.

(b) Un intervalo de confianza para µ1 − µ2.

4.2 Se dispone de rendimientos de dos máquinas. Los resultados de la máquina A son 137.5; 140.7;106.9; 175.1; 177.3; 120.4; 77.9 y 104.2, mientras que los reultados para la B son: 103.3; 121.7; 98.4;161.5; 167.8 y 67.3. ¿Son las máquinas iguales? (Suponer que los rendimientos de ambas máquinassiguen distribuciones normales).

4.3 Un fabricante de automóviles debe elegir entre un determinado tipo de piezas de acero suministradaspor un proveedor A y otras suministradas por otro proveedor B. Para proceder a la elección se haanalizado la resistencia a la tracción de las piezas suministradas por ambos proveedores, tomandouna muestra de tamaño 10 de las piezas del primero, y otra de tamaño 12 del segundo. La resistenciamedia de la muestra de A es de 54000 unidades y la de la muestra de B es de 49000 unidades, siendolas desviaciones típicas muestrales corregidas bsA = 2100 y bsB = 1900. Las resistencias de las piezasde ambos proveedores se distribuyen normalmente. Las piezas del proveedor B son más baratasque las del proveedor A, por lo que estas últimas sólo son rentables si tienen una resistencia mediaal menos 2000 unidades mayor que las de B, y la misma variabilidad.

(a) ¿A qué proveedor habría que comprar las piezas a la vista de los resultados muestrales?(b) Obtener un intervalo de confianza del 90\% para la diferencia de medias de la resistencia

de las piezas de los proveedores A y B.

4.4 En una fábrica de automóviles se utiliza una misma planta para el ensamblaje de tres modelosdistintos (A,B y C). Para determinar si los modelos reciben el mismo tratamiento, se ha realizadoun control de calidad a una muestra tomada para cada modelo. El número de defectos encontradospara cinco vehículos del modelo A son 5, 4, 6, 6 y 7; para seis vehículos del modelo B son 7, 8, 6, 7, 6y 5;y para ocho vehículos del modelo C: 9, 7, 8, 9, 10, 11, 10 y 10. Contrastar si existen diferenciasen el tratamiento que se da a los distintos modelos.

4.5 Cinco tipos (A, B, C, D y E) de material sintético se han sometido a un ensayo de desgaste. Paracada tipo de material la prueba se repitio 6 veces. El desgaste medio y la desviación típica corregidaen cada caso es la siguiente:

A B C D Emedia xi 14.1 16.3 13.5 14.8 15.3d. típica si 1.3 1.2 1.4 1.2 1.5

1

(a) Contrastar (α = 0.05) la hipótesisH0 : µA = µB = µC = µD = µEfrente a la hipótesis alternativa,H1 : Alguna media es distinta a las demás.Indicar con nivel de confianza 0.95 el material con desgaste menor y qué materiales tienendesgaste medio, distinto.

(b) Obtener un intervalo de confianza con α = 0.01 para la varianza del error experimental.

4.6 Se mide la temperatura de una mezcla con cuatro termómetros, obteniéndose los datos siguientes:

Termómetro1 63 63 62 65 662 64 64 63 64 653 58 59 59 684 61 61 62 60 63

(a) ¿Son los cuatro termómetros análogos?(b) Analizar si se verifican las hipótesis básicas del modelo ADEVA mediante los residuos.(c) Elimine el tercer termómetro y calcule la tabla ADEVA para comparar los otros tres

termómetros. ¿Qué conclusiones pueden extraerse?

4.7 Se desea comprobar el efecto de un tratamiento térmico sobre la resistencia de un nuevo material.Se han tomado 15 probetas y se han asignado al azar a los tres tratamientos T1, T2 y T3 obteniendocomo medida de resistencia superficial los valores siguientes:

T1 T2 T32.65 4.31 4.812.67 3.96 5.322.46 4.64 4.931.90 4.74 5.492.62 4.00 4.45

(a) Contrastar mediante el test de análisis de la varianza si existen diferencias significativasentre los tratamientos térmicos (α = 0.01).

(b) La temperatura del tratamiento 2 es la media de las temperaturas de los otros dostratamientos. Si la relación entre la resistencia y la temperatura es lineal, es de esperarque la media del tratamiento 2 verifique : H0 : µ2 =

12(µ1 + µ3). Hacer el contraste

bilateral de esta hipótesis con α = 0.05. (Nota.- Usar la distribución de y2 − (y1 + y3)/2,donde yi es la media de los datos correspondientes al tratamiento Ti).

4.8 En un modelo de análisis de la varianza se ha observado que la desviación típica (si) y la media(yi) de las observaciones de cada tratamiento están relacionadas linealmente, si = kyi, donde kes una constante. ¿ Cuál de las siguientes transformaciones es la más adecuada para corregir laheterocedasticidad ? z = log y, z = y2 o z = ky

2

5. Diseño de experimentos

Estadística 2004-2005

Bloques Aleatorizados

3Diseño Experimentos

Ejemplo de introducción

Se desea estudiar el efecto de la Fluorita en la reducción del coste energético en la fabricación de cemento. Se emplean 6 mezclas distintas de materias primas.

0% 1% 2% 3% 4%M 1 15.02 11.86 9.94 12.45 13.23

e 2 8.42 10.15 8.54 6.98 8.93

z 3 18.31 16.84 15.86 14.64 15.96

c 4 10.49 10.52 8.04 10.50 10.34

l 5 9.78 9.59 6.96 8.15 9.24

a 6 9.28 8.84 7.04 6.66 9.46

Fluorita


Modelo

ijjiij uy +++= βαµ

µ : Media globalαi : Efecto del tratamiento i, i=1,...,Iβj : Efecto del bloque j, j=1,2,...,Juij : Componente aleatoria N(0,σ2)

IJJJ

I

I

yyyJ

yyy

yyy

I

L

MOMMM

L

L

L

21

22212

12111

2

1

21Tratamientos

Blo

ques •Normalidad

•Independencia

•Homocedasticidad

∑ = =Ii i1 0α

∑ = =Jj j1 0β

σ σ σ...11 βαµ ++ 12 βαµ ++ 1βαµ ++ I

σ σ σ...21 βαµ ++ 22 βαµ ++ 2βαµ ++ I

σ σ σ...Jβαµ ++ 1 Jβαµ ++ 2 JI βαµ ++

M M MO

Tratamientos1 2 I

1

2

J

...B

loqu

es

M


Estimación del modelo

→

−→−→

→

1:

1:

1:

1:

:Parámetros

2j

i

σβαµ

J

I

n

y

yI

yy

J

y

y

I

i

J

jij

I

iij

j

J

jij

i

∑ ∑∑∑= =

••=

•=

• === 1 111

−−==

−=−=

=

∑∑•••

•••

••

)1)(1(ˆˆ

ˆˆ

ˆ

:sEstimadore2

22

JI

es

yy

yy

y

ijR

jj

ii

σ

βα

µ

ijjiij

ijjiij

ey

uy

+++=

+++=

βαµ

βαµˆˆˆ •••• +−−=

−−−=

yyyy

ye

jiij

jiijij βαµ ˆˆˆ


Estimación

•••••••••

•••••

••••

••••

••••

−−−

−

−−

yyyyyy

yyyy

yyyyyyJ

yyyyyy

yyyyyy

I

Ii

I

JJIJJJ

I

I

j

L

L

L

MMMOMMM

L

L

L

21

21

21

2222212

1112111

ˆ

2

1

ˆ21

α

β


Estimación (ejemplo)

0% 1% 2% 3% 4%M 1 15.02 11.86 9.94 12.45 13.23 12.50 1.77

e 2 8.42 10.15 8.54 6.98 8.93 8.60 -2.13

z 3 18.31 16.84 15.86 14.64 15.96 16.32 5.59

c 4 10.49 10.52 8.04 10.50 10.34 9.98 -0.76

l 5 9.78 9.59 6.96 8.15 9.24 8.74 -1.99

a 6 9.28 8.84 7.04 6.66 9.46 8.26 -2.4811.88 11.30 9.40 9.90 11.19 10.731.15 0.57 -1.34 -0.84 0.46

Fluorita

αi

βj


Residuos: Varianza residual

0% 1% 2% 3% 4%

M 1 1.37 -1.21 -1.22 0.79 0.27

e 2 -1.33 0.98 1.27 -0.79 -0.13

z 3 0.84 -0.05 0.88 -0.84 -0.82

c 4 -0.64 -0.02 -0.60 1.36 -0.10

l 5 -0.11 0.28 -0.45 0.24 0.04

a 6 -0.13 0.02 0.12 -0.76 0.74

Fluorita

•••• +−−=−−−= yyyyye jiijjiijij βαµ ˆˆˆ

88.020

51.17

)1)(1(ˆ

22 ==

−−=

∑∑JI

es ij

R


Contraste de Hipótesis

Si la Fluorita no influye, los I tratamientos son iguales a efectos de coste, entonces

0 de distinto es Algún :

0:

i1

210

αααα

H

H I ==== L

Iααα === L21 ∑ = =Ii i1 0α


Análisis de la varianza

∑ ∑ ∑ ∑∑ ∑ ∑ ∑= = = =

•••= = = =

•••••

••••••••••••

••••••••••••

+−+−=−

+−−+−+−=−

+−−+−+−+=

+++=⇒+++=

I

i

J

j

I

i

J

jijj

I

i

I

j

I

i

J

jiij

jiijjiij

jiijjiij

ijjiijijjiij

eyyyyyy

yyyyyyyyyy

yyyyyyyyyy

eyuy

1 1 1 1

22

1 1 1 1

22 )()()(

)()()(

)()()(

ˆˆˆ βαµβαµ

∑ ∑ ∑∑ ∑ ∑= = =

•••= = =

••••• +−+−=−J

j

I

i

J

jijj

I

i

I

j

I

iiij eyyIyyJyy

1 1 1

22

1 1 1

22 )()()(


Variabilidades

VNEVEVEVT

eVNE

yyIBVE

yyJTVE

yyVT

I

i

J

jij

J

jj

I

ii

I

i

I

jij

++=

=

−=

−=

−=

∑ ∑

∑

∑

∑ ∑

= =

=•••

=•••

= =••

B)(T)()()(

)()(

)(

1 1

2

1

2

1

2

1 1

2

)1)(1()1()1()1( −−+−+−=− JIJIn


Contraste sobre tratamientos


0:

i1

210

αααα

H

H I ==== L

222 ]ˆ[)1)(1(

ˆ σ=→−−

= RR sEJI

VNEs

222 ]ˆ[1

)osTratamient(ˆ cierto, es Ho Si σ=→

−= TT sE

I

VEs

)1)(1(;121

2

2

2

ˆ

1)(

ˆ

ˆ−−−

=•••

→−−

==∑

JIIR

I

ii

R

TT F

s

IyyJ

s

sF

Ho rechaza Se Si ⇒> αFFT


Explicación del contraste

),(,...,,

][,

),(0 cierto es Ho Si

2

21

121

2

JNyyy

J

JyE

J

yyyy

Ny

I

Jj j

iiJii

i

jiji

σµ

µβµ

σβµα

→

=+

=+++

=

+→⇒=

•••

=••

∑L

21

2

1

2

221

11ˆ

σ=

−⇒

−=⇒

+++=

∑∑=

•••=

••••••

•• I

)y -y(JE

I

)y -y(Js

I

yyyy

I

ii

I

ii

TIL

.ˆ quemayor será ˆ falso, es Ho Cuando

parecidas.serán ˆy ˆ cierto, es Ho Cuando22

22

RT

RT

ss

ss

⊕

⊕


Contraste de bloques


0:

j1

210

ββββ

H

H J ==== L

222 ]ˆ[1

)Bloques(ˆ cierto, es Ho Si σ=→

−= BB sE

J

VEs

)1)(1(;121

2

2

2

ˆ

1)(

ˆ

ˆ−−−

=•••

→−−

==∑

JIJR

J

jj

R

BB F

s

JyyI

s

sF

Ho rechaza Se Si ⇒> αFFB


Tabla de análisis de la varianza

1-nTotal

Residual

Bloque

oTratamient

valorpFVarianzaLibertad.CuadradosadVariabilid

de Gradosde SumaFuentes

∑∑

∑∑

∑

∑

••

•••

•••

−

−−

−−

−−

−

2

22

2

2

22

2

2

22

)(

ˆ)1)(1(

ˆˆ

ˆ1)(

ˆˆ

ˆ1)(

yy

sJIe

pss

sJyyI

pss

sIyyJ

ij

Rij

BR

B

Bj

TR

T

Ti



29Total

Residual

BloqueoTratamient

valorpFVarianzaLibertad.Cuadrados.adVariabilid

Gradosde SumaFuentes

33.291

88.02051.17

0000.6.5655.49577.247

0008.4.751.6405.26

−


Sin bloques

2933.291

61.102528.265

8887.61.051.6405.26

Total

Residual

oTratamient


Gradosde SumaFuentes−


Contraste multiples: tratamientos

ji

ji

H

H

αα

αα

≠

=

:

:

1

0

)1)(1(2ˆ

−−•• →

−JI

R

ji t

Js

yy

tα/2-tα/2

α/2

t(I-1)(J-1)

R.R. R.R

R. Acept. H0

1-αα/2

),(ˆˆ

ˆˆˆ

ˆ

22

JJN

yyyy

yy

jiji

jijijj

ii

σσαααα

αααα

+−→−

−=−

−=−=

•••••

•••

02/

2ˆ HS

LSD

Jstyy Rji rechaza e⇒>− ••43421

α


Contraste multiples: bloques

ji

ji

H

H

ββ

ββ

≠

=

:

:

1

0

02/

2ˆ HS

LSD

Istyy Rji rechaza e⇒>− ••43421

α)1)(1(2ˆ

−−•• →

−JI

R

ji t

Is

yy

tα/2-tα/2

α/2

t(I-1)(J-1)

R.R. R.R

R. Acept. H0

1-αα/2

),(ˆˆ

ˆˆˆ

ˆ

22

IIN

yyyy

yy

jiji

jijijj

ii

σσββββ

ββββ

+−→−

−=−

−=−=

•••••

•••



Fluorita

Mezcla

13.16

293.0085.2

2ˆ2/

=

××=

=J

stLSD Rα

24.15

293.0085.2

2ˆ2/

=

××=

=I

stLSD Rα

1 2 3 4 5 61 0.00 3.90 -3.82 2.52 3.76 4.242 0 6.60 5.60 4.60 3.603 0 6.34 7.58 8.074 0 1.23 1.72

5 0 0.496 0

LSD=1.24

0% 1% 2% 3% 4%0% 0 0.58 2.49 1.99 0.691% 0 1.90 1.40 -1.302% 0 -0.50 -1.803% 0 -1.304% 0

LSD = 1.13


Intervalos de confianza (ejemplo)

Fluorita Medias L.inf. L.Sup.0% 11.88 11.09 12.681% 11.30 10.50 12.102% 9.40 8.60 10.193% 9.90 9.10 10.694% 11.19 10.40 11.99

J

sty R

iiˆ

2/ααµ ±∈+ •


Intervalos para las medias 95%

0 1 2 3 4

Fluorita

8.8

9.8

10.8

11.8

12.8C

oste

Diagnosis:Homocedasticidad

Fluorita0 1 2 3 4

-2

-1.5

-1

-0.50

0.5

1

1.5

2

Mezcla0 1 2 3 4 5 6

-2

-1.5

-1

-0.5

0

0.5

1

1.5

2

resi

duos

Valores previstos

-1.6

-1.2

-0.8

-0.4

0

0.4

0.8

1.2

1.6

5 10 15 20

Gráfico de residuos


Diagnosis: normalidad

residuos

prob

abil

idad

-1.4 -0.9 -0.4 0.1 0.6 1.1 1.60.1

1

5

20

50

80

95

99

99.9

Diseños factoriales


Ejemplo

A B C D0.31 0.82 0.43 0.450.45 1.10 0.45 0.71

V 0.46 0.88 0.63 0.66E 0.43 0.72 0.72 0.62N 0.36 0.92 0.44 0.56E 0.29 0.61 0.35 1.02N 0.40 0.49 0.31 0.71O 0.23 1.24 0.40 0.38S 0.22 0.30 0.23 0.30

0.21 0.37 0.25 0.360.18 0.38 0.24 0.310.23 0.29 0.22 0.33

ANTÍDOTO

I

II

III

Se analiza el efecto de tres venenos y cuatro antídotos

en el tiempo de supervivencia de unas ratas.


Modelo

ijkijjiijk uy ++++= αββαµ

IJm

IJ

IJ

Jm

J

J

Jm

J

J

mI

I

I

mm

mI

I

I

mm

y

y

y

y

y

y

y

y

y

J

y

y

y

y

y

y

y

y

yy

y

y

y

y

y

y

y

yI

ML

MM

MOMMM

ML

MM

ML

MM

L

2

1

2

22

12

1

21

11

2

22

21

22

222

221

12

122

121

1

12

11

21

212

211

11

112

111

2

1

21Factor 1

Fac

tor

2

•Normalidad

•Independencia

•Homocedasticidad

I×J tratamientos

m replicaciones

n = m×I×J

σ σ σ...1111 αββαµ +++ 2112 αββαµ +++

11 II αββαµ +++

σ σ σ...1221 αββαµ +++ 2222 αββαµ +++ 22 II αββαµ +++

σ σ σ...JJ 11 αββαµ +++ JJ 22 αββαµ +++ IJJI αββαµ +++

M M MO

Factor 11 2 I

1

2

J

...F

acto

r 2

M


Modelo

µ : Media global

αi : Efecto del tratamiento i, i=1,...,I

βj : Efecto del bloque j, j=1,2,...,J

αβij: Interacción de niveles ij

uij : Componente aleatoria N(0,σ2)

∑ = =Ii i1 0α ∑ = =J

j j1 0β

ijkijjiijk uy ++++= αββαµjI

i ij ∀=∑ = ,01αβ

iJj ij ∀=∑ = ,01αβ



1:

)1)(1(:

1:

1:

1:

→−−→

−→−→

→

2

j

i

σαββαµ

JI

J

I

ij

n

yy

mI

yy

mJ

yy

m

yy

I

i

J

j

m

kijk

I

i

m

kijk

j

J

j

m

kijk

i

m

kijk

ij

∑ ∑ ∑∑ ∑∑ ∑∑= = =

•••= =

••= =

••=

• ==== 1 1 11 11 11

)1(ˆˆ

ˆˆ

ˆ

222

−==

+−−=∧

−=−=

=

∑∑••••••••

•••••

•••••

•••

mIJ

es

yyyy

yy

yy

y

ijR

jiijij

jj

ii

σ

αβ

βαµ


Estimación

A B C D0.31 0.82 0.43 0.45

V 0.45 1.10 0.45 0.71 0.46 0.88 0.63 0.66E 0.43 0.72 0.72 0.62 0.41 0.88 0.56 0.61

N 0.36 0.92 0.44 0.56 0.29 0.61 0.35 1.02E 0.40 0.49 0.31 0.71 0.23 1.24 0.40 0.38N 0.32 0.82 0.38 0.67

0.22 0.30 0.23 0.30O 0.21 0.37 0.25 0.36

0.18 0.38 0.24 0.31S 0.23 0.29 0.22 0.33

0.21 0.34 0.24 0.33

ANTÍDOTO

I

II

III


Estimación

A B C D Medias0.31 0.82 0.43 0.45

0.45 1.10 0.45 0.71V 0.46 0.88 0.63 0.66 0.43 0.72 0.72 0.62

E Medias 0.41 0.88 0.56 0.61

-0.038 0.067 0.032 -0.061N 0.36 0.92 0.44 0.56 0.29 0.61 0.35 1.02E 0.40 0.49 0.31 0.71 0.23 1.24 0.40 0.38

N Medias 0.32 0.82 0.38 0.67

-0.060 0.073 -0.080 0.068O 0.22 0.30 0.23 0.30 0.21 0.37 0.25 0.36S 0.18 0.38 0.24 0.31

0.23 0.29 0.22 0.33

Medias 0.21 0.34 0.24 0.330.098 -0.139 0.048 -0.007

0.314 0.677 0.389 0.534

-0.164 0.198 -0.089 0.056

ANTÍDOTO

I 0.615 0.136

0.479Medias

II 0.544 0.066

III 0.276 -0.202

iα

jβ

ijαβ

ijαβ

ijαβ


Residuos

A B C D-0.103 -0.060 -0.128 -0.160

V 0.038 0.220 -0.108 0.100 0.048 0.000 0.073 0.050E 0.018 -0.160 0.163 0.010 0.00 0.00 0.00 0.00

N 0.040 0.105 0.065 -0.108 -0.030 -0.205 -0.025 0.353E 0.080 -0.325 -0.065 0.043 -0.090 0.425 0.025 -0.288N 0.00 0.00 0.00 0.00

0.010 -0.035 -0.005 -0.025O 0.000 0.035 0.015 0.035

-0.030 0.045 0.005 -0.015S 0.020 -0.045 -0.015 0.005

0.00 0.00 0.00 0.00

III

RESIDUOS

ANTÍDOTO

I

II



∑ ∑ ∑∑ ∑ ∑

∑ ∑ ∑∑ ∑ ∑ ∑ ∑∑

∧

= = == = =••••••••

= = =••••

= = = = =••••

=•••

•••••••••••••••••••••

••••••••••••••••••••••

++−−+

+−+−=−

++−−+−+−=−

−++−−+−+−+=

++++=⇒++++=

I

i

J

j

m

kij

I

i

J

j

m

kjiij

I

i

J

j

m

kj

I

i

I

j

I

i

J

j

m

ki

m

kijk

ijkjiijjiijk

ijijkjiijjiijk

ijkijjiijkijkijjiijk

eyyyy

yyyyyy

eyyyyyyyyyy

yyyyyyyyyyyy

eyuy

1 1 1

2

1 1 1

2

1 1 1

2

1 1 1 1 1

2

1

2

)(

)()()(

)()()(

)()()()(

ˆˆˆ αββαµαββαµ

∑ ∑ ∑∑ ∑

∑∑ ∑ ∑∑

= = == =••••••••

=••••

= = =••••

=•••

++−−+

−+−=−

I

i

J

j

m

kij

I

i

J

jjiij

J

jj

I

i

I

j

I

ii

m

kijk

eyyyym

yymIyymJyy

1 1 1

2

1 1

2

1

2

1 1 1

2

1

2

)(

)()()(


Variabilidades

∑ ∑ ∑

∑ ∑

∑

∑

∑ ∑ ∑

= = =•

= =••••••••

=•••••

=•••••

= = =•••

−=

+−−=×

−=

−=

−=

I

i

J

j

m

kijijk

I

i

J

jjiij

J

jj

I

ii

I

i

I

j

m

kijk

yyVNE

yyyymBAVE

yymIBVE

yymJAVE

yyVT

1 1 1

2

1 1

2

1

2

1

2

1 1 1

2

)(

)()(

)()(

)()(

)(

)1()1)(1()1()1()1(

)()()(

−+−−+−+−=−+×++=

mIJJIJIn

VNEBAVEBVEAVEVT


Contraste efecto principal de factor A


0:

i1

210

αααα

H

H I ==== L

222 ]ˆ[)1(

ˆ σ=→−

= RR sEmIJ

VNEs

222 ]ˆ[1

)(ˆ σ=→

−= AA sE

I

AVEs cierto, es Ho Si

)1(;121

2

2

2

ˆ

1)(

ˆ

ˆ−−

=•••••

→−−

==∑

mIJIR

I

ii

R

AA F

s

IyymJ

s

sF

Horechaza Se Si ⇒> αFFA


Contraste efecto principal de factor B


0:

j1

210

ββββ

H

H J ==== L

222 ]ˆ[1

)(ˆ σ=→

−= BB sE

J

BVEs cierto, es Ho Si

)1(;12

1

2

2

2

ˆ

1)(

ˆ

ˆ−−

=•••••

→−−

==∑

mIJJR

J

jj

R

BB F

s

JyymI

s

sF

Ho rechaza Se Si ⇒> αFFB


Contraste interacción AxB

0 de distinto es Algún ijαβαβαβαβ

:

0:

1

12110

H

H IJ ==== L

222 ]ˆ[)1)(1(

)(ˆ σ=→

−−×

= ABAB sEJI

BAVEs cierto, es Ho Si

)1();1)(1(2

2

ˆ

ˆ−−−→= mIJJI

R

ABAB F

s

sF

44 344 21naninteraccio BA y

Ho rechaza Se Si ⇒> αFFAB



1)(

ˆ)1(

ˆˆ

ˆ)1)(1()(

ˆˆ

ˆ1)(

ˆˆ

ˆ1)(

2

22

2

2

22

2

2

22

2

2

22

−−

−

−−+−−×

−−

−−

−

∑∑∑

∑∑∑

∑∑

∑

∑

•••

••••••••

••••

••••

nyy

smIJe

pss

sJIyyyym

pss

sJyymI

pss

sIyymJ

ijk

Rijk

ABR

AB

ABjiij

BR

B

Bj

TR

A

Ti

Total

Residual

BA

B

A

valorpFVarianzaLibertad.CuadradosadVariabilid

de Gradosde SumaFuentes



47Total

36Residual

AntVen

Antídoto

Veneno



005.3

022.0801.0

1123.87.1041.06250.0

0000.8.13307.03921.0

0000.2.23516.02033.1

×

−


Contraste multiples: Factor A

ji

ji

H

H

αα

αα

≠

=

:

:

1

0

)1(2ˆ

−•••• →

−mIJ

R

ji t

mJs

yy

tα/2-tα/2

α/2

tIJ(m-1)

R.R. R.R

R. Acept. H0

1-αα/2

),(ˆˆ

ˆˆˆ

ˆ

22

mJmJN

yyyy

yy

jiji

jijijj

ii

σσαααα

αααα

+−→−

−=−

−=−=

•••••••••

•••••

HomJ

styy Rji

rechaza Se

2ˆ2/α>− ••••


Contraste multiples: Factor B

ji

ji

H

H

ββ

ββ

≠

=

:

:

1

0

)1(2ˆ

−•••• →

−mIJ

R

ji t

mIs

yy

tα/2-tα/2

α/2

tIJ(m-1)

R.R. R.R

R. Acept. H0

1-αα/2

),(ˆˆ

ˆˆˆ

ˆ

22

mImIN

yyyy

yy

jiji

jijijj

ii

σσββββ

ββββ

+−→−

−=−

−=−=

•••••••••

•••••

HomI

styy Rji

rechazaSe

2ˆ2/α>− ••••


Intervalos de confianza (interacción nula)

mJ

sty R

iiˆ

2/ααµ ±∈+ ••

mI

sty R

jiˆ

2/αβµ ±∈+ ••



veneno

tiem

po

1 2 30.22

0.32

0.42

0.52

0.62

0.72

antidototi

empo

A B C D0.25

0.35

0.45

0.55

0.65

0.75


Diagnosis: homocedasticidad

resi

duos

antidotoA B C D

-0.6

-0.3

0

0.3

0.6

veneno1 2 3

-0.6

-0.3

0

0.3

0.6


Heterocedasticidadre

sidu

os

valores previstos

-0.6

-0.4

-0.2

0

0.2

0.4

0.6

0 0.2 0.4 0.6 0.8 1


Normalidad

Residuos

prob

abil

idad

-0.5 -0.25 0 0.25 0.50.1

1

5

20

50

80

95

99

99.9


Diagnosis: homocedasticidad datos transformados z=1/y

veneno1 2 3

-1.1

-0.7

-0.3

0.1

0.5

0.9

1.3

antidotoA B C D

-1.1

-0.7

-0.3

0.1

0.5

0.9

1.3re

sidu

os


Datos transformados

resi

duos

valores previstos

-1.2

-0.8

-0.4

0

0.4

0.8

1.2

0 1 2 3 4 5 6


Normalidad (datos transformado)

Residuos

prob

abil

idad

-1.2 -0.8 -0.4 0 0.4 0.8 1.20.1

1

5

20

50

80

95

99

99.9


Tabla de análisis de la varianza datos transformados 1/y

47Total

36Residual

AntVen

Antídoto

Veneno



50.65

24.068.8

3867.09.126.0657.1

0000.3.2880.6341.20

0000.6.724.17287.34

×

−


Comparaciones múltiples intervalos de confianza

antidoto1/

tiem

po

1 2 3 41.6

2

2.4

2.8

3.2

3.6

4

veneno

1/ti

empo

1 2 31.6

2

2.4

2.8

3.2

3.6

4


Diseño con tres factores

Factores A, B y C con NA, NB, Nc niveles.

Nº de Tratamientos T=NAxNBxNc

Efectos principales 3 A, B , C

Interacciones de orden dos 3 AxB, AxC, BxC

Interacción de orden tres 1. AxBxC

Factor A

A1 A2 A3 A4 A5 A6

B1

C1

B2

B3

B4

B5

C2C3

Fac

tor

B

Factor C

Tratamiento: Cada combinación de niveles de los factores

6 x 5 x 3 = 90


K factores con N1, N2, ..., NK

niveles

libertad de grados

con k, orden de ninteracció 1K

K

...

libertad de grados

con 3, orden de nesinteraccio 3

K

libertad de

grados con 2, orden de nesinteraccio 2

K

uno cada libertad de grados con sprincipale efectosK

)(N))(N(N

))(N)(N(N

))(N(N

N

K

kji

ji

i

111

111

11

1

21 −−−=

•

−−−

•

−−

•

−•

L


DatosFactor 1

Fac

tor

2

Factor 31 2 K...

IJKMMIJMIJ

IJKIJIJ

IJKIJIJ

JKMMJMJ

JKJJ

JKJJ

JKMMJMJ

JKJJ

JKJJ

KMIMIMI

KIII

KIII

KMMM

K

K

KMMM

K

K

KMIMIMI

KIII

KIII

KMMM

K

K

KMMM

K

K

yyy

yyy

yyy

K

yyy

yyy

yyy

K

yyy

yyy

yyy

K

yyy

yyy

yyy

K

yyy

yyy

yyy

K

yyy

yyy

yyy

Kyyy

yyy

yyy

K

yyy

yyy

yyy

yyy

yyy

yyy

L

MOMM

L

L

L

L

MOMM

L

L

L

MOMM

L

L

MOMMML

MOMM

L

L

L

L

MOMM

L

L

L

MOMM

L

L

L

MOMM

L

L

L

L

MOMM

L

L

L

MOMM

L

L

L

21

22212

12111

22212

22222122

12212112

12111

21221121

11211111

22221

22222212

12221211

22222221

22222222212

12222212211

12122121

21212221212

11212211211

11211

21122112

11121111

11212211

21121222112

11121212111

11112111

21111221112

11111211111

...21...21...21

J

...21...21...21

2

...21K...21K...21

1

I211 2 ... I

1

2

...

J

1 2 K... 1 2 K... 1 2 K...

1 2 K...1 2 K...1 2 K...

1 2 K...1 2 K...1 2 K...


Ejemplo: Proceso químico

T-1 T-2 T-1 T-2 T-1 T-2 T-1 T-272.2 65.0 74.4 69.2 75.0 70.7 80.0 73.074.4 71.6 66.3 71.8 78.9 80.6 65.0 74.464.3 61.9 66.5 64.6 64.3 73.4 82.1 78.8

T-1 T-2 T-1 T-2 T-1 T-2 T-1 T-262.5 75.9 70.8 79.2 76.3 83.3 72.3 80.365.8 72.9 63.9 80.1 79.1 88.0 72.4 86.971.2 77.8 76.6 75.3 89.0 84.7 75.6 86.3

T-1 T-2 T-1 T-2 T-1 T-2 T-1 T-269.0 73.8 69.0 84.5 72.8 94.1 78.4 87.570.3 59.2 68.2 93.7 73.7 87.3 79.9 79.768.8 80.8 78.7 80.1 80.7 89.0 80.3 79.5

CONCENTRACIÓN1 2 3 4

CA

TA

LIZ

AD

OR

C-1

C-2

C-3

Tres factores:1 4%2 6%3 8%4 10%

ConcentraciónT-1 300º CT-2 320º C

Temperatuta

Variable respuesta: Rendimiento del proceso químico.

Tres replicaciones

C-1 AgC-2 Ag+ZnC-3 Zn

Catalizador


Modelo

ijkmijkjkikijkjiijkm uy ++++++++= αβγβγαγαβγβαµ

•Normalidad

•Independencia

•Homocedasticidad

I × J × K tratamientos

M replicaciones

n = I × J × K × M

∑ = =Ii i1 0α

∑ = =Jj j1 0β

∑ = =Kk k1 0γ

iKk ik ∀=∑ = ,01αγ

iJj ij ∀=∑ = ,01αβ

kJj jk ∀=∑ = ,01βγ

jIi ij ∀=∑ = ,01αβ

kIi ik ∀=∑ = ,01αγ

jKk jk ∀=∑ = ,01βγ

∑∑∑ ∀=∀=∀= Kk ijk

Jj ijk

Ii ijk jikikj .,,0;,,0;,,,0 αβγαβγαβγ

ijkmu


Medias


M

y

y

IM

y

yJM

y

yKM

y

y

IJM

y

yIKM

y

yJKM

y

y

IJKM

y

y

M

mijkm

ijk

I

i

K

kijkm

jk

J

j

M

mijkm

ki

K

k

M

mijkm

ij

I

i

J

j

M

mijkm

k

I

i

K

k

M

mijkm

j

J

j

K

k

M

mijkm

i

I

i

J

j

K

k

M

mijk

∑

∑∑∑ ∑∑ ∑

∑∑ ∑∑∑ ∑∑∑ ∑

∑∑∑ ∑

=•

= =••

= =••

= =••

= = =•••

= = =•••

= = =•••

= = = =••••

=

===

===

=

1

1 11 11 1

1 1 11 1 11 1 1

1 1 1 1


Medias: Proceso químico

T-1 T-2 T-1 T-2 T-1 T-2 T-1 T-2C-1 70.30 66.17 69.07 68.53 72.73 74.90 75.70 75.40C-2 66.50 75.53 70.43 78.20 81.47 85.33 73.43 84.50C-3 69.37 71.27 71.97 86.10 75.73 90.13 79.53 82.23

1 2 3 4

1 2 3 4C-1 68.2 68.8 73.8 75.6 71.6C-2 71.0 74.3 83.4 79.0 76.9C-3 70.3 79.0 82.9 80.9 78.3

69.9 74.1 80.1 78.5 75.6

Concentración

1 2 3 4T-1 68.72 70.49 76.64 76.22 73.02T-2 70.99 77.61 83.46 80.71 78.19

69.9 74.1 80.1 78.5 75.6

T-1 T-2C-1 71.95 71.25 71.6C-2 72.96 80.89 76.9C-3 74.15 82.43 78.3

73.02 78.19 75.6

Catalizador

Temperatura



•

••••••••••••••••••••

••••••••••••

••••••••••••

••••••••••••

•••••••

•••••••

•••••••

••••

−=−

==

−−−→−+++−−−=∧

−−→+−−=∧

−−→+−−=∧

−−→+−−=∧

−→−=

−→−=−→−=

=

∑∑∑∑ijkijkmijkm

ijkmR

kjijkkiijijkijk

kjjkjk

kikiik

jiijij

kk

jj

ii

yyeMIJK

es

KJIyyyyyyyy

KJyyyy

KIyyyy

JIyyyy

Kyy

JyyIyy

y

;)1(

ˆˆ

)1)(1)(1(

)1)(1(

)1)(1(

)1)(1(

1ˆ

1ˆ1ˆ

ˆ

222σ

αβγ

βγ

αγ

αβ

γ

βαµ


Modelo estimado

( ) ( ) ( )( )( )( )( )( )•

••••••••••••••••••••

••••••••••••

••••••••••••

••••••••••••

•••••••••••••••••••••••••

−+

+−+++−−−+

++−−+

++−−+

++−−+

+−+−+−+=

ijkijkm

kjijkkiijijk

kjjk

kiki

jiij

kjiijkm

yy

yyyyyyyy

yyyy

yyyy

yyyy

yyyyyyyy




( )

( ) ( ) ( )

( )

( )

( )

( )

( )∑∑∑∑

∑∑∑

∑∑

∑∑

∑∑

∑∑∑

∑∑∑ ∑

•

••••••••••••••••••••

••••••••••••

••••••••••••

••••••••••••

•••••••••••••••••••••

= = = =••••

−+

+−+++−−−+

++−−+

++−−+

++−−+

+−+−+−

=−

i j k mijkijkm

i j kkjijkkiijijk

j kkjjk

i kkiki

i jjiij

kk

jj

ii

I

i

J

j

K

k

M

mijkm

yy

yyyyyyyyM

yyyyIM

yyyyJM

yyyyKM

yyIJMyyIKMyyJKM

yy

2

2

2

2

2

222

1 1 1 1

2


Variabilidades

( ) ( )

( ) ( )

( )

( )

( )

( )

( )∑∑∑∑

∑∑∑

∑∑

∑∑

∑∑

∑∑

∑∑∑∑ ∑

•

••••••••••••••••••••

••••••••••••

••••••••••••

••••••••••••

••••••••••••••

•••••••= = = =

••••

−=

−+++−−−=××

+−−=×

+−−=×

+−−=×

−=−=

−=−=

i j k mijkijkm

i j kkjijkkiijijk

j kkjjk

i kkiki

i jjiij

kk

jj

ii

I

i

J

j

K

k

M

mijkm

yyVNE

yyyyyyyyMCBAVE

yyyyIMCBVE

yyyyJMCAVE

yyyyKMBAVE

yyIJMCVEyyIKMBVE

yyJKMAVEyyVT

2

2

2

2

2

22

2

1 1 1 1

2

)(

)(

)(

)(

)()(

)(


Grados de libertad

)1()1)(1)(1(

)1)(1()1)(1()1)(1(

)1()1()1()1(

LIBERTAD DE GRADOS

)(

)()()(

)()()(

ADVARIABILIDLA DE CIÓNDESCOMPOSI

−+−−−−−+−−+−−

−+−+−=−

+××+×+×+×

+++=

MIJKKJI

KJKIJI

KJIn

VNECBAVE

CBVECAVEBAVE

CVEBVEAVEVT


( )

( )

( )

( )

( )

( )

( )

( ) 1Total

ˆ)1(Residual

ˆˆˆ)1)(1)(1(

)...

...(ˆ

ˆˆ)1)(1(

ˆˆˆ)1)(1(

ˆˆˆ)1)(1(

ˆˆˆ1

ˆˆˆ1

ˆˆˆ1

..

1 1 1 1

2

22

2

22

2

2

222

2

222

2

222

2

222

2

222

2

222

−−

−−

−−−−+++

+−−−××

−−+−−×

−−+−−×

−−+−−×

−−

−−

−−

∑ ∑∑ ∑

∑∑∑∑

∑∑∑

∑∑

∑∑

∑∑

∑

∑

∑

= = = =••••

•

•••••••••••••

•••••••

••••••••••••

••••••••••••

••••••••••••

•••••••

•••••••

•••••••

IJKMyy

sMIJKyy

sssKJI

yyyy

yyyyM

CBA

sssKJyyyyIMCB

sssKIyyyyJMCA

sssJIyyyyKMBA

sssKyyIJMC

sssJyyIKMB

sssIyyJKMA

FVarianzasLibdeGrADVARIABILIDFUENTE

I

i

J

j

K

k

M

mijkm

Ri j k m

ijkijkm

R

ABCABC

kji

i j kjkkiijijk

R

BCBC

j kkjjk

R

ACAC

i kkiki

R

ABAB

i jjiij

R

CC

kk

R

BB

jj

R

AA

ii

Tabla ANOVA


Contraste efecto principal de factor A


0:

i1

210

αααα

H

H I ==== L

Fα

α

RR

Ho rechaza Se Si ⇒> αFFA

)1(;121

2

2

2

ˆ

1)(

ˆ

ˆ−−

=•••••••

→−−

==∑

MIJKIR

I

ii

R

AA F

s

IyyJKM

s

sF

Ho rechaza se No Si ⇒≤ αFFA)1(;1 −− MIJKIF


Contraste interacción AxB


0:

ij1

12110

αβαβαβαβ

H

H IJ ==== L

)1)(1(

)(ˆ cierto, es Ho Si 2

−−×

=JI

BAVEsAB

)1();1)(1(2

2

ˆ

ˆ−−−→= MIJKJI

R

ABAB F

s

sF

44 344 21naninteraccio BA y

Ho rechaza Se Si ⇒> αFFAB


Contraste interacción AxBxC


0:

ijk1

1121110

αβγαβγαβγαβγ

H

H IJK ==== L

cierto es Ho Si

)1();1)(1)(1(2

2

ˆ

ˆ−−−−→= MIJKKJI

R

ABCABC F

s

sF

Ho rechaza Se Si ⇒> αFFABC



Analysis of Variance for rendimiento - Type III Sums of Squares--------------------------------------------------------------------------------Source Sum of Squares Df Mean Square F-Ratio P-Value--------------------------------------------------------------------------------MAIN EFFECTS A:Catalizador 600.014 2 300.007 10.85 0.0001 B:Concentracion 1141.58 3 380.528 13.76 0.0000 C:Temperatura 481.534 1 481.534 17.41 0.0001

INTERACTIONS AB 177.87 6 29.645 1.07 0.3926 AC 310.714 2 155.357 5.62 0.0064 BC 69.2894 3 23.0965 0.83 0.4813 ABC 217.726 6 36.2876 1.31 0.2701

RESIDUAL 1327.71 48 27.6606--------------------------------------------------------------------------------TOTAL (CORRECTED) 4326.44 71--------------------------------------------------------------------------------All F-ratios are based on the residual mean square error.


Interpretación

El efecto principal del factor concentracióninfluye significativamente (p-valor =0.0000) en el rendimiento. Más adelante se compararán las medias de los cuatro niveles de este factor. Este factor no interacciona con ningún otro.Los efectos principales de catalizador y de la temperatura son significativos, además es muy significativa la interacción de los dos factores (p-valor 0.0064). La comparación de medias de estos factores debe ser conjunta.


Contraste multiples: Factor A

ji

ji

H

H

αα

αα

≠

=

:

:

1

0

)1(2ˆ

−•••••• →

−MIJK

R

ji t

JKMs

yy

tα/2-tα/2

α/2

tIJK(M-1)

R.R. R.R

R. Acept. H0

1-αα/2

),(ˆˆ

ˆˆˆ

ˆ

22

JKMJKMN

yyyy

yy

jiji

jijijj

ii

σσαααα

αααα

+−→−

−=−

−=−=

•••••••••••••

•••••••

HoJKM

styy Rji

rechazase

,2

ˆSi 2/α>− ••••


Concentración

Multiple Range Tests for rendimiento by Concentracion

--------------------------------------------------------------------------------Method: 95.0 percent LSDConcentracion Count LS Mean Homogeneous Groups--------------------------------------------------------------------------------1 18 69.8556 X 2 18 74.05 X 4 18 78.4667 X3 18 80.05 X--------------------------------------------------------------------------------Contrast Difference +/- Limits--------------------------------------------------------------------------------1 - 2 *-4.19444 3.52487 1 - 3 *-10.1944 3.52487 1 - 4 *-8.61111 3.52487 2 - 3 *-6.0 3.52487 2 - 4 *-4.41667 3.52487 3 - 4 1.58333 3.52487 --------------------------------------------------------------------------------* denotes a statistically significant difference.


Intervalos de confianza (concentración)

Means and 95,0 Percent LSD Intervals

Concentracion

Ren

dim

ient

o

1 2 3 468

71

74

77

80

83


Interacción: Cat. x Temp.

T-1 T-2C-1 71.95 71.25 71.6C-2 72.96 80.89 76.9C-3 74.15 82.43 78.3

73.02 78.19 75.6

Interacción Cat x Temp

70.0072.0074.0076.0078.0080.0082.0084.00

0 1 2 3 4

Catalizador

Me

dia

s

Temp - 1

Temp - 2


Selección de temperatura y catalizador.

Las mejores combinaciones corresponden a la temperatura 2,

con el catalizador 2 o el 3.

Table of Least Squares Means for rendimientowith 95.0 Percent Confidence Intervals-------------------------------------------------------------------------------- Stnd. Lower UpperLevel Count Mean Error Limit Limit--------------------------------------------------------------------------------Catalizador by Temperatura1 1 12 71.95 1.51824 68.8974 75.0026 1 2 12 71.25 1.51824 68.1974 74.3026 2 1 12 72.9583 1.51824 69.9057 76.011 2 2 12 80.8917 1.51824 77.839 83.9443 3 1 12 74.15 1.51824 71.0974 77.2026 3 2 12 82.4333 1.51824 79.3807 85.486 --------------------------------------------------------------------------------


Catalizador x Temperatura

Interactions and 95,0 Percent LSD Intervals

Catalizador

Ren

dim

ient

oTemperatura

12

69

73

77

81

85

1 2 3


Diagnosis del modelo

Residual Plot for Rendimiento

resi

dual

predicted Rendimiento

-13

-8

-3

2

7

12

17

59 69 79 89 99


resi

dual

Concentracion1 2 3 4

-13

-8

-3

2

7

12

17


resi

dual

Catalizador1 2 3

-13

-8

-3

2

7

12

17

Normal Probability Plot

-13 -9 -5 -1 3 7 11

RESIDUALS

0,1

1

5

20

50

80

95

99

99,9

perc

enta

ge


Análisis de 3 factores con menos observaciones

Cuando no existe interacción de orden tres.No es necesario replicar para analizar el experimento.

La variabilidad explicada por el término A×B×C se convierte en Variabilidad Residual con (I-1)(J-1)(K-1) grados de libertad.

Las expresiones anteriores siguen siendo válidas, sustituyendo M=1 (sin replicación) y con (I-1)(J-1)(K-1) como grados de libertad de la varianza residual.

Cuando no existe ninguna interacciónSe puede reducir considerablemente el número de observaciones si el número de niveles de los tres factores es el mismo: CUADRADO LATINO


( )

( )

( )

( )

( )

( )

( ) 1Total

ˆ)1)(1)(1()...

...(

Residual

ˆˆˆ)1)(1(

ˆˆˆ)1)(1(

ˆˆˆ)1)(1(

ˆˆˆ1

ˆˆˆ1

ˆˆˆ1

..

1 1 1

2

2

2

2

222

2

222

2

222

2

222

2

222

2

222

−−

−−−−+++

+−−−

−−+−−×

−−+−−×

−−+−−×

−−

−−

−−

∑ ∑∑

∑∑∑

∑∑

∑∑

∑∑

∑

∑

∑

= = =•••

•••••••••

•••

••••••••

••••••••

••••••••

•••••

•••••

•••••

IJKyy

sKJIyyyy

yyyys

ssKJyyyyICB

sssKIyyyyJCA

sssJIyyyyKBA

sssKyyIJC

sssJyyIKB

sssIyyJKA


I

i

J

j

K

kijk

R

kji

i j kjkkiijijk

R

BCBC

j kkjjk

R

ACAC

i kkiki

R

ABAB

i jjiij

R

CC

kk

R

BB

jj

R

AA

ii

Tabla ANOVA tres factores (sin replicación)


Ejemplo: Obleas

Horno AS 1 2 31 122.2 103.2 115.82 138.4 144.3 159.81 131.0 133.4 121.82 147.4 138.0 147.51 120.5 102.8 120.02 140.6 126.6 141.91 100.0 105.8 114.72 117.0 134.4 131.7

4

Temperatura

1

2

3

Se ha realizado un experimento para analizar la influencia de latemperatura y el acabado superficial (AS) en el espesor de óxido conseguido en obleas de silicio. El experimento se repitióen cuatro hornos diferentes. ( Cada uno de los datos del cuadro representa la media de los espesores medidos en el centro de cada una de las 30 obleas que caben en un horno)


ANOVA: Obleas

Analysis of Variance for Espesor - Type III Sums of Squares--------------------------------------------------------------------------------Source Sum of Squares Df Mean Square F-Ratio P-Value--------------------------------------------------------------------------------MAIN EFFECTS A:AS 3183.21 1 3183.21 65.32 0.0002 B:Horno 1200.81 3 400.27 8.21 0.0152 C:Temperatura 262.802 2 131.401 2.70 0.1461

INTERACTIONS AB 265.29 3 88.43 1.81 0.2448 AC 101.251 2 50.6254 1.04 0.4098 BC 541.407 6 90.2346 1.85 0.2362

RESIDUAL 292.393 6 48.7321--------------------------------------------------------------------------------TOTAL (CORRECTED) 5847.16 23--------------------------------------------------------------------------------All F-ratios are based on the residual mean square error.


Comparaciones: Horno

Multiple Range Tests for Espesor by Horno

--------------------------------------------------------------------------------Method: 95.0 percent LSDHorno Count LS Mean Homogeneous Groups--------------------------------------------------------------------------------4 6 117.267 X 3 6 125.4 XX 1 6 130.617 XX2 6 136.517 X--------------------------------------------------------------------------------Contrast Difference +/- Limits--------------------------------------------------------------------------------1 - 2 -5.9 9.86203 1 - 3 5.21667 9.86203 1 - 4 *13.35 9.86203 2 - 3 *11.1167 9.86203 2 - 4 *19.25 9.86203 3 - 4 8.13333 9.86203 --------------------------------------------------------------------------------* denotes a statistically significant difference.




AS

Esp

esor

1 2110

120

130

140

150


Horno

Esp

esor

1 2 3 4110

120

130

140

150

El AS que produce mayor espesor es el 2

El horno que produce media mayor es el 2, aunque no es significativamente distinto del 1.


Cuadrado latino

Permite analizar tres factores con K niveles cada uno, utilizando sólo K2

observaciones.

Deben ser nulas las interacciones de orden 2 y orden 3.

1 2 3 4 5

1 C A D B E

2 D C B E A

3 E B A D C

4 B E C A D

5 A D E C B


Ejemplo: Aditivos gasolina

Una organización de consumidores estudió la eficacia de cinco aditivos que según los fabricantes reducían el consumo de combustible. Se realiza un diseño experimental con cinco conductores, cinco vehículos y cinco aditivos, eligiendo las 25 combinaciones que se muestran en la tabla, junto con una medida del consumo.

C A D B E

71 64 68 78 82D C B E A

65 64 81 82 82E B A D C

63 68 74 77 85B E C A D

66 77 79 88 74A D E C B

73 70 78 80 88

3 4

4

5

Vehículo

Co

nd

uc

tor

5

1

2

3

1 2

ABCDE

Aditivo


Modelo: Cuadrado Latino

)()( kijkjikij uy ++++= γβαµ

•Normalidad

•Independencia

•Homocedasticidad

K2 Observaciones

∑ = =Ki i1 0α

∑ = =Kj j1 0β

∑ = =Kk k1 0γ

)(kiju

)2(55)3(45)5(35)4(25)1(15

)4(54)1(44)3(34)5(24)2(14

)3(53)4(43)1(33)2(23)5(13

)1(52)5(42)2(32)3(22)4(12

)5(51)2(41)4(31)1(21)3(11

5

4

3

2

1

54321

yyyyy

yyyyy

yyyyy

yyyyy

yyyyy


Estimación


K

y

yK

y

yK

y

yK

y

y

K

kkij

k

K

ikij

j

K

jkij

i

K

i

K

jkij ∑∑∑∑∑

=••

=••

=••

= =••• ==== 1

)(

)(1

)(

)(1

)(

)(21 1

)(

)(

;)2)(1(

ˆˆ

2

1ˆ

1ˆ1ˆ

ˆ

2)(22

)()()()()()(

)()(

)()(

)()(

)(

−−==

+−−−=−→−=

−→−=−→−=

=

∑∑∑∑•••••••••

•••••

•••••

•••••

•••

KK

es

yyyyye

Kyy

Kyy

Kyy

y

kijR

kjikijkij

kk

jj

ii

σ

γ

βαµ



( )

( ) ( ) ( ) ( )∑∑∑∑∑

∑∑

+−+−+−

=−

•••••••••••••••

= =•••

i jkij

kk

jj

ii

K

i

K

jkij

eyyKyyKyyK

yy

2)(

2)()(

2)()(

2)()(

1 1

2)()(


)()()()()()()()()( )()()( kijkjikij eyyyyyyyy +−+−+−+= ••••••••••••••••••

)2)(1()1()1()1()1( 2 −−+−+−+−=− KKKKKK

Libertad de Grados


( )

( )

( )

( ) 1

ˆ)2)(1(ˆ

ˆˆ1

ˆˆˆ1

ˆˆˆ1

..

2

1 1 1 1

2

22)(

2

222

)()(

2

222

)()(

2

222

)()(

−−

−−

−−

−−

−−

∑ ∑∑ ∑

∑∑

∑

∑

∑

= = = =••••

•••••

•••••

•••••

Kyy

sKKe

sssKyyKC

sssKyyKB

sssKyyKA


I

i

J

j

K

k

M

mijkm

Ri j

kij

R

CC

kk

R

BB

jj

R

AA

ii

Total

Residual

Tabla ANOVA


Tabla análisis de la varianza

Analysis of Variance for Consumo - Type III Sums of Squares-------------------------------------------------------------------------------Source Sum of Squares Df Mean Square F-Ratio P-Valu-------------------------------------------------------------------------------MAIN EFFECTS A:Conductor 103.032 4 25.758 1.19 0.362 B:Vehiculo 926.689 4 231.672 10.74 0.000 C:Aditivo 121.41 4 30.3525 1.41 0.289

RESIDUAL 258.75 12 21.5625-------------------------------------------------------------------------------TOTAL (CORRECTED) 1399.84 24-------------------------------------------------------------------------------All F-ratios are based on the residual mean square error.


Comparación: vehículos


Vehiculo

Con

sum

o

1 2 3 4 564

68

72

76

80

84

88


Comparación de vehículosMultiple Range Tests for Consumo by Vehiculo

--------------------------------------------------------------------------------Method: 95.0 percent LSDVehiculo Count LS Mean Homogeneous Groups--------------------------------------------------------------------------------1 5 67.6 X 2 5 68.6 X 3 5 76.0 X4 5 81.35 X5 5 82.2 X--------------------------------------------------------------------------------Contrast Difference +/- Limits--------------------------------------------------------------------------------1 - 2 -1.0 6.39883 1 - 3 *-8.4 6.39883 1 - 4 *-13.75 6.39883 1 - 5 *-14.6 6.39883 2 - 3 *-7.4 6.39883 2 - 4 *-12.75 6.39883 2 - 5 *-13.6 6.39883 3 - 4 -5.35 6.39883 3 - 5 -6.2 6.39883 4 - 5 -0.85 6.39883 --------------------------------------------------------------------------------* denotes a statistically significant difference.

Capítulo 5. Diseño de experimentos

5.1 Un laboratorio de Análisis Clínicos ha adquirido un nuevo equipo (B) para medir el colesterol en lasangre de los enfermos. Para evaluar si el nuevo equipo está ajustado se decide analizar muestrasde 5 enfermos que previamente han sido analizadas con otro equipo (A), dando como resultado

Enfermo 1 2 3 4 5 MediaEquipo A 215 305 247 221 286 254.8Equipo B 224 312 251 232 295 262.8

Contrastar con α = 0.05 existen diferencias entre los dos equipos.

5.2 El análisis de la varianza de un diseño en bloques aleatorizados proporciona los siguientes resultados:V T = 232, V E(factor) = 156, V E(bloque) = 15 y V NE = 61. El número de niveles del factor es5 y el número de bloques 8. Construir la tabla ADEVA. ¿ Cuál sería el resultado del análisis si nose tiene en cuenta el efecto de los bloques ? Indicar en qué circunstancias es preferible cada uno delos modelos.

5.3 Para determinar el consumo de energía eléctrica para usos domésticos se ha medido el consumomedio por persona en las distintas estaciones del año en siete comunidades autónomas para 1989,habiéndose obtenido los siguientes resultados:

COMUNIDAD INVIERNO PRIMAVERA VERANO OTOÑO MEDIAS1 13.1 11.4 10.6 11.5 11.652 13.4 12.1 11.1 12.0 12.153 13.8 12.1 11.4 12.9 12.554 14.0 12.8 11.7 12.6 12.775 14.4 12.6 12.5 13.4 13.226 14.8 13.4 13.0 14.0 13.807 15.6 14.2 14.1 14.4 14.57

MEDIAS 14.16 12.66 12.06 12.97 12.96

(a) Analizar si el factor estación del año es influyente, sabiendo que s2y = 1.53.(No considerarel factor Comunidad).

(b) Razonar estadísticamente cuál es la estación de mayor consumo y la de menor, utilizandoel análisis anterior. Calcular los intervalos de confianza para el consumo medio de cadaestación del año.

(c) Sabiendo que la variabilidad explicada por el factor comunidad es 23.62, construir unanueva tabla de la varianza, con dos factores, y decidir qué factor es significativo.

(d) Utilizar los resultados del apartado anterior para realizar un contraste de igualdad demedias del efecto estación y comparar los resultados con los del apartado 2, justificandolas diferencias encontradas.( NOTA: Utilizar α = 0.05 en todos los contrastes )

5.4 Una instalación típica de almacenamiento de combustible en una Estación de Servicio (gasolinera)está formada por un tanque enterrado de gran capacidad, al que se encuentran conectados distintos

1

surtidores. La cantidad total de gasolina suministrada en un día se puede determinar midiendodirectamente la variación que se ha producido en el tanque de almacenamiento (Y1j) o por la sumade los suministros de los distintos surtidores (Y2j). La comparación de ambas medidas permitedeterminar pérdidas en la instalación enterrada y otras anomalías. En el proceso de comparaciónes necesario tener en cuenta que las medidas están afectadas por errores aleatorios. Durante 20 díasse han tomado los valores anteriores en un gasolinera:

Día→ 1 2 3 4 5 6 7 8 9 10Y1j 4116,2 5627,0 2820,4 2521,8 2973,5 2834,9 2335,7 2590,8 2182,7 2621,4Y2j 4143,6 5632,0 2868,1 2477,7 2955,4 2851,9 2312,7 2630,6 2208,9 2635,9

Día→ 11 12 13 14 15 16 17 18 19 20Y1j 4323,6 1880,7 2131,4 3349,6 2545,0 2247,3 1817,5 1461,3 1646,5 1955,4Y2j 4305,4 1877,9 2159,2 3366,7 2566,1 2281,4 1854,6 1461,5 1607,3 1956,4

(a) Llamando Dj = Y1j − Y2j a la diferencia en las medidas de un mismo día, contrastar conα = 0.05

H0 : µD = 0H1 : µD 6= 0

dondeDj tiene distribución N(µD,σD). Calcular el nivel crítico del contraste aproximandola distribución t de Student por la normal.

(b) Los datos anteriores pueden ser analizados mediante un modelo de bloques aleatorizadostomando el tipo de medida (tanque, surtidores) como un factor y los días como bloques.Demostrar con caracter general que en el modelo de bloques aleatorizados si el factor tienedos niveles la varianza residual cumple:

bs2R = 1

2bs2D

donde bs2D es la estimación de σ2D del apartado 1.(c) Teniendo en cuenta lo anterior, demostrar que el contraste correspondiente al factor en el

modelo de bloques aleatorizados es equivalente al contraste del apartado 1.

5.5 Un investigador quiere estudiar el efecto de sexo (hombre, mujer) y tipo de formación (ciencias,letras) en el dominio del inglés escrito en profesores universitarios. Para ello analiza el número deincorrecciones gramaticales en artículos científicos enviados a publicación. Para cada combinaciónde niveles de los factores se han elegido al azar tres profesores. En la tabla se proporciona el númerode fallos detectados en artículos de 15 páginas

Letras CienciasHombre 8, 6, 13 22, 28, 33Mujer 5, 10, 6 12, 14, 9

Contrastar con nivel de significación 0.05 si los efectos principales y la interacción son significativos.Tener en cuenta que P (F1,8 ≤ 5.32) = 0.95, siendo F1,8 la distribución F con grados de libertad1 y 8. Interpretar los resultados.

2

5.6 Un alumno, como trabajo de la asignatura de estadística, ha comparado tres marcas distintas (A,B,C)de palomitas de maíz precocinadas. Cada marca puede prepararse friendolas en una sartén (método1) o en el horno microondas (método 2). El alumno ha realizado un diseño factorial completo 3×2con cinco replicaciones en cada uno de los seis tratamientos. La variable respuesta medida es elporcentaje de granos de maíz que no se han inflado adecuadamente. Los resultados del experimentose muestran en la tabla, en cada tratamiento se proporciona la media y entre paréntesis la desviacióntípica corregida para las cinco replicaciones. Contrastar si la interacción entre los dos factores essignificativa.

A B C

Sartén5.5(1,4)

3.6(1,8)

7.5(2,5)

Horno3.8(1,3)

3.4(0,9)

4.3(1,3)

5.7 Una característica de la calidad de la gasolina es su índice de octanos. Una refinería de petróleotiene cinco fórmulas que pueden emplearse para la obtención de gasolina con plomo o sin plomo.

(a) Para determinar que fórmula proporciona mayor índice de octanos, con cada una de ellasse ha repetido 10 veces en el laboratorio el proceso de fabricación de gasolina con plomo.Si el coeficiente de determinación del análisis de la varianza de los resultados es igual a0.20, contrastar con α = 0.05 si existen diferencias entre las cinco fórmulas para este tipode gasolina.

(b) Los valores medios (yi•) para cada fórmula son:

Fórmula 1 2 3 4 5Media 89.2 90.1 90.7 90.5 89.5Contrastar con α = 0.05 que fórmulas proporcionan índices de octanos significativamentedistintos y cuales no.

(c) Debido a los problemas medio-ambientales gran parte de la producción futura debe estarlibre de plomo. Para determinar que fórmula de las anteriores produce mejores resultadosen cuanto al índice de octanos , se realizo un diseño experimental similar al anterior (cincofórmulas, 10 observaciones en cada fórmula) para la obtención de gasolina sin plomo. Elcoeficiente de determinación en este caso es igual a 0.25 y el índice medio para cada fór-mula es,

Fórmula 1 2 3 4 5Media 88.0 89.5 88.5 90.2 89.8Contrastar (α = 0.05) si existe interacción entre los factores tipo de gasolina (con y sinplomo) y fórmula.

5.8 Se ha realizado un experimento con dos factores cada uno de ellos con 3 niveles. El 20% de lavariabilidad total está explicada por la interacción de los dos factores y el 40% de la variabilidadtotal es debida a la variabilidad residual. Determinar el número de replicaciones necesarias en cadatratamiento para que la interacción sea significativa con α = 0.01. (Explicar el procedimiento decálculo, dejando el resultado indicado en función de las tablas).

3

5.9 Se ha estudiado el efecto de tres hornos diferentes y dos temperaturas (290 oC y 320 oC) en laduración de cierto componente. Para cada combinación de horno y temperatura se ha replicadoel experimento 3 veces. En la tabla siguiente se proporcionan las medias y desviaciones típicas(corregidas) de los datos de cada tratamiento.

Temperatura oC290 oC 320 oC

Media Desv. T. Media Desv. T.Horno 1 24.56 0.850 18.00 0.265Horno 2 19.10 1.539 14.40 0.265Horno 3 18.70 0.458 17.43 0.862

Contrasta si existe interacción entre los factores horno y temperatura (α = 0.05).

5.10 Se desea determinar si cuatro laboratorios dan en promedio los mismos resultados en un análisisquímico. Cada laboratorio ha repetido el análisis cinco veces y los resultados son:

Laboratorios1 2 3 458.7 62.7 55.9 60.761.4 64.5 56.1 60.360.9 63.1 57.3 60.959.1 59.2 55.2 61.458.2 60.3 58.1 62.3

La tabla de análisis de la varianza y la comparación de las medias de los cuatros laboratorios semuestran a continuación:

Analisis de la Varianza-----------------------------------------------------------------------------Fuente Suma de Cuadrados Gl Cuadr. Medios F-Ratio P-Valor-----------------------------------------------------------------------------Laboratorios 85,9255 3 28,6418 13,33 0,0001Residual 34,38 16 2,14875-----------------------------------------------------------------------------Total (Corr.) 120,305 19

4

--------------------------------------------------------------------------------Method: 99,0 percent LSDLaboratorio Count Mean Homogeneous Groups--------------------------------------------------------------------------------3 5 56,52 X 1 5 59,66 X4 5 61,12 X2 5 61,96 X--------------------------------------------------------------------------------Contrast Difference +/- Limits--------------------------------------------------------------------------------1 - 2 -2,3 2,70784 1 - 3 *3,14 2,70784 1 - 4 -1,46 2,70784 2 - 3 *5,44 2,70784 2 - 4 0,84 2,70784 3 - 4 *-4,6 2,70784 --------------------------------------------------------------------------------

Comparación de las medias de los cuatro laboratorios.

(a) Explica que conclusiones se pueden extraer de estos resultados: ¿Existen diferencias entrelos laboratorios? ¿Qué laboratorios presentan diferencias significativas? Da un intervalode confianza al 99% para la media del laboratorio 3.

(b) Según el modelo, la medida yij del laboratorio i en la muestra j tiene distribución normalde media µi y varianza σ2. Los cuatro laboratorios afirman que el error en sus medidasse corresponde con σ2 = 1. Aceptando la hipótesis de homocedasticidad contrastar H0 :σ2 = 1 frente a H1 : σ2 > 1.

(c) Para confirmar los resultados se vuelve a repetir el mismo proceso y otro día se vuelvea analizar por los cuatro laboratorios el producto químico proporcionando otras cincomedidas. Abajo se incluye la tabla de análisis de la varianza del estudio conjunto de las40 observaciones con un modelo de dos factores: Laboratorio (4 niveles) y Día (2 niveles),con 5 replicaciones en cada combinación de día y laboratorio.

Análisis de la varianza----------------------------------------------------------------------------- Suma de Grados CuadradosFuente Cuadrados Libertad Medios F P-Val----------------------------------------------------------------------------- A:Laboratorio 186,81 3 62,27 30,21 0,0 B:Día 0,07396 1 0,07396 0,04 0,8 AB 0,40334 3 0,134447 0,07 0,9

RESIDUAL 65,9686 32 2,06152-----------------------------------------------------------------------------TOTAL (CORREGIDA) 253,256 39

5

-----------------------------------------------------------------Method: 99,0 percent LSDLaboratorio Count LS Mean Homogeneous Groups-----------------------------------------------------------------3 10 56,391 X 1 10 59,766 X 4 10 61,238 XX2 10 62,037 X-----------------------------------------------------------------Contrast Difference +/------------------------------------------------------------------1 - 2 *-2,271 1,71 - 3 *3,375 1,71 - 4 -1,472 1,72 - 3 *5,646 1,72 - 4 0,799 1,73 - 4 *-4,847 1,7-----------------------------------------------------------------

Interpreta los resultados del análisis conjunto y compáralos con los obtenidos en el primeranálisis.

(d) Contrasta si ha habido un cambio significativo en la varianza σ2 de un día y otro. (Ayuda.Comprueba que la varianza residual del modelo factorial es el promedio de las varianzasresiduales de cada día).

5.11 Se ha realizado un experimento para estudiar el efecto de la temperatura (T) y tiempode exposición (E) sobre la cantidad absorbida de un compuesto químico por un materialsumergido en él. En el estudio se han empleado tres temperaturas (T1, T2, T3) y tres tiemposde exposición (E1, E2, E3): cada tratamiento se ha replicado tres veces. La cantidad absorbida(mg) del compuesto químico en cada uno de los 27 experimentos se muestra en la tabla 1 ylas medias en la tabla 2:

Tabla 1: Cantidad Absorbida (mg)

Tiempo de TemperaturaExposición T1 T2 T3

35.5 91.2 70.1E1 29.7 100.7 64.1

31.5 82.4 70.1

52.5 71.0 79.4E2 53.3 77.0 77.7

55.0 75.6 75.1

85.9 87.0 83.0E3 85.2 86.1 87.0

80.2 88.1 78.5

Tabla 2: Medias de Cantidad Absorbida (mg)

Tiempo de TemperaturaExposición T1 T2 T3 Medias

E1 32.23 91.43 68.10 63.92E2 53.60 74.53 77.40 68.51E3 83.76 87.06 82.83 84.56

Medias 56.53 84.34 76.11 72.33

6

La tabla 3 corresponde al análisis de la varianza del experimento y las figuras muestran los gráficosde los intervalos de confianza para las medias de las tres temperaturas, los tres tiempos deexposición y los nueve tratamientos por separado.

Tabla 3: Tabla de análisis de la varianzaFuente Suma de Grados deVariabilidad Cuadrados Libertad Varianzas F p-valorTemperatura 3673.61 2 1836.80 110.58 0.0000T. Exposición 2112.65 2 1056.32 63.59 0.0000Interacción 2704.44 4 676.11 40.70 0.0000Residual 299.00 18 16.61Total 8789.7 26


Tiempo

Abs

orci

on

1 2 361

66

71

76

81

86

91


Temperatura

Abs

orci

on

1 2 354

64

74

84

94

Int. de conf. para las medias de los 9 tratamientos (95%)

Abs

orci

on

T1 T2 T3 T1 T2 T3 T1 T2 T325

45

65

85

105

E1 E2 E3

7

(a) Interpreta los resultados del análisis de la varianza.(b) Demuestra que si se hubiera utilizado el modelo de un único factor para comparar los

nueve tratamientos, la variabilidad explicada de este modelo (VE’) se puede poner comosuma de las variabilidades explicadas del modelo factorial de la tabla 3:

V E0 = V E(Temperatura) + V E(Tiempo) + V E(Interaccion)

Obtén la tabla del análisis de la varianza del nuevo modelo.(c) Realiza las comparaciones dos a dos de los nueve tratamientos y elige aquél o aquellos que

proporcionan una absorción mayor (95%).(d) Comprueba gráficamente la hipótesis de homocedasticidad e interpreta los resultados.

5.12 Se ha realizado un diseño experimental para determinar la influencia de dos factores combinaciónde hidrocarburos y cantidad de hidrógeno en el rendimiento de un proceso químico complejo. Seestudiaron cuatro combinaciones de hidrocarburos (A,B, C y D) y tres niveles en el contenido dehidrógeno (1,2 y 3). En cada tratamiento se realizaron cuatro réplicas. En la tabla 1 se presentanlos resultados: mejora en tanto por mil respecto a procedimiento estándar. Los números entreparéntesis de la tabla se corresponden con las medias de cada tratamiento, de los cuatro niveles delfactor hidrocarburos y de los tres niveles de hidrógeno. En la tabla 2 se muestra la tabla de análisisde la varianza del experimento.

Tabla 1. Datos y medias entre paréntesisA B C D Medias Etapa

10.3 10.5 7.2 13.0 111.1 8.2 5.3 12.9 1

1 15.3 9.7 12.5 5.3 22.1 8.9 19.1 12.0 2

Medias (9.7) (9.325) (11.025) (10.8) (10.213)

25.8 20.6 29.7 17.6 125.7 17.1 26.3 12.0 1

2 28.9 21.4 22.4 24.6 227.8 17.3 25.9 23.1 2

Medias (27.05) (19.1) (26.075) (19.325) (22.888)

28.5 21.0 30.4 20.5 131.2 26.8 26.6 26.2 1

3 24.8 19.4 34.4 27.8 226.5 22.2 27.5 21.9 2

Medias (27.75) (22.35) (29.975) (24.1) (25.981)

Medias (21.5) (16.925) (22.275) (18.075)

8

Tabla 2. ANOVA -Suma Grados

Fuentes Cuadrados Libertad Var. F p-valorHidrocarburos 242.5 3 80.85 5.55 .0031Hidrógeno 2234 2 1117 76.7 .0000Interacción 119.3 6 19.88 1.36 .2546Residual 523.7 36 14.55Total 3120 47

(a) Comparar las medias de los cuatro niveles del factor Hidrocarburo y las de los tres niveles del factorHidrógeno. Indica si existen diferencias significativas con nivel de significación 0.05.

(b) Elige el tratamiento que proporciona el rendimiento óptimo, justificando la respuesta. Da un inter-valo de confianza para el valor medio en dichas condiciones con nivel de confianza del 95%.

(c) El experimento se realizó en dos etapas, en una primera etapa se recogieron las 24 observacionesque se indican en la tabla 1 como etapa 1 y las otras 24 como etapa 2. Los resultados del análisisde la varianza correspondientes a cada etapa se muestran en las tablas 3 y 4.

Tabla 3. ANOVA - Etapa 1Suma Grados

Fuentes Cuadrados Libert. Var. F p-valorHidrocarburos 115.9 3 38.63 6.07 .0093Hidrógeno 1175.0 2 587.7 92.4 .0000Interacción 218.4 6 36.39 5.72 .0051Residual 76.3 12 6.358Total 1586.0 23

Tabla 4. ANOVA - Etapa 2Suma Grados

Fuentes Cuadrados Libert. Var. F p-valorHidrocarburos 162.9 3 54.31 3.35 .0555Hidrógeno 1076 2 537.9 33.19 .0000Interacción 94.94 6 15.82 0.976 .9762Residual 194.5 12 16.21Total 1528 23

¿Se puede concluir que en las dos etapas la varianza del error experimental es la misma? (Realizael contraste con α = 0.05)

(d) Denominando µ y µ0 a las medias (globales) de los modelos factoriales para cada una de las dosetapas, contrasta que son iguales ( H0 : µ = µ0) con α = 0.01.

5.13 Sea un diseño factorial con 4 factores a 3, 4, 2 y 5 niveles. Calcular el número de parámetros totalescorrespondientes a efectos principales e interacciones de orden 2, 3 y 4.

9

5.14 Un centro ha realizado un experimento para mejorar la resistencia a la tensión de ciertos muelles deacero. En una etapa del proceso el muelle caliente se sumerge en aceite templado. Se han estudiadotres factores, A (temperatura del acero antes de la inmersión, con tres niveles), B (temperatura delbaño de aceite, dos niveles) y C (concentración de carbono en el acero, dos niveles). El experimentose ha replicado tres veces. En la tabla se muestra la media y la varianza (corregida) para los tresdatos de cada tratamiento.

A B C yi s2i1 1 1 40.2 0.251 1 2 61.1 2.681 2 1 35.9 2.431 2 2 57.1 4.442 1 1 49.0 3.492 1 2 70.3 7.772 2 1 46.7 5.082 2 2 67.6 1.033 1 1 41.9 4.273 1 2 62.7 11.413 2 1 37.1 1.333 2 2 60.3 6.13

(a) Dar un intervalo del 95 % de confianza para la varianza del error experimental, σ2.(b) Indicar si los efectos principales de A, B y C son significativamente distintos de cero.(c) Dado σ2, construir un intervalo que cumpla que la probabilidad de que s2i (la varianza

muestral corregida de un tratamiento) esté contenido en él sea igual a 0.95. Sustituir σ2

por su estimador y con ayuda de este intervalo, discutir si se puede rechazar la hipótesisde homocedasticidad de las observaciones.

5.15 Se desea estudiar la señal recibida por un equipo de ultrasonidos en función de la profundidad ala que se encuentra el objeto enterrado. En un experimento se han enterrando objetos a 0.5, 1.0,1.5 y 2.0 metros. En cada distancia se han realizado 10 replicaciones. La tabla muestra la media yvarianza de cada nivel.

Nivel Profundidad Num. Media Varianza1 0.5 10 78.21 28.192 1.0 10 50.29 11.113 1.5 10 33.49 8.864 2.0 10 23.574 12.55

Denominando µ1, µ2, µ3 y µ4 a las medias de los niveles, realiza el siguiente contraste:

H0 : µ1 − µ2 = µ3 − µ4,H1 : µ1 − µ2 > µ3 − µ4,

suponiendo que las observaciones tienen distribución normal, con la misma varianza y que sonindependientes (Utiliza α = 0.05). (Ayuda. Llamando δ = (µ1 − µ2) − (µ3 − µ4), el contrastese puede escribir como H0 : δ = 0; H1 : δ > 0. Estima µ1, µ2, µ3 y µ4 con la media muestralrespectiva).

10

5.16 Un estudio bioquímico ha valorado la cantidad de tres ácidos (a, b, c) en muestras extraídas acuatro terneras (1, 2 ,3 y 4) de la misma raza. El análisis es bastante complejo y la determinaciónincluye un error de medida. ¿Se puede aceptar la hipótesis de que los tres ácidos se encuentranen la misma proporción en cada animal? Realiza el contraste con nivel de significación 0.05. (Lavariabilidad total es 41.90).

1.

a b c Medias1 11.0 11.4 12.7 11.72 9.8 10.8 13.7 11.433 7.5 10.6 11.5 9.874 7.9 7.6 10.1 8.53

Medias 9.05 10.1 12.0 10.38

11

6. Regresión lineal

Curso 2004-05

Estadística

2Regresión Lineal

Regresión simple consumo y peso de automóviles

Núm. Obs. Peso Consumo(i) kg litros/100 km

1 981 112 878 123 708 84 1138 115 1064 136 655 67 1273 148 1485 179 1366 1810 1351 1811 1635 2012 900 1013 888 714 766 915 981 1316 729 717 1034 1218 1384 1719 776 1220 835 1021 650 922 956 1223 688 824 716 725 608 726 802 1127 1578 1828 688 729 1461 1730 1556 15

0

5

10

15

20

25

500 700 900 1100 1300 1500 1700

Peso (Kg)

Cons

umo

(litro

s/10

0 Km

)

3Regresión Lineal

ix

iyx10 ββ +

Modelo

osdesconocid parámetros:,, 210 σββ

),0(, 210 σββ Nuuxy iiii →++=

4Regresión Lineal


Linealidadyi = β0+β1xi + ui

Normalidadyi|xi ⇒ N (β0+β1xi,σ2)

HomocedasticidadVar [yi|xi] = σ2

IndependenciaCov [yi, yk] = 0

2

1

0

σ

ββ

Parámetros

5Regresión Lineal

Modelo

),0(, 210 σββ Nuuxy iiii →++=

yi : Variable dependiente

xi : Variable independiente

ui : Parte aleatoria

0

σ

6Regresión Lineal

Estimación

xyx

yx

n

xx

n

xxyy

nxxnyx

xy

xxyxxxyd

dM

xnyxyd

dM

xyM

i

ii

n

ii

n

iii

i

n

iii

iiii

n

iiii

ii

n

iii

n

iii

101

1

2

11

210

1

10

210

110

0

101

100

1

21010

ˆˆ;)var(

),cov(ˆ

)(ˆ

))((

ˆˆ

ˆˆ

ˆˆ0)ˆˆ(

ˆˆ0)ˆˆ(

)(),(

βββ

βββ

ββ

βββββ

βββββ

ββββ

−==

−=

−−

+=

+=

+==−−−=

+==−−−=

−−=

∑∑∑∑

∑ ∑∑∑

∑ ∑∑

∑

==

=

=

=

=

7Regresión Lineal

Estimación: máxima verosimilitud

( )

xyx

yx

n

xx

n

xxyy

nxxnyx

xy

xxyxxxyddL

xnyxyddL

xynn

lL

xyl

i

ii

n

ii

n

iii

in

iii

iiiin

iiii

iin

iii

n

iii

n

iiinn

101

1

2

11

210

1

10

210

1102

0

101

1020

1

2102

2

210

210

1

21022/

210

ˆˆ;)var(

),cov(ˆ

)(ˆ

))((

ˆˆ

ˆˆ

ˆˆ0)ˆˆ(1

ˆˆ0)ˆˆ(1

)(2

1log

2)2log(

2

),,(log),,(

)(2

1

2

1),,( exp

βββ

βββ

ββ

ββββσβ

ββββσβ

ββσ

σπ

σββσββ

ββσσπ

σββ

−==

−=

−−

+=

+=

+==−−=

+==−−=

−−−−−=

=

−−−=

∑∑

∑∑

∑ ∑∑∑

∑ ∑∑

∑

∑

==

=

=

=

=

=

8Regresión Lineal

Estimación σ2 : máxima verosimilitud

n

xy

xyn

d

dL

xynn

L

n

iii

n

iii

n

iii

∑

∑

∑

=

=

=

−−=

=−−+−=

−−−−−=

1

210

2

1

210422

1

2102

2210

)ˆˆ(ˆ

0)ˆˆ(ˆ2

1

ˆ

12

)(2

1log

2)2log(

2),,(

ββσ

ββσσσ

ββσ

σπσββ

2ˆ

0

0

ˆˆ

1

2

2

1

1

10

−=

=

=

−−=

∑

∑

∑=

=

=n

e

s

xe

e

xyen

ii

Rn

iii

n

ii

iii ββ

9Regresión Lineal

Estimación

∑∑

=

=

−−−

==

−=

ni i

ni ii

i

ii

xx

yyxx

x

yx

xy

12

11

10

)(

))((

)var(

),cov(ˆ

ˆˆ

β

ββ

∑=

−−n

iii xy

1

210 )(Mín ββ

Mínimos cuadrados

( )

−−− ∑

=

n

iiinn xyMax

1

21022/ )(

2

1

2

1exp ββ

σσπ

Máxima verosimilitud

10Regresión Lineal

xy 10ˆˆˆ ββ +=

Recta de regresión

x

y

xy 10ˆˆ ββ −=

Pendiente

1β

11Regresión Lineal

{ {ResiduoPrevistoValor

ˆˆ

observadoValor 10 iii exy ++=43421ββ

ix

iy

ii xy 10ˆˆˆ ββ +=

ie

Residuos

12Regresión Lineal

Ejemplo: estimaciónNúm. Obs. Peso Consumo Predicción Residuos

(i) kg litros/100 km

1 981 11 11,44 -0,442 878 12 10,23 1,773 708 8 8,23 -0,234 1138 11 13,28 -2,285 1064 13 12,41 0,596 655 6 7,61 -1,617 1273 14 14,86 -0,868 1485 17 17,35 -0,359 1366 18 15,95 2,0510 1351 18 15,78 2,2211 1635 20 19,11 0,8912 900 10 10,49 -0,4913 888 7 10,35 -3,3514 766 9 8,91 0,0915 981 13 11,44 1,5616 729 7 8,48 -1,4817 1034 12 12,06 -0,0618 1384 17 16,16 0,8419 776 12 9,03 2,9720 835 10 9,72 0,2821 650 9 7,55 1,4522 956 12 11,14 0,8623 688 8 8,00 0,0024 716 7 8,33 -1,3325 608 7 7,06 -0,0626 802 11 9,34 1,6627 1578 18 18,44 -0,4428 688 7 8,00 -1,0029 1461 17 17,07 -0,0730 1556 15 18,18 -3,18

0

5

10

15

20

25

500 700 900 1100 1300 1500 1700

Peso (Kg)

Cons

umo

(litro

s/10

0 Km

)

;0117.0071.0ˆ ii xy +−= 38.2ˆ2 =Rs

13Regresión Lineal

Propiedades de 1β

( )( )

( ) ( )

nn

n

ii

x

i

n

ii

x

n

iii

x

n

iii

xx

ii

ywywywyns

xx

yxxns

yxxns

yyxxnss

yx

+++=

−=

−−−=

−−==

∑

∑∑

∑

=

==

=

L22111

2

12

12

1221

11

1),cov(β 0

( )

( ) ( ) ( ) ( )

( )21

2

2

212

1

2

21212121

121

11

11111

01

x

ni i

x

ni i

ni i

x

ni i

x

ni ii

x

ni ii

xi

ni i

ni i

x

ni i

nsxx

nsw

xxns

xxxns

xxxns

xxxns

xw

xxns

w

=−

=•

=−=−−−=−=•

=−=•

∑∑

∑∑∑∑∑

∑∑

==

=====

==

2ˆx

ii sn

xxw

−=

14Regresión Lineal

son v.a. independientes1ˆ,βy

( )

0)var()ˆ,cov(

ˆ

111111

1

2

1

2

1

2122111

2

1

21

===

=

=+++=

=

=+++=

∑=

n

ii

T

T

n

nnn

T

n

n

wn

y

y

y

y

wwwywywyw

y

y

y

nnny

ny

ny

ny

σβ

β

wYa

Yw

Ya

MLL

MLL

15Regresión Lineal

Distribución de 1β

2

22

1

2

222

221

21

22111

110

102211

22111

22111

210

)(

)][(][][][

][]ˆ[

)()(

)][(][][][

][]ˆ[

normales de lineal Comb.ˆ

),(

x

n

ii

inn

nn

iii

iinn

nn

nn

ii

nsw

yVarywyVarwyVarw

ywywywVarVar

xww

xyEyEwyEwyEw

ywywywEE

ywywyw

xNy

σσ

σ

β

βββββ

β

β

σββ

==

=+++=

+++=

=+=+=+++=

+++=

→+++=

+→

∑

∑∑

=

L

L

L

L

L

→

2

2

11 ,ˆxns

Nσββ

16Regresión Lineal

Modelo en diferencias a la media

)(ˆˆ

)(ˆ

)(ˆˆˆ

ˆˆ

1

1

1

10

10

xxyy

exxyy

exxyyxy

exy

ii

iii

iiiiii

−+=

+−+=

+−=−

+=++=

β

β

βββ

ββ

17Regresión Lineal

Distribución de 0β

+→

+=

=−=→−=

•

→•

+→•

2

22

00

2

22

0

010

10

1

2

2

11

2

10

1,ˆ

1]ˆvar[

]ˆ[][]ˆ[

ˆˆ

ntesindependieson ˆ,

),(ˆ

),(

x

x

x

s

x

n

s

x

n

ExyEE

Normalxy

yns

N

nxNy

N σββσβ

βββββ

β

σββ

σββ

18Regresión Lineal

Distribución de ŝR2

222

2

21

2ˆ)2(

−= →

−=

∑

nR

n

ii sn

e

χσσ

==

→→

→

++=++=

∑∑∑∑

−==

0

0

),0(

ˆˆ

222

12

221

2

21010

ii

in

ni i

n

ni i

i

iiiiii

xe

eeu

Nu

exyuxy

χσ

χσ

σββββ

19Regresión Lineal

Contraste principal de regresión: ¿depende y de x?

0:

0:

11

10

≠=

ββ

H

H

ix

iy

ix

iy

iii uxy ++= 10 ββ ii uy += 0β

H0 es falso

x e y están relacionados

H0 es cierto

x e y no están relacionados

20Regresión Lineal

ii xy 10ˆˆˆ ββ +=0:

0:

11

10

≠=

ββ

H

H

Ho rechaza Se;ˆ

ˆ

ˆ

ˆ)1,0(

ˆ

),(ˆ

2/;211

1

21111

2

2

11

⇒>=

→−

⇒→−

→

−

−

αβ

ββσββ

σββ

n

x

R

n

x

R

x

x

tt

sn

st

t

sn

sN

sn

nsN

Contraste sobre la pendiente

1β

21Regresión Lineal

ii xy 10ˆˆˆ ββ +=

0:

0:

01

00

≠=

ββ

H

H

Ho rechaza Se

;

1ˆ

ˆ

))1(,(ˆ

2/;20

2

2

00

2

22

00

⇒>

+=

+→

− α

β

σββ

n

x

R

x

tt

sx

n

st

s

x

nN

Contraste: ordenada en el origen

22Regresión Lineal

Descomposición de la variabilidad en regresión

{

VNEVEVT

iy

iyy

iyyy

iy

iyy

iyyy

yi

yi

yi

yyi

yi

y

e

iy

xy

uxy

n

i

n

i

n

ii

i

i

iii

iii

+=

−+−=−

−+−=−

−+=

−++=

++=

∑∑∑=== 1

2

1

2

1

2

10

10

)ˆ()ˆ()(

sumando)y cuadrado al elevando()ˆ()ˆ()(

) restando()ˆ(ˆ

ˆˆ

ˆˆ43421ββ

ββ

23Regresión Lineal

Coeficiente de determinación R2

221

1

2211

ˆ)(ˆ:)(ˆˆ x

n

iiii nsxxVExxyy βββ =−=⇒−+= ∑

=

VNEVEVT +=

VT

VER =2

regresor elpor explicado está

que VT de porcentaje el Mide

10 2 ≤≤ R

∑

∑

∑

=

=

=

−=

−=

−=

n

ii

n

iii

n

ii

yyVT

yyVNE

yyVE

1

2

1

2

1

2

)(

)ˆ(

)ˆ(

24Regresión Lineal

Coef. determinación

12 =R 80.02 =R

50.02 =R 02 =R

25Regresión Lineal

ii xy 10ˆˆˆ ββ +=0:

0:

11

10

≠=

ββ

H

H

Contraste F

1β

ntesindependieson ,

ˆ)2(

cierto) es H (Si

22

222

2

21

2

2

o212

σσ

σσσ

σ

χ

χ

VNEVE

sneVNE

VE

nR

ni i

−= →

−==

→

∑212ˆ2 −→== n,

R

Fs

VE

)VNE/(n-

VEF

0H rechaza Se ⇒> αFF

26Regresión Lineal

Regresión con StatgraphicsDependent variable: ConsumoIndependent variable: Peso----------------------------------------------------------------------------- Standard TParameter Estimate Error Statistic P-Value-----------------------------------------------------------------------------Intercept -0,0712606 0,945148 -0,0753962 0,9404Slope 0,0117307 0,000886531 13,2321 0,0000-----------------------------------------------------------------------------

Analysis of Variance-----------------------------------------------------------------------------Source Sum of Squares Df Mean Square F-Ratio P-Value-----------------------------------------------------------------------------Model 416,811 1 416,811 175,09 0,0000Residual 66,6559 28 2,38057-----------------------------------------------------------------------------Total (Corr.) 483,467 29

Correlation Coefficient = 0,928509R-squared = 86,2129 percentStandard Error of Est. = 1,54291

27Regresión Lineal

Ejemplo regresión múltiple

Consumo = β0 + β1 CC + β2 Pot + β3 Peso + β4 Acel + Error

Y X1 X2 X3 X4Consumo Cilindrada Potencia Peso Aceleraciónl/100Km cc CV kg segundos

15 4982 150 1144 1216 6391 190 1283 924 5031 200 1458 159 1491 70 651 2111 2294 72 802 1917 5752 153 1384 14... ... ... ... ...

Var. Independientes

o regresores

Var. dependientes

o respuesta

28Regresión Lineal

Modelo regresión múltiple

osdesconocid parámetros:,,,,, 2210 σββββ kK

),0(

,

222110

σ

ββββ

Nu

uxxxy

i

ikikiii

→

+++++= L

LinealidadE[yi] = β0+ β1x1i+…+ βkxki

Normalidadyi| x1 ,...,xk⇒ Normal

HomocedasticidadVar [yi|x1 ,...,xk] = σ2

IndependenciaCov [yi, yk] = 0

29Regresión Lineal

Notación matricial

+

=

nkknnn

k

k

n u

u

u

xxx

xxx

xxx

y

y

y

MM

L

MOMMM

L

L

M2

1

1

0

21

22212

12111

2

1

1

1

1

β

ββ

),( 2I0U

UXβY

σN→

+=

30Regresión Lineal

Estimación mínimo-cuadrática

eβXY += ˆ

donde el vector e cumple

mínimo es∑=

=n

iie

1

22e

+

=

nkknnn

k

k

n e

e

e

xxx

xxx

xxx

y

y

y

MM

L

MOMMM

L

L

M2

1

1

0

21

22212

12111

2

1

ˆ

ˆ

ˆ

1

1

1

β

ββ

31Regresión Lineal

Para que ||e||2 sea mínimo, e tiene que ser perpendicular al espacio vectorial generado las columnas de X

=

==

=⇒

=

=

∑

∑∑

nkii

nii

ni

nknnn

k

k

xe

xe

e

e

ee

xxx

xxxxxx

1

1 1

1

2

1

21

22212

12111

0

0

0

,

1

11

M

ML

MOMMMLL

0eX

eX

T

32Regresión Lineal

Mínimos cuadrados

YXXXββXXYXeXβXXYX

0eX

TTTT

TTT

T

1)(ˆˆˆ

−=⇒=+=

=

x1

Y

βXY ˆˆ =

YYe ˆ−=

x2

x2

x1

Y

Una d

esco

mpo

sición Solución MC

33Regresión Lineal

Matriz de proyección V

1

x1

VYY =ˆ

V)Y(Ie −=Y

VYYYXX)X(XYβXYT1T

==

=−

ˆˆ

ˆˆPrevistos Val.

V)Y(IVYYβXYe

−=−=−= ˆ

Residuos TT XXX(XV 1)−=

Simétrica V=VT

Idempotente VV=V

34Regresión Lineal

Distribución de probabilidad de β

1T

1TT1T

T1TT1T

T

T1T

T1TT1T

X)(X

X)X(XXX)(X

XX)(XIXX)(X

CYCCYβ

βXβXX)(XCXβYCβ

β

XX)(XCCYYXX)(Xβ

IXβY

−

−−

−−

−

−−

=

=

=

==

====

→

===

→

2

2

2

2

))()((

][][]ˆ[

][]ˆ[

ˆ

) siendo(ˆ

),(

σ

σ

σ

σ

T

VarVarVar

EE

Normal

N

35Regresión Lineal

Distribución de probabilidad de β

==

=

= −

kkkk

k

k

T

kk

qqq

qqqqqq

LMOMM

LL

MM10

11110

00100

11

0

1

0

)(

ˆ

ˆ

ˆ

ˆ XXQββ

β

ββ

β

ββ

),(ˆ

),(ˆ

2

2

iiii qN

N

σββ

σ

→

→ −1TX)(Xββ

)1()1()dim( +×+= kkQ

36Regresión Lineal

Residuos

)ˆˆˆ( 110 kikiii xxye βββ +++−= L

+

=

nkknnn

k

k

n e

e

e

xxx

xxx

xxx

y

y

y

MM

L

MOMMM

L

L

M2

1

1

0

21

22212

12111

2

1

ˆ

ˆ

ˆ

1

1

1

β

ββ

32143421321ResiduosPrevistosObservados

ˆ eβXY +=

37Regresión Lineal

Varianza Residual

212

21

2

212

12

2

]1

[

1][

σ

σ

χσσ

=−−

−−=

→=

∑

∑

∑

=

=

−−=

kn

eE

kne

E

e

ni i

ni i

kn

ni ieeT

212

2

12

2

ˆ)1(

1ˆ

−−

=

→−−

−−=∑

knR

ni i

R

skn

kn

es

χσ

38Regresión Lineal

0:

0:

1

0

≠=

i

i

H

H

ββ

Ho rechaza Se⇒>=

→−

⇒→−

→

−−

−−

2/;1

111

2

;ˆ

ˆ

ˆ

ˆ)1,0(

ˆ

),(ˆ

αβ

ββσ

ββ

σββ

kniiiR

ii

kniiRii

ii

iiii

ttqs

t

tqs

Nq

qN

Contraste individual βi

ikikii uxxy ++++= βββ L110

39Regresión Lineal

Descomposición de la variabilidad en regresión

VNEVEVT

eyyyy

eyyyy

yeyy

exxy

ni i

ni i

ni i

iii

iii

ikikii

+=

+−=−

+−=−

+=

++++=

∑∑∑ === 12

12

12

110

)ˆ()(

)ˆ()(

)(ˆ

ˆˆˆ

Restando

βββ L

40Regresión Lineal


−−−

−−−−−−

=

−

−−

−++−=−

+++=

+++=

++++=

kkknnn

kk

kk

n

kkikii

kikii

kk

ikikii

xxxxxx

xxxxxx

xxxxxx

yy

yy

yy

xxxxyy

xxy

xxy

exxy

β

ββ

ββ

βββ

βββ

βββ

ˆ

ˆ

ˆ

ˆ

ˆ

ˆ

)(ˆ)(ˆˆ

ˆˆˆˆ

ˆˆˆ

ˆˆˆ

2

1

2211

2222112

1221111

2

1

111

110

110

110

M

L

MOMM

L

L

M

L

L

L

L

{0111

1101

ˆˆˆ ∑∑∑∑====

++++=n

ii

n

ikik

n

ii

n

ii exxny βββ L

bXYY ˆ~ˆ =− ebXYY +=− ˆ~

41Regresión Lineal


UbXY +=~~

))~~

(,(ˆ 12 −→ XXbb TσN

−−−

−−−−−−

=

=

=

=

−

−−

=

kknnn

kk

kk

kkn

xxxxxx

xxxxxx

xxxxxx

y

y

y

yy

yy

yy

L

MOMM

L

L

MMMM

2211

2222112

1221111

2

1

2

1

2

1

~

ˆ

ˆ

ˆ

ˆ,,,~

X

bbYY

β

ββ

β

ββ

YX)XX(b~~~~ˆ 1 TT −=

42Regresión Lineal

0:0:

1210

de distinto es algunoHH k ==== βββ L

Contraste general de regresión.

ntesindependie son

cierto) es H (Si o

22

212

2

2

22

,

ˆ)1(

σσ

σσ

σ

χ

χ

VNEVE

sknVNE

VE

knR

k

−−→−−

=

→

11

/−−→

−= kn,kF

)VNE/(n-k

kVEF

0H rechaza Se ⇒> αFF

ikikii uxxy ++++= βββ L110

43Regresión Lineal

Coeficiente de determinación R2

VNEVEVT +=

VT

VER =2

regresores los por explicado está

que VTde porcentaje el Mide

10 2 ≤≤ R

∑

∑

∑

=

=

=

−=

−=

−=

n

ii

n

iii

n

ii

yyVT

yyVNE

yyVE

1

2

1

2

1

2

)(

)ˆ(

)ˆ(

)~~

(ˆˆ)~~

(ˆˆˆ)ˆ(1

2 YXbbXXb)YY()YY( TTTTTn

ii yyVE ==−−=−= ∑

=

44Regresión Lineal

Coef. determinación corregido

2

2

2

ˆ)1(

ˆ)1(11

y

R

sn

skn

VT

VNE

VT

VNEVT

VT

VER

−

−−−=−=

−==

1

)(

ˆ 1

2

2−

−

=∑=

n

yy

s

n

ii

y

)1/(

)1/(1

ˆ

ˆ1

2

22

−−−

−=−=nVT

knVNE

s

sR

y

R

2R

Regresión con STATGRAPHICSMultiple Regression Analysis-----------------------------------------------------------------------------Dependent variable: consumo----------------------------------------------------------------------------- Standard TParameter Estimate Error Statistic P-Value-----------------------------------------------------------------------------CONSTANT -1,66958 0,983305 -1,69793 0,0903cilindrada 0,000383473 0,0001625 2,35983 0,0188potencia 0,0402844 0,00656973 6,13183 0,0000peso 0,00578424 0,00095783 6,0389 0,0000aceleracion 0,111501 0,0496757 2,24458 0,0254-----------------------------------------------------------------------------


R-squared = 81,9694 percentR-squared (adjusted for d.f.) = 81,7826 percentStandard Error of Est. = 1,66162

46Regresión Lineal

Interpretación (inicial)

Contraste F=438 (p-valor=0.0000) ⇒ Alguno de los regresores influye significativamente en el consumo.Contrastes individuales:

La potencia y el peso influyen significativamente (p-valor=0.0000)Para α=0.05, la cilindrada y la aceleración también tienen efecto significativo (p-valor < 0.05)

El efecto de cualquier regresor es “positivo”, al aumentar cualquiera de ellos aumenta la variable respuesta: consumo.Los regresores explican el 82 % de la variabilidad del consumo (R2 = 81.969)

47Regresión Lineal

Multicolinealidad

Cuando la correlación entre los regresores es alta.

Presenta graves inconvenientes:Empeora las estimaciones de los efectos de cada variable βi: aumenta la varianza de las estimaciones y la dependencia de los estimadores)

Dificulta la interpretación de los parámetros del modelo estimado (ver el caso de la aceleración en el ejemplo).

48Regresión Lineal

Identificación de la multicolinealidad: Matriz de correlación de los regresores.

Correlations

cilindrada potencia -------------------------------------------------------cilindrada 0,8984 ( 391) 0,0000

potencia 0,8984 ( 391) 0,0000

peso 0,9339 0,8629 ( 391) ( 391) 0,0000 0,0000

aceleracion -0,5489 -0,6963 ( 391) ( 391) 0,0000 0,0000 -------------------------------------------------------

peso aceleraci----------------------------------- 0,9339 -0,5489 ( 391) ( 391) 0,0000 0,0000

0,8629 -0,6963 ( 391) ( 391) 0,0000 0,0000

-0,4216 ( 391) 0,0000

-0,4216 ( 391) 0,0000

-----------------------------------

49Regresión Lineal

Gráficos consumo - xi

peso

cons

umo

500 1000 1500 20000

4

8

12

16

20

24

potencia

cons

umo

0 40 80 120 160 200 2400

4

8

12

16

20

24

cilindrada

cons

umo

0 2 4 6 8(X 1000)

0

4

8

12

16

20

24

aceleracion

cons

umo

8 11 14 17 20 23 260

4

8

12

16

20

24

50Regresión Lineal

Consumo y aceleración

Multiple Regression Analysis-----------------------------------------------------------------------------Dependent variable: consumo----------------------------------------------------------------------------- Standard TParameter Estimate Error Statistic P-Value-----------------------------------------------------------------------------CONSTANT -1,66958 0,983305 -1,69793 0,0903cilindrada 0,000383473 0,0001625 2,35983 0,0188potencia 0,0402844 0,00656973 6,13183 0,0000peso 0,00578424 0,00095783 6,0389 0,0000aceleracion 0,111501 0,0496757 2,24458 0,0254-----------------------------------------------------------------------------

Regression Analysis - Linear model: Y = a + b*X-----------------------------------------------------------------------------Dependent variable: consumoIndependent variable: aceleracion----------------------------------------------------------------------------- Standard TParameter Estimate Error Statistic P-Value-----------------------------------------------------------------------------CONSTANT 21,5325 1,00701 21,3827 0,0000aceleracion -0,657509 0,0632814 -10,3902 0,0000-----------------------------------------------------------------------------

R. s

impl

eR

. múl

tiple

51Regresión Lineal

Multicolinealidad: efecto en la varianza de los estimadores

( )

−−

−−

−

−=−=

=

===

+++=

−

−

)1(

1

)1(

)1()1(

1

)1(||

~~~~ˆ

ˆvar

22110

212

22

21221

12

21221

122

122112

1222

21

222112

211221

2212

122121

2

1

rsrss

rrss

r

rsrss

sssr

ssrs

ss

ssn

iuixixy

XXXX

XXXXTT

i

SS

SSXXXX σββ

βββ

−−

−−

−−

=

)1()1(

)1()1(ˆˆ

var

212

22

2

21221

212

21221

212

212

21

2

2

1

rnsrsns

r

rsns

r

rns

σσ

σσ

ββ

52Regresión Lineal

Consecuencias de la multicolinealidad

Gran varianza de los estimadores βCambio importante en las estimaciones al eliminar o incluir regresores en el modelo

Cambio de los contrastes al eliminar o incluir regresores en el modelo.

Contradicciones entre el contraste F y los contrastes individuales.

53Regresión Lineal

Consumo Cilindrada Potencia Peso Aceleración Origenl/100Km cc CV kg segundos

15 4982 150 1144 12 Europa16 6391 190 1283 9 Japón24 5031 200 1458 15 USA9 1491 70 651 21 Europa11 2294 72 802 19 Japón17 5752 153 1384 14 USA12 2294 90 802 20 Europa17 6555 175 1461 12 USA18 6555 190 1474 13 USA12 1147 97 776 14 Japón16 5735 145 1360 13 USA12 1868 91 860 14 Europa9 2294 75 847 17 USA... ... ... ... ... ...

Variables cualitativas como regresores

Consumo = β0 + β1 CC + β2 Pot + β3 Peso +

+ β4 Acel + αJAP ZJAP + αUSA ZUSA + Error

USAJapónEuropa

Origen

∈∉=

∈∉=

∈∉=

EUROPA siEUROPA si

USA siUSA si

JAPON siJAPON si

ii

iZ

ii

iZ

ii

iZ

EUR

USA

JAP

10

10

10

54Regresión Lineal

Consumo Cilindrada Potencia Peso Aceleración ZJAP ZUSA ZEURl/100Km cc CV kg segundos

15 4982 150 1144 12 0 0 116 6391 190 1283 9 1 0 024 5031 200 1458 15 0 1 09 1491 70 651 21 0 0 111 2294 72 802 19 1 0 017 5752 153 1384 14 0 1 012 2294 90 802 20 0 0 117 6555 175 1461 12 0 1 018 6555 190 1474 13 0 1 012 1147 97 776 14 1 0 016 5735 145 1360 13 0 1 012 1868 91 860 14 0 0 19 2294 75 847 17 0 1 0... ... ... ... ... ... ... ...

Variables cualitativas



55Regresión Lineal

Interpretación var. cualitativa



• Coches europeos: ZJAP = 0 y ZUSA = 0 REFERENCIA

Consumo = β0 + β1 CC + β2 Pot + β3 Peso + β4 Acel + Error

• Coches japoneses: ZJAP =1 y ZUSA = 0

• Coches americanos: ZJAP =0 y ZUSA = 1

Consumo = β0 + αJAP + β1 CC + β2 Pot + β3 Peso + β4 Acel + Error

Consumo = β0 + αUSA + β1 CC + β2 Pot + β3 Peso + β4 Acel + Error

56Regresión Lineal

Interpretación del modelo

β0 + αJAP

β0

β0 + αUSA

Europeos

Japoneses

Americanos

xi

yRef.

57Regresión Lineal

Multiple Regression Analysis-----------------------------------------------------------------------------Dependent variable: consumo----------------------------------------------------------------------------- Standard TParameter Estimate Error Statistic P-Value-----------------------------------------------------------------------------CONSTANT -1,45504 1,01725 -1,43037 0,1534cilindrada 0,000322798 0,0001792 1,80133 0,0724potencia 0,0422677 0,00678898 6,22592 0,0000peso 0,00559955 0,000965545 5,79937 0,0000aceleracion 0,110841 0,0496919 2,23057 0,0263Zjap -0,361762 0,279049 -1,29641 0,1956Zusa 0,0611229 0,280236 0,218113 0,8275-----------------------------------------------------------------------------


R-squared = 82,0969 percentR-squared (adjusted for d.f.) = 81,8171 percentStandard Error of Est. = 1,66005

58Regresión Lineal

Interpretación

El p-valor del coeficiente asociado a ZJAPes 0.1956>.05, se concluye que no existe diferencia significativa entre el consumo de los coches Japoneses y Europeos (manteniendo constante el peso, cc, pot y acel.)La misma interpretación para ZUSA.Comparando R2 =82.09 de este modelo con el anterior R2=81.98, se confirma que el modelo con las variables de Origen no suponen una mejora sensible.

59Regresión Lineal

Modelo de regresión con variables cualitativas

En general, para considerar una variable cualitativa con r niveles, se introducen en la ecuación r-1 variables ficticias

Y el nivel r no utilizado es el que actúa de

referencia

−∈−∉=

∈∉=

∈∉= − 11

10,,

2120

,1110

121 riri

zii

zii

z irii nivelnivel

nivelnivel

nivelnivel

L

iirrii

kikii

uzzzxxy

+++++++++=

−− 44444 344444 21L

L

acualitativ variable

,112211

110

αααβββ

60Regresión Lineal

Predicción

hx

hy

Media mh|xh Nueva Observ. yh|xh

hx

hm

hm

hy

hx

61Regresión Lineal

Predicción de la media mh (Regresión simple)

hh

hh

xm

xNy

10

210 ),(

ββσββ

+=+→

hx

hm

hx

hy

2

22

21

21

1010

110

)

]var[)]

)]ˆ

ˆ[

)ˆ

(

ˆ(var[

(ˆvar[]var[

]ˆˆ[]

(ˆˆˆ

xh

h

hh

hhhh

hhh

nsxx

n

xxy

xxyy

xxyE

xxyxy

mE

σσ

β

β

ββββ

βββ

−

−

−=

=+=+=

−=+=

+=

+=

+

+

−+→

2

2)(1

2,ˆ

xs

xhx

nhmNyhσ

62Regresión Lineal

Predicción de la media mh(Regresión múltiple)

hT

khkhh

hh

xxm

mNy

'

),(

110

2

xβ=

+++=→

βββσ

L

hx

hm

h'x

hy

hTT

hhh

hhhTT

h

hTT

hhT

h

hT

hT

hT

h

khhhT

hT

h

v

y

yE

y

v

EE

xxxh

'

'

']ˆ'ˆvar[]var[

'']ˆ[]'ˆ[]

),,,,1(','ˆ

1

221

21

)('

)('

var[']ˆ

ˆ[

ˆ

x

x

xβxβ

xβxβxβ

xxβ

XXx

XXx

x

−

−

=

=

=

=

=

===

==

σσ

L

→ hhhh vmNy 2,ˆ σ

63Regresión Lineal

Expresión alternativa para vhh

))()(1(

)~~

(,)()~~

()(

)](ˆvar[)(]var[)](ˆvar[]ˆvar[

)(ˆˆ

12

212

xxSxx

XXSxxXXxx

xxbxxxxb

xxb

−−+=

=−−+=

−−+=−+=

−+=

−

−

hxT

h

T

xhTT

h

hT

hhT

h

hT

h

n

nn

yyy

yy

σ

σσ

))()(1(1 1 xxSxx −−+= −

hxT

hhh nv

nv

nv

hhh

hhh

/1

/1

>⇒≠=⇒=

xx

xx

64Regresión Lineal

Intervalos de confianza para la media mh

( )

1

2

ˆ

)1,0(

ˆ

ˆ,ˆ

−−→

→

−

−→

kn

hhR

hh

hh

hh

hhh

tvs

m

Nv

m

y

yvhmNy

σ

σ

hx

hy

))(

1(1

2

2

x

hhh

s

xx

nv −

+=

hhR vsth

yh

m ˆˆ 2/α±∈

))()(1(1 1 xxSxx hh −−+= −

xT

hh nv

Regresión simple

65Regresión Lineal

Predicción de una nueva observación yh (reg.simple)

hh

hh

xm

mNy

10

2 ),(

ββσ

+=→

hx hx

hy

hh

hhh

hhh

hhh

hhhh

hh

v

yye

yEyEeE

yye

vmNy

xy

22

2

10

]ˆvar[]var[]~var[

0]ˆ[][]~[

ˆ~),(ˆ

ˆˆˆ

σσ

σ

ββ

+=

+==−=

−=→

+=

))1(,0(~ 2hhh vNe +→ σ

hm

hy

66Regresión Lineal

Predicción de una nueva observación yh (Reg. Múltiple)

hx

hm

hx

hy

+=+==−=

→−=

→+=

)1(]ˆvar[]var[]~var[

0]ˆ[][]~[ˆ~

),(ˆˆˆ

2

2

hhhhh

hhhhhh

hhhhhT

h

vyye

yEyEeEyye

vmNyyy

σ

σxb

))1(,0(~ 2hhh vNe +→ σ

hy

67Regresión Lineal

Intervalos de predicción para una nueva observación yh

( )

1

2

1ˆ

ˆ

)1,0(1

ˆˆ~ )1(,0~

−−→+

→+−

−−=

+→

kn

hhR

hh

hh

hh

hhh

hhh

tvs

y

Nv

yy

y

yye

vNe

σ

σ

hhR vsth

yh

y +±∈ 1ˆˆ 2/α

hx

hy

68Regresión Lineal

kk xxy βββ ˆˆˆˆ 110 +++= L

Límites de predicción

x

y hhR vsth

yh

y +±∈ 1ˆˆ 2/α

hhR vsth

yh

m ˆˆ 2/α±∈

69Regresión Lineal

Diagnosis: Residuos

)ˆˆˆ( 110 kikiii xxye βββ +++−= L

+

=

nkknnn

k

k

n e

e

e

xxx

xxx

xxx

y

y

y

MM

L

MOMMM

L

L

M2

1

1

0

21

22212

12111

2

1

ˆ

ˆ

ˆ

1

1

1

β

ββ

32143421321ResiduosPrevistosObservados

ˆ eβXY +=

70Regresión Lineal

Distribución de los residuos

−=−−==−=−=

→

=

−=→

−

V)(IV)(Y)(IV)(Ie0V)Xβ(IYV)(Ie

e

XX)X(XV

V)Y(IeIXβY

T1T

2

2

var]var[][][

),(

σ

σ

EE

N

Normal

))1(,0(

),(

2iii vNe

N

−→

−→

σ

σ V)(I0e 2

71Regresión Lineal

Distancia de Mahalanobis

>⇒≠=⇒=⇒

−−= −

00

.()()(

2

2

12

i

i

ixT

ii

DD

D

xxxxxx

xxSxx

i

ii

a de distancia la Mide

s)Mahalanobi de Dist

TT

ii v

XX)X(XV 1−=

Vmatriz la de diagonales elementos los son

11

0)1(,1

22

,1

2

1

≤≤⇒≥=−⇒+== ∑∑∑≠=≠==

ii

n

ijjijiiiiii

n

ijjijji

n

jijii v

nvvvvvvvv

))()(1(1

')(' 11 xxSxxxXXx −−+== −−ix

Tii

TTiii

nv

72Regresión Lineal

Residuos estandarizados

iivRs

ieir

eev

env

ve

iiiii

iiii

iii

−=

≈⇒≈⇒≈⇒

≈⇒≈⇒

−=

1ˆ

adosestandariz Residuos

00)var(1 de lejos está Cuando

)var(/1 a próximo está Cuando

)1()var(

2

2

xx

xx σ

σ

))1(,0( 2σiii vNe −→

73Regresión Lineal

Hipótesis de normalidad

Herramientas de comprobación:Histograma de residuos

Gráfico de probabilidad normal (Q-Q plot)

Contrastes formales (Kolmogorov-Smirnov)

Ejemplo de coches

Residuos-9 -6 -3 0 3 6 9

0

20

40

60

80

100

120

-6 -4 -2 0 2 4 6

Residuos

0,1

1

5

20

50

80

95

99

99,9

prob

abil

idad

74Regresión Lineal

Comprobación de la linealidad y homocedasticidad

Ambas hipótesis se comprueban conjuntamente mediante gráficos de los residuos

Frente a valores previstos

Frente a cada regresor.

En muchas ocasiones se corrige la falta de linealidad y la heterocedasticidadmediante transformación de las variables.

ikikii

ikikii

uxxy

uxxy

++++=

++++=

logloglog

log

110

110

βββ

βββ

L

L

75Regresión Lineal

Residuos - Valores previstos

0

iy

ie

0

iy

ie

0

iy

ieLineal y homocedástico No lineal y homocedástico

Lineal y no homocedástico

0

iy

ie

No lineal y no homocedástico

76Regresión Lineal

Ejemplo 1: Cerezos Negros

Se desea construir un modelo de regresión para obtener el volumen de madera de una “cerezo negro” en función de la altura del tronco y del diámetro del mismo a un metro sobre el suelo. Se ha tomado una muestra de 31 árboles. Las unidades de longitudes son pies y de volumen pies cúbicos.

77Regresión Lineal

Cerezos negros: Datos

Árbol Diametro Altura Volumen Árbol Diametro Altura Volumen1 8,3 70 10,30 17 12,9 85 33,802 8,6 65 10,30 18 13,3 86 27,403 8,8 63 10,20 19 13,7 71 25,704 10,5 72 16,40 20 13,8 64 24,905 10,7 81 18,80 21 14,0 78 34,506 10,8 83 19,70 22 14,2 80 31,707 11,0 66 15,60 23 14,5 74 36,308 11,0 75 18,20 24 16,0 72 38,309 11,1 80 22,60 25 16,3 77 42,6010 11,2 75 19,90 26 17,3 81 55,4011 11,3 79 24,20 27 17,5 82 55,7012 11,4 76 21,00 28 17,9 80 58,3013 11,4 76 21,40 29 18,0 80 51,5014 11,7 69 21,30 30 18,0 80 51,0015 12,0 75 19,10 31 20,6 87 77,0016 12,9 74 22,20

78Regresión Lineal

Gráficos x-y

Altura

Vol

umen

60 65 70 75 80 85 900

20

40

60

80

Diametro

Vol

umen

8 11 14 17 20 230

20

40

60

80

79Regresión Lineal

Primer modelo:cerezos negros

Standard TParameter Estimate Error Statistic P-Value-----------------------------------------------------------------------------CONSTANT -57,9877 8,63823 -6,71291 0,0000Altura 0,339251 0,130151 2,60659 0,0145Diametro 4,70816 0,264265 17,8161 0,0000-----------------------------------------------------------------------------


R-squared = 94,795 percentR-squared (adjusted for d.f.) = 94,4232 percent

ErrorAlturaDiametroVolumen +++= 210 βββ

80Regresión Lineal

Diagnosis

Diametro8 11 14 17 20 23

-9

-6

-3

0

3

6

9

valores previstos0 20 40 60 80

-9

-6

-3

0

3

6

9

resi

duos

resi

duosFalta de

linealidad

Falta de homocedasticidad

81Regresión Lineal

Transformación

errordiámetro)altura)vol)

diámetroalturakvol

20

2

+++≈××≈

log(log(log( 1 βββDependent variable: log(Volumen)----------------------------------------------------------------------------- Standard TParameter Estimate Error Statistic P-Value-----------------------------------------------------------------------------CONSTANT -6,63162 0,79979 -8,2917 0,0000log(Altura) 1,11712 0,204437 5,46439 0,0000log(Diametro) 1,98265 0,0750106 26,4316 0,0000-----------------------------------------------------------------------------



82Regresión Lineal

Diagnosis (modelo transformado)

log(Altura)4,1 4,2 4,3 4,4 4,5

-0,17

-0,07

0,03

0,13

0,23

log(Diametro)2,1 2,3 2,5 2,7 2,9 3,1

-0,17

-0,07

0,03

0,13

0,23

valores previstos2,3 2,7 3,1 3,5 3,9 4,3 4,7

-0,17

-0,07

0,03

0,13

0,23

resi

duos

resi

duos

resi

duos

-0,17 -0,12 -0,07 -0,02 0,03 0,08 0,13

Residuos

0,1

15

20

50

80

9599

99,9

prob

abili

dad

83Regresión Lineal

Interpretación

Se comprueba gráficamente que la distribución de los residuos es compatible con las hipótesis de normalidad y homocedasticidad.El volumen está muy relacionada con la altura y el diámetro del árbol (R2= 97.8%)El modelo estimado

log(Vol) = -6.6 + 1.12 log(Alt) + 1.98 log(Diam.) + Error

es compatible con la ecuación vol=k × Alt ×Diam2

La varianza residual es 0.006623, es decir sR=0.081 que indica que el error relativo del modelo en la predicción del volumen es del 8.1%.

84Regresión Lineal

Datos olímpicos

Se pretende construir un modelo de regresión con dos objetivos:

Medir la evolución de estas marcas con el tiempo.Hacer una predicción del resultado en unas futuras olimpiadas.

Tiempos de los campeones olímpicos en 200m, 400m, 800m y 1500m.

85Regresión Lineal

Ejemplo: Carreras olímpicas

Ciudad Altitud Año 200 m 400 m 800 m 1500 mParís 79 1900 22,20 49,40 121,40 246,00San Luis 138 1904 21,60 49,20 116,00 245,40Londres 15 1908 22,40 50,00 112,80 243,40Estocolmo 15 1912 21,70 48,20 111,90 236,80Amberes 4 1920 22,00 49,60 113,40 241,80París 79 1924 21,60 47,60 112,40 233,60Amsterdan -2 1928 21,80 47,80 111,80 233,20Los Ángeles 100 1932 21,20 46,20 109,80 231,20Berlín 50 1936 20,70 46,50 112,90 227,80Londres 15 1948 21,10 46,20 109,20 225,20Helsinki 25 1952 20,70 45,90 109,20 225,20Melbourne 115 1956 20,60 46,70 107,70 221,20Roma 15 1960 20,50 44,90 106,30 215,60Tokyo 14 1964 20,30 45,10 105,10 218,10Mexico 2220 1968 19,83 43,80 104,30 214,90Munich 458 1972 20,00 44,66 105,90 216,30Montreal 53 1976 20,23 44,26 103,50 219,20Moscú 150 1980 20,19 44,60 105,40 218,40Los Ángeles 100 1984 19,80 44,27 104,00 212,53Seúl 34 1988 19,75 43,87 103,45 215,96Barcelona 0 1992 20,01 43,50 103,66 220,12Atlanta 320 1996 19,32 43,49 102,58 215,78

86Regresión Lineal

Tiempo = β0 + β1 Año + β2 Distancia + Error

Dependent variable: Tiempo----------------------------------------------------------------------------- Standard TParameter Estimate Error Statistic P-Value-----------------------------------------------------------------------------CONSTANT 268,485 36,8179 7,29222 0,0000Año -0,145478 0,0188741 -7,70784 0,0000Distancia 0,159578 0,00113405 140,715 0,0000-----------------------------------------------------------------------------



87Regresión Lineal

Diagnosis

Distancia

Res

iduo

s

0 200 400 600 800 1000 1200 1400 1600-15

-10

-5

0

5

10

15

Valores previstos

resi

duos

0 50 100 150 200 250-15

-10

-5

0

5

10

15

residuos

prob

abili

dad

-16 -12 -8 -4 0 4 8 12 160,1

15

2050

80

9599

99,9

88Regresión Lineal

Interpretación

Los gráficos de los residuos con la distancia y con los valores previstos muestran falta de linealidad yheterocedasticidad (leve)El gráfico Q-Q muestra falta de normalidadLa transformación 1/Tiempo puede servir para corregir el problema deheterocedasticidad. En este caso es más útil modelar la velocidad

iiiTiempoDistanciaVelocidad /=

89Regresión Lineal

Velocidad = β0 + β1 Año + β2 Dist. + Error

Dependent variable: Velocidad----------------------------------------------------------------------------- Standard TParameter Estimate Error Statistic P-Value-----------------------------------------------------------------------------CONSTANT -12,2153 2,73592 -4,46478 0,0000Año 0,0112286 0,00140252 8,00603 0,0000Distancia -0,00220474 0,0000842706 -26,1627 0,0000-----------------------------------------------------------------------------



90Regresión Lineal

Diagnosis

Distancia

Res

iduo

s

0 200 400 600 800 1000 1200 1400 1600-0,8

-0,4

0

0,4

0,8

Valores previstos

resi

duos

6 7 8 9 10 11-0,8

-0,4

0

0,4

0,8

-0,8 -0,5 -0,2 0,1 0,4 0,7

Residuos

0,1

1

5

20

50

80

95

99

99,9

Res

iduo

s

91Regresión Lineal

Velocidad = β0 + β1 Año + β2 Dist. + β3 Dist.2 + Error

Dependent variable: Velocidad----------------------------------------------------------------------------- Standard TParameter Estimate Error Statistic P-Value-----------------------------------------------------------------------------CONSTANT -11,1792 0,834388 -13,3981 0,0000Año 0,0112286 0,000427338 26,2758 0,0000Distancia -0,00588973 0,000130341 -45,1873 0,0000Distancia^2 0,0000021172 7,34191E-8 28,8371 0,0000-----------------------------------------------------------------------------



92Regresión Lineal

Diagnosis

Distancia

resi

duos

0 200 400 600 800 1000 1200 1400 1600-0,5

-0,25

0

0,25

0,5

valores previstos

resi

duos

6 7 8 9 10 11-0,5

-0,25

0

0,25

0,5

Residuos

prob

abili

dad

-0,31 -0,21 -0,11 -0,01 0,09 0,19 0,290,1

1

5

20

50

80

95

99

99,9

93Regresión Lineal

Interpretación

El modelo cumple las condiciones de normalidad y homocedasticidad.El coeficiente de determinación R2=99% da una medida de la bondad de ajuste del modelo.El coeficiente positivo del AÑO indica que conforme pasan los años se aumenta la velocidad (se mejoran las marcas). El término dominante de la variable DISTANCIA tiene coeficiente negativo que indica que la velocidad media disminuye al aumentar la distancia de la prueba.Se mejora ligeramente el modelo con una nueva variable ALTITUD de la ciudad donde se desarrolla las olimpiadas.

94Regresión Lineal

Vel. = β0+β1 Año+β2 Dist. + β3 Dist.2 + log(Alt)+Error

Dependent variable: Velocidad----------------------------------------------------------------------------- Standard TParameter Estimate Error Statistic P-Value-----------------------------------------------------------------------------CONSTANT -10,6966 0,807542 -13,2459 0,0000Año 0,0109342 0,000416677 26,2413 0,0000Distancia -0,00588973 0,000123874 -47,5461 0,0000Distancia^2 0,0000021172 6,97766E-8 30,3425 0,0000log(Altitud+3) 0,0237773 0,00751947 3,1621 0,0022-----------------------------------------------------------------------------



95Regresión Lineal

Predicción Sydney 2000

Predicción para Velocidad - AÑO 2000 - SYDNEY------------------------------------------------------------------------ Fitted Stnd. Error Lower 95,0% CL Upper 95,0% CL

Row Value for Forecast for Forecast for Forecast ------------------------------------------------------------------------ 200 m 10,1114 0,119833 9,87302 10,3497 400 m 9,18748 0,118783 8,95123 9,42374 800 m 7,84784 0,119901 7,60937 8,08632 1500 m 7,13371 0,120308 6,89442 7,373

------------------------------------------------------------------------

Resultado Error ErrorDistancia Lím. Inf. Lím. Sup. Predicción Sydney 2000 Absoluto Relativo

200 m 19,32 20,26 19,78 20,09 0,31 2%400 m 42,44 44,69 43,538 43,84 0,302 1%800 m 98,93 105,13 101,939 95,08 -6,859 -7%1500 m 203,44 217,57 210,269 212,07 1,801 1%

Intervalo de predicción (95%)

Predicción del tiempo (segundos) y resultados Sydney 2000

Capítulo 6. Regresión lineal

6.1 Con los datos de la tabla, se pide:

x -2 -2 -1 -1 0 0 1 1 2 2 3 3y 1.1 1.3 2.0 2.1 2.7 2.8 3.4 3.6 4.0 3.9 3.8 3.6

(a) Estimar un modelo de regresión simple con y como variable dependiente y x como regresor.Indicar si el modelo es apropiado, justificando la respuesta.

(b) Estimar el modelo

yi = β0 + β1xi + β2x2i + ui.

6.2 La ley de Hubble sobre la expansión del universo establece que dadas dos galaxias la velocidad dedesplazamiento de una respecto a la otra es v = Hd, siendo d su distancia y H la constante deHubble. La tabla proporciona la velocidad y la distancia de varias galaxias respecto a la Via Láctea.Se pide:

Galaxia Distancia Velocidad(millones años luz) (103km/s)

Virgo 22 1.21Pegaso 68 3.86Perseo 108 5.15Coma Berenices 137 7.56Osa Mayor 1 255 14.96Leo 315 19.31Corona Boreal 390 21.56Géminis 405 23.17Osa Mayor 2 700 41.83Hidra 1100 61.14

Tabla: Distancia y velocidad de desplazamiento de las distintas galaxias a la Via Lactea.

Nota: Obsérvese que según el modelo de Hubble la regresión debe pasar por el origen. Tómese 1año luz = 300 000 km/s × 31 536 000 s = 9.46 1012 km.

(a) Estimar por regresión la constante de Hubble.(b) Como T = d/v = d/Hd = 1/H, la inversa de la constante de Hubble representa la edad

estimada del Universo. Construir un intervalo de confianza del 95% para dicha edad .

6.3 Estimar por máxima verosimilitud los parámetros β1 y β2 del modelo

yi = β1x1i + β2x22i + ui ;ui ; N(0,σ).

¿En qué condiciones los estimadores obtenidos por máxima verosimilitud son iguales que los obtenidospor mínimos cuadrados?

6.4 Sir Francis Galton (1877) estudió la relación entre la estatura de una persona (y) y la estatura desus padres (x) obteniendo las siguientes conclusiones:

1

(a) Existía una correlación positiva entre las dos variables.(b) Las estaturas de los hijos cuyos padres medían más que la media era, en promedio, inferior

a la de sus progenitores, mientras que los padres con estatura inferior a la media enpromedio tenían hijos más altos que ellos, calificando este hecho como de ”regresión” a lamedia.

Contrastar (α = 0.05) estas dos conclusiones con la ecuación y = 17.8 + 0.91x resultante de estimarun modelo de regresión lineal entre las variables (en cm.) descritas anteriormente para unamuestra de tamaño 100 si la desviación típica (estimada) de β1 es 0.04.

6.5 Demostrar que en un modelo de regresión simple y y el estimador de la pendiente β1 son indepen-dientes. Utilizar esta propiedad para calcular la varianza de β0 = y − β1x.

6.6 La matriz de varianzas de las variables X1, X2 e Y es

25 27 1427 36 19.214 19.2 16

Siendo X1 = 30,X2 = 40, Y = 100 y el número de datos n = 10. Se pide:

(a) Realizar la regresión simple entre Y (variable dependiente) y X1, dando el intervalo deconfianza para la pendiente de la recta con α = 0.05. Hacer lo mismo con Y y X2.

(b) Realizar la regresión múltiple entre Y (variable dependiente) y X1,X2, en desviaciones ala media.

(c) Indicar si los coeficientes de la regresión anterior son significativos.(d) Calcular R2 para los tres modelos, comentar los resultados obtenidos e indicar qué modelo

eligiría y por qué.

6.7 Demostrar que el coeficiente de correlación múltiple en el modelo general de regresión es igual alcoeficiente de correlación lineal entre la variable observada y y la prevista by.

6.8 La resistencia a la tracción (y) de una aleación metálica en función de la temperatura de templado(x) se ha ajustado con una ecuación de regresión para 30 observaciones resultando:

y = 276.1 + 1.9x, sR = 15.7, R2 = 0.43

¿Se puede concluir con una confianza del 95% que la temperatura de templado tiene efecto signi-ficativo en la resistencia a la tracción.?

6.9 El coeficiente de determinación en un modelo de regresión simple es R2 = 0.75. Si el número deobservaciones es n = 100, contrasta la hipótesis H0 : β1 = 0 frente a la alternativa H1 : β1 6= 0(α = 0.05).

6.10 La masa M de un cristal de hielo depositado en una cámara a temperatura (-5oC) y humedadrelativa constante crece según la ecuación M = αT β, donde T es el tiempo y α y β son parámetros

2

desconocidos. La relación anterior se linealiza con la transformación logarítmica, estimándose elsiguiente modelo

logM = logα+ β log T + u

donde el término añadido u son los errores experimentales, que se consideran aleatorios e indepen-dientes con distribución normal, N(0,σ2). Diez cristales del mismo tamaño y forma se introdujeronen una cámara, extrayéndose secuencialmente según unos tiempos previamente establecidos. Paradeterminar la influencia del tipo de cámara, se repitió exáctamente el experimento en una segundacámara. Los valores de sR para la cámara 1 y 2 son 0.64 y 0.50, respectivamente. Los modelosestimados para cada cámara, XTX y (XTX)−1 son:

logM1 = −7.30 + 2.40 log TlogM2 = −5.74 + 2.03 log T XTX =

µ10.00 46.6646.66 218.9

¶

(XTX)−1 =µ18.27 −3.89−3.89 0.835

¶(a) Contrastar con nivel de significación 0.05 si los dos modelos tienen la misma pendiente. Lo

mismo para la ordenada en el origen. (NOTA.- Aceptar que la varianza de los dos modeloses la misma y estimarla como el promedio de las dos varianzas residuales calculadas.)

(b) Un modelo de regresión múltipleY = Xβ +U, se replica, es decir se obtienen dos vectoresde variables respuesta Y1,Y2, para los mismo regresores (matriz X). Demostrar que siβ1 y β2 son los resultados de la estimación de β utilizando por separado la variable Y1 eY2; entonces el estimador de β con todos los datos es (β1+β2)/2.

(c) Estimar un único modelo con los datos de las dos cámaras. Sabiendo que YTY = 306.8,donde Y = logM , dar un intervalo de confianza al 99% para los dos parámetros.

6.11 Se ha estimado un modelo de regresión para la estatura (y) de un grupo de adultos y sus estaturasa los 7 (x1) y 14 (x2) años. La desviación típica residual obtenida es 5 cm y la desviación típicadel coeficiente de x1 (estatura a los 7 años) resulta 2.4, siendo este efecto no significativo al 95%.Sin embargo, un segundo modelo de regresión que incluya sólo a esta variable (x1) conduce a unadesviación típica residual de 7 cm y a un coeficiente de regresión de 2 con desviación típica de 1.¿Qué podemos concluir con estos resultados de la correlación entre x1 y x2?

6.12 En la tabla 1 se muestran los resultados de un experimento en el que se estudiaron las pérdidas porabrasión (rozamiento) de material de goma empleado en la fabricación de neumáticos en funciónde la dureza de la goma en grados Shore y de su resistencia a la tensión. Esta última variable estárepresentada por dos únicos valores, -1 para las gomas con una resistencia máxima a la tensión menorde 180 kg/cm2 y con +1 aquellas que presentan una resistencia máxima superior a 180 kg/cm2. Losresultados del modelo de regresión múltiple (P erdidas = β0+β1Dureza+β2 Re sistencia +ui) semuestran en las tablas 1 y 2.

(a) ¿Hay diferencias significativas en las pérdidas observadas en gomas con resistencia baja(-1) y en gomas con resistencia alta (+1)?. Explicar el significado de β2 (coeficiente deResistencia) y dar un intervalo de confianza de 95% para el mismo.

3

(b) Para comprobar si el efecto de la dureza en las pérdidas es el mismo para las gomas donresistencia alta y baja se planteó el siguiente modelo:P erdidas = β0 + β1Dureza+ β2Re sistencia+ β3Dureza×Re sistencia+ ui.Explicar de forma concisa el significado de cada uno de los tres parámetros del modelo.

(c) Los resultados de la estimación del modelo del apartado 2 se proporcionan en la tabla 3 yen la figura siguiente. Teniendo en cuenta los resultados de la tabla 2 y 3, elegir el modeloque relaciona las pérdidas por rozamiento con las variables resistencia y dureza. Justificarla respuesta. ¿Por qué cambia tanto el nivel crítico (p-value) correspondiente a la variableResistencia en uno y otro modelo?.

(d) En la tabla 1 se proporcionan los valores previstos y los residuos del modelo anterior.Comprobar la hipótesis de homocedasticidad.

DATOS RESULTADOSDureza Resistencia Pérdidas Predicción Residuos53 -1 221 227,1 -6,155 -1 206 215,1 -9,156 -1 228 209,1 18,960 -1 166 185,1 -19,261 -1 175 179,2 -4,264 -1 164 161,2 2,866 -1 154 149,2 4,868 -1 113 137,3 -24,371 -1 136 119,3 16,771 -1 112 119,3 -7,375 -1 128 95,4 32,679 -1 82 71,4 10,681 -1 55 59,4 -4,481 -1 32 59,4 -27,486 -1 45 29,5 15,545 1 372 378,4 -6,451 1 341 342,5 -1,559 1 249 294,6 -45,659 1 340 294,6 45,465 1 283 258,7 24,368 1 196 240,7 -44,771 1 219 222,8 -3,874 1 267 204,8 62,280 1 186 168,9 17,181 1 215 162,9 52,182 1 155 156,9 -1,983 1 97 150,9 -53,986 1 148 133,0 15,088 1 64 121,0 -57,089 1 114 115,0 -1,0

TABLA 1. Datos, valores previstos y residuos del modelo de regresión: P erdidas = β0 + β1Dureza+β2Re sistencia+ ui

4

TABLA 2.

Multiple Regression AnalysisDependent variable: PerdidasParameter Estimate Standard Error T Statistic P-ValueCONSTANT 596,075 32,8079 18,1686 0,0000Dureza -5,98636 0,46042 -13,0019 0,0000Resistencia 51,7421 5,51215 9,38692 0,0000

Analysis of VarianceSource Sum of Squares Df Mean Square F-ratio P-ValueModel 200957,0 2 100478,0 112,78 0,0000Residual 24054,6 27 890,909Total (Corr.) 225011,0 29

R-squared=89,3096 percentR-squared (adjusted for d.f.)=88,5177 percentStandard Error of Est.=29,8481Mean absolute error =21,1946Durbin-Watson statistic=2,25411

TABLA 3.

Multiple Regression AnalysisDependent variable: PerdidasParameter Estimate Standard Error T Statistic P-ValueCONSTANT 592,59 34,4264 17,2132 0,0000Dureza -5,93173 0,486879 -12,1832 0,0000Resistencia 65,4644 34,4264 1,90157 0,0684Dureza×Resistencia -0,196688 0,486879 -0,403978 0,6895

Analysis of VarianceSource Sum of Squares Df Mean Square F-ratio P-ValueModel 201107,0 3 67035,6 72,91 0,0000Residual 23904,5 26 919,404Total (Corr.) 23904,5 29

R-squared=89,3763 percentR-squared (adjusted for d.f.)=88,1505 percentStandard Error of Est.=30,3217Mean absolute error =21,1085Durbin-Watson statistic=2,25622

6.13 Se ha estimado un modelo de regresión múltiple para estudiar el efecto de tres regresores x1, x2, x3sobre la resistencia de ciertas fibras textiles con n = 15 observaciones, resultando:

yi = 17.36 + 0.95x1i + 1.03x2i − 1.58x3i, s2R = 2.54, R2 = 0.92

Realiza el contraste general de regresión y los contrastes individuales (α = 0.05) si

5

(XT X)−1 =

0.0051 −0.0041 0.0204−0.0041 0.4033 0.18360.0204 0.1836 0.4818

.6.14 Los datos mostrados son el resultado de un experimento para caracterizar la duración de un material

utilizado en un torno de corte de acero, en función de la velocidad de corte (X1) y del ratio dealimentación (X2). Por sencillez, las variables se han escalado de la siguiente forma

V =X1 − 900300

, F =X2 − 136

V F Y V F Y-1 -1 54.5 -

√2 0 20.1

-1 -1 66.0√2 0 2.9

1 -1 11.8 0 0 3.81 -1 14.0 0 0 2.2-1 1 5.2 0 0 3.2-1 1 3.0 0 0 4.01 1 0.8 0 0 2.81 1 0.5 0 0 3.20 -

√2 86.5 0 0 4.0

0√2 0.4 0 0 3.5

y se ha estimado el siguiente modelo

log(Yi) = β0 + β1Vi + β2Fi + β3V2i + β4F

2i + β5Vi × Fi + Ui

siendo Ui errores aleatorios con distribución normal de media cero y varianza constante. y se haestimado el siguiente modelo

log(Yi) = β0 + β1Vi + β2Fi + β3V2i + β4F

2i + β5Vi × Fi + Ui

siendo Ui errores aleatorios con distribución normal de media cero y varianza constante. Losresultados principales del análisis son los de la siguiente tabla.

Interpreta los resultados del análisis de regresión, indica de forma específica los resultados de los con-trastes individuales de los parámetros βi y del contraste general de regresión si se utiliza un nivelde significación α = 0.01.

6

Análisis de Regresión Múltiple----------------------------------------------------------------------------Variable Dependiente: LOG10(Duración)----------------------------------------------------------------------------- Desviación Estadístico Parámetro Estimación Típica t P-Valor-----------------------------------------------------------------------------CONSTANTE 0,515979 0,045626 11,3089 0,0000V -0,343176 0,0372527 -9,21213 0,0000F -0,690076 0,0372536 -18,5237 0,0000V^2 0,181733 0,0436797 4,16058 0,0010F^2 0,125106 0,043684 2,86389 0,0125V x F -0,0316418 0,045626 -0,693503 0,4993-----------------------------------------------------------------------------

Análisis de la Varianza----------------------------------------------------------------------------- Suma de Grados CuadradosFuente Cuadrados Libertad Medios F P-Valor-----------------------------------------------------------------------------Modelo 7,60038 5 1,52008 91,27 0,0000Residual 0,233154 14 0,0166539-----------------------------------------------------------------------------Total (Corr.) 7,83354 19

6.15 En un modelo de regresión simple se ha obtenido un coeficiente de correlación igual a −0.8. Si elnúmero de observaciones es n = 150, y = 22 y la variabilidad total es 320. Construir un intervalode confianza al 95% para el valor medio de la variable dependiente (y) cuando x (regresor) esigual a x. (Aproximar la distribución t de Student correspondiente por una distribución normal, siZ ; N(0, 1), P (Z ≤ 1.96) = 0.975).

6.16 Sea x1 la altura del tronco de un árbol y x2 el diámetro del mismo en su parte inferior. El volumeny del tronco de árbol puede ser calculado aproximadamente con el modelo

yi = αx1ix22i + ui,

según el cual, el volumen del tronco es proporcional al volumen de un cono con las medidas x1i, x2i,siendo α el parámetro (desconocido) de proporcionalidad, más una componente de error aleatorioui. La tabla siguiente contiene los datos (en metros y metros cúbicos) correspondientes a unamuestra aleatoria de 15 troncos de una variedad de pino.

Obs. x1i x2i x1ix22i yi Obs. x1i x2i x1ix

22i yi

1 10,1 0,117 0,14 0,062 9 19,8 0,297 1,75 0,8212 11,3 0,13 0,19 0,085 10 26,8 0,328 2,90 1,2803 20,4 0,142 0,41 0,204 11 21 0,351 2,60 1,0344 14,9 0,193 0,56 0,227 12 27,4 0,376 3,90 1,6795 23,8 0,218 1,13 0,47 13 29 0,389 4,40 2,0736 19,5 0,236 1,09 0,484 14 27,4 0,427 5,00 2,0227 21,6 0,257 1,43 0,623 15 31,7 0,594 11,2 4,6308 22,9 0,269 1,66 0,722

7

(a) Estimar α por máxima verosimilitud suponiendo que las variables ui tienen distribuciónnormal de media cero, con la misma varianza e independientes.

(b) Un tronco tiene una altura de 20 metros y un diametro de 0.25 metros, dar un intervalo depredicción de su volumen (95% de confianza). La varianza residual del modelo es 0,0058.

(c) En el análisis de los residuos se observa que la varianza de los errores crece con el volumendel tronco. Para obtener homocedasticidad se propone el siguiente modelo transformadoutilizando logaritmos neperianos,

log yi = β0 + β1 log x1i + β2 log x2i + ui

El resultado de la estimación es:

Parámetro Estimaciónβ0 -1,45β1 1,14β2 1,86

y cMbβ = 0, 1250 0, 0212 −0, 0317

0, 0212 0, 0082 −0, 0051−0, 0317 −0, 0051 0, 0042

siendocMbβ = bs2R(XTX)−1 (X es la matriz de los regresores transformados según el modelo)La transformación logarítmica del modelo inicial (αx1ix22i) implicaría que β1 = 1 y β2 = 2.Contrastar (nivel de significación 0.05) si estos dos valores son aceptables.

(d) Con este modelo, dar un intervalo de predicción (95% de confianza) para el volumen deltronco del apartado 2 si la varianza residual es 0,0031.

6.17 La empresa de bebidas gaseosas CIBELES quiere determinar la influencia sobre la presión interna(yi) en los botes de refresco de dos variables continuas (x1, x2) y del tipo de bebida (NARANJA=1,LIMÓN=2 y COLA=3). Para distintos valores de x1 y x2 y 20 botes de cada sabor, ha medidola presión interna. El tipo de bebida se representa por las variables z1, z2 y z3 qué identifican elsabor NARANJA, LIMÓN y COLA, respectivamente. El modelo estimado de regresión de y conrespecto a x1, x2, z2 y z3 es:

y = 19.4 + 77.2x1 − 50.8x2 + 2.95z2 + 5.52z3; bsR = 4.32donde

(XTX)−1 =

0.1772 −0.6909 −0.5043 −0.0605 −0.0896−0.6909 5.8085 0.2541 0.1478 0.2444−0.5043 0.2541 5.0070 −0.0680 0.1216−0.0605 0.1478 −0.0680 0.1049 0.0546−0.0896 0.2444 0.1216 0.0546 0.1127

(a) Realizar los contrastes individuales con α = 0.01, indicando las variables que influyen

significativamente en la presión. Interpretar el resultado explicando el significado de cadaparámetro.

(b) Si se realiza una regresión entre la presión interna (yi) y las dos variables continuas x1 yx2 se obtiene el siguiente modelo de regresión

y = 23.86 + 65.1x1 − 56.3x2; sR = 4.78.

Contrastar (α = 0.01) conjuntamente que el tipo de bebida no influye. (H0 : α2 = α3 = 0frente a H1 : α2 ó α3 es distinto de cero).

8

(c) ¿Existe diferencia significativa en las presiones internas de los botes de LIMÓN y COLA?(α = 0.01)

6.18 Se ha ajustado el siguiente modelo de regresión múltiple con una muestra de 86 vehículos, delos cuales 31 son japoneses , 41 norteamericanos y 14 europeos, dónde la variable dependiente esel consumo, y los regresores: Pot (potencia) está expresada en unidades de 100 Cv, el Peso enToneladas, ZJ toma el valor 1 si el coche es japonés y cero en los demás, y ZE toma el valor 1 paralos coches europeos y cero en los demás.

by = 3.305 + 0.843 Pot+ 3.829 Peso+ 0.440 ZJ + 1.127 ZE bs2R = 0.506, R2 = 75.7%

(XTX)−1 =

4.791e− 1 5.054e− 2 −3.794e− 1 −9.157e− 2 −4.682e− 25.054e− 2 1.595e− 1 −1.931e− 1 −3.443e− 3 −1.262e− 2−3.794e− 1 −1.931e− 1 4.646e− 1 5.210e− 2 2.865e− 2−9.157e− 2 −3.443e− 3 5.210e− 2 6.667e− 2 2.744e− 2−4.682e− 2 −1.262e− 2 2.865e− 2 2.744e− 2 9.759e− 2

Dar el intervalo de confianza para el consumo previsto de un coche norteamericano con una potenciade 120 Cv y 1600 kg de peso.

6.19 Sea X la matriz completa de un diseño 2k, por ejemplo para el caso de k = 3,

X =

1 −1 −1 −1 1 1 1 −11 1 −1 −1 −1 −1 1 11 −1 1 −1 −1 1 −1 11 1 1 −1 1 −1 −1 −11 −1 −1 1 1 −1 −1 11 1 −1 1 −1 1 −1 −11 −1 1 1 −1 −1 1 −11 1 1 1 1 1 1 1

e Y el vector de dimensión n = 2k con los valores de la variable respuesta correspondiente al exper-imento. El análisis estadístico del experimento se puede realizar mediante el modelo de regresiónmúltiple

Y = Xβ +U,

donde β = (β0,β1, ...,βn−1)T es el vector de parámetros yU = (u1, u2, ..., un)T el vector de variables

aleatorias independientes con distribución normal de media cero y desviación típica σ. Demostrarque para cualquier i, la varianza de bβi es σ2/n y que el error de predicción de una observaciónnueva en cualquiera de los 2k tratamientos tiene como varianza 2σ2.

6.20 Demuestra que la recta de regresión pasa por el punto (x, y) y que el intervalo de predicción parala media de la variable respuesta cuando el regresor toma el valor igual a x, es

y ± tα/2sR√n

donde n es el número de observaciones, tα/2 se obtiene de la distribución t de Student con n − 2grados de libertad y s2R es la varianza residual.

9

6.21 La masa M de un cristal de hielo depositado en una cámara a temperatura (-5oC) y humedadrelativa constante crece según la ecuación M = αT β, donde T es el tiempo en horas, y α y βson parámetros desconocidos. La relación anterior se linealiza con la transformación logarítmica,estimándose el siguiente modelo

logM = logα+ β log T + u

donde el término añadido u son los errores experimentales, que se consideran aleatorios e indepen-dientes con distribución normal, N(0,σ2). Diez cristales del mismo tamaño y forma se introdujeronen una cámara, extrayéndose secuencialmente según unos tiempos previamente establecidos. Elmodelo estimado, XTX y (XTX)−1 son:

dlogMi = −7.30 + 2.40 log Ti, sR = 0.64

XTX =

µ10.00 46.6646.66 218.9

¶(XTX)−1 =

µ18.27 −3.89−3.89 0.835

¶Predice el crecimiento medio esperado del cristal después de 3 horas en la cámara con un intervaloal 95% de confianza.

6.22 La siguiente tabla muestra los datos recogidos en un estudio sobre el efecto de disolver azufre en latensión superficial del cobre fundido

Variables ObservacionesX: % en Peso deAzufre 0.034 0.093 0.30 0.40 0.61 0.83Y: Reducción de Ten.Sup. 301 430 593 630 656 740(dos replicaciones) 316 422 586 618 642 714

Se ha estimado el modelo de regresión lineal simple con log(X) como regresor. El resultado delanálisis de regresión y la gráfica del modelo se proporcionan más abajo.Se ha estimado el modelo deregresión lineal simple con log(X) como regresor. El resultado del análisis de regresión y la gráficadel modelo se proporcionan más abajo.

Análisis de Regresión: Modelo Logarítmico Y = a + b*ln(X)--------------------------------------------------------------------------Variable dependiente: Tensión SuperficialVariable Independiente: Azufre-------------------------------------------------------------------------- Desviación Estadístico Parámetro Estimación Típica t P-Valor--------------------------------------------------------------------------Constante 735,784 7,47038 98,4935 0,0000Pendiente 127,457 4,12867 30,8712 0,0000--------------------------------------------------------------------------

Analisis de la Varianza--------------------------------------------------------------------------Fuente Suma de Grados Cuadrados Cuadrados Libertad Medios F P-Va--------------------------------------------------------------------------Modelo 241678,0 1 241678,0 953,03 0,0Residual 2535,9 10 253,59--------------------------------------------------------------------------Total (Corr.) 244214,0 11

10

Azufre

Tension_Sup

0 0,2 0,4 0,6 0,8 1300

400

500

600

700

800

Utiliza el modelo para predecir la reducción de la tensión superficial del cobre fundido con un 0.8%de azufre disuelto. Da un intervalo de confianza del 95% para la predicción.

6.23 Se ha estimado un modelo de regresión con dos variables independientes y 20 observaciones obtenién-dose la siguiente ecuación:

byi = −19.17 + 0.222x1 + 0.659x2, bs2R = 6.468La matriz de varianzas de los regresores (x1, x2) esµ

25.23 24.2924.29 27.40

¶.

Teniendo en cuenta que la matriz de varianza teórica de los estimadores bb = [bβ1, bβ2]T esσ2

ns21(1− r2)− r σ2

ns1s2(1− r2)− r σ2

ns1s2(1− r2)σ2

n s22(1− r2)

,donde n es el número de observaciones, r el coeficiente de correlación entre los regresores, s21 ys22 las varianzas muestrales de los regresores y σ2 la varianza del modelo de regresión; realiza loscontrastes individuales de los dos regresores, α = 0.05. Interpreta el resultado de los dos contrastes.

11

.

EstadísticaSoluciones a los ejercicios propuestos.

Curso 2004/05

1

Capítulo 1. Descriptiva

1.1 xp = (10+18+22+150)/4 = 50; sp =

r(10− 50)2 + ...+ (150− 50)2

4= 57.9;xa = 10(10/200)+

...+ 150(150/200) = 117.04;

sa =p(10− 117.04)2(10/200) + ...+ (150− 117.04)2(150/200) = 57.1.

1.2 Si es posible el resultado, z = x+ y; s2z = s2x + s

2y + 2sxy; sxy = −11/2;

¯4 −11/2

−11/2 9

¯≥ 0.

1.3 x0 = k1x; y0 = k2y; cov(x0, y0) = k1k2cov(x, y); sx0 = |k1| sx; sy0 = |k2| sy; r(x0, y0) = r(x, y).1.4 cov(x, y) = bs2x; s

2y = b

2s2x; r(x, y) = 1.

1.5

¯s2x rsxsyrsxsy s2y

¯= s2xs

2y − r2s2xs2y ≥ 0; 1 ≥ r2.

1.6 Si. Determinante = −2. No puede ser una matriz de varianzas.1.7 No. y = log10 xG; xG es la media geométrica; xG < xA; log10 xG < log10 xA; 2.5 ≮ 2.

1.8 Q1 = −0.16;Q2 = mediana = −0.0.3;Q3 = 0.18;RI = 0.34;LI = −0.67;LS = 0.69, como el valormáximo muestral es 0.45, entonces LS = 0.45.

Capítulo 2. Probabilidad

2.1 p = 0.472

2.2 La función de densidad es fz(z) = 2zr2con 0 < z < r y la función de distribución es Fz(z) =

z2

r2

2.4 k = log 2;E[X] =25

log 2y V ar[X] ' 51.67

2.5 E

·mV 2

2

¸= 3

2kT,que es independiente de su masa. Fijada la temperatura T , cualquier gas tiene

el mismo valor medio de energía cinética molecular independientemente de su masa.

2.6 fY (y) = 1 con 0 ≤ y ≤ 1

2.7 p =

R∞5 x

σ2e−x2

2σ2 dx

10

= e−10/8

2.8 E[X] =R a0 xfX(x)dx +

R∞a xfX(x)dx ≥

R∞a xfX(x)dx = aP (x > a) y despejando se obtiene la

desigualdad de Markov.

2.9 k =3

2, E[Y ] =

1

8, V ar[Y ] =

171

320.

2.10 fXY (x,y) =

½c si x2 + y2 ≤ r20 si x2 + y2 > r2

, fX(x) =2

πr2√r2 − x2, −r ≤ x ≤ r

2

2.11 (a) k = 6;E[p] =1

2;V ar[p] =

1

20.

(b)³R 0.750 6p(1− p)dp

´10= 0.183

2.12 fU (u) = 2F (u)f(u)

2.13 La función de probabilidad para el máximo es:

Valor Probabilidad1 1/36

2 3/36

3 5/36

4 7/36

5 9/36

6 11/36

La función de probabilidad para el mínimo es:


2 9/36

3 7/36

4 5/36

5 3/36

6 1/36

La función de probabilidad para la media es:


1, 5 2/36

2 3/36

2, 5 4/36

3 5/36

3, 5 6/36

4 5/36

4, 5 4/36

5 3/36

5, 5 2/36

6 1/36

2.14 fXY (x, y) 6= fx(x)fY (y), por lo que X e Y no son variables aleatorias independientes.

2.15 (a) P (Z = n) =Pnk=0 P (X = k)P (Y = n − k) = e−(λ1+λ2)

Pnk=0

λk1λn−k2

k!(n− k)! , multiplicando y

dividiendo por n!, y utilizando que (λ1 + λ2)n =

Pnk=0

n!

k!(n− k)!λk1λn−k2 , se obtiene que:

3

P (Z = n) =e−(λ1+λ2)

n!(λ1 + λ2)

n,

que es la probabilidad de Poisson con parámetro λ = λ1 + λ2.

(b) P (X = k|Z = n) = n!

k!(n− k)!³

λ1λ1+λ2

´k ³λ2

λ1+λ2

ń−k, si llamamos p =

λ1λ1 + λ2

,

P (X = k|Z = n) = ¡nk¢ (p)k (1− p)n−k que es una binomial de parámetros n y p = λ1λ1 + λ2

2.16 P (X < 0.3|Y = 0.8) = 0.092.17 Sea X la variable llegada de clientes en una hora, X1 la variable llegada de clientes en los 15

primeros minutos de esa hora y X2 la variable llegada de clientes en los 45 últimos minutos de esahora. La probabilidad pedida:

P (X1 = 2|X2 = 2) =µ1

4

¶2.

2.18 (a) k = 8

(b) P (X < 0.5|Y = 0.5) = 1(c) Las variables aleatoriasX e Y no son independientes ya que el campo de variación deX dependede Y.

2.19 V ar(Z) = 0

2.20 LLamando X al tiempo de vida del receptor e Y al tiempo de vida del amplificador, P (X < Y ) =2

3.

2.21 El número medio de años que dura una máquina es:

E[Y ] =R T0 xfx(x)dx+ T (1− F (T )).

Por lo tanto el número medio esperado de máquinas empleadas en un año es:

1

E[Y ]= [R T0 xfx(x)dx+ T (1− F (T ))]−1.

2.22 MZ =

6 −2 4−2 6 −44 −4 6

2.23 ρ = 0. Las variables no son independientes porque por ejemplo P (Y1 = 0|Y2 = 0) = 0 6= P (Y1 = 0)

2.24 (a) fX(x) = 2x con 0 < x < 1, fY (y) =y

2con 0 < y < 2. Las variables X e Y son independientes

ya que fXY (x, y) = fX(x)fY (y)

(b) P (X + Y < 1) =1

24

4

2.25 FX(x) = 1− e−ax;x ≥ 0 y FY (y) = 1− e−ay; y ≥ 0. Como FXY (x, y) = FX(x)Fy(y) las variablesaleatorias X e Y son independientes.

P (X < 1, Y ≥ 2) = (1− e−a)e−2b;P (X < 1) = 1− e−a y P (Y ≥ 2) = e−2b.

2.26 P (T1 < 1|T2 > 2) = 1

3

2.27 fY (y) = − ln(1− y) con 0 ≤ y ≤ 1

2.28 p =1

2

2.29 Cov(X,Y ) = E[(X −E(X))(Y −E(Y ))] = E[XY ]−E[X]E[Y ],

se sustituye Y = U + V, obteniendo:

Cov(X,Y ) = E[(X(U + V )]−E[X]E[U + V ] = E[XU ]−E[X]E[U ] +E[XV ]−E[X]E[V ] == Cov(X,U) + Cov(X,V )

2.30 (a) Sea Y el número de pruebas a realizar, E[Y ] = 51× 0.395 + 1× 0.605 = 20.75 ' 21

(b) Sea A el suceso de que un individuo sea portador del virus y B el suceso el resultado delaanálisis ha resultado positivo, P (A|B) = 0.025.

2.31 P (X = n) =

µn

k − 1¶pk(1− p)n−k+1.

2.32 16/7

2.33 p = 1−P4i=1(

12)i = 0.0625

2.34 (a) e−336

6!

(b) e−663

3!

(c) 1−P15i=0 e

−9 9i

i!

(d) e−3

5(3

5)2

2!

2.35 La función de densidad es fW (w) =b

abwb−1e

−(w

a)b

con a > 0, < b > 0, w > 0 y la función de

distribución es FW (w) = 1− e−µwa

¶b

2.36 p = 0.3

2.37 p = 0.065

2.38 (a) p = 0.76× 0.37× 0.76 = 0.21

5

(b) Sea D el tiempo de vida de la depuradora P (D < T + 1000|D > T ) = 0.049. No depende deT, por lo que no está justificado renovar la depuradora antes del fallo ya que la probabilidadde fallo no depende del tiempo que ha estado funcionando.

2.39 p = 0.175

2.40 p = e−k(tβ2−tβ1 )

2.41 Sea X el número de peces capturados en 15 minutos, P (X > 1|λ = 3

4) = 0.5276. Sea X

0el número

de peces capturados en dos horas de pesca P (X0= 5|λ0 = 6) = 0.1606.

2.42 λ(t) = 11000

2.43 Utilizando la aproximación a la normal a ≥ 9.

2.44 fY (y) =1√y

1√2πe−y

2 con y > 0

2.45 Mediana= 0.674σ

2.46 (a) 0.976

(b) 0.0229

(c) 0.999

(d) 0.1

2.47 (a) 0.3142

(b) 0.119

(c) 0.7103

2.48 X = peso de caja con 100 sobres;

X ∼ N(µ = 100× 8 + 30 = 830;σ = √100× 0, 25 = 5);P (X > 820) = 1− φ(820−8305 ) = 0, 0228;

Y = peso de caja con 199 sobres;

Y ∼ N(µ = 99× 8 + 30 = 822;σ = √99× 0, 25 = 4, 975);P (Y > 820) = 1− φ(820−8224,975 ) = 0, 656

2.49 Y = número de veces que sale el número elegido

Y ∼ B(n = 3; p = 1/6);X = balance del jugador = Y − 1E[X] = 3/6− 1 = −0.5; sale ganando la banca.

2.50 X = número de unidades defectuosas de un total de 400

6

X ∼ B(n = 400; p = 0, 06) ∼ (aprox) ∼ N(µ = 400× 0, 06 = 24;σ = √400× 0, 06× 0, 94 = 4, 745);Hay que calcular c tal que φ( c−244,745) = 0, 05, es decir

c−244,745 = −1, 645; c = 16, 18

Capítulo 3. Inferencia3.1 bn = 103; bp = 0.21.3.2 bN = 2x− 1.

3.3 bθ = 6

5x; E[bθ] = θ y V ar[bθ] = θ2

35.

3.4 bθ = 100/22.3.5 P (t > 10) = 1− P (t ≤ 10) = 1− FT (10) = exp(−10/7) = 0.24, siendo bα = 1/7.3.6 bα = n

ni=1 log

Ã bβxi

! ; bβ = max{x1, x2, ..., x3}.

3.7dL(θ)

dθ= −20

θ+2

θ3

10

i=1(xi)

2 +726

θ3;bθMV = 8.2582.

3.8 L(p) = 20 log p+ 95 log(1− p) + k; dL(p)dp

= 0; bp = 0.174.3.9 l(λ) =

1

λ7exp(−2082λ ); bλ = 2082

7= 297.4.

3.10 bθ = 3x;V ar(bθ) = θ2

2n.

3.11 c =nµ2

σ2 + nµ2; c =

n

4 + n.

3.12 k =1

n(n− 1) .

3.13 ECM(bσ2) = σ4(k − 1)2 + 2k2σ4

(n− 1); k =n− 1n+ 1

.

3.14 bµ = t12+t24;E[µ] = µ;V ar[µ] =

1

4V ar[t1] +

1

16V ar[t2] =

17

64nµ2.

3.15 P = P (fallo en un mensaje) = P (fallo en al menos un bit de los 128) = 1 − (1 − p)128. En losúltimos 10000 mensajes (lecturas) ha habido 340 erróneos. bP = 340

10000= 1−(1−bp)128; bp = 0.000270.

3.16 (a) µ ∈ x± t(11;α2)bs√n;µ ∈ (29.47, 30.70).

(b)(n− 1)bs2

σ2; χ211;σ

2 ∈ (0.472, 2.709).

7

3.17 µ ∈ x± t(12;α2)bs√n;µ ∈ (30.37, 38.25).

3.18 ingreso ∈ x± t(11;α2)bs√n; ingreso ∈ (2857, 1822).La amplitud es 500.

L = 250;n = z2α2

bs2L2= 40.8; al menos n = 41 estaciones.

3.19 (a) x = 45.75; bs2 = 201.6(b) µ ∈ x± t(14;α

2)bs√n;µ ∈ (34.82, 56.67)

(c)(n− 1)bs2

σ2; χ214;σ

2 ∈ (90.19, 693.60)

(d) L = 2× bs√n× t(14;α

2);√n >

bs6× t(14;α

2);n > 23;n = 24.

3.20 p ∈ bp± zα2

rbp(1− bp)n

; p ∈ (0.131, 0.239);L = 2× 1.96×rbp(1− bp)

200;

L1 = 2× 1.96×rbp(1− bp)

m,L1 =

L

2;m = 4× 200 = 800.

3.21 P (|bp− p| ≤ 0.05) = 0.95; bp ; N

Ãp,

rp(1− p)n

!;

0.05rp(1− p)n

= 1.96;n =1.962p(1− p)

0.052; p =

1/2;n = 384.

3.22 θ ∈ bθ ± zα2

sbθT;bθ = 236.5;T = 15; θ ∈ (228.72, 244.28).

3.23 χ2a,60 ≤2× 30× x

λ≤ χ2b,60;λ ∈ (4.46, 9.18).

3.24 (a) bαMV =r2Px2i3n

;V ar(bαMV ) = α2

6n.

(b) bαM =x√π

2;V ar(bαM) = µ3π

8n− 1n

¶α2.

(c) α ∈ bαMV ± zα2

rbα2MV6n

;α ∈ (2.74, 3.21); α ∈ bαM ± zα2

sµ3π

8n− 1n

¶ bα2M ;α ∈ (2.78, 3.27).3.25 (a) X ; B(n = 1012, p = e−λt = e−20000/8270);E[X] = np = 8.9× 1010.

X ; N(µ = ne−λt,σ =pne−λt(1− e−λt)).

(b) El intervalo es µ ± 1.96σ; (8.9 × 1010 ± 5.58 × 105). Se ve que el cociente entre la desviacióntípica y la media es 6.26× 10−6, lo cual indica que la incertidumbre del proceso es despreciable.

8

(c) E[X] = Np = Ne−λt;x = x1 = 1010; bNe−λt = 1010; bN = x1eλt = 1.12×1011;E[ bN ] = eλtE[x1] =

eλtNe−λt = N ;V ar( bN) = e2λtV ar(x1) = e2λtNe−λt(1− e−λt) = Neλt(1− e−λt).(d) Ne−λT =

N

2;T =

log 2

λ= 5.73× 103.

3.26 (a) t =190− xbs/√n ; tn−1; t = 1.84; |t| < t(4;0.025) = 2.78, no se puede rechazar H0 : µ = 190.

(b) D =(n− 1)bs2100

; χ24;D = 4.58 < χ2(4,0.05) = 9.49, no se puede rechazar H0 : σ2 = 100.

3.27 P (Error tipo I) = P (x > 11|µ = 10) = 0.0227;P (Error tipo II) = P (x < 11|µ = 12) = 0.0227.3.28 P

¡X ≥ 85|X ; N

¡100× 0.75,√100× 0.75× 0.25¢¢ = 0.01044 < α = 0.05. Con nivel de signifi-

cación α = 0.05, la nueva medicina es más efectiva que la antigua.

3.29½H0 : p = 0.03H1 : p > 0.03

;Z =bp− prp(1− p)n

; N(0, 1);Z = 1.24 < Z0.05 = 1.65, no se puede rechazar

H0;Pot(p) = 1−Φ

0.04978− prp(1− p)200

;P (Error tipo II|p = 0.06) = 1− Pot(p = 0.06) = 0.2709.3.30 (a) X2 =

2nx

λ; χ260;X

2 = 74.4 < χ2(60;0.05) = 79.1, no se puede rechazar H0;

Nivel crítico: P (χ260 ≥ 74.4) = 0.10.P (Error tipo II|λ = 7.5) = Pµ2nx

5≤ 79.1 |λ = 7.5

¶≈ 0.25.

(b)½H0 : λ1 = λ2H1 : λ1 > λ2

;x1/λ1x2/λ2

; F2n1,2n2 . Se rechaza H0 six1x2> 1.74;x2 < 3.56. Después de 6000

horas x2 ≥ 2.35× 6 + 6× 915

= 4.54 > 3.56. No es necesario seguir el ensayo.

3.31 P (bp > c|p = 0.85) = 0.01;P (bp > c|p = 0.95) = 0.99;n ≈ 180; c = 0.912.3.32 X2 =8i=1

(Oi −Ei)2Ei

; χ25;X2 = 7.5181 < χ2(5;0.05) = 11.1, no se puede rechazar la hipótesis de

normalidad.

3.33 X2 =6i=1(Oi −Ei)2

Ei; χ25;Ei = 20 ∀i;X2 = 8.5 < χ2(5;0.05) = 11.1,no existe evidencia para

rechazar la hipótesis de que el dado está equilibrado.

3.34 X : v.a número de epicentros en una cuadrícula de tamaño 100 km2 ; Poisson(λ);

bλ = no total de epicentrosno total de cuadrículas

=

PxiPni=48

34= 1.41 epicentros/100 km2;X2 =5i=1

(Oi −Ei)2Ei

; χ23;

X2 = 0.44 < χ2(3;0.05) = 7.8147; no existe evidencia para rechazar la hipótesis de que la distribución

de epicentros es una Poisson. Nivel crítico: P (χ23 ≥ 0.44) ≈ 0.90÷ 0.95.

9

3.35 P (error tipo II ) = P (X > 0|p < 0.07) = 1− (1− p)20, p < 0.07;P (error tipo I ) = P (X = 0|p =0.07) = (1 − p)20 = 0.234. El método tiene una probabilidad muy alta (0.234) de dar como mejorel apoyo nuevo cuando es igual que el existente.

3.36 X2 =20Pi=1

2Ti200

Ã χ240; X2 = 22.74 < χ2(40;0.95) = 26.5. Se rechaza H0 con α = 0.05. Conviene

resaltar que el contraste es unilateral con la región de rechazo a la izquierda.

3.37 X = número de defectos en 900m2 de tela

X ∼ Poisson(λ = 9 ∗ 4 = 36) ∼ (aprox) ∼ N(µ = 36;σ = 6);P (X > 50, 5) = 1− φ(50,5−366 ) = 0, 0078;

Y = número de defectos en 16 horas de fabricación

Y ∼ Poisson(λ = 9 ∗ 4 ∗ 16 = 576) ∼ (aprox) ∼ N(µ = 576;σ = 24);H0 : λ = 576;H1 : λ > 576;

P (Y > 720 | λ = 576) = 1− φ(720,5−57624 ) = 8, 6e− 10; se rechaza H0, la evidencia muestral indic queha habido un aumento.

Capítulo 4. Análisis de la varianza

4.1 (a) 0.4325 ≤ σ21σ22≤ 1.1149.

(b) µ1 − µ2 ∈ (−809.2, 1023.2).

4.2 La región de rechazo es:|d| > 2.179, como d = 0.51 no se rechaza las máquinas son iguales.4.3 (a) Se debe elegir el proveedor A.

(b) µA − µB ∈ (3526.34, 6473.65).

4.4 El valor calculado de la F (19.2) se compara con el valor de tablas F(2,16;0.05) = 3.63. Como19.2>3.63 se puede concluir que para α = 0.05 existen diferencias significativas entre los tratamien-tos.

4.5 (a) Se compara el valor obtenido de la F(3.99) con el valor de tablas F(4,25;0.05) = 2.76. Como3.99>2.76 se concluye que existen diferencias significativas entre los materiales. No se puede concluirque exista un material con desgaste significativamente menor. Los materiales que tiene un desgastemedio significativamente distinto son: B y C, B y A, y E y C. El resto no se pueden considerarsignificativamente distintos.

(b) 0.93 ≤ σ2 ≤ 4.18

4.6 (a) El valor de la F obtenido es 2.05, que se compara con el de tablas F(3,15;0.05) = 3.29. Como3.29 >2.05 no puede rechazarse la hipótesis nula de igualdad de medias.

(b) No, el valor 68 del tercer termómetro parece discordante con los demas.

10

(c) El termómetro 4 es distinto al 1 al 2. La diferencia de las conclusiones proviene de que el valor68 del grupo 3 es atípico y distorsiona todo el resultado.

4.7 (a) Se compara el valor de la F (64.348) obtenido con el de las tablas F(2,12;0.01) = 6.92. Como64.348 > 6.92 se rechaza la hipótesis nula de que las medias son iguales.

(b) El valor que se obtiene de la t es 2.9853 que no está incluido en el intervalo (−2.18, 2.18), conlo que se rechaza la hipótesis nula.

4.8 La relación aproximada entre la desviación típica de la variable transformada y la original essz ' sy|h0(y)| donde h es la transformación realizada, h0 es la primera derivada de la transformacióne y es el valor medio de y. Utilizando la expresión anterior se observa que la transformación quecorrige la heterocedaricidad es z = log y.

Capítulo 5. Diseño de experimentos

5.1 Se compara el valor de la F = 45.7 con el valor de las tablas F(1,4;0.05) = 7.71. Como 45.7 > 7.71se rechaza que los equipos son iguales.

5.2 Si no se tiene en cuenta el bloque el resultado es el mismo que si no se tiene en cuenta. El factores significativo. Es mejor el modelo en bloques que el de un factor para cualquier caso. Ya que si elbloque no es significativo, podemos pasar directamente al modelo con un factor (sin realizar ningúncálculo), pero si el bloque es significativo se pierde mucho no planteando el modelo en bloques,incluso podría suceder que el factor no resultara significativo.

5.3 (a) Existe evidencia de que el consumo medio no es igual en cada estación del año.

(b) La estación de mayor consumo es el invierno. No se puede hablar de una estación de menorconsumo, ya que el consumo medio en otoño, primavera y verano no se pueden considerar significa-tivamente distintos. Los intervalos de confianza para el consumo medio de las diferentes estacionesdel año son: µI ∈ (13.36, 14.96), µI ∈ (12.17, 13.77), µI ∈ (11.86, 13.46) y µI ∈ (11.26, 12.86).(c) Los factores estación y comunidad son significativos.

(d) El consumo en invierno es significativamente mayor que en el resto de las estaciones, el consumoen otoño y primavera es significativamente mayor que en verano y, el consumo en primavera essignificativamente mayor que en primavera. Al incluir el factor comunidad disminuye la varianzaresidual y el test para el invierno resulta más significativo y permite detectar el efecto de las demásestaciones.

5.4 (a) No se rechaza H0 : µD = 0. El nivel crítico del contraste es 0.1462.

(b) El número de niveles del factor y del bloque es respectivamente I = 2 y J = 20, bs2R =P2i=1

P20j=1 e

2ij

(I − 1)(J − 1) =P20j=1 e

21j +

P20j=1 e

22j

(J − 1) , donde eij = yij − yi• − y•j + y••. Para un mismo día

e1j + e2j = 0⇒P20j=1 e

21j =

P20j=1 e

22j , por lo tanto bs2R = 1

2

P20j=1(Dj −D)2(J − 1) =

1

2bs2D

(c) F1,J−1 =V Ebs2R =

µy1• − y2•bsD/√J

¶2=

µDbsD/√J

¶2= t2J−1.

11

5.5 El efecto del sexo y el tipo de de formación son significativos y además existe interacción entre ellos.Interpretacción: 1) Existen diferencias significativas en el número medio de errores cometidos entreprofesores de ciencias y profesores de letras (11.67 más en ciencias). 2) También es significativa ladiferencia entre hombres y mujeres (9 errores más para hombres). 3) Además la diferencia observadaentre hombres y mujeres de letras (2 errores más para hombres) difieren significativamente de laobservada para los profesores de ciencias (16 errores más para hombres).

5.6 La interacción entre los dos factores no es significativa. Esta conclusión se puede obtener alcomparar el valor de la F (2.16) obtenido con el de las tablas F(2,24;0.05) = 3.4. Como 2.16>3.4 lainteracción no resulta significativa.

5.7 (a) Se compara el valor de laF (2.8125) con el obtenido en las tablas F(4,45;0.05) = 2.59. Como2.8125 > 2.59 se rechaza la hipótesis nula de igualdad de medias, y se concluye que el índice deoctanos medido no es igual para cada fórmula.

(b) La fórmula 3 proporciona índice medio de octanos significativamente distintos a las fórmulas 1y 5, y la fórmula 4 es significativamente distinto a la 1. Las demás fórmulas no se pueden considerarque proporcionen índice de octanos diferentes.

(c) El valor de la F (2.43) correspondiente a la interaccion se compara con el valor de las tablasF(4,90;0.05) = 2.47. Como 2.47 > 2.43 no se puede rechazar que la interacción sea nula, o de otraforma, el efecto de la interacción no es significativo al 95%.

5.8 Para que la interacción sea significativa debe cumplirse que 1.125(R− 1) > F(4,9(R−1);0.05), dondeR es el número de replicaciones. El cálculo de R es iterativo. Se irán dando valores hasta conseguirque la interacción sea significativa.

5.9 V E(αβ) = 20.9988, V NE = 4.1842, el valor correspondiente de la F es 28.5155, que se comparacon el valor de las tablas F(2,12;0.05) = 3.89. Como 28.5155 > 3.89 se rechaza que la interacción entrelos factores horno y temperatura.

5.10 (a) El laboratorio 3 tiene una media significativamente menor que los otros tres. La diferenciaentre las medias de los laboratorios 1,2 y 4 no son significativas. Este resultado se observa en latabla del enunciado, en la que se marcan con un asterísco las diferencias significativas entre losvalores medios de los laboratorios. El intervalo para la media del tercer laboratorio es:

µ3 ∈ y3• ± t16;0.005bsRr 1

n3,

y sustituyendo para los datos obtenidos se tiene que:

µ3 ∈ 56.52± 2.921×√2.14872

r1

5→ µ3 ∈ (54.61, 58.44).

(b) El contraste

H0 : σ2 = 1

H1 : σ2 > 1

12

se realiza con el estadístico

(n− I)s2Rσ2

que tiene distribución de probabilidad χ2n−I siendo I = 4 el número de laboratorios y n = 20 elnúmero de datos.

χ20 =(n− I)s2R

σ2=16× 2.14872

1= 34. 38

que es mayor que el valor χ216,0.01 = 32, por consiguiente se rechaza la hipótesis H0 y se concluyeque la varianza es mayor que 1.

(c) Como resultado del análisis del modelo con dos factores se observa que el efecto principal día yla interacción entre el laboratorio y el día no resultan significativas, obteniendo para ambos casosp-valores (0.8510 y 0.9779 respectivamente) claramente superiores a 0.01. Por otra parte al hacerlas comparaciones para los laboratorios dos a dos se observa que además de las diferencias entrelaboratorios obtenidos en el primer apartado, se aprecia ahora una nueva diferencia significativaentre el laboratorio 1 y 2.

(d) Sea σ21 la varianza correspondiente al día 1 y σ22 la correspondiente al día 2. El contraste pedido

es:

H0 : σ21 = σ22

H1 : σ21 6= σ22

El contraste se realiza según:

16s2R1σ2116s2R2σ22

∼ F16,16,donde s2R1 = 2.14875 y s2R2 se calcula como se

muestra a continuación.

La varianza residual correspondiente al modelo de dos factores es:

s2R =

P4i=1

P2j=1

P5r=1(yijr − yij.)

IJ(R− 1) ,donde I = 4 es el número de laboratorios, J = 1 es el

número de días y R = 5 es el número de replicaciones. Esta varianza residual se puede escribircomo:

s2R =

P4i=1

P5r=1(yi1r − yi1.) +

P4i=1

P5r=1(yi2r − yi2.)

32=16s2R1 + 16s

2R2

32,de donde se obtiene

que:

s2R2 = 2s2R − s2R1 = 2 × 2.06152 − 2.14875 = 1.9743. El valor del estadístico de contraste

es:2.14875

1.9743= 1.0884, que pertenece al intervalo (F16,16;0.95 = 0.26, F16,16;0.05 = 3.92), por lo

que no se rechaza la hipótesis nula y se concluye que no ha habido un cambio en la varianzade un día a otro.

5.11 (a) Los resultados del análisis de la varianza se pueden interpretar de la siguiente manera: En latabla 3 se puede ver que el nivel crítico de los tres contrastes es p-valor=0.0000, ésto quiere decir que

13

con un nivel de significación α = 0.05, por ejemplo, la temperatura, el tiempo de exposicióny la interacción entre ambas tienen un efecto significativo sobre la cantidad absorbida.Como la interacción es significativa, el efecto de la temperatura y del tiempo de exposición sobre lacantidad absorbida debe hacerse de forma conjunta. El gráfico de interaccciones que se proporcionaen el enunciado ayuda a realizar la interpretación: Para el tiempo de exposición E1: Laabsorción media es diferente para cada temperatura. La máxima absorción se consigue a T2 y lamínima a T1. Para el tiempo de exposición E2: La absorción media para cada temperaturason más parecidas. Sólo es distinta la media de la temperatura T1, que es mayor que las mediasde las otras dos. Para el tiempo de exposición E3: No existen diferencias significativas en laabsorción media de cada temperatura. Para este tiempo de exposición la temperatura no influyeen la absorción.

(b)La tabla de análisis de la varianza para el nuevo modelo es:

Fuente Suma de Grados deVariabilidad Cuadrados Libertad Varianzas F p-valorV E 8490.7 8 1061.34 63.89 0.0000V NE 299.00 18 16.61V T 8789.7 26

(c) Con los datos del experimento, se rechazará H0 cuando|zi. − zj.| > 6.99. El tratamiento quetiene mayor media es el número 2, z2. = 91.43, que es significativamente distinto de todos los demássalvo del 8, z8. = 87.06, pero éste a su vez no se puede distinguir del 7, z7. = 83.76. Luego nose puede decir que exista un único tratamiento que proporcione una absorción significativamentemayor que el resto.

(d) No se aprecian signos preocupantes de heterocedasticidad. Unicamente comentar que los resid-uos correspondientes al valor previsto zk. = 91.43 tienen mayor variabilidad que el resto. Alrepresentar los residuos frente a los tratamientos, se observa que es el tratamiento 2 el que presentamayor variabilidad. Este resultado debe ser analizado en detalle: El tratamiento 2, que es el quepresenta la mayor media de cantidad absorbida, es también el que presenta una mayor variabili-dad. Este resultado tendría que ser comentado y discutido con los expertos que han realizado elexperimento.

5.12 (a) Los resultados del análisis de la varianza se pueden interpretar de la siguiente manera: losfactores hidrocarburo e hidrógeno son significativos pero la interacción entre ellos no lo es. Lasdiferencias significativas con nivel de significación de 0.05 son:

- Para Hidrocarburos: B 6= A,B 6= C,D 6= A,D 6= C.- Para Hidrógeno: 1 6= 2, 1 6= 3, 2 6= 3.

(b) Teniendo en cuenta que la interacción no es significativa el tratamiento que proporciona elrendimiento óptimo es el correspondiente al hidrocarburo C y el hidrógeno 3. El intervalo deconfianza para el valor medio en esas condiciones es:

µ ∈ y33. ± t36;0.025bsR 1√4→ µ ∈ 29.975± 2.02√14.551

2

(c) .Se contrasta la hipótesis H0 : σ21 = σ22 frente a la alternativa H1 : σ21 6= σ22, obteniendo

un valor de F = 0.3922, que se compara con los valores obtenidos en las tablas (F12,12). Como0.3922 ∈ (0.30, 3.28),no se rechaza la hipótesis nula.

14

(d) Teniendo en cuenta que x1 = 18.6875 y x2 = 20.03, el estadístico t =(16.6875− 20.03)3.36

p1/12

= −1.38.Como −1.38 está dentro del intervalo (−2.7, 2.7), no se rechaza la hipótesis nula de igualdad demedias.

5.13 El número de parámetros correspondientes a efectos principales son 14, correspondientes a inter-acciones de orden 2 son 71, correspondientes a interacciones de orden 3 son 154, y correspondientesa interacciones de orden 4 son 120. Por lo tanto, el número de parámetros totales son 359.

5.14 (a) 2.55 ≤ σ2 ≤ 8.11(b) Los efectos principales de A, B y C son significativamente distintos de cero.

(c) El intervalo pedido es: 0.0253σ2 ≤ bs2i ≤ 3.69σ2. Sustituyendo σ2 por su estimador se obtieneque 0.106 ≤ bs2i ≤ 15.47. Como todos los valores de bs2i pertenecen al intervalo construido no se puederechazar la hipótesis de homocedasticidad.

5.15 . d = (y1 − y2)− (y3 − y4) ∼ N(µ = µ1 − µ2 − µ3 + µ4;σ =q4σ2y/10);

bS2R = 104Pi=1

s2i

4×10−4 ;

t = (y1−y3)−(y3−y4)bSR√4/10 ∼ t(4× 10− 4)H0 : δ = 0;H1 : δ > 0;

Para la muestra, t = 6, 93 > t0,95(36) = 1, 69, se rechaza H0

Capítulo 6. Regresión lineal

6.1 (a) bβ0 = 2.5876; bβ1 = 0.5414; en el contraste½H0 : β1 = 0H1 : β1 6= 0 se rechaza H0; bs2R = 0.1269; en el

gráfico de los residuos frente a los valores previstos se aprecia falta de linealidad, el modelo no esadecuado.

(b) bβ = bβ0bβ1bβ2

=

2.89710.6575−01161

.6.2 (a) El modelo es vi = Hdi + ui; la estimación por mínimos cuadradros se realiza a partir de

M =P(vi −Hdi)2; bH =

PvidiPd2i

= 6.015× 10−18s−1.

(b) H ∈ ( bH ± t(n−1;0.025) × bs( bH);V ar( bH) = V arµP vidiPd2i

¶=

σ2Pd2i;H ∈ ( bH ± t(9;0.025) × bsRqP

d2i

;

bs2R =P e2i ;H ∈ (5.849× 10−18, 6.185× 10−18) segundos; bT = bH−1 = 5271× 106 años;T ∈ (5126× 106, 5422× 106) años.

15

6.3 Como ui ; N(0,σ),la estimación por máxima verosimilitud es equivalente a la estimación por

mínimos cuadrados; M =P(yi − β1x1i − β2x

22i)2; bb = " bβ1bβ2

#=¡WTW

¢−1W0Y; siendo W = x11 x221

... ...x1n x22n

e Y =

y1...yn

.6.4 (a)

½H0 : β1 ≤ 0H1 : β1 > 0

; t =bβ1 − 0bs(bβ1) ; tn−2; t = 22.75 > t(98;0.05) ≈ 1.66, se rechaza H0.

(b)½H0 : β1 ≥ 1H1 : β1 < 1

; t =bβ1 − 1bs(bβ1) ; tn−2; t = −2.25 < t(98;0.95) ≈ −1.66, se rechaza H0.

6.5 Si cov(y, bβ1) = 0, al ser ambas variables normales, son independientes.cov(y, bβ1) = E h(y −E(y))³bβ1 −E(bβ1)í , siendo yi = β0 + β1xi + ui.

y −E(y) = 1

n

Pui; bβ1 −E(bβ1) = 1

ns2x

P(xi − x)ui;

cov(y, bβ1) =P (xi − x)n2s2x

E(u2i ) =σ2

n2s2x

P(xi − x) = 0.

6.6 (a) Con x1 : yi = β0 + β1x1i + ui;bβ0 = 83.2; bβ1 = 0.56;

β1 ∈ bβ1 ± t(n−2;α/2)bs(bβ1); bs(bβ1) = bsRs1√n; bs2R = eTe

n− 2; eTe = YTY−bβTXTY = 81.6;

β1 ∈ (0.1, 1.02).Con x2 : yi = α0 + α1x2i + ²i; bα0 = 78.8; bα1 = 0.53;α1 ∈ bα1 ± t(n−2;α/2)bs(bα1); bs(bα1) = bsR

s2√n; bs2R = ²T ²

n− 2; ²T ² = YTY−bαTXTY = 58.3;

α1 ∈ (0.21, 0.85).

(b) En desviaciones a la media:

yi − y = β1(x1i − x1) + β2(x2i − x2) + εi; bβ = Ã bβ1bβ2!=³eXT eX´−1 eXT eY =

· −0.0840.597

¸.

(c) Los contrastes individuales ti =bβi − 0bs(bβi) ; tn−2−1; dV ar(bβ) = bs2R ³eXT eX´−1 ; bs2R =

εTε

n− 2− 1;

εTε = eYT eY − bβT eXT eY = 57.1;dV ar(bβ) = · 0.17 −0.13−0.13 0.12

¸t1 = −0.21 < t(7,0.025) = 2.36; t2 = 1.7 < t(7,0.025) = 2.36. Ninguno de los coeficientes essignificativo.

El contraste conjunto:

16

½H0 : β1 = β2 = 0H1 : Alguno 6= 0 ; F =

bβT eXT eXbβk × bs2R ; F(2,7); F = 6.73 > F(2,7;0.05) = 4.73. Se rechaza H0.

Existe multicolinealidad provocada por la alta correlación entre x1 y x2. r12 =cov(x1, x2)

s1s2=

0.9.

(d) Regresión Y − X1 : R21 = 0.49; Regresión Y − X2 : R22 = 0.64; Regresión Y − X1,X2 :R23 = 0.64. El modelo con dos regresores y el modelo de regresión simple con X2 son similares.La selección de un modelo u otro depende del objetivo. Si el interés es estimar los coeficientesβ, son preferibles las regresiones simples. Si lo que se pretende es hacer predicciones de Y paravalores de X1,X2 se podría usar el modelo de regresión múltiple pues la multicolinealidad noafecta a las predicciones.

6.7 Coeficiente de correlación múltiple R =µP

(byi − y)2P(yi − y)2

¶1/2=sbysy.

Coeficiente de correlación lineal r =P(yi − y)(byi − y)pP

(yi − y)2pP

(byi − y)2 = sybysysby .

Se demuestraP(yi − y)(byi − y) =P(byi − y)2; entonces r = s2by

sysby =sbysy= R.

6.8 F =n− k − 1

k

R2

1−R2 = 21.12 > F(1,28;0.05) = 4.196. El efecto es significativo.

6.9 Conocidos los valores de R2 y n se calcula F =n− 21

R2

1−R2 = 294, y se compara con el valor detablas F(1,98;0.05) = 3.92. Como 294 > 3.92 se rechaza la hipótesis nula.

6.10 (a)

(H0 : β1 = β

01

H1 : β1 6= β01

, t =bβ1 − bβ01bsT√2× 0.835 ; t(2(n−2)); bsT = 0.5743;

t = 0.4986 < t(16;0.025) = 2.1199. No se rechaza H0.½H0 : β0 = β00H1 : β0 6= β00

, t =bβ0 − bβ00bsT√2× 18.27 = −0.4493; |t| < t(16;0.025). No se rechaza H0.

(b) YR =·Y1Y2

¸;XR =

·XX

¸;YR = XRβ +U; bβ = (XTRXR)−1XTRYR = 1

2(bβ1 + bβ2).

(c) bY = −6.52+2.215 log T ; dV ar(bβ) = bs2R(XTRXR)−1; bs2R = 0.2258; (XTRXR)−1 = 1

2(XTX)−1;β1 ∈bβ1 ± t(18;0.005) × bs(bβ1);β1 ∈ 2.215± 0.8836; β0 ∈ bβ0 ± t(18;0.005) × bs(bβ0);β0 ∈ −6.52± 4.1333.

6.11

6.12 (a) En la tabla 2 del enunciado: bβ2 = 51.7421; p − V alue = 0.00. La variable resistencia essignificativa.Significado de β2 : Independientemente del valor de la dureza, las gomas de resistenciaalta(+1) tienen, por término medio, unas pérdidas superiores en 2 × β2 unidades a las gomas deresitencia baja (-1). En el problema 2 × bβ2 = 103.4842. Esta diferencia se aprecia en la gráficadel enunciado. Intervalo para bβ2. β2 ∈ bβ2 ± t27;0.025 × bs(bβ2) con los datos de la tabla 2, β2∈ [40.44; 63.04].

17

(b) β0: Ordenada en el origen. En este caso no tiene interés práctico. β3: Cuantifica el efecto dela interacción dureza×resistencia en las pérdidas. Mide el cambio del efecto de la dureza al utilizargomas con resistencia alta o gomas con resistencia baja. Al observar la figura del enunciado, sepuede ver que la influencia de la dureza sobre las pérdidas no depende de la resistencia. En amboscasos al aumentar la dureza, las pérdidas disminuyen en una cantidad muy similar, puesto quelas rectas que determinan esta relación son prácticamente paralelas en el rango de variación de ladureza.

Para resistencia baja : P erdidas = (β0 − β2) + (β1 − β3)×DurezaPara resistencia alta: P erdidas = (β0 + β2) + (β1 + β3)×Durezaβ1: Incremento que se produce en las pérdidas al aumentar la dureza un grado Shore, mante-niendo la resistencia de las gomas constante.

β2: Interpretado en el apartado 1.

(c) Eligiríamos el modelo del apartado 1. Ambos modelos parecen adecuados porque en ambosse rechaza el contraste general de regresión. Sin embargo en la tabla 3, se observa que la inter-acción dureza×resistencia no es significativa. Además R2modelo1 =88.5177 > R

2modelo2 = 88.1505.

La variable resistencia (significativa en el modelo 1), deja de serlo al introducir la interaccióndureza×resistencia. bs(bβ1) crece desde 5.52215 (modelo 1) hasta 34.4264 (modelo 2). Hay mul-ticolinealidad entre resistencia y dureza×resistencia que tambien ocasiona el cambio en el nivelcrítico.

(d) El gráfico de residuos frente a valores previstos no presenta anomalías que indiquen falta dehomocedasticidad.

6.13 F =n− k − 1

k

R2

1−R2 Ã F(3,11);F = 42.166 > F(3,11;0.05) = 3.5874. Se rechaza H0 en el contraste

general de regresión.

Los contrastes individuales:½H0 : βi = 0H1 : βi 6= 0 ; ti =

bβi − 0bsR√qii Ã t11; t1 = 8.347 > t(11;0.025) = 2.20;

t2 = 1.018 < 2.20; |t3| = 1.429 < 2.20. Solo x3 es significativa.

6.14 El contraste general de regresión (contraste de la F) proporciona un nivel crítico = 0.0000 ( p-valor)<0.01, el contraste es por lo tanto significativo, se rechaza H0; Los contrastes individualesson todos significativos (p-valor <0.01) a excepción de F 2 y V × F.

6.15 mh ∈ byh ± t(n−2;α/2) bsR√bnh ; byh = 22; bnh = n = 150; bs2R = 0.778;mh ∈ 22± 0.1411.

6.16 (a) Como ui Ã N(0,σ),máxima verosimilitud es equivalente a mínimos cuadrados

M =P(yi − αzi)

2; bα = PyiziPz2i

= 0.4210.

(b) El error de predicción eh = yh − byh; eh Ã N

Ã0,σ

s1 +

z2hPz2i

!;

18

yh ∈ byh ± t(n−1;α/2)bsRs1 +

z2hPz2i= 0.525± 0.1636.

(c)½H0 : β1 = 1H1 : β1 6= 1 , t =

1.14− 1√0.0081

= 1.54 < t(15−2−1;0.025) = 2.18. No se rechaza H0.½H0 : β2 = 2H1 : β2 6= 2 , t =

1.86− 2√0.0042

= −2.16; |t| < t(15−2−1;0.025). No se rechaza H0.

(d) En general yh ∈ byh ± tn−k−1bsR√1 + vhh; en nuestro casobyh = \log(volumen) = −1.45 + 1.14 log 20 + 1.86 log 0.25 = −0.6134;vhh = x

0h

¡XTX

¢−1xh = 149.64; log(volumen) ∈ −0.6134± 2.18

√0.0031

√1 + 149.64;

volumen ∈ (0.1221, 2.4022).

6.17 (a)bβi; bαi 77.2 −50.8 2.95 5.52

ti 7.415 −5.255 2.108 3.806; los valores |ti| se comparan con

t(60−4−1;0.005) = 2.68; todas las variables son significativas a excepción de z2.

bβ0 : es la presión media de los botas de naranja para x1 = x2 = 0.; bβ1 : la presión media aumentaen 77.2 por cada unidad de incremento en x1 manteniendo x2, z2 y z3 constantes; bβ2 : lapresión media disminuye en 50.8 por cada unidad de incremento en x2 manteniendo x1, z2 yz3 constantes; bα2 : la presión media de los botes de limón es superior en 2.95 unidades a lade los botes de naranja manteniendo x1y x2 constantes; bα3 : la presión media de los botes decola es superior en 5.52 unidades a la de los botes de naranja manteniendo x1y x2 constantes.

(b) F =∆V E/2bs2R Ã F(2,55);F =

275.92/2

4.322= 7.3833 > F(2,55;0.01) ≈ 5.00. Se rechaza H0.

(c)½H0 : α2 − α3 = 0H1 : α2 − α3 6= 0 ; t =

(bα2 − bα3)− 0qdV ar(bα2 − bα3) Ã t55;

dV ar(bα2−bα3) = dV ar(bα2)+dV ar(bα3)−2ccov(bα2, bα3) = 2.023; |t| = |−1.8073| < t(55;0.005) = 2.68.No existe diferencia significativa entre los botes de limón y cola.

6.18 yh ∈ byh ± tn−k−1bsR√1 + vhh; byh = 3.305 + 0.843× 1.2 + 3.829× 1.6 + 0 + 0 = 10.446;vhh = x

0h

¡XTX

¢−1xh = 0.0639; yh ∈ 10.443± 2× 0.7113

√1 + 0.0639; yh ∈ 10.443± 1.4674.

6.19 En el modelo de regresión múltiple V ar(bβ) = σ2¡XTX

¢−1. En el problema XTX = nI, donde I

es la matriz identidad.¡XTX

¢−1= (1/n)I, luego V ar(bβi) = σ2/n.

V ar(bmh) = V ar(xTh bβ) = xThV ar(bβ)xh = (σ2/n)n;eh = yh − bmh;V ar(eh) = V ar(yh) + V ar(bmh) = σ2 + σ2.

6.20nPi=1(yi − bβ0 − bβ1xi) = 0; nP

i=1yi = bβ0 + bβ1 nP

i=1xi; y = bβ0 + bβ1x.

19

mh ∈ byh ± t(n−2;α/2) bsRvuuut n

1 +

µxh − xsx

¶2 ;xh = x; byh = y;mh ∈ yh ± t(n−2;α/2)bsR√n.

6.21 mh ∈ byh ± t(8;0.025)bsR√vhhvhh = x

0h

¡XTX

¢−1xh = 10.7306;mh ∈ −4.66± 2.31× 0.64

√10.7306;mh ∈ −4.66± 4.41.

6.22 yh ∈ byh ± t(10;0.025)bsRr1 + 1bnh ; bnh = n

1 +

µxh − xsx

¶2 ;xh = −0.2231;x = −1.4262; sx = 1.1134;n = 12; bβ0 = 735.784; bβ1 = 127.457; bs2R = 253.59; yh ∈ (668.79, 745.89).

20

Tabl

as

Esta

díst

ica

2004

-200

5

00,01

0,02

0,03

0,04

0,05

0,06

0,07

0,08

0,09

0,0

.5000

.5040

.5080

.5120

.5160

.5199

.5239

.5279

.5319

.5359

0,1

.5398

.5438

.5478

.5517

.5557

.5596

.5636

.5675

.5714

.5753

0,2

.5793

.5832

.5871

.5910

.5948

.5987

.6026

.6064

.6103

.6141

0,3

.6179

.6217

.6255

.6293

.6331

.6368

.6406

.6443

.6480

.6517

0,4

.6554

.6591

.6628

.6664

.6700

.6736

.6772

.6808

.6844

.6879

0,5

.6915

.6950

.6985

.7019

.7054

.7088

.7123

.7157

.7190

.7224

0,6

.7257

.7291

.7324

.7357

.7389

.7422

.7454

.7486

.7517

.7549

0,7

.7580

.7611

.7642

.7673

.7704

.7734

.7764

.7794

.7823

.7852

0,8

.7881

.7910

.7939

.7967

.7995

.8023

.8051

.8078

.8106

.8133

0,9

.8159

.8186

.8212

.8238

.8264

.8289

.8315

.8340

.8365

.8389

1,0

.8413

.8438

.8461

.8485

.8508

.8531

.8554

.8577

.8599

.8621

1,1

.8643

.8665

.8686

.8708

.8729

.8749

.8770

.8790

.8810

.8830

1,2

.8849

.8869

.8888

.8907

.8925

.8944

.8962

.8980

.8997

.9015

1,3

.9032

.9049

.9066

.9082

.9099

.9115

.9131

.9147

.9162

.9177

1,4

.9192

.9207

.9222

.9236

.9251

.9265

.9279

.9292

.9306

.9319

1,5

.9332

.9345

.9357

.9370

.9382

.9394

.9406

.9418

.9429

.9441

1,6

.9452

.9463

.9474

.9484

.9495

.9505

.9515

.9525

.9535

.9545

1,7

.9554

.9564

.9573

.9582

.9591

.9599

.9608

.9616

.9625

.9633

1,8

.9641

.9649

.9656

.9664

.9671

.9678

.9686

.9693

.9699

.9706

1,9

.9713

.9719

.9726

.9732

.9738

.9744

.9750

.9756

.9761

.9767

2,0

.9772

.9778

.9783

.9788

.9793

.9798

.9803

.9808

.9812

.9817

2,1

.9821

.9826

.9830

.9834

.9838

.9842

.9846

.9850

.9854

.9857

2,2

.9861

.9864

.9868

.9871

.9875

.9878

.9881

.9884

.9887

.9890

2,3

.9893

.9896

.9898

.9901

.9904

.9906

.9909

.9911

.9913

.9916

2,4

.9918

.9920

.9922

.9925

.9927

.9929

.9931

.9932

.9934

.9936

2,5

.9938

.9940

.9941

.9943

.9945

.9946

.9948

.9949

.9951

.9952

2,6

.9953

.9955

.9956

.9957

.9959

.9960

.9961

.9962

.9963

.9964

2,7

.9965

.9966

.9967

.9968

.9969

.9970

.9971

.9972

.9973

.9974

2,8

.9974

.9975

.9976

.9977

.9977

.9978

.9979

.9979

.9980

.9981

2,9

.9981

.9982

.9982

.9983

.9984

.9984

.9985

.9985

.9986

.9986

3,0

.9987

.9987

.9987

.9988

.9988

.9989

.9989

.9989

.9990

.9990

z

N(0,1)

)(

zZ

P≤

z

9750

.0)

96.1(Ejem

plo.

=≤

ZP

TABLA

Nor

mal

Es

tand

ar

z0,00

0,01

0,02

0,03

0,04

0,05

0,06

0,07

0,08

0,09

3,1

.9990323

.9990645

.9990957

.9991259

.9991552

.9991836

.9992111

.9992377

.9992636

.9992886

3,2

.9993128

.9993363

.9993590

.9993810

.9994023

.9994229

.9994429

.9994622

.9994809

.9994990

3,3

.9995165

.9995335

.9995499

.9995657

.9995811

.9995959

.9996102

.9996241

.9996375

.9996505

3,4

.9996630

.9996751

.9996868

.9996982

.9997091

.9997197

.9997299

.9997397

.9997492

.9997584

3,5

.9997673

.9997759

.9997842

.9997922

.9997999

.9998073

.9998145

.9998215

.9998282

.9998346

3,6

.9998409

.9998469

.9998527

.9998583

.9998636

.9998688

.9998739

.9998787

.9998834

.9998878

3,7

.9998922

.9998963

.9999004

.9999042

.9999080

.9999116

.9999150

.9999184

.9999216

.9999247

3,8

.9999276

.9999305

.9999333

.9999359

.9999385

.9999409

.9999433

.9999456

.9999478

.9999499

3,9

.9999519

.9999538

.9999557

.9999575

.9999592

.9999609

.9999625

.9999640

.9999655

.9999669

4,0

.9999683

.9999696

.9999709

.9999721

.9999733

.9999744

.9999755

.9999765

.9999775

.9999784

Bin

omia

ln,p

Poiss

onλ

Nor

mal

µ,σ

0,

→∞

→p

nnp

=λ

λσ

λµλ

==∞

→

)1(2/1

pnp

nppn

−==→∞

→

σµ

Dis

tribu

ción

nor

mal

est

ánda

r(co

ntin

uaci

ón)

Rel

ació

n en

tre B

inom

ial,

Pois

son

y N

orm

al

N(0,1)

)(

zZ

P≤

z

Tabl

a χ

2

α

ν: g

rado

s de

liber

tad

(g.l.

)

χ ν,α

EJEM

PLO

P(χ 9≥

19,0

2) =

0,0

25

g.l.

0,995

0,990

0,975

0,950

0,500

0,050

0,025

0,010

0,005

1,00004

,00016

,00098

,00393

0,455

3,841

5,024

6,635

7,879

2,01002

,0201

0,051

0,103

1,386

5,991

7,378

9,210

10,60

3,0717

0,115

0,216

0,352

2,366

7,815

9,348

11,34

12,84

40,207

0,297

0,484

0,711

3,357

9,488

11,14

13,28

14,86

50,412

0,554

0,831

1,145

4,351

11,07

12,83

15,09

16,75

60,676

0,872

1,237

1,635

5,348

12,59

14,45

16,81

18,55

70,989

1,239

1,690

2,167

6,346

14,07

16,01

18,48

20,28

81,344

1,647

2,180

2,733

7,344

15,51

17,53

20,09

21,95

91,735

2,088

2,700

3,325

8,343

16,92

19,02

21,67

23,59

102,156

2,558

3,247

3,940

9,342

18,31

20,48

23,21

25,19

112,603

3,053

3,816

4,575

10,341

19,68

21,92

24,73

26,76

123,074

3,571

4,404

5,226

11,340

21,03

23,34

26,22

28,30

133,565

4,107

5,009

5,892

12,340

22,36

24,74

27,69

29,82

144,075

4,660

5,629

6,571

13,339

23,68

26,12

29,14

31,32

154,601

5,229

6,262

7,261

14,339

25,00

27,49

30,58

32,80

165,142

5,812

6,908

7,962

15,338

26,30

28,85

32,00

34,27

175,697

6,408

7,564

8,672

16,338

27,59

30,19

33,41

35,72

186,265

7,015

8,231

9,390

17,338

28,87

31,53

34,81

37,16

196,844

7,633

8,907

10,117

18,338

30,14

32,85

36,19

38,58

207,434

8,260

9,591

10,851

19,337

31,41

34,17

37,57

40,00

218,034

8,897

10,283

11,591

20,337

32,67

35,48

38,93

41,40

228,643

9,542

10,982

12,338

21,337

33,92

36,78

40,29

42,80

239,260

10,196

11,689

13,091

22,337

35,17

38,08

41,64

44,18

249,886

10,856

12,401

13,848

23,337

36,42

39,36

42,98

45,56

2510,520

11,524

13,120

14,611

24,337

37,65

40,65

44,31

46,93

2611,160

12,198

13,844

15,379

25,336

38,89

41,92

45,64

48,29

2711,808

12,878

14,573

16,151

26,336

40,11

43,19

46,96

49,65

2812,461

13,565

15,308

16,928

27,336

41,34

44,46

48,28

50,99

2913,121

14,256

16,047

17,708

28,336

42,56

45,72

49,59

52,34

3013,787

14,953

16,791

18,493

29,336

43,77

46,98

50,89

53,67

4020,707

22,164

24,433

26,509

39,335

55,76

59,34

63,69

66,77

5027,991

29,707

32,357

34,764

49,335

67,50

71,42

76,15

79,49

6035,534

37,485

40,482

43,188

59,335

79,08

83,30

88,38

91,95

7043,275

45,442

48,758

51,739

69,334

90,53

95,02

100,43

104,21

8051,172

53,540

57,153

60,391

79,334

101,88

106,63

112,33

116,32

9059,196

61,754

65,647

69,126

89,334

113,15

118,14

124,12

128,30

100

67,328

70,065

74,222

77,929

99,334

124,34

129,56

135,81

140,17

120

83,852

86,923

91,573

95,705

119,334

146,57

152,21

158,95

163,65

α

g.l

0,20

0,15

0,10

0,05

0,025

0,01

0,005

0,0025

0,001

0,0005

11,376

1,963

3,078

6,314

12,706

31,821

63,656

127,321

318,289

636,578

21,061

1,386

1,886

2,920

4,303

6,965

9,925

14,089

22,328

31,600

30,978

1,250

1,638

2,353

3,182

4,541

5,841

7,453

10,214

12,924

40,941

1,190

1,533

2,132

2,776

3,747

4,604

5,598

7,173

8,610

50,920

1,156

1,476

2,015

2,571

3,365

4,032

4,773

5,894

6,869

60,906

1,134

1,440

1,943

2,447

3,143

3,707

4,317

5,208

5,959

70,896

1,119

1,415

1,895

2,365

2,998

3,499

4,029

4,785

5,408

80,889

1,108

1,397

1,860

2,306

2,896

3,355

3,833

4,501

5,041

90,883

1,100

1,383

1,833

2,262

2,821

3,250

3,690

4,297

4,781

100,879

1,093

1,372

1,812

2,228

2,764

3,169

3,581

4,144

4,587

110,876

1,088

1,363

1,796

2,201

2,718

3,106

3,497

4,025

4,437

120,873

1,083

1,356

1,782

2,179

2,681

3,055

3,428

3,930

4,318

130,870

1,079

1,350

1,771

2,160

2,650

3,012

3,372

3,852

4,221

140,868

1,076

1,345

1,761

2,145

2,624

2,977

3,326

3,787

4,140

150,866

1,074

1,341

1,753

2,131

2,602

2,947

3,286

3,733

4,073

160,865

1,071

1,337

1,746

2,120

2,583

2,921

3,252

3,686

4,015

170,863

1,069

1,333

1,740

2,110

2,567

2,898

3,222

3,646

3,965

180,862

1,067

1,330

1,734

2,101

2,552

2,878

3,197

3,610

3,922

190,861

1,066

1,328

1,729

2,093

2,539

2,861

3,174

3,579

3,883

200,860

1,064

1,325

1,725

2,086

2,528

2,845

3,153

3,552

3,850

210,859

1,063

1,323

1,721

2,080

2,518

2,831

3,135

3,527

3,819

220,858

1,061

1,321

1,717

2,074

2,508

2,819

3,119

3,505

3,792

230,858

1,060

1,319

1,714

2,069

2,500

2,807

3,104

3,485

3,768

240,857

1,059

1,318

1,711

2,064

2,492

2,797

3,091

3,467

3,745

250,856

1,058

1,316

1,708

2,060

2,485

2,787

3,078

3,450

3,725

260,856

1,058

1,315

1,706

2,056

2,479

2,779

3,067

3,435

3,707

270,855

1,057

1,314

1,703

2,052

2,473

2,771

3,057

3,421

3,689

280,855

1,056

1,313

1,701

2,048

2,467

2,763

3,047

3,408

3,674

290,854

1,055

1,311

1,699

2,045

2,462

2,756

3,038

3,396

3,660

300,854

1,055

1,310

1,697

2,042

2,457

2,750

3,030

3,385

3,646

400,851

1,050

1,303

1,684

2,021

2,423

2,704

2,971

3,307

3,551

500,849

1,047

1,299

1,676

2,009

2,403

2,678

2,937

3,261

3,496

600,848

1,045

1,296

1,671

2,000

2,390

2,660

2,915

3,232

3,460

700,847

1,044

1,294

1,667

1,994

2,381

2,648

2,899

3,211

3,435

800,846

1,043

1,292

1,664

1,990

2,374

2,639

2,887

3,195

3,416

900,846

1,042

1,291

1,662

1,987

2,368

2,632

2,878

3,183

3,402

100

0,845

1,042

1,290

1,660

1,984

2,364

2,626

2,871

3,174

3,390

infinito

0,842

1,036

1,282

1,645

1,960

2,327

2,576

2,808

3,091

3,291

0,20

0,15

0,10

0,05

0,025

0,01

0,005

0,0025

0,001

0,0005

Tabl

a

t-Stu

dent

α

α

ν: g

rado

s de

liber

tad

(g.l.

)

t ν,α

EJEM

PLO

P(t 9≥

2,26

2) =

0,0

25

Grados de libertad del denominador: ν2

Gra

dos d

e l ib

ert a

d de

l nu m

erad

o r: ν

1α

=0.0

5Ta

bla

Fα

αν

νν

να

νν

=≥

⇒)

(,

,,

,,

21

21

21

FF

PF

05.0)

50.3(

:8,7

=≥

FP

Ejem

plo

12

34

56

78

910

1215

2024

3040

60100

120

Inf.

1161,4

199,5

215,7

224,6

230,2

234,0

236,8

238,9

240,5

241,9

243,9

245,9

248,0

249,1

250,1

251,1

252,2

253,0

253,3

254,3

12

18,51

19,00

19,16

19,25

19,30

19,33

19,35

19,37

19,38

19,40

19,41

19,43

19,45

19,45

19,46

19,47

19,48

19,49

19,49

19,50

23

10,13

9,55

9,28

9,12

9,01

8,94

8,89

8,85

8,81

8,79

8,74

8,70

8,66

8,64

8,62

8,59

8,57

8,55

8,55

8,53

34

7,71

6,94

6,59

6,39

6,26

6,16

6,09

6,04

6,00

5,96

5,91

5,86

5,80

5,77

5,75

5,72

5,69

5,66

5,66

5,63

45

6,61

5,79

5,41

5,19

5,05

4,95

4,88

4,82

4,77

4,74

4,68

4,62

4,56

4,53

4,50

4,46

4,43

4,41

4,40

4,37

56

5,99

5,14

4,76

4,53

4,39

4,28

4,21

4,15

4,10

4,06

4,00

3,94

3,87

3,84

3,81

3,77

3,74

3,71

3,70

3,67

67

5,59

4,74

4,35

4,12

3,97

3,87

3,79

3,73

3,68

3,64

3,57

3,51

3,44

3,41

3,38

3,34

3,30

3,27

3,27

3,23

78

5,32

4,46

4,07

3,84

3,69

3,58

3,50

3,44

3,39

3,35

3,28

3,22

3,15

3,12

3,08

3,04

3,01

2,97

2,97

2,93

89

5,12

4,26

3,86

3,63

3,48

3,37

3,29

3,23

3,18

3,14

3,07

3,01

2,94

2,90

2,86

2,83

2,79

2,76

2,75

2,71

910

4,96

4,10

3,71

3,48

3,33

3,22

3,14

3,07

3,02

2,98

2,91

2,85

2,77

2,74

2,70

2,66

2,62

2,59

2,58

2,54

1011

4,84

3,98

3,59

3,36

3,20

3,09

3,01

2,95

2,90

2,85

2,79

2,72

2,65

2,61

2,57

2,53

2,49

2,46

2,45

2,40

1112

4,75

3,89

3,49

3,26

3,11

3,00

2,91

2,85

2,80

2,75

2,69

2,62

2,54

2,51

2,47

2,43

2,38

2,35

2,34

2,30

1213

4,67

3,81

3,41

3,18

3,03

2,92

2,83

2,77

2,71

2,67

2,60

2,53

2,46

2,42

2,38

2,34

2,30

2,26

2,25

2,21

1314

4,60

3,74

3,34

3,11

2,96

2,85

2,76

2,70

2,65

2,60

2,53

2,46

2,39

2,35

2,31

2,27

2,22

2,19

2,18

2,13

1415

4,54

3,68

3,29

3,06

2,90

2,79

2,71

2,64

2,59

2,54

2,48

2,40

2,33

2,29

2,25

2,20

2,16

2,12

2,11

2,07

1516

4,49

3,63

3,24

3,01

2,85

2,74

2,66

2,59

2,54

2,49

2,42

2,35

2,28

2,24

2,19

2,15

2,11

2,07

2,06

2,01

1617

4,45

3,59

3,20

2,96

2,81

2,70

2,61

2,55

2,49

2,45

2,38

2,31

2,23

2,19

2,15

2,10

2,06

2,02

2,01

1,96

1718

4,41

3,55

3,16

2,93

2,77

2,66

2,58

2,51

2,46

2,41

2,34

2,27

2,19

2,15

2,11

2,06

2,02

1,98

1,97

1,92

1819

4,38

3,52

3,13

2,90

2,74

2,63

2,54

2,48

2,42

2,38

2,31

2,23

2,16

2,11

2,07

2,03

1,98

1,94

1,93

1,88

1920

4,35

3,49

3,10

2,87

2,71

2,60

2,51

2,45

2,39

2,35

2,28

2,20

2,12

2,08

2,04

1,99

1,95

1,91

1,90

1,84

2021

4,32

3,47

3,07

2,84

2,68

2,57

2,49

2,42

2,37

2,32

2,25

2,18

2,10

2,05

2,01

1,96

1,92

1,88

1,87

1,81

2122

4,30

3,44

3,05

2,82

2,66

2,55

2,46

2,40

2,34

2,30

2,23

2,15

2,07

2,03

1,98

1,94

1,89

1,85

1,84

1,78

2223

4,28

3,42

3,03

2,80

2,64

2,53

2,44

2,37

2,32

2,27

2,20

2,13

2,05

2,01

1,96

1,91

1,86

1,82

1,81

1,76

2324

4,26

3,40

3,01

2,78

2,62

2,51

2,42

2,36

2,30

2,25

2,18

2,11

2,03

1,98

1,94

1,89

1,84

1,80

1,79

1,73

2425

4,24

3,39

2,99

2,76

2,60

2,49

2,40

2,34

2,28

2,24

2,16

2,09

2,01

1,96

1,92

1,87

1,82

1,78

1,77

1,71

2526

4,23

3,37

2,98

2,74

2,59

2,47

2,39

2,32

2,27

2,22

2,15

2,07

1,99

1,95

1,90

1,85

1,80

1,76

1,75

1,69

2627

4,21

3,35

2,96

2,73

2,57

2,46

2,37

2,31

2,25

2,20

2,13

2,06

1,97

1,93

1,88

1,84

1,79

1,74

1,73

1,67

2728

4,20

3,34

2,95

2,71

2,56

2,45

2,36

2,29

2,24

2,19

2,12

2,04

1,96

1,91

1,87

1,82

1,77

1,73

1,71

1,65

2829

4,18

3,33

2,93

2,70

2,55

2,43

2,35

2,28

2,22

2,18

2,10

2,03

1,94

1,90

1,85

1,81

1,75

1,71

1,70

1,64

2930

4,17

3,32

2,92

2,69

2,53

2,42

2,33

2,27

2,21

2,16

2,09

2,01

1,93

1,89

1,84

1,79

1,74

1,70

1,68

1,62

3040

4,08

3,23

2,84

2,61

2,45

2,34

2,25

2,18

2,12

2,08

2,00

1,92

1,84

1,79

1,74

1,69

1,64

1,59

1,58

1,51

4050

4,03

3,18

2,79

2,56

2,40

2,29

2,20

2,13

2,07

2,03

1,95

1,87

1,78

1,74

1,69

1,63

1,58

1,52

1,51

1,44

5060

4,00

3,15

2,76

2,53

2,37

2,25

2,17

2,10

2,04

1,99

1,92

1,84

1,75

1,70

1,65

1,59

1,53

1,48

1,47

1,39

6070

3,98

3,13

2,74

2,50

2,35

2,23

2,14

2,07

2,02

1,97

1,89

1,81

1,72

1,67

1,62

1,57

1,50

1,45

1,44

1,35

7080

3,96

3,11

2,72

2,49

2,33

2,21

2,13

2,06

2,00

1,95

1,88

1,79

1,70

1,65

1,60

1,54

1,48

1,43

1,41

1,32

8090

3,95

3,10

2,71

2,47

2,32

2,20

2,11

2,04

1,99

1,94

1,86

1,78

1,69

1,64

1,59

1,53

1,46

1,41

1,39

1,30

90100

3,94

3,09

2,70

2,46

2,31

2,19

2,10

2,03

1,97

1,93

1,85

1,77

1,68

1,63

1,57

1,52

1,45

1,39

1,38

1,28

100

120

3,92

3,07

2,68

2,45

2,29

2,18

2,09

2,02

1,96

1,91

1,83

1,75

1,66

1,61

1,55

1,50

1,43

1,37

1,35

1,25

120

Inf

3,84

3,00

2,60

2,37

2,21

2,10

2,01

1,94

1,88

1,83

1,75

1,67

1,57

1,52

1,46

1,39

1,32

1,24

1,22

1,00

Inf

12

34

56

78

910

1215

2024

3040

60100

120

Inf.


Gra

dos d

e l ib

ert a

d de

l nu m

erad

o r: ν

1α

=0.0

25Ta

bla

Fα

αν

νν

να

νν

=≥

⇒)

(,

,,

,,

21

21

21

FF

PF

025

.0)

53.4(

:8,7

=≥

FP

Ejem

plo

12

34

56

78

910

1215

2024

3040

60100

120

Inf.

1647,8

799,5

864,2

899,6

921,8

937,1

948,2

956,6

963,3

968,6

976,7

984,9

993,1

997,31001,41005,61009,81013,21014,01018,3

12

38,51

39,00

39,17

39,25

39,30

39,33

39,36

39,37

39,39

39,40

39,41

39,43

39,45

39,46

39,46

39,47

39,48

39,49

39,49

39,50

23

17,44

16,04

15,44

15,10

14,88

14,73

14,62

14,54

14,47

14,42

14,34

14,25

14,17

14,12

14,08

14,04

13,99

13,96

13,95

13,90

34

12,22

10,65

9,98

9,60

9,36

9,20

9,07

8,98

8,90

8,84

8,75

8,66

8,56

8,51

8,46

8,41

8,36

8,32

8,31

8,26

45

10,01

8,43

7,76

7,39

7,15

6,98

6,85

6,76

6,68

6,62

6,52

6,43

6,33

6,28

6,23

6,18

6,12

6,08

6,07

6,02

56

8,81

7,26

6,60

6,23

5,99

5,82

5,70

5,60

5,52

5,46

5,37

5,27

5,17

5,12

5,07

5,01

4,96

4,92

4,90

4,85

67

8,07

6,54

5,89

5,52

5,29

5,12

4,99

4,90

4,82

4,76

4,67

4,57

4,47

4,41

4,36

4,31

4,25

4,21

4,20

4,14

78

7,57

6,06

5,42

5,05

4,82

4,65

4,53

4,43

4,36

4,30

4,20

4,10

4,00

3,95

3,89

3,84

3,78

3,74

3,73

3,67

89

7,21

5,71

5,08

4,72

4,48

4,32

4,20

4,10

4,03

3,96

3,87

3,77

3,67

3,61

3,56

3,51

3,45

3,40

3,39

3,33

910

6,94

5,46

4,83

4,47

4,24

4,07

3,95

3,85

3,78

3,72

3,62

3,52

3,42

3,37

3,31

3,26

3,20

3,15

3,14

3,08

1011

6,72

5,26

4,63

4,28

4,04

3,88

3,76

3,66

3,59

3,53

3,43

3,33

3,23

3,17

3,12

3,06

3,00

2,96

2,94

2,88

1112

6,55

5,10

4,47

4,12

3,89

3,73

3,61

3,51

3,44

3,37

3,28

3,18

3,07

3,02

2,96

2,91

2,85

2,80

2,79

2,72

1213

6,41

4,97

4,35

4,00

3,77

3,60

3,48

3,39

3,31

3,25

3,15

3,05

2,95

2,89

2,84

2,78

2,72

2,67

2,66

2,60

1314

6,30

4,86

4,24

3,89

3,66

3,50

3,38

3,29

3,21

3,15

3,05

2,95

2,84

2,79

2,73

2,67

2,61

2,56

2,55

2,49

1415

6,20

4,77

4,15

3,80

3,58

3,41

3,29

3,20

3,12

3,06

2,96

2,86

2,76

2,70

2,64

2,59

2,52

2,47

2,46

2,40

1516

6,12

4,69

4,08

3,73

3,50

3,34

3,22

3,12

3,05

2,99

2,89

2,79

2,68

2,63

2,57

2,51

2,45

2,40

2,38

2,32

1617

6,04

4,62

4,01

3,66

3,44

3,28

3,16

3,06

2,98

2,92

2,82

2,72

2,62

2,56

2,50

2,44

2,38

2,33

2,32

2,25

1718

5,98

4,56

3,95

3,61

3,38

3,22

3,10

3,01

2,93

2,87

2,77

2,67

2,56

2,50

2,44

2,38

2,32

2,27

2,26

2,19

1819

5,92

4,51

3,90

3,56

3,33

3,17

3,05

2,96

2,88

2,82

2,72

2,62

2,51

2,45

2,39

2,33

2,27

2,22

2,20

2,13

1920

5,87

4,46

3,86

3,51

3,29

3,13

3,01

2,91

2,84

2,77

2,68

2,57

2,46

2,41

2,35

2,29

2,22

2,17

2,16

2,09

2021

5,83

4,42

3,82

3,48

3,25

3,09

2,97

2,87

2,80

2,73

2,64

2,53

2,42

2,37

2,31

2,25

2,18

2,13

2,11

2,04

2122

5,79

4,38

3,78

3,44

3,22

3,05

2,93

2,84

2,76

2,70

2,60

2,50

2,39

2,33

2,27

2,21

2,14

2,09

2,08

2,00

2223

5,75

4,35

3,75

3,41

3,18

3,02

2,90

2,81

2,73

2,67

2,57

2,47

2,36

2,30

2,24

2,18

2,11

2,06

2,04

1,97

2324

5,72

4,32

3,72

3,38

3,15

2,99

2,87

2,78

2,70

2,64

2,54

2,44

2,33

2,27

2,21

2,15

2,08

2,02

2,01

1,94

2425

5,69

4,29

3,69

3,35

3,13

2,97

2,85

2,75

2,68

2,61

2,51

2,41

2,30

2,24

2,18

2,12

2,05

2,00

1,98

1,91

2526

5,66

4,27

3,67

3,33

3,10

2,94

2,82

2,73

2,65

2,59

2,49

2,39

2,28

2,22

2,16

2,09

2,03

1,97

1,95

1,88

2627

5,63

4,24

3,65

3,31

3,08

2,92

2,80

2,71

2,63

2,57

2,47

2,36

2,25

2,19

2,13

2,07

2,00

1,94

1,93

1,85

2728

5,61

4,22

3,63

3,29

3,06

2,90

2,78

2,69

2,61

2,55

2,45

2,34

2,23

2,17

2,11

2,05

1,98

1,92

1,91

1,83

2829

5,59

4,20

3,61

3,27

3,04

2,88

2,76

2,67

2,59

2,53

2,43

2,32

2,21

2,15

2,09

2,03

1,96

1,90

1,89

1,81

2930

5,57

4,18

3,59

3,25

3,03

2,87

2,75

2,65

2,57

2,51

2,41

2,31

2,20

2,14

2,07

2,01

1,94

1,88

1,87

1,79

3040

5,42

4,05

3,46

3,13

2,90

2,74

2,62

2,53

2,45

2,39

2,29

2,18

2,07

2,01

1,94

1,88

1,80

1,74

1,72

1,64

4050

5,34

3,97

3,39

3,05

2,83

2,67

2,55

2,46

2,38

2,32

2,22

2,11

1,99

1,93

1,87

1,80

1,72

1,66

1,64

1,55

5060

5,29

3,93

3,34

3,01

2,79

2,63

2,51

2,41

2,33

2,27

2,17

2,06

1,94

1,88

1,82

1,74

1,67

1,60

1,58

1,48

6070

5,25

3,89

3,31

2,97

2,75

2,59

2,47

2,38

2,30

2,24

2,14

2,03

1,91

1,85

1,78

1,71

1,63

1,56

1,54

1,44

7080

5,22

3,86

3,28

2,95

2,73

2,57

2,45

2,35

2,28

2,21

2,11

2,00

1,88

1,82

1,75

1,68

1,60

1,53

1,51

1,40

8090

5,20

3,84

3,26

2,93

2,71

2,55

2,43

2,34

2,26

2,19

2,09

1,98

1,86

1,80

1,73

1,66

1,58

1,50

1,48

1,37

90100

5,18

3,83

3,25

2,92

2,70

2,54

2,42

2,32

2,24

2,18

2,08

1,97

1,85

1,78

1,71

1,64

1,56

1,48

1,46

1,35

100

120

5,15

3,80

3,23

2,89

2,67

2,52

2,39

2,30

2,22

2,16

2,05

1,94

1,82

1,76

1,69

1,61

1,53

1,45

1,43

1,31

120

Inf

5,02

3,69

3,12

2,79

2,57

2,41

2,29

2,19

2,11

2,05

1,94

1,83

1,71

1,64

1,57

1,48

1,39

1,30

1,27

1,00

Inf

12

34

56

78

910

1215

2024

3040

60100

120

Inf.


Gra

dos d

e l ib

ert a

d de

l nu m

erad

o r: ν

1α

=0.0

1Ta

bla

Fα

αν

νν

να

νν

=≥

⇒)

(,

,,

,,

21

21

21

FF

PF

01.0)

18.6(

:8,7

=≥

FP

Ejem

plo

12

34

56

78

910

1215

2024

3040

60100

120

Inf.

14052,24999,35403,55624,35764,05859,05928,35981,06022,46055,96106,76157,06208,76234,36260,46286,46313,06333,96339,56365,6

12

98,50

99,00

99,16

99,25

99,30

99,33

99,36

99,38

99,39

99,40

99,42

99,43

99,45

99,46

99,47

99,48

99,48

99,49

99,49

99,50

23

34,12

30,82

29,46

28,71

28,24

27,91

27,67

27,49

27,34

27,23

27,05

26,87

26,69

26,60

26,50

26,41

26,32

26,24

26,22

26,13

34

21,20

18,00

16,69

15,98

15,52

15,21

14,98

14,80

14,66

14,55

14,37

14,20

14,02

13,93

13,84

13,75

13,65

13,58

13,56

13,46

45

16,26

13,27

12,06

11,39

10,97

10,67

10,46

10,29

10,16

10,05

9,89

9,72

9,55

9,47

9,38

9,29

9,20

9,13

9,11

9,02

56

13,75

10,92

9,78

9,15

8,75

8,47

8,26

8,10

7,98

7,87

7,72

7,56

7,40

7,31

7,23

7,14

7,06

6,99

6,97

6,88

67

12,25

9,55

8,45

7,85

7,46

7,19

6,99

6,84

6,72

6,62

6,47

6,31

6,16

6,07

5,99

5,91

5,82

5,75

5,74

5,65

78

11,26

8,65

7,59

7,01

6,63

6,37

6,18

6,03

5,91

5,81

5,67

5,52

5,36

5,28

5,20

5,12

5,03

4,96

4,95

4,86

89

10,56

8,02

6,99

6,42

6,06

5,80

5,61

5,47

5,35

5,26

5,11

4,96

4,81

4,73

4,65

4,57

4,48

4,41

4,40

4,31

910

10,04

7,56

6,55

5,99

5,64

5,39

5,20

5,06

4,94

4,85

4,71

4,56

4,41

4,33

4,25

4,17

4,08

4,01

4,00

3,91

1011

9,65

7,21

6,22

5,67

5,32

5,07

4,89

4,74

4,63

4,54

4,40

4,25

4,10

4,02

3,94

3,86

3,78

3,71

3,69

3,60

1112

9,33

6,93

5,95

5,41

5,06

4,82

4,64

4,50

4,39

4,30

4,16

4,01

3,86

3,78

3,70

3,62

3,54

3,47

3,45

3,36

1213

9,07

6,70

5,74

5,21

4,86

4,62

4,44

4,30

4,19

4,10

3,96

3,82

3,66

3,59

3,51

3,43

3,34

3,27

3,25

3,17

1314

8,86

6,51

5,56

5,04

4,69

4,46

4,28

4,14

4,03

3,94

3,80

3,66

3,51

3,43

3,35

3,27

3,18

3,11

3,09

3,00

1415

8,68

6,36

5,42

4,89

4,56

4,32

4,14

4,00

3,89

3,80

3,67

3,52

3,37

3,29

3,21

3,13

3,05

2,98

2,96

2,87

1516

8,53

6,23

5,29

4,77

4,44

4,20

4,03

3,89

3,78

3,69

3,55

3,41

3,26

3,18

3,10

3,02

2,93

2,86

2,84

2,75

1617

8,40

6,11

5,19

4,67

4,34

4,10

3,93

3,79

3,68

3,59

3,46

3,31

3,16

3,08

3,00

2,92

2,83

2,76

2,75

2,65

1718

8,29

6,01

5,09

4,58

4,25

4,01

3,84

3,71

3,60

3,51

3,37

3,23

3,08

3,00

2,92

2,84

2,75

2,68

2,66

2,57

1819

8,18

5,93

5,01

4,50

4,17

3,94

3,77

3,63

3,52

3,43

3,30

3,15

3,00

2,92

2,84

2,76

2,67

2,60

2,58

2,49

1920

8,10

5,85

4,94

4,43

4,10

3,87

3,70

3,56

3,46

3,37

3,23

3,09

2,94

2,86

2,78

2,69

2,61

2,54

2,52

2,42

2021

8,02

5,78

4,87

4,37

4,04

3,81

3,64

3,51

3,40

3,31

3,17

3,03

2,88

2,80

2,72

2,64

2,55

2,48

2,46

2,36

2122

7,95

5,72

4,82

4,31

3,99

3,76

3,59

3,45

3,35

3,26

3,12

2,98

2,83

2,75

2,67

2,58

2,50

2,42

2,40

2,31

2223

7,88

5,66

4,76

4,26

3,94

3,71

3,54

3,41

3,30

3,21

3,07

2,93

2,78

2,70

2,62

2,54

2,45

2,37

2,35

2,26

2324

7,82

5,61

4,72

4,22

3,90

3,67

3,50

3,36

3,26

3,17

3,03

2,89

2,74

2,66

2,58

2,49

2,40

2,33

2,31

2,21

2425

7,77

5,57

4,68

4,18

3,85

3,63

3,46

3,32

3,22

3,13

2,99

2,85

2,70

2,62

2,54

2,45

2,36

2,29

2,27

2,17

2526

7,72

5,53

4,64

4,14

3,82

3,59

3,42

3,29

3,18

3,09

2,96

2,81

2,66

2,58

2,50

2,42

2,33

2,25

2,23

2,13

2627

7,68

5,49

4,60

4,11

3,78

3,56

3,39

3,26

3,15

3,06

2,93

2,78

2,63

2,55

2,47

2,38

2,29

2,22

2,20

2,10

2728

7,64

5,45

4,57

4,07

3,75

3,53

3,36

3,23

3,12

3,03

2,90

2,75

2,60

2,52

2,44

2,35

2,26

2,19

2,17

2,06

2829

7,60

5,42

4,54

4,04

3,73

3,50

3,33

3,20

3,09

3,00

2,87

2,73

2,57

2,49

2,41

2,33

2,23

2,16

2,14

2,03

2930

7,56

5,39

4,51

4,02

3,70

3,47

3,30

3,17

3,07

2,98

2,84

2,70

2,55

2,47

2,39

2,30

2,21

2,13

2,11

2,01

3040

7,31

5,18

4,31

3,83

3,51

3,29

3,12

2,99

2,89

2,80

2,66

2,52

2,37

2,29

2,20

2,11

2,02

1,94

1,92

1,80

4050

7,17

5,06

4,20

3,72

3,41

3,19

3,02

2,89

2,78

2,70

2,56

2,42

2,27

2,18

2,10

2,01

1,91

1,82

1,80

1,68

5060

7,08

4,98

4,13

3,65

3,34

3,12

2,95

2,82

2,72

2,63

2,50

2,35

2,20

2,12

2,03

1,94

1,84

1,75

1,73

1,60

6070

7,01

4,92

4,07

3,60

3,29

3,07

2,91

2,78

2,67

2,59

2,45

2,31

2,15

2,07

1,98

1,89

1,78

1,70

1,67

1,54

7080

6,96

4,88

4,04

3,56

3,26

3,04

2,87

2,74

2,64

2,55

2,42

2,27

2,12

2,03

1,94

1,85

1,75

1,65

1,63

1,49

8090

6,93

4,85

4,01

3,53

3,23

3,01

2,84

2,72

2,61

2,52

2,39

2,24

2,09

2,00

1,92

1,82

1,72

1,62

1,60

1,46

90100

6,90

4,82

3,98

3,51

3,21

2,99

2,82

2,69

2,59

2,50

2,37

2,22

2,07

1,98

1,89

1,80

1,69

1,60

1,57

1,43

100

120

6,85

4,79

3,95

3,48

3,17

2,96

2,79

2,66

2,56

2,47

2,34

2,19

2,03

1,95

1,86

1,76

1,66

1,56

1,53

1,38

120

Inf

6,63

4,61

3,78

3,32

3,02

2,80

2,64

2,51

2,41

2,32

2,18

2,04

1,88

1,79

1,70

1,59

1,47

1,36

1,32

1,00

Inf

12

34

56

78

910

1215

2024

3040

60100

120

Inf.