ESTADÍSTICA 1. Descriptiva 2. Probabilidad 3. Inferencia 4. Análisis de la
varianza 5. Diseño de
Experimento 6. Regresión
lineal
Departamento de Ingeniería de Organización, Administración de Empresas y Estadística
Escuela Técnica Superior de Ingenieros Industriales
Universidad Politécnica de Madrid
ww
w.e
tsii
.up
m.e
s/in
go
r/e
stad
isti
ca/
LABORATORIO DE ESTADISTICADepartamento de ingenierıa de organizacion,administracion de empresas y estadıstica.Escuela Tecnica Superior de Ingenieros Industriales
Universidad Politecnica de Madrid
ESTADISTICA
1
.
PROGRAMA
1. Estadıstica Descriptiva. Datos: tipos de datos. Distribucion de frecuencias ehistograma. Medidas caracterısticas. Diagrama de cajas. Diagrama de tallos y hojas.Transformaciones de datos. Datos multivariantes. Vector de medias y matriz de varian-zas. Correlacion. Transformaciones.
2. Probabilidad. Experimento aleatorio. Definicion de variable aleatoria discreta. Dis-tribucion de probabilidad. Funcion de distribucion. Variable aleatoria continua. Funcionde densidad. Transformaciones. Esperanza y varianza. Momentos. Proceso de Bernoulli:Distribucion binomial. Proceso de Poisson: Distribucion de Poisson. Distribucion ex-ponencial. Distribucion normal. La distribucion normal como aproximacion de las dis-tribuciones binomial y de Poisson. Distribucion conjunta. Definiciones de distribucionconjunta, marginal y condicionada. Funciones de densidad de varias variables. Esperanza.Covarianza y correlacion. Generalizacion a n variables aleatorias. Independencia. Trans-formaciones lineales. Media de variables aleatorias independientes: el teorema central dellımite.
3. Inferencia. Concepto de inferencia. Distintos problemas de inferencia. Metodos deestimacion: metodo de los momentos, metodo de maxima verosimilitud. Aplicacion a lasdistribuciones binomial, Poisson, exponencial y normal. Distribucion de los estimadores.Distribucion χ2 de Pearson. Comparacion de estimadores. Propiedades deseables de unestimador. Concepto de intervalo de confianza. Intervalo de confianza para la media deuna distribucion normal con varianza conocida. Intervalo de confianza para la media yla varianza de una distribucion normal. La distribucion t de Student. Intervalos de con-fianza en general. Aplicaciones a las distribuciones de Poisson, binomial y exponencial.Contrastes de hipotesis. Contrastes parametricos: hipotesis nula e hipotesis alternativa.Nivel de significacion y region de rechazo. Nivel crıtico p. Errores tipo I y II de uncontraste. Potencia de un contraste. Aplicacion a la normal, binomial y Poisson. Con-trastes de bondad de ajuste (no parametricos): contraste χ2 de Pearson y el contraste deKolmogorov-Smirnov.
4. Analisis de la varianza. Comparacion de dos tratamientos. La hipotesis de normal-idad, independencia y homocedasticidad. Estimacion. Contraste de igualdad de medias.Contraste de igualdad de varianzas. La distribucion F. Comparacion de varios tratamien-tos. Modelo basico. Descomposicion de la variabilidad. Tabla del analisis de la varianza(ADEVA). Contraste de igualdad de medias. Comparaciones multiples. Diagnosis de lashipotesis del modelo de analisis de la varianza. Grafico probabilista normal. Contrastesde homocedasticidad. Aleatorizacion.
5. Diseno de experimentos. El modelo en bloques aleatorizados. Modelo y esti-macion. Descomposicion de la variabilidad. Tabla de analisis de la varianza. Modelocon dos factores. Concepto de interaccion. Descomposicion de la variabilidad. Tabla deanalisis de la varianza. Modelo con mas factores. Cuadrado Latino.
6. Regresion lineal. Hipotesis del modelo. Estimacion de los parametros por maximaverosimilitud (mınimos cuadrados). Distribucion de los estimadores. Contrastes individ-uales de los parametros del modelo. Contraste general de regresion. El coeficiente dedeterminacion. Multicolinealidad: identificacion y sus consecuencias. Prediccion en re-gresion simple y regresion multiple. Variables cualitativas como regresores. Diagnosis delmodelo.
1
.
1. Estadística descriptiva
Curso 2004-05
Estadística
Estadística Descriptiva 2
DatosNúmero Consumo Cilindrada Potencia Peso Aceleración Año País Nº Cilindros
l/100Km cc CV kg segundos
1 15 4982 150 1144 12 70 EEUU 82 16 6391 190 1283 9 70 EEUU 83 24 5031 200 1458 15 70 EEUU 84 9 1491 70 651 21 71 EEUU 45 11 2294 72 802 19 71 EEUU 46 17 5752 153 1384 14 71 EEUU 87 12 2294 90 802 20 72 EEUU 48 17 6555 175 1461 12 72 EEUU 89 18 6555 190 1474 13 72 EEUU 810 12 1147 97 776 14 72 Japón 311 16 5735 145 1360 13 73 EEUU 812 12 1868 91 860 14 73 Europa 413 9 2294 75 847 17 74 EEUU 414 8 1295 67 666 16 74 Europa 415 7 1163 65 612 21 74 Japón 416 7 1360 61 667 19 74 Japón 417 12 3802 90 1070 17 75 EEUU 618 13 3687 95 1261 19 75 EEUU 619 9 1475 71 741 17 75 Europa 420 9 1983 115 890 14 75 Europa 4... ... ... ... ... ... ... ... ...391 7 1753 75 735 15 82 Japón 4
Estadística Descriptiva 3
Tipos de datos
• Cuantitativos– Continuos: consumo, potencia,aceleración,
peso
– Discretos: nº de cilindros
• Cualitativos– Ordinales: categoría
– No ordinales: país, gasolina/gasoil
Estadística Descriptiva 4
Distribución de frecuencias:consumo l/100 km
------------------------------------------------------------- Limite Limite Punto Frecuencia Frecuencia Clase Inferior Superior Medio Absoluta Relativa ------------------------------------------------------------- 1 0,0 2,5 1,25 0 0,0000 2 2,5 5,0 3,75 6 0,0153 3 5,0 7,5 6,25 65 0,1662 4 7,5 10,0 8,75 126 0,3223 5 10,0 12,5 11,25 64 0,1637 6 12,5 15,0 13,75 62 0,1586 7 15,0 17,5 16,25 36 0,0921 8 17,5 20,0 18,75 26 0,0665 9 20,0 22,5 21,25 4 0,0102 10 22,5 25,0 23,75 2 0,0051 -------------------------------------------------------------Total 391 1,0000
Estadística Descriptiva 5
Histograma
0 5 10 15 20 25
consumo
0
30
60
90
120
150
Estadística Descriptiva 6
Histogramas para coches
0 2 4 6 8(X 1000)
cilindrada
0
20
40
60
80
100
120
potencia0 40 80 120 160 200 240
0
30
60
90
120
150
peso0 0,4 0,8 1,2 1,6 2
(X 1000)
0
20
40
60
80
aceleracion7 11 15 19 23 27
0
20
40
60
80
Estadística Descriptiva 7
Medidas de centro
n
xxxx
xxx
n
n
+++=
L21
21
aritmética Media
,...,,
xxx
xxx
nxxxxx
ixix
GH
n
Hn
nG
ii
≤≤
+++==
>>
111
) todopara0 (si
armónica Media
) todopara0 (si
geométrica Media
21
21
LL
Estadística Descriptiva 8
Medidas de dispersión
2
n
12
21
: Varianza
)(
Típica Desviación
,...,,
s
n
xxs
xxx
i i
n
∑ =−
=
90 95 100 105 110
90 95 100 105 110
s = 2
s = 5.4
Media 100
Estadística Descriptiva 9
Densidad de la tierra (Cavendish, 1798)
5,5 5,47 5,55 5,75 5,29 5,275,57 4,88 5,34 5,29 5,34 5,855,42 5,62 5,3 5,1 5,26 5,655,61 5,63 5,36 5,86 5,44 5,395,53 4,07 5,79 5,58 5,46
densidad
Media = 5.42 Desv. Típ. = 0.338
4 4,4 4,8 5,2 5,6 6
Estadística Descriptiva 10
Desigualdad de Chebychev
2
11)|(|
kksxxfr i −>≤−
235 240 245 250 255
xskx ×− skx ×+
22
22
222
2
22
12
2
11)|(|
1)|(|
)|(|
)(
)()()(
kksxxfr
kksxxfr
skksxxfrn
sk
n
xx
s
n
xx
n
xx
n
xxs
ii
iksxxksxx
i
ksxxi
ksxxin
i i
ii
ii
−>≤−⇔≤>−
>−=>−
≥
−+
−=
−=
∑∑
∑∑∑
>−>−
>−≤−=
Estadística Descriptiva 11
Mediana y Cuartiles
12
1
Cuartiles
par :22
impar:2
1
Mediana
ordenados Datos
,...,,
)(3)(1
)1()(
)(
)()2()1(
21
+−=
+
=
==
=+
+=
≤≤≤
+
rnsp
r
xx
nn
pxx
nn
px
xxx
xxx
sr
pp
p
n
n
L
Estadística Descriptiva 12
Mediana y Cuartiles
750250
Cuartiles
500
)( :Mediana
,...,,
31
31
21
.)Qfr(x.)Qfr(x
.Med)fr(x
Med
xxx
ii
i
n
=≤=≤
=≤
235 240 245 250 255
25% 25%
50%
Q1 Med Q3
Estadística Descriptiva 13
Medidas característicasConsumo Cilindrada Potencia Peso Aceleración
Media 11.2 3181.2 104.2 990.7 15.7Desv. Típica 3.9 1714.6 38.3 281.9 2.8
Primer Cuartil 8 1721 75 741.5 14Mediana 10 2474 93 933 16
Tercer Cuartil 13.5 4334 125 1203.5 17Rango Intercuartílico 5.5 2613 50 462 3
Estadística Descriptiva 14
Diagrama de caja
0 4 8 12 16 20 24
consumo
Q1 Q2 Q3
LI = Q1 -1.5 RI LS = Q3+1.5 RI
RI = Q3 - Q1
Min {xi : xi ≥ LI}Max {xi : xi ≤ LS}
atípicos
Estadística Descriptiva 15
Densidad de la tierra (Cavendish, 1798)5,5 5,47 5,55 5,75 5,29 5,275,57 4,88 5,34 5,29 5,34 5,855,42 5,62 5,3 5,1 5,26 5,655,61 5,63 5,36 5,86 5,44 5,395,53 4,07 5,79 5,58 5,46
4 4,4 4,8 5,2 5,6 6
densidadMedia = 5.42 Desv. Típ. = 0.338
Estadística Descriptiva 16
Diagrama de caja múltiple
0 4 8 12 16 20 24
consumo
EEUU
Europa
Japón
Estadística Descriptiva 17
Diagrama de caja múltiple
EEUU
Europa
Japón
500 800 1100 1400 1700 2000
peso
Estadística Descriptiva 18
Consumo según año de fabricación
70717273747576777879808182
0 4 8 12 16 20 24
consumo
Estadística Descriptiva 19
Diagrama de Caja Múltiple
0 4 8 12 16 20 24
OCDE
Europa Oriental
Asia/Pacífico
África
Oriente Medio
America Latina
EEUU
Japón
Grecia
Barbados
Gabón
Producto interior bruto per capitaX1000
Estadística Descriptiva 20
Diagrama de tallos y hojas
LO|4,07
1 4| 1 4| 1 4| 1 4| 2 4|8 3 5|1 12 5|222233333 (9) 5|444455555 8 5|666677 2 5|88
• Media 5,419• Des. Típica 0,339• Mínimo 4,07• Máximo 5,86• Cuartil 1 5.3• Mediana 5.46• Cuartil 3 5.61
Estadística Descriptiva 21
Medidas características de forma(asimetría y curtosis)
n
xxm
n
xa
n
ik
ik
n
iki
k∑∑ == −
== 11)(
media la a respecto
Momentos
origen al respecto
Momento
4
4
44
3
3
33
)()(
toapuntamien
o curtosis de eCoeficient
asimetría de
eCoeficient
ns
xx
s
mC
ns
xx
s
mC
i
AP
i
AS
∑∑ −=
=
−=
=
Estadística Descriptiva 22
Modelo ideal
frec
uenc
ia
230 235 240 245 250 255 2600
200
400
600
800
1000
CAS = 0 CAP = 3
0 100 200 300 400 500 600 700
0
5
10
15
20
25
30
220 230 240 250 260 270 280
0
5
10
15
20
25
30
CAS > 0 CAP < 3
Estadística Descriptiva 23
Transformaciones de datos
cambia) no curtosisy (Asimetría
cambia noón distribuci la de "" La forma
sbs
xbay
bxay
xy
ii
=
+=+=
• Transformaciones Lineales
• Transformaciones no-lineales
cambian) curtosisy asimetría de tes(coeficien
óndistribuci la de "" la Cambia
)(
)(
forma
xhy
xhy ii
≠=
Estadística Descriptiva 24
X-10 10 30 50 70
0
40
80
120
160
200
240
Y0 1 2 3 4 5 6
0
30
60
90
120
150
ii xy log=
Efecto de la transformación de datos
Estadística Descriptiva 25
Transformaciones Box-Cox
-1,5
-1
-0,5
0
0,5
1
1,5
ii
pi
i
xyp
p
xy
log0
1
=⇒=
−=
Estadística Descriptiva 26
Datos
knkn
k
k
k
xxxn
xxx
xxx
YYY
L
MOMMM
L
L
L
21
22212
12111
21
2
1
Variables
Ob
serv
a cio
nes x1
x2
xn
M
Estadística Descriptiva 27
Vector de Medias
==
=∑ =
n
n
i
ki
i
i
x
x
x
n
x
x
x
MM2
1
12
1
;i
i
xxx
Estadística Descriptiva 28
Covarianza
500 800 1100 1400 1700 2000
peso
0
4
8
12
16
20
24
cons
umo
nn y
y
x
x
n
yx
ConsumoPesoCoche
MMM
22
1121
n
yyxxs
n
i iixy
∑ =−−
= 1))((
Estadística Descriptiva 29
Matriz de Varianzas
( )
=
−−−−−
−−−−−−−−−−
=
−−−
−
−−
=
∑
∑
=
=
221
22212
11221
12
2211
222
222211
1122112
11
22111
22
11
2
)())(())((
))(()())((
))(())(()(
1
1
kkk
k
k
n
i
kkikkiikkii
kkiiiii
kkiiiii
kkiii
n
i
kki
i
i
sss
sss
sss
xxxxxxxxxx
xxxxxxxxxx
xxxxxxxxxx
n
xxxxxx
xx
xx
xx
n
L
MOMM
L
L
L
MOMM
L
L
LM
S
Estadística Descriptiva 30
Gráficos de dispersión: ejemplo coches
consumo
cilindrada
potencia
peso
aceleracion
Estadística Descriptiva 31
Matriz de varianzas: ejemplo coches
−−−−−−
−−
=
6,70,3285,734,597.20,5
0,3285,949.78,312.90,461.4515,971
5,738,312.92,465.14,965.583,127
4,597.20,461.4514,965.58694,24,824.5
0,55,9713,1274,824.52,15
E
S
consumo c.c. pot. peso acel.
Estadística Descriptiva 32
Propiedades de S2
01~
~~1)~~1
(
0,
: es
~~1
~
12
2211
2222112
1221111
≥==⇒=
==
≥ℜ∈∀
=
−−−
−−−−−−
=
∑ =
n
v
n
nn
positivadasemidefini
n
xxxxxx
xxxxxx
xxxxxx
n
i i
k
kknnn
kk
kk
vvwSww,Xv
w)X(w)X(wXXwwSw
wSww
S
XXS
X
T2T
TTT2T
2T
2
T2
L
MOMM
L
L
Cuadrada k x k
Simétrica
Semidef. positiva
Estadística Descriptiva 33
Correlación
500 800 1100 1400 1700 2000
peso
0
4
8
12
16
20
24
cons
umo
nn y
y
x
x
n
yx
VarVarObs
MMM22
1121
21. −−
∑∑∑
==
=
−−
−−==
n
i in
i i
n
i ii
yx
xyxy
yyxx
yyxx
ss
sr
12
12
1
)()(
))((
• Adimensional
• -1 ≤ rxy ≤ +1
• |rxy| = 1 ⇔ yi = a + b xi
Estadística Descriptiva 34
Matriz de correlacionesejemplo coches
−−−−−−−−
=
1422,0696,0549,0466,0
422,01863,0934,0885,0
696,0863,01898,0854,0
549,0934,0898,01873,0
466,0885,0854,0873,01
R
consumo c.c. pot. peso Acel.
Las variables están muy correlacionadas
Estadística Descriptiva 35
Transformaciones Lineales
aSaa)x)(xx(x
a
a)xa)(xxax(a
xax(axa
xa
2TT
iiT
TTi
Ti
T
TiT
iT
iT
=
−−=
−−=
−−=
−=
====
=
=+++=
∑
∑∑∑
∑∑∑
=
===
===
n
nn
yyyy
n
yys
n
)
nn
yy
x
x
x
aaaxaxaxay
n
i
n
i
n
i iin
i iy
n
i
n
i
n
i i
ki
i
i
kkikiii
1
1112
2
111
2
1
212211
))(()(
)(M
LL
Estadística Descriptiva 36
Transformaciones lineales II
T2X
TiiTTTT
ii
ii2Y
iii
ii
AAS
Axxxx
AAxAxxAAx
yyyyS
xAxAAxy
y
Axy
=
−−=
−−=
−−=
====
=+++=
+++=+++=
∑∑
∑
∑∑∑
==
=
===
nn
n
nnn
xaxaxay
xaxaxay
xaxaxay
n
iTn
i
n
iT
n
i
n
i
n
i
kimkimimmi
kimkiii
kikiii
11
1
111
2211
2221212
12121111
))(())((
))((
)(
L
M
L
L
=
ki
i
i
mkmm
k
k
mi
i
i
x
x
x
aaa
aaa
aaa
y
y
y
M
L
MOMM
L
L
M2
1
21
22221
11211
2
1
SX2
Capítulo 1. Descriptiva
1.1 En un departamento cuatro profesores imparten clases en grupos con 10, 18, 22 y 150 alumnosrespectivamente. Si se pregunta a los profesores por el tamaño de su clase ¿cuál sería el valor medioy la desviación típica obtenida? ¿Y si se pregunta a todos los alumnos del departamento?
1.2 ¿Es posible que la varianza de una variable x sea 4, la de y sea 9 y la de z = x + y sea igual a 2?Justificar la respuesta.
1.3 Demostrar que al multiplicar x por k1 e y por k2, el coeficiente de correlación entre ambas no varía(k1 y k2 deben tener el mismo signo).
1.4 Demostrar que si entre dos variables existe una relación exacta y = a+ bx, con b > 0, el coeficientede correlación es uno.
1.5 Demostrar que el coeficiente de correlación es siempre en valor absoluto menor que uno.
1.6 En un proceso de fabricación se han medido tres variables y calculado la matriz de varianzas con elresultado siguiente:
2 3 13 4 21 2 2
¿Podemos afirmar que hay un error en los cálculos? ¿Por qué?
1.7 A la variable x de media x = 100 se le ha aplicado una transformación con el logaritmo decimalobteniéndose la nueva variable y = log10(x). La media de la nueva variable es y = 2.5. ¿Es posibleeste resultado?
1.8 En la figura se presenta el diagrama de tallos y hojas de los residuos obtenidos de un diseño factorial.Representa el diagrama de caja (box plot) de los datos. (Nota.- La rama -6|91 representa los valores-0.69 y -0.61).
2 -6 | 912 -5 |4 -4 | 0010 -3 | 76632018 -2 | 9875431029 -1 | 98654321100
(16) -0 | 997766655443321136 0 | 01556667727 1 | 233347820 2 | 13478914 3 | 234556996 4 | 011355
1
.
2. Probabilidad
Curso 2004 - 2005
Estadística
Probabilidad. 2
Experimento Aleatorio
EL término “experimento aleatorio” se utiliza en la teoría de la probabilidad para referirse a un proceso cuyo resultado no es conocido de antemano con certeza.
“Suma de valores en el lanzamiento de 2 dados.”
Probabilidad. 3
Variable AleatoriaUna variable aleatoria es una función que asigna un número real a cada uno de los resultados de un experimento aleatorio.
Lanzamiento de 2 monedas
X(s) ≡Número de CARAS
s X(s)
CC→ 2
CX → 1
XC → 1
XX → 0
Probabilidad. 4
Variable Aleatoria Discreta
Cuando los valores que toma una variable aleatoria son finitos o infinitos numerablesse dice que es discreta.– Resultado obtenido al lanzar un dado
{1,2,3,4,5,6}
– Número de veces que hay que lanzar una moneda hasta obtener una CARA
{1,2,3,4, ...}
Probabilidad. 5
Distribución de probabilidadSea { x1 , x2 , ..., xn } los valores que puede tomar la variable aleatoria X. Se denomina distribución de probabilidad de la variable aleatoria a P( X=xi ) que cumple:
• P ( X = xi ) ≥ 0
• Σi=1 P ( X = xi ) = 1.
x P(X=x)
0 → 1/4
1 → 1/2
2 → 1/4
Nº de Caras al lanzar 2 monedas
Probabilidad. 6
Distribución de probabilidad
p(X)
x
1/2
1/4
30 1 2
Nº de Caras al lanzar 2 monedas
Probabilidad. 7
Lanzamiento de un dado
x5
P (X = x)
1/6
1 36/16
6/15
6/14
6/13
6/12
6/11
)( xXPx =
2 4 6
Probabilidad. 8
Función de distribución
x FX ( x )
(-∞,0) 0
[0,1) 1/4
[1,2) 3/4
[2,∞) 1
La función de distribución FX ( x ) de una variable aleatoria X se define para todo número real x como:
FX ( x ) = PX ( X ≤ x ).
Ejemplo. X = Número de caras al lanzar 2 monedas
F(x)
x30 1 2
1/4
1/2
3/4
1
Probabilidad. 9
Función de Distribución
Distribución puntual de probabilidad
x
x
30 1 2
1/4
1/2
3/4
1
1/2
1/4
30 1 2
Probabilidad. 10
F(x)
x
p(x)
x
1
1 3 5
5
1/6
1 3
2 4 6
2 4 6
Lanzamiento de un dado
6/16
6/15
6/14
6/13
6/12
6/11
)( xXPx =
Probabilidad. 11
Una función F(x) es una función de distribuciónsi y sólo si cumple las siguientes condiciones:
).()(,0
:derecha lapor continua es c.
e.decrecient nofunción una es b.
.1)(y0)(.a
0xFhxFlimh
F(x)
F(x)
xFlimxFlim
h
xx
=+>∀
==
→
+∞→−∞→
Probabilidad. 12
Variable aleatoria continuaUna variable aleatoria X es continua si su función de distribución FX ( x ) es continua.
F(x)
x0 0,5 1 1,5
1
3/4
1/2
1/4
FX ( x ) = x, x ∈ [0,1)
0
0.25
0.50
0.75
x
Probabilidad. 13
Función de densidadLa función de densidad de probabilidad fX(x)de una variable aleatoria continua X es la función que verifica
Si FX(x) es derivable, además
.,)()( xdttfxFx
XX ∀= ∫ ∞−
).()( xfxFdxd
XX =
Probabilidad. 14
F(x)
x
f(x)
x1.5
0 0.5 1
0 0.5 1 1.5
1
3/4
1/2
1/4
Función de distribución
FX(x) = x, x∈[0,1)
Función de densidad
fX(x) = 1, x∈[0,1]1
Probabilidad. 15
Una función fX (x) es una función de densidadde probabilidad de una variable aleatoria X si y sólo si cumple:
.1)( b.
. todopara 0)( a.
=
≥
∫∞
∞dxxf
xxf
- X
X
Área = 1
Probabilidad. 16
Cálculo de probabilidades
a b
∫=
−=≤≤b
a X
XX
dxxf
aFbFbXaP
)(
)()()(
∫b
a X dxxf )(
)(xf X
Probabilidad. 17
EsperanzaSe define esperanza o media de una variable
aleatoria discreta X y se representa por E[X] al valor
5.361
661
561
461
361
261
1][
dadoun de oLanzamient :Ejemplo
=×+×+×+×+×+×=XE
∑=
==n
iii xXPxXE
1
).(][
x5
1/6
1 3
3.5
Centro de la distribución de probabilidad
Probabilidad. 18x
1,5
0 0,5 1
1
EsperanzaSe define esperanza o media de una variable aleatoria continua X con función de densidad fX(x) y se representa por E[X] al valor
.21
21][
101uniformeón Distribuci :Ejemplo1
0
1
0
2
==×=
≤≤=
∫x
dxxXE
x, (x) f X
∫∞
∞−
= .)(][ dxxfxXE X
Centro de la distribución de probabilidad
Probabilidad. 19
Propiedades de E[X]
• Transformaciones lineales Y = a X+b (a y b constantes)
bXaEbaXE +=+ ][][
Probabilidad. 20
Varianza
Sea X una variable aleatoria con media µ, se denomina varianza a
Var ( X ) = E[ ( X - µ )2 ].
•Variable aleatoria discreta
•Variable aleatoria continua
∑∞
−∞=
=−=x
xXPxXVar ).()(][ 2µ
dxxfxXVar X )()(][ 2∫∞
∞−−= µ
Probabilidad. 21
Propiedades de la varianza
.][
])[()(.122
2
µ
µ
−=
−=
XE
XEXVar
)()(.2 2 XVarabaXVar =+
Probabilidad. 22
Ejemplos
.121
41
3
)2/1(1Var[X]
uniformeón Distribuci
.1235
)5.3()61
661
561
461
361
261
1(][
dadoun deoLanzamient
1
0
3
1
0
22
2222222
=−=
−×=
=
−×+×+×+×+×+×=
∫
x
dxx
XVar
Probabilidad. 23
Desigualdad de Tchebychev
µ µ + k σµ - k σ
2
11
kArea −≥
.1
1)(
][][
aleatoria variablecualquier Para
2
2
kkXP
XVarXE
−>≤−
==
σµ
σµ
Probabilidad. 24
Momentos de una V.A.
][
...
][
][
Origen al respecto Momentos
22
1
pp XE
XE
XE
=
=
==
µ
µ
µµ
])[(
...
])[(
0)][(
media la a respecto Momentos
222
1
pp XE
XE
XE
µα
σµα
µα
−=
=−=
=−=
Distribución conjunta de variables aleatorias
Probabilidad. 26
Definiciones (v. a. discretas)
• Distribución de probabilidad conjunta de dos variables aleatorias X, Y
• Función de distribución conjunta:
===
∀≥==== ∑ ∑
∞=
−∞=
∞=
−∞=
x
x
y
yyYxXP
yxyYxXP
yYxXP .1),(
,,0),(
),(
),(),( yYxXPyxFXY ≤≤=
Probabilidad. 27
Lanzamiento de dos dados
1 2 3 4 5 61 1/36 1/36 1/36 1/36 1/36 1/362 1/36 1/36 1/36 1/36 1/36 1/363 1/36 1/36 1/36 1/36 1/36 1/364 1/36 1/36 1/36 1/36 1/36 1/365 1/36 1/36 1/36 1/36 1/36 1/366 1/36 1/36 1/36 1/36 1/36 1/36
Dado AZUL
Dado ROJO
X = “ Resultado de dado ROJO”
Y = “ Resultado de dado AZUL”
Distribución conjunta de probabilidad
P ( X=i , Y=j ) =1/36, (i,j de 1 a 6)
Probabilidad. 28
Ejemplo
S : SUMA DE DOS DADOS2 3 4 5 6 7 8 9 10 11 12
0 1/36 1/36 1/36 1/36 1/36 1/361 1/18 1/18 1/18 1/18 1/18
D : DIFERENCIA 2 1/18 1/18 1/18 1/18DE DOS DADOS 3 1/18 1/18 1/18
4 1/18 1/185 1/18
Ejemplo: Se lanzan dos dados y se definen las variables aleatorias suma (S) y valor absoluto de la diferencia (D) de los resultados.
Distribución Conjunta P(S= x, D= y)
Probabilidad. 29
Distribuciones Marginales
S : SUMA DE DOS DADOS2 3 4 5 6 7 8 9 10 11 12
0 1/36 1/36 1/36 1/36 1/36 1/36 6/361 1/18 1/18 1/18 1/18 1/18 10/36
D : DIFERENCIA 2 1/18 1/18 1/18 1/18 8/36DE DOS DADOS 3 1/18 1/18 1/18 6/36
4 1/18 1/18 4/365 1/18 2/36
1/36 2/36 3/36 4/36 5/36 6/36 5/36 4/36 3/36 2/36 1/36
Marginal de S Marginal de D
Probabilidad. 30
Distribuciones marginales
∑
∑
∞=
−∞=
∞=
−∞=
====
====
x
x
y
y
yYxXPyYP
yYxXPxXP
),()(
),()(
00,020,040,060,080,1
0,120,140,160,18
1 2 3 4 5 6 7 8 9 10 11 12 13
Suma de dos dados
Probabilidad. 31
Distribuciones condicionadasS : SUMA DE DOS DADOS
2 3 4 5 6 7 8 9 10 11 12 0 1/36 1/36 1/36 1/36 1/36 1/36 6/361 1/18 1/18 1/18 1/18 1/18 10/36
D : DIFERENCIA 2 1/18 1/18 1/18 1/18 8/36DE DOS DADOS 3 1/18 1/18 1/18 6/36
4 1/18 1/18 4/365 1/18 2/36 1/36 2/36 3/36 4/36 5/36 6/36 5/36 4/36 3/36 2/36 1/36
D | S = 8
0 1/51 02 2/53 04 2/55 0
1
Distribución de la diferencia entre los dados condicionada a que la suma es 8.
P(D = y | S=8) = P(D=y, S=8) / P(S=8)
Probabilidad. 32
Independencia
P(X=i, Y=j) = P( X= i ) × P( Y= j )
Dado ROJO
1 2 3 4 5 61 1/36 1/36 1/36 1/36 1/36 1/362 1/36 1/36 1/36 1/36 1/36 1/363 1/36 1/36 1/36 1/36 1/36 1/364 1/36 1/36 1/36 1/36 1/36 1/365 1/36 1/36 1/36 1/36 1/36 1/366 1/36 1/36 1/36 1/36 1/36 1/36
Dado AZUL
si sóloy sintesindependieson aleatorias variables Las X, Y
Probabilidad. 33
Variables aleatorias continuas
:cumple que
conjunta, densidad defunción la),( Siendo
),(),(
yxf
dydxyxfdYcbXaP
XY
dc
ba XY∫ ∫=≤≤≤≤
1),()2
,,0),()1
=
∀≥
∫ ∫∞∞−
∞∞− dydxyxf
yxyxf
XY
XY
Probabilidad. 34
Variables aleatorias continuas
• Función de distribución
• Funciones de densidad marginales
∫ ∫∞− ∞−= x yXYXY dvduvufyxF ),(),(
∫
∫∞∞−
∞∞−
=
=
dxyxfyf
dyyxfxf
XYY
XYX
),()(
),()(
Probabilidad. 35
Las variables aleatorias X, Y tienen como función de densidad conjunta
10,10,6),( 2 <<<<= yxxyyxf XY
10,36)(
10,26)(
Marginales.3
.5
16
6)1(.2
6),(.1
21
02
1
02
1
0
1
02
1
2
320 0
2
<<==
<<==
==
=≤+
==≤≤
∫
∫
∫ ∫
∫∫∫ ∫
−
≤+
yydxxyyf
xxdyxyxf
dxdyxy
dxdyxyYXP
yxdudvuvyYxXP
Y
X
y
yx
x y
y
x = 1-y
Probabilidad. 36
Independencia
.
si sóloy si ntesindependieson aleatorias variablesLas
(y)(x)ff(x,y)f
X, Y
YXXY =
<<=
<<=⇒<<<<=
10,3)(
10,2)(
10,10,6),(.12
2
yyyf
xxxf
yxxyyxf
Y
X
XY
Independientes
<<−==
<<==⇒≤≤≤=
∫
∫
10),log(1
)(
10,11
)(10,
1),(.2
1
0
yydxx
yf
xdyx
xfxy
xyxf
yY
xX
XY
No independientesy
x0 1
1
Probabilidad. 37
Funciones de densidad condicionadas
0)( cuando,)(
),()|(
.0)( cuando,)(
),()|(
|
|
>=
>=
xfxf
yxfxyf
yfyf
yxfyxf
XX
XYXY
YY
XYYX
Probabilidad. 38
Independencia -II
(y)fx)(yf
(x)fy)(xf
X, Y
YXY
XYX
=
=
|
|
si sóloy si ntesindependieson aleatorias variablesLas
|
|
⇒<<==
<<=
<<=⇒<<<<=
10,23
6)|(
10,3)(
10,2)(
10,10,6),(.1
2
2
|
2
2
xxx
xyyxf
yyyf
xxxf
yxxyyxf
YX
Y
X
XY
Independientes
xyx
xyf
xyyx
yxf
yydxx
yf
xdyx
xfxy
xyxf
XY
YX
yY
x
X
XY
≤≤=
≤≤−=
<<−==
<<==⇒≤≤≤=
∫
∫
0,1
)|(
1,)log(
1)|(
10),log(1
)(
10,11
)(10,
1),(.2
|
|
1
0
No independientes
Probabilidad. 39
Covarianza
( ).
,
E[Y]µE[X]µ
dxdyyxf)µ)(yµ(x
)]µ)(Yµ E[(XCov(X,Y)
Cov(X,Y)
X, Y
YX
YX
YX
==
−−=
−−=
∫ ∫∞∞−
∞∞−
y donde
:como define se y por denota se, aleatorias variables dos decovarianza La
∑∑ ==−−=−−=
i jjiYjXi
YX
yYxX)Pµ)(yµ(x
)]µ)(Yµ E[(XCov(X,Y)
),(
:discretas son sv.a' las Si
Probabilidad. 40
Propiedades de la covarianza
Propiedades
• Cov(X,Y)=E[XY] - E[X]E[Y]
•Var (X+Y) = Var(X) + Var(Y) + 2 Cov(X,Y)
La covarianza es una medida de la dependencia lineal entre las dos variables. Si las variables son independientes, Cov(X,Y)=0
( )
( )
( ) 0)(
()
,
=−−=
−−=
−−=
∫ ∫
∫ ∫
∫ ∫
∞∞−
∞∞−
∞∞−
∞∞−
∞∞−
∞∞−
dyy)fµ(ydxx)fµ(x
dxdyyfx)fµ)(yµ(x
dxdyyxf)µ)(yµ(x Cov(X,Y)
YYXX
YXYX
YX
Probabilidad. 41
Medias y Matriz de Varianzas
=
=
=
2
2
][
varianzasde Matriz
][
medias deVector
; aleatorioVector
YXY
XYX
Y
X
UVar
UE
Y
X
σσσσ
µµ
U
X, Y dos variables aleatorias con función de densidad conjunta f (x,y)
),(
][],[)(:
][],[)(:2
2
YXCov
YVarYEyfY
XVarXExfX
XY
YYY
XXX
===→
==→
σσµ
σµ
Probabilidad. 42
Correlación
.)()(
),(
como aleatorias
variablesdos entre n correlació de ecoeficient define Se
YVarXVar
YXCov (X,Y)
X, Y
=ρ
ρ
Propiedades
• -1 ≤ ρ(X,Y) ≤ +1
• Si X e Y son independientes, entonces ρ(X,Y) = 0.
• Y = a + b X ⇔ ρ(X,Y) = 1 (b>0) o ρ(X,Y) = -1 (b<0)
Probabilidad. 43
n variables aleatorias
)x,x(xf nX ,...,21
Para hacer cálculo de probabilidades de un suceso en el que intervenga las variables aleatorias X1, X2, ..., Xn es preciso conocer la distribución de probabilidad conjunta.
Si las variables son continuas se emplea la función de densidad conjunta
=
nX
X
X
M2
1
X
n
x x x
nn
n
dtdtdttttfxxxF
xxxFn n
LL 212121
21
1 1
),...,,(),...,,(
).,...,,( conjuntaón distribuci defunción la o
∫ ∫ ∫∞− ∞− ∞−
−= XX
X
Probabilidad. 44
Vector de Medias y Matriz de Varianzas
≠==
→
=
=
==
→
=
→=
jiXXCov
XVarVar
XE
XE
XE
E
nXXX
ijji
ii
nnn
n
n
nnn
Tn
σσ
σσσ
σσσσσσ
µ
µµ
µ
µµ
),(
)(][
][
][
][
][
aleatoriasvariablesdeVector ,),...,,(
2
221
22212
11221
22
11
2
1
21
L
MOMM
L
L
MM
X
X
X
Probabilidad. 45
Independencia
.,...,
si sóloy si
ntesindependieson ,..., aleatorias variablesLas
221121
21
)(xf)(x)f(xf)x,xf(x
X,XX
nnn
n
L=
Modelos Univariantes
Probabilidad. 47
Proceso de Bernoulli
El resultado de un experimento admite dos categorías: “Aceptable” y “Defectuoso”. – Se repite el experimento n veces.
– La probabilidad de “defectuoso” es la misma p
en todos los experimentos.
– Los experimentos son independientes.
Probabilidad. 48
Ejemplos de procesos de Bernoulli
• Lanzamiento de n monedas. Resultado: cara o cruz.
• Se extraen piezas al azar de un sistema continuo de fabricación. Se clasifican las piezas en aceptables o no.
• Lanzamiento de un dado n veces. En cada lanzamiento se clasifica como 6 o distinto de 6.
Probabilidad. 49
Distribución Binomial (n,p)
X = “ Nº de defectuosas al extraer n piezas”
Proporción defectuosas = p
n
Probabilidad. 50
Distribución de probabilidad binomial (n,p)n=10
↓
64 )1( pp −
4
10
64 )1(4
10)4( ppXP −
==
Probabilidad. 51
Distribución de probabilidad binomial (n,p)
nkppk
nkXP knk ,...,2,1,0,)1()( =−
== −
x0 1 2 3 4 5 6 7 8 9 10
0
0,1
0,2
0,3
0,4
n =10, p=0.2
∑=
− =−
∀≥=n
0k
.1)1( (2)
.0)1(
knk ppk
n
k, k)P(X
Probabilidad. 52
Propiedades de la dist. binomial
)1(][][][
.)(][
22
0
pnpXEXEXVar
npkXPkXEn
k
−=−=
==×= ∑=
0 20 40 60 80 1000
0,02
0,04
0,06
0,08
50
5
n = 100, p = 0.5
Probabilidad. 53
Distribuciones binomiales
0 5 10 15 20 250
0,04
0,08
0,12
0,16
0 5 10 15 20 250
0,04
0,08
0,12
0,16
0,2
0 20 40 60 80 1000
0,02
0,04
0,06
0,08
0,1
0 20 40 60 80 1000
0,02
0,04
0,06
0,08
n = 25, p = 0.5 n = 25, p = 0.2
n = 100 , p = 0.5 n = 100, p = 0.2
12.5
2.5
5
2
50
5
20
4
Probabilidad. 54
EjemploUn contrato estipula la compra de componentes en lotes grandes que deben contener un máximo de 10% de piezas con algún defecto. Para comprobar la calidad se toman 11 unidades y se acepta el lote si hay como máximo 2 piezas defectuosas. ¿Es un buen procedimiento de control?
45.0617.0779.0910.0985.0)(
%25%20%15%10%5
)1(2
11)1(
1
11)1(
0
11
2) P(X P(Aceptar)
muestra laen sdefectuosa de Número X
lote,un en piezas de proporción la Sea
92101110
AceptarP
p
pppppp
p
−
+−
+−
=
≤=≡
Probabilidad. 55
Distribución Geométrica (p)
Y = “Piezas extraídas hasta que aparezca una defectuosa”
nY
Proporción defectuosas = p
Probabilidad. 56
Distribución de probabilidad geométrica (p)
,...3,2,1,)1()( 1 =−== − kppkXP k
123
↓... k
p(1-p)p(1-p)2p
↓(1-p)k-1p
Probabilidad. 57
Propiedades de la v.a. geométrica
0 4 8 12 16 200
0,05
0,1
0,15
0,2
0,25
0,3
p=0.3
2
1][,
1][
p
pYVar
pYE
−==
Probabilidad. 58
Distribución de Poisson• Número de defectos aparecidos en tramos de
longitud fija de hilos de cobre.
• Número de partículas por centímetro cúbico en líquidos con sustancias en suspensión.
• Emisiones radiactivas: número de partículas emitidas en intervalos de tiempo fijo.
• Número de llamadas a una centralita de teléfonos en un día
Probabilidad. 59
Distribución de Poisson
Ejemplo: Fabricación continua de conductor de cobre.
λ ≡ Número medio de defectos cada 100 m
X ≡ Número de defectos en un tramo de 100 m
Probabilidad. 60
Límite de la dist. binomial
,...2,1,0,!
11)1()1(
!
1!)!(
!)(
,)1()(
==
−
−+−−=
−
−=
=−−
=
−
−
∞→
−
∞→
xex
nnn
xnnnlim
x
nnxxnn
limxP
npxnpxp
x
nxXP
x
xn
xn
x
xnx
nX
λλ
λλλ
λλ
λ
L
1→λ−→ e 1→
Probabilidad. 61
Distribución de Poisson
,..2,1,0,!
)( === − xex
xXPx
λλ
0,0000E+00
5,0000E-02
1,0000E-01
1,5000E-01
2,0000E-01
2,5000E-01
0 2 4 6 8 10 12 14 16
λ=3
Probabilidad. 62
Media y Varianza
λλ
λλλ
λλ
λ
λ
λλ
λ
==
=−
=
×=×=
===
∑
∑∑
∞
=
−−
−∞
=
−∞
=
−
][][
)!1(
!!][
,...2,1,0,!
)(
1
1
10
XVarXE
xe
ex
xex
xXE
xex
xXP
x
x
x
x
x
x
x
eλ
Probabilidad. 63
EjemploUna fuente radiactiva emite partículas según la
distribución de Poisson de media 10 partículas por minuto. Se desea calcular:
• Probabilidad de 5 partículas en un minuto
• Probabilidad de 0 partículas en un minuto
• Probabilidad de más de 5 partículas en un minuto.
• Probabilidad de al menos 30 partículas en 5 minutos.
Probabilidad. 64
Ejemplo Poisson
0016.0!
50)30(
50105'
minutos 5en partículas deNº.4
.933.0!
101
)5(1)5(.3
.1554.4)0(.2
0378.0!5
10)5(.1
30
0
50
5
0
10
10
510
==≤
=×=≡
=−=
≤−=>−===
===
∑
∑
=
−
=
−
−
−
x
x
x
x
xeYP
Y
xe
XPXP
EeXP
eXP
λ
Probabilidad. 65
Poisson de media 10
0,0000E+00
2,0000E-02
4,0000E-02
6,0000E-02
8,0000E-02
1,0000E-01
1,2000E-01
1,4000E-01
0 5 10 15 20 25
Probabilidad. 66
Distribución Exponencial
Ejemplo: Fabricación continua de conductor de cobre.
λ ≡ Número medio de defectos cada 100 m
T ≡ “Distancia entre dos defectos consecutivos”
t1 t2 t3 t4 t6t5 t7
T
Probabilidad. 67
Distribución ExponencialT≥ t
0 t
{ }
.0,)(
0,1
)()(
0,
t)[0, intervalo elen defectos 0 )(
≥=
≥−=
≤=≥=
=≥
−
−
−
tetf
te
tTPtF
te
PtTP
tT
t
T
t
λ
λ
λ
λ
Probabilidad. 68
Propiedades (Exponencial)
0 10 20 30 40 50 60
T
0
0,02
0,04
0,06
0,08
0,1
Fun
ción
de
dens
idad .0,)( ≥= − tetf tT
λλ
λ = 0.1
.111
][][][)(][
2202
0
22
λλλ
λλ λλ =−===
−==
∫∫∫
∞ −∞ −
∞
∞−
dtetdtte
TETETVardttftTE
tt
T
Probabilidad. 69
Distribución Normal Campana de Gauss
ℜ∈
−
−= xx
xf X ,2
1exp
2
1)(
2
σµ
σπ
µ
σ
Probabilidad. 70
Medidas Características
µ
σ
3])[(
0])[(
3])[(0])[(
][][
4
4
3
3
443
2
=−
===−
==
=−=−
==
σµ
σµ
σµµ
σµ
XECurtosisCAp
XEAsimetríaCA
XEXE
XVarXE
),( σµNX →
Probabilidad. 71
µ
σ
µ + σµ - σ
µ - 2σ µ +2σ µ - 3σ µ +3σ
0.68
0.955 0.997
Probabilidad. 72
Normal Estándar
dtezzezfz tz
Z ∫ ∞−−− =Φℜ∈= 2/2/ 22
2
1)(,
2
1)(
ππ
0
1)1,0(NZ →
TABLAS
Probabilidad. 73
Estandarización
).()()()(
)1,0(),(
σµ
σµ
σµ
σµ
σµσµ
−Φ=
−≤=
−≤
−=≤
→−
=⇒→
aaZP
aXPaXP
NX
ZNX
z = (a-µ)/σ
N(0,1)
)( zZP ≤
a
N(µ,σ)
)( aXP ≤
µ
Probabilidad. 74
0 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,090,0 .5000 .5040 .5080 .5120 .5160 .5199 .5239 .5279 .5319 .53590,1 .5398 .5438 .5478 .5517 .5557 .5596 .5636 .5675 .5714 .57530,2 .5793 .5832 .5871 .5910 .5948 .5987 .6026 .6064 .6103 .61410,3 .6179 .6217 .6255 .6293 .6331 .6368 .6406 .6443 .6480 .65170,4 .6554 .6591 .6628 .6664 .6700 .6736 .6772 .6808 .6844 .68790,5 .6915 .6950 .6985 .7019 .7054 .7088 .7123 .7157 .7190 .72240,6 .7257 .7291 .7324 .7357 .7389 .7422 .7454 .7486 .7517 .75490,7 .7580 .7611 .7642 .7673 .7704 .7734 .7764 .7794 .7823 .78520,8 .7881 .7910 .7939 .7967 .7995 .8023 .8051 .8078 .8106 .81330,9 .8159 .8186 .8212 .8238 .8264 .8289 .8315 .8340 .8365 .83891,0 .8413 .8438 .8461 .8485 .8508 .8531 .8554 .8577 .8599 .86211,1 .8643 .8665 .8686 .8708 .8729 .8749 .8770 .8790 .8810 .88301,2 .8849 .8869 .8888 .8907 .8925 .8944 .8962 .8980 .8997 .90151,3 .9032 .9049 .9066 .9082 .9099 .9115 .9131 .9147 .9162 .91771,4 .9192 .9207 .9222 .9236 .9251 .9265 .9279 .9292 .9306 .93191,5 .9332 .9345 .9357 .9370 .9382 .9394 .9406 .9418 .9429 .94411,6 .9452 .9463 .9474 .9484 .9495 .9505 .9515 .9525 .9535 .95451,7 .9554 .9564 .9573 .9582 .9591 .9599 .9608 .9616 .9625 .96331,8 .9641 .9649 .9656 .9664 .9671 .9678 .9686 .9693 .9699 .97061,9 .9713 .9719 .9726 .9732 .9738 .9744 .9750 .9756 .9761 .97672,0 .9772 .9778 .9783 .9788 .9793 .9798 .9803 .9808 .9812 .98172,1 .9821 .9826 .9830 .9834 .9838 .9842 .9846 .9850 .9854 .98572,2 .9861 .9864 .9868 .9871 .9875 .9878 .9881 .9884 .9887 .98902,3 .9893 .9896 .9898 .9901 .9904 .9906 .9909 .9911 .9913 .99162,4 .9918 .9920 .9922 .9925 .9927 .9929 .9931 .9932 .9934 .99362,5 .9938 .9940 .9941 .9943 .9945 .9946 .9948 .9949 .9951 .99522,6 .9953 .9955 .9956 .9957 .9959 .9960 .9961 .9962 .9963 .99642,7 .9965 .9966 .9967 .9968 .9969 .9970 .9971 .9972 .9973 .99742,8 .9974 .9975 .9976 .9977 .9977 .9978 .9979 .9979 .9980 .99812,9 .9981 .9982 .9982 .9983 .9984 .9984 .9985 .9985 .9986 .99863,0 .9987 .9987 .9987 .9988 .9988 .9989 .9989 .9989 .9990 .9990
z
N(0,1) )( zZP ≤
z
9750.0)96.1(
Ejemplo.
=≤ZP
TABLA
Normal Estandar
Probabilidad. 75
N(0,1) )( zZP ≤
z
z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,093,1 .9990323 .9990645 .9990957 .9991259 .9991552 .9991836 .9992111 .9992377 .9992636 .99928863,2 .9993128 .9993363 .9993590 .9993810 .9994023 .9994229 .9994429 .9994622 .9994809 .99949903,3 .9995165 .9995335 .9995499 .9995657 .9995811 .9995959 .9996102 .9996241 .9996375 .99965053,4 .9996630 .9996751 .9996868 .9996982 .9997091 .9997197 .9997299 .9997397 .9997492 .99975843,5 .9997673 .9997759 .9997842 .9997922 .9997999 .9998073 .9998145 .9998215 .9998282 .99983463,6 .9998409 .9998469 .9998527 .9998583 .9998636 .9998688 .9998739 .9998787 .9998834 .99988783,7 .9998922 .9998963 .9999004 .9999042 .9999080 .9999116 .9999150 .9999184 .9999216 .99992473,8 .9999276 .9999305 .9999333 .9999359 .9999385 .9999409 .9999433 .9999456 .9999478 .99994993,9 .9999519 .9999538 .9999557 .9999575 .9999592 .9999609 .9999625 .9999640 .9999655 .99996694,0 .9999683 .9999696 .9999709 .9999721 .9999733 .9999744 .9999755 .9999765 .9999775 .9999784
Probabilidad. 76
Ejemplo (Normal)
La longitud X de ciertos tornillos es una variable aleatoria con distribución normal de media 30 mm y desviación típica 0.2 mm. Se aceptan como válidos aquellos que cumplen 29.5 < X < 30.3.
• Proporción de tornillos no aceptables por cortos.
• Proporción de tornillos no aceptables por largos.
• Proporción de tornillos válidos.
Probabilidad. 77
Ejemplo (Solución)
0062.0)5.2()5.2(
)2.0
305.292.030
()5.29(.1
)1,0()2.0,30(
=−Φ=−≤=
−≤
−=≤
→−
=⇒→
ZP
XPXP
NX
ZNXσ
µ
-2.5
0.0062
2.5
0.9938
0.0062
Tablas
Probabilidad. 78
971.00062.00228.01)3.305.29(.3
0228.0)2(1)0.2(
)2.0
304.302.030
()4.30(.2
=−−=<<
=Φ−=≥=
−≥
−=≥
XP
ZP
XPXP
Probabilidad. 79
Binomial-Poisson-Normal
Binomial n,p
Poisson λ
Normal µ,σ
0, →∞→ pn
np=λ
λσ
λµλ
=
=∞→
)1(
2/1
pnp
np
p
n
−=
=→
∞→
σ
µ
Probabilidad. 80
Aproximación Binomial-Normal n=25, p=1/2
0
0.02
0.04
0.06
0.08
0.1
0.12
0.14
0.16
0.18
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25
Probabilidad. 81
0
0.02
0.04
0.06
0.08
0.1
0.12
0 5 10 15 20 25 30 35 40 45 50
Aproximación de Normal y Binomial n = 50, p=0.5
Probabilidad. 82
Transformaciones Lineales
nn
nn
Tn
Tn
aaaEYE
XaXaXaY
naaa
nXXX
µµµ +++==
=+++=
→=
→=
L
L
2211
2211
21
21
][][
constantes deVector ,),...,,(
aleatorias variables deVector ,),...,,(
Xa
Xa
a
X
T
T
( )
==
nnnn
n
n
n
a
a
a
aaaVarYVarM
L
MOMM
L
L
L 2
1
221
22212
11221
21][][
σσσ
σσσσσσ
aXaT
Probabilidad. 83
Transformaciones Lineales Caso General
=
=
=→=
=
×→
=
→=
mnnn
m
m
nnn
n
n
mnmm
n
n
T
nmnmm
n
n
m
mnmm
n
n
Tn
aaa
aaa
aaa
aaa
aaa
aaa
VarYVar
EYE
X
X
X
aaa
aaa
aaa
Y
Y
Y
nm
aaa
aaa
aaa
nXXX
L
MOMM
L
L
L
MOMM
L
L
L
MOMM
L
L
M
L
MOMM
L
L
M
L
MOMM
L
L
21
22212
12111
221
22212
11221
21
22221
11211
2
1
21
22221
11211
2
1
21
22221
11211
21
][][
][][
constantes de Matriz
aleatorias variables deVector ,),...,,(
σσσ
σσσσσσ
AXA
XAAX
a
X
Probabilidad. 84
Transformaciones Lineales(Independencia)
( )
2222
22
21
21
2
1
2
22
21
21
2211
21
21
00
00
00
][
constantes deVector ,),...,,(
ntesindependie aleatorias variables deVector ,),...,,(
nn
nn
n
nn
Tn
Tn
aaa
a
a
a
aaaYVar
XaXaXaY
naaa
nXXX
σσσ
σ
σσ
+++=
=
+++=
→=
→=
L
M
L
MOMM
L
L
L
L
a
X
Probabilidad. 85
Ejemplo:Calcular la media y la varianza de la suma de 12 variables aleatorias independientes con distribución uniforme en (0,1)
1][][
6][][
0),(12/1][
2/1][
)1,0(,
12
1
12
1
1221
12
2
1
∑
∑
=
=
==
==
+++=
==
=→
=
ii
ii
ji
i
i
i
UVarYVar
UEYE
UUUY
UUCovUVar
UE
UniformeU
U
U
U
U
L
M
Probabilidad. 86
Ejemplo• Un proceso fabrica una proporción p de tornillos
defectuosos. Se define X como la variable “número de tornillos extraídos del proceso hasta que aparecen r defectuosos”. Se pide E[X] y Var[X].
.)1(
][][][][
][][][][
/)1(][
/1]:
221
2
2
2
2
1
p
prXVarXVarXVarXVar
p
rXEXEEXE
ppXVar
pX
XX
X
X
X
r
r
ii
r
i
−=+++=
=+++=
−==
+++=
≡≡≡
L
L
L
1
i
1
X
E[X geométrica aleatoria variable
XX
defectuoso ésimo-i el aparece que hasta extraídos tornillos de Número defectuoso 2º el aparece que hasta extraídos tornillos de Número
defectuoso primer el aparece quehasta extraídostornillos de Número
nuevos
nuevos
Probabilidad. 87
Media de n variables aleatorias independientes
=
=⇒
+++=
∀=∀=
+++=
+++=
+++=
→=
nXVar
XE
n
XXXX
i]Var[Xi]E[Xµ
n
XVarXVarXVarXVar
n
XEXEXEXE
n
XXXX
nXXX
n
ii
n
n
n
Tn
221
2
221
21
21
21
][
][
][][][][
][][][][
,),...,,(
σµ
σ
L
L
L
L
varianza y media misma la tienen variables las Si
ntesindependie aleatorias variables de VectorX
Probabilidad. 88
Teorema Central del Límite
estándar. normalla deón distribucidefunción la es21
(t)
/)( donde
),(/
Entonces . y varianza media de
adprobabilid deón distribuci misma lacon ntesindependie
aleatorias variablesde secuenciauna Sea
2/
21
2
21
2
∫ ∞−−
∞→
=Φ
+++=
∞<<∞−Φ=
≤−
∞<
t x
n
n
n
dxe
nXXXX
tttn
XPlim
,...,X,XX
π
σµσµ
L
Probabilidad. 89
Teorema Central del Límite
:(aprox.) Entonces
varianza
y media de adprobabilid de óndistribuci misma la conntes,independie aleatoriasvariables Sea
2 .
21
∞<σ
µn,...,X,XX
),(2
nNX
σµ→
Probabilidad. 90
-0,2 0 0,2 0,4 0,6 0,8 1 1,20
0,5
1
1,5
Media = 0.5
Var = 0.08
-0,2 0 0,2 0,4 0,6 0,8 1 1,20
1
2
3
4
5
Media = 0.5
Var = 0.08/10101021 XXX
X+++
=L
Xi
Capítulo 2. Probabilidad
2.1 Sea X una variable aleatoria con distribución uniforme en (0, 1). Calcular la probabilidad de queY > 0.8 si Y = e−X2
.
2.2 Se elige un punto al azar interior a la circunferencia de ecuación x2 + y2 = r2. Llamando Z a lavariable aleatoria definida por la distancia entre el punto elegido y el centro de la circunferencia,calcular las funciones de densidad y distribución de Z.
2.3 Si X es una variable aleatoria con media µ. Demostrar que cuando m = µ, E[(X −m)2] es mínima.2.4 La función de densidad de la variable aleatoria X es
f(x) =
½1/(kx), si 25 ≤ x ≤ 500, en el resto.
Obtener k, la media y la varianza de X.
2.5 De acuerdo con la teoría cinética de los gases, la velocidad V de una molécula de masa m de un gasa la temperatura (absoluta) T es una variable aleatoria con la siguiente función de densidad:
f(v) =4
α3√πv2e−v
2/α2 , v ≥ 0
donde α =p2kT/m, siendo k la constante de Boltzmann. Además, E(V ) = 2α/
√π y Var(V ) =
(3/2 − 4/π)α2. Calcular el valor medio de la energía cinética, mV 2/2, de una molécula. ¿ A unamisma temperatura T , qué gas tiene mayor valor medio de energía cinética, uno ligero u otro máspesado?
2.6 La función de distribución de la variable aleatoria X es FX(x). Obtener la función de densidad dela variable aleatoria Y = FX(x).
2.7 Un modelo que habitualmente se utiliza en balística para comprobar la correcta calibración de lasarmas es
f(x) =x
σ2exp
·− x
2
2σ2
¸, x ≥ 0,σ ≥ 0,
donde la variable aleatoria X es la distancia del punto de impacto del proyectil al centro del blancoal que iba dirigido y σ es el parámetro que mide la precisión. Si para una distancia determinada dedisparo la precisión del arma es σ = 10 cm, ¿cuál es la probabilidad de que al lanzar 10 proyectiles,ninguno haya impactado a una distacia menor de 5 cm del centro del blanco?
2.8 Adaptar la demostración de la desigualdad de Chebychev y demostrar la desigualdad de Markov
P (X > a) ≤ 1aE [X]
donde X es una variable aleatoria positiva (P (X > 0) = 1)
2.9 Dada la variable aleatoria X, cuya función de densidad es
f(x) =
½k(1− x2), si 0 < x < 10, en el resto
1
Obtener k, así como la media y la varianza de la variable Y = 3X − 1.
2.10 Supóngase una diana circular con centro en el origen de coordenadas y radio r y X, Y las coor-denadas de un punto elegido al azar (por ejemplo, el lanzamiento de un dardo). Supóngase quecualquier otro punto de la diana tiene la misma probabilidad de ser elegido. Calcule fXY (x, y) yfX(x).
2.11 Un gran almacén guarda cajas que contienen piezas de distinto tipo. La proporción p de piezas detipo A en una caja se puede considerar una variable aleatoria con función de densidad:
f(p) = kp(1− p) con 0 ≤ p ≤ 1
(a) Calcular el valor de k, la media y la varianza de la variable aleatoria p.
(b) Si se toman 10 cajas al azar.¿Cuál es la probabilidad de que ninguna de ellas contenga unaproporción de piezas de tipo A igual o superior al 75% ?
2.12 X e Y son dos variables aleatorias independientes con la misma función de distribución F . Calcularla función de densidad de
U = max(X,Y).
2.13 Obtén la distribución de probabilidad del máximo, del mínimo y de la media de los resultadosobtenidos al lanzar dos dados equilibrados. Se acepta que los resultados de los dados son variablesaleatorias independientes.
2.14 La función de densidad de una variable aleatoria bidemensional viene dada por la expresión:
fXY (x, y) =
½xy + cex, cuando 0 < x < 1 y 0 < y < 10, en el resto
¿Son independientes las variables aleatorias X e Y ?
2.15 Los billetes de banco son fabricados en pliegos. La impresión se realiza por dos máquinas iguales,una de ellas imprime el anverso y la otra el reverso. Sea X e Y , respectivamente, el número dedefectos de impresión en el anverso y reverso de un pliego. Ambas variables son independientes condistribución de Poisson de parámetros λ1 y λ2.
(a) Demostrar que el número total de defectos en un pliego Z = X + Y tiene distribución dePoisson. (Nota.- Utilizar que
Pr{Z = n} =nXk=0
Pr{X = k}Pr{Y = n− k}
y el desarrollo del binomio de Newton para (λ1 + λ2)n.)
(b) Si el número total de defectos en un pliego es Z = n, ¿ cuál es la probabilidad de que hayaexáctamente X = k defectos en el anverso? (Obtener la expresión en función de λ1,λ2, ny k). ¿ De qué distribución de probabilidad se trata?
2.16 La cantidad en miligramos de dos componentes contenidos en un producto es una variable aleatoriabidemensional, cuya función de densidad viene dada por la expresión
2
fXY (x, y) =
½4xy, cuando 0 ≤ x ≤ 1 y 0 ≤ y ≤ 10, en el resto
Calcular la probabilidad de que la cantidad del primer componentes sea menor que 0.3 miligramoscuando la del segundo es 0.8 miligramos.
2.17 La llegada de los clientes a un banco se considera un proceso Poisson con parámetro λ. Sabiendoque en la última hora han llegado 2 clientes, ¿cuál es la probabilidad de que los dos entraran en losprimeros 15 minutos?
2.18 La función de densidad de la variable aleatoria bidemendional (X,Y ), bien dada por la expresión:
fXY (x, y) =
½kxy, cuando 0 < x < y < 10, en el resto
(a) Calcular el valor de k.(b) Calcular P (X < 0.5|Y = 0.5).(c) ¿Son independientes las variables aleatorias X e Y ?
2.19 X e Y son variables aleatorias con coeficiente de correlación lineal ρ = −1. Si las varianzas soniguales, calcular la varianza de Z = X + Y − 1.
2.20 Un equipo de radio tiene dos partes, el receptor y el amplificador. La duración del receptor esuna variable aleatoria exponencial de media 500 horas y la duración del amplificador una variableexponencial de media 1000 horas. ¿Cuál es la probabilidad de que el fallo del equipo (cuando seproduzca) sea debido a un fallo del receptor? (Se supone que las variables son independientes)
2.21 Una máquina en funcionamiento es reemplazada por una nueva máquina bien cuando falla, biencuando alcanza la edad de T años. Si el tiempo de vida de las sucesivas máquinas son variablesaleatorias independientes con la misma función de distribución F y con función de densidad f,demuestra que el número medio esperado de máquinas empleadas en un año es·Z T
0xf(x)dx+ T (1− F (T ))
¸−1.
2.22 SeaX1 una variable aleatoria N(10,1), X2 una variable aleatoria N(20,1), yX3 una variable aleatoriaN(30,4). Se define
Z1 = X1 +X2 −X3
Z2 = X1 +X2 +X3
Z3 = X1 −X2 −X3
Si X1,X2,X3 son independientes, calcular la matriz de varianzas de (Z1, Z2, Z3).
3
2.23 La distribución de probabilidad conjunta de las variables aleatorias Y1 e Y2 es la siguiente:
Y1-1 0 1
-1 1/16 3/16 1/16Y2 0 3/16 0 3/16
1 1/16 3/16 1/16
Calcular su coeficiente de correlación e indicar si son independientes.
2.24 La función de densidad conjunta de X e Y viene dada por
f(x, y) = xy, 0 < x < 1, 0 < y < 2
(a) Obtener las funciones de densidad marginales y decir si X e Y son independientes.(b) Calcular P(X + Y < 1).
2.25 La función de distribución conjunta de dos variables aleatorias X e Y es
F (x, y) = (1− e−ax)(1− e−by), x ≥ 0, y ≥ 0, a > 0, b > 0siendo a y b dos constantes conocidas. Calcula las funciones de distribución marginales de X eY.¿Son variables aleatorias independientes? Calcula P (X < 1, Y ≥ 2), P (X < 1) y P (Y ≥ 2).
2.26 Un ordenador tarda un total de T2 segundos en procesar un mensaje de correo electrónico, estacantidad incluye el tiempo T1 durante el cual el mensaje está en la cola esperando a ser procesado(T2 ≥ T1). La función de densidad conjunta de las variables aleatorias T1, T2 es
fT1T2(t1, t2) = e−t2 , 0 ≤ t1 ≤ t2 <∞
Calcular la probabilidad de que un mensaje haya estado menos de un segundo en la cola si el tiempototal que ha durado su procesamiento ha sido mayor que dos segundos.
2.27 Sea X un valor elegido al azar de la distribución uniforme en el intervalo [0,1]. A continuaciónse toma al azar otro valor Y de la distribución uniforme [X, 1]. Calcular la función de densidadmarginal de Y.
2.28 Una oficina de correos tiene dos ventanillas de atención al público. Tres personas A,B y C llegan enel mismo instante a la oficina de correos y encuentran las dos ventanillas desocupadas. Los tiemposde servicio requeridos por las tres personas son variables aleatorias independientes con distribuciónexponencial de parámetro λ. Los tiempos de servicio de A y B comienzan de inmediato, mientrasque C debe esperar a que termine el primero de los dos. ¿Cuál es la probabilidad de que C no seael último en salir de la oficina de correos?
2.29 Sean X,Y,U y V variables aleatorias, demostrar que si Y = U + V, entonces
Cov(X,Y ) = Cov(X,U) + Cov(X,V ).
2.30 Un laboratorio de análisis realiza pruebas de sangre para detectar la presencia de un tipo de virus.Se sabe que una de cada 100 personas es portadora del virus. Se va a realizar un estudio en uncolegio, para abaratar las pruebas se realiza un análisis combinado que consiste en: En lugar deanalizar la sangre de cada individuo, se toman las muestras de 50 y se analiza la mezcla. Si elresultado del análisis es negativo, se concluye que los 50 individuos están sanos. Si el análisis espositivo, se repite a cada persona de manera individual. El análisis es infalible.
4
(a) Determinar el número esperado de pruebas (análisis) que se tendrá que realizar si se sigueeste tipo de estrategia.
(b) ¿Cuál es la probabilidad de que un individuo determinado sea portador del virus, si elresultado del análisis realizado a su grupo de 50 ha resultado positivo?
2.31 De un lote con una proporción de piezas defectuosas p, se extraen piexas con reposición hasta quese observa la k−ésima defectuosa. Obtener la distribución de probabilidad de la variable aleatoriaX número total de piezas observadas.
2.32 La función de densidad de una variable aleatoria X viene dada por la expresión
f(x) =
½x/8, si 0 ≤ x ≤ 40, en el resto
Se generan secuencialmente valores de esta variable. ¿Cuántos valores de X habrá que generarpor término medio hasta obtener un valor mayor que 3?
2.33 Una pareja decide tener hijos hasta el nacimiento de la primera niña. Calcular la probabilidad deque tengan más de 4 hijos. (Supóngase P (nino) = P (nina) = 0.5)
2.34 Si las llamadas telefónicas a una centralita siguen una distribución de Poisson de parámetro λ = 3llamadas/cinco minutos, calcular la probabilidad de:
(a) Seis llamadas en cinco minutos.(b) Tres llamadas en diez minutos.(c) Más de 15 en un cuarto de hora.(d) Dos en un minuto.
2.35 La variable aleatoria X tiene distribución exponencial con media 1. Obtener la función de distribu-ción y la función de densidad de
W = aX1/b, a > 0, b > 0
2.36 El número de averías diarias de una máquina sigue una distribución de Poisson de media 0.4 averías.Calcular la probabilidad de que haya tres días sucesivos sin averías.
2.37 A un puesto de servicio llegan de manera independiente, por término medio, 10 clientes/hora.Calcular la probabilidad de que lleguen 8 clientes en la próxima media hora sabiendo que en laúltima hora llegaron 14 clientes, y que la variable aleatoria número de clientes que llegan en unhora siguen una distribución de Poisson.
2.38 En una planta industrial dos bombas B1 y B2 en paralelo conducen agua desde un pozo a unadepuradora D, y posteriormente otras dos bombas B3 y B4, también en paralelo, la trasladan a undepósito como indica la figura.
Los tiempos de vida de la depuradora y de las bombas son variables aleatorias independientes condistribución exponencial, siendo 20 mil horas la vida media de la depuradora y 30 mil horasla de cada bomba.
5
Pozo
B2
D
B1 B3
B4
Depósito
- ¡¡µ
-@@R
@@R
¡¡µ
-
-
(a) Calcular la probabilidad de que llegue agua al depósito después de 20 mil horas de fun-cionamiento.
(b) Calcular la probabilidad de que una depuradora que ha trabajado T horas falle antes de las milhoras siguientes. ¿Es razonable que para evitar fallos de la depuradora se renueve ésta cada 20 milhoras? ¿Por qué?
2.39 La distancia D entre dos vehículos consecutivos es una autopista sigue una distribución exponencialcon media 200 metros. ¿Cuál es la probabilidad de que en un tramo de 1 km haya exactamente 5vehículos?
2.40 La función de densidad del tiempo T de funcionamiento de un componente hasta que falla es
f(t) = kβtβ−1 exp(−ktβ), t > 0, k > 0,β > 0.
Cuando un componente falla se puede reparar y queda igual que otro que no hubiera fallado nuncay tuviera la misma edad. Además, el tiempo necesario para reparar el componente se consideradespreciable. Si un componente tiene su primer fallo en el instante t1, calcular la probabilidad deque el segundo fallo se produzca después de t2 con t2 > t1.
2.41 Ricardo es un pescador experto que ha comprobado, después de una larga experiencia practicandosu deporte favorito, que el número de peces capturados por la mañana puede ser representado poruna variable aleatoria de Poisson de media 3 peces a la hora. Quiere ir a pescar el sábado próximo,si empieza a las 7 de la mañana, ¿cuál es la probabilidad de que capture el primer pez antes de las7 h. 15 min.? ¿Cuál es la probabilidad de que capture 5 peces durante dos horas de pesca?
2.42 La variable aleatoria T representa la duración de vida de un componente electrónico. En teoría dela fiabilidad la probabilidad de que un componente falle en el instante t sabiendo que ha duradohasta t se denomina tasa de fallo y se representa por λ(t), siendo su valor en función de t
λ(t) =f(t)
1− F (t) ,
donde f y F son, respectivamente, las funciones de densidad y de distribución de la variablealeatoria T . Obtener la tasa de fallo en caso que T sea una variable aleatoria exponencial demedia 1000 horas e interpolar el resultado.
2.43 Un examen consiste en 25 cuestiones. En cada cuestión, el alumno debe elegir entre 5 solucionespropuestas, de las que una (y sólo una) es cierta. El número mínimo de respuestas correctas quedebe tener un alumno para aprobar es a. El profesor decide fijar a con el siguiente criterio: quela probabilidad de aprobar para un alumno que conteste todas las cuestiones al azar sea menor de0.05. Obtener a. (Una cuestión es respondida al azar si cada uno de los cinco resultados propuestostiene la misma probabilidad de ser escogido).
6
2.44 Obtener la función de densidad de una variable aleatoria χ2 con un grado de libertad. (Si X ;
N(0, 1), Y = X2 es una χ21.)
2.45 Dada una variable aleatoria X, cuya distribución es N(0,σ2), calcular la mediana de la variableY = |X|.
2.46 La longitud L en milímetros de las piezas fabricadas en un proceso es una variable aleatoria quese distribuye según una N(32, 0.3), considerándose aceptables aquellas cuya medida se encuentradentro del intervalo (31.1, 32.6).
(a) Calcular la probabilidad de que una pieza elegida al azar sea aceptable.(b) Si se toma al azar una muestra de tres piezas, ¿cuál es la probabilidad de que la primera
y la tercera sean aceptables y la segunda no lo sea?(c) ¿Cuál es la probabilidad de que en una muestra de tamaño 3 al menos una sea aceptable?(d) Las piezas se embalan en lotes de 500. Calcular la probabilidad de que un lote tenga más
de 15 defectuosas.
2.47 En cierta fabricación mecánica el 96% de las piezas resultan con longitudes admisibles (dentrode tolerancias), un 3% son piezas defectuosas cortas y un 1% son defectuosas largas. Calcular laprobabilidad de:
(a) En un lote de 250 piezas sean admisibles 242 o más.(b) En un lote de 500 sean cortas 10 o menos.(c) En 1000 piezas haya entre 6 y 12 largas. Todas las aproximaciones se calculan la distribu-
ción normal.
2.48 Una máquina rellena sobres de azucar para café. La cantidad de azucar en cada sobre se distribuyecomo una normal de media 8 gramos y desviación típica 0.5 gramos. Los sobres llenos se colocanen cajas de cartón. Cada caja tiene 100 sobres de azucar. El peso conjunto de la caja y los 100sobres vacíos es 30 gramos. Al final del proceso de empaquetado se pesa cada caja llena, si el pesoes menor de 820 gramos se retiran y no se comercializan. ¿Cuál es el porcentaje de cajas llenasque pesan menos de 820 gramos? ¿Cuál es la probabilidad de que una caja con 99 sobres llenos deazucar supere el control? (Se supone despreciable el peso de un sobre vacío)
2.49 En un juego de apuestas una persona paga un euro, elige un número del 1 al 6 y lanza tres dados.La banca le paga tantos euros como número de veces haya salido el número elegido. Sea X los eurosganados o perdidos por el jugador en una jugada, calcula E[X]. ¿A quién beneficia este juego, a labanca o al jugador?
2.50 Una empresa y su proveedor han llegado a un acuerdo en cuanto al plan de muestreo en la compra-venta de lotes de 100.000 unidades. Para comprobar la calidad se tomará una muestra de 400unidades, aceptando el lote cuando haya como máximo c unidades defectuosas. Calcula c para quela probabilidad de aceptar un lote con el 6% de piezas defectuosas sea 0.05.
7
3. Inferencia
Curso 2004-2005
Estadística
Inferencia 2
Probabilidad
Inferencia
Muestra n
Poblaciónp
% DEFECTUOSA
X ≡Nº Defectuosa
¿Conocido pcuanto vale X ?
¿Conocido Xcuanto vale p ?
Inferencia 3
µ
σ
),( σµNX → nXXX ,...,, 21
X
POBLACIÓN
MUESTRA n
Datos Conocidos?,¿ σµParámetros
?
Inferencia 4
240 235 240 240 247 237 243 242 236 239243 237 243 242 245 239 245 245 239 240250 246 244 246 255 242 248 248 241 242253 249 249 249 250 247 251 251 246 243248 246 246 248 249 245 250 249 242 244238 240 245 240 237 242 244 242 243 239242 241 250 243 239 244 246 245 246 240245 246 250 246 243 246 246 248 247 250251 247 247 250 247 251 250 243 252 252247 249 248 248 246 248 246 246 247 250239 240 238 241 242 243 241 241 241 241242 243 240 245 244 245 239 244 243 243246 244 245 243 245 247 244 245 245 249250 248 248 247 248 252 250 249 248 255248 245 246 245 245 249 246 247 246 253
X
Espesores de 150 obleas de Silicio (micras)
Inferencia 5
Histograma para Espesor
Espesor
frec
uenc
ia
230 235 240 245 250 255 2600
10
20
30
40
Inferencia 6
Distintos problemas de inferencia
Dado un modelo para los datos:
• Estimar µ y σ• Dar un intervalo de confianza para µ y σ• Elegir entre (contraste de hipótesis):
µ ≥ 250 o µ < 250
• Comprobar la validez del modelo (contraste de bondad de ajuste).
µ
σ
nXXX ,...,, 21
Inferencia 7
Métodos de Estimación
r
X
rX
f
xfX
θθθ
θθθ
,...,,
osdesconocid Parámetros
conocida
),...,,,(
21
21→
1. Método de los momentos
2. Método de máxima verosimilitud
?,...,,¿,,,
desimple aleatoriamuestra una Dada
2121 rnxxx
X
θθθ→K
Inferencia 8
Métodos de los momentos
),...,,(][
),...,,(][
),...,,(][
),...,,,(,,,
211
2122
21
2
2
21111
1
2121
rrr
r
n
iri
r
r
n
i i
r
n
i i
rXn
gXEn
xa
gXEn
xa
gXEn
xa
xfxxx
θθθα
θθθα
θθθα
θθθ
===
===
===
∑
∑
∑
=
=
=
MM
KDATOS VAR. ALEATORIA
=
==
→
rrr
r
r
r
ag
ag
ag
)ˆ,,ˆ,ˆ(
)ˆ,,ˆ,ˆ(
)ˆ,,ˆ,ˆ(
ˆ,,ˆ,ˆsEstimadore
21
2212
1211
21
θθθ
θθθθθθ
θθθK
M
K
K
K
Inferencia 9
Método de los momentos: Distribución normal
µ
σ ℜ∈
−
−= xx
xf X ,2
1exp
2
1)(
2
σµ
σπ
?,¿ :Parámetros σµ
2222
12
2
11
1
21
][
][
),,(,,,
µσα
µα
σµ
+===
===
∑
∑
=
=
XEn
xa
XEn
xa
xfxxx
n
i i
n
i i
XnK
22
1
22 1ˆ
ˆ
sxxn
xn
ii =−=
=
∑=
σ
µ
Inferencia 10
Método de máxima verosimilitud(Introducción)
Una fuente radiactiva emite partículas según un proceso de Poisson con media λ desconocida. Durante 10 minutos se han contado el número de partículas emitidas:
12, 6, 11, 3, 8, 5, 3, 9, 7, 5
!5!6!12)(
!5!6!12!5!6!12
!5!6!12)5,...,6,12(
6910
6910
561210
5612
1021
×××=
×××=
×××=
×××====
−
−+++
−
−−−
L
LL
L
L
λλ
λλ
λλλ
λ
λλ
λλλ
el
ee
eeeXXXP
Inferencia 11
Función de verosimilitud
2 4 6 8 10
!5!6!12)(
6910
×××= −
L
λλ λel
6,9
9,6ˆ =λ
λ
Estimador máximo-verosímil:
Inferencia 12
Función de verosimilitud
!5!6!12)(
6910
×××= −
L
λλ λel
6,9
9,6ˆ =λEstimador máximo-verosímil:
verosimilitud
0
2E-12
4E-12
6E-12
8E-12
1E-11
1,2E-11
1,4E-11
1,6E-11
1,8E-11
4
4,6
5,2
5,8
6,4 7
7,6
8,2
8,8
9,4 10
lambda
prob
abili
dad
-40
-35
-30
-25
-20
-15
-10
-5
0
log
prob
abili
dad
L(λ) = log l(λ)
Inferencia 13
Estimación por máxima verosimilitud
),...,,(max )ˆ,...,ˆ,ˆ(ˆ,...,ˆ,ˆ
),...,,(),...,,,(log),...,,(log
),...,,,(),...,,,(),...,,,(
),...,;,...,,(
:conjuntaón Distribuci
,...,,:simple aleatoria Muestra
,...,,:osdesconocid Parámetros
conocida
),...,,,(
212121
211
2121
21212211
121
21
21
21
rrr
r
n
iriXn
rnXrXrX
rn
n
r
X
rX
LL
Lxfxxxf
xfxfxf
xxxf
XXX
f
xfX
θθθθθθθθθ
θθθθθθ
θθθθθθθθθθθ
θθθ
θθθ
=⇒
==
==
→
∑=
L
Inferencia 14
Máx. verosimilitud: Distribución normal
ℜ∈
−
−= xx
xf X ,2
1exp
2
1)(
2
σµ
σπ?,¿ :Parámetros σµ
==
⇒
∑ =−+−=∂
∂
=∑ −=∂∂
∑ −−−−=
=
=
=
=
=
=
−−
−−−−−−
∑=
22
12
422
12
12
22
212
)(21
2/
)(21
)(21
)(21
21
21
ˆ
ˆ
0)ˆ(ˆ2
1
ˆ
12
0)ˆ(1
:max
)(2
1log
2)2log(
2
),...,,(log),(
)2(
1
21
21
21
),...,,(
simple aleatoriamuestra:,...,,
1
2
2
2
2
2
22
2
12
s
x
xnL
xL
L
xnn
xxxfL
e
eeexxxf
XXX
ni i
ni i
ni i
n
x
nn
xxxn
n
ni
i
n
σµ
µσσσ
µσµ
µσ
σπ
σµ
σπ
σπσπσπ
µσ
µσ
µσ
µσ L
Inferencia 15
Máx. Verosimilitud: Poisson
xx
nd
dLL
xxnL
xxxe
xe
xe
xe
xXxXxXPxxxp
xxx
xx
exXP
i
ii
n
xn
n
xxx
nnn
n
x
in
=⇒=Σ
+−=
−Σ+−=
==
====
→===
∑
Σ−−−−
−
λλλ
λλ
λλλ
λλλλ
λλ
λλλλ
λ
ˆ0ˆ
)(:)(max
!loglog)()(
!!!!!!
),,,(),...,,(
,...,, :simple aleatoria Muestra
Parámetro,...2,1,0,!
)(
2121
221121
21
21
LL
L
Inferencia 16
Máx. verosimilitud: Binomial(n,p)Proporción defectuosas = ¿ p ?
n
=Defectuosa
Aceptable
es si 1
es si 0
,...,,
:)(Bernoulli Muestra
21
i
n
x
xxx
n
rp
p
rn
p
r
dp
pdL
prnprL(p)
xrpp
pp
xXPxXPxXP
xXxXxXPxxxp
irnr
xnx
nn
nnn
ii
=→=−−
−=
−−+=
=−=
∑−∑=
========
∑−
−
ˆ0ˆ1ˆ
)(
)1log()(log
sdefectuosa de nº el es donde)1(
)1(
)()()(
),...,,(),...,,(
2211
221121
L
Inferencia 17
Distribución de media (normal)
µ
σ
),( σµNX →
nXXX ,...,, 21
nnn
XXXX
nn
XEXEXEXE
n
n
2
2
222
221
21
][Var][Var][Var][Var
][][][][
σσσσ
µµµµ
=+++
=+++
=
=+++
=+++
=
LL
LL
n
XXXX n+++=
L21
),(n
NXσµ→
Inferencia 18
Histograma de Espesores
Espesores
frec
uenc
ia
230 235 240 245 250 255 260
0
200
400
600
800
1000
Distribución de la Media de 5 observaciones
Media
Frec
uenc
ia/P
roba
bilid
ad
230 235 240 245 250 255 260
0
200
400
600
800
1000
1200
Inferencia 19
Distribución de S2 (Normal)
µ
σ
),( σµNX →
nXXX ,...,, 21
n
XXXXXXS n
222
212 )()()( −++−+−
=L
222
22222
21
21
22
1)()(
1][][
1][
1)(
1
σµσµσn
n
nnXEXE
nSE
XXn
XXn
S
i
ni
ni
−=+−+Σ=−Σ=
−=−= ∑∑
2222
222
212
]ˆ[1
ˆ
1
)()()(ˆ
σ=⇒−
=
−−++−+−
=
SESn
nS
n
XXXXXXS nL
Inferencia 20
Distribución χ2
2222
21
21 ntesindependie)1,0(,...,,
nn
n
ZZZ
NZZZ
χ→+++
→
L
indep.) y (
2Var
sPropiedade
22222
2
2
mnmnmn
n
n
n][
n]E[
χχχχχ
χ
χ
+=+⊗
=⊗
=⊗
Inferencia 21
Distribución Chi-cuadrado con 4 g.l.de
nsid
ad
0 4 8 12 16 20
0
0.04
0.08
0.12
0.16
0.2
Inferencia 22
Distribución de S2 (Normal)
4342144 344 2144 344 21
4444 84444 76
21
21
2
2
2
21
2
21
2
21
2
0
112
12
12
12
21
2
)()()(
)()(
))((2)()(
)()(
χχχ
σµ
σσ
µ
µ
µµ
µµ
χσ
µ
↓↓
=
↓
=
=
=
===
==
=
−+
−=
−
−+−=
∑ −−+−+−=
−+−=−
→
−
−
∑∑∑
∑∑
∑∑
∑
n
XXXX
XnXX
XXXXXX
XXXX
X
nn
n
i in
i i
n
i i
ni i
n
i
n
i i
n
i in
i i
nn
ii
21
2
12
2
21
2
12
2
ˆ)1(−
=
−=
→
−=
−
→
−=
∑
∑
ndist
n
i
i
ndist
n
i
i
XXSn
XXnS
χσσ
χσσ
Inferencia 23
Histograma de Espesores
Espesores
frec
uenc
ia
230 235 240 245 250 255 260
0
200
400
600
800
1000
Histograma para Varianzas
varianza muestral
frec
uenc
ia
0 20 40 60 80
0
100
200
300
400
500
Inferencia 24
Distribución de la media (general)
),(][
][
y varianza media misma la tienen variableslas Si
][][][][
][][][][
ntesindependie aleatorias variables deVector ,),...,,(
221
2
221
21
21
21
nNX
nXVar
XE
n
XXXX
i]Var[Xi]E[X
n
XVarXVarXVarXVar
n
XEXEXEXE
n
XXXX
nXXX
n
ii
n
n
n
Tn
σµσµ
σµ
→⇒
=
=⇒
+++=
∀=∀=
+++=
+++=
+++=
→=
L
L
L
L
X
∞<→ ]Var[ :),( ii XxfX θ
∞→n
Inferencia 25
Binomial
))1(
,(ˆ
)1(]ˆ[
]ˆ[ˆ
)1(][
][
es si 1
es si 0
,...,,: Binomial
21
21
n
pppNp
n
pppVar
ppE
n
XXXp
ppXVar
pXEX
XXX
n
n
i
ii
n
−→
−=
=→
+++=
−==
⇒=
∞→
L
Defectuosa
Aceptable
Inferencia 26
Poisson
),(ˆ
]ˆ[
]ˆ[ˆ
][
][
!)(
,...,,:Poisson
21
21
nN
nVar
E
n
XXX
XVar
XE
kekXP
XXX
n
n
i
ik
i
n
λλλ
λλ
λλλ
λλλλ
∞→
−
→
=
=→
+++=
==
⇒==
L
Inferencia 27
Propiedades de los estimadores
• Centrados:
• Varianza mínima:
• Error cuadrático medio mínimo
• Consistentes
)]ˆ[]ˆSesgo[(]ˆ[ θθθθθ −== EE
]'ˆ[Var]ˆ[Var:'ˆ θθθ ≤∀
)ˆ(Var)ˆ(Sesgo
])ˆ[(]ˆECM[2
2
θθ
θθθ
+=
−= E
0]ˆ[Vary ]ˆ[ limlim ==∞→∞→
θθθnn
E
),...,,(ˆˆ:),( de m.a.s ,...,, 2121 nn XXXxfXXX θθθ ≡
Inferencia 28
Ejemplo 1
0]]
:
][:
==
=
∞→∞→XX
XE
limlimnn
Var[yE[
econsistent Es
mínima varianza de Es
centrado Es
µ
µ
∑=
=n
iin X
nXNXXX
121
1:),( de m.a.s ,...,, σµ
Inferencia 29
Ejemplo 2
[ ]
0]Var[y]E[
:econsistent Es
)1(2][)1(2Var
:Varianza
)(Sesgo
1][:centrado es No
222
42
2212
2
22
22
limlim ==
−=⇒−==
−=
−=
∞→∞→
−
SS
n
nSVarnVar
σ
nS
nS
nn
SE
nn
n
σ
σχ
σ
σ
2
1
221 )(
1:),( de m.a.s ,...,, ∑
=−=
n
iin XX
nSNXXX σµ
Intervalos de confianza
Inferencia 31
Concepto de intervalo de confianzaSe ha realizado una encuesta a 400 personas elegidas al azar para estimar la proporción p de votantes de un partido político.
¿ p ?Resultado Encuesta
Sí 220No/Otros 180
Inferencia 32
N(0,1)
Introducción
)1,0()1(
ˆ
))1(
,(ˆ
))1(,(),(.
N
npp
pp
npp
pNnX
p
pnpnpNXpnBXaprox
→−−
−→=
−→ →
Inferencia 33
zα/2-zα/2
α/2 α/2
N(0,1)
2/2/
2/2/
)1(ˆ :de Despejando
1))1(
ˆ(
αα
αα α
z
npp
ppzp
z
npp
ppzP
≤−−≤−
−=≤−−≤−
Nivel de CONFIANZA
1-α
Inferencia 34
npp
zppn
ppzp
z
npp
ppz
z
npp
ppz
)ˆ1(ˆˆ
)ˆ1(ˆˆ
)ˆ1(ˆˆ
)1(ˆ
2/2/
2/2/
2/2/
−+≤≤−−
⇓
≤−−≤−
⇓
≤−−≤−
αα
αα
αα
Nivel de confianza: (1-α) TamañoMuestral
n
Inferencia 35
Ejemplo
0,55
0,550,49 0,61
0,43 0,67
0,51 0,59
0,47 0,63
95 %
99 %
n = 100
n = 400
n = 100n = 400
55,0400
220ˆ ==p
400
45,055,096,155,0
×±∈p
Inferencia 36
1. Normal: Intervalo para µ con σ conocido
),(,...,, 21 σµNXXX n →
nzx
nzx
zn
Xz
Nn
Xn
NX
σµσσ
µσ
µ
σµ
αα
αα
2/2/
2/2/ /
)1,0(/
),(
+≤≤−
≤−≤−
→−
→
zα/2-zα/2
α/2 α/2
N(0,1)
nzx
σµ α 2/±∈
Inferencia 37
2. Normal:Intervalo para µ con σ desconocido
),(,...,, 21 σµNXXX n →
ns
txn
stx
tnS
Xt
tnS
X
Nn
Xn
NX
nn
nn
n
ˆˆ
/ˆ
/ˆ
)1,0(/
),(
2/,12/,1
2/,12/,1
1
αα
αα
µ
µ
µσ
µ
σµ
−−
−−
−
+≤≤−
≤−≤−
→−
→−
→
ns
tx nˆ
2/,1αµ −±∈
tα/2- tα/2
α/2 α/2
tn-1
Inferencia 38
Distribución t de Student
-4,00 -3,00 -2,00 -1,00 0,00 1,00 2,00 3,00 4,00
N(0,1)
t1
t2
t4
p
p
tV/pZ
VZ
V
NZ
→
→
→
ntesindependieson ,
)1,0(2χ
Inferencia 39
3. Normal: Intervalo para σ2
),(,...,, 21 σµNXXX n →
22/
22
22/1
2
22/12
22
2/
212
21
22
ˆ)1(ˆ)1(
1)ˆ)1(
(
ˆ)1(1
)(ˆ
αα
αα
χσ
χ
αχσ
χ
χσ
snsn
SnP
Snn
XXS n
ni i
−≤≤−
−=≤−≤
→−
−−
=
−
−
−=∑
22/1 αχ −
22/αχ
α/2α/2
21−nχ
Inferencia 40
EJEMPLO 1. La resistencia a la compresión de 15 probetas de acero elegidas al azar es:
40,15 65,10 49,50 22,40 38,2060,40 43,40 26,35 31,20 55,6047,25 73,20 35,90 45,25 52,40
152,14
98,275,4515
2,1498,275,45
2,14ˆ75,45
98,215/ˆ
98,2
15/ˆ 14
+≤≤−
==
≤−≤−
→−
µ
µ
µ
sx
SX
tSX
2,98- 2,98
0,005 0,005
t14
99 % confianza: 34,8 ≤ µ ≤ 56,7
Inferencia 41
2142
22
12
2 ˆ14ˆ)1( χσ
χσ
→→−
−SSn
n
0,00 5,00 10,00 15,00 20,00 25,00 30,00 35,00
214χ
0,0050,005
4,07 31,3
07,46,20114
3,316,20114
6,201ˆ
99,0)3,31ˆ14
07,4(
22
2
2
×≤≤×=
=≤≤
σ
σ
s
SP
99% confianza: 90,2 ≤ σ2 ≤ 693,6
Inferencia 42
4. Poisson: Intervalo para λ
nz
nz
zn
zP
n
nX
XXXaprox
n
λλλλλ
αλλλ
λλλ
λλλ
λ
αα
αα
ˆˆ
ˆˆ
1)/
ˆ(
)1,0(Nˆ
),(Nˆ
)(Poisson ,,,
2/2/
2/2/
21
+≤≤−
−=≤−≤−
→−
→=
→K
zα/2-zα/2
α/2 α/2
N(0,1)
Tabla χ2
α
ν: grados de libertad (g.l.)
χν,1-α
EJEMPLO
P(χ9≥ 19,02) = 0,025
g.l. 0,995 0,990 0,975 0,950 0,500 0,050 0,025 0,010 0,0051 ,00004 ,00016 ,00098 ,00393 0,455 3,841 5,024 6,635 7,8792 ,01002 ,0201 0,051 0,103 1,386 5,991 7,378 9,210 10,603 ,0717 0,115 0,216 0,352 2,366 7,815 9,348 11,34 12,844 0,207 0,297 0,484 0,711 3,357 9,488 11,14 13,28 14,865 0,412 0,554 0,831 1,145 4,351 11,07 12,83 15,09 16,756 0,676 0,872 1,237 1,635 5,348 12,59 14,45 16,81 18,557 0,989 1,239 1,690 2,167 6,346 14,07 16,01 18,48 20,288 1,344 1,647 2,180 2,733 7,344 15,51 17,53 20,09 21,959 1,735 2,088 2,700 3,325 8,343 16,92 19,02 21,67 23,59
10 2,156 2,558 3,247 3,940 9,342 18,31 20,48 23,21 25,1911 2,603 3,053 3,816 4,575 10,341 19,68 21,92 24,73 26,7612 3,074 3,571 4,404 5,226 11,340 21,03 23,34 26,22 28,3013 3,565 4,107 5,009 5,892 12,340 22,36 24,74 27,69 29,8214 4,075 4,660 5,629 6,571 13,339 23,68 26,12 29,14 31,3215 4,601 5,229 6,262 7,261 14,339 25,00 27,49 30,58 32,8016 5,142 5,812 6,908 7,962 15,338 26,30 28,85 32,00 34,2717 5,697 6,408 7,564 8,672 16,338 27,59 30,19 33,41 35,7218 6,265 7,015 8,231 9,390 17,338 28,87 31,53 34,81 37,1619 6,844 7,633 8,907 10,117 18,338 30,14 32,85 36,19 38,5820 7,434 8,260 9,591 10,851 19,337 31,41 34,17 37,57 40,0021 8,034 8,897 10,283 11,591 20,337 32,67 35,48 38,93 41,4022 8,643 9,542 10,982 12,338 21,337 33,92 36,78 40,29 42,8023 9,260 10,196 11,689 13,091 22,337 35,17 38,08 41,64 44,1824 9,886 10,856 12,401 13,848 23,337 36,42 39,36 42,98 45,5625 10,520 11,524 13,120 14,611 24,337 37,65 40,65 44,31 46,9326 11,160 12,198 13,844 15,379 25,336 38,89 41,92 45,64 48,2927 11,808 12,878 14,573 16,151 26,336 40,11 43,19 46,96 49,6528 12,461 13,565 15,308 16,928 27,336 41,34 44,46 48,28 50,9929 13,121 14,256 16,047 17,708 28,336 42,56 45,72 49,59 52,3430 13,787 14,953 16,791 18,493 29,336 43,77 46,98 50,89 53,6740 20,707 22,164 24,433 26,509 39,335 55,76 59,34 63,69 66,7750 27,991 29,707 32,357 34,764 49,335 67,50 71,42 76,15 79,4960 35,534 37,485 40,482 43,188 59,335 79,08 83,30 88,38 91,9570 43,275 45,442 48,758 51,739 69,334 90,53 95,02 100,43 104,2180 51,172 53,540 57,153 60,391 79,334 101,88 106,63 112,33 116,3290 59,196 61,754 65,647 69,126 89,334 113,15 118,14 124,12 128,30100 67,328 70,065 74,222 77,929 99,334 124,34 129,56 135,81 140,17120 83,852 86,923 91,573 95,705 119,334 146,57 152,21 158,95 163,65
α
g.l 0,20 0,15 0,10 0,05 0,025 0,01 0,005 0,0025 0,001 0,00051 1,376 1,963 3,078 6,314 12,706 31,821 63,656 127,321 318,289 636,5782 1,061 1,386 1,886 2,920 4,303 6,965 9,925 14,089 22,328 31,6003 0,978 1,250 1,638 2,353 3,182 4,541 5,841 7,453 10,214 12,9244 0,941 1,190 1,533 2,132 2,776 3,747 4,604 5,598 7,173 8,6105 0,920 1,156 1,476 2,015 2,571 3,365 4,032 4,773 5,894 6,8696 0,906 1,134 1,440 1,943 2,447 3,143 3,707 4,317 5,208 5,9597 0,896 1,119 1,415 1,895 2,365 2,998 3,499 4,029 4,785 5,4088 0,889 1,108 1,397 1,860 2,306 2,896 3,355 3,833 4,501 5,0419 0,883 1,100 1,383 1,833 2,262 2,821 3,250 3,690 4,297 4,781
10 0,879 1,093 1,372 1,812 2,228 2,764 3,169 3,581 4,144 4,58711 0,876 1,088 1,363 1,796 2,201 2,718 3,106 3,497 4,025 4,43712 0,873 1,083 1,356 1,782 2,179 2,681 3,055 3,428 3,930 4,31813 0,870 1,079 1,350 1,771 2,160 2,650 3,012 3,372 3,852 4,22114 0,868 1,076 1,345 1,761 2,145 2,624 2,977 3,326 3,787 4,14015 0,866 1,074 1,341 1,753 2,131 2,602 2,947 3,286 3,733 4,07316 0,865 1,071 1,337 1,746 2,120 2,583 2,921 3,252 3,686 4,01517 0,863 1,069 1,333 1,740 2,110 2,567 2,898 3,222 3,646 3,96518 0,862 1,067 1,330 1,734 2,101 2,552 2,878 3,197 3,610 3,92219 0,861 1,066 1,328 1,729 2,093 2,539 2,861 3,174 3,579 3,88320 0,860 1,064 1,325 1,725 2,086 2,528 2,845 3,153 3,552 3,85021 0,859 1,063 1,323 1,721 2,080 2,518 2,831 3,135 3,527 3,81922 0,858 1,061 1,321 1,717 2,074 2,508 2,819 3,119 3,505 3,79223 0,858 1,060 1,319 1,714 2,069 2,500 2,807 3,104 3,485 3,76824 0,857 1,059 1,318 1,711 2,064 2,492 2,797 3,091 3,467 3,74525 0,856 1,058 1,316 1,708 2,060 2,485 2,787 3,078 3,450 3,72526 0,856 1,058 1,315 1,706 2,056 2,479 2,779 3,067 3,435 3,70727 0,855 1,057 1,314 1,703 2,052 2,473 2,771 3,057 3,421 3,68928 0,855 1,056 1,313 1,701 2,048 2,467 2,763 3,047 3,408 3,67429 0,854 1,055 1,311 1,699 2,045 2,462 2,756 3,038 3,396 3,66030 0,854 1,055 1,310 1,697 2,042 2,457 2,750 3,030 3,385 3,64640 0,851 1,050 1,303 1,684 2,021 2,423 2,704 2,971 3,307 3,55150 0,849 1,047 1,299 1,676 2,009 2,403 2,678 2,937 3,261 3,49660 0,848 1,045 1,296 1,671 2,000 2,390 2,660 2,915 3,232 3,46070 0,847 1,044 1,294 1,667 1,994 2,381 2,648 2,899 3,211 3,43580 0,846 1,043 1,292 1,664 1,990 2,374 2,639 2,887 3,195 3,41690 0,846 1,042 1,291 1,662 1,987 2,368 2,632 2,878 3,183 3,402100 0,845 1,042 1,290 1,660 1,984 2,364 2,626 2,871 3,174 3,390
infinito 0,842 1,036 1,282 1,645 1,960 2,327 2,576 2,808 3,091 3,2910,20 0,15 0,10 0,05 0,025 0,01 0,005 0,0025 0,001 0,0005
Tabla
t-Student
α
α
ν: grados de libertad (g.l.)
tν,α
EJEMPLO
P(t9≥ 2,262) = 0,025
Contraste de Hipótesis
Inferencia 46
Contraste de HipótesisSe ha realizado una encuesta a 400 personas elegidas al azar Llamando p a la proporción de votantes del partido político A. Podemos afirmar que p > 0.5.
¿ p ? Resultado Encuesta
Sí 220No/Otros 180
Inferencia 47
Contraste de hipótesis
))1(
,(ˆ
5.0:
5.0:
1
0
n
pppNP
pH
pH
−→
>≤
)1,0(
4005.05.0
5.0ˆ
50 cierto es H Si 0
NP
.p
→×
−
=
5.0:
5.0:
1
0
>=
pH
pH
Inferencia 48
Nivel de significación α
α = P( rechazar H0 | H0 es cierta)
N(0,1)
α
zα
Región de
Aceptación de HoRegión de
Rechazo Ho
Inferencia 49
00
0
H rechaza Se64.12
0.05ión significac de nivel el Elegido
2
4005.05.0
5.055.0550ˆ Muestra
⇒=>=
=
=×−
=⇒=
α
α
zz
z.p
0
0.05
1.64
R.A. Ho
R.R. H0
2
Con un nivel de significación de α = 0.05 ⇒ p > 0.5
Inferencia 50
H0 CIERTA
p=0.5
H0 FALSA
p = 0.6
0.5
0.6
α
β
c
c
cAceptar Ho Rechazar Ho
Probabilidad de Rechazar Ho
Probabilidad de Aceptar Ho
Error II
Error I
Inferencia 51
Tipos de erroresR
EA
LID
AD Ho
CIERTA
HoFALSA
Se Acepta Ho Se Rechaza Ho
RESULTADO CONTRASTE
Ok
Ok
Error tipo I α
Error tipo II β
Inferencia 52
Tipos de Contrastes
5.0:
5.0:
1
0
>=
pH
pH
5.0:
5.0:
1
0
≠=
pH
pH
UNILATERAL BILATERAL
αzα
R.A. Ho
α/2
zα/2-zα/2
α/2 R.A. Ho
R.R.Ho R.R.Ho
Nivel de significación α
R.R.Ho
Inferencia 53
Nivel crítico o p-valor
01
00
:
:
ppH
ppH
>=
))1(
,(ˆn
pppNP
−→
)Pr(
))1(
ˆ
)1(
ˆPr(
cierto) es |ˆˆ(Pr
0
00
0
00
0
0
zZn
pp
pp
npp
pP
HpPvalorp
>=
−−
>−−
=
>=−
Inferencia 54
Ejemplo
Datos: 55.0400
220ˆ ==p
0
Región de Aceptación
Ho
R.R. H005.0=α
2
0228.0
valorp −
1.64
Inferencia 55
Relación entre p-valor y α
0
R.R. H0αα<−valorp
zα
p-valor < α
Se rechaza H0
0
R.R. H0αα≥−valorp
zα
p-valor ≥ α
No se rechaza H0
Inferencia 56
1. Normal: Contraste para µ con σ conocido
),(,...,, 21 σµNXXX n →
n
xz
Nn
X
nNX
H
H
/
)1,0(/
),(
:
:
00
01
00
σµ
σµ
σµ
µµµµ
−=
→−
→
≠=
02/0
02/0
rechaza e
rechaza se No
HSzz
Hzz
⇒>
⇒≤
α
α
zα/2-zα/2
α/2 α/2
N(0,1)R.R. R.R
R. Acept.
1-α
Inferencia 57
2. Normal: Contraste para µ con σ desconocido
),(,...,, 21 σµNXXX n →
ns
xt
tnS
X
nNX
H
H
n
/ˆ
/ˆ
),(
:
:
00
1
01
00
µ
µ
σµ
µµµµ
−=
→−
→
≠=
−tα/2-tα/2
α/2 α/2
tn-1
R.R. R.R
02/0
02/0
rechaza e
rechaza se No
HStt
Htt
⇒>
⇒≤
α
α
R. Acept.
1-α
Inferencia 58
3. Normal: Contraste para σ2
),(,...,, 21 σµNXXX n →
20
220
212
2
122
20
20
20
20
ˆ)1(
ˆ)1(
)(1
1ˆ
:
:
σχ
χσ
σσ
σσ
sn
Sn
XXn
S
H
H
n
n
i i
−=
→−
−−
=
≠
=
−
=∑
[ ][ ] 0
22/1
22/
20
02
2/12
2/20
22/1
21
22/
H echazo,
H rechazo No,
1)(
R
P n
⇒∉
⇒∈
−=≤≤
−
−
−−
αα
αα
αα
χχχ
χχχ
αχχχ
Datos: ŝ2
22/1 αχ −
22/αχ
α/2α/2
21−nχ
R. A. Ho
RRHoRRHo
Inferencia 59
EJEMPLO 1. La resistencia a la compresión de 15 probetas de acero elegidas al azar es:
40,15 65,10 49,50 22,40 38,2060,40 43,40 26,35 31,20 55,6047,25 73,20 35,90 45,25 52,40
88.315/2,14
6075,452,14ˆ75,45
99.0)98,298,2(15/ˆ
60:
60:
0
14
14
1
0
−=−
=⇒==
=≤≤−
→−
≠=
tsx
tP
tS
X
H
H
µ
µµ
2,98- 2,98
0,005 0,005
t14
Como 3.88 > 2.98 ⇒ Se rechaza H0 con α=0.01
α = 0.01
Datos:
Inferencia 60
2142
22
12
2 ˆ14ˆ)1( χσ
χσ
→→−
−SSn
n
0,00 5,00 10,00 15,00 20,00 25,00 30,00 35,00
214χ
0,0050,005
4,07 31,3
1.14200
6,201146,201ˆ 2
02 =
×== χs
Como 4,07 ≤ 14,1 ≤ 31,3 ⇒ No se rechaza H0
200:
200:2
1
20
≠
=
σ
σ
H
H
99,0)3,3107,4( 214 =≤≤ χP
Datos:
Inferencia 61
4. Poisson: Contraste para λ
α
λλλ
λλλ
αλλλλ
λ
αα −=≤≤−
→−
=
→=
≠=
→
1)(
)1,0(Nˆ
),(Nˆ
ión significac de nivel:
:)(Poisson ,,,
2/2/
01
0021
zZzPn
Z
nX
H
HXXX
aprox
nK
zα/2-zα/2
α/2 α/2
N(0,1)R.R. R.R
R. Acept.
1-α
02/0
02/0
rechaza e
rechaza se No
HSzz
Hzz
⇒>
⇒≤
α
α
n
z0
00
ˆ
λλλ −
=
Inferencia 62
?),(¿ σµNX →nXXX ,...,, 21
X
µ
σ
POBLACIÓN
MUESTRA n
Datos Conocidos
Contraste χ2 de bondad de ajuste
¿Tienen los datos distribución Normal?
s
x
ˆˆ
ˆ
==
σµ
Inferencia 63
240 235 240 240 247 237 243 242 236 239243 237 243 242 245 239 245 245 239 240250 246 244 246 255 242 248 248 241 242253 249 249 249 250 247 251 251 246 243248 246 246 248 249 245 250 249 242 244238 240 245 240 237 242 244 242 243 239242 241 250 243 239 244 246 245 246 240245 246 250 246 243 246 246 248 247 250251 247 247 250 247 251 250 243 252 252247 249 248 248 246 248 246 246 247 250239 240 238 241 242 243 241 241 241 241242 243 240 245 244 245 239 244 243 243246 244 245 243 245 247 244 245 245 249250 248 248 247 248 252 250 249 248 255248 245 246 245 245 249 246 247 246 253
X
Espesores de 150 obleas de Silicio (micras)
Inferencia 64
Histograma para Espesor
Espesor
frec
uenc
ia
230 235 240 245 250 255 2600
10
20
30
40
Inferencia 65
Contraste χ2 de bondad de ajuste
∑=
−−
−
−
→−
<≤
<≤
<≤<≤
→=∀→=∀
K
krK
k
kk
KKKiK
kkkik
i
io
Xi
Xi
EEO
EOcxc
EOcxc
EOcxc
EOcxc
fniXH
fniXH
1
21
2
1
1
2221
111
0
1
0
)(
Esperada Fr.Observada Fr.Clases
:cierto es H Si
,...,2,1,:
,...,2,1,:
χ
MMM
MMM
)Pr( 1 kkk
kk
cXcp
npE
<≤==
−
nEOK
kk
K
kk ∑∑
====
11
/
Inferencia 66
Justificación del contraste χ2
21
1
2
)1,0(
)1,0()1(
))1(,(),(
−−=
∞→
→
−⇒→
−
→−
−=
−→ →→
∑ rKaproxK
k k
kk
k
kk
kk
kk
kk
kkkkn
kk
EEO
NE
EO
Npnp
npO
npE
pnpnpNOpnBO
χ
≅ 1
K ≡ Nº de CLASES r ≡ Nº de parámetro estimados
Inferencia 67
Obleas: Frecuencias Observadas
Fr. ObservadaOi
-inf 238 7238 240 16240 242 17242 244 21244 246 34246 248 24248 250 20250 252 7252 +inf 4
150
Clase
Total
micras4ˆ
micras1.245
==
s
x
Inferencia 68
Frecuencias esperadas N(245.1;4)Fr. Observada Fr. Esperada
Oi Ei
-inf 238 7 5,88238 240 16 9,58240 242 17 17,71242 244 21 25,71244 246 34 29,35246 248 24 26,34248 250 20 18,58250 252 7 10,3252 +inf 4 6,54
150 150
Clase
Total
71.251714.0150
1714.0
)775.0275.0(
)4
1.245244
4
1.245
4
1.245242Pr(
)244242Pr(
44
4
=×===
−≤≤−=
−≤
−≤
−=
≤≤=
npE
ZP
X
Xp
Inferencia 69
Contraste de Normalidad
5.854.6
)54.64(
58.9
)58,916(
88.5
)88.57( 22220 =
−++
−+
−= Lχ
Normal:
Normal:
1
0
→/
→
i
i
XH
XH
0,000
0,020
0,040
0,060
0,080
0,100
0,120
0,140
0,160
0,00 5,00 10,00 15,00 20,00
normalidad de hipótesis la rechaza se No59.125.8
95.0)59.12Pr(20
26
⇒<=
=≤
χ
χ
05.0=α
12,59
2037.0=− valorp
Inferencia 70
Se ha lanzado 300 veces un dado y se han obtenido los resultados:
Resultados Observadas1 492 593 494 515 436 49
Total 300
¿Se puede afirmar con α=0.05 que el dado está desequilibrado?
Inferencia 71
0,000
0,020
0,040
0,060
0,080
0,100
0,120
0,140
0,160
0,180
0,00 5,00 10,00 15,00
Resultados Observados Esperados1 49 502 59 503 49 504 51 505 43 506 49 50
Total 300 300
020
25
22220
H Rechaza se No07.1168.295.0)07.11Pr(
68.250
)5049(50
)5059(50
)5049(
⇒<=⇒=≤
=−++−+−=
χχ
χ L
25χ p-valor = 0.749
α=0.05
11.072.68
leequiprobab No:H
leEquiprobab:
6,...,2,1,6/1)Pr(
1 →→
=∀==
X
XH
iiX
o
Capítulo 3. Inferencia
3.1 La variable aleatoria X tiene distribución binomial con parámetros n y p, ambos desconocidos. Si{16,18,22,25,27} es una muestra aleatoria simple de la distribución anterior, estimar por el métodode los momentos n y p.
3.2 Los taxis en servicio de una ciudad están numerados del 1 al N. Se observa una muestra de 10 taxisy se apuntan sus números. Obtener un estimador de N por el método de los momentos.
3.3 Sea X1,X2, . . . ,Xn una muestra aleatoria simple de una variable aleatoria X con función de densi-dad,
fX(x) = 5x4/θ5, 0 ≤ x ≤ θ.
Obtén el estimador por el método de los momentos de θ y determina su sesgo y su varianza.
3.4 Una variable aleatoria discreta puede tomar los valores 0, 1 y 2 con probabilidades 1.5/θ, 2.5/θ y(θ − 4)/θ respectivamente. Se toma una muestra de tamaño 25 con los resultados siguientes (lasegunda fila corresponde a la fracción observada Oi para 0, 1 y 2).
x 0 1 2Oi 17 5 3
Estimar θ por máxima verosimilitud.
3.5 Se ha tomado una muestra de tamaño 10 del tiempo, en minutos, entre el paso de dos autobuses Ten una parada con los siguientes resultados: 9,10,6,4,15,6,1,5,4,10.
Si la función de distribución del tiempo de paso es F (t) = 1− exp(−αt), calcular la probabilidadestimada de esperar al autobús más de 10 minutos.
3.6 La función de distribución de una variable aleatoria es
F (x) =
0 x < 0,(x/β)α 0 ≤ x ≤ β,1 x > β.
donde los parámetros α y β son positivos. Estimar los parámetros de la distribución por el métodode máxima verosimilitud.
3.7 El club de tiro de una determinada ciudad está estudiando la distancia X del punto de impacto delproyectil al centro de la diana de sus 13 mejores tiradores.
Sabiendo que la función de densidad de la variable aleatoria presentada es
f(x) =2x
θ2exp[−x
2
θ2], x ≥ 0, θ ≥ 0,
estimar θ si la distancia en cm al blanco de 10 tiradores fue
2,1 3,2 6,3 5,4 2,2 6,9 7,1 6,6 2,5 9,1
1
y la distancia de los otros tres fue mayor que la distancia máxima permitida en su categoría quees de 11cm.
3.8 Una compañía, para determinar el número de consumidores de un determinado producto en Madrid,ha encuestado a personas elegidas al azar hasta encontrar a 20 que utilicen el producto. Estimar pormáxima verosimilitud la proporción de consumidores en la ciudad si el número total de entrevistadosha sido 115.
3.9 El tiempo de duración de ciertos componentes electrónicos es una variable aleatoria con distribuciónexponencial. Se ha realizado un ensayo con 10 componentes cuyos tiempos de duración han sido:37,45,92,104,109,200,295. Despues de 400 horas, tres componentes seguían funcionando. Con estainformación, estimar por máxima verosimilitud el parámetro de la distribución exponencial.
3.10 Sea X1,X2, ...,Xn una muestra aleatoria simple de la función de densidad
f(x) = 2(θ − x)/θ2, 0 ≤ x ≤ θ.
Obtener por el método de los momentos un estimador insesgado de θ y calcular su varianza.
3.11 Sea X la media aritmética de una muestra aleatoria simple de una distribución N(µ,σ). Se defineX = cX como nuevo estimador para µ. Determinar c (en función de µ y σ) para que el nuevoestimador tenga Error Cuadrático Medio (ECM) mínimo. Calcular c si se sabe que el coeficientede variación σ/µ = 2.
3.12 X1,X2, ...,Xn es una muestra aleatoria simple de una distribución normal con parámetros descono-cidos. Para estimar la varianza se propone el siguiente estimador
S2 = kn−1Xi=1
nXj=i+1
(Xi −Xj)2.
Determinar k para que el estimador sea centrado.
3.13 Para estimar la media σ2 de una población normal se utiliza el estimador bσ2 = kbs2, siendo bs2la varianza muestral corregida y k una constante. Calcular el valor de k que minimiza el errorcuadrático medio. (Utilizar Var[χ2g] = 2g, siendo g el número de grados de libertad).
3.14 Los tiempos de funcionamiento de dos componentes electrónicos distintos siguen distribucionesexponenciales con esperanzas µ y 2µ. Se han obtenido los tiempos de fallo de una muestra de cadatipo de componente, en ambos casos de tamaño n. Obtener el estimador de máxima verosimilitudde µ, calcular su media y su varianza.
3.15 Un sistema de lectura telemática de consumo de energía eléctrica emplea un mensaje de 128-bit. Ocasionalmente las interferencias aleatorias provocan que un bit se invierta produciéndose unerror de transmisión. Se acepta que la probabilidad de que cada bit cambie en una transmisiónes constante e igual a p, y que los cambios son independientes. Estima el valor de p si se hacomprobado que de las últimas 10000 lecturas efectuadas (todas de 128-bit) 340 eran erróneas.
3.16 Se han tomado 12 valores de una variable física X, que se supone normal, resultando
30.2, 30.8, 29.3, 29, 30.9, 30.8, 29.7, 28.9, 30.5, 31.2, 31.3, 28.5.
(a) Construir un intervalo de confianza para la media de la población al 95% de confianza.
2
(b) Construir un intervalo de confianza para la varianza de la población con el mismo nivelde confianza del apartado anterior.
3.17 En la lista adjunta se indica la edad y el área científica en que trece importantes científicos dediversas áreas descubrieron la teoría que les ha dado la fama. Construir con estos datos un intervalode confianza para la edad a la que los científicos realizan su contribución más importante: Galileo(34, astronomía), Franklin (40, electricidad), Lavoisier (31, química), Lyell (33, geología), Darwin(49, biología), Maxwell (33, ecuaciones de la luz), Curie (34, radiactividad), Plank (43, teoríacuántica), Marx (30, socialismo científico), Freud (31, psicoanálisis), Bohr (26, modelo del átomo),Einstein (26, relatividad), Keynes (36, macroeconomía).
3.18 Una muestra de 12 estaciones de servicio de una cadena de gasolineras proporciona un ingreso mediopor persona al mes de 2340 euros con una desviación típica de 815 euros. Calcular un intervalo deconfianza para el ingreso medio por trabajador en esta empresa. Calcular el número de estacionesque debemos estudiar para que el intervalo tenga una amplitud máxima de 500 euros.
3.19 Se han escogido al azar 15 probetas de un determinado acero, cuya resistencia a la compresión sesupone que se distribuye normalmente, y se ha medido ésta en las unidades adecuadas, habiéndoseobservado los resultados siguientes
40.15, 65.10, 49.5, 22.4, 38.2, 60.4, 43.4, 26.35, 31.2, 55.6, 47.25, 73.2, 35.9, 45.25, 52.4.
(a) Estimar la resistencia media del acero y su varianza.(b) Hallar un intervalo de confianza del 99% para la resistencia media.(c) Hallar un intervalo de confianza del 99% para la varianza.(d) ¿Cuántas probetas deberían haberse utilizado en el estudio si se quisiera estimar la re-
sistencia media del acero con una precisión de ±6 unidades y una confianza del 95%?.
3.20 Una compañía de comida precocinada desea lanzar al mercado un nuevo producto. Para conocer laaceptación del mismo realiza previamente una encuesta entre 200 personas elegidas al azar, de lasque 37 manifiestan su disposición a comprarlo. Obtener un intervalo de confianza (α = 0.05) parala proporción p de compradores potenciales de este nuevo producto. ¿Cúal debería ser el tamañomuestral si se quisiera reducir la longitud del intervalo a la mitad.
3.21 Se desea estimar la proporción de niños entre 0 y 14 años que se encuentran adecuadamentevacunados contra la poliomielitis. Si se quiere que la diferencia en valor absoluto entre la estimaciónfinal y el verdadero valor de la proporción sea menor que 0.05 con probabilidad 0.95, ¿ Cúal es eltamaño muestral mínimo requerido?.
3.22 Una roca lunar es enviada a un laboratorio para determinar su nivel de radiactividad θ, nivel que semide por el número medio de partículas emitidas por hora. Después de 15 horas, el equipo Geigerha contabilizado un total de 3.547 partículas emitidas. Aceptando que el número de partículasemitidas sigue una distribución de Poisson, dar un intervalo con 95% de confianza para el nivelde radiactividad de la roca. (Nota.- Utilizar que si Z tiene distribución N(0,1), entonces P (Z ≤1.96) = 0.975).
3.23 Teniendo en cuenta que si X1,X2, . . . ,Xn es una muestra aleatoria simple de una variable aleatoriaexponencial con función de densidad, f(x) = 1
λe−x/λ, x ≥ 0, λ > 0; el estadístico U = 2nX/λ
tiene distribución χ22n, donde X = (X1 +X2 + · · ·+Xn)/n; resolver la cuestión siguiente:
3
El tiempo de funcionamiento de un equipo electrónico es una variable aleatoria con distribución expo-nencial. Se han tomado los tiempos de funcionamiento hasta el fallo de 30 equipos elegidos al azar,obteniéndose 6.2 × 103 horas de media. Calcular un intervalo con 95 % de confianza para la vidamedia de un equipo.
3.24 La velocidad de una molécula según el modelo de Maxwell, es una variable aleatoria con funciónde densidad
f(x) =
4√π× 1
α3x2 exp−(x/α)2, x ≥ 0
0, x ≤ 0.donde α > 0, es el parámetro de la distribución y se verifica que
E(X) =2α√πy V ar(X) =
3
2− 4
πα2.
(a) Calcular el estimador máximo verosímil de α y su varianza asintótica.(b) Calcular el estimador por momentos de α y la varianza de dicho estimador.
(c) Para una muestra de tamaño n=100, para la que se verifica que100Pi=1xi = 342 y que
100Pi=1x2i =
1339, hallar un intervalo de confianza de α con el 95% de confianza utilizando ambosestimadores.
3.25 Los núcleos (radionucleidos) del elemento radiactivo Carbono 14 (C14) se desintegran aleatori-amente. El tiempo que tarda en desintegrarse cada radionucleido es una variable aleatoria condistribución exponencial de media 8, 27× 103 años.
(a) Si inicialmente había 1012 radionucleidos, obtener el número esperado de los radionucleidossin desintegrar al cabo de los 20.000 años.
(b) Obtener, para la variable aleatoria número de radionucleidos sin desintegrar al cabo de20.000 años, un intervalo que contenga al valor de esa variable con probabilidad 0, 95 einterpretar el resultado.
(c) Una pieza arqueológica ha estado enterrada durante 20.000 años al cabo de los cualesse han observado 1010 radionucleidos de C14. Estimar por el método de los momentosel número inicial de radionucleidos N y calcular la media y la varianza del estimadorobtenido.
(d) Determinar el tiempo que debe transcurrir para que el número de radionucleidos inicialesse reduzca a la mitad.
3.26 Un proceso industrial fabrica piezas cuya longitud en mm se distribuye según una N(190, 10). Unamuestra de 5 piezas proporciona los resultados siguientes:
187, 212, 195, 208, 192
(a) Contrastar la hipótesis de que la media del proceso µ es efectivamente 190.(b) Contrastar la hipótesis de que la varianza del proceso σ2 es 100. Tómese α = 0.05 en
todos los contrastes.
4
3.27 Para contrastar unilateralmente que la esperanza µ de una variable aleatoria normal es 10, se tomauna muestra de tamaño 16 y se rechaza la hipótesis en el caso en que la media muestral sea mayorque 11, aceptándose en el caso contrario. Sabiendo que la desviación típica de la población es σ = 2,¿cúal es la probabilidad de error de tipo I de este contraste?. ¿Cúal sería la probabilidad de errorde tipo II del contraste si el valor verdadero de la esperanza fuese 12?.
3.28 Una medicina estándar es efectiva en el 75% de los casos en los que se aplica. Se ha comprobadoun nuevo medicamento en 100 pacientes, observándose su efectividad en 85 de ellos. ¿ Es la nuevamedicina más efectiva que la estándar ? (Contrastar con α = 0.05).
3.29 Un empresario quiere comprar una empresa que fabrica cojinetes. Durante los 5 últimos años laproporción de cojinetes defectuosos se ha mantenido en un 3%. Para verificar esto, se toma unamuestra de 200 cojinetes y obtiene que 9 son defectuosos. ¿Se puede concluir que la proporción decojinetes defectuosos ha aumentado? Calcular la potencia del contraste planteado anteriormente enfunción de p. Calcular la probabilidad de error de tipo II cuando la hipótesis alternativa es p = 0.06,siendo p la proporción de defectuosos.(Nota: Utilícese la aproximación normal y α = 0, 05.).
3.30 Teniendo en cuenta que si X1,X2, . . . ,Xn es una muestra aleatoria simple de una variable aleatoriaexponencial con función de densidad, f(x) = 1
λe−x/λ, x ≥ 0, λ > 0; el estadístico U = 2nX/λ
tiene distribución χ22n, donde X = (X1 +X2 + · · ·+Xn)/n; resolver las cuestiones siguientes:
(a) El tiempo de funcionamiento de un equipo electrónico es una variable aleatoria con dis-tribución exponencial. Se han tomado los tiempos de funcionamiento hasta el fallo de30 equipos elegidos al azar, obteniéndose 6.2× 103 horas de media. Contrastar con nivelde significación igual a 0.05, H0 : λ = 5 × 103 horas, frente a H1 : λ > 5 × 103 horas;indicando: (a) el valor crítico, y (b) la probabilidad de error tipo II cuando λ = 7.5× 103horas. (Es suficiente con proporcionar el valor más proximo obtenido en las tablas dellibro de texto).
(b) Se va a realizar un ensayo con 15 equipos fabricados por una segunda empresa. Si eltiempo de funcionamiento de estos tiene también distribución exponencial. ¿ Cuál es elvalor máximo de la media muestral de estos quince equipos que permitiría concluir conα = 0.05 que son peores que los de la primera empresa? Después de 6000 horas de ensayohan fallado 6 equipos, siendo el promedio de estos seis valores igual a 2350 horas. ¿Esnecesario seguir el ensayo para tomar una decisión ?
3.31 Cibeles Computer S.A. ha realizado un gran pedido de chips para su nueva linea de ordenadorespersonales. En el contrato de suministro se especifica que al menos el 95% de los chips debenser aceptables. Como es imposible comprobarlo al 100%, el control se va a realizar mediante elsiguiente procedimiento: de cada lote (que se supone de gran tamaño) se toman al azar n chips, sila proporción de chips en la muestra que supera el control es mayor que c se acepta el lote y en casocontrario se rechaza. Llamando p a la proporción real de chips aceptables en un lote, determinar ny c si se desea que
P(Aceptar un lote)=0.01 si p=0.85
P(Aceptar un lote)=0.99 si p=0.95.
(Utilizar la aproximación normal y considerar que si Z es una variable aleatoria normal estándar,P (Z ≤ 2.33) = 0.99).
5
3.32 La estatura de 60 niños de una escuela infantil se resume en la siguiente tabla de frecuencias, dóndela última columna muestra la frecuencia esperada bajo la hipótesis de normalidad.
Frecuencia FrecuenciaIntervalo Observada Esperada41,5-43,5 4 4,0843,5-45,5 7 5,5845,5-47,5 12 9,0647,5-49,5 8 11,2749,5-51,5 6 11,2751,5-53,5 11 9,0853,5-55,5 9 5,5855,5-57,5 3 4,08Total 60 60¿Se puede aceptar la hipótesis de normalidad de los datos (α = 0.05) ?
3.33 Se tira 120 veces un dado y se obtienen los resultados de la tabla
VALOR 1 2 3 4 5 6FRECUENCIA 20 14 23 12 26 25
Contrastar la hipótesis de que el dado está equilibrado y que, por tanto, sus caras son equiproba-bles. (Tómese α = 0.05).
3.34 Un modelo sísmico indica que la distribución de los epicentros de sismos en una región debería seguiruna distribución de Poisson en el plano. Un grupo de expertos pretende contrastar si ese modelose cumple, para ello ha representado un mapa de la región dividido en cuadrículas de tamaño 100km2, y ha señalado con puntos las posiciones de los epicentros (véase figura adjunta). Realizar elcontraste χ2 de bondad de ajuste con nivel de significación α = 0, 05 proporcionando el nivel críticoaproximado del contraste.
6
3.35 El Ministerio de defensa está considerando un nuevo sistema de apoyo para el lanzamineto demisiles de corto alcance. El sistema existente tiene errores en el 7% de los lanzamientos y se deseacomprobar si el nuevo sistema tiene una probabilidad de fallo menor. El ensayo va a consistiren realizar 20 lanzamientos y se concluirá que el nuevo sistema es mejor si no se produce ningúnfallo. Llamando p a la probabilidad de fallo del sistema nuevo y aceptando independencia entre losresultados del lanzamiento, obtenga y represente gráficamente la probabilidad de error de tipo IIdel contraste ½
H0 : p = 0.07H1 : p < 0.07
Obtenga la probabilidad de error tipo I. Interprete el resultado y valore si el método de decisiónes adecuado.
3.36 El tiempo de duración T de un componente electrodinámico es una variable aleatoria con distribu-ción exponencial de media µ. Veinte componentes han sido sometidos a un ensayo y el número dehoras que han durado ha sido:
10.99 15.79 24.14 34.43 43.72 51.72 56.12 60.27 77.20 88.4791.07 117.58 130.40 133.12 152.90 159.00 193.62 208.71 308.82 316.07
Teniendo en cuenta que 2T/µ tiene distribución χ2 con dos grados de libertad, realiza el siguientecontraste
H0 : µ = 200 horas,
H1 : µ < 200 horas,
con α = 0.05.
3.37 Para controlar la calidad de un proceso textil se cuenta el número de defectos que aparecen en latela fabricada. Según el fabricante, cuando el proceso funciona correctamente el número de defectosen una bobina de 100 metros cuadrados es una variable aleatoria de Poisson con media 4. Se hainstalado un equipo de visión artificial para realizar el recuento que permite inspeccionar 900 m2
de tela cada hora. ¿Cuál es la probabilidad de que aparezcan más de 50 defectos en una horasi el proceso funciona bien? En una jornada de 16 horas de fabricación se han contabilizado 720defectos, ¿se puede afirmar que ha habido un aumento del número medio de defectos en ese día?(Nivel de significación 0.05).
7
.
4. Análisis de la Varianza
Curso 2004-05
Estadística
2Análisis de la varianza
Comparación de dos tratamientos
A B51,3 29,639,4 47,026,3 25,939,0 13,048,1 33,134,2 22,169,8 34,131,3 19,545,2 43,846,4 24,9
Sea desea comparar dos tratamientos para reducir el nivel de colesterol en la sangre. Se seleccionan 20 individuos y se asignan al azar a dos tipos de dietas A y B. La tabla muestra la reducción conseguida después de dos meses.
3Análisis de la varianza
Método: 4 pasos
Definición del modelo de distribución de probabilidad:
Hipótesis
Parámetros
Estimación de los parámetros
Diagnosis de las hipótesis
Aplicación
4Análisis de la varianza
µ1
σ
µ2
σ
11
12
11
ny
y
y
M
22
22
21
ny
y
y
M
Modelo
MODELO
DATOS
5Análisis de la varianza
Modelo: Hipótesis y Parámetros
Hipótesis básicas:
Normalidad
yij ⇒ N(µi,σ2)
Homocedasticidad
Var [yij] = σ2
Independencia
Cov [yij, ykl] = 0
Parámetros
2
2
1
σ
µµ
6Análisis de la varianza
Modelo
),0(, 2σµ Nuuy ijijiij →+=
Las observaciones se descomponen en:
Parte predecible
Parte aleatoriaiµ
0
σ
iju
7Análisis de la varianza
Estimación medias:
2
12
22
1
11
11
2
1
:
:
n
y
y
n
y
y
n
jj
n
jj
∑
∑
=•
=•
=→
=→
µ
µ
A B51,3 29,639,4 47,026,3 25,939,0 13,048,1 33,134,2 22,169,8 34,131,3 19,545,2 43,846,4 24,943,1 29,3
8Análisis de la varianza
Estimación varianza (residuos)
A B8,2 0,3-3,7 17,7
-16,8 -3,4-4,1 -16,35,0 3,8-8,9 -7,226,7 4,8-11,8 -9,82,1 14,53,3 -4,40,0 0,0
Residuos
2ˆ:
:
),0(,
2
1 1
2
22
2
−=→
−=
−=
→+=
∑∑= =
•
n
e
s
e
yye
yu
Nuuy
i
n
jij
R
ij
iijij
iijij
ijijiij
i
σ
µ
σµ
RESIDUO
95.130ˆ;0 2
1==∑
=R
n
jij se
i
9Análisis de la varianza
Varianza residual:
1
)(ˆ
1
2112
1
1
12
11
1
−
−=
∑ •
n
yys
y
y
y
j
n
M 1
)(ˆ
2
2222
2
2
22
21
2
−
−=
∑ •
n
yys
y
y
y
j
n
M
σ
µ1 µ2
σ
22
221
1
2
1 1
2
2 ˆ1
1ˆ
1
1
2ˆ s
n
ns
n
n
n
e
s i
n
jij
R
i
−−
+−−
=−
=∑∑= =
2ˆRs
10Análisis de la varianza
Diferencia de medias:
),(1
2
11
1
12
11
1
nNy
y
y
y
n
σµ→
•M),(
2
2
22
2
22
21
2
nNy
y
y
y
n
σµ→
•M
σ
µ1 µ2
σ
2
21
2121
21
2121
2
2
1
2
2121
11ˆ
)()()1,0(
11
)()(
),(
−••
••
••
→+
−−−⇒
→+
−−−
+−→−
n
R
t
nns
yyN
nn
yynn
Nyyµµ
σ
µµ
σσµµ
•• − 21 yy
11Análisis de la varianza
Contraste de igualdad de medias
211
210
:
:
µµµµ
≠=
H
H
α/2
02/0
02/0
rechaza e
rechaza se No
HStt
Htt
⇒>
⇒≤
α
α
tα/2-tα/2
α/2
tn-2
R.R. R.R
R. Acept.
1-α
2
21
210
11ˆ
−•• →
+
−= n
R
t
nns
yyt
12Análisis de la varianza
211
210
:
:
µµµµ
≠=
H
H
0 rechaza e10.269.2 HS⇒>
2.10-2.10
0.025
t18R.R. R.R
69.2
101
101
44.11
3.291.430 =
+
−=t
0.025
Ejemplo: α = 0.05
13Análisis de la varianza
Ejemplo: α = 0.01
211
210
:
:
µµµµ
≠=
H
H
α/2
0 rechaza se No88.269.2 H⇒≤
2.88-2.88
0.005
t18
R.R. R.R
0.99
69.2
101
101
44.11
3.291.430 =
+
−=t
0.005
14Análisis de la varianza
211
210
:
:
µµµµ
≠=
H
H
69.2
101
101
44.11
3.291.430 =
+
−=t
Nivel crítico (bilateral)
2.69-2.69
0.0740.074
t18
0147.0)69.2Pr( 18 =>=− tvalorp
•α = 0.05 > p-valor ⇒ Se rechaza H0
•α = 0.01 < p-valor ⇒ No se rechaza H0
15Análisis de la varianza
Conclusiones (fijado α)
Si |to| > tα/2 se dice que la diferencia de medias es significativa. O simplemente que los tratamientos son distintos (tienen medias distintas)
Si |to| ≤ tα/2 se dice que la diferencia de medias no es significativa. No hay evidencia suficiente para afirmar que las medias de los tratamientos sean diferentes.
16Análisis de la varianza
No rechazar Ho, no implicaque Ho sea cierta
El resultado |to| ≤ tα/2, (no se rechazaHo) no debe interpretarse como que “se ha demostrado que las dos medias son iguales”.
No-rechazar la hipótesis nula implica que la diferencia entre las medias µ1 - µ2 no es lo suficientemente grande como para ser detectada con el tamaño muestraldado.
17Análisis de la varianza
Intervalo de confianza para la diferencia de medias:
2
21
2121
11ˆ
)()(−
•• →+
−−−n
R
t
nns
yy µµ
21 µµ −
212/2121
2/
21
21212/
11ˆ)(
1}11
ˆ
)()({Pr
nnstyy
t
nns
yyt
R
R
+±−∈−
−=≤+
−−−≤−
••
••
α
αα
µµ
αµµ
tα/2-tα/2
α/2
tn-2
1-α α/2
18Análisis de la varianza
Ejemplo: intervalo de confianza
2.10-2.10
0.025
t18
0.025
74.108.13101
101
44.1110.2)3.291.43(
11ˆ)(
21
21
212/2121
±∈−
+××±−∈−
+±−∈− ••
µµ
µµ
µµ α nnstyy R
21 µµ −
19Análisis de la varianza
Hipótesis de homocedasticidad
1
)(ˆ
1
2112
1
1
12
11
1
−
−=
∑ •
n
yys
y
y
y
j
n
M 1
)(ˆ
2
2222
2
2
22
21
2
−
−=
∑ •
n
yys
y
y
y
j
n
M
σ1
µ1 µ2
σ2
22
211
22
210
:
:
σσ
σσ
≠
=
H
H
20Análisis de la varianza
Distribución F
212
1
211
1
2112
1
1
12
11
1
1
ˆ)1(
1
)(ˆ
−
•
→−
−
−=
∑
n
j
n
sn
n
yys
y
y
y
χσ
M
212
2
222
2
2222
2
2
22
21
2
2
ˆ)1(
1
)(ˆ
−
•
→−
−
−=
∑
n
j
n
sn
n
yys
y
y
y
χσ
M
1,1
22
22
21
21
2
21
1
21
21
2
1
ˆ
ˆ
)1(
)1(−−
−
−
→=
−
−= nn
n
n
Fs
s
n
nF
σ
σχ
χ
21Análisis de la varianza
Distribución F
F5,40
F10,40
F20,40
F40,40
22Análisis de la varianza
Algunas distribuciones F
F10,10
F10,20
F10,40
F10,80
23Análisis de la varianza
Contraste de igualdad de varianzas
Fα/2F1-α/2
α/2α/2
RRRR1-α
R.A. Ho
[ ][ ] 02/2/10
02/2/10
rechaza Se , Si
rechaza se No , Si
HFFF
HFFF
⇒∉⇒∈
−
−
αα
αα
22
211
22
210
:
:
σσ
σσ
≠
=
H
H
1,121
21
0
22
210
21ˆ
ˆ
, cierto es Si
−−→=
=
nnFs
sF
H σσ
24Análisis de la varianza
Ejemplo: Contraste de igualdad de varianzas
4.030.248
0.0250.025
RRRR
[ ] 0 rechaza se No 03.4,248.0.371 H⇒∈
22
211
22
210
:
:
σσ
σσ
≠
=
H
H
37.17.111
02.154
7.111ˆ02.154ˆ
0
22
21
==
==
F
ss1.37
Gra
dos
de li
bert
ad d
el d
enom
inad
or: ν 2
Grados de libertad del numerador: ν1α=0.05
Tabla F ααννννανν =≥⇒ )( ,,,,, 212121FFPF
05.0)50.3(: 8,7 =≥FPEjemplo
1 2 3 4 5 6 7 8 9 10 12 15 20 24 30 40 60 100 120 Inf.1 161,4 199,5 215,7 224,6 230,2 234,0 236,8 238,9 240,5 241,9 243,9 245,9 248,0 249,1 250,1 251,1 252,2 253,0 253,3 254,3 12 18,51 19,00 19,16 19,25 19,30 19,33 19,35 19,37 19,38 19,40 19,41 19,43 19,45 19,45 19,46 19,47 19,48 19,49 19,49 19,50 23 10,13 9,55 9,28 9,12 9,01 8,94 8,89 8,85 8,81 8,79 8,74 8,70 8,66 8,64 8,62 8,59 8,57 8,55 8,55 8,53 34 7,71 6,94 6,59 6,39 6,26 6,16 6,09 6,04 6,00 5,96 5,91 5,86 5,80 5,77 5,75 5,72 5,69 5,66 5,66 5,63 45 6,61 5,79 5,41 5,19 5,05 4,95 4,88 4,82 4,77 4,74 4,68 4,62 4,56 4,53 4,50 4,46 4,43 4,41 4,40 4,37 56 5,99 5,14 4,76 4,53 4,39 4,28 4,21 4,15 4,10 4,06 4,00 3,94 3,87 3,84 3,81 3,77 3,74 3,71 3,70 3,67 67 5,59 4,74 4,35 4,12 3,97 3,87 3,79 3,73 3,68 3,64 3,57 3,51 3,44 3,41 3,38 3,34 3,30 3,27 3,27 3,23 78 5,32 4,46 4,07 3,84 3,69 3,58 3,50 3,44 3,39 3,35 3,28 3,22 3,15 3,12 3,08 3,04 3,01 2,97 2,97 2,93 89 5,12 4,26 3,86 3,63 3,48 3,37 3,29 3,23 3,18 3,14 3,07 3,01 2,94 2,90 2,86 2,83 2,79 2,76 2,75 2,71 9
10 4,96 4,10 3,71 3,48 3,33 3,22 3,14 3,07 3,02 2,98 2,91 2,85 2,77 2,74 2,70 2,66 2,62 2,59 2,58 2,54 1011 4,84 3,98 3,59 3,36 3,20 3,09 3,01 2,95 2,90 2,85 2,79 2,72 2,65 2,61 2,57 2,53 2,49 2,46 2,45 2,40 1112 4,75 3,89 3,49 3,26 3,11 3,00 2,91 2,85 2,80 2,75 2,69 2,62 2,54 2,51 2,47 2,43 2,38 2,35 2,34 2,30 1213 4,67 3,81 3,41 3,18 3,03 2,92 2,83 2,77 2,71 2,67 2,60 2,53 2,46 2,42 2,38 2,34 2,30 2,26 2,25 2,21 1314 4,60 3,74 3,34 3,11 2,96 2,85 2,76 2,70 2,65 2,60 2,53 2,46 2,39 2,35 2,31 2,27 2,22 2,19 2,18 2,13 1415 4,54 3,68 3,29 3,06 2,90 2,79 2,71 2,64 2,59 2,54 2,48 2,40 2,33 2,29 2,25 2,20 2,16 2,12 2,11 2,07 1516 4,49 3,63 3,24 3,01 2,85 2,74 2,66 2,59 2,54 2,49 2,42 2,35 2,28 2,24 2,19 2,15 2,11 2,07 2,06 2,01 1617 4,45 3,59 3,20 2,96 2,81 2,70 2,61 2,55 2,49 2,45 2,38 2,31 2,23 2,19 2,15 2,10 2,06 2,02 2,01 1,96 1718 4,41 3,55 3,16 2,93 2,77 2,66 2,58 2,51 2,46 2,41 2,34 2,27 2,19 2,15 2,11 2,06 2,02 1,98 1,97 1,92 1819 4,38 3,52 3,13 2,90 2,74 2,63 2,54 2,48 2,42 2,38 2,31 2,23 2,16 2,11 2,07 2,03 1,98 1,94 1,93 1,88 1920 4,35 3,49 3,10 2,87 2,71 2,60 2,51 2,45 2,39 2,35 2,28 2,20 2,12 2,08 2,04 1,99 1,95 1,91 1,90 1,84 2021 4,32 3,47 3,07 2,84 2,68 2,57 2,49 2,42 2,37 2,32 2,25 2,18 2,10 2,05 2,01 1,96 1,92 1,88 1,87 1,81 2122 4,30 3,44 3,05 2,82 2,66 2,55 2,46 2,40 2,34 2,30 2,23 2,15 2,07 2,03 1,98 1,94 1,89 1,85 1,84 1,78 2223 4,28 3,42 3,03 2,80 2,64 2,53 2,44 2,37 2,32 2,27 2,20 2,13 2,05 2,01 1,96 1,91 1,86 1,82 1,81 1,76 2324 4,26 3,40 3,01 2,78 2,62 2,51 2,42 2,36 2,30 2,25 2,18 2,11 2,03 1,98 1,94 1,89 1,84 1,80 1,79 1,73 2425 4,24 3,39 2,99 2,76 2,60 2,49 2,40 2,34 2,28 2,24 2,16 2,09 2,01 1,96 1,92 1,87 1,82 1,78 1,77 1,71 2526 4,23 3,37 2,98 2,74 2,59 2,47 2,39 2,32 2,27 2,22 2,15 2,07 1,99 1,95 1,90 1,85 1,80 1,76 1,75 1,69 2627 4,21 3,35 2,96 2,73 2,57 2,46 2,37 2,31 2,25 2,20 2,13 2,06 1,97 1,93 1,88 1,84 1,79 1,74 1,73 1,67 2728 4,20 3,34 2,95 2,71 2,56 2,45 2,36 2,29 2,24 2,19 2,12 2,04 1,96 1,91 1,87 1,82 1,77 1,73 1,71 1,65 2829 4,18 3,33 2,93 2,70 2,55 2,43 2,35 2,28 2,22 2,18 2,10 2,03 1,94 1,90 1,85 1,81 1,75 1,71 1,70 1,64 2930 4,17 3,32 2,92 2,69 2,53 2,42 2,33 2,27 2,21 2,16 2,09 2,01 1,93 1,89 1,84 1,79 1,74 1,70 1,68 1,62 3040 4,08 3,23 2,84 2,61 2,45 2,34 2,25 2,18 2,12 2,08 2,00 1,92 1,84 1,79 1,74 1,69 1,64 1,59 1,58 1,51 4050 4,03 3,18 2,79 2,56 2,40 2,29 2,20 2,13 2,07 2,03 1,95 1,87 1,78 1,74 1,69 1,63 1,58 1,52 1,51 1,44 5060 4,00 3,15 2,76 2,53 2,37 2,25 2,17 2,10 2,04 1,99 1,92 1,84 1,75 1,70 1,65 1,59 1,53 1,48 1,47 1,39 6070 3,98 3,13 2,74 2,50 2,35 2,23 2,14 2,07 2,02 1,97 1,89 1,81 1,72 1,67 1,62 1,57 1,50 1,45 1,44 1,35 7080 3,96 3,11 2,72 2,49 2,33 2,21 2,13 2,06 2,00 1,95 1,88 1,79 1,70 1,65 1,60 1,54 1,48 1,43 1,41 1,32 8090 3,95 3,10 2,71 2,47 2,32 2,20 2,11 2,04 1,99 1,94 1,86 1,78 1,69 1,64 1,59 1,53 1,46 1,41 1,39 1,30 90100 3,94 3,09 2,70 2,46 2,31 2,19 2,10 2,03 1,97 1,93 1,85 1,77 1,68 1,63 1,57 1,52 1,45 1,39 1,38 1,28 100120 3,92 3,07 2,68 2,45 2,29 2,18 2,09 2,02 1,96 1,91 1,83 1,75 1,66 1,61 1,55 1,50 1,43 1,37 1,35 1,25 120Inf 3,84 3,00 2,60 2,37 2,21 2,10 2,01 1,94 1,88 1,83 1,75 1,67 1,57 1,52 1,46 1,39 1,32 1,24 1,22 1,00 Inf
1 2 3 4 5 6 7 8 9 10 12 15 20 24 30 40 60 100 120 Inf.
Gra
dos
de li
bert
ad d
el d
enom
inad
or: ν 2
Grados de libertad del numerador: ν1α=0.025
Tabla F ααννννανν =≥⇒ )( ,,,,, 212121FFPF
025.0)53.4(: 8,7 =≥FPEjemplo
1 2 3 4 5 6 7 8 9 10 12 15 20 24 30 40 60 100 120 Inf.1 647,8 799,5 864,2 899,6 921,8 937,1 948,2 956,6 963,3 968,6 976,7 984,9 993,1 997,3 1001,4 1005,6 1009,8 1013,2 1014,0 1018,3 12 38,51 39,00 39,17 39,25 39,30 39,33 39,36 39,37 39,39 39,40 39,41 39,43 39,45 39,46 39,46 39,47 39,48 39,49 39,49 39,50 23 17,44 16,04 15,44 15,10 14,88 14,73 14,62 14,54 14,47 14,42 14,34 14,25 14,17 14,12 14,08 14,04 13,99 13,96 13,95 13,90 34 12,22 10,65 9,98 9,60 9,36 9,20 9,07 8,98 8,90 8,84 8,75 8,66 8,56 8,51 8,46 8,41 8,36 8,32 8,31 8,26 45 10,01 8,43 7,76 7,39 7,15 6,98 6,85 6,76 6,68 6,62 6,52 6,43 6,33 6,28 6,23 6,18 6,12 6,08 6,07 6,02 56 8,81 7,26 6,60 6,23 5,99 5,82 5,70 5,60 5,52 5,46 5,37 5,27 5,17 5,12 5,07 5,01 4,96 4,92 4,90 4,85 67 8,07 6,54 5,89 5,52 5,29 5,12 4,99 4,90 4,82 4,76 4,67 4,57 4,47 4,41 4,36 4,31 4,25 4,21 4,20 4,14 78 7,57 6,06 5,42 5,05 4,82 4,65 4,53 4,43 4,36 4,30 4,20 4,10 4,00 3,95 3,89 3,84 3,78 3,74 3,73 3,67 89 7,21 5,71 5,08 4,72 4,48 4,32 4,20 4,10 4,03 3,96 3,87 3,77 3,67 3,61 3,56 3,51 3,45 3,40 3,39 3,33 9
10 6,94 5,46 4,83 4,47 4,24 4,07 3,95 3,85 3,78 3,72 3,62 3,52 3,42 3,37 3,31 3,26 3,20 3,15 3,14 3,08 1011 6,72 5,26 4,63 4,28 4,04 3,88 3,76 3,66 3,59 3,53 3,43 3,33 3,23 3,17 3,12 3,06 3,00 2,96 2,94 2,88 1112 6,55 5,10 4,47 4,12 3,89 3,73 3,61 3,51 3,44 3,37 3,28 3,18 3,07 3,02 2,96 2,91 2,85 2,80 2,79 2,72 1213 6,41 4,97 4,35 4,00 3,77 3,60 3,48 3,39 3,31 3,25 3,15 3,05 2,95 2,89 2,84 2,78 2,72 2,67 2,66 2,60 1314 6,30 4,86 4,24 3,89 3,66 3,50 3,38 3,29 3,21 3,15 3,05 2,95 2,84 2,79 2,73 2,67 2,61 2,56 2,55 2,49 1415 6,20 4,77 4,15 3,80 3,58 3,41 3,29 3,20 3,12 3,06 2,96 2,86 2,76 2,70 2,64 2,59 2,52 2,47 2,46 2,40 1516 6,12 4,69 4,08 3,73 3,50 3,34 3,22 3,12 3,05 2,99 2,89 2,79 2,68 2,63 2,57 2,51 2,45 2,40 2,38 2,32 1617 6,04 4,62 4,01 3,66 3,44 3,28 3,16 3,06 2,98 2,92 2,82 2,72 2,62 2,56 2,50 2,44 2,38 2,33 2,32 2,25 1718 5,98 4,56 3,95 3,61 3,38 3,22 3,10 3,01 2,93 2,87 2,77 2,67 2,56 2,50 2,44 2,38 2,32 2,27 2,26 2,19 1819 5,92 4,51 3,90 3,56 3,33 3,17 3,05 2,96 2,88 2,82 2,72 2,62 2,51 2,45 2,39 2,33 2,27 2,22 2,20 2,13 1920 5,87 4,46 3,86 3,51 3,29 3,13 3,01 2,91 2,84 2,77 2,68 2,57 2,46 2,41 2,35 2,29 2,22 2,17 2,16 2,09 2021 5,83 4,42 3,82 3,48 3,25 3,09 2,97 2,87 2,80 2,73 2,64 2,53 2,42 2,37 2,31 2,25 2,18 2,13 2,11 2,04 2122 5,79 4,38 3,78 3,44 3,22 3,05 2,93 2,84 2,76 2,70 2,60 2,50 2,39 2,33 2,27 2,21 2,14 2,09 2,08 2,00 2223 5,75 4,35 3,75 3,41 3,18 3,02 2,90 2,81 2,73 2,67 2,57 2,47 2,36 2,30 2,24 2,18 2,11 2,06 2,04 1,97 2324 5,72 4,32 3,72 3,38 3,15 2,99 2,87 2,78 2,70 2,64 2,54 2,44 2,33 2,27 2,21 2,15 2,08 2,02 2,01 1,94 2425 5,69 4,29 3,69 3,35 3,13 2,97 2,85 2,75 2,68 2,61 2,51 2,41 2,30 2,24 2,18 2,12 2,05 2,00 1,98 1,91 2526 5,66 4,27 3,67 3,33 3,10 2,94 2,82 2,73 2,65 2,59 2,49 2,39 2,28 2,22 2,16 2,09 2,03 1,97 1,95 1,88 2627 5,63 4,24 3,65 3,31 3,08 2,92 2,80 2,71 2,63 2,57 2,47 2,36 2,25 2,19 2,13 2,07 2,00 1,94 1,93 1,85 2728 5,61 4,22 3,63 3,29 3,06 2,90 2,78 2,69 2,61 2,55 2,45 2,34 2,23 2,17 2,11 2,05 1,98 1,92 1,91 1,83 2829 5,59 4,20 3,61 3,27 3,04 2,88 2,76 2,67 2,59 2,53 2,43 2,32 2,21 2,15 2,09 2,03 1,96 1,90 1,89 1,81 2930 5,57 4,18 3,59 3,25 3,03 2,87 2,75 2,65 2,57 2,51 2,41 2,31 2,20 2,14 2,07 2,01 1,94 1,88 1,87 1,79 3040 5,42 4,05 3,46 3,13 2,90 2,74 2,62 2,53 2,45 2,39 2,29 2,18 2,07 2,01 1,94 1,88 1,80 1,74 1,72 1,64 4050 5,34 3,97 3,39 3,05 2,83 2,67 2,55 2,46 2,38 2,32 2,22 2,11 1,99 1,93 1,87 1,80 1,72 1,66 1,64 1,55 5060 5,29 3,93 3,34 3,01 2,79 2,63 2,51 2,41 2,33 2,27 2,17 2,06 1,94 1,88 1,82 1,74 1,67 1,60 1,58 1,48 6070 5,25 3,89 3,31 2,97 2,75 2,59 2,47 2,38 2,30 2,24 2,14 2,03 1,91 1,85 1,78 1,71 1,63 1,56 1,54 1,44 7080 5,22 3,86 3,28 2,95 2,73 2,57 2,45 2,35 2,28 2,21 2,11 2,00 1,88 1,82 1,75 1,68 1,60 1,53 1,51 1,40 8090 5,20 3,84 3,26 2,93 2,71 2,55 2,43 2,34 2,26 2,19 2,09 1,98 1,86 1,80 1,73 1,66 1,58 1,50 1,48 1,37 90100 5,18 3,83 3,25 2,92 2,70 2,54 2,42 2,32 2,24 2,18 2,08 1,97 1,85 1,78 1,71 1,64 1,56 1,48 1,46 1,35 100120 5,15 3,80 3,23 2,89 2,67 2,52 2,39 2,30 2,22 2,16 2,05 1,94 1,82 1,76 1,69 1,61 1,53 1,45 1,43 1,31 120Inf 5,02 3,69 3,12 2,79 2,57 2,41 2,29 2,19 2,11 2,05 1,94 1,83 1,71 1,64 1,57 1,48 1,39 1,30 1,27 1,00 Inf
1 2 3 4 5 6 7 8 9 10 12 15 20 24 30 40 60 100 120 Inf.
Gra
dos
de li
bert
ad d
el d
enom
inad
or: ν 2
Grados de libertad del numerador: ν1α=0.01
Tabla F ααννννανν =≥⇒ )( ,,,,, 212121FFPF
01.0)18.6(: 8,7 =≥FPEjemplo
1 2 3 4 5 6 7 8 9 10 12 15 20 24 30 40 60 100 120 Inf.1 4052,2 4999,3 5403,5 5624,3 5764,0 5859,0 5928,3 5981,0 6022,4 6055,9 6106,7 6157,0 6208,7 6234,3 6260,4 6286,4 6313,0 6333,9 6339,5 6365,6 12 98,50 99,00 99,16 99,25 99,30 99,33 99,36 99,38 99,39 99,40 99,42 99,43 99,45 99,46 99,47 99,48 99,48 99,49 99,49 99,50 23 34,12 30,82 29,46 28,71 28,24 27,91 27,67 27,49 27,34 27,23 27,05 26,87 26,69 26,60 26,50 26,41 26,32 26,24 26,22 26,13 34 21,20 18,00 16,69 15,98 15,52 15,21 14,98 14,80 14,66 14,55 14,37 14,20 14,02 13,93 13,84 13,75 13,65 13,58 13,56 13,46 45 16,26 13,27 12,06 11,39 10,97 10,67 10,46 10,29 10,16 10,05 9,89 9,72 9,55 9,47 9,38 9,29 9,20 9,13 9,11 9,02 56 13,75 10,92 9,78 9,15 8,75 8,47 8,26 8,10 7,98 7,87 7,72 7,56 7,40 7,31 7,23 7,14 7,06 6,99 6,97 6,88 67 12,25 9,55 8,45 7,85 7,46 7,19 6,99 6,84 6,72 6,62 6,47 6,31 6,16 6,07 5,99 5,91 5,82 5,75 5,74 5,65 78 11,26 8,65 7,59 7,01 6,63 6,37 6,18 6,03 5,91 5,81 5,67 5,52 5,36 5,28 5,20 5,12 5,03 4,96 4,95 4,86 89 10,56 8,02 6,99 6,42 6,06 5,80 5,61 5,47 5,35 5,26 5,11 4,96 4,81 4,73 4,65 4,57 4,48 4,41 4,40 4,31 9
10 10,04 7,56 6,55 5,99 5,64 5,39 5,20 5,06 4,94 4,85 4,71 4,56 4,41 4,33 4,25 4,17 4,08 4,01 4,00 3,91 1011 9,65 7,21 6,22 5,67 5,32 5,07 4,89 4,74 4,63 4,54 4,40 4,25 4,10 4,02 3,94 3,86 3,78 3,71 3,69 3,60 1112 9,33 6,93 5,95 5,41 5,06 4,82 4,64 4,50 4,39 4,30 4,16 4,01 3,86 3,78 3,70 3,62 3,54 3,47 3,45 3,36 1213 9,07 6,70 5,74 5,21 4,86 4,62 4,44 4,30 4,19 4,10 3,96 3,82 3,66 3,59 3,51 3,43 3,34 3,27 3,25 3,17 1314 8,86 6,51 5,56 5,04 4,69 4,46 4,28 4,14 4,03 3,94 3,80 3,66 3,51 3,43 3,35 3,27 3,18 3,11 3,09 3,00 1415 8,68 6,36 5,42 4,89 4,56 4,32 4,14 4,00 3,89 3,80 3,67 3,52 3,37 3,29 3,21 3,13 3,05 2,98 2,96 2,87 1516 8,53 6,23 5,29 4,77 4,44 4,20 4,03 3,89 3,78 3,69 3,55 3,41 3,26 3,18 3,10 3,02 2,93 2,86 2,84 2,75 1617 8,40 6,11 5,19 4,67 4,34 4,10 3,93 3,79 3,68 3,59 3,46 3,31 3,16 3,08 3,00 2,92 2,83 2,76 2,75 2,65 1718 8,29 6,01 5,09 4,58 4,25 4,01 3,84 3,71 3,60 3,51 3,37 3,23 3,08 3,00 2,92 2,84 2,75 2,68 2,66 2,57 1819 8,18 5,93 5,01 4,50 4,17 3,94 3,77 3,63 3,52 3,43 3,30 3,15 3,00 2,92 2,84 2,76 2,67 2,60 2,58 2,49 1920 8,10 5,85 4,94 4,43 4,10 3,87 3,70 3,56 3,46 3,37 3,23 3,09 2,94 2,86 2,78 2,69 2,61 2,54 2,52 2,42 2021 8,02 5,78 4,87 4,37 4,04 3,81 3,64 3,51 3,40 3,31 3,17 3,03 2,88 2,80 2,72 2,64 2,55 2,48 2,46 2,36 2122 7,95 5,72 4,82 4,31 3,99 3,76 3,59 3,45 3,35 3,26 3,12 2,98 2,83 2,75 2,67 2,58 2,50 2,42 2,40 2,31 2223 7,88 5,66 4,76 4,26 3,94 3,71 3,54 3,41 3,30 3,21 3,07 2,93 2,78 2,70 2,62 2,54 2,45 2,37 2,35 2,26 2324 7,82 5,61 4,72 4,22 3,90 3,67 3,50 3,36 3,26 3,17 3,03 2,89 2,74 2,66 2,58 2,49 2,40 2,33 2,31 2,21 2425 7,77 5,57 4,68 4,18 3,85 3,63 3,46 3,32 3,22 3,13 2,99 2,85 2,70 2,62 2,54 2,45 2,36 2,29 2,27 2,17 2526 7,72 5,53 4,64 4,14 3,82 3,59 3,42 3,29 3,18 3,09 2,96 2,81 2,66 2,58 2,50 2,42 2,33 2,25 2,23 2,13 2627 7,68 5,49 4,60 4,11 3,78 3,56 3,39 3,26 3,15 3,06 2,93 2,78 2,63 2,55 2,47 2,38 2,29 2,22 2,20 2,10 2728 7,64 5,45 4,57 4,07 3,75 3,53 3,36 3,23 3,12 3,03 2,90 2,75 2,60 2,52 2,44 2,35 2,26 2,19 2,17 2,06 2829 7,60 5,42 4,54 4,04 3,73 3,50 3,33 3,20 3,09 3,00 2,87 2,73 2,57 2,49 2,41 2,33 2,23 2,16 2,14 2,03 2930 7,56 5,39 4,51 4,02 3,70 3,47 3,30 3,17 3,07 2,98 2,84 2,70 2,55 2,47 2,39 2,30 2,21 2,13 2,11 2,01 3040 7,31 5,18 4,31 3,83 3,51 3,29 3,12 2,99 2,89 2,80 2,66 2,52 2,37 2,29 2,20 2,11 2,02 1,94 1,92 1,80 4050 7,17 5,06 4,20 3,72 3,41 3,19 3,02 2,89 2,78 2,70 2,56 2,42 2,27 2,18 2,10 2,01 1,91 1,82 1,80 1,68 5060 7,08 4,98 4,13 3,65 3,34 3,12 2,95 2,82 2,72 2,63 2,50 2,35 2,20 2,12 2,03 1,94 1,84 1,75 1,73 1,60 6070 7,01 4,92 4,07 3,60 3,29 3,07 2,91 2,78 2,67 2,59 2,45 2,31 2,15 2,07 1,98 1,89 1,78 1,70 1,67 1,54 7080 6,96 4,88 4,04 3,56 3,26 3,04 2,87 2,74 2,64 2,55 2,42 2,27 2,12 2,03 1,94 1,85 1,75 1,65 1,63 1,49 8090 6,93 4,85 4,01 3,53 3,23 3,01 2,84 2,72 2,61 2,52 2,39 2,24 2,09 2,00 1,92 1,82 1,72 1,62 1,60 1,46 90100 6,90 4,82 3,98 3,51 3,21 2,99 2,82 2,69 2,59 2,50 2,37 2,22 2,07 1,98 1,89 1,80 1,69 1,60 1,57 1,43 100120 6,85 4,79 3,95 3,48 3,17 2,96 2,79 2,66 2,56 2,47 2,34 2,19 2,03 1,95 1,86 1,76 1,66 1,56 1,53 1,38 120Inf 6,63 4,61 3,78 3,32 3,02 2,80 2,64 2,51 2,41 2,32 2,18 2,04 1,88 1,79 1,70 1,59 1,47 1,36 1,32 1,00 Inf
1 2 3 4 5 6 7 8 9 10 12 15 20 24 30 40 60 100 120 Inf.
28Análisis de la varianza
¿Existen diferencias entre las cuatro semillas?
Se desea comparar el rendimiento de cuatro semillas A,B,C y D. Un terreno se divide en 24 parcelas similares y se asigna al azar cada semilla a 6 parcelas.
A B C D229.1 233.4 211.1 270.4253.7 233.0 223.1 248.6241.3 219.2 217.5 230.0254.7 200.0 211.8 250.7237.2 224.3 207.6 230.0241.3 202.0 213.7 245.8242.9 218.7 214.1 245.9
29Análisis de la varianza
Método: 4 pasos
Definición del modelo de distribución de probabilidad:
Hipótesis
Parámetros
Estimación de los parámetros
Diagnosis de las hipótesis
Aplicación
30Análisis de la varianza
Modelo
µ1
σ
µ2
σ
µK
σ...
11
12
11
ny
y
y
M
22
22
21
ny
y
y
M
KKn
K
K
y
y
y
M2
1
...
31Análisis de la varianza
Hipótesis del modelo
Normalidadyij ⇒ N(µi,σ2)
HomocedasticidadVar [yij] = σ2
IndependenciaCov [yij, ykl] = 0
32Análisis de la varianza
Modelo: Hipótesis y Parámetros
Hipótesis básicas:Normalidad
yij ⇒ N(µi,σ2)
Homocedasticidad
Var [yij] = σ2
Independencia
Cov [yij, ykl] = 0
Parámetros
2
2
1
σ
µ
µµ
K
M
33Análisis de la varianza
Modelo: Forma alternativa
),0(, 2σµ Nuuy ijijiij →+=
Las observaciones se descomponen en:
Parte predecible
Parte aleatoriaiµ
0
σ
iju
34Análisis de la varianza
Estimación medias:Max. Verosímil
K
n
jKj
KK
n
jj
n
jj
n
y
y
n
y
y
n
y
y
K
∑
∑
∑
=•
=•
=•
=→
=→
=→
1
2
12
22
1
11
11
:
:
:
2
1
µ
µ
µ
M
A B C D229.1 233.4 211.1 270.4253.7 233.0 223.1 248.6241.3 219.2 217.5 230.0254.7 200.0 211.8 250.7237.2 224.3 207.6 230.0241.3 202.0 213.7 245.8242.9 218.7 214.1 245.9
35Análisis de la varianza
Estimación varianza (residuos)
Kn
e
s
e
yye
yu
Nuuy
K
i
n
jij
R
ij
iijij
iijij
ijijiij
i
−=→
−=
−=
→+=
∑ ∑= =
•
1 1
2
22
2
ˆ:
:
),0(,
σ
µ
σµ
RESIDUO
4.142ˆ2 =Rs
A B C D-13.8 14.8 -3.0 24.510.8 14.4 9.0 2.7-1.6 0.6 3.4 -15.911.8 -18.7 -2.3 4.8-5.7 5.7 -6.5 -15.9-1.6 -16.7 -0.4 -0.10.0 0.0 0.0 0.0
Residuos
36Análisis de la varianza
Comparación de medias
La comparación de tratamientos con este modelo se reduce a comparar las medias µ1, µ2, ..., µK , en primer lugar con el contraste:
diferente es una menos Al:
:
1
210
H
H Kµµµ === L
37Análisis de la varianza
Descomposición de la variabilidad
∑ ∑∑∑ ∑
∑ ∑∑ ∑∑ ∑
∑ ∑
∑∑
= =•
=•••
= =••
= =•
= =•••
= =••
= =••••
••••••
••••
−+−=−
−+−=−
=−−
−+−=−
=−+=⇒+=
K
i
n
jiij
K
iii
K
i
n
jij
K
i
n
jiij
K
i
n
ji
K
i
n
jij
K
i
n
jiiji
iijiij
ijiijiijijiij
ii
iii
i
yyyynyy
yyyyyy
yyyy
i,j
yyyyyyn
yyyyyyuy
1 1
2
1
2
1 1
2
1 1
2
1 1
2
1 1
2
1 1
)()()(
)()()(
)0))(( donde(
todopara sumandoy cuadrado al elevando
)()(
, restando:)(µ
38Análisis de la varianza
Variabilidades
n-KeyyVNE
K-yynVE
n-yyVT
K
i
n
jij
K
i
n
jiij
K
iii
K
i
n
jij
ii
i
∑ ∑∑ ∑
∑
∑ ∑
= == =•
=•••
= =••
=−=
−=
−=
1 1
2
1 1
2
1
2
1 1
2
)(
1)(
1)(
libertad de GradosadesVariabilid
)()1(1 KnKn
VNEVEVT
−+−=−+=
39Análisis de la varianza
Descomposición: ejemplo
229.1 233.4 211.1 270.4 242.9 218.7 214.1 245.9 -13.8 14.8 -3.0 24.5253.7 233.0 223.1 248.6 242.9 218.7 214.1 245.9 10.8 14.4 9.0 2.7241.3 219.2 217.5 230.0 242.9 218.7 214.1 245.9 -1.6 0.6 3.4 -15.9254.7 200.0 211.8 250.7 242.9 218.7 214.1 245.9 11.8 -18.7 -2.3 4.8237.2 224.3 207.6 230.0 242.9 218.7 214.1 245.9 -5.7 5.7 -6.5 -15.9241.3 202.0 213.7 245.8 242.9 218.7 214.1 245.9 -1.6 -16.7 -0.4 -0.1
-1.3 3.0 -19.3 40.0 12.5 -11.7 -16.3 15.5 -13.8 14.8 -3.0 24.523.3 2.6 -7.3 18.2 12.5 -11.7 -16.3 15.5 10.8 14.4 9.0 2.710.9 -11.2 -12.9 -0.4 12.5 -11.7 -16.3 15.5 -1.6 0.6 3.4 -15.924.3 -30.4 -18.6 20.3 12.5 -11.7 -16.3 15.5 11.8 -18.7 -2.3 4.86.8 -6.1 -22.8 -0.4 12.5 -11.7 -16.3 15.5 -5.7 5.7 -6.5 -15.910.9 -28.4 -16.7 15.4 12.5 -11.7 -16.3 15.5 -1.6 -16.7 -0.4 -0.1
= +
Datos Medias Residuos
= +
••− yyij ••• − yyi •− iij yy
4.230=••y
40Análisis de la varianza
Variabilidades: ejemplo
204.2847
311.4798)(
2315.7645)(
libertad de GradosadesVariabilid
1 1
2
1
2
1 1
2
===
==−=
==−=
∑ ∑
∑
∑ ∑
= =
=•••
= =••
n-KeVNE
K-yynVE
n-yyVT
K
i
n
jij
K
iii
K
i
n
jij
i
i
20323
4.28471.47985.7645
+=+=
41Análisis de la varianza
Interpretación gráfica de la descomposición
•− iij yy••• − yyi
•1y
•2y
•3y
•4y
••y ••− yy ij
42Análisis de la varianza
Distribución de VE
21
22
2
22
1
1
222
2
22
1
1
2
21
22
///
///
),(
llamaremos que Si
),(),(
−•••••••••
•••
•
•
→
−++
−+
−
→
−++
−+
−
→
===
→⇒→
KK
K
KK
K
ii
K
iiiiij
n
yy
n
yy
n
yy
n
y
n
y
n
y
nNy
nNyNy
χσσσ
χσ
µσ
µσ
µ
σµ
µµµµ
σµσµ
L
L
L
µi
σ
43Análisis de la varianza
Distribución de VNE
221
21
21
2
2
2
222
2
211
2
2
2222
211
1
2
1
222
1
211
1 1
2
2
212
21
2
22
21
ˆ)1(ˆ)1(ˆ)1(ˆ)(
ˆ)1(ˆ)1(ˆ)1(
)()()()(
ˆ
ˆ)1(1
)(
ˆ),(
21
Knnnn
KKR
KK
n
jKKj
n
jj
n
jj
K
i
n
jiij
R
nii
i
n
jiij
iiij
K
i
i
i
snsnsnsKn
Knsnsnsn
Kn
yyyyyy
Kn
yy
s
snn
yy
sNy
K
−−−−
=•
=•
=•
= =•
−=
•
=+++=
−++−+−=−
−−++−+−=
−
−++−+−=
−
−=
→−
→−
−=⇒→
∑∑∑∑ ∑
∑
χχχχσσσσ
χσ
σµ
L
L
L
L
44Análisis de la varianza
Contraste (Análisis de la Varianza)
00
00
,10
212
1
2
22
2
rechaza Se
rechaza se No
2ˆ)1(
1
2)(
)( :cierto es Ho Siˆ)(
HFF
HFF
F
RsK
K
iyiyin
F
yynsKn
KnK
K
K
iii
KnR
⇒>⇒≤
→−
∑=
••−•=
→−
•→−
•
−−
−=
•••
−
∑
α
α
χσ
χσ
diferente es una menos Al:
:
1
210
H
H Kµµµ === L
45Análisis de la varianza
Tabla de Análisis de la Varianza
1)(
)(
ˆ)1(
)()1/()(1)(
2
2
2
222
Total
Residual
osTratamient
FVarianzasLibertadCuadradosFuentesdeGradosde Suma
2ˆ
−−
−−
−
−−−−−
∑∑
∑∑
∑∑∑
••
•
•••••••••
nyy
Knyy
sK
yynKyynKyyn
ij
iij
R
iiiiii
Rs
46Análisis de la varianza
Tabla de Análisis de la Varianza
235.7645Total
4.142204.2847Residual2.113.159931.4798osTratamient
FVarianzasLibertadCuadradosFuentes
deGradosde Suma
47Análisis de la varianza
tα/2-tα/2
α/2
tn-K
R.R. R.R
R. Acept. H0
1-αα/2
Intervalos de confianza para las medias
inRs
tiyi
Kn
i
R
ii
i
ii
iiiiij
t
n
s
y
N
n
y
nNyNy
ˆ2/
ˆ
)1,0(
),(),(2
2
αµ
µ
σµ
σµσµ
±•∈
−•
•
•
→−
→−
→⇒→
48Análisis de la varianza
Intervalos de confianza
Semilla Media L. Inferior L. SuperiorA 242.9 235.7 250.1B 218.7 211.4 225.8C 214.1 206.9 221.3D 245.9 238.7 253.1
49Análisis de la varianza
Intervalos de confianza (95%)
Semilla
Ren
dim
ient
o
A B C D200
210
220
230
240
250
260
50Análisis de la varianza
Diferencia de medias:
),(1
2
11
1
12
11
1
nNy
y
y
y
n
σµ→
•M),(
2
2
22
2
22
21
2
nNy
y
y
y
n
σµ→
•M
σ
µ1 µ2
σ
Kn
R
t
nns
yyN
nn
yynn
Nyy
−••
••
••
→+
−−−⇒
→+
−−−
+−→−
21
2121
21
2121
2
2
1
2
2121
11ˆ
)()()1,0(
11
)()(
),(
µµ
σ
µµ
σσµµ
•• − 21 yy
51Análisis de la varianza
tα/2-tα/2
α/2
tn-K
R.R. R.R
R. Acept. H0
1-αα/2
Contraste multiples
ji
ji
H
H
µµ
µµ
≠
=
:
:
1
0
02/0
02/0
rechaza e
rechaza se No
HStt
Htt
⇒>
⇒≤
α
α
Kn
jiR
jiij t
nns
yyt −
•• →+
−=
11ˆ
Diagnosis del modelo
Estadística-2002
53Análisis de la varianza
µ1
σ
µ2
σ
µK
σ...
Modelo
11
12
11
ny
y
y
M
22
22
21
ny
y
y
M
KKn
K
K
y
y
y
M2
1
...
54Análisis de la varianza
Hipótesis del modelo
Normalidadyij ⇒ N(µi,σ2)
HomocedasticidadVar [yij] = σ2
IndependenciaCov [yij, ykl] = 0
55Análisis de la varianza
σ
Residuos: Normales y homocedásticos
),0( 2σ
µ
µ
Nu
yu
uy
ij
iijij
ijiij
→
−=
+=
A B C D-13,8 14,8 -3,0 24,510,8 14,4 9,0 2,7-1,6 0,6 3,4 -15,911,8 -18,7 -2,3 4,8-5,7 5,7 -6,5 -15,9-1,6 -16,7 -0,4 -0,10,0 0,0 0,0 0,0
Residuos
0
•−= iijij yye
56Análisis de la varianza
Comprobación de la normalidad
Los residuos deben de tener distribución normal. Las observaciones originales también, pero cada grupo con media diferente, por ello es preciso estimar el modelo para descontar a cada observación su media y obtener valores con la misma distribución.
Herramientas de comprobación:Histograma de residuos
Gráfico de probabilidad normal (Q-Q plot)
Contrastes formales (Kolmogorov-Smirnov)
57Análisis de la varianza
Gráfico probabilista normal
Es un gráfico X-Y de los residuos frente a los percentiles de la distribución normal.
La idea básica es que cuando los residuos tienen distribución normal, los puntos deben formar aproximadamente una línea recta
Pasos:Ordenar los residuos de menor a mayor.
Calcular los percentiles de la distribución normal
Representar
nisn
iY Ri ,...,2,1,ˆ)
5.0(1 =×−
Φ= −
)()2()1( neee ≤≤≤ L
ii Ye ,)(
58Análisis de la varianza
Gráfico prob. Normal (ejemplo)
Q-Q plot
-30,0
-20,0
-10,0
0,0
10,0
20,0
30,0
-30,0 -20,0 -10,0 0,0 10,0 20,0 30,0
Residuos ordenados
Perc
entil
es
Orden Resid. Probab. Percen. Percen.i eij (i-0.5)/n N(0,1) N(0, )1 -18,7 0,021 -2,04 -24,302 -16,7 0,063 -1,53 -18,303 -15,9 0,104 -1,26 -15,014 -15,9 0,146 -1,05 -12,585 -13,8 0,188 -0,89 -10,586 -6,5 0,229 -0,74 -8,857 -5,7 0,271 -0,61 -7,288 -3,0 0,313 -0,49 -5,839 -2,3 0,354 -0,37 -4,4610 -1,6 0,396 -0,26 -3,1511 -1,6 0,438 -0,16 -1,8812 -0,4 0,479 -0,05 -0,6213 -0,1 0,521 0,05 0,6214 0,6 0,563 0,16 1,8815 2,7 0,604 0,26 3,1516 3,4 0,646 0,37 4,4617 4,8 0,688 0,49 5,8318 5,7 0,729 0,61 7,2819 9,0 0,771 0,74 8,8520 10,8 0,813 0,89 10,5821 11,8 0,854 1,05 12,5822 14,4 0,896 1,26 15,0123 14,8 0,938 1,53 18,3024 24,5 0,979 2,04 24,30
σ
59Análisis de la varianza
Gráfico probabilista normal
Residuos
Pro
babi
lida
d
-30 -20 -10 0 10 20 300.1
1
5
20
50
80
95
99
99.9
60Análisis de la varianza
Ejemplos
-3 -1 1 3 50,1
1
520
50
80
95
9999,9
-2,6 -1,6 -0,6 0,4 1,4 2,4 3,40,1
1
520
50
80
95
9999,9
0 3 6 9 12 150,1
1
520
50
80
95
9999,9
0 0,4 0,8 1,2 1,6 20,1
1
520
50
80
95
9999,9
Normal No normal
No normal No normal
61Análisis de la varianza
Comprobación de la homocedasticidad
En el proceso de estimación se ha supuesto que los distintos tratamientos tienen la misma varianza
HerramientasGráficos de residuos:
Frente a valores previstos
Frente a tratamientos (o factor,etc.)
Contrastes formales:
Bartlett, Cochran, Hartley, Levene
62Análisis de la varianza
Residuos - Valores previstos
En este modelo los valores previstos corresponden a la media del tratamiento
Los puntos deben aparecer dispuestos al azar en una banda horizontal alrededor del eje horizontal.
Heterocedasticidad: a veces la dispersión aumenta conforme la media crece.
resi
duos
Valores previstos
-30
-20
-10
0
10
20
30
0 5 10 15
resi
duos
valores previstos
-30
-20
-10
0
10
20
30
210 220 230 240 250
63Análisis de la varianza
Residuos por tratamientos
A B C D-25
-15
-5
5
15
25
Res
iduo
s
Semilla
En cada grupo los residuos aparecen esparcidos con dispersión similar y media cero.
máx
.
mín
.
64Análisis de la varianza
Residuos por tratamientos
A B C D-25
-15
-5
5
15
25
Res
iduo
s
Semilla
En cada grupo los residuos aparecen esparcidos con dispersión similar y media cero.
máx
.
mín
.
3mín
máx<
65Análisis de la varianza
Contrastes formales
µ1
σ1
µ2
σ2
µK
σK...
distinta es Alguna :
:
1
222
210
H
H Kσσσ === L
66Análisis de la varianza
Contraste de Bartlettn1=n2=···=nK=m
1
)(ˆ
2112
1
1
12
11
−
−=
∑ •
m
yys
y
y
y
j
m
M 1
)(ˆ
2222
2
2
22
21
2
−
−=
∑ •
m
yys
y
y
y
j
n
M
µ1
σ1
µ2
σ2
µK
σK...
1
)(ˆ
222
1
−
−=
∑ •
m
yys
y
y
y
KKjK
Km
K
K
M...
KKG
KR
ssss
K
ssss
222
21
2
222
212
ˆˆˆˆ
ˆˆˆˆ
×××=
+++=
L
L2
12
2
ˆ
ˆlog
1 −→
+−
KG
R
s
s
c
Kn χSi Ho cierto )(3
1
Kn
Kc
−+
=
67Análisis de la varianza
Contraste de Bartlett (general)
Kn
snsnsns KK
R −−++−+−
=22
222112 ˆ)1(ˆ)1(ˆ)1(
ˆL
212
2
ˆ
ˆlog
1 −→
+−
KG
R
s
s
c
Kn χSi Ho cierto
−−
−−= ∑
=
K
i i KnnKc
1
1
1
1
)1(3
1
( ) ( ) ( )Kn nK
nnG
Kssss − −−−×××=
12122
121
2 ˆˆˆˆ 21L
68Análisis de la varianza
Contraste de Bartlett: ejemplo
A B C D229,1 233,4 211,1 270,4253,7 233,0 223,1 248,6241,3 219,2 217,5 230,0254,7 200,0 211,8 250,7237,2 224,3 207,6 230,0241,3 202,0 213,7 245,8
Medias 242,9 218,7 214,1 245,9
Varianzas 96,8 216,2 29,9 227,2
Datos
1.1092.2279.292.2168.96ˆ
4.1424
2.2279.292.2168.96ˆ
42
2
=×××=
=+++
=
G
R
s
s
91.41.109
4.142log
)60/5(1
20
ˆ
ˆlog
1 2
220
=+
=
+−
=G
R
s
s
c
Knχ
0 4 8 12 160
5 177.0=− valorp
0.010.05
23χ
resi
duos
Valores previstos
-0,43
-0,23
-0,03
0,17
0,37
0,57
0 0,3 0,6 0,9 1,2 1 2 3-0,43
-0,23
-0,03
0,17
0,37
0,57
resi
duos
Tratamientos
-0,33 -0,13 0,07 0,27 0,47
residuos
0,1
15
20
50
80
9599
99,9
prob
abil
idad
Diagnosis: Tres gráficos básicos
Normalidad
Homocedasticidad
70Análisis de la varianza
Gráfico probabilista normal
-0,33 -0,13 0,07 0,27 0,47
residuos
0,1
15
20
50
80
9599
99,9
prob
abil
idad
71Análisis de la varianza
Transformaciones para estabilizar la varianza
[ ] ][Var)('][Var
Var)2
1)
aprox.son z de sy varianza media La
))((''2
1))((')(
E[y]en )( paraTaylor de Desarrollo
2
2
yhz
(y)h''(µ h(µE[z]
yhyhhz
yhz
µ
µµµµµ
µ
≈
+≈
−+−+≈
==
)(yhz =
72Análisis de la varianza
Ejemplo
][Var][Var
E[z]
son de sy varianza media La
2 ybz
b a
z
=
+= µ
byaz +=
bz de depende ]Var[ La
Observación: Esta transformación no altera las características de y: si y no tiene varianza constante, z tampoco.
77Análisis de la varianza
Ejemplo
][Var1
][Var
Var2
1)log
aprox.son desy varianzamedia La
2
2
yz
(y) (µ E[z]
z
µ
µ
≈
−≈
)log(yz =
kzkµy ≈⇒≈ ]Var[ ]Var[ Si 2
yij heterocedásticas
z ij homocedásticas
)( ijij yhz =
79Análisis de la varianza
Transformaciones Box-Cox
-1,5
-1
-0,5
0
0,5
1
1,5
0log
1
==
−=
psiyz
p
yz
ijij
pij
ij
1ijy
ijz
p = 1
p < 1
p > 1
80Análisis de la varianza
Búsqueda de la transformación adecuada
La dispersión aumenta al aumentar la media
p < 1
La dispersión disminuye al aumentar la media
p > 1
resi
duos
Valores previstos
-0,43
-0,23
-0,03
0,17
0,37
0,57
0 0,3 0,6 0,9 1,2
resi
duos
valores previstos
-1,4
-0,9
-0,4
0,1
0,6
1,1
1,6
0 4 8 12 16
81Análisis de la varianza
Elección de la transformación
Empezar con p=1 (datos sin transformar) y decidir a partir de los gráficos si p>1 o p<1.
Parar cuando los gráficos estén ok
pijij yz =
=⇒−=
=⇒−=
=⇒==⇒=
→<
MMM
2
11
12/1
log0
2/1
1
ijij
ijij
ijij
ijij
yzp
yzp
yzp
yzp
p
82Análisis de la varianza
Independencia
Es la hipótesis fundamental y con diferencia la más importante de las tres, además es la más difícil de comprobar.La falta de independencia suele ir ligada a factores no controlados por el experimentador y que influyen en los resultados introduciendo errores sistemáticos. La forma más recomendable de evitar errores sistemáticos consiste en aleatorizar.
83Análisis de la varianza
Aleatorización
La aleatorización evita que se produzcan errores que sistemáticamente aumenten o disminuyan un conjunto de medidas por causas no reconocibles: al aleatorizar se reparten estos errores por igual entre los diferentes tratamientos y se convierten en errores aleatorios, previstos en el modelo.
84Análisis de la varianza
¿Cómo aleatorizar?
Asignar las unidades experimentales al azar a los distintos tratamientos.
Aleatorizar el orden de ejecución de los experimentos.
Aleatorizar respecto a cualquier otra variable que implique diferenciar a los tratamientos.
“La aleatorización es una precaución contra distorsiones que pueden ocurrir o no ocurrir, y que puedieran ser serias o no si llegaran a ocurrir”
Capítulo 4. Análisis de la varianza
4.1 Se estudian los Km recorridos antes del desgaste de dos tipos de neumáticos con los resultadossiguientes:
Tipo ni xi(Km) bsi(Km)A 121 27465 2500B 121 27572 3000
(a) Calcular, con α = 0.05,un intervalo de confianza paraσ21σ22.
(b) Un intervalo de confianza para µ1 − µ2.
4.2 Se dispone de rendimientos de dos máquinas. Los resultados de la máquina A son 137.5; 140.7;106.9; 175.1; 177.3; 120.4; 77.9 y 104.2, mientras que los reultados para la B son: 103.3; 121.7; 98.4;161.5; 167.8 y 67.3. ¿Son las máquinas iguales? (Suponer que los rendimientos de ambas máquinassiguen distribuciones normales).
4.3 Un fabricante de automóviles debe elegir entre un determinado tipo de piezas de acero suministradaspor un proveedor A y otras suministradas por otro proveedor B. Para proceder a la elección se haanalizado la resistencia a la tracción de las piezas suministradas por ambos proveedores, tomandouna muestra de tamaño 10 de las piezas del primero, y otra de tamaño 12 del segundo. La resistenciamedia de la muestra de A es de 54000 unidades y la de la muestra de B es de 49000 unidades, siendolas desviaciones típicas muestrales corregidas bsA = 2100 y bsB = 1900. Las resistencias de las piezasde ambos proveedores se distribuyen normalmente. Las piezas del proveedor B son más baratasque las del proveedor A, por lo que estas últimas sólo son rentables si tienen una resistencia mediaal menos 2000 unidades mayor que las de B, y la misma variabilidad.
(a) ¿A qué proveedor habría que comprar las piezas a la vista de los resultados muestrales?(b) Obtener un intervalo de confianza del 90\% para la diferencia de medias de la resistencia
de las piezas de los proveedores A y B.
4.4 En una fábrica de automóviles se utiliza una misma planta para el ensamblaje de tres modelosdistintos (A,B y C). Para determinar si los modelos reciben el mismo tratamiento, se ha realizadoun control de calidad a una muestra tomada para cada modelo. El número de defectos encontradospara cinco vehículos del modelo A son 5, 4, 6, 6 y 7; para seis vehículos del modelo B son 7, 8, 6, 7, 6y 5;y para ocho vehículos del modelo C: 9, 7, 8, 9, 10, 11, 10 y 10. Contrastar si existen diferenciasen el tratamiento que se da a los distintos modelos.
4.5 Cinco tipos (A, B, C, D y E) de material sintético se han sometido a un ensayo de desgaste. Paracada tipo de material la prueba se repitio 6 veces. El desgaste medio y la desviación típica corregidaen cada caso es la siguiente:
A B C D Emedia xi 14.1 16.3 13.5 14.8 15.3d. típica si 1.3 1.2 1.4 1.2 1.5
1
(a) Contrastar (α = 0.05) la hipótesisH0 : µA = µB = µC = µD = µEfrente a la hipótesis alternativa,H1 : Alguna media es distinta a las demás.Indicar con nivel de confianza 0.95 el material con desgaste menor y qué materiales tienendesgaste medio, distinto.
(b) Obtener un intervalo de confianza con α = 0.01 para la varianza del error experimental.
4.6 Se mide la temperatura de una mezcla con cuatro termómetros, obteniéndose los datos siguientes:
Termómetro1 63 63 62 65 662 64 64 63 64 653 58 59 59 684 61 61 62 60 63
(a) ¿Son los cuatro termómetros análogos?(b) Analizar si se verifican las hipótesis básicas del modelo ADEVA mediante los residuos.(c) Elimine el tercer termómetro y calcule la tabla ADEVA para comparar los otros tres
termómetros. ¿Qué conclusiones pueden extraerse?
4.7 Se desea comprobar el efecto de un tratamiento térmico sobre la resistencia de un nuevo material.Se han tomado 15 probetas y se han asignado al azar a los tres tratamientos T1, T2 y T3 obteniendocomo medida de resistencia superficial los valores siguientes:
T1 T2 T32.65 4.31 4.812.67 3.96 5.322.46 4.64 4.931.90 4.74 5.492.62 4.00 4.45
(a) Contrastar mediante el test de análisis de la varianza si existen diferencias significativasentre los tratamientos térmicos (α = 0.01).
(b) La temperatura del tratamiento 2 es la media de las temperaturas de los otros dostratamientos. Si la relación entre la resistencia y la temperatura es lineal, es de esperarque la media del tratamiento 2 verifique : H0 : µ2 =
12(µ1 + µ3). Hacer el contraste
bilateral de esta hipótesis con α = 0.05. (Nota.- Usar la distribución de y2 − (y1 + y3)/2,donde yi es la media de los datos correspondientes al tratamiento Ti).
4.8 En un modelo de análisis de la varianza se ha observado que la desviación típica (si) y la media(yi) de las observaciones de cada tratamiento están relacionadas linealmente, si = kyi, donde kes una constante. ¿ Cuál de las siguientes transformaciones es la más adecuada para corregir laheterocedasticidad ? z = log y, z = y2 o z = ky
2
5. Diseño de experimentos
Estadística 2004-2005
Bloques Aleatorizados
3Diseño Experimentos
Ejemplo de introducción
Se desea estudiar el efecto de la Fluorita en la reducción del coste energético en la fabricación de cemento. Se emplean 6 mezclas distintas de materias primas.
0% 1% 2% 3% 4%M 1 15.02 11.86 9.94 12.45 13.23
e 2 8.42 10.15 8.54 6.98 8.93
z 3 18.31 16.84 15.86 14.64 15.96
c 4 10.49 10.52 8.04 10.50 10.34
l 5 9.78 9.59 6.96 8.15 9.24
a 6 9.28 8.84 7.04 6.66 9.46
Fluorita
4Diseño Experimentos
Modelo
ijjiij uy +++= βαµ
µ : Media globalαi : Efecto del tratamiento i, i=1,...,Iβj : Efecto del bloque j, j=1,2,...,Juij : Componente aleatoria N(0,σ2)
IJJJ
I
I
yyyJ
yyy
yyy
I
L
MOMMM
L
L
L
21
22212
12111
2
1
21Tratamientos
Blo
ques •Normalidad
•Independencia
•Homocedasticidad
∑ = =Ii i1 0α
∑ = =Jj j1 0β
σ σ σ...11 βαµ ++ 12 βαµ ++ 1βαµ ++ I
σ σ σ...21 βαµ ++ 22 βαµ ++ 2βαµ ++ I
σ σ σ...Jβαµ ++ 1 Jβαµ ++ 2 JI βαµ ++
M M MO
Tratamientos1 2 I
1
2
J
...B
loqu
es
M
6Diseño Experimentos
Estimación del modelo
→
−→−→
→
1:
1:
1:
1:
:Parámetros
2j
i
σβαµ
J
I
n
y
yI
yy
J
y
y
I
i
J
jij
I
iij
j
J
jij
i
∑ ∑∑∑= =
••=
•=
• === 1 111
−−==
−=−=
=
∑∑•••
•••
••
)1)(1(ˆˆ
ˆˆ
ˆ
:sEstimadore2
22
JI
es
yy
yy
y
ijR
jj
ii
σ
βα
µ
ijjiij
ijjiij
ey
uy
+++=
+++=
βαµ
βαµˆˆˆ •••• +−−=
−−−=
yyyy
ye
jiij
jiijij βαµ ˆˆˆ
7Diseño Experimentos
Estimación
•••••••••
•••••
••••
••••
••••
−−−
−
−−
yyyyyy
yyyy
yyyyyyJ
yyyyyy
yyyyyy
I
Ii
I
JJIJJJ
I
I
j
L
L
L
MMMOMMM
L
L
L
21
21
21
2222212
1112111
ˆ
2
1
ˆ21
α
β
8Diseño Experimentos
Estimación (ejemplo)
0% 1% 2% 3% 4%M 1 15.02 11.86 9.94 12.45 13.23 12.50 1.77
e 2 8.42 10.15 8.54 6.98 8.93 8.60 -2.13
z 3 18.31 16.84 15.86 14.64 15.96 16.32 5.59
c 4 10.49 10.52 8.04 10.50 10.34 9.98 -0.76
l 5 9.78 9.59 6.96 8.15 9.24 8.74 -1.99
a 6 9.28 8.84 7.04 6.66 9.46 8.26 -2.4811.88 11.30 9.40 9.90 11.19 10.731.15 0.57 -1.34 -0.84 0.46
Fluorita
αi
βj
9Diseño Experimentos
Residuos: Varianza residual
0% 1% 2% 3% 4%
M 1 1.37 -1.21 -1.22 0.79 0.27
e 2 -1.33 0.98 1.27 -0.79 -0.13
z 3 0.84 -0.05 0.88 -0.84 -0.82
c 4 -0.64 -0.02 -0.60 1.36 -0.10
l 5 -0.11 0.28 -0.45 0.24 0.04
a 6 -0.13 0.02 0.12 -0.76 0.74
Fluorita
•••• +−−=−−−= yyyyye jiijjiijij βαµ ˆˆˆ
88.020
51.17
)1)(1(ˆ
22 ==
−−=
∑∑JI
es ij
R
10Diseño Experimentos
Contraste de Hipótesis
Si la Fluorita no influye, los I tratamientos son iguales a efectos de coste, entonces
0 de distinto es Algún :
0:
i1
210
αααα
H
H I ==== L
Iααα === L21 ∑ = =Ii i1 0α
11Diseño Experimentos
Análisis de la varianza
∑ ∑ ∑ ∑∑ ∑ ∑ ∑= = = =
•••= = = =
•••••
••••••••••••
••••••••••••
+−+−=−
+−−+−+−=−
+−−+−+−+=
+++=⇒+++=
I
i
J
j
I
i
J
jijj
I
i
I
j
I
i
J
jiij
jiijjiij
jiijjiij
ijjiijijjiij
eyyyyyy
yyyyyyyyyy
yyyyyyyyyy
eyuy
1 1 1 1
22
1 1 1 1
22 )()()(
)()()(
)()()(
ˆˆˆ βαµβαµ
∑ ∑ ∑∑ ∑ ∑= = =
•••= = =
••••• +−+−=−J
j
I
i
J
jijj
I
i
I
j
I
iiij eyyIyyJyy
1 1 1
22
1 1 1
22 )()()(
12Diseño Experimentos
Variabilidades
VNEVEVEVT
eVNE
yyIBVE
yyJTVE
yyVT
I
i
J
jij
J
jj
I
ii
I
i
I
jij
++=
=
−=
−=
−=
∑ ∑
∑
∑
∑ ∑
= =
=•••
=•••
= =••
B)(T)()()(
)()(
)(
1 1
2
1
2
1
2
1 1
2
)1)(1()1()1()1( −−+−+−=− JIJIn
13Diseño Experimentos
Contraste sobre tratamientos
0 de distinto es Algún :
0:
i1
210
αααα
H
H I ==== L
222 ]ˆ[)1)(1(
ˆ σ=→−−
= RR sEJI
VNEs
222 ]ˆ[1
)osTratamient(ˆ cierto, es Ho Si σ=→
−= TT sE
I
VEs
)1)(1(;121
2
2
2
ˆ
1)(
ˆ
ˆ−−−
=•••
→−−
==∑
JIIR
I
ii
R
TT F
s
IyyJ
s
sF
Ho rechaza Se Si ⇒> αFFT
14Diseño Experimentos
Explicación del contraste
),(,...,,
][,
),(0 cierto es Ho Si
2
21
121
2
JNyyy
J
JyE
J
yyyy
Ny
I
Jj j
iiJii
i
jiji
σµ
µβµ
σβµα
→
=+
=+++
=
+→⇒=
•••
=••
∑L
21
2
1
2
221
11ˆ
σ=
−⇒
−=⇒
+++=
∑∑=
•••=
••••••
•• I
)y -y(JE
I
)y -y(Js
I
yyyy
I
ii
I
ii
TIL
.ˆ quemayor será ˆ falso, es Ho Cuando
parecidas.serán ˆy ˆ cierto, es Ho Cuando22
22
RT
RT
ss
ss
⊕
⊕
15Diseño Experimentos
Contraste de bloques
0 de distinto es Algún :
0:
j1
210
ββββ
H
H J ==== L
222 ]ˆ[1
)Bloques(ˆ cierto, es Ho Si σ=→
−= BB sE
J
VEs
)1)(1(;121
2
2
2
ˆ
1)(
ˆ
ˆ−−−
=•••
→−−
==∑
JIJR
J
jj
R
BB F
s
JyyI
s
sF
Ho rechaza Se Si ⇒> αFFB
16Diseño Experimentos
Tabla de análisis de la varianza
1-nTotal
Residual
Bloque
oTratamient
valorpFVarianzaLibertad.CuadradosadVariabilid
de Gradosde SumaFuentes
∑∑
∑∑
∑
∑
••
•••
•••
−
−−
−−
−−
−
2
22
2
2
22
2
2
22
)(
ˆ)1)(1(
ˆˆ
ˆ1)(
ˆˆ
ˆ1)(
yy
sJIe
pss
sJyyI
pss
sIyyJ
ij
Rij
BR
B
Bj
TR
T
Ti
17Diseño Experimentos
Tabla de análisis de la varianza
29Total
Residual
BloqueoTratamient
valorpFVarianzaLibertad.Cuadrados.adVariabilid
Gradosde SumaFuentes
33.291
88.02051.17
0000.6.5655.49577.247
0008.4.751.6405.26
−
18Diseño Experimentos
Sin bloques
2933.291
61.102528.265
8887.61.051.6405.26
Total
Residual
oTratamient
valorpFVarianzaLibertad.Cuadrados.adVariabilid
Gradosde SumaFuentes−
19Diseño Experimentos
Contraste multiples: tratamientos
ji
ji
H
H
αα
αα
≠
=
:
:
1
0
)1)(1(2ˆ
−−•• →
−JI
R
ji t
Js
yy
tα/2-tα/2
α/2
t(I-1)(J-1)
R.R. R.R
R. Acept. H0
1-αα/2
),(ˆˆ
ˆˆˆ
ˆ
22
JJN
yyyy
yy
jiji
jijijj
ii
σσαααα
αααα
+−→−
−=−
−=−=
•••••
•••
02/
2ˆ HS
LSD
Jstyy Rji rechaza e⇒>− ••43421
α
20Diseño Experimentos
Contraste multiples: bloques
ji
ji
H
H
ββ
ββ
≠
=
:
:
1
0
02/
2ˆ HS
LSD
Istyy Rji rechaza e⇒>− ••43421
α)1)(1(2ˆ
−−•• →
−JI
R
ji t
Is
yy
tα/2-tα/2
α/2
t(I-1)(J-1)
R.R. R.R
R. Acept. H0
1-αα/2
),(ˆˆ
ˆˆˆ
ˆ
22
IIN
yyyy
yy
jiji
jijijj
ii
σσββββ
ββββ
+−→−
−=−
−=−=
•••••
•••
21Diseño Experimentos
Comparación de medias
Fluorita
Mezcla
13.16
293.0085.2
2ˆ2/
=
××=
=J
stLSD Rα
24.15
293.0085.2
2ˆ2/
=
××=
=I
stLSD Rα
1 2 3 4 5 61 0.00 3.90 -3.82 2.52 3.76 4.242 0 6.60 5.60 4.60 3.603 0 6.34 7.58 8.074 0 1.23 1.72
5 0 0.496 0
LSD=1.24
0% 1% 2% 3% 4%0% 0 0.58 2.49 1.99 0.691% 0 1.90 1.40 -1.302% 0 -0.50 -1.803% 0 -1.304% 0
LSD = 1.13
22Diseño Experimentos
Intervalos de confianza (ejemplo)
Fluorita Medias L.inf. L.Sup.0% 11.88 11.09 12.681% 11.30 10.50 12.102% 9.40 8.60 10.193% 9.90 9.10 10.694% 11.19 10.40 11.99
J
sty R
iiˆ
2/ααµ ±∈+ •
23Diseño Experimentos
Intervalos para las medias 95%
0 1 2 3 4
Fluorita
8.8
9.8
10.8
11.8
12.8C
oste
Diagnosis:Homocedasticidad
Fluorita0 1 2 3 4
-2
-1.5
-1
-0.50
0.5
1
1.5
2
Mezcla0 1 2 3 4 5 6
-2
-1.5
-1
-0.5
0
0.5
1
1.5
2
resi
duos
Valores previstos
-1.6
-1.2
-0.8
-0.4
0
0.4
0.8
1.2
1.6
5 10 15 20
Gráfico de residuos
25Diseño Experimentos
Diagnosis: normalidad
residuos
prob
abil
idad
-1.4 -0.9 -0.4 0.1 0.6 1.1 1.60.1
1
5
20
50
80
95
99
99.9
Diseños factoriales
27Diseño Experimentos
Ejemplo
A B C D0.31 0.82 0.43 0.450.45 1.10 0.45 0.71
V 0.46 0.88 0.63 0.66E 0.43 0.72 0.72 0.62N 0.36 0.92 0.44 0.56E 0.29 0.61 0.35 1.02N 0.40 0.49 0.31 0.71O 0.23 1.24 0.40 0.38S 0.22 0.30 0.23 0.30
0.21 0.37 0.25 0.360.18 0.38 0.24 0.310.23 0.29 0.22 0.33
ANTÍDOTO
I
II
III
Se analiza el efecto de tres venenos y cuatro antídotos
en el tiempo de supervivencia de unas ratas.
28Diseño Experimentos
Modelo
ijkijjiijk uy ++++= αββαµ
IJm
IJ
IJ
Jm
J
J
Jm
J
J
mI
I
I
mm
mI
I
I
mm
y
y
y
y
y
y
y
y
y
J
y
y
y
y
y
y
y
y
yy
y
y
y
y
y
y
y
yI
ML
MM
MOMMM
ML
MM
ML
MM
L
2
1
2
22
12
1
21
11
2
22
21
22
222
221
12
122
121
1
12
11
21
212
211
11
112
111
2
1
21Factor 1
Fac
tor
2
•Normalidad
•Independencia
•Homocedasticidad
I×J tratamientos
m replicaciones
n = m×I×J
σ σ σ...1111 αββαµ +++ 2112 αββαµ +++
11 II αββαµ +++
σ σ σ...1221 αββαµ +++ 2222 αββαµ +++ 22 II αββαµ +++
σ σ σ...JJ 11 αββαµ +++ JJ 22 αββαµ +++ IJJI αββαµ +++
M M MO
Factor 11 2 I
1
2
J
...F
acto
r 2
M
30Diseño Experimentos
Modelo
µ : Media global
αi : Efecto del tratamiento i, i=1,...,I
βj : Efecto del bloque j, j=1,2,...,J
αβij: Interacción de niveles ij
uij : Componente aleatoria N(0,σ2)
∑ = =Ii i1 0α ∑ = =J
j j1 0β
ijkijjiijk uy ++++= αββαµjI
i ij ∀=∑ = ,01αβ
iJj ij ∀=∑ = ,01αβ
31Diseño Experimentos
Estimación del modelo
1:
)1)(1(:
1:
1:
1:
→−−→
−→−→
→
2
j
i
σαββαµ
JI
J
I
ij
n
yy
mI
yy
mJ
yy
m
yy
I
i
J
j
m
kijk
I
i
m
kijk
j
J
j
m
kijk
i
m
kijk
ij
∑ ∑ ∑∑ ∑∑ ∑∑= = =
•••= =
••= =
••=
• ==== 1 1 11 11 11
)1(ˆˆ
ˆˆ
ˆ
222
−==
+−−=∧
−=−=
=
∑∑••••••••
•••••
•••••
•••
mIJ
es
yyyy
yy
yy
y
ijR
jiijij
jj
ii
σ
αβ
βαµ
32Diseño Experimentos
Estimación
A B C D0.31 0.82 0.43 0.45
V 0.45 1.10 0.45 0.71 0.46 0.88 0.63 0.66E 0.43 0.72 0.72 0.62 0.41 0.88 0.56 0.61
N 0.36 0.92 0.44 0.56 0.29 0.61 0.35 1.02E 0.40 0.49 0.31 0.71 0.23 1.24 0.40 0.38N 0.32 0.82 0.38 0.67
0.22 0.30 0.23 0.30O 0.21 0.37 0.25 0.36
0.18 0.38 0.24 0.31S 0.23 0.29 0.22 0.33
0.21 0.34 0.24 0.33
ANTÍDOTO
I
II
III
33Diseño Experimentos
Estimación
A B C D Medias0.31 0.82 0.43 0.45
0.45 1.10 0.45 0.71V 0.46 0.88 0.63 0.66 0.43 0.72 0.72 0.62
E Medias 0.41 0.88 0.56 0.61
-0.038 0.067 0.032 -0.061N 0.36 0.92 0.44 0.56 0.29 0.61 0.35 1.02E 0.40 0.49 0.31 0.71 0.23 1.24 0.40 0.38
N Medias 0.32 0.82 0.38 0.67
-0.060 0.073 -0.080 0.068O 0.22 0.30 0.23 0.30 0.21 0.37 0.25 0.36S 0.18 0.38 0.24 0.31
0.23 0.29 0.22 0.33
Medias 0.21 0.34 0.24 0.330.098 -0.139 0.048 -0.007
0.314 0.677 0.389 0.534
-0.164 0.198 -0.089 0.056
ANTÍDOTO
I 0.615 0.136
0.479Medias
II 0.544 0.066
III 0.276 -0.202
iα
jβ
ijαβ
ijαβ
ijαβ
34Diseño Experimentos
Residuos
A B C D-0.103 -0.060 -0.128 -0.160
V 0.038 0.220 -0.108 0.100 0.048 0.000 0.073 0.050E 0.018 -0.160 0.163 0.010 0.00 0.00 0.00 0.00
N 0.040 0.105 0.065 -0.108 -0.030 -0.205 -0.025 0.353E 0.080 -0.325 -0.065 0.043 -0.090 0.425 0.025 -0.288N 0.00 0.00 0.00 0.00
0.010 -0.035 -0.005 -0.025O 0.000 0.035 0.015 0.035
-0.030 0.045 0.005 -0.015S 0.020 -0.045 -0.015 0.005
0.00 0.00 0.00 0.00
III
RESIDUOS
ANTÍDOTO
I
II
35Diseño Experimentos
Análisis de la varianza
∑ ∑ ∑∑ ∑ ∑
∑ ∑ ∑∑ ∑ ∑ ∑ ∑∑
∧
= = == = =••••••••
= = =••••
= = = = =••••
=•••
•••••••••••••••••••••
••••••••••••••••••••••
++−−+
+−+−=−
++−−+−+−=−
−++−−+−+−+=
++++=⇒++++=
I
i
J
j
m
kij
I
i
J
j
m
kjiij
I
i
J
j
m
kj
I
i
I
j
I
i
J
j
m
ki
m
kijk
ijkjiijjiijk
ijijkjiijjiijk
ijkijjiijkijkijjiijk
eyyyy
yyyyyy
eyyyyyyyyyy
yyyyyyyyyyyy
eyuy
1 1 1
2
1 1 1
2
1 1 1
2
1 1 1 1 1
2
1
2
)(
)()()(
)()()(
)()()()(
ˆˆˆ αββαµαββαµ
∑ ∑ ∑∑ ∑
∑∑ ∑ ∑∑
= = == =••••••••
=••••
= = =••••
=•••
++−−+
−+−=−
I
i
J
j
m
kij
I
i
J
jjiij
J
jj
I
i
I
j
I
ii
m
kijk
eyyyym
yymIyymJyy
1 1 1
2
1 1
2
1
2
1 1 1
2
1
2
)(
)()()(
36Diseño Experimentos
Variabilidades
∑ ∑ ∑
∑ ∑
∑
∑
∑ ∑ ∑
= = =•
= =••••••••
=•••••
=•••••
= = =•••
−=
+−−=×
−=
−=
−=
I
i
J
j
m
kijijk
I
i
J
jjiij
J
jj
I
ii
I
i
I
j
m
kijk
yyVNE
yyyymBAVE
yymIBVE
yymJAVE
yyVT
1 1 1
2
1 1
2
1
2
1
2
1 1 1
2
)(
)()(
)()(
)()(
)(
)1()1)(1()1()1()1(
)()()(
−+−−+−+−=−+×++=
mIJJIJIn
VNEBAVEBVEAVEVT
37Diseño Experimentos
Contraste efecto principal de factor A
0 de distinto es Algún :
0:
i1
210
αααα
H
H I ==== L
222 ]ˆ[)1(
ˆ σ=→−
= RR sEmIJ
VNEs
222 ]ˆ[1
)(ˆ σ=→
−= AA sE
I
AVEs cierto, es Ho Si
)1(;121
2
2
2
ˆ
1)(
ˆ
ˆ−−
=•••••
→−−
==∑
mIJIR
I
ii
R
AA F
s
IyymJ
s
sF
Horechaza Se Si ⇒> αFFA
38Diseño Experimentos
Contraste efecto principal de factor B
0 de distinto es Algún :
0:
j1
210
ββββ
H
H J ==== L
222 ]ˆ[1
)(ˆ σ=→
−= BB sE
J
BVEs cierto, es Ho Si
)1(;12
1
2
2
2
ˆ
1)(
ˆ
ˆ−−
=•••••
→−−
==∑
mIJJR
J
jj
R
BB F
s
JyymI
s
sF
Ho rechaza Se Si ⇒> αFFB
39Diseño Experimentos
Contraste interacción AxB
0 de distinto es Algún ijαβαβαβαβ
:
0:
1
12110
H
H IJ ==== L
222 ]ˆ[)1)(1(
)(ˆ σ=→
−−×
= ABAB sEJI
BAVEs cierto, es Ho Si
)1();1)(1(2
2
ˆ
ˆ−−−→= mIJJI
R
ABAB F
s
sF
44 344 21naninteraccio BA y
Ho rechaza Se Si ⇒> αFFAB
40Diseño Experimentos
Tabla de análisis de la varianza
1)(
ˆ)1(
ˆˆ
ˆ)1)(1()(
ˆˆ
ˆ1)(
ˆˆ
ˆ1)(
2
22
2
2
22
2
2
22
2
2
22
−−
−
−−+−−×
−−
−−
−
∑∑∑
∑∑∑
∑∑
∑
∑
•••
••••••••
••••
••••
nyy
smIJe
pss
sJIyyyym
pss
sJyymI
pss
sIyymJ
ijk
Rijk
ABR
AB
ABjiij
BR
B
Bj
TR
A
Ti
Total
Residual
BA
B
A
valorpFVarianzaLibertad.CuadradosadVariabilid
de Gradosde SumaFuentes
41Diseño Experimentos
Tabla de análisis de la varianza
47Total
36Residual
AntVen
Antídoto
Veneno
valorpFVarianzaLibertad.Cuadrados.adVariabilid
Gradosde SumaFuentes
005.3
022.0801.0
1123.87.1041.06250.0
0000.8.13307.03921.0
0000.2.23516.02033.1
×
−
42Diseño Experimentos
Contraste multiples: Factor A
ji
ji
H
H
αα
αα
≠
=
:
:
1
0
)1(2ˆ
−•••• →
−mIJ
R
ji t
mJs
yy
tα/2-tα/2
α/2
tIJ(m-1)
R.R. R.R
R. Acept. H0
1-αα/2
),(ˆˆ
ˆˆˆ
ˆ
22
mJmJN
yyyy
yy
jiji
jijijj
ii
σσαααα
αααα
+−→−
−=−
−=−=
•••••••••
•••••
HomJ
styy Rji
rechaza Se
2ˆ2/α>− ••••
43Diseño Experimentos
Contraste multiples: Factor B
ji
ji
H
H
ββ
ββ
≠
=
:
:
1
0
)1(2ˆ
−•••• →
−mIJ
R
ji t
mIs
yy
tα/2-tα/2
α/2
tIJ(m-1)
R.R. R.R
R. Acept. H0
1-αα/2
),(ˆˆ
ˆˆˆ
ˆ
22
mImIN
yyyy
yy
jiji
jijijj
ii
σσββββ
ββββ
+−→−
−=−
−=−=
•••••••••
•••••
HomI
styy Rji
rechazaSe
2ˆ2/α>− ••••
44Diseño Experimentos
Intervalos de confianza (interacción nula)
mJ
sty R
iiˆ
2/ααµ ±∈+ ••
mI
sty R
jiˆ
2/αβµ ±∈+ ••
45Diseño Experimentos
Intervalos de confianza
veneno
tiem
po
1 2 30.22
0.32
0.42
0.52
0.62
0.72
antidototi
empo
A B C D0.25
0.35
0.45
0.55
0.65
0.75
46Diseño Experimentos
Diagnosis: homocedasticidad
resi
duos
antidotoA B C D
-0.6
-0.3
0
0.3
0.6
veneno1 2 3
-0.6
-0.3
0
0.3
0.6
47Diseño Experimentos
Heterocedasticidadre
sidu
os
valores previstos
-0.6
-0.4
-0.2
0
0.2
0.4
0.6
0 0.2 0.4 0.6 0.8 1
48Diseño Experimentos
Normalidad
Residuos
prob
abil
idad
-0.5 -0.25 0 0.25 0.50.1
1
5
20
50
80
95
99
99.9
49Diseño Experimentos
Diagnosis: homocedasticidad datos transformados z=1/y
veneno1 2 3
-1.1
-0.7
-0.3
0.1
0.5
0.9
1.3
antidotoA B C D
-1.1
-0.7
-0.3
0.1
0.5
0.9
1.3re
sidu
os
50Diseño Experimentos
Datos transformados
resi
duos
valores previstos
-1.2
-0.8
-0.4
0
0.4
0.8
1.2
0 1 2 3 4 5 6
51Diseño Experimentos
Normalidad (datos transformado)
Residuos
prob
abil
idad
-1.2 -0.8 -0.4 0 0.4 0.8 1.20.1
1
5
20
50
80
95
99
99.9
52Diseño Experimentos
Tabla de análisis de la varianza datos transformados 1/y
47Total
36Residual
AntVen
Antídoto
Veneno
valorpFVarianzaLibertad.Cuadrados.adVariabilid
Gradosde SumaFuentes
50.65
24.068.8
3867.09.126.0657.1
0000.3.2880.6341.20
0000.6.724.17287.34
×
−
53Diseño Experimentos
Comparaciones múltiples intervalos de confianza
antidoto1/
tiem
po
1 2 3 41.6
2
2.4
2.8
3.2
3.6
4
veneno
1/ti
empo
1 2 31.6
2
2.4
2.8
3.2
3.6
4
54Diseño Experimentos
Diseño con tres factores
Factores A, B y C con NA, NB, Nc niveles.
Nº de Tratamientos T=NAxNBxNc
Efectos principales 3 A, B , C
Interacciones de orden dos 3 AxB, AxC, BxC
Interacción de orden tres 1. AxBxC
Factor A
A1 A2 A3 A4 A5 A6
B1
C1
B2
B3
B4
B5
C2C3
Fac
tor
B
Factor C
Tratamiento: Cada combinación de niveles de los factores
6 x 5 x 3 = 90
55Diseño Experimentos
K factores con N1, N2, ..., NK
niveles
libertad de grados
con k, orden de ninteracció 1K
K
...
libertad de grados
con 3, orden de nesinteraccio 3
K
libertad de
grados con 2, orden de nesinteraccio 2
K
uno cada libertad de grados con sprincipale efectosK
)(N))(N(N
))(N)(N(N
))(N(N
N
K
kji
ji
i
111
111
11
1
21 −−−=
•
−−−
•
−−
•
−•
L
56Diseño Experimentos
DatosFactor 1
Fac
tor
2
Factor 31 2 K...
IJKMMIJMIJ
IJKIJIJ
IJKIJIJ
JKMMJMJ
JKJJ
JKJJ
JKMMJMJ
JKJJ
JKJJ
KMIMIMI
KIII
KIII
KMMM
K
K
KMMM
K
K
KMIMIMI
KIII
KIII
KMMM
K
K
KMMM
K
K
yyy
yyy
yyy
K
yyy
yyy
yyy
K
yyy
yyy
yyy
K
yyy
yyy
yyy
K
yyy
yyy
yyy
K
yyy
yyy
yyy
Kyyy
yyy
yyy
K
yyy
yyy
yyy
yyy
yyy
yyy
L
MOMM
L
L
L
L
MOMM
L
L
L
MOMM
L
L
MOMMML
MOMM
L
L
L
L
MOMM
L
L
L
MOMM
L
L
L
MOMM
L
L
L
L
MOMM
L
L
L
MOMM
L
L
L
21
22212
12111
22212
22222122
12212112
12111
21221121
11211111
22221
22222212
12221211
22222221
22222222212
12222212211
12122121
21212221212
11212211211
11211
21122112
11121111
11212211
21121222112
11121212111
11112111
21111221112
11111211111
...21...21...21
J
...21...21...21
2
...21K...21K...21
1
I211 2 ... I
1
2
...
J
1 2 K... 1 2 K... 1 2 K...
1 2 K...1 2 K...1 2 K...
1 2 K...1 2 K...1 2 K...
57Diseño Experimentos
Ejemplo: Proceso químico
T-1 T-2 T-1 T-2 T-1 T-2 T-1 T-272.2 65.0 74.4 69.2 75.0 70.7 80.0 73.074.4 71.6 66.3 71.8 78.9 80.6 65.0 74.464.3 61.9 66.5 64.6 64.3 73.4 82.1 78.8
T-1 T-2 T-1 T-2 T-1 T-2 T-1 T-262.5 75.9 70.8 79.2 76.3 83.3 72.3 80.365.8 72.9 63.9 80.1 79.1 88.0 72.4 86.971.2 77.8 76.6 75.3 89.0 84.7 75.6 86.3
T-1 T-2 T-1 T-2 T-1 T-2 T-1 T-269.0 73.8 69.0 84.5 72.8 94.1 78.4 87.570.3 59.2 68.2 93.7 73.7 87.3 79.9 79.768.8 80.8 78.7 80.1 80.7 89.0 80.3 79.5
CONCENTRACIÓN1 2 3 4
CA
TA
LIZ
AD
OR
C-1
C-2
C-3
Tres factores:1 4%2 6%3 8%4 10%
ConcentraciónT-1 300º CT-2 320º C
Temperatuta
Variable respuesta: Rendimiento del proceso químico.
Tres replicaciones
C-1 AgC-2 Ag+ZnC-3 Zn
Catalizador
58Diseño Experimentos
Modelo
ijkmijkjkikijkjiijkm uy ++++++++= αβγβγαγαβγβαµ
•Normalidad
•Independencia
•Homocedasticidad
I × J × K tratamientos
M replicaciones
n = I × J × K × M
∑ = =Ii i1 0α
∑ = =Jj j1 0β
∑ = =Kk k1 0γ
iKk ik ∀=∑ = ,01αγ
iJj ij ∀=∑ = ,01αβ
kJj jk ∀=∑ = ,01βγ
jIi ij ∀=∑ = ,01αβ
kIi ik ∀=∑ = ,01αγ
jKk jk ∀=∑ = ,01βγ
∑∑∑ ∀=∀=∀= Kk ijk
Jj ijk
Ii ijk jikikj .,,0;,,0;,,,0 αβγαβγαβγ
ijkmu
59Diseño Experimentos
Medias
ijkmijkjkikijkjiijkm uy ++++++++= αβγβγαγαβγβαµ
M
y
y
IM
y
yJM
y
yKM
y
y
IJM
y
yIKM
y
yJKM
y
y
IJKM
y
y
M
mijkm
ijk
I
i
K
kijkm
jk
J
j
M
mijkm
ki
K
k
M
mijkm
ij
I
i
J
j
M
mijkm
k
I
i
K
k
M
mijkm
j
J
j
K
k
M
mijkm
i
I
i
J
j
K
k
M
mijk
∑
∑∑∑ ∑∑ ∑
∑∑ ∑∑∑ ∑∑∑ ∑
∑∑∑ ∑
=•
= =••
= =••
= =••
= = =•••
= = =•••
= = =•••
= = = =••••
=
===
===
=
1
1 11 11 1
1 1 11 1 11 1 1
1 1 1 1
60Diseño Experimentos
Medias: Proceso químico
T-1 T-2 T-1 T-2 T-1 T-2 T-1 T-2C-1 70.30 66.17 69.07 68.53 72.73 74.90 75.70 75.40C-2 66.50 75.53 70.43 78.20 81.47 85.33 73.43 84.50C-3 69.37 71.27 71.97 86.10 75.73 90.13 79.53 82.23
1 2 3 4
1 2 3 4C-1 68.2 68.8 73.8 75.6 71.6C-2 71.0 74.3 83.4 79.0 76.9C-3 70.3 79.0 82.9 80.9 78.3
69.9 74.1 80.1 78.5 75.6
Concentración
1 2 3 4T-1 68.72 70.49 76.64 76.22 73.02T-2 70.99 77.61 83.46 80.71 78.19
69.9 74.1 80.1 78.5 75.6
T-1 T-2C-1 71.95 71.25 71.6C-2 72.96 80.89 76.9C-3 74.15 82.43 78.3
73.02 78.19 75.6
Catalizador
Temperatura
61Diseño Experimentos
Estimación del modelo
•
••••••••••••••••••••
••••••••••••
••••••••••••
••••••••••••
•••••••
•••••••
•••••••
••••
−=−
==
−−−→−+++−−−=∧
−−→+−−=∧
−−→+−−=∧
−−→+−−=∧
−→−=
−→−=−→−=
=
∑∑∑∑ijkijkmijkm
ijkmR
kjijkkiijijkijk
kjjkjk
kikiik
jiijij
kk
jj
ii
yyeMIJK
es
KJIyyyyyyyy
KJyyyy
KIyyyy
JIyyyy
Kyy
JyyIyy
y
;)1(
ˆˆ
)1)(1)(1(
)1)(1(
)1)(1(
)1)(1(
1ˆ
1ˆ1ˆ
ˆ
222σ
αβγ
βγ
αγ
αβ
γ
βαµ
62Diseño Experimentos
Modelo estimado
( ) ( ) ( )( )( )( )( )( )•
••••••••••••••••••••
••••••••••••
••••••••••••
••••••••••••
•••••••••••••••••••••••••
−+
+−+++−−−+
++−−+
++−−+
++−−+
+−+−+−+=
ijkijkm
kjijkkiijijk
kjjk
kiki
jiij
kjiijkm
yy
yyyyyyyy
yyyy
yyyy
yyyy
yyyyyyyy
ijkmijkjkikijkjiijkm uy ++++++++= αβγβγαγαβγβαµ
63Diseño Experimentos
Descomposición de la variabilidad
( )
( ) ( ) ( )
( )
( )
( )
( )
( )∑∑∑∑
∑∑∑
∑∑
∑∑
∑∑
∑∑∑
∑∑∑ ∑
•
••••••••••••••••••••
••••••••••••
••••••••••••
••••••••••••
•••••••••••••••••••••
= = = =••••
−+
+−+++−−−+
++−−+
++−−+
++−−+
+−+−+−
=−
i j k mijkijkm
i j kkjijkkiijijk
j kkjjk
i kkiki
i jjiij
kk
jj
ii
I
i
J
j
K
k
M
mijkm
yy
yyyyyyyyM
yyyyIM
yyyyJM
yyyyKM
yyIJMyyIKMyyJKM
yy
2
2
2
2
2
222
1 1 1 1
2
64Diseño Experimentos
Variabilidades
( ) ( )
( ) ( )
( )
( )
( )
( )
( )∑∑∑∑
∑∑∑
∑∑
∑∑
∑∑
∑∑
∑∑∑∑ ∑
•
••••••••••••••••••••
••••••••••••
••••••••••••
••••••••••••
••••••••••••••
•••••••= = = =
••••
−=
−+++−−−=××
+−−=×
+−−=×
+−−=×
−=−=
−=−=
i j k mijkijkm
i j kkjijkkiijijk
j kkjjk
i kkiki
i jjiij
kk
jj
ii
I
i
J
j
K
k
M
mijkm
yyVNE
yyyyyyyyMCBAVE
yyyyIMCBVE
yyyyJMCAVE
yyyyKMBAVE
yyIJMCVEyyIKMBVE
yyJKMAVEyyVT
2
2
2
2
2
22
2
1 1 1 1
2
)(
)(
)(
)(
)()(
)(
65Diseño Experimentos
Grados de libertad
)1()1)(1)(1(
)1)(1()1)(1()1)(1(
)1()1()1()1(
LIBERTAD DE GRADOS
)(
)()()(
)()()(
ADVARIABILIDLA DE CIÓNDESCOMPOSI
−+−−−−−+−−+−−
−+−+−=−
+××+×+×+×
+++=
MIJKKJI
KJKIJI
KJIn
VNECBAVE
CBVECAVEBAVE
CVEBVEAVEVT
66Diseño Experimentos
( )
( )
( )
( )
( )
( )
( )
( ) 1Total
ˆ)1(Residual
ˆˆˆ)1)(1)(1(
)...
...(ˆ
ˆˆ)1)(1(
ˆˆˆ)1)(1(
ˆˆˆ)1)(1(
ˆˆˆ1
ˆˆˆ1
ˆˆˆ1
..
1 1 1 1
2
22
2
22
2
2
222
2
222
2
222
2
222
2
222
2
222
−−
−−
−−−−+++
+−−−××
−−+−−×
−−+−−×
−−+−−×
−−
−−
−−
∑ ∑∑ ∑
∑∑∑∑
∑∑∑
∑∑
∑∑
∑∑
∑
∑
∑
= = = =••••
•
•••••••••••••
•••••••
••••••••••••
••••••••••••
••••••••••••
•••••••
•••••••
•••••••
IJKMyy
sMIJKyy
sssKJI
yyyy
yyyyM
CBA
sssKJyyyyIMCB
sssKIyyyyJMCA
sssJIyyyyKMBA
sssKyyIJMC
sssJyyIKMB
sssIyyJKMA
FVarianzasLibdeGrADVARIABILIDFUENTE
I
i
J
j
K
k
M
mijkm
Ri j k m
ijkijkm
R
ABCABC
kji
i j kjkkiijijk
R
BCBC
j kkjjk
R
ACAC
i kkiki
R
ABAB
i jjiij
R
CC
kk
R
BB
jj
R
AA
ii
Tabla ANOVA
67Diseño Experimentos
Contraste efecto principal de factor A
0 de distinto es Algún :
0:
i1
210
αααα
H
H I ==== L
Fα
α
RR
Ho rechaza Se Si ⇒> αFFA
)1(;121
2
2
2
ˆ
1)(
ˆ
ˆ−−
=•••••••
→−−
==∑
MIJKIR
I
ii
R
AA F
s
IyyJKM
s
sF
Ho rechaza se No Si ⇒≤ αFFA)1(;1 −− MIJKIF
68Diseño Experimentos
Contraste interacción AxB
0 de distinto es Algún :
0:
ij1
12110
αβαβαβαβ
H
H IJ ==== L
)1)(1(
)(ˆ cierto, es Ho Si 2
−−×
=JI
BAVEsAB
)1();1)(1(2
2
ˆ
ˆ−−−→= MIJKJI
R
ABAB F
s
sF
44 344 21naninteraccio BA y
Ho rechaza Se Si ⇒> αFFAB
69Diseño Experimentos
Contraste interacción AxBxC
0 de distinto es Algún :
0:
ijk1
1121110
αβγαβγαβγαβγ
H
H IJK ==== L
cierto es Ho Si
)1();1)(1)(1(2
2
ˆ
ˆ−−−−→= MIJKKJI
R
ABCABC F
s
sF
Ho rechaza Se Si ⇒> αFFABC
70Diseño Experimentos
Análisis de la varianza
Analysis of Variance for rendimiento - Type III Sums of Squares--------------------------------------------------------------------------------Source Sum of Squares Df Mean Square F-Ratio P-Value--------------------------------------------------------------------------------MAIN EFFECTS A:Catalizador 600.014 2 300.007 10.85 0.0001 B:Concentracion 1141.58 3 380.528 13.76 0.0000 C:Temperatura 481.534 1 481.534 17.41 0.0001
INTERACTIONS AB 177.87 6 29.645 1.07 0.3926 AC 310.714 2 155.357 5.62 0.0064 BC 69.2894 3 23.0965 0.83 0.4813 ABC 217.726 6 36.2876 1.31 0.2701
RESIDUAL 1327.71 48 27.6606--------------------------------------------------------------------------------TOTAL (CORRECTED) 4326.44 71--------------------------------------------------------------------------------All F-ratios are based on the residual mean square error.
71Diseño Experimentos
Interpretación
El efecto principal del factor concentracióninfluye significativamente (p-valor =0.0000) en el rendimiento. Más adelante se compararán las medias de los cuatro niveles de este factor. Este factor no interacciona con ningún otro.Los efectos principales de catalizador y de la temperatura son significativos, además es muy significativa la interacción de los dos factores (p-valor 0.0064). La comparación de medias de estos factores debe ser conjunta.
72Diseño Experimentos
Contraste multiples: Factor A
ji
ji
H
H
αα
αα
≠
=
:
:
1
0
)1(2ˆ
−•••••• →
−MIJK
R
ji t
JKMs
yy
tα/2-tα/2
α/2
tIJK(M-1)
R.R. R.R
R. Acept. H0
1-αα/2
),(ˆˆ
ˆˆˆ
ˆ
22
JKMJKMN
yyyy
yy
jiji
jijijj
ii
σσαααα
αααα
+−→−
−=−
−=−=
•••••••••••••
•••••••
HoJKM
styy Rji
rechazase
,2
ˆSi 2/α>− ••••
73Diseño Experimentos
Concentración
Multiple Range Tests for rendimiento by Concentracion
--------------------------------------------------------------------------------Method: 95.0 percent LSDConcentracion Count LS Mean Homogeneous Groups--------------------------------------------------------------------------------1 18 69.8556 X 2 18 74.05 X 4 18 78.4667 X3 18 80.05 X--------------------------------------------------------------------------------Contrast Difference +/- Limits--------------------------------------------------------------------------------1 - 2 *-4.19444 3.52487 1 - 3 *-10.1944 3.52487 1 - 4 *-8.61111 3.52487 2 - 3 *-6.0 3.52487 2 - 4 *-4.41667 3.52487 3 - 4 1.58333 3.52487 --------------------------------------------------------------------------------* denotes a statistically significant difference.
74Diseño Experimentos
Intervalos de confianza (concentración)
Means and 95,0 Percent LSD Intervals
Concentracion
Ren
dim
ient
o
1 2 3 468
71
74
77
80
83
75Diseño Experimentos
Interacción: Cat. x Temp.
T-1 T-2C-1 71.95 71.25 71.6C-2 72.96 80.89 76.9C-3 74.15 82.43 78.3
73.02 78.19 75.6
Interacción Cat x Temp
70.0072.0074.0076.0078.0080.0082.0084.00
0 1 2 3 4
Catalizador
Me
dia
s
Temp - 1
Temp - 2
76Diseño Experimentos
Selección de temperatura y catalizador.
Las mejores combinaciones corresponden a la temperatura 2,
con el catalizador 2 o el 3.
Table of Least Squares Means for rendimientowith 95.0 Percent Confidence Intervals-------------------------------------------------------------------------------- Stnd. Lower UpperLevel Count Mean Error Limit Limit--------------------------------------------------------------------------------Catalizador by Temperatura1 1 12 71.95 1.51824 68.8974 75.0026 1 2 12 71.25 1.51824 68.1974 74.3026 2 1 12 72.9583 1.51824 69.9057 76.011 2 2 12 80.8917 1.51824 77.839 83.9443 3 1 12 74.15 1.51824 71.0974 77.2026 3 2 12 82.4333 1.51824 79.3807 85.486 --------------------------------------------------------------------------------
77Diseño Experimentos
Catalizador x Temperatura
Interactions and 95,0 Percent LSD Intervals
Catalizador
Ren
dim
ient
oTemperatura
12
69
73
77
81
85
1 2 3
78Diseño Experimentos
Diagnosis del modelo
Residual Plot for Rendimiento
resi
dual
predicted Rendimiento
-13
-8
-3
2
7
12
17
59 69 79 89 99
Residual Plot for Rendimiento
resi
dual
Concentracion1 2 3 4
-13
-8
-3
2
7
12
17
Residual Plot for Rendimiento
resi
dual
Catalizador1 2 3
-13
-8
-3
2
7
12
17
Normal Probability Plot
-13 -9 -5 -1 3 7 11
RESIDUALS
0,1
1
5
20
50
80
95
99
99,9
perc
enta
ge
79Diseño Experimentos
Análisis de 3 factores con menos observaciones
Cuando no existe interacción de orden tres.No es necesario replicar para analizar el experimento.
La variabilidad explicada por el término A×B×C se convierte en Variabilidad Residual con (I-1)(J-1)(K-1) grados de libertad.
Las expresiones anteriores siguen siendo válidas, sustituyendo M=1 (sin replicación) y con (I-1)(J-1)(K-1) como grados de libertad de la varianza residual.
Cuando no existe ninguna interacciónSe puede reducir considerablemente el número de observaciones si el número de niveles de los tres factores es el mismo: CUADRADO LATINO
80Diseño Experimentos
( )
( )
( )
( )
( )
( )
( ) 1Total
ˆ)1)(1)(1()...
...(
Residual
ˆˆˆ)1)(1(
ˆˆˆ)1)(1(
ˆˆˆ)1)(1(
ˆˆˆ1
ˆˆˆ1
ˆˆˆ1
..
1 1 1
2
2
2
2
222
2
222
2
222
2
222
2
222
2
222
−−
−−−−+++
+−−−
−−+−−×
−−+−−×
−−+−−×
−−
−−
−−
∑ ∑∑
∑∑∑
∑∑
∑∑
∑∑
∑
∑
∑
= = =•••
•••••••••
•••
••••••••
••••••••
••••••••
•••••
•••••
•••••
IJKyy
sKJIyyyy
yyyys
ssKJyyyyICB
sssKIyyyyJCA
sssJIyyyyKBA
sssKyyIJC
sssJyyIKB
sssIyyJKA
FVarianzasLibdeGrADVARIABILIDFUENTE
I
i
J
j
K
kijk
R
kji
i j kjkkiijijk
R
BCBC
j kkjjk
R
ACAC
i kkiki
R
ABAB
i jjiij
R
CC
kk
R
BB
jj
R
AA
ii
Tabla ANOVA tres factores (sin replicación)
81Diseño Experimentos
Ejemplo: Obleas
Horno AS 1 2 31 122.2 103.2 115.82 138.4 144.3 159.81 131.0 133.4 121.82 147.4 138.0 147.51 120.5 102.8 120.02 140.6 126.6 141.91 100.0 105.8 114.72 117.0 134.4 131.7
4
Temperatura
1
2
3
Se ha realizado un experimento para analizar la influencia de latemperatura y el acabado superficial (AS) en el espesor de óxido conseguido en obleas de silicio. El experimento se repitióen cuatro hornos diferentes. ( Cada uno de los datos del cuadro representa la media de los espesores medidos en el centro de cada una de las 30 obleas que caben en un horno)
82Diseño Experimentos
ANOVA: Obleas
Analysis of Variance for Espesor - Type III Sums of Squares--------------------------------------------------------------------------------Source Sum of Squares Df Mean Square F-Ratio P-Value--------------------------------------------------------------------------------MAIN EFFECTS A:AS 3183.21 1 3183.21 65.32 0.0002 B:Horno 1200.81 3 400.27 8.21 0.0152 C:Temperatura 262.802 2 131.401 2.70 0.1461
INTERACTIONS AB 265.29 3 88.43 1.81 0.2448 AC 101.251 2 50.6254 1.04 0.4098 BC 541.407 6 90.2346 1.85 0.2362
RESIDUAL 292.393 6 48.7321--------------------------------------------------------------------------------TOTAL (CORRECTED) 5847.16 23--------------------------------------------------------------------------------All F-ratios are based on the residual mean square error.
83Diseño Experimentos
Comparaciones: Horno
Multiple Range Tests for Espesor by Horno
--------------------------------------------------------------------------------Method: 95.0 percent LSDHorno Count LS Mean Homogeneous Groups--------------------------------------------------------------------------------4 6 117.267 X 3 6 125.4 XX 1 6 130.617 XX2 6 136.517 X--------------------------------------------------------------------------------Contrast Difference +/- Limits--------------------------------------------------------------------------------1 - 2 -5.9 9.86203 1 - 3 5.21667 9.86203 1 - 4 *13.35 9.86203 2 - 3 *11.1167 9.86203 2 - 4 *19.25 9.86203 3 - 4 8.13333 9.86203 --------------------------------------------------------------------------------* denotes a statistically significant difference.
84Diseño Experimentos
Comparación de medias
Means and 95,0 Percent LSD Intervals
AS
Esp
esor
1 2110
120
130
140
150
Means and 95,0 Percent LSD Intervals
Horno
Esp
esor
1 2 3 4110
120
130
140
150
El AS que produce mayor espesor es el 2
El horno que produce media mayor es el 2, aunque no es significativamente distinto del 1.
85Diseño Experimentos
Cuadrado latino
Permite analizar tres factores con K niveles cada uno, utilizando sólo K2
observaciones.
Deben ser nulas las interacciones de orden 2 y orden 3.
1 2 3 4 5
1 C A D B E
2 D C B E A
3 E B A D C
4 B E C A D
5 A D E C B
86Diseño Experimentos
Ejemplo: Aditivos gasolina
Una organización de consumidores estudió la eficacia de cinco aditivos que según los fabricantes reducían el consumo de combustible. Se realiza un diseño experimental con cinco conductores, cinco vehículos y cinco aditivos, eligiendo las 25 combinaciones que se muestran en la tabla, junto con una medida del consumo.
C A D B E
71 64 68 78 82D C B E A
65 64 81 82 82E B A D C
63 68 74 77 85B E C A D
66 77 79 88 74A D E C B
73 70 78 80 88
3 4
4
5
Vehículo
Co
nd
uc
tor
5
1
2
3
1 2
ABCDE
Aditivo
87Diseño Experimentos
Modelo: Cuadrado Latino
)()( kijkjikij uy ++++= γβαµ
•Normalidad
•Independencia
•Homocedasticidad
K2 Observaciones
∑ = =Ki i1 0α
∑ = =Kj j1 0β
∑ = =Kk k1 0γ
)(kiju
)2(55)3(45)5(35)4(25)1(15
)4(54)1(44)3(34)5(24)2(14
)3(53)4(43)1(33)2(23)5(13
)1(52)5(42)2(32)3(22)4(12
)5(51)2(41)4(31)1(21)3(11
5
4
3
2
1
54321
yyyyy
yyyyy
yyyyy
yyyyy
yyyyy
88Diseño Experimentos
Estimación
)()( kijkjikij uy ++++= γβαµ
K
y
yK
y
yK
y
yK
y
y
K
kkij
k
K
ikij
j
K
jkij
i
K
i
K
jkij ∑∑∑∑∑
=••
=••
=••
= =••• ==== 1
)(
)(1
)(
)(1
)(
)(21 1
)(
)(
;)2)(1(
ˆˆ
2
1ˆ
1ˆ1ˆ
ˆ
2)(22
)()()()()()(
)()(
)()(
)()(
)(
−−==
+−−−=−→−=
−→−=−→−=
=
∑∑∑∑•••••••••
•••••
•••••
•••••
•••
KK
es
yyyyye
Kyy
Kyy
Kyy
y
kijR
kjikijkij
kk
jj
ii
σ
γ
βαµ
89Diseño Experimentos
Descomposición de la variabilidad
( )
( ) ( ) ( ) ( )∑∑∑∑∑
∑∑
+−+−+−
=−
•••••••••••••••
= =•••
i jkij
kk
jj
ii
K
i
K
jkij
eyyKyyKyyK
yy
2)(
2)()(
2)()(
2)()(
1 1
2)()(
)()( kijkjikij uy ++++= γβαµ
)()()()()()()()()( )()()( kijkjikij eyyyyyyyy +−+−+−+= ••••••••••••••••••
)2)(1()1()1()1()1( 2 −−+−+−+−=− KKKKKK
Libertad de Grados
90Diseño Experimentos
( )
( )
( )
( ) 1
ˆ)2)(1(ˆ
ˆˆ1
ˆˆˆ1
ˆˆˆ1
..
2
1 1 1 1
2
22)(
2
222
)()(
2
222
)()(
2
222
)()(
−−
−−
−−
−−
−−
∑ ∑∑ ∑
∑∑
∑
∑
∑
= = = =••••
•••••
•••••
•••••
Kyy
sKKe
sssKyyKC
sssKyyKB
sssKyyKA
FVarianzasLibdeGrADVARIABILIDFUENTE
I
i
J
j
K
k
M
mijkm
Ri j
kij
R
CC
kk
R
BB
jj
R
AA
ii
Total
Residual
Tabla ANOVA
91Diseño Experimentos
Tabla análisis de la varianza
Analysis of Variance for Consumo - Type III Sums of Squares-------------------------------------------------------------------------------Source Sum of Squares Df Mean Square F-Ratio P-Valu-------------------------------------------------------------------------------MAIN EFFECTS A:Conductor 103.032 4 25.758 1.19 0.362 B:Vehiculo 926.689 4 231.672 10.74 0.000 C:Aditivo 121.41 4 30.3525 1.41 0.289
RESIDUAL 258.75 12 21.5625-------------------------------------------------------------------------------TOTAL (CORRECTED) 1399.84 24-------------------------------------------------------------------------------All F-ratios are based on the residual mean square error.
92Diseño Experimentos
Comparación: vehículos
Means and 95,0 Percent LSD Intervals
Vehiculo
Con
sum
o
1 2 3 4 564
68
72
76
80
84
88
93Diseño Experimentos
Comparación de vehículosMultiple Range Tests for Consumo by Vehiculo
--------------------------------------------------------------------------------Method: 95.0 percent LSDVehiculo Count LS Mean Homogeneous Groups--------------------------------------------------------------------------------1 5 67.6 X 2 5 68.6 X 3 5 76.0 X4 5 81.35 X5 5 82.2 X--------------------------------------------------------------------------------Contrast Difference +/- Limits--------------------------------------------------------------------------------1 - 2 -1.0 6.39883 1 - 3 *-8.4 6.39883 1 - 4 *-13.75 6.39883 1 - 5 *-14.6 6.39883 2 - 3 *-7.4 6.39883 2 - 4 *-12.75 6.39883 2 - 5 *-13.6 6.39883 3 - 4 -5.35 6.39883 3 - 5 -6.2 6.39883 4 - 5 -0.85 6.39883 --------------------------------------------------------------------------------* denotes a statistically significant difference.
Capítulo 5. Diseño de experimentos
5.1 Un laboratorio de Análisis Clínicos ha adquirido un nuevo equipo (B) para medir el colesterol en lasangre de los enfermos. Para evaluar si el nuevo equipo está ajustado se decide analizar muestrasde 5 enfermos que previamente han sido analizadas con otro equipo (A), dando como resultado
Enfermo 1 2 3 4 5 MediaEquipo A 215 305 247 221 286 254.8Equipo B 224 312 251 232 295 262.8
Contrastar con α = 0.05 existen diferencias entre los dos equipos.
5.2 El análisis de la varianza de un diseño en bloques aleatorizados proporciona los siguientes resultados:V T = 232, V E(factor) = 156, V E(bloque) = 15 y V NE = 61. El número de niveles del factor es5 y el número de bloques 8. Construir la tabla ADEVA. ¿ Cuál sería el resultado del análisis si nose tiene en cuenta el efecto de los bloques ? Indicar en qué circunstancias es preferible cada uno delos modelos.
5.3 Para determinar el consumo de energía eléctrica para usos domésticos se ha medido el consumomedio por persona en las distintas estaciones del año en siete comunidades autónomas para 1989,habiéndose obtenido los siguientes resultados:
COMUNIDAD INVIERNO PRIMAVERA VERANO OTOÑO MEDIAS1 13.1 11.4 10.6 11.5 11.652 13.4 12.1 11.1 12.0 12.153 13.8 12.1 11.4 12.9 12.554 14.0 12.8 11.7 12.6 12.775 14.4 12.6 12.5 13.4 13.226 14.8 13.4 13.0 14.0 13.807 15.6 14.2 14.1 14.4 14.57
MEDIAS 14.16 12.66 12.06 12.97 12.96
(a) Analizar si el factor estación del año es influyente, sabiendo que s2y = 1.53.(No considerarel factor Comunidad).
(b) Razonar estadísticamente cuál es la estación de mayor consumo y la de menor, utilizandoel análisis anterior. Calcular los intervalos de confianza para el consumo medio de cadaestación del año.
(c) Sabiendo que la variabilidad explicada por el factor comunidad es 23.62, construir unanueva tabla de la varianza, con dos factores, y decidir qué factor es significativo.
(d) Utilizar los resultados del apartado anterior para realizar un contraste de igualdad demedias del efecto estación y comparar los resultados con los del apartado 2, justificandolas diferencias encontradas.( NOTA: Utilizar α = 0.05 en todos los contrastes )
5.4 Una instalación típica de almacenamiento de combustible en una Estación de Servicio (gasolinera)está formada por un tanque enterrado de gran capacidad, al que se encuentran conectados distintos
1
surtidores. La cantidad total de gasolina suministrada en un día se puede determinar midiendodirectamente la variación que se ha producido en el tanque de almacenamiento (Y1j) o por la sumade los suministros de los distintos surtidores (Y2j). La comparación de ambas medidas permitedeterminar pérdidas en la instalación enterrada y otras anomalías. En el proceso de comparaciónes necesario tener en cuenta que las medidas están afectadas por errores aleatorios. Durante 20 díasse han tomado los valores anteriores en un gasolinera:
Día→ 1 2 3 4 5 6 7 8 9 10Y1j 4116,2 5627,0 2820,4 2521,8 2973,5 2834,9 2335,7 2590,8 2182,7 2621,4Y2j 4143,6 5632,0 2868,1 2477,7 2955,4 2851,9 2312,7 2630,6 2208,9 2635,9
Día→ 11 12 13 14 15 16 17 18 19 20Y1j 4323,6 1880,7 2131,4 3349,6 2545,0 2247,3 1817,5 1461,3 1646,5 1955,4Y2j 4305,4 1877,9 2159,2 3366,7 2566,1 2281,4 1854,6 1461,5 1607,3 1956,4
(a) Llamando Dj = Y1j − Y2j a la diferencia en las medidas de un mismo día, contrastar conα = 0.05
H0 : µD = 0H1 : µD 6= 0
dondeDj tiene distribución N(µD,σD). Calcular el nivel crítico del contraste aproximandola distribución t de Student por la normal.
(b) Los datos anteriores pueden ser analizados mediante un modelo de bloques aleatorizadostomando el tipo de medida (tanque, surtidores) como un factor y los días como bloques.Demostrar con caracter general que en el modelo de bloques aleatorizados si el factor tienedos niveles la varianza residual cumple:
bs2R = 1
2bs2D
donde bs2D es la estimación de σ2D del apartado 1.(c) Teniendo en cuenta lo anterior, demostrar que el contraste correspondiente al factor en el
modelo de bloques aleatorizados es equivalente al contraste del apartado 1.
5.5 Un investigador quiere estudiar el efecto de sexo (hombre, mujer) y tipo de formación (ciencias,letras) en el dominio del inglés escrito en profesores universitarios. Para ello analiza el número deincorrecciones gramaticales en artículos científicos enviados a publicación. Para cada combinaciónde niveles de los factores se han elegido al azar tres profesores. En la tabla se proporciona el númerode fallos detectados en artículos de 15 páginas
Letras CienciasHombre 8, 6, 13 22, 28, 33Mujer 5, 10, 6 12, 14, 9
Contrastar con nivel de significación 0.05 si los efectos principales y la interacción son significativos.Tener en cuenta que P (F1,8 ≤ 5.32) = 0.95, siendo F1,8 la distribución F con grados de libertad1 y 8. Interpretar los resultados.
2
5.6 Un alumno, como trabajo de la asignatura de estadística, ha comparado tres marcas distintas (A,B,C)de palomitas de maíz precocinadas. Cada marca puede prepararse friendolas en una sartén (método1) o en el horno microondas (método 2). El alumno ha realizado un diseño factorial completo 3×2con cinco replicaciones en cada uno de los seis tratamientos. La variable respuesta medida es elporcentaje de granos de maíz que no se han inflado adecuadamente. Los resultados del experimentose muestran en la tabla, en cada tratamiento se proporciona la media y entre paréntesis la desviacióntípica corregida para las cinco replicaciones. Contrastar si la interacción entre los dos factores essignificativa.
A B C
Sartén5.5(1,4)
3.6(1,8)
7.5(2,5)
Horno3.8(1,3)
3.4(0,9)
4.3(1,3)
5.7 Una característica de la calidad de la gasolina es su índice de octanos. Una refinería de petróleotiene cinco fórmulas que pueden emplearse para la obtención de gasolina con plomo o sin plomo.
(a) Para determinar que fórmula proporciona mayor índice de octanos, con cada una de ellasse ha repetido 10 veces en el laboratorio el proceso de fabricación de gasolina con plomo.Si el coeficiente de determinación del análisis de la varianza de los resultados es igual a0.20, contrastar con α = 0.05 si existen diferencias entre las cinco fórmulas para este tipode gasolina.
(b) Los valores medios (yi•) para cada fórmula son:
Fórmula 1 2 3 4 5Media 89.2 90.1 90.7 90.5 89.5Contrastar con α = 0.05 que fórmulas proporcionan índices de octanos significativamentedistintos y cuales no.
(c) Debido a los problemas medio-ambientales gran parte de la producción futura debe estarlibre de plomo. Para determinar que fórmula de las anteriores produce mejores resultadosen cuanto al índice de octanos , se realizo un diseño experimental similar al anterior (cincofórmulas, 10 observaciones en cada fórmula) para la obtención de gasolina sin plomo. Elcoeficiente de determinación en este caso es igual a 0.25 y el índice medio para cada fór-mula es,
Fórmula 1 2 3 4 5Media 88.0 89.5 88.5 90.2 89.8Contrastar (α = 0.05) si existe interacción entre los factores tipo de gasolina (con y sinplomo) y fórmula.
5.8 Se ha realizado un experimento con dos factores cada uno de ellos con 3 niveles. El 20% de lavariabilidad total está explicada por la interacción de los dos factores y el 40% de la variabilidadtotal es debida a la variabilidad residual. Determinar el número de replicaciones necesarias en cadatratamiento para que la interacción sea significativa con α = 0.01. (Explicar el procedimiento decálculo, dejando el resultado indicado en función de las tablas).
3
5.9 Se ha estudiado el efecto de tres hornos diferentes y dos temperaturas (290 oC y 320 oC) en laduración de cierto componente. Para cada combinación de horno y temperatura se ha replicadoel experimento 3 veces. En la tabla siguiente se proporcionan las medias y desviaciones típicas(corregidas) de los datos de cada tratamiento.
Temperatura oC290 oC 320 oC
Media Desv. T. Media Desv. T.Horno 1 24.56 0.850 18.00 0.265Horno 2 19.10 1.539 14.40 0.265Horno 3 18.70 0.458 17.43 0.862
Contrasta si existe interacción entre los factores horno y temperatura (α = 0.05).
5.10 Se desea determinar si cuatro laboratorios dan en promedio los mismos resultados en un análisisquímico. Cada laboratorio ha repetido el análisis cinco veces y los resultados son:
Laboratorios1 2 3 458.7 62.7 55.9 60.761.4 64.5 56.1 60.360.9 63.1 57.3 60.959.1 59.2 55.2 61.458.2 60.3 58.1 62.3
La tabla de análisis de la varianza y la comparación de las medias de los cuatros laboratorios semuestran a continuación:
Analisis de la Varianza-----------------------------------------------------------------------------Fuente Suma de Cuadrados Gl Cuadr. Medios F-Ratio P-Valor-----------------------------------------------------------------------------Laboratorios 85,9255 3 28,6418 13,33 0,0001Residual 34,38 16 2,14875-----------------------------------------------------------------------------Total (Corr.) 120,305 19
4
--------------------------------------------------------------------------------Method: 99,0 percent LSDLaboratorio Count Mean Homogeneous Groups--------------------------------------------------------------------------------3 5 56,52 X 1 5 59,66 X4 5 61,12 X2 5 61,96 X--------------------------------------------------------------------------------Contrast Difference +/- Limits--------------------------------------------------------------------------------1 - 2 -2,3 2,70784 1 - 3 *3,14 2,70784 1 - 4 -1,46 2,70784 2 - 3 *5,44 2,70784 2 - 4 0,84 2,70784 3 - 4 *-4,6 2,70784 --------------------------------------------------------------------------------
Comparación de las medias de los cuatro laboratorios.
(a) Explica que conclusiones se pueden extraer de estos resultados: ¿Existen diferencias entrelos laboratorios? ¿Qué laboratorios presentan diferencias significativas? Da un intervalode confianza al 99% para la media del laboratorio 3.
(b) Según el modelo, la medida yij del laboratorio i en la muestra j tiene distribución normalde media µi y varianza σ2. Los cuatro laboratorios afirman que el error en sus medidasse corresponde con σ2 = 1. Aceptando la hipótesis de homocedasticidad contrastar H0 :σ2 = 1 frente a H1 : σ2 > 1.
(c) Para confirmar los resultados se vuelve a repetir el mismo proceso y otro día se vuelvea analizar por los cuatro laboratorios el producto químico proporcionando otras cincomedidas. Abajo se incluye la tabla de análisis de la varianza del estudio conjunto de las40 observaciones con un modelo de dos factores: Laboratorio (4 niveles) y Día (2 niveles),con 5 replicaciones en cada combinación de día y laboratorio.
Análisis de la varianza----------------------------------------------------------------------------- Suma de Grados CuadradosFuente Cuadrados Libertad Medios F P-Val----------------------------------------------------------------------------- A:Laboratorio 186,81 3 62,27 30,21 0,0 B:Día 0,07396 1 0,07396 0,04 0,8 AB 0,40334 3 0,134447 0,07 0,9
RESIDUAL 65,9686 32 2,06152-----------------------------------------------------------------------------TOTAL (CORREGIDA) 253,256 39
5
-----------------------------------------------------------------Method: 99,0 percent LSDLaboratorio Count LS Mean Homogeneous Groups-----------------------------------------------------------------3 10 56,391 X 1 10 59,766 X 4 10 61,238 XX2 10 62,037 X-----------------------------------------------------------------Contrast Difference +/------------------------------------------------------------------1 - 2 *-2,271 1,71 - 3 *3,375 1,71 - 4 -1,472 1,72 - 3 *5,646 1,72 - 4 0,799 1,73 - 4 *-4,847 1,7-----------------------------------------------------------------
Interpreta los resultados del análisis conjunto y compáralos con los obtenidos en el primeranálisis.
(d) Contrasta si ha habido un cambio significativo en la varianza σ2 de un día y otro. (Ayuda.Comprueba que la varianza residual del modelo factorial es el promedio de las varianzasresiduales de cada día).
5.11 Se ha realizado un experimento para estudiar el efecto de la temperatura (T) y tiempode exposición (E) sobre la cantidad absorbida de un compuesto químico por un materialsumergido en él. En el estudio se han empleado tres temperaturas (T1, T2, T3) y tres tiemposde exposición (E1, E2, E3): cada tratamiento se ha replicado tres veces. La cantidad absorbida(mg) del compuesto químico en cada uno de los 27 experimentos se muestra en la tabla 1 ylas medias en la tabla 2:
Tabla 1: Cantidad Absorbida (mg)
Tiempo de TemperaturaExposición T1 T2 T3
35.5 91.2 70.1E1 29.7 100.7 64.1
31.5 82.4 70.1
52.5 71.0 79.4E2 53.3 77.0 77.7
55.0 75.6 75.1
85.9 87.0 83.0E3 85.2 86.1 87.0
80.2 88.1 78.5
Tabla 2: Medias de Cantidad Absorbida (mg)
Tiempo de TemperaturaExposición T1 T2 T3 Medias
E1 32.23 91.43 68.10 63.92E2 53.60 74.53 77.40 68.51E3 83.76 87.06 82.83 84.56
Medias 56.53 84.34 76.11 72.33
6
La tabla 3 corresponde al análisis de la varianza del experimento y las figuras muestran los gráficosde los intervalos de confianza para las medias de las tres temperaturas, los tres tiempos deexposición y los nueve tratamientos por separado.
Tabla 3: Tabla de análisis de la varianzaFuente Suma de Grados deVariabilidad Cuadrados Libertad Varianzas F p-valorTemperatura 3673.61 2 1836.80 110.58 0.0000T. Exposición 2112.65 2 1056.32 63.59 0.0000Interacción 2704.44 4 676.11 40.70 0.0000Residual 299.00 18 16.61Total 8789.7 26
Intervalos de confianza (95%)
Tiempo
Abs
orci
on
1 2 361
66
71
76
81
86
91
Intervalos de confianza (95%)
Temperatura
Abs
orci
on
1 2 354
64
74
84
94
Int. de conf. para las medias de los 9 tratamientos (95%)
Abs
orci
on
T1 T2 T3 T1 T2 T3 T1 T2 T325
45
65
85
105
E1 E2 E3
7
(a) Interpreta los resultados del análisis de la varianza.(b) Demuestra que si se hubiera utilizado el modelo de un único factor para comparar los
nueve tratamientos, la variabilidad explicada de este modelo (VE’) se puede poner comosuma de las variabilidades explicadas del modelo factorial de la tabla 3:
V E0 = V E(Temperatura) + V E(Tiempo) + V E(Interaccion)
Obtén la tabla del análisis de la varianza del nuevo modelo.(c) Realiza las comparaciones dos a dos de los nueve tratamientos y elige aquél o aquellos que
proporcionan una absorción mayor (95%).(d) Comprueba gráficamente la hipótesis de homocedasticidad e interpreta los resultados.
5.12 Se ha realizado un diseño experimental para determinar la influencia de dos factores combinaciónde hidrocarburos y cantidad de hidrógeno en el rendimiento de un proceso químico complejo. Seestudiaron cuatro combinaciones de hidrocarburos (A,B, C y D) y tres niveles en el contenido dehidrógeno (1,2 y 3). En cada tratamiento se realizaron cuatro réplicas. En la tabla 1 se presentanlos resultados: mejora en tanto por mil respecto a procedimiento estándar. Los números entreparéntesis de la tabla se corresponden con las medias de cada tratamiento, de los cuatro niveles delfactor hidrocarburos y de los tres niveles de hidrógeno. En la tabla 2 se muestra la tabla de análisisde la varianza del experimento.
Tabla 1. Datos y medias entre paréntesisA B C D Medias Etapa
10.3 10.5 7.2 13.0 111.1 8.2 5.3 12.9 1
1 15.3 9.7 12.5 5.3 22.1 8.9 19.1 12.0 2
Medias (9.7) (9.325) (11.025) (10.8) (10.213)
25.8 20.6 29.7 17.6 125.7 17.1 26.3 12.0 1
2 28.9 21.4 22.4 24.6 227.8 17.3 25.9 23.1 2
Medias (27.05) (19.1) (26.075) (19.325) (22.888)
28.5 21.0 30.4 20.5 131.2 26.8 26.6 26.2 1
3 24.8 19.4 34.4 27.8 226.5 22.2 27.5 21.9 2
Medias (27.75) (22.35) (29.975) (24.1) (25.981)
Medias (21.5) (16.925) (22.275) (18.075)
8
Tabla 2. ANOVA -Suma Grados
Fuentes Cuadrados Libertad Var. F p-valorHidrocarburos 242.5 3 80.85 5.55 .0031Hidrógeno 2234 2 1117 76.7 .0000Interacción 119.3 6 19.88 1.36 .2546Residual 523.7 36 14.55Total 3120 47
(a) Comparar las medias de los cuatro niveles del factor Hidrocarburo y las de los tres niveles del factorHidrógeno. Indica si existen diferencias significativas con nivel de significación 0.05.
(b) Elige el tratamiento que proporciona el rendimiento óptimo, justificando la respuesta. Da un inter-valo de confianza para el valor medio en dichas condiciones con nivel de confianza del 95%.
(c) El experimento se realizó en dos etapas, en una primera etapa se recogieron las 24 observacionesque se indican en la tabla 1 como etapa 1 y las otras 24 como etapa 2. Los resultados del análisisde la varianza correspondientes a cada etapa se muestran en las tablas 3 y 4.
Tabla 3. ANOVA - Etapa 1Suma Grados
Fuentes Cuadrados Libert. Var. F p-valorHidrocarburos 115.9 3 38.63 6.07 .0093Hidrógeno 1175.0 2 587.7 92.4 .0000Interacción 218.4 6 36.39 5.72 .0051Residual 76.3 12 6.358Total 1586.0 23
Tabla 4. ANOVA - Etapa 2Suma Grados
Fuentes Cuadrados Libert. Var. F p-valorHidrocarburos 162.9 3 54.31 3.35 .0555Hidrógeno 1076 2 537.9 33.19 .0000Interacción 94.94 6 15.82 0.976 .9762Residual 194.5 12 16.21Total 1528 23
¿Se puede concluir que en las dos etapas la varianza del error experimental es la misma? (Realizael contraste con α = 0.05)
(d) Denominando µ y µ0 a las medias (globales) de los modelos factoriales para cada una de las dosetapas, contrasta que son iguales ( H0 : µ = µ0) con α = 0.01.
5.13 Sea un diseño factorial con 4 factores a 3, 4, 2 y 5 niveles. Calcular el número de parámetros totalescorrespondientes a efectos principales e interacciones de orden 2, 3 y 4.
9
5.14 Un centro ha realizado un experimento para mejorar la resistencia a la tensión de ciertos muelles deacero. En una etapa del proceso el muelle caliente se sumerge en aceite templado. Se han estudiadotres factores, A (temperatura del acero antes de la inmersión, con tres niveles), B (temperatura delbaño de aceite, dos niveles) y C (concentración de carbono en el acero, dos niveles). El experimentose ha replicado tres veces. En la tabla se muestra la media y la varianza (corregida) para los tresdatos de cada tratamiento.
A B C yi s2i1 1 1 40.2 0.251 1 2 61.1 2.681 2 1 35.9 2.431 2 2 57.1 4.442 1 1 49.0 3.492 1 2 70.3 7.772 2 1 46.7 5.082 2 2 67.6 1.033 1 1 41.9 4.273 1 2 62.7 11.413 2 1 37.1 1.333 2 2 60.3 6.13
(a) Dar un intervalo del 95 % de confianza para la varianza del error experimental, σ2.(b) Indicar si los efectos principales de A, B y C son significativamente distintos de cero.(c) Dado σ2, construir un intervalo que cumpla que la probabilidad de que s2i (la varianza
muestral corregida de un tratamiento) esté contenido en él sea igual a 0.95. Sustituir σ2
por su estimador y con ayuda de este intervalo, discutir si se puede rechazar la hipótesisde homocedasticidad de las observaciones.
5.15 Se desea estudiar la señal recibida por un equipo de ultrasonidos en función de la profundidad ala que se encuentra el objeto enterrado. En un experimento se han enterrando objetos a 0.5, 1.0,1.5 y 2.0 metros. En cada distancia se han realizado 10 replicaciones. La tabla muestra la media yvarianza de cada nivel.
Nivel Profundidad Num. Media Varianza1 0.5 10 78.21 28.192 1.0 10 50.29 11.113 1.5 10 33.49 8.864 2.0 10 23.574 12.55
Denominando µ1, µ2, µ3 y µ4 a las medias de los niveles, realiza el siguiente contraste:
H0 : µ1 − µ2 = µ3 − µ4,H1 : µ1 − µ2 > µ3 − µ4,
suponiendo que las observaciones tienen distribución normal, con la misma varianza y que sonindependientes (Utiliza α = 0.05). (Ayuda. Llamando δ = (µ1 − µ2) − (µ3 − µ4), el contrastese puede escribir como H0 : δ = 0; H1 : δ > 0. Estima µ1, µ2, µ3 y µ4 con la media muestralrespectiva).
10
5.16 Un estudio bioquímico ha valorado la cantidad de tres ácidos (a, b, c) en muestras extraídas acuatro terneras (1, 2 ,3 y 4) de la misma raza. El análisis es bastante complejo y la determinaciónincluye un error de medida. ¿Se puede aceptar la hipótesis de que los tres ácidos se encuentranen la misma proporción en cada animal? Realiza el contraste con nivel de significación 0.05. (Lavariabilidad total es 41.90).
1.
a b c Medias1 11.0 11.4 12.7 11.72 9.8 10.8 13.7 11.433 7.5 10.6 11.5 9.874 7.9 7.6 10.1 8.53
Medias 9.05 10.1 12.0 10.38
11
6. Regresión lineal
Curso 2004-05
Estadística
2Regresión Lineal
Regresión simple consumo y peso de automóviles
Núm. Obs. Peso Consumo(i) kg litros/100 km
1 981 112 878 123 708 84 1138 115 1064 136 655 67 1273 148 1485 179 1366 1810 1351 1811 1635 2012 900 1013 888 714 766 915 981 1316 729 717 1034 1218 1384 1719 776 1220 835 1021 650 922 956 1223 688 824 716 725 608 726 802 1127 1578 1828 688 729 1461 1730 1556 15
0
5
10
15
20
25
500 700 900 1100 1300 1500 1700
Peso (Kg)
Cons
umo
(litro
s/10
0 Km
)
3Regresión Lineal
ix
iyx10 ββ +
Modelo
osdesconocid parámetros:,, 210 σββ
),0(, 210 σββ Nuuxy iiii →++=
4Regresión Lineal
Hipótesis del modelo
Linealidadyi = β0+β1xi + ui
Normalidadyi|xi ⇒ N (β0+β1xi,σ2)
HomocedasticidadVar [yi|xi] = σ2
IndependenciaCov [yi, yk] = 0
2
1
0
σ
ββ
Parámetros
5Regresión Lineal
Modelo
),0(, 210 σββ Nuuxy iiii →++=
yi : Variable dependiente
xi : Variable independiente
ui : Parte aleatoria
0
σ
6Regresión Lineal
Estimación
xyx
yx
n
xx
n
xxyy
nxxnyx
xy
xxyxxxyd
dM
xnyxyd
dM
xyM
i
ii
n
ii
n
iii
i
n
iii
iiii
n
iiii
ii
n
iii
n
iii
101
1
2
11
210
1
10
210
110
0
101
100
1
21010
ˆˆ;)var(
),cov(ˆ
)(ˆ
))((
ˆˆ
ˆˆ
ˆˆ0)ˆˆ(
ˆˆ0)ˆˆ(
)(),(
βββ
βββ
ββ
βββββ
βββββ
ββββ
−==
−=
−−
+=
+=
+==−−−=
+==−−−=
−−=
∑∑∑∑
∑ ∑∑∑
∑ ∑∑
∑
==
=
=
=
=
7Regresión Lineal
Estimación: máxima verosimilitud
( )
xyx
yx
n
xx
n
xxyy
nxxnyx
xy
xxyxxxyddL
xnyxyddL
xynn
lL
xyl
i
ii
n
ii
n
iii
in
iii
iiiin
iiii
iin
iii
n
iii
n
iiinn
101
1
2
11
210
1
10
210
1102
0
101
1020
1
2102
2
210
210
1
21022/
210
ˆˆ;)var(
),cov(ˆ
)(ˆ
))((
ˆˆ
ˆˆ
ˆˆ0)ˆˆ(1
ˆˆ0)ˆˆ(1
)(2
1log
2)2log(
2
),,(log),,(
)(2
1
2
1),,( exp
βββ
βββ
ββ
ββββσβ
ββββσβ
ββσ
σπ
σββσββ
ββσσπ
σββ
−==
−=
−−
+=
+=
+==−−=
+==−−=
−−−−−=
=
−−−=
∑∑
∑∑
∑ ∑∑∑
∑ ∑∑
∑
∑
==
=
=
=
=
=
8Regresión Lineal
Estimación σ2 : máxima verosimilitud
n
xy
xyn
d
dL
xynn
L
n
iii
n
iii
n
iii
∑
∑
∑
=
=
=
−−=
=−−+−=
−−−−−=
1
210
2
1
210422
1
2102
2210
)ˆˆ(ˆ
0)ˆˆ(ˆ2
1
ˆ
12
)(2
1log
2)2log(
2),,(
ββσ
ββσσσ
ββσ
σπσββ
2ˆ
0
0
ˆˆ
1
2
2
1
1
10
−=
=
=
−−=
∑
∑
∑=
=
=n
e
s
xe
e
xyen
ii
Rn
iii
n
ii
iii ββ
9Regresión Lineal
Estimación
∑∑
=
=
−−−
==
−=
ni i
ni ii
i
ii
xx
yyxx
x
yx
xy
12
11
10
)(
))((
)var(
),cov(ˆ
ˆˆ
β
ββ
∑=
−−n
iii xy
1
210 )(Mín ββ
Mínimos cuadrados
( )
−−− ∑
=
n
iiinn xyMax
1
21022/ )(
2
1
2
1exp ββ
σσπ
Máxima verosimilitud
10Regresión Lineal
xy 10ˆˆˆ ββ +=
Recta de regresión
x
y
xy 10ˆˆ ββ −=
Pendiente
1β
11Regresión Lineal
{ {ResiduoPrevistoValor
ˆˆ
observadoValor 10 iii exy ++=43421ββ
ix
iy
ii xy 10ˆˆˆ ββ +=
ie
Residuos
12Regresión Lineal
Ejemplo: estimaciónNúm. Obs. Peso Consumo Predicción Residuos
(i) kg litros/100 km
1 981 11 11,44 -0,442 878 12 10,23 1,773 708 8 8,23 -0,234 1138 11 13,28 -2,285 1064 13 12,41 0,596 655 6 7,61 -1,617 1273 14 14,86 -0,868 1485 17 17,35 -0,359 1366 18 15,95 2,0510 1351 18 15,78 2,2211 1635 20 19,11 0,8912 900 10 10,49 -0,4913 888 7 10,35 -3,3514 766 9 8,91 0,0915 981 13 11,44 1,5616 729 7 8,48 -1,4817 1034 12 12,06 -0,0618 1384 17 16,16 0,8419 776 12 9,03 2,9720 835 10 9,72 0,2821 650 9 7,55 1,4522 956 12 11,14 0,8623 688 8 8,00 0,0024 716 7 8,33 -1,3325 608 7 7,06 -0,0626 802 11 9,34 1,6627 1578 18 18,44 -0,4428 688 7 8,00 -1,0029 1461 17 17,07 -0,0730 1556 15 18,18 -3,18
0
5
10
15
20
25
500 700 900 1100 1300 1500 1700
Peso (Kg)
Cons
umo
(litro
s/10
0 Km
)
;0117.0071.0ˆ ii xy +−= 38.2ˆ2 =Rs
13Regresión Lineal
Propiedades de 1β
( )( )
( ) ( )
nn
n
ii
x
i
n
ii
x
n
iii
x
n
iii
xx
ii
ywywywyns
xx
yxxns
yxxns
yyxxnss
yx
+++=
−=
−−−=
−−==
∑
∑∑
∑
=
==
=
L22111
2
12
12
1221
11
1),cov(β 0
( )
( ) ( ) ( ) ( )
( )21
2
2
212
1
2
21212121
121
11
11111
01
x
ni i
x
ni i
ni i
x
ni i
x
ni ii
x
ni ii
xi
ni i
ni i
x
ni i
nsxx
nsw
xxns
xxxns
xxxns
xxxns
xw
xxns
w
=−
=•
=−=−−−=−=•
=−=•
∑∑
∑∑∑∑∑
∑∑
==
=====
==
2ˆx
ii sn
xxw
−=
14Regresión Lineal
son v.a. independientes1ˆ,βy
( )
0)var()ˆ,cov(
ˆ
111111
1
2
1
2
1
2122111
2
1
21
===
=
=+++=
=
=+++=
∑=
n
ii
T
T
n
nnn
T
n
n
wn
y
y
y
y
wwwywywyw
y
y
y
nnny
ny
ny
ny
σβ
β
wYa
Yw
Ya
MLL
MLL
15Regresión Lineal
Distribución de 1β
2
22
1
2
222
221
21
22111
110
102211
22111
22111
210
)(
)][(][][][
][]ˆ[
)()(
)][(][][][
][]ˆ[
normales de lineal Comb.ˆ
),(
x
n
ii
inn
nn
iii
iinn
nn
nn
ii
nsw
yVarywyVarwyVarw
ywywywVarVar
xww
xyEyEwyEwyEw
ywywywEE
ywywyw
xNy
σσ
σ
β
βββββ
β
β
σββ
==
=+++=
+++=
=+=+=+++=
+++=
→+++=
+→
∑
∑∑
=
L
L
L
L
L
→
2
2
11 ,ˆxns
Nσββ
16Regresión Lineal
Modelo en diferencias a la media
)(ˆˆ
)(ˆ
)(ˆˆˆ
ˆˆ
1
1
1
10
10
xxyy
exxyy
exxyyxy
exy
ii
iii
iiiiii
−+=
+−+=
+−=−
+=++=
β
β
βββ
ββ
17Regresión Lineal
Distribución de 0β
+→
+=
=−=→−=
•
→•
+→•
2
22
00
2
22
0
010
10
1
2
2
11
2
10
1,ˆ
1]ˆvar[
]ˆ[][]ˆ[
ˆˆ
ntesindependieson ˆ,
),(ˆ
),(
x
x
x
s
x
n
s
x
n
ExyEE
Normalxy
yns
N
nxNy
N σββσβ
βββββ
β
σββ
σββ
18Regresión Lineal
Distribución de ŝR2
222
2
21
2ˆ)2(
−= →
−=
∑
nR
n
ii sn
e
χσσ
==
→→
→
++=++=
∑∑∑∑
−==
0
0
),0(
ˆˆ
222
12
221
2
21010
ii
in
ni i
n
ni i
i
iiiiii
xe
eeu
Nu
exyuxy
χσ
χσ
σββββ
19Regresión Lineal
Contraste principal de regresión: ¿depende y de x?
0:
0:
11
10
≠=
ββ
H
H
ix
iy
ix
iy
iii uxy ++= 10 ββ ii uy += 0β
H0 es falso
x e y están relacionados
H0 es cierto
x e y no están relacionados
20Regresión Lineal
ii xy 10ˆˆˆ ββ +=0:
0:
11
10
≠=
ββ
H
H
Ho rechaza Se;ˆ
ˆ
ˆ
ˆ)1,0(
ˆ
),(ˆ
2/;211
1
21111
2
2
11
⇒>=
→−
⇒→−
→
−
−
αβ
ββσββ
σββ
n
x
R
n
x
R
x
x
tt
sn
st
t
sn
sN
sn
nsN
Contraste sobre la pendiente
1β
21Regresión Lineal
ii xy 10ˆˆˆ ββ +=
0:
0:
01
00
≠=
ββ
H
H
Ho rechaza Se
;
1ˆ
ˆ
))1(,(ˆ
2/;20
2
2
00
2
22
00
⇒>
+=
+→
− α
β
σββ
n
x
R
x
tt
sx
n
st
s
x
nN
Contraste: ordenada en el origen
22Regresión Lineal
Descomposición de la variabilidad en regresión
{
VNEVEVT
iy
iyy
iyyy
iy
iyy
iyyy
yi
yi
yi
yyi
yi
y
e
iy
xy
uxy
n
i
n
i
n
ii
i
i
iii
iii
+=
−+−=−
−+−=−
−+=
−++=
++=
∑∑∑=== 1
2
1
2
1
2
10
10
)ˆ()ˆ()(
sumando)y cuadrado al elevando()ˆ()ˆ()(
) restando()ˆ(ˆ
ˆˆ
ˆˆ43421ββ
ββ
23Regresión Lineal
Coeficiente de determinación R2
221
1
2211
ˆ)(ˆ:)(ˆˆ x
n
iiii nsxxVExxyy βββ =−=⇒−+= ∑
=
VNEVEVT +=
VT
VER =2
regresor elpor explicado está
que VT de porcentaje el Mide
10 2 ≤≤ R
∑
∑
∑
=
=
=
−=
−=
−=
n
ii
n
iii
n
ii
yyVT
yyVNE
yyVE
1
2
1
2
1
2
)(
)ˆ(
)ˆ(
24Regresión Lineal
Coef. determinación
12 =R 80.02 =R
50.02 =R 02 =R
25Regresión Lineal
ii xy 10ˆˆˆ ββ +=0:
0:
11
10
≠=
ββ
H
H
Contraste F
1β
ntesindependieson ,
ˆ)2(
cierto) es H (Si
22
222
2
21
2
2
o212
σσ
σσσ
σ
χ
χ
VNEVE
sneVNE
VE
nR
ni i
−= →
−==
→
∑212ˆ2 −→== n,
R
Fs
VE
)VNE/(n-
VEF
0H rechaza Se ⇒> αFF
26Regresión Lineal
Regresión con StatgraphicsDependent variable: ConsumoIndependent variable: Peso----------------------------------------------------------------------------- Standard TParameter Estimate Error Statistic P-Value-----------------------------------------------------------------------------Intercept -0,0712606 0,945148 -0,0753962 0,9404Slope 0,0117307 0,000886531 13,2321 0,0000-----------------------------------------------------------------------------
Analysis of Variance-----------------------------------------------------------------------------Source Sum of Squares Df Mean Square F-Ratio P-Value-----------------------------------------------------------------------------Model 416,811 1 416,811 175,09 0,0000Residual 66,6559 28 2,38057-----------------------------------------------------------------------------Total (Corr.) 483,467 29
Correlation Coefficient = 0,928509R-squared = 86,2129 percentStandard Error of Est. = 1,54291
27Regresión Lineal
Ejemplo regresión múltiple
Consumo = β0 + β1 CC + β2 Pot + β3 Peso + β4 Acel + Error
Y X1 X2 X3 X4Consumo Cilindrada Potencia Peso Aceleraciónl/100Km cc CV kg segundos
15 4982 150 1144 1216 6391 190 1283 924 5031 200 1458 159 1491 70 651 2111 2294 72 802 1917 5752 153 1384 14... ... ... ... ...
Var. Independientes
o regresores
Var. dependientes
o respuesta
28Regresión Lineal
Modelo regresión múltiple
osdesconocid parámetros:,,,,, 2210 σββββ kK
),0(
,
222110
σ
ββββ
Nu
uxxxy
i
ikikiii
→
+++++= L
LinealidadE[yi] = β0+ β1x1i+…+ βkxki
Normalidadyi| x1 ,...,xk⇒ Normal
HomocedasticidadVar [yi|x1 ,...,xk] = σ2
IndependenciaCov [yi, yk] = 0
29Regresión Lineal
Notación matricial
+
=
nkknnn
k
k
n u
u
u
xxx
xxx
xxx
y
y
y
MM
L
MOMMM
L
L
M2
1
1
0
21
22212
12111
2
1
1
1
1
β
ββ
),( 2I0U
UXβY
σN→
+=
30Regresión Lineal
Estimación mínimo-cuadrática
eβXY += ˆ
donde el vector e cumple
mínimo es∑=
=n
iie
1
22e
+
=
nkknnn
k
k
n e
e
e
xxx
xxx
xxx
y
y
y
MM
L
MOMMM
L
L
M2
1
1
0
21
22212
12111
2
1
ˆ
ˆ
ˆ
1
1
1
β
ββ
31Regresión Lineal
Para que ||e||2 sea mínimo, e tiene que ser perpendicular al espacio vectorial generado las columnas de X
=
==
=⇒
=
=
∑
∑∑
nkii
nii
ni
nknnn
k
k
xe
xe
e
e
ee
xxx
xxxxxx
1
1 1
1
2
1
21
22212
12111
0
0
0
,
1
11
M
ML
MOMMMLL
0eX
eX
T
32Regresión Lineal
Mínimos cuadrados
YXXXββXXYXeXβXXYX
0eX
TTTT
TTT
T
1)(ˆˆˆ
−=⇒=+=
=
x1
Y
βXY ˆˆ =
YYe ˆ−=
x2
x2
x1
Y
Una d
esco
mpo
sición Solución MC
33Regresión Lineal
Matriz de proyección V
1
x1
VYY =ˆ
V)Y(Ie −=Y
VYYYXX)X(XYβXYT1T
==
=−
ˆˆ
ˆˆPrevistos Val.
V)Y(IVYYβXYe
−=−=−= ˆ
Residuos TT XXX(XV 1)−=
Simétrica V=VT
Idempotente VV=V
34Regresión Lineal
Distribución de probabilidad de β
1T
1TT1T
T1TT1T
T
T1T
T1TT1T
X)(X
X)X(XXX)(X
XX)(XIXX)(X
CYCCYβ
βXβXX)(XCXβYCβ
β
XX)(XCCYYXX)(Xβ
IXβY
−
−−
−−
−
−−
=
=
=
==
====
→
===
→
2
2
2
2
))()((
][][]ˆ[
][]ˆ[
ˆ
) siendo(ˆ
),(
σ
σ
σ
σ
T
VarVarVar
EE
Normal
N
35Regresión Lineal
Distribución de probabilidad de β
==
=
= −
kkkk
k
k
T
kk
qqq
qqqqqq
LMOMM
LL
MM10
11110
00100
11
0
1
0
)(
ˆ
ˆ
ˆ
ˆ XXQββ
β
ββ
β
ββ
),(ˆ
),(ˆ
2
2
iiii qN
N
σββ
σ
→
→ −1TX)(Xββ
)1()1()dim( +×+= kkQ
36Regresión Lineal
Residuos
)ˆˆˆ( 110 kikiii xxye βββ +++−= L
+
=
nkknnn
k
k
n e
e
e
xxx
xxx
xxx
y
y
y
MM
L
MOMMM
L
L
M2
1
1
0
21
22212
12111
2
1
ˆ
ˆ
ˆ
1
1
1
β
ββ
32143421321ResiduosPrevistosObservados
ˆ eβXY +=
37Regresión Lineal
Varianza Residual
212
21
2
212
12
2
]1
[
1][
σ
σ
χσσ
=−−
−−=
→=
∑
∑
∑
=
=
−−=
kn
eE
kne
E
e
ni i
ni i
kn
ni ieeT
212
2
12
2
ˆ)1(
1ˆ
−−
=
→−−
−−=∑
knR
ni i
R
skn
kn
es
χσ
38Regresión Lineal
0:
0:
1
0
≠=
i
i
H
H
ββ
Ho rechaza Se⇒>=
→−
⇒→−
→
−−
−−
2/;1
111
2
;ˆ
ˆ
ˆ
ˆ)1,0(
ˆ
),(ˆ
αβ
ββσ
ββ
σββ
kniiiR
ii
kniiRii
ii
iiii
ttqs
t
tqs
Nq
qN
Contraste individual βi
ikikii uxxy ++++= βββ L110
39Regresión Lineal
Descomposición de la variabilidad en regresión
VNEVEVT
eyyyy
eyyyy
yeyy
exxy
ni i
ni i
ni i
iii
iii
ikikii
+=
+−=−
+−=−
+=
++++=
∑∑∑ === 12
12
12
110
)ˆ()(
)ˆ()(
)(ˆ
ˆˆˆ
Restando
βββ L
40Regresión Lineal
Modelo en diferencias a la media
−−−
−−−−−−
=
−
−−
−++−=−
+++=
+++=
++++=
kkknnn
kk
kk
n
kkikii
kikii
kk
ikikii
xxxxxx
xxxxxx
xxxxxx
yy
yy
yy
xxxxyy
xxy
xxy
exxy
β
ββ
ββ
βββ
βββ
βββ
ˆ
ˆ
ˆ
ˆ
ˆ
ˆ
)(ˆ)(ˆˆ
ˆˆˆˆ
ˆˆˆ
ˆˆˆ
2
1
2211
2222112
1221111
2
1
111
110
110
110
M
L
MOMM
L
L
M
L
L
L
L
{0111
1101
ˆˆˆ ∑∑∑∑====
++++=n
ii
n
ikik
n
ii
n
ii exxny βββ L
bXYY ˆ~ˆ =− ebXYY +=− ˆ~
41Regresión Lineal
Modelo en diferencias a la media
UbXY +=~~
))~~
(,(ˆ 12 −→ XXbb TσN
−−−
−−−−−−
=
=
=
=
−
−−
=
kknnn
kk
kk
kkn
xxxxxx
xxxxxx
xxxxxx
y
y
y
yy
yy
yy
L
MOMM
L
L
MMMM
2211
2222112
1221111
2
1
2
1
2
1
~
ˆ
ˆ
ˆ
ˆ,,,~
X
bbYY
β
ββ
β
ββ
YX)XX(b~~~~ˆ 1 TT −=
42Regresión Lineal
0:0:
1210
de distinto es algunoHH k ==== βββ L
Contraste general de regresión.
ntesindependie son
cierto) es H (Si o
22
212
2
2
22
,
ˆ)1(
σσ
σσ
σ
χ
χ
VNEVE
sknVNE
VE
knR
k
−−→−−
=
→
11
/−−→
−= kn,kF
)VNE/(n-k
kVEF
0H rechaza Se ⇒> αFF
ikikii uxxy ++++= βββ L110
43Regresión Lineal
Coeficiente de determinación R2
VNEVEVT +=
VT
VER =2
regresores los por explicado está
que VTde porcentaje el Mide
10 2 ≤≤ R
∑
∑
∑
=
=
=
−=
−=
−=
n
ii
n
iii
n
ii
yyVT
yyVNE
yyVE
1
2
1
2
1
2
)(
)ˆ(
)ˆ(
)~~
(ˆˆ)~~
(ˆˆˆ)ˆ(1
2 YXbbXXb)YY()YY( TTTTTn
ii yyVE ==−−=−= ∑
=
44Regresión Lineal
Coef. determinación corregido
2
2
2
ˆ)1(
ˆ)1(11
y
R
sn
skn
VT
VNE
VT
VNEVT
VT
VER
−
−−−=−=
−==
1
)(
ˆ 1
2
2−
−
=∑=
n
yy
s
n
ii
y
)1/(
)1/(1
ˆ
ˆ1
2
22
−−−
−=−=nVT
knVNE
s
sR
y
R
2R
Regresión con STATGRAPHICSMultiple Regression Analysis-----------------------------------------------------------------------------Dependent variable: consumo----------------------------------------------------------------------------- Standard TParameter Estimate Error Statistic P-Value-----------------------------------------------------------------------------CONSTANT -1,66958 0,983305 -1,69793 0,0903cilindrada 0,000383473 0,0001625 2,35983 0,0188potencia 0,0402844 0,00656973 6,13183 0,0000peso 0,00578424 0,00095783 6,0389 0,0000aceleracion 0,111501 0,0496757 2,24458 0,0254-----------------------------------------------------------------------------
Analysis of Variance-----------------------------------------------------------------------------Source Sum of Squares Df Mean Square F-Ratio P-Value-----------------------------------------------------------------------------Model 4845,0 4 1211,25 438,70 0,0000Residual 1065,74 386 2,76099-----------------------------------------------------------------------------Total (Corr.) 5910,74 390
R-squared = 81,9694 percentR-squared (adjusted for d.f.) = 81,7826 percentStandard Error of Est. = 1,66162
46Regresión Lineal
Interpretación (inicial)
Contraste F=438 (p-valor=0.0000) ⇒ Alguno de los regresores influye significativamente en el consumo.Contrastes individuales:
La potencia y el peso influyen significativamente (p-valor=0.0000)Para α=0.05, la cilindrada y la aceleración también tienen efecto significativo (p-valor < 0.05)
El efecto de cualquier regresor es “positivo”, al aumentar cualquiera de ellos aumenta la variable respuesta: consumo.Los regresores explican el 82 % de la variabilidad del consumo (R2 = 81.969)
47Regresión Lineal
Multicolinealidad
Cuando la correlación entre los regresores es alta.
Presenta graves inconvenientes:Empeora las estimaciones de los efectos de cada variable βi: aumenta la varianza de las estimaciones y la dependencia de los estimadores)
Dificulta la interpretación de los parámetros del modelo estimado (ver el caso de la aceleración en el ejemplo).
48Regresión Lineal
Identificación de la multicolinealidad: Matriz de correlación de los regresores.
Correlations
cilindrada potencia -------------------------------------------------------cilindrada 0,8984 ( 391) 0,0000
potencia 0,8984 ( 391) 0,0000
peso 0,9339 0,8629 ( 391) ( 391) 0,0000 0,0000
aceleracion -0,5489 -0,6963 ( 391) ( 391) 0,0000 0,0000 -------------------------------------------------------
peso aceleraci----------------------------------- 0,9339 -0,5489 ( 391) ( 391) 0,0000 0,0000
0,8629 -0,6963 ( 391) ( 391) 0,0000 0,0000
-0,4216 ( 391) 0,0000
-0,4216 ( 391) 0,0000
-----------------------------------
49Regresión Lineal
Gráficos consumo - xi
peso
cons
umo
500 1000 1500 20000
4
8
12
16
20
24
potencia
cons
umo
0 40 80 120 160 200 2400
4
8
12
16
20
24
cilindrada
cons
umo
0 2 4 6 8(X 1000)
0
4
8
12
16
20
24
aceleracion
cons
umo
8 11 14 17 20 23 260
4
8
12
16
20
24
50Regresión Lineal
Consumo y aceleración
Multiple Regression Analysis-----------------------------------------------------------------------------Dependent variable: consumo----------------------------------------------------------------------------- Standard TParameter Estimate Error Statistic P-Value-----------------------------------------------------------------------------CONSTANT -1,66958 0,983305 -1,69793 0,0903cilindrada 0,000383473 0,0001625 2,35983 0,0188potencia 0,0402844 0,00656973 6,13183 0,0000peso 0,00578424 0,00095783 6,0389 0,0000aceleracion 0,111501 0,0496757 2,24458 0,0254-----------------------------------------------------------------------------
Regression Analysis - Linear model: Y = a + b*X-----------------------------------------------------------------------------Dependent variable: consumoIndependent variable: aceleracion----------------------------------------------------------------------------- Standard TParameter Estimate Error Statistic P-Value-----------------------------------------------------------------------------CONSTANT 21,5325 1,00701 21,3827 0,0000aceleracion -0,657509 0,0632814 -10,3902 0,0000-----------------------------------------------------------------------------
R. s
impl
eR
. múl
tiple
51Regresión Lineal
Multicolinealidad: efecto en la varianza de los estimadores
( )
−−
−−
−
−=−=
=
===
+++=
−
−
)1(
1
)1(
)1()1(
1
)1(||
~~~~ˆ
ˆvar
22110
212
22
21221
12
21221
122
122112
1222
21
222112
211221
2212
122121
2
1
rsrss
rrss
r
rsrss
sssr
ssrs
ss
ssn
iuixixy
XXXX
XXXXTT
i
SS
SSXXXX σββ
βββ
−−
−−
−−
=
)1()1(
)1()1(ˆˆ
var
212
22
2
21221
212
21221
212
212
21
2
2
1
rnsrsns
r
rsns
r
rns
σσ
σσ
ββ
52Regresión Lineal
Consecuencias de la multicolinealidad
Gran varianza de los estimadores βCambio importante en las estimaciones al eliminar o incluir regresores en el modelo
Cambio de los contrastes al eliminar o incluir regresores en el modelo.
Contradicciones entre el contraste F y los contrastes individuales.
53Regresión Lineal
Consumo Cilindrada Potencia Peso Aceleración Origenl/100Km cc CV kg segundos
15 4982 150 1144 12 Europa16 6391 190 1283 9 Japón24 5031 200 1458 15 USA9 1491 70 651 21 Europa11 2294 72 802 19 Japón17 5752 153 1384 14 USA12 2294 90 802 20 Europa17 6555 175 1461 12 USA18 6555 190 1474 13 USA12 1147 97 776 14 Japón16 5735 145 1360 13 USA12 1868 91 860 14 Europa9 2294 75 847 17 USA... ... ... ... ... ...
Variables cualitativas como regresores
Consumo = β0 + β1 CC + β2 Pot + β3 Peso +
+ β4 Acel + αJAP ZJAP + αUSA ZUSA + Error
USAJapónEuropa
Origen
∈∉=
∈∉=
∈∉=
EUROPA siEUROPA si
USA siUSA si
JAPON siJAPON si
ii
iZ
ii
iZ
ii
iZ
EUR
USA
JAP
10
10
10
54Regresión Lineal
Consumo Cilindrada Potencia Peso Aceleración ZJAP ZUSA ZEURl/100Km cc CV kg segundos
15 4982 150 1144 12 0 0 116 6391 190 1283 9 1 0 024 5031 200 1458 15 0 1 09 1491 70 651 21 0 0 111 2294 72 802 19 1 0 017 5752 153 1384 14 0 1 012 2294 90 802 20 0 0 117 6555 175 1461 12 0 1 018 6555 190 1474 13 0 1 012 1147 97 776 14 1 0 016 5735 145 1360 13 0 1 012 1868 91 860 14 0 0 19 2294 75 847 17 0 1 0... ... ... ... ... ... ... ...
Variables cualitativas
Consumo = β0 + β1 CC + β2 Pot + β3 Peso +
+ β4 Acel + αJAP ZJAP + αUSA ZUSA + Error
55Regresión Lineal
Interpretación var. cualitativa
Consumo = β0 + β1 CC + β2 Pot + β3 Peso +
+ β4 Acel + αJAP ZJAP + αUSA ZUSA + Error
• Coches europeos: ZJAP = 0 y ZUSA = 0 REFERENCIA
Consumo = β0 + β1 CC + β2 Pot + β3 Peso + β4 Acel + Error
• Coches japoneses: ZJAP =1 y ZUSA = 0
• Coches americanos: ZJAP =0 y ZUSA = 1
Consumo = β0 + αJAP + β1 CC + β2 Pot + β3 Peso + β4 Acel + Error
Consumo = β0 + αUSA + β1 CC + β2 Pot + β3 Peso + β4 Acel + Error
56Regresión Lineal
Interpretación del modelo
β0 + αJAP
β0
β0 + αUSA
Europeos
Japoneses
Americanos
xi
yRef.
57Regresión Lineal
Multiple Regression Analysis-----------------------------------------------------------------------------Dependent variable: consumo----------------------------------------------------------------------------- Standard TParameter Estimate Error Statistic P-Value-----------------------------------------------------------------------------CONSTANT -1,45504 1,01725 -1,43037 0,1534cilindrada 0,000322798 0,0001792 1,80133 0,0724potencia 0,0422677 0,00678898 6,22592 0,0000peso 0,00559955 0,000965545 5,79937 0,0000aceleracion 0,110841 0,0496919 2,23057 0,0263Zjap -0,361762 0,279049 -1,29641 0,1956Zusa 0,0611229 0,280236 0,218113 0,8275-----------------------------------------------------------------------------
Analysis of Variance-----------------------------------------------------------------------------Source Sum of Squares Df Mean Square F-Ratio P-Value-----------------------------------------------------------------------------Model 4852,53 6 808,756 293,48 0,0000Residual 1058,21 384 2,75575-----------------------------------------------------------------------------Total (Corr.) 5910,74 390
R-squared = 82,0969 percentR-squared (adjusted for d.f.) = 81,8171 percentStandard Error of Est. = 1,66005
58Regresión Lineal
Interpretación
El p-valor del coeficiente asociado a ZJAPes 0.1956>.05, se concluye que no existe diferencia significativa entre el consumo de los coches Japoneses y Europeos (manteniendo constante el peso, cc, pot y acel.)La misma interpretación para ZUSA.Comparando R2 =82.09 de este modelo con el anterior R2=81.98, se confirma que el modelo con las variables de Origen no suponen una mejora sensible.
59Regresión Lineal
Modelo de regresión con variables cualitativas
En general, para considerar una variable cualitativa con r niveles, se introducen en la ecuación r-1 variables ficticias
Y el nivel r no utilizado es el que actúa de
referencia
−∈−∉=
∈∉=
∈∉= − 11
10,,
2120
,1110
121 riri
zii
zii
z irii nivelnivel
nivelnivel
nivelnivel
L
iirrii
kikii
uzzzxxy
+++++++++=
−− 44444 344444 21L
L
acualitativ variable
,112211
110
αααβββ
60Regresión Lineal
Predicción
hx
hy
Media mh|xh Nueva Observ. yh|xh
hx
hm
hm
hy
hx
61Regresión Lineal
Predicción de la media mh (Regresión simple)
hh
hh
xm
xNy
10
210 ),(
ββσββ
+=+→
hx
hm
hx
hy
2
22
21
21
1010
110
)
]var[)]
)]ˆ
ˆ[
)ˆ
(
ˆ(var[
(ˆvar[]var[
]ˆˆ[]
(ˆˆˆ
xh
h
hh
hhhh
hhh
nsxx
n
xxy
xxyy
xxyE
xxyxy
mE
σσ
β
β
ββββ
βββ
−
−
−=
=+=+=
−=+=
+=
+=
+
+
−+→
2
2)(1
2,ˆ
xs
xhx
nhmNyhσ
62Regresión Lineal
Predicción de la media mh(Regresión múltiple)
hT
khkhh
hh
xxm
mNy
'
),(
110
2
xβ=
+++=→
βββσ
L
hx
hm
h'x
hy
hTT
hhh
hhhTT
h
hTT
hhT
h
hT
hT
hT
h
khhhT
hT
h
v
y
yE
y
v
EE
xxxh
'
'
']ˆ'ˆvar[]var[
'']ˆ[]'ˆ[]
),,,,1(','ˆ
1
221
21
)('
)('
var[']ˆ
ˆ[
ˆ
x
x
xβxβ
xβxβxβ
xxβ
XXx
XXx
x
−
−
=
=
=
=
=
===
==
σσ
L
→ hhhh vmNy 2,ˆ σ
63Regresión Lineal
Expresión alternativa para vhh
))()(1(
)~~
(,)()~~
()(
)](ˆvar[)(]var[)](ˆvar[]ˆvar[
)(ˆˆ
12
212
xxSxx
XXSxxXXxx
xxbxxxxb
xxb
−−+=
=−−+=
−−+=−+=
−+=
−
−
hxT
h
T
xhTT
h
hT
hhT
h
hT
h
n
nn
yyy
yy
σ
σσ
))()(1(1 1 xxSxx −−+= −
hxT
hhh nv
nv
nv
hhh
hhh
/1
/1
>⇒≠=⇒=
xx
xx
64Regresión Lineal
Intervalos de confianza para la media mh
( )
1
2
ˆ
)1,0(
ˆ
ˆ,ˆ
−−→
→
−
−→
kn
hhR
hh
hh
hh
hhh
tvs
m
Nv
m
y
yvhmNy
σ
σ
hx
hy
))(
1(1
2
2
x
hhh
s
xx
nv −
+=
hhR vsth
yh
m ˆˆ 2/α±∈
))()(1(1 1 xxSxx hh −−+= −
xT
hh nv
Regresión simple
65Regresión Lineal
Predicción de una nueva observación yh (reg.simple)
hh
hh
xm
mNy
10
2 ),(
ββσ
+=→
hx hx
hy
hh
hhh
hhh
hhh
hhhh
hh
v
yye
yEyEeE
yye
vmNy
xy
22
2
10
]ˆvar[]var[]~var[
0]ˆ[][]~[
ˆ~),(ˆ
ˆˆˆ
σσ
σ
ββ
+=
+==−=
−=→
+=
))1(,0(~ 2hhh vNe +→ σ
hm
hy
66Regresión Lineal
Predicción de una nueva observación yh (Reg. Múltiple)
hx
hm
hx
hy
+=+==−=
→−=
→+=
)1(]ˆvar[]var[]~var[
0]ˆ[][]~[ˆ~
),(ˆˆˆ
2
2
hhhhh
hhhhhh
hhhhhT
h
vyye
yEyEeEyye
vmNyyy
σ
σxb
))1(,0(~ 2hhh vNe +→ σ
hy
67Regresión Lineal
Intervalos de predicción para una nueva observación yh
( )
1
2
1ˆ
ˆ
)1,0(1
ˆˆ~ )1(,0~
−−→+
→+−
−−=
+→
kn
hhR
hh
hh
hh
hhh
hhh
tvs
y
Nv
yy
y
yye
vNe
σ
σ
hhR vsth
yh
y +±∈ 1ˆˆ 2/α
hx
hy
68Regresión Lineal
kk xxy βββ ˆˆˆˆ 110 +++= L
Límites de predicción
x
y hhR vsth
yh
y +±∈ 1ˆˆ 2/α
hhR vsth
yh
m ˆˆ 2/α±∈
69Regresión Lineal
Diagnosis: Residuos
)ˆˆˆ( 110 kikiii xxye βββ +++−= L
+
=
nkknnn
k
k
n e
e
e
xxx
xxx
xxx
y
y
y
MM
L
MOMMM
L
L
M2
1
1
0
21
22212
12111
2
1
ˆ
ˆ
ˆ
1
1
1
β
ββ
32143421321ResiduosPrevistosObservados
ˆ eβXY +=
70Regresión Lineal
Distribución de los residuos
−=−−==−=−=
→
=
−=→
−
V)(IV)(Y)(IV)(Ie0V)Xβ(IYV)(Ie
e
XX)X(XV
V)Y(IeIXβY
T1T
2
2
var]var[][][
),(
σ
σ
EE
N
Normal
))1(,0(
),(
2iii vNe
N
−→
−→
σ
σ V)(I0e 2
71Regresión Lineal
Distancia de Mahalanobis
>⇒≠=⇒=⇒
−−= −
00
.()()(
2
2
12
i
i
ixT
ii
DD
D
xxxxxx
xxSxx
i
ii
a de distancia la Mide
s)Mahalanobi de Dist
TT
ii v
XX)X(XV 1−=
Vmatriz la de diagonales elementos los son
11
0)1(,1
22
,1
2
1
≤≤⇒≥=−⇒+== ∑∑∑≠=≠==
ii
n
ijjijiiiiii
n
ijjijji
n
jijii v
nvvvvvvvv
))()(1(1
')(' 11 xxSxxxXXx −−+== −−ix
Tii
TTiii
nv
72Regresión Lineal
Residuos estandarizados
iivRs
ieir
eev
env
ve
iiiii
iiii
iii
−=
≈⇒≈⇒≈⇒
≈⇒≈⇒
−=
1ˆ
adosestandariz Residuos
00)var(1 de lejos está Cuando
)var(/1 a próximo está Cuando
)1()var(
2
2
xx
xx σ
σ
))1(,0( 2σiii vNe −→
73Regresión Lineal
Hipótesis de normalidad
Herramientas de comprobación:Histograma de residuos
Gráfico de probabilidad normal (Q-Q plot)
Contrastes formales (Kolmogorov-Smirnov)
Ejemplo de coches
Residuos-9 -6 -3 0 3 6 9
0
20
40
60
80
100
120
-6 -4 -2 0 2 4 6
Residuos
0,1
1
5
20
50
80
95
99
99,9
prob
abil
idad
74Regresión Lineal
Comprobación de la linealidad y homocedasticidad
Ambas hipótesis se comprueban conjuntamente mediante gráficos de los residuos
Frente a valores previstos
Frente a cada regresor.
En muchas ocasiones se corrige la falta de linealidad y la heterocedasticidadmediante transformación de las variables.
ikikii
ikikii
uxxy
uxxy
++++=
++++=
logloglog
log
110
110
βββ
βββ
L
L
75Regresión Lineal
Residuos - Valores previstos
0
iy
ie
0
iy
ie
0
iy
ieLineal y homocedástico No lineal y homocedástico
Lineal y no homocedástico
0
iy
ie
No lineal y no homocedástico
76Regresión Lineal
Ejemplo 1: Cerezos Negros
Se desea construir un modelo de regresión para obtener el volumen de madera de una “cerezo negro” en función de la altura del tronco y del diámetro del mismo a un metro sobre el suelo. Se ha tomado una muestra de 31 árboles. Las unidades de longitudes son pies y de volumen pies cúbicos.
77Regresión Lineal
Cerezos negros: Datos
Árbol Diametro Altura Volumen Árbol Diametro Altura Volumen1 8,3 70 10,30 17 12,9 85 33,802 8,6 65 10,30 18 13,3 86 27,403 8,8 63 10,20 19 13,7 71 25,704 10,5 72 16,40 20 13,8 64 24,905 10,7 81 18,80 21 14,0 78 34,506 10,8 83 19,70 22 14,2 80 31,707 11,0 66 15,60 23 14,5 74 36,308 11,0 75 18,20 24 16,0 72 38,309 11,1 80 22,60 25 16,3 77 42,6010 11,2 75 19,90 26 17,3 81 55,4011 11,3 79 24,20 27 17,5 82 55,7012 11,4 76 21,00 28 17,9 80 58,3013 11,4 76 21,40 29 18,0 80 51,5014 11,7 69 21,30 30 18,0 80 51,0015 12,0 75 19,10 31 20,6 87 77,0016 12,9 74 22,20
78Regresión Lineal
Gráficos x-y
Altura
Vol
umen
60 65 70 75 80 85 900
20
40
60
80
Diametro
Vol
umen
8 11 14 17 20 230
20
40
60
80
79Regresión Lineal
Primer modelo:cerezos negros
Standard TParameter Estimate Error Statistic P-Value-----------------------------------------------------------------------------CONSTANT -57,9877 8,63823 -6,71291 0,0000Altura 0,339251 0,130151 2,60659 0,0145Diametro 4,70816 0,264265 17,8161 0,0000-----------------------------------------------------------------------------
Analysis of Variance-----------------------------------------------------------------------------Source Sum of Squares Df Mean Square F-Ratio P-Value-----------------------------------------------------------------------------Model 7684,16 2 3842,08 254,97 0,0000Residual 421,921 28 15,0686-----------------------------------------------------------------------------Total (Corr.) 8106,08 30
R-squared = 94,795 percentR-squared (adjusted for d.f.) = 94,4232 percent
ErrorAlturaDiametroVolumen +++= 210 βββ
80Regresión Lineal
Diagnosis
Diametro8 11 14 17 20 23
-9
-6
-3
0
3
6
9
valores previstos0 20 40 60 80
-9
-6
-3
0
3
6
9
resi
duos
resi
duosFalta de
linealidad
Falta de homocedasticidad
81Regresión Lineal
Transformación
errordiámetro)altura)vol)
diámetroalturakvol
20
2
+++≈××≈
log(log(log( 1 βββDependent variable: log(Volumen)----------------------------------------------------------------------------- Standard TParameter Estimate Error Statistic P-Value-----------------------------------------------------------------------------CONSTANT -6,63162 0,79979 -8,2917 0,0000log(Altura) 1,11712 0,204437 5,46439 0,0000log(Diametro) 1,98265 0,0750106 26,4316 0,0000-----------------------------------------------------------------------------
Analysis of Variance-----------------------------------------------------------------------------Source Sum of Squares Df Mean Square F-Ratio P-Value-----------------------------------------------------------------------------Model 8,12323 2 4,06161 613,19 0,0000Residual 0,185463 28 0,00662369-----------------------------------------------------------------------------Total (Corr.) 8,30869 30
R-squared = 97,7678 percentR-squared (adjusted for d.f.) = 97,6084 percent
82Regresión Lineal
Diagnosis (modelo transformado)
log(Altura)4,1 4,2 4,3 4,4 4,5
-0,17
-0,07
0,03
0,13
0,23
log(Diametro)2,1 2,3 2,5 2,7 2,9 3,1
-0,17
-0,07
0,03
0,13
0,23
valores previstos2,3 2,7 3,1 3,5 3,9 4,3 4,7
-0,17
-0,07
0,03
0,13
0,23
resi
duos
resi
duos
resi
duos
-0,17 -0,12 -0,07 -0,02 0,03 0,08 0,13
Residuos
0,1
15
20
50
80
9599
99,9
prob
abili
dad
83Regresión Lineal
Interpretación
Se comprueba gráficamente que la distribución de los residuos es compatible con las hipótesis de normalidad y homocedasticidad.El volumen está muy relacionada con la altura y el diámetro del árbol (R2= 97.8%)El modelo estimado
log(Vol) = -6.6 + 1.12 log(Alt) + 1.98 log(Diam.) + Error
es compatible con la ecuación vol=k × Alt ×Diam2
La varianza residual es 0.006623, es decir sR=0.081 que indica que el error relativo del modelo en la predicción del volumen es del 8.1%.
84Regresión Lineal
Datos olímpicos
Se pretende construir un modelo de regresión con dos objetivos:
Medir la evolución de estas marcas con el tiempo.Hacer una predicción del resultado en unas futuras olimpiadas.
Tiempos de los campeones olímpicos en 200m, 400m, 800m y 1500m.
85Regresión Lineal
Ejemplo: Carreras olímpicas
Ciudad Altitud Año 200 m 400 m 800 m 1500 mParís 79 1900 22,20 49,40 121,40 246,00San Luis 138 1904 21,60 49,20 116,00 245,40Londres 15 1908 22,40 50,00 112,80 243,40Estocolmo 15 1912 21,70 48,20 111,90 236,80Amberes 4 1920 22,00 49,60 113,40 241,80París 79 1924 21,60 47,60 112,40 233,60Amsterdan -2 1928 21,80 47,80 111,80 233,20Los Ángeles 100 1932 21,20 46,20 109,80 231,20Berlín 50 1936 20,70 46,50 112,90 227,80Londres 15 1948 21,10 46,20 109,20 225,20Helsinki 25 1952 20,70 45,90 109,20 225,20Melbourne 115 1956 20,60 46,70 107,70 221,20Roma 15 1960 20,50 44,90 106,30 215,60Tokyo 14 1964 20,30 45,10 105,10 218,10Mexico 2220 1968 19,83 43,80 104,30 214,90Munich 458 1972 20,00 44,66 105,90 216,30Montreal 53 1976 20,23 44,26 103,50 219,20Moscú 150 1980 20,19 44,60 105,40 218,40Los Ángeles 100 1984 19,80 44,27 104,00 212,53Seúl 34 1988 19,75 43,87 103,45 215,96Barcelona 0 1992 20,01 43,50 103,66 220,12Atlanta 320 1996 19,32 43,49 102,58 215,78
86Regresión Lineal
Tiempo = β0 + β1 Año + β2 Distancia + Error
Dependent variable: Tiempo----------------------------------------------------------------------------- Standard TParameter Estimate Error Statistic P-Value-----------------------------------------------------------------------------CONSTANT 268,485 36,8179 7,29222 0,0000Año -0,145478 0,0188741 -7,70784 0,0000Distancia 0,159578 0,00113405 140,715 0,0000-----------------------------------------------------------------------------
Analysis of Variance-----------------------------------------------------------------------------Source Sum of Squares Df Mean Square F-Ratio P-Value-----------------------------------------------------------------------------Model 554892,0 2 277446,0 9930,11 0,0000Residual 2374,89 85 27,9399-----------------------------------------------------------------------------Total (Corr.) 557267,0 87
R-squared = 99,5738 percentR-squared (adjusted for d.f.) = 99,5638 percent
87Regresión Lineal
Diagnosis
Distancia
Res
iduo
s
0 200 400 600 800 1000 1200 1400 1600-15
-10
-5
0
5
10
15
Valores previstos
resi
duos
0 50 100 150 200 250-15
-10
-5
0
5
10
15
residuos
prob
abili
dad
-16 -12 -8 -4 0 4 8 12 160,1
15
2050
80
9599
99,9
88Regresión Lineal
Interpretación
Los gráficos de los residuos con la distancia y con los valores previstos muestran falta de linealidad yheterocedasticidad (leve)El gráfico Q-Q muestra falta de normalidadLa transformación 1/Tiempo puede servir para corregir el problema deheterocedasticidad. En este caso es más útil modelar la velocidad
iiiTiempoDistanciaVelocidad /=
89Regresión Lineal
Velocidad = β0 + β1 Año + β2 Dist. + Error
Dependent variable: Velocidad----------------------------------------------------------------------------- Standard TParameter Estimate Error Statistic P-Value-----------------------------------------------------------------------------CONSTANT -12,2153 2,73592 -4,46478 0,0000Año 0,0112286 0,00140252 8,00603 0,0000Distancia -0,00220474 0,0000842706 -26,1627 0,0000-----------------------------------------------------------------------------
Analysis of Variance-----------------------------------------------------------------------------Source Sum of Squares Df Mean Square F-Ratio P-Value-----------------------------------------------------------------------------Model 115,492 2 57,7459 374,29 0,0000Residual 13,1139 85 0,154281-----------------------------------------------------------------------------Total (Corr.) 128,606 87
R-squared = 89,803 percentR-squared (adjusted for d.f.) = 89,5631 percent
90Regresión Lineal
Diagnosis
Distancia
Res
iduo
s
0 200 400 600 800 1000 1200 1400 1600-0,8
-0,4
0
0,4
0,8
Valores previstos
resi
duos
6 7 8 9 10 11-0,8
-0,4
0
0,4
0,8
-0,8 -0,5 -0,2 0,1 0,4 0,7
Residuos
0,1
1
5
20
50
80
95
99
99,9
Res
iduo
s
91Regresión Lineal
Velocidad = β0 + β1 Año + β2 Dist. + β3 Dist.2 + Error
Dependent variable: Velocidad----------------------------------------------------------------------------- Standard TParameter Estimate Error Statistic P-Value-----------------------------------------------------------------------------CONSTANT -11,1792 0,834388 -13,3981 0,0000Año 0,0112286 0,000427338 26,2758 0,0000Distancia -0,00588973 0,000130341 -45,1873 0,0000Distancia^2 0,0000021172 7,34191E-8 28,8371 0,0000-----------------------------------------------------------------------------
Analysis of Variance-----------------------------------------------------------------------------Source Sum of Squares Df Mean Square F-Ratio P-Value-----------------------------------------------------------------------------Model 127,403 3 42,4675 2964,98 0,0000Residual 1,20314 84 0,014323-----------------------------------------------------------------------------Total (Corr.) 128,606 87
R-squared = 99,0645 percentR-squared (adjusted for d.f.) = 99,0311 percent
92Regresión Lineal
Diagnosis
Distancia
resi
duos
0 200 400 600 800 1000 1200 1400 1600-0,5
-0,25
0
0,25
0,5
valores previstos
resi
duos
6 7 8 9 10 11-0,5
-0,25
0
0,25
0,5
Residuos
prob
abili
dad
-0,31 -0,21 -0,11 -0,01 0,09 0,19 0,290,1
1
5
20
50
80
95
99
99,9
93Regresión Lineal
Interpretación
El modelo cumple las condiciones de normalidad y homocedasticidad.El coeficiente de determinación R2=99% da una medida de la bondad de ajuste del modelo.El coeficiente positivo del AÑO indica que conforme pasan los años se aumenta la velocidad (se mejoran las marcas). El término dominante de la variable DISTANCIA tiene coeficiente negativo que indica que la velocidad media disminuye al aumentar la distancia de la prueba.Se mejora ligeramente el modelo con una nueva variable ALTITUD de la ciudad donde se desarrolla las olimpiadas.
94Regresión Lineal
Vel. = β0+β1 Año+β2 Dist. + β3 Dist.2 + log(Alt)+Error
Dependent variable: Velocidad----------------------------------------------------------------------------- Standard TParameter Estimate Error Statistic P-Value-----------------------------------------------------------------------------CONSTANT -10,6966 0,807542 -13,2459 0,0000Año 0,0109342 0,000416677 26,2413 0,0000Distancia -0,00588973 0,000123874 -47,5461 0,0000Distancia^2 0,0000021172 6,97766E-8 30,3425 0,0000log(Altitud+3) 0,0237773 0,00751947 3,1621 0,0022-----------------------------------------------------------------------------
Analysis of Variance-----------------------------------------------------------------------------Source Sum of Squares Df Mean Square F-Ratio P-Value-----------------------------------------------------------------------------Model 127,532 4 31,883 2464,46 0,0000Residual 1,07378 83 0,0129371-----------------------------------------------------------------------------Total (Corr.) 128,606 87
R-squared = 99,1651 percentR-squared (adjusted for d.f.) = 99,1248 percent
95Regresión Lineal
Predicción Sydney 2000
Predicción para Velocidad - AÑO 2000 - SYDNEY------------------------------------------------------------------------ Fitted Stnd. Error Lower 95,0% CL Upper 95,0% CL
Row Value for Forecast for Forecast for Forecast ------------------------------------------------------------------------ 200 m 10,1114 0,119833 9,87302 10,3497 400 m 9,18748 0,118783 8,95123 9,42374 800 m 7,84784 0,119901 7,60937 8,08632 1500 m 7,13371 0,120308 6,89442 7,373
------------------------------------------------------------------------
Resultado Error ErrorDistancia Lím. Inf. Lím. Sup. Predicción Sydney 2000 Absoluto Relativo
200 m 19,32 20,26 19,78 20,09 0,31 2%400 m 42,44 44,69 43,538 43,84 0,302 1%800 m 98,93 105,13 101,939 95,08 -6,859 -7%1500 m 203,44 217,57 210,269 212,07 1,801 1%
Intervalo de predicción (95%)
Predicción del tiempo (segundos) y resultados Sydney 2000
Capítulo 6. Regresión lineal
6.1 Con los datos de la tabla, se pide:
x -2 -2 -1 -1 0 0 1 1 2 2 3 3y 1.1 1.3 2.0 2.1 2.7 2.8 3.4 3.6 4.0 3.9 3.8 3.6
(a) Estimar un modelo de regresión simple con y como variable dependiente y x como regresor.Indicar si el modelo es apropiado, justificando la respuesta.
(b) Estimar el modelo
yi = β0 + β1xi + β2x2i + ui.
6.2 La ley de Hubble sobre la expansión del universo establece que dadas dos galaxias la velocidad dedesplazamiento de una respecto a la otra es v = Hd, siendo d su distancia y H la constante deHubble. La tabla proporciona la velocidad y la distancia de varias galaxias respecto a la Via Láctea.Se pide:
Galaxia Distancia Velocidad(millones años luz) (103km/s)
Virgo 22 1.21Pegaso 68 3.86Perseo 108 5.15Coma Berenices 137 7.56Osa Mayor 1 255 14.96Leo 315 19.31Corona Boreal 390 21.56Géminis 405 23.17Osa Mayor 2 700 41.83Hidra 1100 61.14
Tabla: Distancia y velocidad de desplazamiento de las distintas galaxias a la Via Lactea.
Nota: Obsérvese que según el modelo de Hubble la regresión debe pasar por el origen. Tómese 1año luz = 300 000 km/s × 31 536 000 s = 9.46 1012 km.
(a) Estimar por regresión la constante de Hubble.(b) Como T = d/v = d/Hd = 1/H, la inversa de la constante de Hubble representa la edad
estimada del Universo. Construir un intervalo de confianza del 95% para dicha edad .
6.3 Estimar por máxima verosimilitud los parámetros β1 y β2 del modelo
yi = β1x1i + β2x22i + ui ;ui ; N(0,σ).
¿En qué condiciones los estimadores obtenidos por máxima verosimilitud son iguales que los obtenidospor mínimos cuadrados?
6.4 Sir Francis Galton (1877) estudió la relación entre la estatura de una persona (y) y la estatura desus padres (x) obteniendo las siguientes conclusiones:
1
(a) Existía una correlación positiva entre las dos variables.(b) Las estaturas de los hijos cuyos padres medían más que la media era, en promedio, inferior
a la de sus progenitores, mientras que los padres con estatura inferior a la media enpromedio tenían hijos más altos que ellos, calificando este hecho como de ”regresión” a lamedia.
Contrastar (α = 0.05) estas dos conclusiones con la ecuación y = 17.8 + 0.91x resultante de estimarun modelo de regresión lineal entre las variables (en cm.) descritas anteriormente para unamuestra de tamaño 100 si la desviación típica (estimada) de β1 es 0.04.
6.5 Demostrar que en un modelo de regresión simple y y el estimador de la pendiente β1 son indepen-dientes. Utilizar esta propiedad para calcular la varianza de β0 = y − β1x.
6.6 La matriz de varianzas de las variables X1, X2 e Y es
25 27 1427 36 19.214 19.2 16
Siendo X1 = 30,X2 = 40, Y = 100 y el número de datos n = 10. Se pide:
(a) Realizar la regresión simple entre Y (variable dependiente) y X1, dando el intervalo deconfianza para la pendiente de la recta con α = 0.05. Hacer lo mismo con Y y X2.
(b) Realizar la regresión múltiple entre Y (variable dependiente) y X1,X2, en desviaciones ala media.
(c) Indicar si los coeficientes de la regresión anterior son significativos.(d) Calcular R2 para los tres modelos, comentar los resultados obtenidos e indicar qué modelo
eligiría y por qué.
6.7 Demostrar que el coeficiente de correlación múltiple en el modelo general de regresión es igual alcoeficiente de correlación lineal entre la variable observada y y la prevista by.
6.8 La resistencia a la tracción (y) de una aleación metálica en función de la temperatura de templado(x) se ha ajustado con una ecuación de regresión para 30 observaciones resultando:
y = 276.1 + 1.9x, sR = 15.7, R2 = 0.43
¿Se puede concluir con una confianza del 95% que la temperatura de templado tiene efecto signi-ficativo en la resistencia a la tracción.?
6.9 El coeficiente de determinación en un modelo de regresión simple es R2 = 0.75. Si el número deobservaciones es n = 100, contrasta la hipótesis H0 : β1 = 0 frente a la alternativa H1 : β1 6= 0(α = 0.05).
6.10 La masa M de un cristal de hielo depositado en una cámara a temperatura (-5oC) y humedadrelativa constante crece según la ecuación M = αT β, donde T es el tiempo y α y β son parámetros
2
desconocidos. La relación anterior se linealiza con la transformación logarítmica, estimándose elsiguiente modelo
logM = logα+ β log T + u
donde el término añadido u son los errores experimentales, que se consideran aleatorios e indepen-dientes con distribución normal, N(0,σ2). Diez cristales del mismo tamaño y forma se introdujeronen una cámara, extrayéndose secuencialmente según unos tiempos previamente establecidos. Paradeterminar la influencia del tipo de cámara, se repitió exáctamente el experimento en una segundacámara. Los valores de sR para la cámara 1 y 2 son 0.64 y 0.50, respectivamente. Los modelosestimados para cada cámara, XTX y (XTX)−1 son:
logM1 = −7.30 + 2.40 log TlogM2 = −5.74 + 2.03 log T XTX =
µ10.00 46.6646.66 218.9
¶
(XTX)−1 =µ18.27 −3.89−3.89 0.835
¶(a) Contrastar con nivel de significación 0.05 si los dos modelos tienen la misma pendiente. Lo
mismo para la ordenada en el origen. (NOTA.- Aceptar que la varianza de los dos modeloses la misma y estimarla como el promedio de las dos varianzas residuales calculadas.)
(b) Un modelo de regresión múltipleY = Xβ +U, se replica, es decir se obtienen dos vectoresde variables respuesta Y1,Y2, para los mismo regresores (matriz X). Demostrar que siβ1 y β2 son los resultados de la estimación de β utilizando por separado la variable Y1 eY2; entonces el estimador de β con todos los datos es (β1+β2)/2.
(c) Estimar un único modelo con los datos de las dos cámaras. Sabiendo que YTY = 306.8,donde Y = logM , dar un intervalo de confianza al 99% para los dos parámetros.
6.11 Se ha estimado un modelo de regresión para la estatura (y) de un grupo de adultos y sus estaturasa los 7 (x1) y 14 (x2) años. La desviación típica residual obtenida es 5 cm y la desviación típicadel coeficiente de x1 (estatura a los 7 años) resulta 2.4, siendo este efecto no significativo al 95%.Sin embargo, un segundo modelo de regresión que incluya sólo a esta variable (x1) conduce a unadesviación típica residual de 7 cm y a un coeficiente de regresión de 2 con desviación típica de 1.¿Qué podemos concluir con estos resultados de la correlación entre x1 y x2?
6.12 En la tabla 1 se muestran los resultados de un experimento en el que se estudiaron las pérdidas porabrasión (rozamiento) de material de goma empleado en la fabricación de neumáticos en funciónde la dureza de la goma en grados Shore y de su resistencia a la tensión. Esta última variable estárepresentada por dos únicos valores, -1 para las gomas con una resistencia máxima a la tensión menorde 180 kg/cm2 y con +1 aquellas que presentan una resistencia máxima superior a 180 kg/cm2. Losresultados del modelo de regresión múltiple (P erdidas = β0+β1Dureza+β2 Re sistencia +ui) semuestran en las tablas 1 y 2.
(a) ¿Hay diferencias significativas en las pérdidas observadas en gomas con resistencia baja(-1) y en gomas con resistencia alta (+1)?. Explicar el significado de β2 (coeficiente deResistencia) y dar un intervalo de confianza de 95% para el mismo.
3
(b) Para comprobar si el efecto de la dureza en las pérdidas es el mismo para las gomas donresistencia alta y baja se planteó el siguiente modelo:P erdidas = β0 + β1Dureza+ β2Re sistencia+ β3Dureza×Re sistencia+ ui.Explicar de forma concisa el significado de cada uno de los tres parámetros del modelo.
(c) Los resultados de la estimación del modelo del apartado 2 se proporcionan en la tabla 3 yen la figura siguiente. Teniendo en cuenta los resultados de la tabla 2 y 3, elegir el modeloque relaciona las pérdidas por rozamiento con las variables resistencia y dureza. Justificarla respuesta. ¿Por qué cambia tanto el nivel crítico (p-value) correspondiente a la variableResistencia en uno y otro modelo?.
(d) En la tabla 1 se proporcionan los valores previstos y los residuos del modelo anterior.Comprobar la hipótesis de homocedasticidad.
DATOS RESULTADOSDureza Resistencia Pérdidas Predicción Residuos53 -1 221 227,1 -6,155 -1 206 215,1 -9,156 -1 228 209,1 18,960 -1 166 185,1 -19,261 -1 175 179,2 -4,264 -1 164 161,2 2,866 -1 154 149,2 4,868 -1 113 137,3 -24,371 -1 136 119,3 16,771 -1 112 119,3 -7,375 -1 128 95,4 32,679 -1 82 71,4 10,681 -1 55 59,4 -4,481 -1 32 59,4 -27,486 -1 45 29,5 15,545 1 372 378,4 -6,451 1 341 342,5 -1,559 1 249 294,6 -45,659 1 340 294,6 45,465 1 283 258,7 24,368 1 196 240,7 -44,771 1 219 222,8 -3,874 1 267 204,8 62,280 1 186 168,9 17,181 1 215 162,9 52,182 1 155 156,9 -1,983 1 97 150,9 -53,986 1 148 133,0 15,088 1 64 121,0 -57,089 1 114 115,0 -1,0
TABLA 1. Datos, valores previstos y residuos del modelo de regresión: P erdidas = β0 + β1Dureza+β2Re sistencia+ ui
4
TABLA 2.
Multiple Regression AnalysisDependent variable: PerdidasParameter Estimate Standard Error T Statistic P-ValueCONSTANT 596,075 32,8079 18,1686 0,0000Dureza -5,98636 0,46042 -13,0019 0,0000Resistencia 51,7421 5,51215 9,38692 0,0000
Analysis of VarianceSource Sum of Squares Df Mean Square F-ratio P-ValueModel 200957,0 2 100478,0 112,78 0,0000Residual 24054,6 27 890,909Total (Corr.) 225011,0 29
R-squared=89,3096 percentR-squared (adjusted for d.f.)=88,5177 percentStandard Error of Est.=29,8481Mean absolute error =21,1946Durbin-Watson statistic=2,25411
TABLA 3.
Multiple Regression AnalysisDependent variable: PerdidasParameter Estimate Standard Error T Statistic P-ValueCONSTANT 592,59 34,4264 17,2132 0,0000Dureza -5,93173 0,486879 -12,1832 0,0000Resistencia 65,4644 34,4264 1,90157 0,0684Dureza×Resistencia -0,196688 0,486879 -0,403978 0,6895
Analysis of VarianceSource Sum of Squares Df Mean Square F-ratio P-ValueModel 201107,0 3 67035,6 72,91 0,0000Residual 23904,5 26 919,404Total (Corr.) 23904,5 29
R-squared=89,3763 percentR-squared (adjusted for d.f.)=88,1505 percentStandard Error of Est.=30,3217Mean absolute error =21,1085Durbin-Watson statistic=2,25622
6.13 Se ha estimado un modelo de regresión múltiple para estudiar el efecto de tres regresores x1, x2, x3sobre la resistencia de ciertas fibras textiles con n = 15 observaciones, resultando:
yi = 17.36 + 0.95x1i + 1.03x2i − 1.58x3i, s2R = 2.54, R2 = 0.92
Realiza el contraste general de regresión y los contrastes individuales (α = 0.05) si
5
(XT X)−1 =
0.0051 −0.0041 0.0204−0.0041 0.4033 0.18360.0204 0.1836 0.4818
.6.14 Los datos mostrados son el resultado de un experimento para caracterizar la duración de un material
utilizado en un torno de corte de acero, en función de la velocidad de corte (X1) y del ratio dealimentación (X2). Por sencillez, las variables se han escalado de la siguiente forma
V =X1 − 900300
, F =X2 − 136
V F Y V F Y-1 -1 54.5 -
√2 0 20.1
-1 -1 66.0√2 0 2.9
1 -1 11.8 0 0 3.81 -1 14.0 0 0 2.2-1 1 5.2 0 0 3.2-1 1 3.0 0 0 4.01 1 0.8 0 0 2.81 1 0.5 0 0 3.20 -
√2 86.5 0 0 4.0
0√2 0.4 0 0 3.5
y se ha estimado el siguiente modelo
log(Yi) = β0 + β1Vi + β2Fi + β3V2i + β4F
2i + β5Vi × Fi + Ui
siendo Ui errores aleatorios con distribución normal de media cero y varianza constante. y se haestimado el siguiente modelo
log(Yi) = β0 + β1Vi + β2Fi + β3V2i + β4F
2i + β5Vi × Fi + Ui
siendo Ui errores aleatorios con distribución normal de media cero y varianza constante. Losresultados principales del análisis son los de la siguiente tabla.
Interpreta los resultados del análisis de regresión, indica de forma específica los resultados de los con-trastes individuales de los parámetros βi y del contraste general de regresión si se utiliza un nivelde significación α = 0.01.
6
Análisis de Regresión Múltiple----------------------------------------------------------------------------Variable Dependiente: LOG10(Duración)----------------------------------------------------------------------------- Desviación Estadístico Parámetro Estimación Típica t P-Valor-----------------------------------------------------------------------------CONSTANTE 0,515979 0,045626 11,3089 0,0000V -0,343176 0,0372527 -9,21213 0,0000F -0,690076 0,0372536 -18,5237 0,0000V^2 0,181733 0,0436797 4,16058 0,0010F^2 0,125106 0,043684 2,86389 0,0125V x F -0,0316418 0,045626 -0,693503 0,4993-----------------------------------------------------------------------------
Análisis de la Varianza----------------------------------------------------------------------------- Suma de Grados CuadradosFuente Cuadrados Libertad Medios F P-Valor-----------------------------------------------------------------------------Modelo 7,60038 5 1,52008 91,27 0,0000Residual 0,233154 14 0,0166539-----------------------------------------------------------------------------Total (Corr.) 7,83354 19
6.15 En un modelo de regresión simple se ha obtenido un coeficiente de correlación igual a −0.8. Si elnúmero de observaciones es n = 150, y = 22 y la variabilidad total es 320. Construir un intervalode confianza al 95% para el valor medio de la variable dependiente (y) cuando x (regresor) esigual a x. (Aproximar la distribución t de Student correspondiente por una distribución normal, siZ ; N(0, 1), P (Z ≤ 1.96) = 0.975).
6.16 Sea x1 la altura del tronco de un árbol y x2 el diámetro del mismo en su parte inferior. El volumeny del tronco de árbol puede ser calculado aproximadamente con el modelo
yi = αx1ix22i + ui,
según el cual, el volumen del tronco es proporcional al volumen de un cono con las medidas x1i, x2i,siendo α el parámetro (desconocido) de proporcionalidad, más una componente de error aleatorioui. La tabla siguiente contiene los datos (en metros y metros cúbicos) correspondientes a unamuestra aleatoria de 15 troncos de una variedad de pino.
Obs. x1i x2i x1ix22i yi Obs. x1i x2i x1ix
22i yi
1 10,1 0,117 0,14 0,062 9 19,8 0,297 1,75 0,8212 11,3 0,13 0,19 0,085 10 26,8 0,328 2,90 1,2803 20,4 0,142 0,41 0,204 11 21 0,351 2,60 1,0344 14,9 0,193 0,56 0,227 12 27,4 0,376 3,90 1,6795 23,8 0,218 1,13 0,47 13 29 0,389 4,40 2,0736 19,5 0,236 1,09 0,484 14 27,4 0,427 5,00 2,0227 21,6 0,257 1,43 0,623 15 31,7 0,594 11,2 4,6308 22,9 0,269 1,66 0,722
7
(a) Estimar α por máxima verosimilitud suponiendo que las variables ui tienen distribuciónnormal de media cero, con la misma varianza e independientes.
(b) Un tronco tiene una altura de 20 metros y un diametro de 0.25 metros, dar un intervalo depredicción de su volumen (95% de confianza). La varianza residual del modelo es 0,0058.
(c) En el análisis de los residuos se observa que la varianza de los errores crece con el volumendel tronco. Para obtener homocedasticidad se propone el siguiente modelo transformadoutilizando logaritmos neperianos,
log yi = β0 + β1 log x1i + β2 log x2i + ui
El resultado de la estimación es:
Parámetro Estimaciónβ0 -1,45β1 1,14β2 1,86
y cMbβ = 0, 1250 0, 0212 −0, 0317
0, 0212 0, 0082 −0, 0051−0, 0317 −0, 0051 0, 0042
siendocMbβ = bs2R(XTX)−1 (X es la matriz de los regresores transformados según el modelo)La transformación logarítmica del modelo inicial (αx1ix22i) implicaría que β1 = 1 y β2 = 2.Contrastar (nivel de significación 0.05) si estos dos valores son aceptables.
(d) Con este modelo, dar un intervalo de predicción (95% de confianza) para el volumen deltronco del apartado 2 si la varianza residual es 0,0031.
6.17 La empresa de bebidas gaseosas CIBELES quiere determinar la influencia sobre la presión interna(yi) en los botes de refresco de dos variables continuas (x1, x2) y del tipo de bebida (NARANJA=1,LIMÓN=2 y COLA=3). Para distintos valores de x1 y x2 y 20 botes de cada sabor, ha medidola presión interna. El tipo de bebida se representa por las variables z1, z2 y z3 qué identifican elsabor NARANJA, LIMÓN y COLA, respectivamente. El modelo estimado de regresión de y conrespecto a x1, x2, z2 y z3 es:
y = 19.4 + 77.2x1 − 50.8x2 + 2.95z2 + 5.52z3; bsR = 4.32donde
(XTX)−1 =
0.1772 −0.6909 −0.5043 −0.0605 −0.0896−0.6909 5.8085 0.2541 0.1478 0.2444−0.5043 0.2541 5.0070 −0.0680 0.1216−0.0605 0.1478 −0.0680 0.1049 0.0546−0.0896 0.2444 0.1216 0.0546 0.1127
(a) Realizar los contrastes individuales con α = 0.01, indicando las variables que influyen
significativamente en la presión. Interpretar el resultado explicando el significado de cadaparámetro.
(b) Si se realiza una regresión entre la presión interna (yi) y las dos variables continuas x1 yx2 se obtiene el siguiente modelo de regresión
y = 23.86 + 65.1x1 − 56.3x2; sR = 4.78.
Contrastar (α = 0.01) conjuntamente que el tipo de bebida no influye. (H0 : α2 = α3 = 0frente a H1 : α2 ó α3 es distinto de cero).
8
(c) ¿Existe diferencia significativa en las presiones internas de los botes de LIMÓN y COLA?(α = 0.01)
6.18 Se ha ajustado el siguiente modelo de regresión múltiple con una muestra de 86 vehículos, delos cuales 31 son japoneses , 41 norteamericanos y 14 europeos, dónde la variable dependiente esel consumo, y los regresores: Pot (potencia) está expresada en unidades de 100 Cv, el Peso enToneladas, ZJ toma el valor 1 si el coche es japonés y cero en los demás, y ZE toma el valor 1 paralos coches europeos y cero en los demás.
by = 3.305 + 0.843 Pot+ 3.829 Peso+ 0.440 ZJ + 1.127 ZE bs2R = 0.506, R2 = 75.7%
(XTX)−1 =
4.791e− 1 5.054e− 2 −3.794e− 1 −9.157e− 2 −4.682e− 25.054e− 2 1.595e− 1 −1.931e− 1 −3.443e− 3 −1.262e− 2−3.794e− 1 −1.931e− 1 4.646e− 1 5.210e− 2 2.865e− 2−9.157e− 2 −3.443e− 3 5.210e− 2 6.667e− 2 2.744e− 2−4.682e− 2 −1.262e− 2 2.865e− 2 2.744e− 2 9.759e− 2
Dar el intervalo de confianza para el consumo previsto de un coche norteamericano con una potenciade 120 Cv y 1600 kg de peso.
6.19 Sea X la matriz completa de un diseño 2k, por ejemplo para el caso de k = 3,
X =
1 −1 −1 −1 1 1 1 −11 1 −1 −1 −1 −1 1 11 −1 1 −1 −1 1 −1 11 1 1 −1 1 −1 −1 −11 −1 −1 1 1 −1 −1 11 1 −1 1 −1 1 −1 −11 −1 1 1 −1 −1 1 −11 1 1 1 1 1 1 1
e Y el vector de dimensión n = 2k con los valores de la variable respuesta correspondiente al exper-imento. El análisis estadístico del experimento se puede realizar mediante el modelo de regresiónmúltiple
Y = Xβ +U,
donde β = (β0,β1, ...,βn−1)T es el vector de parámetros yU = (u1, u2, ..., un)T el vector de variables
aleatorias independientes con distribución normal de media cero y desviación típica σ. Demostrarque para cualquier i, la varianza de bβi es σ2/n y que el error de predicción de una observaciónnueva en cualquiera de los 2k tratamientos tiene como varianza 2σ2.
6.20 Demuestra que la recta de regresión pasa por el punto (x, y) y que el intervalo de predicción parala media de la variable respuesta cuando el regresor toma el valor igual a x, es
y ± tα/2sR√n
donde n es el número de observaciones, tα/2 se obtiene de la distribución t de Student con n − 2grados de libertad y s2R es la varianza residual.
9
6.21 La masa M de un cristal de hielo depositado en una cámara a temperatura (-5oC) y humedadrelativa constante crece según la ecuación M = αT β, donde T es el tiempo en horas, y α y βson parámetros desconocidos. La relación anterior se linealiza con la transformación logarítmica,estimándose el siguiente modelo
logM = logα+ β log T + u
donde el término añadido u son los errores experimentales, que se consideran aleatorios e indepen-dientes con distribución normal, N(0,σ2). Diez cristales del mismo tamaño y forma se introdujeronen una cámara, extrayéndose secuencialmente según unos tiempos previamente establecidos. Elmodelo estimado, XTX y (XTX)−1 son:
dlogMi = −7.30 + 2.40 log Ti, sR = 0.64
XTX =
µ10.00 46.6646.66 218.9
¶(XTX)−1 =
µ18.27 −3.89−3.89 0.835
¶Predice el crecimiento medio esperado del cristal después de 3 horas en la cámara con un intervaloal 95% de confianza.
6.22 La siguiente tabla muestra los datos recogidos en un estudio sobre el efecto de disolver azufre en latensión superficial del cobre fundido
Variables ObservacionesX: % en Peso deAzufre 0.034 0.093 0.30 0.40 0.61 0.83Y: Reducción de Ten.Sup. 301 430 593 630 656 740(dos replicaciones) 316 422 586 618 642 714
Se ha estimado el modelo de regresión lineal simple con log(X) como regresor. El resultado delanálisis de regresión y la gráfica del modelo se proporcionan más abajo.Se ha estimado el modelo deregresión lineal simple con log(X) como regresor. El resultado del análisis de regresión y la gráficadel modelo se proporcionan más abajo.
Análisis de Regresión: Modelo Logarítmico Y = a + b*ln(X)--------------------------------------------------------------------------Variable dependiente: Tensión SuperficialVariable Independiente: Azufre-------------------------------------------------------------------------- Desviación Estadístico Parámetro Estimación Típica t P-Valor--------------------------------------------------------------------------Constante 735,784 7,47038 98,4935 0,0000Pendiente 127,457 4,12867 30,8712 0,0000--------------------------------------------------------------------------
Analisis de la Varianza--------------------------------------------------------------------------Fuente Suma de Grados Cuadrados Cuadrados Libertad Medios F P-Va--------------------------------------------------------------------------Modelo 241678,0 1 241678,0 953,03 0,0Residual 2535,9 10 253,59--------------------------------------------------------------------------Total (Corr.) 244214,0 11
10
Azufre
Tension_Sup
0 0,2 0,4 0,6 0,8 1300
400
500
600
700
800
Utiliza el modelo para predecir la reducción de la tensión superficial del cobre fundido con un 0.8%de azufre disuelto. Da un intervalo de confianza del 95% para la predicción.
6.23 Se ha estimado un modelo de regresión con dos variables independientes y 20 observaciones obtenién-dose la siguiente ecuación:
byi = −19.17 + 0.222x1 + 0.659x2, bs2R = 6.468La matriz de varianzas de los regresores (x1, x2) esµ
25.23 24.2924.29 27.40
¶.
Teniendo en cuenta que la matriz de varianza teórica de los estimadores bb = [bβ1, bβ2]T esσ2
ns21(1− r2)− r σ2
ns1s2(1− r2)− r σ2
ns1s2(1− r2)σ2
n s22(1− r2)
,donde n es el número de observaciones, r el coeficiente de correlación entre los regresores, s21 ys22 las varianzas muestrales de los regresores y σ2 la varianza del modelo de regresión; realiza loscontrastes individuales de los dos regresores, α = 0.05. Interpreta el resultado de los dos contrastes.
11
.
EstadísticaSoluciones a los ejercicios propuestos.
Curso 2004/05
1
Capítulo 1. Descriptiva
1.1 xp = (10+18+22+150)/4 = 50; sp =
r(10− 50)2 + ...+ (150− 50)2
4= 57.9;xa = 10(10/200)+
...+ 150(150/200) = 117.04;
sa =p(10− 117.04)2(10/200) + ...+ (150− 117.04)2(150/200) = 57.1.
1.2 Si es posible el resultado, z = x+ y; s2z = s2x + s
2y + 2sxy; sxy = −11/2;
¯4 −11/2
−11/2 9
¯≥ 0.
1.3 x0 = k1x; y0 = k2y; cov(x0, y0) = k1k2cov(x, y); sx0 = |k1| sx; sy0 = |k2| sy; r(x0, y0) = r(x, y).1.4 cov(x, y) = bs2x; s
2y = b
2s2x; r(x, y) = 1.
1.5
¯s2x rsxsyrsxsy s2y
¯= s2xs
2y − r2s2xs2y ≥ 0; 1 ≥ r2.
1.6 Si. Determinante = −2. No puede ser una matriz de varianzas.1.7 No. y = log10 xG; xG es la media geométrica; xG < xA; log10 xG < log10 xA; 2.5 ≮ 2.
1.8 Q1 = −0.16;Q2 = mediana = −0.0.3;Q3 = 0.18;RI = 0.34;LI = −0.67;LS = 0.69, como el valormáximo muestral es 0.45, entonces LS = 0.45.
Capítulo 2. Probabilidad
2.1 p = 0.472
2.2 La función de densidad es fz(z) = 2zr2con 0 < z < r y la función de distribución es Fz(z) =
z2
r2
2.4 k = log 2;E[X] =25
log 2y V ar[X] ' 51.67
2.5 E
·mV 2
2
¸= 3
2kT,que es independiente de su masa. Fijada la temperatura T , cualquier gas tiene
el mismo valor medio de energía cinética molecular independientemente de su masa.
2.6 fY (y) = 1 con 0 ≤ y ≤ 1
2.7 p =
R∞5 x
σ2e−x2
2σ2 dx
10
= e−10/8
2.8 E[X] =R a0 xfX(x)dx +
R∞a xfX(x)dx ≥
R∞a xfX(x)dx = aP (x > a) y despejando se obtiene la
desigualdad de Markov.
2.9 k =3
2, E[Y ] =
1
8, V ar[Y ] =
171
320.
2.10 fXY (x,y) =
½c si x2 + y2 ≤ r20 si x2 + y2 > r2
, fX(x) =2
πr2√r2 − x2, −r ≤ x ≤ r
2
2.11 (a) k = 6;E[p] =1
2;V ar[p] =
1
20.
(b)³R 0.750 6p(1− p)dp
´10= 0.183
2.12 fU (u) = 2F (u)f(u)
2.13 La función de probabilidad para el máximo es:
Valor Probabilidad1 1/36
2 3/36
3 5/36
4 7/36
5 9/36
6 11/36
La función de probabilidad para el mínimo es:
Valor Probabilidad1 11/36
2 9/36
3 7/36
4 5/36
5 3/36
6 1/36
La función de probabilidad para la media es:
Valor Probabilidad1 1/36
1, 5 2/36
2 3/36
2, 5 4/36
3 5/36
3, 5 6/36
4 5/36
4, 5 4/36
5 3/36
5, 5 2/36
6 1/36
2.14 fXY (x, y) 6= fx(x)fY (y), por lo que X e Y no son variables aleatorias independientes.
2.15 (a) P (Z = n) =Pnk=0 P (X = k)P (Y = n − k) = e−(λ1+λ2)
Pnk=0
λk1λn−k2
k!(n− k)! , multiplicando y
dividiendo por n!, y utilizando que (λ1 + λ2)n =
Pnk=0
n!
k!(n− k)!λk1λn−k2 , se obtiene que:
3
P (Z = n) =e−(λ1+λ2)
n!(λ1 + λ2)
n,
que es la probabilidad de Poisson con parámetro λ = λ1 + λ2.
(b) P (X = k|Z = n) = n!
k!(n− k)!³
λ1λ1+λ2
´k ³λ2
λ1+λ2
´n−k, si llamamos p =
λ1λ1 + λ2
,
P (X = k|Z = n) = ¡nk¢ (p)k (1− p)n−k que es una binomial de parámetros n y p = λ1λ1 + λ2
2.16 P (X < 0.3|Y = 0.8) = 0.092.17 Sea X la variable llegada de clientes en una hora, X1 la variable llegada de clientes en los 15
primeros minutos de esa hora y X2 la variable llegada de clientes en los 45 últimos minutos de esahora. La probabilidad pedida:
P (X1 = 2|X2 = 2) =µ1
4
¶2.
2.18 (a) k = 8
(b) P (X < 0.5|Y = 0.5) = 1(c) Las variables aleatoriasX e Y no son independientes ya que el campo de variación deX dependede Y.
2.19 V ar(Z) = 0
2.20 LLamando X al tiempo de vida del receptor e Y al tiempo de vida del amplificador, P (X < Y ) =2
3.
2.21 El número medio de años que dura una máquina es:
E[Y ] =R T0 xfx(x)dx+ T (1− F (T )).
Por lo tanto el número medio esperado de máquinas empleadas en un año es:
1
E[Y ]= [R T0 xfx(x)dx+ T (1− F (T ))]−1.
2.22 MZ =
6 −2 4−2 6 −44 −4 6
2.23 ρ = 0. Las variables no son independientes porque por ejemplo P (Y1 = 0|Y2 = 0) = 0 6= P (Y1 = 0)
2.24 (a) fX(x) = 2x con 0 < x < 1, fY (y) =y
2con 0 < y < 2. Las variables X e Y son independientes
ya que fXY (x, y) = fX(x)fY (y)
(b) P (X + Y < 1) =1
24
4
2.25 FX(x) = 1− e−ax;x ≥ 0 y FY (y) = 1− e−ay; y ≥ 0. Como FXY (x, y) = FX(x)Fy(y) las variablesaleatorias X e Y son independientes.
P (X < 1, Y ≥ 2) = (1− e−a)e−2b;P (X < 1) = 1− e−a y P (Y ≥ 2) = e−2b.
2.26 P (T1 < 1|T2 > 2) = 1
3
2.27 fY (y) = − ln(1− y) con 0 ≤ y ≤ 1
2.28 p =1
2
2.29 Cov(X,Y ) = E[(X −E(X))(Y −E(Y ))] = E[XY ]−E[X]E[Y ],
se sustituye Y = U + V, obteniendo:
Cov(X,Y ) = E[(X(U + V )]−E[X]E[U + V ] = E[XU ]−E[X]E[U ] +E[XV ]−E[X]E[V ] == Cov(X,U) + Cov(X,V )
2.30 (a) Sea Y el número de pruebas a realizar, E[Y ] = 51× 0.395 + 1× 0.605 = 20.75 ' 21
(b) Sea A el suceso de que un individuo sea portador del virus y B el suceso el resultado delaanálisis ha resultado positivo, P (A|B) = 0.025.
2.31 P (X = n) =
µn
k − 1¶pk(1− p)n−k+1.
2.32 16/7
2.33 p = 1−P4i=1(
12)i = 0.0625
2.34 (a) e−336
6!
(b) e−663
3!
(c) 1−P15i=0 e
−9 9i
i!
(d) e−3
5(3
5)2
2!
2.35 La función de densidad es fW (w) =b
abwb−1e
−(w
a)b
con a > 0, < b > 0, w > 0 y la función de
distribución es FW (w) = 1− e−µwa
¶b
2.36 p = 0.3
2.37 p = 0.065
2.38 (a) p = 0.76× 0.37× 0.76 = 0.21
5
(b) Sea D el tiempo de vida de la depuradora P (D < T + 1000|D > T ) = 0.049. No depende deT, por lo que no está justificado renovar la depuradora antes del fallo ya que la probabilidadde fallo no depende del tiempo que ha estado funcionando.
2.39 p = 0.175
2.40 p = e−k(tβ2−tβ1 )
2.41 Sea X el número de peces capturados en 15 minutos, P (X > 1|λ = 3
4) = 0.5276. Sea X
0el número
de peces capturados en dos horas de pesca P (X0= 5|λ0 = 6) = 0.1606.
2.42 λ(t) = 11000
2.43 Utilizando la aproximación a la normal a ≥ 9.
2.44 fY (y) =1√y
1√2πe−y
2 con y > 0
2.45 Mediana= 0.674σ
2.46 (a) 0.976
(b) 0.0229
(c) 0.999
(d) 0.1
2.47 (a) 0.3142
(b) 0.119
(c) 0.7103
2.48 X = peso de caja con 100 sobres;
X ∼ N(µ = 100× 8 + 30 = 830;σ = √100× 0, 25 = 5);P (X > 820) = 1− φ(820−8305 ) = 0, 0228;
Y = peso de caja con 199 sobres;
Y ∼ N(µ = 99× 8 + 30 = 822;σ = √99× 0, 25 = 4, 975);P (Y > 820) = 1− φ(820−8224,975 ) = 0, 656
2.49 Y = número de veces que sale el número elegido
Y ∼ B(n = 3; p = 1/6);X = balance del jugador = Y − 1E[X] = 3/6− 1 = −0.5; sale ganando la banca.
2.50 X = número de unidades defectuosas de un total de 400
6
X ∼ B(n = 400; p = 0, 06) ∼ (aprox) ∼ N(µ = 400× 0, 06 = 24;σ = √400× 0, 06× 0, 94 = 4, 745);Hay que calcular c tal que φ( c−244,745) = 0, 05, es decir
c−244,745 = −1, 645; c = 16, 18
Capítulo 3. Inferencia3.1 bn = 103; bp = 0.21.3.2 bN = 2x− 1.
3.3 bθ = 6
5x; E[bθ] = θ y V ar[bθ] = θ2
35.
3.4 bθ = 100/22.3.5 P (t > 10) = 1− P (t ≤ 10) = 1− FT (10) = exp(−10/7) = 0.24, siendo bα = 1/7.3.6 bα = n
ni=1 log
à bβxi
! ; bβ = max{x1, x2, ..., x3}.
3.7dL(θ)
dθ= −20
θ+2
θ3
10
i=1(xi)
2 +726
θ3;bθMV = 8.2582.
3.8 L(p) = 20 log p+ 95 log(1− p) + k; dL(p)dp
= 0; bp = 0.174.3.9 l(λ) =
1
λ7exp(−2082λ ); bλ = 2082
7= 297.4.
3.10 bθ = 3x;V ar(bθ) = θ2
2n.
3.11 c =nµ2
σ2 + nµ2; c =
n
4 + n.
3.12 k =1
n(n− 1) .
3.13 ECM(bσ2) = σ4(k − 1)2 + 2k2σ4
(n− 1); k =n− 1n+ 1
.
3.14 bµ = t12+t24;E[µ] = µ;V ar[µ] =
1
4V ar[t1] +
1
16V ar[t2] =
17
64nµ2.
3.15 P = P (fallo en un mensaje) = P (fallo en al menos un bit de los 128) = 1 − (1 − p)128. En losúltimos 10000 mensajes (lecturas) ha habido 340 erróneos. bP = 340
10000= 1−(1−bp)128; bp = 0.000270.
3.16 (a) µ ∈ x± t(11;α2)bs√n;µ ∈ (29.47, 30.70).
(b)(n− 1)bs2
σ2; χ211;σ
2 ∈ (0.472, 2.709).
7
3.17 µ ∈ x± t(12;α2)bs√n;µ ∈ (30.37, 38.25).
3.18 ingreso ∈ x± t(11;α2)bs√n; ingreso ∈ (2857, 1822).La amplitud es 500.
L = 250;n = z2α2
bs2L2= 40.8; al menos n = 41 estaciones.
3.19 (a) x = 45.75; bs2 = 201.6(b) µ ∈ x± t(14;α
2)bs√n;µ ∈ (34.82, 56.67)
(c)(n− 1)bs2
σ2; χ214;σ
2 ∈ (90.19, 693.60)
(d) L = 2× bs√n× t(14;α
2);√n >
bs6× t(14;α
2);n > 23;n = 24.
3.20 p ∈ bp± zα2
rbp(1− bp)n
; p ∈ (0.131, 0.239);L = 2× 1.96×rbp(1− bp)
200;
L1 = 2× 1.96×rbp(1− bp)
m,L1 =
L
2;m = 4× 200 = 800.
3.21 P (|bp− p| ≤ 0.05) = 0.95; bp ; N
Ãp,
rp(1− p)n
!;
0.05rp(1− p)n
= 1.96;n =1.962p(1− p)
0.052; p =
1/2;n = 384.
3.22 θ ∈ bθ ± zα2
sbθT;bθ = 236.5;T = 15; θ ∈ (228.72, 244.28).
3.23 χ2a,60 ≤2× 30× x
λ≤ χ2b,60;λ ∈ (4.46, 9.18).
3.24 (a) bαMV =r2Px2i3n
;V ar(bαMV ) = α2
6n.
(b) bαM =x√π
2;V ar(bαM) = µ3π
8n− 1n
¶α2.
(c) α ∈ bαMV ± zα2
rbα2MV6n
;α ∈ (2.74, 3.21); α ∈ bαM ± zα2
sµ3π
8n− 1n
¶ bα2M ;α ∈ (2.78, 3.27).3.25 (a) X ; B(n = 1012, p = e−λt = e−20000/8270);E[X] = np = 8.9× 1010.
X ; N(µ = ne−λt,σ =pne−λt(1− e−λt)).
(b) El intervalo es µ ± 1.96σ; (8.9 × 1010 ± 5.58 × 105). Se ve que el cociente entre la desviacióntípica y la media es 6.26× 10−6, lo cual indica que la incertidumbre del proceso es despreciable.
8
(c) E[X] = Np = Ne−λt;x = x1 = 1010; bNe−λt = 1010; bN = x1eλt = 1.12×1011;E[ bN ] = eλtE[x1] =
eλtNe−λt = N ;V ar( bN) = e2λtV ar(x1) = e2λtNe−λt(1− e−λt) = Neλt(1− e−λt).(d) Ne−λT =
N
2;T =
log 2
λ= 5.73× 103.
3.26 (a) t =190− xbs/√n ; tn−1; t = 1.84; |t| < t(4;0.025) = 2.78, no se puede rechazar H0 : µ = 190.
(b) D =(n− 1)bs2100
; χ24;D = 4.58 < χ2(4,0.05) = 9.49, no se puede rechazar H0 : σ2 = 100.
3.27 P (Error tipo I) = P (x > 11|µ = 10) = 0.0227;P (Error tipo II) = P (x < 11|µ = 12) = 0.0227.3.28 P
¡X ≥ 85|X ; N
¡100× 0.75,√100× 0.75× 0.25¢¢ = 0.01044 < α = 0.05. Con nivel de signifi-
cación α = 0.05, la nueva medicina es más efectiva que la antigua.
3.29½H0 : p = 0.03H1 : p > 0.03
;Z =bp− prp(1− p)n
; N(0, 1);Z = 1.24 < Z0.05 = 1.65, no se puede rechazar
H0;Pot(p) = 1−Φ
0.04978− prp(1− p)200
;P (Error tipo II|p = 0.06) = 1− Pot(p = 0.06) = 0.2709.3.30 (a) X2 =
2nx
λ; χ260;X
2 = 74.4 < χ2(60;0.05) = 79.1, no se puede rechazar H0;
Nivel crítico: P (χ260 ≥ 74.4) = 0.10.P (Error tipo II|λ = 7.5) = Pµ2nx
5≤ 79.1 |λ = 7.5
¶≈ 0.25.
(b)½H0 : λ1 = λ2H1 : λ1 > λ2
;x1/λ1x2/λ2
; F2n1,2n2 . Se rechaza H0 six1x2> 1.74;x2 < 3.56. Después de 6000
horas x2 ≥ 2.35× 6 + 6× 915
= 4.54 > 3.56. No es necesario seguir el ensayo.
3.31 P (bp > c|p = 0.85) = 0.01;P (bp > c|p = 0.95) = 0.99;n ≈ 180; c = 0.912.3.32 X2 =8i=1
(Oi −Ei)2Ei
; χ25;X2 = 7.5181 < χ2(5;0.05) = 11.1, no se puede rechazar la hipótesis de
normalidad.
3.33 X2 =6i=1(Oi −Ei)2
Ei; χ25;Ei = 20 ∀i;X2 = 8.5 < χ2(5;0.05) = 11.1,no existe evidencia para
rechazar la hipótesis de que el dado está equilibrado.
3.34 X : v.a número de epicentros en una cuadrícula de tamaño 100 km2 ; Poisson(λ);
bλ = no total de epicentrosno total de cuadrículas
=
PxiPni=48
34= 1.41 epicentros/100 km2;X2 =5i=1
(Oi −Ei)2Ei
; χ23;
X2 = 0.44 < χ2(3;0.05) = 7.8147; no existe evidencia para rechazar la hipótesis de que la distribución
de epicentros es una Poisson. Nivel crítico: P (χ23 ≥ 0.44) ≈ 0.90÷ 0.95.
9
3.35 P (error tipo II ) = P (X > 0|p < 0.07) = 1− (1− p)20, p < 0.07;P (error tipo I ) = P (X = 0|p =0.07) = (1 − p)20 = 0.234. El método tiene una probabilidad muy alta (0.234) de dar como mejorel apoyo nuevo cuando es igual que el existente.
3.36 X2 =20Pi=1
2Ti200
à χ240; X2 = 22.74 < χ2(40;0.95) = 26.5. Se rechaza H0 con α = 0.05. Conviene
resaltar que el contraste es unilateral con la región de rechazo a la izquierda.
3.37 X = número de defectos en 900m2 de tela
X ∼ Poisson(λ = 9 ∗ 4 = 36) ∼ (aprox) ∼ N(µ = 36;σ = 6);P (X > 50, 5) = 1− φ(50,5−366 ) = 0, 0078;
Y = número de defectos en 16 horas de fabricación
Y ∼ Poisson(λ = 9 ∗ 4 ∗ 16 = 576) ∼ (aprox) ∼ N(µ = 576;σ = 24);H0 : λ = 576;H1 : λ > 576;
P (Y > 720 | λ = 576) = 1− φ(720,5−57624 ) = 8, 6e− 10; se rechaza H0, la evidencia muestral indic queha habido un aumento.
Capítulo 4. Análisis de la varianza
4.1 (a) 0.4325 ≤ σ21σ22≤ 1.1149.
(b) µ1 − µ2 ∈ (−809.2, 1023.2).
4.2 La región de rechazo es:|d| > 2.179, como d = 0.51 no se rechaza las máquinas son iguales.4.3 (a) Se debe elegir el proveedor A.
(b) µA − µB ∈ (3526.34, 6473.65).
4.4 El valor calculado de la F (19.2) se compara con el valor de tablas F(2,16;0.05) = 3.63. Como19.2>3.63 se puede concluir que para α = 0.05 existen diferencias significativas entre los tratamien-tos.
4.5 (a) Se compara el valor obtenido de la F(3.99) con el valor de tablas F(4,25;0.05) = 2.76. Como3.99>2.76 se concluye que existen diferencias significativas entre los materiales. No se puede concluirque exista un material con desgaste significativamente menor. Los materiales que tiene un desgastemedio significativamente distinto son: B y C, B y A, y E y C. El resto no se pueden considerarsignificativamente distintos.
(b) 0.93 ≤ σ2 ≤ 4.18
4.6 (a) El valor de la F obtenido es 2.05, que se compara con el de tablas F(3,15;0.05) = 3.29. Como3.29 >2.05 no puede rechazarse la hipótesis nula de igualdad de medias.
(b) No, el valor 68 del tercer termómetro parece discordante con los demas.
10
(c) El termómetro 4 es distinto al 1 al 2. La diferencia de las conclusiones proviene de que el valor68 del grupo 3 es atípico y distorsiona todo el resultado.
4.7 (a) Se compara el valor de la F (64.348) obtenido con el de las tablas F(2,12;0.01) = 6.92. Como64.348 > 6.92 se rechaza la hipótesis nula de que las medias son iguales.
(b) El valor que se obtiene de la t es 2.9853 que no está incluido en el intervalo (−2.18, 2.18), conlo que se rechaza la hipótesis nula.
4.8 La relación aproximada entre la desviación típica de la variable transformada y la original essz ' sy|h0(y)| donde h es la transformación realizada, h0 es la primera derivada de la transformacióne y es el valor medio de y. Utilizando la expresión anterior se observa que la transformación quecorrige la heterocedaricidad es z = log y.
Capítulo 5. Diseño de experimentos
5.1 Se compara el valor de la F = 45.7 con el valor de las tablas F(1,4;0.05) = 7.71. Como 45.7 > 7.71se rechaza que los equipos son iguales.
5.2 Si no se tiene en cuenta el bloque el resultado es el mismo que si no se tiene en cuenta. El factores significativo. Es mejor el modelo en bloques que el de un factor para cualquier caso. Ya que si elbloque no es significativo, podemos pasar directamente al modelo con un factor (sin realizar ningúncálculo), pero si el bloque es significativo se pierde mucho no planteando el modelo en bloques,incluso podría suceder que el factor no resultara significativo.
5.3 (a) Existe evidencia de que el consumo medio no es igual en cada estación del año.
(b) La estación de mayor consumo es el invierno. No se puede hablar de una estación de menorconsumo, ya que el consumo medio en otoño, primavera y verano no se pueden considerar significa-tivamente distintos. Los intervalos de confianza para el consumo medio de las diferentes estacionesdel año son: µI ∈ (13.36, 14.96), µI ∈ (12.17, 13.77), µI ∈ (11.86, 13.46) y µI ∈ (11.26, 12.86).(c) Los factores estación y comunidad son significativos.
(d) El consumo en invierno es significativamente mayor que en el resto de las estaciones, el consumoen otoño y primavera es significativamente mayor que en verano y, el consumo en primavera essignificativamente mayor que en primavera. Al incluir el factor comunidad disminuye la varianzaresidual y el test para el invierno resulta más significativo y permite detectar el efecto de las demásestaciones.
5.4 (a) No se rechaza H0 : µD = 0. El nivel crítico del contraste es 0.1462.
(b) El número de niveles del factor y del bloque es respectivamente I = 2 y J = 20, bs2R =P2i=1
P20j=1 e
2ij
(I − 1)(J − 1) =P20j=1 e
21j +
P20j=1 e
22j
(J − 1) , donde eij = yij − yi• − y•j + y••. Para un mismo día
e1j + e2j = 0⇒P20j=1 e
21j =
P20j=1 e
22j , por lo tanto bs2R = 1
2
P20j=1(Dj −D)2(J − 1) =
1
2bs2D
(c) F1,J−1 =V Ebs2R =
µy1• − y2•bsD/√J
¶2=
µDbsD/√J
¶2= t2J−1.
11
5.5 El efecto del sexo y el tipo de de formación son significativos y además existe interacción entre ellos.Interpretacción: 1) Existen diferencias significativas en el número medio de errores cometidos entreprofesores de ciencias y profesores de letras (11.67 más en ciencias). 2) También es significativa ladiferencia entre hombres y mujeres (9 errores más para hombres). 3) Además la diferencia observadaentre hombres y mujeres de letras (2 errores más para hombres) difieren significativamente de laobservada para los profesores de ciencias (16 errores más para hombres).
5.6 La interacción entre los dos factores no es significativa. Esta conclusión se puede obtener alcomparar el valor de la F (2.16) obtenido con el de las tablas F(2,24;0.05) = 3.4. Como 2.16>3.4 lainteracción no resulta significativa.
5.7 (a) Se compara el valor de laF (2.8125) con el obtenido en las tablas F(4,45;0.05) = 2.59. Como2.8125 > 2.59 se rechaza la hipótesis nula de igualdad de medias, y se concluye que el índice deoctanos medido no es igual para cada fórmula.
(b) La fórmula 3 proporciona índice medio de octanos significativamente distintos a las fórmulas 1y 5, y la fórmula 4 es significativamente distinto a la 1. Las demás fórmulas no se pueden considerarque proporcionen índice de octanos diferentes.
(c) El valor de la F (2.43) correspondiente a la interaccion se compara con el valor de las tablasF(4,90;0.05) = 2.47. Como 2.47 > 2.43 no se puede rechazar que la interacción sea nula, o de otraforma, el efecto de la interacción no es significativo al 95%.
5.8 Para que la interacción sea significativa debe cumplirse que 1.125(R− 1) > F(4,9(R−1);0.05), dondeR es el número de replicaciones. El cálculo de R es iterativo. Se irán dando valores hasta conseguirque la interacción sea significativa.
5.9 V E(αβ) = 20.9988, V NE = 4.1842, el valor correspondiente de la F es 28.5155, que se comparacon el valor de las tablas F(2,12;0.05) = 3.89. Como 28.5155 > 3.89 se rechaza que la interacción entrelos factores horno y temperatura.
5.10 (a) El laboratorio 3 tiene una media significativamente menor que los otros tres. La diferenciaentre las medias de los laboratorios 1,2 y 4 no son significativas. Este resultado se observa en latabla del enunciado, en la que se marcan con un asterísco las diferencias significativas entre losvalores medios de los laboratorios. El intervalo para la media del tercer laboratorio es:
µ3 ∈ y3• ± t16;0.005bsRr 1
n3,
y sustituyendo para los datos obtenidos se tiene que:
µ3 ∈ 56.52± 2.921×√2.14872
r1
5→ µ3 ∈ (54.61, 58.44).
(b) El contraste
H0 : σ2 = 1
H1 : σ2 > 1
12
se realiza con el estadístico
(n− I)s2Rσ2
que tiene distribución de probabilidad χ2n−I siendo I = 4 el número de laboratorios y n = 20 elnúmero de datos.
χ20 =(n− I)s2R
σ2=16× 2.14872
1= 34. 38
que es mayor que el valor χ216,0.01 = 32, por consiguiente se rechaza la hipótesis H0 y se concluyeque la varianza es mayor que 1.
(c) Como resultado del análisis del modelo con dos factores se observa que el efecto principal día yla interacción entre el laboratorio y el día no resultan significativas, obteniendo para ambos casosp-valores (0.8510 y 0.9779 respectivamente) claramente superiores a 0.01. Por otra parte al hacerlas comparaciones para los laboratorios dos a dos se observa que además de las diferencias entrelaboratorios obtenidos en el primer apartado, se aprecia ahora una nueva diferencia significativaentre el laboratorio 1 y 2.
(d) Sea σ21 la varianza correspondiente al día 1 y σ22 la correspondiente al día 2. El contraste pedido
es:
H0 : σ21 = σ22
H1 : σ21 6= σ22
El contraste se realiza según:
16s2R1σ2116s2R2σ22
∼ F16,16,donde s2R1 = 2.14875 y s2R2 se calcula como se
muestra a continuación.
La varianza residual correspondiente al modelo de dos factores es:
s2R =
P4i=1
P2j=1
P5r=1(yijr − yij.)
IJ(R− 1) ,donde I = 4 es el número de laboratorios, J = 1 es el
número de días y R = 5 es el número de replicaciones. Esta varianza residual se puede escribircomo:
s2R =
P4i=1
P5r=1(yi1r − yi1.) +
P4i=1
P5r=1(yi2r − yi2.)
32=16s2R1 + 16s
2R2
32,de donde se obtiene
que:
s2R2 = 2s2R − s2R1 = 2 × 2.06152 − 2.14875 = 1.9743. El valor del estadístico de contraste
es:2.14875
1.9743= 1.0884, que pertenece al intervalo (F16,16;0.95 = 0.26, F16,16;0.05 = 3.92), por lo
que no se rechaza la hipótesis nula y se concluye que no ha habido un cambio en la varianzade un día a otro.
5.11 (a) Los resultados del análisis de la varianza se pueden interpretar de la siguiente manera: En latabla 3 se puede ver que el nivel crítico de los tres contrastes es p-valor=0.0000, ésto quiere decir que
13
con un nivel de significación α = 0.05, por ejemplo, la temperatura, el tiempo de exposicióny la interacción entre ambas tienen un efecto significativo sobre la cantidad absorbida.Como la interacción es significativa, el efecto de la temperatura y del tiempo de exposición sobre lacantidad absorbida debe hacerse de forma conjunta. El gráfico de interaccciones que se proporcionaen el enunciado ayuda a realizar la interpretación: Para el tiempo de exposición E1: Laabsorción media es diferente para cada temperatura. La máxima absorción se consigue a T2 y lamínima a T1. Para el tiempo de exposición E2: La absorción media para cada temperaturason más parecidas. Sólo es distinta la media de la temperatura T1, que es mayor que las mediasde las otras dos. Para el tiempo de exposición E3: No existen diferencias significativas en laabsorción media de cada temperatura. Para este tiempo de exposición la temperatura no influyeen la absorción.
(b)La tabla de análisis de la varianza para el nuevo modelo es:
Fuente Suma de Grados deVariabilidad Cuadrados Libertad Varianzas F p-valorV E 8490.7 8 1061.34 63.89 0.0000V NE 299.00 18 16.61V T 8789.7 26
(c) Con los datos del experimento, se rechazará H0 cuando|zi. − zj.| > 6.99. El tratamiento quetiene mayor media es el número 2, z2. = 91.43, que es significativamente distinto de todos los demássalvo del 8, z8. = 87.06, pero éste a su vez no se puede distinguir del 7, z7. = 83.76. Luego nose puede decir que exista un único tratamiento que proporcione una absorción significativamentemayor que el resto.
(d) No se aprecian signos preocupantes de heterocedasticidad. Unicamente comentar que los resid-uos correspondientes al valor previsto zk. = 91.43 tienen mayor variabilidad que el resto. Alrepresentar los residuos frente a los tratamientos, se observa que es el tratamiento 2 el que presentamayor variabilidad. Este resultado debe ser analizado en detalle: El tratamiento 2, que es el quepresenta la mayor media de cantidad absorbida, es también el que presenta una mayor variabili-dad. Este resultado tendría que ser comentado y discutido con los expertos que han realizado elexperimento.
5.12 (a) Los resultados del análisis de la varianza se pueden interpretar de la siguiente manera: losfactores hidrocarburo e hidrógeno son significativos pero la interacción entre ellos no lo es. Lasdiferencias significativas con nivel de significación de 0.05 son:
- Para Hidrocarburos: B 6= A,B 6= C,D 6= A,D 6= C.- Para Hidrógeno: 1 6= 2, 1 6= 3, 2 6= 3.
(b) Teniendo en cuenta que la interacción no es significativa el tratamiento que proporciona elrendimiento óptimo es el correspondiente al hidrocarburo C y el hidrógeno 3. El intervalo deconfianza para el valor medio en esas condiciones es:
µ ∈ y33. ± t36;0.025bsR 1√4→ µ ∈ 29.975± 2.02√14.551
2
(c) .Se contrasta la hipótesis H0 : σ21 = σ22 frente a la alternativa H1 : σ21 6= σ22, obteniendo
un valor de F = 0.3922, que se compara con los valores obtenidos en las tablas (F12,12). Como0.3922 ∈ (0.30, 3.28),no se rechaza la hipótesis nula.
14
(d) Teniendo en cuenta que x1 = 18.6875 y x2 = 20.03, el estadístico t =(16.6875− 20.03)3.36
p1/12
= −1.38.Como −1.38 está dentro del intervalo (−2.7, 2.7), no se rechaza la hipótesis nula de igualdad demedias.
5.13 El número de parámetros correspondientes a efectos principales son 14, correspondientes a inter-acciones de orden 2 son 71, correspondientes a interacciones de orden 3 son 154, y correspondientesa interacciones de orden 4 son 120. Por lo tanto, el número de parámetros totales son 359.
5.14 (a) 2.55 ≤ σ2 ≤ 8.11(b) Los efectos principales de A, B y C son significativamente distintos de cero.
(c) El intervalo pedido es: 0.0253σ2 ≤ bs2i ≤ 3.69σ2. Sustituyendo σ2 por su estimador se obtieneque 0.106 ≤ bs2i ≤ 15.47. Como todos los valores de bs2i pertenecen al intervalo construido no se puederechazar la hipótesis de homocedasticidad.
5.15 . d = (y1 − y2)− (y3 − y4) ∼ N(µ = µ1 − µ2 − µ3 + µ4;σ =q4σ2y/10);
bS2R = 104Pi=1
s2i
4×10−4 ;
t = (y1−y3)−(y3−y4)bSR√4/10 ∼ t(4× 10− 4)H0 : δ = 0;H1 : δ > 0;
Para la muestra, t = 6, 93 > t0,95(36) = 1, 69, se rechaza H0
Capítulo 6. Regresión lineal
6.1 (a) bβ0 = 2.5876; bβ1 = 0.5414; en el contraste½H0 : β1 = 0H1 : β1 6= 0 se rechaza H0; bs2R = 0.1269; en el
gráfico de los residuos frente a los valores previstos se aprecia falta de linealidad, el modelo no esadecuado.
(b) bβ = bβ0bβ1bβ2
=
2.89710.6575−01161
.6.2 (a) El modelo es vi = Hdi + ui; la estimación por mínimos cuadradros se realiza a partir de
M =P(vi −Hdi)2; bH =
PvidiPd2i
= 6.015× 10−18s−1.
(b) H ∈ ( bH ± t(n−1;0.025) × bs( bH);V ar( bH) = V arµP vidiPd2i
¶=
σ2Pd2i;H ∈ ( bH ± t(9;0.025) × bsRqP
d2i
;
bs2R =P e2i ;H ∈ (5.849× 10−18, 6.185× 10−18) segundos; bT = bH−1 = 5271× 106 años;T ∈ (5126× 106, 5422× 106) años.
15
6.3 Como ui ; N(0,σ),la estimación por máxima verosimilitud es equivalente a la estimación por
mínimos cuadrados; M =P(yi − β1x1i − β2x
22i)2; bb = " bβ1bβ2
#=¡WTW
¢−1W0Y; siendo W = x11 x221
... ...x1n x22n
e Y =
y1...yn
.6.4 (a)
½H0 : β1 ≤ 0H1 : β1 > 0
; t =bβ1 − 0bs(bβ1) ; tn−2; t = 22.75 > t(98;0.05) ≈ 1.66, se rechaza H0.
(b)½H0 : β1 ≥ 1H1 : β1 < 1
; t =bβ1 − 1bs(bβ1) ; tn−2; t = −2.25 < t(98;0.95) ≈ −1.66, se rechaza H0.
6.5 Si cov(y, bβ1) = 0, al ser ambas variables normales, son independientes.cov(y, bβ1) = E h(y −E(y))³bβ1 −E(bβ1)´i , siendo yi = β0 + β1xi + ui.
y −E(y) = 1
n
Pui; bβ1 −E(bβ1) = 1
ns2x
P(xi − x)ui;
cov(y, bβ1) =P (xi − x)n2s2x
E(u2i ) =σ2
n2s2x
P(xi − x) = 0.
6.6 (a) Con x1 : yi = β0 + β1x1i + ui;bβ0 = 83.2; bβ1 = 0.56;
β1 ∈ bβ1 ± t(n−2;α/2)bs(bβ1); bs(bβ1) = bsRs1√n; bs2R = eTe
n− 2; eTe = YTY−bβTXTY = 81.6;
β1 ∈ (0.1, 1.02).Con x2 : yi = α0 + α1x2i + ²i; bα0 = 78.8; bα1 = 0.53;α1 ∈ bα1 ± t(n−2;α/2)bs(bα1); bs(bα1) = bsR
s2√n; bs2R = ²T ²
n− 2; ²T ² = YTY−bαTXTY = 58.3;
α1 ∈ (0.21, 0.85).
(b) En desviaciones a la media:
yi − y = β1(x1i − x1) + β2(x2i − x2) + εi; bβ = Ã bβ1bβ2!=³eXT eX´−1 eXT eY =
· −0.0840.597
¸.
(c) Los contrastes individuales ti =bβi − 0bs(bβi) ; tn−2−1; dV ar(bβ) = bs2R ³eXT eX´−1 ; bs2R =
εTε
n− 2− 1;
εTε = eYT eY − bβT eXT eY = 57.1;dV ar(bβ) = · 0.17 −0.13−0.13 0.12
¸t1 = −0.21 < t(7,0.025) = 2.36; t2 = 1.7 < t(7,0.025) = 2.36. Ninguno de los coeficientes essignificativo.
El contraste conjunto:
16
½H0 : β1 = β2 = 0H1 : Alguno 6= 0 ; F =
bβT eXT eXbβk × bs2R ; F(2,7); F = 6.73 > F(2,7;0.05) = 4.73. Se rechaza H0.
Existe multicolinealidad provocada por la alta correlación entre x1 y x2. r12 =cov(x1, x2)
s1s2=
0.9.
(d) Regresión Y − X1 : R21 = 0.49; Regresión Y − X2 : R22 = 0.64; Regresión Y − X1,X2 :R23 = 0.64. El modelo con dos regresores y el modelo de regresión simple con X2 son similares.La selección de un modelo u otro depende del objetivo. Si el interés es estimar los coeficientesβ, son preferibles las regresiones simples. Si lo que se pretende es hacer predicciones de Y paravalores de X1,X2 se podría usar el modelo de regresión múltiple pues la multicolinealidad noafecta a las predicciones.
6.7 Coeficiente de correlación múltiple R =µP
(byi − y)2P(yi − y)2
¶1/2=sbysy.
Coeficiente de correlación lineal r =P(yi − y)(byi − y)pP
(yi − y)2pP
(byi − y)2 = sybysysby .
Se demuestraP(yi − y)(byi − y) =P(byi − y)2; entonces r = s2by
sysby =sbysy= R.
6.8 F =n− k − 1
k
R2
1−R2 = 21.12 > F(1,28;0.05) = 4.196. El efecto es significativo.
6.9 Conocidos los valores de R2 y n se calcula F =n− 21
R2
1−R2 = 294, y se compara con el valor detablas F(1,98;0.05) = 3.92. Como 294 > 3.92 se rechaza la hipótesis nula.
6.10 (a)
(H0 : β1 = β
01
H1 : β1 6= β01
, t =bβ1 − bβ01bsT√2× 0.835 ; t(2(n−2)); bsT = 0.5743;
t = 0.4986 < t(16;0.025) = 2.1199. No se rechaza H0.½H0 : β0 = β00H1 : β0 6= β00
, t =bβ0 − bβ00bsT√2× 18.27 = −0.4493; |t| < t(16;0.025). No se rechaza H0.
(b) YR =·Y1Y2
¸;XR =
·XX
¸;YR = XRβ +U; bβ = (XTRXR)−1XTRYR = 1
2(bβ1 + bβ2).
(c) bY = −6.52+2.215 log T ; dV ar(bβ) = bs2R(XTRXR)−1; bs2R = 0.2258; (XTRXR)−1 = 1
2(XTX)−1;β1 ∈bβ1 ± t(18;0.005) × bs(bβ1);β1 ∈ 2.215± 0.8836; β0 ∈ bβ0 ± t(18;0.005) × bs(bβ0);β0 ∈ −6.52± 4.1333.
6.11
6.12 (a) En la tabla 2 del enunciado: bβ2 = 51.7421; p − V alue = 0.00. La variable resistencia essignificativa.Significado de β2 : Independientemente del valor de la dureza, las gomas de resistenciaalta(+1) tienen, por término medio, unas pérdidas superiores en 2 × β2 unidades a las gomas deresitencia baja (-1). En el problema 2 × bβ2 = 103.4842. Esta diferencia se aprecia en la gráficadel enunciado. Intervalo para bβ2. β2 ∈ bβ2 ± t27;0.025 × bs(bβ2) con los datos de la tabla 2, β2∈ [40.44; 63.04].
17
(b) β0: Ordenada en el origen. En este caso no tiene interés práctico. β3: Cuantifica el efecto dela interacción dureza×resistencia en las pérdidas. Mide el cambio del efecto de la dureza al utilizargomas con resistencia alta o gomas con resistencia baja. Al observar la figura del enunciado, sepuede ver que la influencia de la dureza sobre las pérdidas no depende de la resistencia. En amboscasos al aumentar la dureza, las pérdidas disminuyen en una cantidad muy similar, puesto quelas rectas que determinan esta relación son prácticamente paralelas en el rango de variación de ladureza.
Para resistencia baja : P erdidas = (β0 − β2) + (β1 − β3)×DurezaPara resistencia alta: P erdidas = (β0 + β2) + (β1 + β3)×Durezaβ1: Incremento que se produce en las pérdidas al aumentar la dureza un grado Shore, mante-niendo la resistencia de las gomas constante.
β2: Interpretado en el apartado 1.
(c) Eligiríamos el modelo del apartado 1. Ambos modelos parecen adecuados porque en ambosse rechaza el contraste general de regresión. Sin embargo en la tabla 3, se observa que la inter-acción dureza×resistencia no es significativa. Además R2modelo1 =88.5177 > R
2modelo2 = 88.1505.
La variable resistencia (significativa en el modelo 1), deja de serlo al introducir la interaccióndureza×resistencia. bs(bβ1) crece desde 5.52215 (modelo 1) hasta 34.4264 (modelo 2). Hay mul-ticolinealidad entre resistencia y dureza×resistencia que tambien ocasiona el cambio en el nivelcrítico.
(d) El gráfico de residuos frente a valores previstos no presenta anomalías que indiquen falta dehomocedasticidad.
6.13 F =n− k − 1
k
R2
1−R2 Ã F(3,11);F = 42.166 > F(3,11;0.05) = 3.5874. Se rechaza H0 en el contraste
general de regresión.
Los contrastes individuales:½H0 : βi = 0H1 : βi 6= 0 ; ti =
bβi − 0bsR√qii à t11; t1 = 8.347 > t(11;0.025) = 2.20;
t2 = 1.018 < 2.20; |t3| = 1.429 < 2.20. Solo x3 es significativa.
6.14 El contraste general de regresión (contraste de la F) proporciona un nivel crítico = 0.0000 ( p-valor)<0.01, el contraste es por lo tanto significativo, se rechaza H0; Los contrastes individualesson todos significativos (p-valor <0.01) a excepción de F 2 y V × F.
6.15 mh ∈ byh ± t(n−2;α/2) bsR√bnh ; byh = 22; bnh = n = 150; bs2R = 0.778;mh ∈ 22± 0.1411.
6.16 (a) Como ui à N(0,σ),máxima verosimilitud es equivalente a mínimos cuadrados
M =P(yi − αzi)
2; bα = PyiziPz2i
= 0.4210.
(b) El error de predicción eh = yh − byh; eh à N
Ã0,σ
s1 +
z2hPz2i
!;
18
yh ∈ byh ± t(n−1;α/2)bsRs1 +
z2hPz2i= 0.525± 0.1636.
(c)½H0 : β1 = 1H1 : β1 6= 1 , t =
1.14− 1√0.0081
= 1.54 < t(15−2−1;0.025) = 2.18. No se rechaza H0.½H0 : β2 = 2H1 : β2 6= 2 , t =
1.86− 2√0.0042
= −2.16; |t| < t(15−2−1;0.025). No se rechaza H0.
(d) En general yh ∈ byh ± tn−k−1bsR√1 + vhh; en nuestro casobyh = \log(volumen) = −1.45 + 1.14 log 20 + 1.86 log 0.25 = −0.6134;vhh = x
0h
¡XTX
¢−1xh = 149.64; log(volumen) ∈ −0.6134± 2.18
√0.0031
√1 + 149.64;
volumen ∈ (0.1221, 2.4022).
6.17 (a)bβi; bαi 77.2 −50.8 2.95 5.52
ti 7.415 −5.255 2.108 3.806; los valores |ti| se comparan con
t(60−4−1;0.005) = 2.68; todas las variables son significativas a excepción de z2.
bβ0 : es la presión media de los botas de naranja para x1 = x2 = 0.; bβ1 : la presión media aumentaen 77.2 por cada unidad de incremento en x1 manteniendo x2, z2 y z3 constantes; bβ2 : lapresión media disminuye en 50.8 por cada unidad de incremento en x2 manteniendo x1, z2 yz3 constantes; bα2 : la presión media de los botes de limón es superior en 2.95 unidades a lade los botes de naranja manteniendo x1y x2 constantes; bα3 : la presión media de los botes decola es superior en 5.52 unidades a la de los botes de naranja manteniendo x1y x2 constantes.
(b) F =∆V E/2bs2R Ã F(2,55);F =
275.92/2
4.322= 7.3833 > F(2,55;0.01) ≈ 5.00. Se rechaza H0.
(c)½H0 : α2 − α3 = 0H1 : α2 − α3 6= 0 ; t =
(bα2 − bα3)− 0qdV ar(bα2 − bα3) Ã t55;
dV ar(bα2−bα3) = dV ar(bα2)+dV ar(bα3)−2ccov(bα2, bα3) = 2.023; |t| = |−1.8073| < t(55;0.005) = 2.68.No existe diferencia significativa entre los botes de limón y cola.
6.18 yh ∈ byh ± tn−k−1bsR√1 + vhh; byh = 3.305 + 0.843× 1.2 + 3.829× 1.6 + 0 + 0 = 10.446;vhh = x
0h
¡XTX
¢−1xh = 0.0639; yh ∈ 10.443± 2× 0.7113
√1 + 0.0639; yh ∈ 10.443± 1.4674.
6.19 En el modelo de regresión múltiple V ar(bβ) = σ2¡XTX
¢−1. En el problema XTX = nI, donde I
es la matriz identidad.¡XTX
¢−1= (1/n)I, luego V ar(bβi) = σ2/n.
V ar(bmh) = V ar(xTh bβ) = xThV ar(bβ)xh = (σ2/n)n;eh = yh − bmh;V ar(eh) = V ar(yh) + V ar(bmh) = σ2 + σ2.
6.20nPi=1(yi − bβ0 − bβ1xi) = 0; nP
i=1yi = bβ0 + bβ1 nP
i=1xi; y = bβ0 + bβ1x.
19
mh ∈ byh ± t(n−2;α/2) bsRvuuut n
1 +
µxh − xsx
¶2 ;xh = x; byh = y;mh ∈ yh ± t(n−2;α/2)bsR√n.
6.21 mh ∈ byh ± t(8;0.025)bsR√vhhvhh = x
0h
¡XTX
¢−1xh = 10.7306;mh ∈ −4.66± 2.31× 0.64
√10.7306;mh ∈ −4.66± 4.41.
6.22 yh ∈ byh ± t(10;0.025)bsRr1 + 1bnh ; bnh = n
1 +
µxh − xsx
¶2 ;xh = −0.2231;x = −1.4262; sx = 1.1134;n = 12; bβ0 = 735.784; bβ1 = 127.457; bs2R = 253.59; yh ∈ (668.79, 745.89).
20
Tabl
as
Esta
díst
ica
2004
-200
5
00,01
0,02
0,03
0,04
0,05
0,06
0,07
0,08
0,09
0,0
.5000
.5040
.5080
.5120
.5160
.5199
.5239
.5279
.5319
.5359
0,1
.5398
.5438
.5478
.5517
.5557
.5596
.5636
.5675
.5714
.5753
0,2
.5793
.5832
.5871
.5910
.5948
.5987
.6026
.6064
.6103
.6141
0,3
.6179
.6217
.6255
.6293
.6331
.6368
.6406
.6443
.6480
.6517
0,4
.6554
.6591
.6628
.6664
.6700
.6736
.6772
.6808
.6844
.6879
0,5
.6915
.6950
.6985
.7019
.7054
.7088
.7123
.7157
.7190
.7224
0,6
.7257
.7291
.7324
.7357
.7389
.7422
.7454
.7486
.7517
.7549
0,7
.7580
.7611
.7642
.7673
.7704
.7734
.7764
.7794
.7823
.7852
0,8
.7881
.7910
.7939
.7967
.7995
.8023
.8051
.8078
.8106
.8133
0,9
.8159
.8186
.8212
.8238
.8264
.8289
.8315
.8340
.8365
.8389
1,0
.8413
.8438
.8461
.8485
.8508
.8531
.8554
.8577
.8599
.8621
1,1
.8643
.8665
.8686
.8708
.8729
.8749
.8770
.8790
.8810
.8830
1,2
.8849
.8869
.8888
.8907
.8925
.8944
.8962
.8980
.8997
.9015
1,3
.9032
.9049
.9066
.9082
.9099
.9115
.9131
.9147
.9162
.9177
1,4
.9192
.9207
.9222
.9236
.9251
.9265
.9279
.9292
.9306
.9319
1,5
.9332
.9345
.9357
.9370
.9382
.9394
.9406
.9418
.9429
.9441
1,6
.9452
.9463
.9474
.9484
.9495
.9505
.9515
.9525
.9535
.9545
1,7
.9554
.9564
.9573
.9582
.9591
.9599
.9608
.9616
.9625
.9633
1,8
.9641
.9649
.9656
.9664
.9671
.9678
.9686
.9693
.9699
.9706
1,9
.9713
.9719
.9726
.9732
.9738
.9744
.9750
.9756
.9761
.9767
2,0
.9772
.9778
.9783
.9788
.9793
.9798
.9803
.9808
.9812
.9817
2,1
.9821
.9826
.9830
.9834
.9838
.9842
.9846
.9850
.9854
.9857
2,2
.9861
.9864
.9868
.9871
.9875
.9878
.9881
.9884
.9887
.9890
2,3
.9893
.9896
.9898
.9901
.9904
.9906
.9909
.9911
.9913
.9916
2,4
.9918
.9920
.9922
.9925
.9927
.9929
.9931
.9932
.9934
.9936
2,5
.9938
.9940
.9941
.9943
.9945
.9946
.9948
.9949
.9951
.9952
2,6
.9953
.9955
.9956
.9957
.9959
.9960
.9961
.9962
.9963
.9964
2,7
.9965
.9966
.9967
.9968
.9969
.9970
.9971
.9972
.9973
.9974
2,8
.9974
.9975
.9976
.9977
.9977
.9978
.9979
.9979
.9980
.9981
2,9
.9981
.9982
.9982
.9983
.9984
.9984
.9985
.9985
.9986
.9986
3,0
.9987
.9987
.9987
.9988
.9988
.9989
.9989
.9989
.9990
.9990
z
N(0,1)
)(
zZ
P≤
z
9750
.0)
96.1(Ejem
plo.
=≤
ZP
TABLA
Nor
mal
Es
tand
ar
z0,00
0,01
0,02
0,03
0,04
0,05
0,06
0,07
0,08
0,09
3,1
.9990323
.9990645
.9990957
.9991259
.9991552
.9991836
.9992111
.9992377
.9992636
.9992886
3,2
.9993128
.9993363
.9993590
.9993810
.9994023
.9994229
.9994429
.9994622
.9994809
.9994990
3,3
.9995165
.9995335
.9995499
.9995657
.9995811
.9995959
.9996102
.9996241
.9996375
.9996505
3,4
.9996630
.9996751
.9996868
.9996982
.9997091
.9997197
.9997299
.9997397
.9997492
.9997584
3,5
.9997673
.9997759
.9997842
.9997922
.9997999
.9998073
.9998145
.9998215
.9998282
.9998346
3,6
.9998409
.9998469
.9998527
.9998583
.9998636
.9998688
.9998739
.9998787
.9998834
.9998878
3,7
.9998922
.9998963
.9999004
.9999042
.9999080
.9999116
.9999150
.9999184
.9999216
.9999247
3,8
.9999276
.9999305
.9999333
.9999359
.9999385
.9999409
.9999433
.9999456
.9999478
.9999499
3,9
.9999519
.9999538
.9999557
.9999575
.9999592
.9999609
.9999625
.9999640
.9999655
.9999669
4,0
.9999683
.9999696
.9999709
.9999721
.9999733
.9999744
.9999755
.9999765
.9999775
.9999784
Bin
omia
ln,p
Poiss
onλ
Nor
mal
µ,σ
0,
→∞
→p
nnp
=λ
λσ
λµλ
==∞
→
)1(2/1
pnp
nppn
−==→∞
→
σµ
Dis
tribu
ción
nor
mal
est
ánda
r(co
ntin
uaci
ón)
Rel
ació
n en
tre B
inom
ial,
Pois
son
y N
orm
al
N(0,1)
)(
zZ
P≤
z
Tabl
a χ
2
α
ν: g
rado
s de
liber
tad
(g.l.
)
χ ν,α
EJEM
PLO
P(χ 9≥
19,0
2) =
0,0
25
g.l.
0,995
0,990
0,975
0,950
0,500
0,050
0,025
0,010
0,005
1,00004
,00016
,00098
,00393
0,455
3,841
5,024
6,635
7,879
2,01002
,0201
0,051
0,103
1,386
5,991
7,378
9,210
10,60
3,0717
0,115
0,216
0,352
2,366
7,815
9,348
11,34
12,84
40,207
0,297
0,484
0,711
3,357
9,488
11,14
13,28
14,86
50,412
0,554
0,831
1,145
4,351
11,07
12,83
15,09
16,75
60,676
0,872
1,237
1,635
5,348
12,59
14,45
16,81
18,55
70,989
1,239
1,690
2,167
6,346
14,07
16,01
18,48
20,28
81,344
1,647
2,180
2,733
7,344
15,51
17,53
20,09
21,95
91,735
2,088
2,700
3,325
8,343
16,92
19,02
21,67
23,59
102,156
2,558
3,247
3,940
9,342
18,31
20,48
23,21
25,19
112,603
3,053
3,816
4,575
10,341
19,68
21,92
24,73
26,76
123,074
3,571
4,404
5,226
11,340
21,03
23,34
26,22
28,30
133,565
4,107
5,009
5,892
12,340
22,36
24,74
27,69
29,82
144,075
4,660
5,629
6,571
13,339
23,68
26,12
29,14
31,32
154,601
5,229
6,262
7,261
14,339
25,00
27,49
30,58
32,80
165,142
5,812
6,908
7,962
15,338
26,30
28,85
32,00
34,27
175,697
6,408
7,564
8,672
16,338
27,59
30,19
33,41
35,72
186,265
7,015
8,231
9,390
17,338
28,87
31,53
34,81
37,16
196,844
7,633
8,907
10,117
18,338
30,14
32,85
36,19
38,58
207,434
8,260
9,591
10,851
19,337
31,41
34,17
37,57
40,00
218,034
8,897
10,283
11,591
20,337
32,67
35,48
38,93
41,40
228,643
9,542
10,982
12,338
21,337
33,92
36,78
40,29
42,80
239,260
10,196
11,689
13,091
22,337
35,17
38,08
41,64
44,18
249,886
10,856
12,401
13,848
23,337
36,42
39,36
42,98
45,56
2510,520
11,524
13,120
14,611
24,337
37,65
40,65
44,31
46,93
2611,160
12,198
13,844
15,379
25,336
38,89
41,92
45,64
48,29
2711,808
12,878
14,573
16,151
26,336
40,11
43,19
46,96
49,65
2812,461
13,565
15,308
16,928
27,336
41,34
44,46
48,28
50,99
2913,121
14,256
16,047
17,708
28,336
42,56
45,72
49,59
52,34
3013,787
14,953
16,791
18,493
29,336
43,77
46,98
50,89
53,67
4020,707
22,164
24,433
26,509
39,335
55,76
59,34
63,69
66,77
5027,991
29,707
32,357
34,764
49,335
67,50
71,42
76,15
79,49
6035,534
37,485
40,482
43,188
59,335
79,08
83,30
88,38
91,95
7043,275
45,442
48,758
51,739
69,334
90,53
95,02
100,43
104,21
8051,172
53,540
57,153
60,391
79,334
101,88
106,63
112,33
116,32
9059,196
61,754
65,647
69,126
89,334
113,15
118,14
124,12
128,30
100
67,328
70,065
74,222
77,929
99,334
124,34
129,56
135,81
140,17
120
83,852
86,923
91,573
95,705
119,334
146,57
152,21
158,95
163,65
α
g.l
0,20
0,15
0,10
0,05
0,025
0,01
0,005
0,0025
0,001
0,0005
11,376
1,963
3,078
6,314
12,706
31,821
63,656
127,321
318,289
636,578
21,061
1,386
1,886
2,920
4,303
6,965
9,925
14,089
22,328
31,600
30,978
1,250
1,638
2,353
3,182
4,541
5,841
7,453
10,214
12,924
40,941
1,190
1,533
2,132
2,776
3,747
4,604
5,598
7,173
8,610
50,920
1,156
1,476
2,015
2,571
3,365
4,032
4,773
5,894
6,869
60,906
1,134
1,440
1,943
2,447
3,143
3,707
4,317
5,208
5,959
70,896
1,119
1,415
1,895
2,365
2,998
3,499
4,029
4,785
5,408
80,889
1,108
1,397
1,860
2,306
2,896
3,355
3,833
4,501
5,041
90,883
1,100
1,383
1,833
2,262
2,821
3,250
3,690
4,297
4,781
100,879
1,093
1,372
1,812
2,228
2,764
3,169
3,581
4,144
4,587
110,876
1,088
1,363
1,796
2,201
2,718
3,106
3,497
4,025
4,437
120,873
1,083
1,356
1,782
2,179
2,681
3,055
3,428
3,930
4,318
130,870
1,079
1,350
1,771
2,160
2,650
3,012
3,372
3,852
4,221
140,868
1,076
1,345
1,761
2,145
2,624
2,977
3,326
3,787
4,140
150,866
1,074
1,341
1,753
2,131
2,602
2,947
3,286
3,733
4,073
160,865
1,071
1,337
1,746
2,120
2,583
2,921
3,252
3,686
4,015
170,863
1,069
1,333
1,740
2,110
2,567
2,898
3,222
3,646
3,965
180,862
1,067
1,330
1,734
2,101
2,552
2,878
3,197
3,610
3,922
190,861
1,066
1,328
1,729
2,093
2,539
2,861
3,174
3,579
3,883
200,860
1,064
1,325
1,725
2,086
2,528
2,845
3,153
3,552
3,850
210,859
1,063
1,323
1,721
2,080
2,518
2,831
3,135
3,527
3,819
220,858
1,061
1,321
1,717
2,074
2,508
2,819
3,119
3,505
3,792
230,858
1,060
1,319
1,714
2,069
2,500
2,807
3,104
3,485
3,768
240,857
1,059
1,318
1,711
2,064
2,492
2,797
3,091
3,467
3,745
250,856
1,058
1,316
1,708
2,060
2,485
2,787
3,078
3,450
3,725
260,856
1,058
1,315
1,706
2,056
2,479
2,779
3,067
3,435
3,707
270,855
1,057
1,314
1,703
2,052
2,473
2,771
3,057
3,421
3,689
280,855
1,056
1,313
1,701
2,048
2,467
2,763
3,047
3,408
3,674
290,854
1,055
1,311
1,699
2,045
2,462
2,756
3,038
3,396
3,660
300,854
1,055
1,310
1,697
2,042
2,457
2,750
3,030
3,385
3,646
400,851
1,050
1,303
1,684
2,021
2,423
2,704
2,971
3,307
3,551
500,849
1,047
1,299
1,676
2,009
2,403
2,678
2,937
3,261
3,496
600,848
1,045
1,296
1,671
2,000
2,390
2,660
2,915
3,232
3,460
700,847
1,044
1,294
1,667
1,994
2,381
2,648
2,899
3,211
3,435
800,846
1,043
1,292
1,664
1,990
2,374
2,639
2,887
3,195
3,416
900,846
1,042
1,291
1,662
1,987
2,368
2,632
2,878
3,183
3,402
100
0,845
1,042
1,290
1,660
1,984
2,364
2,626
2,871
3,174
3,390
infinito
0,842
1,036
1,282
1,645
1,960
2,327
2,576
2,808
3,091
3,291
0,20
0,15
0,10
0,05
0,025
0,01
0,005
0,0025
0,001
0,0005
Tabl
a
t-Stu
dent
α
α
ν: g
rado
s de
liber
tad
(g.l.
)
t ν,α
EJEM
PLO
P(t 9≥
2,26
2) =
0,0
25
Grados de libertad del denominador: ν2
Gra
dos d
e l ib
ert a
d de
l nu m
erad
o r: ν
1α
=0.0
5Ta
bla
Fα
αν
νν
να
νν
=≥
⇒)
(,
,,
,,
21
21
21
FF
PF
05.0)
50.3(
:8,7
=≥
FP
Ejem
plo
12
34
56
78
910
1215
2024
3040
60100
120
Inf.
1161,4
199,5
215,7
224,6
230,2
234,0
236,8
238,9
240,5
241,9
243,9
245,9
248,0
249,1
250,1
251,1
252,2
253,0
253,3
254,3
12
18,51
19,00
19,16
19,25
19,30
19,33
19,35
19,37
19,38
19,40
19,41
19,43
19,45
19,45
19,46
19,47
19,48
19,49
19,49
19,50
23
10,13
9,55
9,28
9,12
9,01
8,94
8,89
8,85
8,81
8,79
8,74
8,70
8,66
8,64
8,62
8,59
8,57
8,55
8,55
8,53
34
7,71
6,94
6,59
6,39
6,26
6,16
6,09
6,04
6,00
5,96
5,91
5,86
5,80
5,77
5,75
5,72
5,69
5,66
5,66
5,63
45
6,61
5,79
5,41
5,19
5,05
4,95
4,88
4,82
4,77
4,74
4,68
4,62
4,56
4,53
4,50
4,46
4,43
4,41
4,40
4,37
56
5,99
5,14
4,76
4,53
4,39
4,28
4,21
4,15
4,10
4,06
4,00
3,94
3,87
3,84
3,81
3,77
3,74
3,71
3,70
3,67
67
5,59
4,74
4,35
4,12
3,97
3,87
3,79
3,73
3,68
3,64
3,57
3,51
3,44
3,41
3,38
3,34
3,30
3,27
3,27
3,23
78
5,32
4,46
4,07
3,84
3,69
3,58
3,50
3,44
3,39
3,35
3,28
3,22
3,15
3,12
3,08
3,04
3,01
2,97
2,97
2,93
89
5,12
4,26
3,86
3,63
3,48
3,37
3,29
3,23
3,18
3,14
3,07
3,01
2,94
2,90
2,86
2,83
2,79
2,76
2,75
2,71
910
4,96
4,10
3,71
3,48
3,33
3,22
3,14
3,07
3,02
2,98
2,91
2,85
2,77
2,74
2,70
2,66
2,62
2,59
2,58
2,54
1011
4,84
3,98
3,59
3,36
3,20
3,09
3,01
2,95
2,90
2,85
2,79
2,72
2,65
2,61
2,57
2,53
2,49
2,46
2,45
2,40
1112
4,75
3,89
3,49
3,26
3,11
3,00
2,91
2,85
2,80
2,75
2,69
2,62
2,54
2,51
2,47
2,43
2,38
2,35
2,34
2,30
1213
4,67
3,81
3,41
3,18
3,03
2,92
2,83
2,77
2,71
2,67
2,60
2,53
2,46
2,42
2,38
2,34
2,30
2,26
2,25
2,21
1314
4,60
3,74
3,34
3,11
2,96
2,85
2,76
2,70
2,65
2,60
2,53
2,46
2,39
2,35
2,31
2,27
2,22
2,19
2,18
2,13
1415
4,54
3,68
3,29
3,06
2,90
2,79
2,71
2,64
2,59
2,54
2,48
2,40
2,33
2,29
2,25
2,20
2,16
2,12
2,11
2,07
1516
4,49
3,63
3,24
3,01
2,85
2,74
2,66
2,59
2,54
2,49
2,42
2,35
2,28
2,24
2,19
2,15
2,11
2,07
2,06
2,01
1617
4,45
3,59
3,20
2,96
2,81
2,70
2,61
2,55
2,49
2,45
2,38
2,31
2,23
2,19
2,15
2,10
2,06
2,02
2,01
1,96
1718
4,41
3,55
3,16
2,93
2,77
2,66
2,58
2,51
2,46
2,41
2,34
2,27
2,19
2,15
2,11
2,06
2,02
1,98
1,97
1,92
1819
4,38
3,52
3,13
2,90
2,74
2,63
2,54
2,48
2,42
2,38
2,31
2,23
2,16
2,11
2,07
2,03
1,98
1,94
1,93
1,88
1920
4,35
3,49
3,10
2,87
2,71
2,60
2,51
2,45
2,39
2,35
2,28
2,20
2,12
2,08
2,04
1,99
1,95
1,91
1,90
1,84
2021
4,32
3,47
3,07
2,84
2,68
2,57
2,49
2,42
2,37
2,32
2,25
2,18
2,10
2,05
2,01
1,96
1,92
1,88
1,87
1,81
2122
4,30
3,44
3,05
2,82
2,66
2,55
2,46
2,40
2,34
2,30
2,23
2,15
2,07
2,03
1,98
1,94
1,89
1,85
1,84
1,78
2223
4,28
3,42
3,03
2,80
2,64
2,53
2,44
2,37
2,32
2,27
2,20
2,13
2,05
2,01
1,96
1,91
1,86
1,82
1,81
1,76
2324
4,26
3,40
3,01
2,78
2,62
2,51
2,42
2,36
2,30
2,25
2,18
2,11
2,03
1,98
1,94
1,89
1,84
1,80
1,79
1,73
2425
4,24
3,39
2,99
2,76
2,60
2,49
2,40
2,34
2,28
2,24
2,16
2,09
2,01
1,96
1,92
1,87
1,82
1,78
1,77
1,71
2526
4,23
3,37
2,98
2,74
2,59
2,47
2,39
2,32
2,27
2,22
2,15
2,07
1,99
1,95
1,90
1,85
1,80
1,76
1,75
1,69
2627
4,21
3,35
2,96
2,73
2,57
2,46
2,37
2,31
2,25
2,20
2,13
2,06
1,97
1,93
1,88
1,84
1,79
1,74
1,73
1,67
2728
4,20
3,34
2,95
2,71
2,56
2,45
2,36
2,29
2,24
2,19
2,12
2,04
1,96
1,91
1,87
1,82
1,77
1,73
1,71
1,65
2829
4,18
3,33
2,93
2,70
2,55
2,43
2,35
2,28
2,22
2,18
2,10
2,03
1,94
1,90
1,85
1,81
1,75
1,71
1,70
1,64
2930
4,17
3,32
2,92
2,69
2,53
2,42
2,33
2,27
2,21
2,16
2,09
2,01
1,93
1,89
1,84
1,79
1,74
1,70
1,68
1,62
3040
4,08
3,23
2,84
2,61
2,45
2,34
2,25
2,18
2,12
2,08
2,00
1,92
1,84
1,79
1,74
1,69
1,64
1,59
1,58
1,51
4050
4,03
3,18
2,79
2,56
2,40
2,29
2,20
2,13
2,07
2,03
1,95
1,87
1,78
1,74
1,69
1,63
1,58
1,52
1,51
1,44
5060
4,00
3,15
2,76
2,53
2,37
2,25
2,17
2,10
2,04
1,99
1,92
1,84
1,75
1,70
1,65
1,59
1,53
1,48
1,47
1,39
6070
3,98
3,13
2,74
2,50
2,35
2,23
2,14
2,07
2,02
1,97
1,89
1,81
1,72
1,67
1,62
1,57
1,50
1,45
1,44
1,35
7080
3,96
3,11
2,72
2,49
2,33
2,21
2,13
2,06
2,00
1,95
1,88
1,79
1,70
1,65
1,60
1,54
1,48
1,43
1,41
1,32
8090
3,95
3,10
2,71
2,47
2,32
2,20
2,11
2,04
1,99
1,94
1,86
1,78
1,69
1,64
1,59
1,53
1,46
1,41
1,39
1,30
90100
3,94
3,09
2,70
2,46
2,31
2,19
2,10
2,03
1,97
1,93
1,85
1,77
1,68
1,63
1,57
1,52
1,45
1,39
1,38
1,28
100
120
3,92
3,07
2,68
2,45
2,29
2,18
2,09
2,02
1,96
1,91
1,83
1,75
1,66
1,61
1,55
1,50
1,43
1,37
1,35
1,25
120
Inf
3,84
3,00
2,60
2,37
2,21
2,10
2,01
1,94
1,88
1,83
1,75
1,67
1,57
1,52
1,46
1,39
1,32
1,24
1,22
1,00
Inf
12
34
56
78
910
1215
2024
3040
60100
120
Inf.
Grados de libertad del denominador: ν2
Gra
dos d
e l ib
ert a
d de
l nu m
erad
o r: ν
1α
=0.0
25Ta
bla
Fα
αν
νν
να
νν
=≥
⇒)
(,
,,
,,
21
21
21
FF
PF
025
.0)
53.4(
:8,7
=≥
FP
Ejem
plo
12
34
56
78
910
1215
2024
3040
60100
120
Inf.
1647,8
799,5
864,2
899,6
921,8
937,1
948,2
956,6
963,3
968,6
976,7
984,9
993,1
997,31001,41005,61009,81013,21014,01018,3
12
38,51
39,00
39,17
39,25
39,30
39,33
39,36
39,37
39,39
39,40
39,41
39,43
39,45
39,46
39,46
39,47
39,48
39,49
39,49
39,50
23
17,44
16,04
15,44
15,10
14,88
14,73
14,62
14,54
14,47
14,42
14,34
14,25
14,17
14,12
14,08
14,04
13,99
13,96
13,95
13,90
34
12,22
10,65
9,98
9,60
9,36
9,20
9,07
8,98
8,90
8,84
8,75
8,66
8,56
8,51
8,46
8,41
8,36
8,32
8,31
8,26
45
10,01
8,43
7,76
7,39
7,15
6,98
6,85
6,76
6,68
6,62
6,52
6,43
6,33
6,28
6,23
6,18
6,12
6,08
6,07
6,02
56
8,81
7,26
6,60
6,23
5,99
5,82
5,70
5,60
5,52
5,46
5,37
5,27
5,17
5,12
5,07
5,01
4,96
4,92
4,90
4,85
67
8,07
6,54
5,89
5,52
5,29
5,12
4,99
4,90
4,82
4,76
4,67
4,57
4,47
4,41
4,36
4,31
4,25
4,21
4,20
4,14
78
7,57
6,06
5,42
5,05
4,82
4,65
4,53
4,43
4,36
4,30
4,20
4,10
4,00
3,95
3,89
3,84
3,78
3,74
3,73
3,67
89
7,21
5,71
5,08
4,72
4,48
4,32
4,20
4,10
4,03
3,96
3,87
3,77
3,67
3,61
3,56
3,51
3,45
3,40
3,39
3,33
910
6,94
5,46
4,83
4,47
4,24
4,07
3,95
3,85
3,78
3,72
3,62
3,52
3,42
3,37
3,31
3,26
3,20
3,15
3,14
3,08
1011
6,72
5,26
4,63
4,28
4,04
3,88
3,76
3,66
3,59
3,53
3,43
3,33
3,23
3,17
3,12
3,06
3,00
2,96
2,94
2,88
1112
6,55
5,10
4,47
4,12
3,89
3,73
3,61
3,51
3,44
3,37
3,28
3,18
3,07
3,02
2,96
2,91
2,85
2,80
2,79
2,72
1213
6,41
4,97
4,35
4,00
3,77
3,60
3,48
3,39
3,31
3,25
3,15
3,05
2,95
2,89
2,84
2,78
2,72
2,67
2,66
2,60
1314
6,30
4,86
4,24
3,89
3,66
3,50
3,38
3,29
3,21
3,15
3,05
2,95
2,84
2,79
2,73
2,67
2,61
2,56
2,55
2,49
1415
6,20
4,77
4,15
3,80
3,58
3,41
3,29
3,20
3,12
3,06
2,96
2,86
2,76
2,70
2,64
2,59
2,52
2,47
2,46
2,40
1516
6,12
4,69
4,08
3,73
3,50
3,34
3,22
3,12
3,05
2,99
2,89
2,79
2,68
2,63
2,57
2,51
2,45
2,40
2,38
2,32
1617
6,04
4,62
4,01
3,66
3,44
3,28
3,16
3,06
2,98
2,92
2,82
2,72
2,62
2,56
2,50
2,44
2,38
2,33
2,32
2,25
1718
5,98
4,56
3,95
3,61
3,38
3,22
3,10
3,01
2,93
2,87
2,77
2,67
2,56
2,50
2,44
2,38
2,32
2,27
2,26
2,19
1819
5,92
4,51
3,90
3,56
3,33
3,17
3,05
2,96
2,88
2,82
2,72
2,62
2,51
2,45
2,39
2,33
2,27
2,22
2,20
2,13
1920
5,87
4,46
3,86
3,51
3,29
3,13
3,01
2,91
2,84
2,77
2,68
2,57
2,46
2,41
2,35
2,29
2,22
2,17
2,16
2,09
2021
5,83
4,42
3,82
3,48
3,25
3,09
2,97
2,87
2,80
2,73
2,64
2,53
2,42
2,37
2,31
2,25
2,18
2,13
2,11
2,04
2122
5,79
4,38
3,78
3,44
3,22
3,05
2,93
2,84
2,76
2,70
2,60
2,50
2,39
2,33
2,27
2,21
2,14
2,09
2,08
2,00
2223
5,75
4,35
3,75
3,41
3,18
3,02
2,90
2,81
2,73
2,67
2,57
2,47
2,36
2,30
2,24
2,18
2,11
2,06
2,04
1,97
2324
5,72
4,32
3,72
3,38
3,15
2,99
2,87
2,78
2,70
2,64
2,54
2,44
2,33
2,27
2,21
2,15
2,08
2,02
2,01
1,94
2425
5,69
4,29
3,69
3,35
3,13
2,97
2,85
2,75
2,68
2,61
2,51
2,41
2,30
2,24
2,18
2,12
2,05
2,00
1,98
1,91
2526
5,66
4,27
3,67
3,33
3,10
2,94
2,82
2,73
2,65
2,59
2,49
2,39
2,28
2,22
2,16
2,09
2,03
1,97
1,95
1,88
2627
5,63
4,24
3,65
3,31
3,08
2,92
2,80
2,71
2,63
2,57
2,47
2,36
2,25
2,19
2,13
2,07
2,00
1,94
1,93
1,85
2728
5,61
4,22
3,63
3,29
3,06
2,90
2,78
2,69
2,61
2,55
2,45
2,34
2,23
2,17
2,11
2,05
1,98
1,92
1,91
1,83
2829
5,59
4,20
3,61
3,27
3,04
2,88
2,76
2,67
2,59
2,53
2,43
2,32
2,21
2,15
2,09
2,03
1,96
1,90
1,89
1,81
2930
5,57
4,18
3,59
3,25
3,03
2,87
2,75
2,65
2,57
2,51
2,41
2,31
2,20
2,14
2,07
2,01
1,94
1,88
1,87
1,79
3040
5,42
4,05
3,46
3,13
2,90
2,74
2,62
2,53
2,45
2,39
2,29
2,18
2,07
2,01
1,94
1,88
1,80
1,74
1,72
1,64
4050
5,34
3,97
3,39
3,05
2,83
2,67
2,55
2,46
2,38
2,32
2,22
2,11
1,99
1,93
1,87
1,80
1,72
1,66
1,64
1,55
5060
5,29
3,93
3,34
3,01
2,79
2,63
2,51
2,41
2,33
2,27
2,17
2,06
1,94
1,88
1,82
1,74
1,67
1,60
1,58
1,48
6070
5,25
3,89
3,31
2,97
2,75
2,59
2,47
2,38
2,30
2,24
2,14
2,03
1,91
1,85
1,78
1,71
1,63
1,56
1,54
1,44
7080
5,22
3,86
3,28
2,95
2,73
2,57
2,45
2,35
2,28
2,21
2,11
2,00
1,88
1,82
1,75
1,68
1,60
1,53
1,51
1,40
8090
5,20
3,84
3,26
2,93
2,71
2,55
2,43
2,34
2,26
2,19
2,09
1,98
1,86
1,80
1,73
1,66
1,58
1,50
1,48
1,37
90100
5,18
3,83
3,25
2,92
2,70
2,54
2,42
2,32
2,24
2,18
2,08
1,97
1,85
1,78
1,71
1,64
1,56
1,48
1,46
1,35
100
120
5,15
3,80
3,23
2,89
2,67
2,52
2,39
2,30
2,22
2,16
2,05
1,94
1,82
1,76
1,69
1,61
1,53
1,45
1,43
1,31
120
Inf
5,02
3,69
3,12
2,79
2,57
2,41
2,29
2,19
2,11
2,05
1,94
1,83
1,71
1,64
1,57
1,48
1,39
1,30
1,27
1,00
Inf
12
34
56
78
910
1215
2024
3040
60100
120
Inf.
Grados de libertad del denominador: ν2
Gra
dos d
e l ib
ert a
d de
l nu m
erad
o r: ν
1α
=0.0
1Ta
bla
Fα
αν
νν
να
νν
=≥
⇒)
(,
,,
,,
21
21
21
FF
PF
01.0)
18.6(
:8,7
=≥
FP
Ejem
plo
12
34
56
78
910
1215
2024
3040
60100
120
Inf.
14052,24999,35403,55624,35764,05859,05928,35981,06022,46055,96106,76157,06208,76234,36260,46286,46313,06333,96339,56365,6
12
98,50
99,00
99,16
99,25
99,30
99,33
99,36
99,38
99,39
99,40
99,42
99,43
99,45
99,46
99,47
99,48
99,48
99,49
99,49
99,50
23
34,12
30,82
29,46
28,71
28,24
27,91
27,67
27,49
27,34
27,23
27,05
26,87
26,69
26,60
26,50
26,41
26,32
26,24
26,22
26,13
34
21,20
18,00
16,69
15,98
15,52
15,21
14,98
14,80
14,66
14,55
14,37
14,20
14,02
13,93
13,84
13,75
13,65
13,58
13,56
13,46
45
16,26
13,27
12,06
11,39
10,97
10,67
10,46
10,29
10,16
10,05
9,89
9,72
9,55
9,47
9,38
9,29
9,20
9,13
9,11
9,02
56
13,75
10,92
9,78
9,15
8,75
8,47
8,26
8,10
7,98
7,87
7,72
7,56
7,40
7,31
7,23
7,14
7,06
6,99
6,97
6,88
67
12,25
9,55
8,45
7,85
7,46
7,19
6,99
6,84
6,72
6,62
6,47
6,31
6,16
6,07
5,99
5,91
5,82
5,75
5,74
5,65
78
11,26
8,65
7,59
7,01
6,63
6,37
6,18
6,03
5,91
5,81
5,67
5,52
5,36
5,28
5,20
5,12
5,03
4,96
4,95
4,86
89
10,56
8,02
6,99
6,42
6,06
5,80
5,61
5,47
5,35
5,26
5,11
4,96
4,81
4,73
4,65
4,57
4,48
4,41
4,40
4,31
910
10,04
7,56
6,55
5,99
5,64
5,39
5,20
5,06
4,94
4,85
4,71
4,56
4,41
4,33
4,25
4,17
4,08
4,01
4,00
3,91
1011
9,65
7,21
6,22
5,67
5,32
5,07
4,89
4,74
4,63
4,54
4,40
4,25
4,10
4,02
3,94
3,86
3,78
3,71
3,69
3,60
1112
9,33
6,93
5,95
5,41
5,06
4,82
4,64
4,50
4,39
4,30
4,16
4,01
3,86
3,78
3,70
3,62
3,54
3,47
3,45
3,36
1213
9,07
6,70
5,74
5,21
4,86
4,62
4,44
4,30
4,19
4,10
3,96
3,82
3,66
3,59
3,51
3,43
3,34
3,27
3,25
3,17
1314
8,86
6,51
5,56
5,04
4,69
4,46
4,28
4,14
4,03
3,94
3,80
3,66
3,51
3,43
3,35
3,27
3,18
3,11
3,09
3,00
1415
8,68
6,36
5,42
4,89
4,56
4,32
4,14
4,00
3,89
3,80
3,67
3,52
3,37
3,29
3,21
3,13
3,05
2,98
2,96
2,87
1516
8,53
6,23
5,29
4,77
4,44
4,20
4,03
3,89
3,78
3,69
3,55
3,41
3,26
3,18
3,10
3,02
2,93
2,86
2,84
2,75
1617
8,40
6,11
5,19
4,67
4,34
4,10
3,93
3,79
3,68
3,59
3,46
3,31
3,16
3,08
3,00
2,92
2,83
2,76
2,75
2,65
1718
8,29
6,01
5,09
4,58
4,25
4,01
3,84
3,71
3,60
3,51
3,37
3,23
3,08
3,00
2,92
2,84
2,75
2,68
2,66
2,57
1819
8,18
5,93
5,01
4,50
4,17
3,94
3,77
3,63
3,52
3,43
3,30
3,15
3,00
2,92
2,84
2,76
2,67
2,60
2,58
2,49
1920
8,10
5,85
4,94
4,43
4,10
3,87
3,70
3,56
3,46
3,37
3,23
3,09
2,94
2,86
2,78
2,69
2,61
2,54
2,52
2,42
2021
8,02
5,78
4,87
4,37
4,04
3,81
3,64
3,51
3,40
3,31
3,17
3,03
2,88
2,80
2,72
2,64
2,55
2,48
2,46
2,36
2122
7,95
5,72
4,82
4,31
3,99
3,76
3,59
3,45
3,35
3,26
3,12
2,98
2,83
2,75
2,67
2,58
2,50
2,42
2,40
2,31
2223
7,88
5,66
4,76
4,26
3,94
3,71
3,54
3,41
3,30
3,21
3,07
2,93
2,78
2,70
2,62
2,54
2,45
2,37
2,35
2,26
2324
7,82
5,61
4,72
4,22
3,90
3,67
3,50
3,36
3,26
3,17
3,03
2,89
2,74
2,66
2,58
2,49
2,40
2,33
2,31
2,21
2425
7,77
5,57
4,68
4,18
3,85
3,63
3,46
3,32
3,22
3,13
2,99
2,85
2,70
2,62
2,54
2,45
2,36
2,29
2,27
2,17
2526
7,72
5,53
4,64
4,14
3,82
3,59
3,42
3,29
3,18
3,09
2,96
2,81
2,66
2,58
2,50
2,42
2,33
2,25
2,23
2,13
2627
7,68
5,49
4,60
4,11
3,78
3,56
3,39
3,26
3,15
3,06
2,93
2,78
2,63
2,55
2,47
2,38
2,29
2,22
2,20
2,10
2728
7,64
5,45
4,57
4,07
3,75
3,53
3,36
3,23
3,12
3,03
2,90
2,75
2,60
2,52
2,44
2,35
2,26
2,19
2,17
2,06
2829
7,60
5,42
4,54
4,04
3,73
3,50
3,33
3,20
3,09
3,00
2,87
2,73
2,57
2,49
2,41
2,33
2,23
2,16
2,14
2,03
2930
7,56
5,39
4,51
4,02
3,70
3,47
3,30
3,17
3,07
2,98
2,84
2,70
2,55
2,47
2,39
2,30
2,21
2,13
2,11
2,01
3040
7,31
5,18
4,31
3,83
3,51
3,29
3,12
2,99
2,89
2,80
2,66
2,52
2,37
2,29
2,20
2,11
2,02
1,94
1,92
1,80
4050
7,17
5,06
4,20
3,72
3,41
3,19
3,02
2,89
2,78
2,70
2,56
2,42
2,27
2,18
2,10
2,01
1,91
1,82
1,80
1,68
5060
7,08
4,98
4,13
3,65
3,34
3,12
2,95
2,82
2,72
2,63
2,50
2,35
2,20
2,12
2,03
1,94
1,84
1,75
1,73
1,60
6070
7,01
4,92
4,07
3,60
3,29
3,07
2,91
2,78
2,67
2,59
2,45
2,31
2,15
2,07
1,98
1,89
1,78
1,70
1,67
1,54
7080
6,96
4,88
4,04
3,56
3,26
3,04
2,87
2,74
2,64
2,55
2,42
2,27
2,12
2,03
1,94
1,85
1,75
1,65
1,63
1,49
8090
6,93
4,85
4,01
3,53
3,23
3,01
2,84
2,72
2,61
2,52
2,39
2,24
2,09
2,00
1,92
1,82
1,72
1,62
1,60
1,46
90100
6,90
4,82
3,98
3,51
3,21
2,99
2,82
2,69
2,59
2,50
2,37
2,22
2,07
1,98
1,89
1,80
1,69
1,60
1,57
1,43
100
120
6,85
4,79
3,95
3,48
3,17
2,96
2,79
2,66
2,56
2,47
2,34
2,19
2,03
1,95
1,86
1,76
1,66
1,56
1,53
1,38
120
Inf
6,63
4,61
3,78
3,32
3,02
2,80
2,64
2,51
2,41
2,32
2,18
2,04
1,88
1,79
1,70
1,59
1,47
1,36
1,32
1,00
Inf
12
34
56
78
910
1215
2024
3040
60100
120
Inf.