Experimentos Simples 123 Alumnos

Embed Size (px)

DESCRIPTION

Experimentos de probabilidad y estadistica

Citation preview

1.2.3.- DATOS DE UNA, DOS Y TRES VAS.

1.2.3.1- DISEO COMPLETAMENTE AL AZAR,

1.2.1.- CARACTERSTICAS Y PROPSITOS DEL ANLISIS DE VARIANZA.

La estadstica ha desarrollado la tcnica de Fisher conocida como anlisis de varianza (ANAVA), para la prueba de hiptesis de varias poblaciones con datos de muestras. Esta tcnica es una herramienta muy til en el proceso de investigacin en el cual se aplican la observacin y la experimentacin.

La tcnica del ANAVA consiste en separar de la variacin total observada las causas o factores parciales siguiendo los siguientes pasos:a) Clasificar o separar las causas parciales de variacinb) Calcular los grados de libertad para cada factor o causa de variacinc) Calcular la suma de cuadrados de las desviaciones de las observaciones con respecto a la media, para cada una de las causas de variacind) Probar la hiptesis por medio de la prueba de Fisher, conocida como prueba de F o relacin de varianza.e) Comparar los promedios (discriminar variables) por varios mtodos, cuando los tratamientos son numerosos.f) Calcular la varianza o cuadrado medio para cada factor de variacin.

El tipo ms sencillo de un arreglo es aquel en que los tratamientos estn asignados completamente al azar a las unidades experimentales.

Esta distribucin se usa cuando se usan dos o ms tratamientos bajo las siguientes condiciones: Lugar y unidad experimental muy uniforme (homognea). Cuando sea probable que una parte del experimento se pierda. Cuando se tiene un experimento pequeo y donde la mayor precisin de otras distribuciones no compensa la perdida de grados de libertad del error.

Este diseo tiene varias ventajas:1.- Permite flexibilidad completa. Puede usarse cualquier nmero de repeticiones y de tratamientos.2.- El anlisis estadstico es fcil, aun si el nmero de repeticiones no es el mismo por tratamientos.Aun cuando los datos de algunas unidades o algunos tratamientos completos se hayan perdido.

El Anava requiere el cumplimiento los siguientes supuestos:

Las poblaciones (distribuciones de probabilidad de la variable dependiente correspondiente a cada factor) son normales. Las K muestras sobre las que se aplican los tratamientos son independientes. Las poblaciones tienen todas igual varianza (homoscedasticidad).

TIPOS DE MODELOS ESTADISTICOS

De acuerdo a la seleccin de los tratamientos y otros factores se tiene la siguiente clasificacin:

Modelo I (Efectos Fijos):

Se presenta cuando los tratamientos y dems factores que intervienen en un experimento son fijados por el investigador; es decir, no se efecta una eleccin aleatoria. En estos casos las conclusiones del anlisis de variancia solamente son vlidas para los tratamientos y otros factores usados en el experimento.

Modelo II (Efectos aleatorios):

Se presenta cuando los tratamientos y dems factores que intervienen en un experimento son elegidos al azar de una poblacin. En estos casos las conclusiones del anlisis de variancia son vlidos, tanto para los tratamientos y dems factores usados, as como para todas las poblaciones de tratamientos y factores.

Modelo III (Modelo Mixto):

Este modelo es la combinacin de los dos anteriores y se presenta cuando algunos factores son fijados y otros son elegidos al azar. En estos casos las conclusiones del anlisis de variancia sern vlidas para toda la poblacin de factores cuando estos son elegidos al azar, y solamente para los factores usados cuando estos son fijados.

Las Hiptesis a Probar sern:

Ho: 1=2=3....a

Ha: 123....a

Otra forma equivalente de plantear las hiptesis en trminos de los efectos de los tratamientos, si las medias de los tratamientos son iguales, esto implica que no existe ningn efecto o desviacin causada por el tratamiento en si, las hiptesis son:

Ho: t1= t2=t3......ta

Ha: t1 t2t3......ta

Regla de Decisin:

Si Fc es que la F Hay diferencia significativa entre los tratamientosSi Fc es que la F No hay diferencia significativa entre los tratamientos

Modelo I (Efectos Fijos):

Cuando los tratamientos son seleccionados por el experimentador y las conclusiones del anlisis slo se aplican a dichos tratamientos.

Cuadro 1.- Mostrando la estructura de datos para el anlisis de varianza Tratamientos Observaciones TRATSMedia

1234nXi.

1X11X12X13X14X1nX1.

2X21X22X23X24X2nX2.

3X31X32 XIJX33X34X3nX3.

.....

aXa1Xa2Xa3Xa4XanXa.

X..

X..=X1.+X2.+X3.+....+Xa.

Donde las observaciones Xij se pueden representar con el modelo:

Xij = + i + ij

Cuando i = 1,2,....., a y j = 1,2,.......,n

Donde:

Xij: Variable de respuesta : Es la media general alrededor de la cual oscilan los valores de todas las observaciones.i: Efecto del i-esimo tratamiento o nivel de un factorij: error experimental, variacin debido al azar o variacin de muestreo NI (0, 2)

Distribucin completamente al azar con el mismo nmero de repeticiones por tratamiento.Donde : Tratamientos = a Repeticiones = n

1.

2. -FC

3. 4.

Cuadro 2.- Modelo de anlisis de varianza para una distribucin completamente al azar

Fuentes de variacinG.L.S.C.CM = 2FcF

Tratamientoa 1

Errora(n-1)

Totalan 1

Distribucin Completamente al Azar con Diferente Nmero de Repeticiones por TratamientoDonde : Tratamientos = a Repeticiones = n

Cuadro 3.- Mostrando la estructura de datos para el anlisis de varianza Tratamientos Observaciones TRATSMedia

12345Xi.

1X11X12X13X14X1.

2X21X22X23X24X25X2.

3X31X32X33XIJX3.

4X41X42X43X44X45.

5X51X52X53X5.

X..

X..=X1.+X2.+X3.+....+Xa.

1.-

2.-

3.-

4.-

Cuadro 4.- Modelo de anlisis de varianza para una distribucin completamente al azar con diferente nmero de repeticiones por tratamiento.

Fuentes de variacinG.L.S.C.CM = 2FcF

Tratamientoa 1

Error

Total

Estimacin de parmetros:

El efecto de cada tratamiento se traduce en una desviacin de la media poblacional. Existe un valor i que representa la media para un tratamiento que debe ser el valor de la media poblacional ms la desviacin causada por el tratamiento, esto es: i=+i. Se puede tener una estimacin del valor i por el intervalo siguiente:

O

De igual forma se puede tener una estimacin para la diferencia de medias de dos tratamientos: i-j

o

Donde: = La media de las n observaciones del tratamiento i

= La media de las n observaciones del tratamiento j t/2, gLError = Valor del estadstico t para una significancia /2 y glError

Estadsticos que verifican calidad de los datos, R2 y CV. Al interpretar un ANDEVA es importante medir que tan bueno fue el modelo estadstico aplicado y si el error experimental fue controlados por el diseo experimental. Para este tipo de anlisis disponemos de dos coeficientes fciles de calcular el coeficiente de determinacin, R2 , y el coeficiente de variacin aplicado al error CV. El coeficiente de Determinacin, R2 : Este coeficiente muestra que proporcin de la variacin total de los datos est siendo explicada por el modelo adoptado, R2 es un valor entre 0 y 1; a ms cerca de 1 mejor funciona el modelo. El R2 se construye con la suma de cuadrados de la tabla ANDEVA de la siguiente manera: 2 = / . En el caso de un DCA la suma de cuadrados del modelo, SCModelo, es la suma de cuadrados de los tratamientos. En el caso de un BCA (bloques completos al azar), la SCModelo es igual a la SCTratamientos + SCBloques. En una caso de un cuadro latino, CL, la SCModelo es igual a la SCTratamientos + SCFilas + SCcolumnas.Coeficiente de variacinEl Coeficiente de Variacin, CV, se puede aplicar para medir la variacin interna de los tratamientos, variacin que se refleja en la variancia del error o cuadrado medio del error. Un experimento mal manejado puede presentar mucha variacin entre las repeticiones de un mismo tratamiento, esto es error experimental. El CV tambin est en dependencia de la variable que se mide o pesa. Si la variable est bien controlada el CV deber ser menor a 20 %, incluso en laboratorio se pueden exigir CV menores al 10 %. Sin embargo en investigacin social descriptiva o en variables biolgicas no controladas como es una plaga, es comn que los CV sean grandes. En experimentacin no controlada (condiciones de campo) se considera que un coeficiente de variabilidad mayor de 35% es elevado por lo que se debe tener especial cuidado en la interpretacin y o conclusiones.a).- CV = 20% muy variableb).- CV = 10% variablec).- CV = 5% Relativamente variable

Coeficiente de Variacin %Interpretacin del coeficiente

Variabilidad Estabilidad

Igual a 0NulaMuy alta

Mayor de 0 - 20BajaAlta

Mayor de 20 60ModeradaModerada

Mayor de 60 90AltaBaja

Mayor de 90Muy altaNula

El investigador debe explicar la causa de esta variacin. La forma de clculo es:

ANALISIS DEL MODELO DE EFECTOS FIJOS

En esta seccin se desarrolla el anlisis de un solo factor para el modelo de efectos fijos. Recuerde que xi representa el total de las observaciones bajo el tratamiento i-esimo. Sea que la media represente el promedio de las observaciones bajo el tratamiento i-esimo. De manera similar, sea que X.. representa el gran total de todas las observaciones y que la media representa el gran promedio de todas las observaciones.

Ejemplo

1.- Un ingeniero est interesado en maximizar la resistencia a la tensin de una nueva fibra sinttica empleada en la manufactura de telas. Se sabe que la resistencia a la tensin es influida por el porcentaje de algodn presente en la fibra. As que decide elaborar fibras con el 15% de algodn, despus con un 20%, luego 25%, 30% y 35% y decide tambin tomar 5 muestras de cada porcentaje, donde cada muestra se obtiene con una corrida experimental. Supngase que se corren las 25 pruebas obtenindose los siguientes resultados:

Tabla 7.- Mostrando las corridas experimentales enumeradas del 1 al 25

% de AlgodnNumero de corrida experimental

1512345

20678910

251112131415

301617181920

352122232425

Tabla 8.- Eligiendo nmeros aleatorios entre 1 a 25 para realizar cada prueba, supngase que se obtienen las siguientes secuencias aleatorias.

SecuenciaCorridas% algodon

1820

21830

31020

42535

51730

6515

71425

8620

91525

102030

11920

12415

131225

14720

15115

162435

172135

181125

19215

201325

212235

221630

232535

241930

25315

Esta secuencia de prueba aleatorizada es necesaria para evitar que los efectos de variables perturbadoras desconocidas, las cuales quizas varien fuera de control durante el experimento, contaminen los resultados.

Para ilustrar esto, suponga que las 25 corridas de prueba tuvieran que realizarse en el orden original no aleatorizado (es decir, primero se prueban los cinco ejemplares con 15% de algodn, despues se prueban los cinco ejemplares con 20% de algodn, etc). Si la maquina empleada para probar la resistencia a la tension presenta un efecto de calentamiento tal que entre mas tiempo este funcionando sean menores las lecturas de la resistencia la tension observada, el efecto del calentamiento contaminara potencialmente los datos de la resistencia a la tension y destruira la validez del experimento

Tabla 9.- Supngase que se corren las 25 pruebas en el orden anterior y que se obtienen los siguientes datos de resistencia a la tensin, para cada nivel de % de algodn.

Observaciones

% de Algodn12345

157715119

201217121818

251418181919

301925221923

35710111511

Se usara el anlisis de varianza para probar Ho: u1=2= 3= 4= 5 contra la hiptesis alternativa Ha: (Ho: u12 3 4 5) o al menos una media de ellas es diferente.

La suma de cuadrados requeridos se calcula como sigue:

Donde: Tratamientos = a Repeticiones = n

1.

2. -FC

3.

4.

Cuadro 5.- Anlisis de varianza de los datos de la resistencia a la tensin

Ejemplo: para el caso de la fibra sinttica, si se quisiera determinar un intervalo para la media del tratamiento de un 20% de algodn, 2 con un nivel de confianza del 95%.

De igual forma se puede tener una estimacin para la diferencia de medias de dos tratamientos: i-j

2.- Se coleccionaron las concentraciones atmosfricas de SO2 (en ppm) provenientes de 5 muestreadores localizados a diferentes distancias (aleatoriamente asignadas), de una fuente industrial emisora. Los datos que se dan en la tabla de abajo son de 4 observaciones por muestreador. Tabla 10.- Mostrando los datos de concentraciones de SO2 (ppm) observacionesMuestreadores

12345

I500550648720890

II510540630700900

III490500620710920

IV530520600736880

Probar la hiptesis nula de que las poblaciones de SO2 son iguales, es decir, Ho: 1 = 2 = 3 = 4 = 5. La suma de cuadrados requeridos se calcula como sigue:

Donde: Tratamientos = a Repeticiones = n

5.

6. -FC

7.

8.

Distribucin Completamente al Azar con Diferente Nmero de Repeticiones por TratamientoDonde : Tratamientos = a Repeticiones = n

1.- Se examina el contenido de azufre en 5 yacimientos de carbn. Se toman 10 muestras aleatorias de cada uno de los yacimientos y se analizan, obteniendo los siguientes datos del porcentaje de azufre de los yacimientos. Sin embargo en alguno de ellos se carece de informacin.

MuestrasYacimientos

12345

11.511.691.561.300.73

21.920.641.220.750.80

31.080.901.321.260.90

42.041.411.390.691.24

52.141.011.330.620.82

61.760.841.540.900.72

71.171.281.041.200.57

81.592.250.321.18

91.490.54

101.30

a- Plantear la hiptesisb- Realice el anlisis de varianza para verificar si hay diferencia del contenido de azufre en los yacimientos de carbn.c- De acuerdo a los resultados que conclusiones deduce de este experimento?

2.- En una empresa de montaje trabajan 135 operarios que realizan un determinado trabajo (T). Ladireccin de la empresa est interesada en conocer si influye el factoroperarioen la variable tiempo derealizacin del trabajo T. Para ello se eligen cinco operarios al azar y se les controla el tiempo enminutos que tardan en realizar el trabajo T en diez ocasiones. Sin embargo en algunos de ellos no se tiene informacin.

Los resultados del experimento son los de la tabla adjunta.

Oper.1.Oper.2.Oper.3.Oper. 4.Oper.5.

7275786965

7570796560

7177846163

6973727568

6779837070

7177776864

7576806762

73748364

697169

6585

a- Plantear la hiptesisb- Realice el anlisis de varianza para verificar si hay diferencia en el factor operarios.c- De acuerdo a los resultados que conclusiones deduce de este experimento?

9.

10.

11.

12.

EL MODELO DE EFECTOS ALEATORIOSEn algunas ocasiones los niveles de los tratamientos son demasiados y se tienen que elegir solo algunos de ellos, cuando esta seleccin es aleatoria, los resultados pueden aplicarse a todos los posibles niveles.Como son demasiados los niveles involucrados, no es prctico hacer el anlisis de variancia para probar hiptesis sobre los valores de cada nivel. En ese sentido, el planteamiento de las hiptesis se hace con la idea de que si un tratamiento es indiferente o no sirve, no desva los valores observados de su media poblacional, ni produce variacin, por lo que basta con probar su varianza. Es obvio que dicho tratamiento debe seleccionarse aleatoriamente.Para probar si los tratamientos producen o no variacin, las hiptesis se plantean:Ho: t2 = 0 Ha: t2>0De esta manera, si los tratamientos efectivamente no influyen, no producirn varianza, por lo que es de esperarse que una Ho: t2 = 0 sea aceptada. Si Ho se rechaza es que si hay variacin y los tratamientos si influyen en los valores observados, aunque de momento no sea posible determinarlos.

El anlisis de varianza es igual al anlisis de varianza para el modelo de efectos fijos.Fuentes de variacinG.L.S.C.CM = 2FcF

Tratamientoa 1

Errora(n-1)

Totalan 1

Y los estimadores de la variancia del error y de la variancia de los tratamientos son:2= CME

ESTIMACIN DE PARMETROS

En el anlisis de varianza se tienen dos fuentes de variabilidad: la variacin proveniente del error aleatorio que se genera dentro de cada tratamiento, representada por y la variacin proveniente por el efecto de los tratamientos, representada por . En los modelos de efectos aleatorios es frecuente la necesidad de tener estimaciones de estos valores considerados como fuentes de variabilidad.

Es posible construir intervalos de confianza para estos valores de la siguiente manera: Para la varianza del error ( ) con 1- de confiabilidad, el intervalo queda:

Para la varianza de los tratamientos ( ) no es posible construir un intervalo de confianza pero se puede tener para que representa la proporcin de la variabilidad debida a la varianza de los tratamientos, es decir, debida a la diferencia entre los tratamientos.

El intervalo para para una confiabilidad 1- queda:

Ejemplos1.- Un ingeniero de procesos de una industria textil, piensa que la resistencia de las telas, aparte de la variacin usual se ven afectadas por el telar que las produce. Como se desea que esto no ocurra, decide tomar cuatro muestras de cada telar en forma aleatoria, obtenindose los siguientes datos del experimento.

Tela1234xi.

198979996390

291909392366

396959795383

495969998388

X..=1527

13. =145,733.06

14. = 145,845 145,733.06 = 111.93

15.

= 145,822.25 145,733.06 = 89.19

16.

= 111.93 89.19 = 22.74

FVGLSCCMFcF 0.050.01

Trats389.1929.7315.733.495.95

Error1222.741.89

Total15111.93

Las Hiptesis a Probar sern:

Ho: t = 0Ha: t 0

Intervalo de para la varianza del error ( ) con 1- de confiabilidad.

El intervalo para para una confiabilidad 1- queda:

=

2.- Una fbrica de textiles cuenta con un gran nmero de telares. Se supone que cada uno tiene la misma produccin de tela por minuto. Para investigar esta suposicin, 5 telares son escogidos al azar y se mide la cantidad de tela producida en 5 tiempos diferentes. Se obtienen los siguientes datos.

Produccin de telaresTiempo12345

114.014.114.214.014.1

213.913.813.914.014.0

314.114.214.114.013.9

413.613.814.013.913.7

513.813.613.913.814.0

Tienen los mismos telares el mismo rendimiento?Calcular la variabilidad de los telaresEstime la varianza del error experimental

Determine un intervalo de confianza del 95% para

1.2.3.2.- DISEOS EN BLOQUES AL AZAR.

En este diseo se pretende eliminar el efecto de la variacin predominante.

1.- El material experimental se divide en bloques2.- Los tratamientos se asignan aleatoriamente dentro de cada bloque (suposicin de independencia).3.- El manejo dentro del mismo bloque debe ser el mismo en tiempo y espacio (muestreo, compostaje, alimentacin, aclareo, control de insectos, control de enfermedades, cosecha, ect).4.- Cada bloque deber ser lo ms uniforme posible.5.- Cada tratamiento es asignado una vez a una unidad experimental dentro de cada bloque (pero uno o ms pueden repetirse).6.- El nmero de tratamientos no debe ser excesivo > 157.- Se mantiene el error experimental dentro de cada bloque.8.- Todas las unidades dentro del mismo bloque son comparables.9.- Los bloques deben formarse perpendiculares a los gradientes de variacin.10.- El bloque ayuda a reducir el error experimental proveniente de las variaciones (de tratamientos, de la unidad experimental, peso, altura, edad, diamentro, etc).

La distribucin de los bloques puede ser de acuerdo a la variacin existente, no importando que tan dispersos queden, siempre y cuando tengan el mismo ambiente atmosfrico.

Estratificacin del sitio

MODELO DE RESPUESTA.

Donde:

Xij = Variable de respuesta de la j-esima unidad experimental, con eli-esimo tratamiento.

= media general comun a todas las unidades experimentales antes de aplicar los tratamientos.

ti= Efecto del i-esimo tratamiento

bj= Efecto del j-esimo bloque

Eij= Error en el j-esimo del i-esimo tratamiento

ESTRUCTURA DE CONCENTRACIN DE DATOS

Tratamientos (Niveles)Observaciones(Repeticiones)Total Trat'sPromedio.

IIIIIInXi.

1X11X12X13X1nX1.

2X21X22 XijX23X2nX2.

3X31X32X33X3nX3.

.......

aXa1Xa2Xa3XanXa.

Total bloques (X.j)X.1X.2X.3X.nX..

X..= Xi.+X2.+X3.+..+Xa.

Modelo de anlisis de varianza para una distribucin en bloques al azar

Fuentes de variacinG.L.S.C.CM = 2FcF

Tratamiento(a-1)

Bloque(n-1)

Error(a-1)(n-1)

Total(an-1)

Se prueban dos Hiptesis:

Tratamientos:

Ho: t1= t2=t3......ta

Ha: t1 t2t3......taBloques:

Ho: 1=2=3..nHa: 123..n

Regla de desicin:

Para tratamientos:

Si Fc es F; se rechaza Ho: t1= t2=t3......ta

por lo tanto se acepta Ha: t1 t2t3......ta

Para bloques:

Si Fc es F; se rechaza Ho: 1=2=3..n por lo tanto se acepta Ha: 123..n

CALCULO DE LA SUMA DE CUADRADOS

17.

18.

19.

8.-

20.

21.

ESTIMACIN DE PARMETROS:

El efecto de cada tratamiento se traduce en una desviacin de la media poblacional. Existe un valor i que representa la media para un tratamiento que debe ser el valor de la media poblacional ms la desviacin causada por el tratamiento, esto es: i=+i. Se puede tener una estimacin del valor i por el intervalo siguiente:

O

De igual forma se puede tener una estimacin para la diferencia de medias de dos tratamientos: i-j

o

Donde: = La media de las n observaciones del tratamiento i

= La media de las n observaciones del tratamiento j t/2, gLError = Valor del estadstico t para una significancia /2 y glError

Ejemplo

1.- Un ingeniero industrial realiza un experimento para estudiar el tiempo que tarda el ojo en enfocar. Est interesado en la relacin que existe entre la distancia del objeto al ojo y el tiempo que el ojo tarda en enfocar. Cuatro diferentes distancias resultan de inters. Hay 5 sujetos disponibles para el experimento. Los datos se muestran a continuacin.

SujetoDistancia (pies)12345

4108646

676616

853325

1064423

Bloques (X.j)282119920

Regla de decisin:

Para tratamientos:

Si Fc es F; se rechaza Ho: t1= t2=t3......ta

por lo tanto se acepta Ha: t1 t2t3......ta

Como Fc es > que Ft en los dos niveles hay alta diferencia significativa entre los tratamientos, por lo tanto no ce acepta a Ho y no se rechaza a Ha de que los tratamientos son diferentes entre s o al menos uno de ellos.

Para bloques:

Si Fc es F; se rechaza Ho: 1=2=3..n por lo tanto se acepta Ha: 123..n

Intervalo de confianza para la media del mtodo 3.

De igual forma se puede tener una estimacin para la diferencia de medias de dos tratamientos: i-j

2.- Se desea estudiar el efecto de la Fluorita en la reduccin del costo energtico en la fabricacin de cemento. Se emplean 6 mezclas distintas de materias primas.MezclasFluorita

0%1%2%3%4%

I15.0211.869.9412.4513.23

II8.4210.158.546.988.93

III18.3116.8415.8614.6415.96

IV10.4910.528.0410.5010.34

V9.789.596.968.159.24

VI9.288.847.046.669.46

DATOS FALTANTES EN BLOQUES AL AZAR

Cuando por alguna razn ajena al experimento una observacin se pierde se presenta el problema de no poder realizar el anlisis correspondiente. La solucin al problema anterior se logra por medio de los pasos siguientes.

a) Estimacin del dato faltanteb) Bloques incompletos

ESTIMACION DE UN DATO FALTANTE:

Repeticiones I

II .........m ............nTotal Xi.

T1X11X12...X1m....X1nX1.

T2..X21..X22.....X2m....X2n..X2...

Ts.Xs1.Xs2....X1...Xsn.X's.+X1.

TaXa1Xa2...Xam...XanXa.

Total X.jX.1X.2...X'm.+X1X.nX"..

X"..

X..= X+X1

Donde: n= repeticiones a= tratamientos X's. = Suma total de los tratamientos. X'm. = Suma total del bloque. X".. = Suma total de los tratamientos.

Una vez que se tiene la estimacin del dato faltante, su valor se incluye en la celda correspondiente del cuadro de concentracin de datos y se procede a calcular la suma de cuadrados de las fuentes de variacin correspondientes al diseo de bloques al azar. El anlisis de varianza deber mostrar una disminucin de 1 gL. en el error y en el total 2 gL.

Cuadro de ANAVA

F.V.G.L.S.C.C.M.FcF

Trat'sa-1

Bloquesn-1

Error(a-1)(n_1)-1

Total(an-1)-1

El ANAVA anterior nos da una prueba aproximada de la hiptesis Ho: t1=t2=.......ta. Si en la prueba aproximada de Ho: t1=t2=t3=...=ta, se obtiene significancia, deber hacerse la prueba exacta para dicha hiptesis. La razn para realizar la prueba es la posibilidad de que la diferencia significativa detectada se deba al incremento que sufre la suma de cuadrados de los tratamientos por el clculo del dato perdido.

PROCEDIMIENTO PARA REALIZAR LA PRUEBA EXACTA.

1.- Obtener la sctrat's corregida (Sctratc)

a) Donde:

Esta cantidad hay que restarla a la suma de cuadrados de tratas.

b)

c)

ESTIMACION DE DOS DATOS FALTANTES:

A) LOS DATOS FALTANTES PERTENECEN AL MISMO TRATAMIENTOI

II .........m ............nTotal Xi.

T1X11X12..X1m..X1nX1.

T2..X21..X22....X2m....X2n..X2...

Ts..Xs1..X1...X2....Xsn..X's.+X1+X2..

TaXa1Xa2..Xam..XanXa.

Total X.jX.1Xm.+X1X'w.+X2X.nX"..

X..=X"..+X1+X2

LOS DATOS FALTANTES PERTENECEN AL MISMO BLOQUE

Repeticiones lI

II .........m ............nTota Xi.

T1X11X12...X1m....X1nX1.

t2..X21..X22.....X2m......X2n..X2...

Ts..XS1..XS2...X1.XSn..X's.+X1..

tq..Xq1..Xq2.....X2...Xqn..X'q.+X2..

TaXa1Xa2...Xam...XanXa.

Total X.jX.1X.2...Xm.+X1+X2X.nX"..

X..=X"..+X1+X2

LOS DATOS FALTANTES PERTENECEN A DIFERENTES TRATAMIENTOS Y DIFERENTES BLOQUES Repeticiones III .....m......w......n Total Xi.

t1X11X12....X1m....X1w...X1nX1.

t2..X21..X22.....X2m.....X2w.....X2n..X2.

ts..Xs1..Xs2.....X1...Xsw..Xsn..X's.+X1=T1+X1

tq..Xq1..Xq2...Xqm..X2...Xqn..X'q.+X2=T2+X2

TaXa1Xa2XamXawXanXa.

Total X.jX.1X.2X'm.+X1=R1+X1X'w.+X2= R2+X2X.nX"..

X..=X"..+X1+X2

Prueba Exacta Cuando son Dos los Datos Faltantes

Una vez que se tienen las estimaciones de los datos faltantes, sus valores se incluyen en las celdas correspondientes del cuadro de concentracin de datos y se procede a calcular la suma de cuadrados de las fuentes de variacin correspondientes al diseo de bloques al azar. El anlisis de varianza deber mostrar una disminucin de 2 gL. en el error y en el total 3 gL.

Cuadro de ANAVA

F.V.G.L.S.C.C.M.FcF

Trat'sa-1

Bloquesn-1

Error(a-1)(n_1)-2

Total(an-1)-2

El ANAVA anterior nos da una prueba aproximada de la hiptesis Ha: t1=t2=.......ta. Si en esta prueba se detecta significancia para los tratamientos deberemos hacer una correccin para abatir el efecto del incremento en la ScTrat's debido a los valores estimados de los datos faltantes.

PROCEDIMIENTO

1) Sin considerar las estimaciones de los datos faltantes, realizar un anlisis de varianza para un diseo completamente al azar con diferente nmero de repeticiones por tratamiento. En este diseo considrese a los bloques como los tratamientos y a los tratamientos como repeticiones.

2) La suma de cuadrados de los tratamientos corregida (ScTrat'sc) es la diferencia de la suma de cuadrados del error del diseo completamente al azar del procedimiento 1, menos la suma de cuadrados del error del diseo bloques al azar (obtenido en el ANAVA) de la prueba aproximada) identificados como SCEBA, es decir.

SCTC= SCECA-SCEBA

CMTC=SCTC / t-1

3) La prueba exacta de la hiptesis Ho: t1=t2=.....=ta, se obtiene con el CMTc y el CMEBA (CME obtenido en el ANAVA de la prueba aproximada).

Nota 1. Cuando faltan dos datos, un procedimiento frecuentemente usado es: Para uno de los datos faltantes se le asigna la media de todas las observaciones (na-2 datos disponibles en todo el experimento). De esta forma tendremos el caso de un solo dato faltante y usarse la ecuacin para este caso. A continuacin se estima el dato al cual se le asign la media. Se vuelve a estimar la primera observacin y as sucesivamente hasta que se estabilicen las estimaciones, es decir, hasta que los cambios en los valores de las estimaciones no sean grandes.

Nota 2. Si falta un bloque o un tratamiento completo, el anlisis de los resultados puede realizarse de la manera usual, si se tienen todava dos o ms tratamientos o bloques completos.

Nota 3.- Cuando son tres los datos faltantes, a uno puede asignarsele la media de los an-3 datos disponibles y usar para estimar los restantes dos, las ecuaciones para los dos datos faltantes.

Estimacin de un dato faltante

1.- Tres diferentes soluciones para lavar estn siendo comparadas con objeto de estudiar su efectividad en el retraso del crecimiento de bacterias en envases de leche de 5 galones. El anlisis se realiza en un laboratorio y slo pueden efectuarse 3 pruebas en un mismo da. Como los das son una fuente de variabilidad potencial, el experimentador decide usar un diseo aleatorizado en bloques. Las observaciones se recopilaron durante 4 das y los datos son los siguientes.

Dias

Solucin1234

113221839

216X1744

354122

2- El tiempo de respuesta en milisegundos, fue determinado para tres tipos de circuito de un mecanismo de interrupcin automtica de vlvulas. Los resultados fueron:

Tipo de tiempos de respuesta en milesegundos

Circuito

191210X15

22021231730

3658167

-Realice el anlisis de varianza para verificar si hay diferencia en los tiempos de respuesta de cada mecanismo

Estimacin de Datos Faltantes.

1.- Los datos siguientes se refieren a un experimento conducido bajo un diseo bloques al azar en el cual se han perdido dos datos en diferente tratamiento y diferente bloque.

Bloques TratamientosSuma de Bloques X.j

123456

I162216X118880+X1= R1+X1

II282717202323138

III162516161916108

IV28X219182425114+X2=R2+X2

Suma de TratsXi.8874+X2= T2+X26854+X1=T4+X18472440

= (6-1)(4-1) =15

= [(6)(54) + 4(80)] 440 = 204

= [(6)(74) + 4(114) ] 440 = 460

Una vez calculados los datos faltantes realizar el anlisis de varianza y si hay diferencia significativa, obliga a realizar la prueba exacta de la hiptesis nula para dos datos faltantes.

1.2.3.3- DISEO EN CUADRADO LATINO

Contenido

1.- Caractersticas y supuestos bsicos del Diseo en Cuadro Latino.2.- Modelo Lineal.3.- Asignacin aleatoria de los tratamientos: aleatorizacin de hileras y columnas4.- Cuadro de concentracin de datos5.- Hiptesis a probar.6.- Modelo del Anlisis de Varianza.7.- Interpretacin del Anlisis de Varianza: Diferentes ejemplos numricos.8.- Intervalo de Confianza Para una Media de Tratamientos

Se aplica donde se sospecha que la variabilidad afecta en dos sentidos y es tal su magnitud que modifican la respuesta de los tratamientos.Bloquea la variabilidad en cada sentido.Se aleatorizan los tratamientos en cada sentido de la variabilidad dando lugar a hileras y columnas.Cada tratamiento se asigna una vez en cada hilera y columna.Se requieren tantas repeticiones como tratamientos se evalan, los ms comunes son de 5 a 8.Hileras y columnas son grupos de unidades homogneas para una u otra variable.El error experimental por unidad tiende a ser directo al tamao del cuadro.Se aplica tanto en la industria como en la agricultura.La varianza del error experimental en el cuadrado latino se espera que sea menor en relacin con los anteriores diseos.

DISTRIBUCIN DE LOS TRATAMIENTOS:

aleatorizacin de tratamientos en cuadrado latino

Se selecciona un plan de distribucin de tratamientos de acuerdo al nmero de tratamientos, mismos que no deben repetirse en cada hilera y columna.

1 ABCDEABCDEFABCDEFGABCDEFGH

2 EABCDFABCDEGABCDEFHABCDEFG

3 DEABCEFABCDFGABCDEGHABCDEF

4 CDEABDEFABCEFGABCDFGHABCDE

5 BCDEACDEFABDEFGABCEFGHABCD

6BCDEFACDEFGABDEFGHABC

7 BCDEFGACDEFGHAB

8BCDEFGHA

N=5n=6n=7n=8

Los anteriores planes de distribucin se obtuvieron al ubicar las letras de la primera hilera en orden alfabtico e iniciar la siguiente con la ltima letra de la hilera anterior para continuar con el orden alfabtico de las letras que participan, as sucesivamente hasta la ltima hilera. Sin embargo los planes muestran una direccin diagonal de los tratamientos lo que es indeseable pues existe la posibilidad de que no se logre el efecto de hileras y columnas, lo que obliga a aleatorizar hileras y columnas.

ALEATORIZACIN DE COLUMNAS

1 BACEDCBADFEDBGACEFFGABECHD

2 AEBDCBAFCEDCAFGBDEEFHADBGC

3 EDACBAFEBDCBGEFACDDEGHCAFB

4 DCEBAFEDACBAFDEGBCCDFGBHEA

5 CBDAEEDCFBAGECDFABBCEFAGDH

6DCBEAFFDBCEGAHACDGEBF

7ECABDFGHACDGEBF

8GHBCFDAE

ALEATORIZACIN DE HILERAS

3 EDACB4 FEDACB2 CAFGBDE6 ABDEHFCG

2 AEBDC1 CBADFE1DBGACEF1 FGABECHD

5 CBDAE2 BAFCED3 BGEFACD3 DEGHCAFB

1 BACED6 DCBEAF4 AFDEGBC5 BCEFAGDH

4 DCEBA5 EDCFBA6 FDBCEGA2 EFHADBGC

3 AFEDBC5 GECDFAB7 HACDGEBF

7 ECABDFG8 GHBCFDAE

4 CDFABHEA

Modelo de respuesta:

Donde:

Xij(k) = variable de respuesta para el tratamiento k que se encuentra en la hilera i y columna j.

Hi = efecto de la hilera iCj = efecto de la columna jTk = efecto del tratamiento k = efecto general o contribucin comn a todas las unidades experimentales.

= error experimental, variacin debido al azar o variacin de muestreo con distribucin NI (0, 2)

Cuadro de Concentracin de Datos

Suma total Xhi..

1AEBCD

2BDAEC

3DAC XiltkBE

4CBEDA

5ECDAB

Suma total X.cj.

X..

Suma total X..tkA=B=C=D=E=

Modelo de anlisis de varianza para una distribucin en Cuadrado Latino

Fuentes de VariacinG.L.S.C.C.m.Fc

Hilerasa-1

Columnasn-1

Tratamienton-1

Error(n-1)(n-2)

Totala2-1

Las hiptesis que se prueban en el anlisis de varianza son:

Para hileras:

Para columnas:

Para tratamientos:

Regla de desicin:

Para tratamientos:

Si Fc es F; se rechaza Ho: t1= t2=t3......ta

por lo tanto se acepta Ha: t1 t2t3......ta

Para hileras:

Si Fc es F; se rechaza Ho: h1=h2=h3..hn por lo tanto se acepta Ha: h1h2h3..hn

Para columnas:

Si Fc es F; se rechaza Ho: c1=c2=c3..cn por lo tanto se acepta Ha: c1c2c3..cn

Suma de Cuadrados:

1.-

2.-

3.-

4.-

5.-

6.-

ESTIMACIN DE PARMETROS:

El efecto de cada tratamiento se traduce en una desviacin de la media poblacional. Existe un valor i que representa la media para un tratamiento que debe ser el valor de la media poblacional ms la desviacin causada por el tratamiento, esto es: i=+i. Se puede tener una estimacin del valor i por el intervalo siguiente:

O

De igual forma se puede tener una estimacin para la diferencia de medias de dos tratamientos: i-j

o

Ejemplo

1.- Suponga que un experimentador est investigando el efecto de 5 tipos de formulaciones de combustible (usado en la operacin de una caldera), para observar el efecto en la tasa de combustin. Cada formula de combustible se tom de un lote que solo da para 5 pruebas. Adems de esto, las formulas son preparadas por 5 operadores diferentes. De esta manera, se puede observar dos factores de ruido o variabilidad que son identificables por el experimentador y que se pueden bloquear: los lotes de material y los operadores. La siguiente tabla ilustra lo anteriormente descrito:

Lotes de materia primaOperadoresTotal

12345

Lote1A=24B=20C=19D=24E=24

Lote2B=17C=24D=30E=27A=36

Lote3C=18D=38E=26A=27B=21

Lote4D=26E=31A=26B=23C=22

Lote5E=22A=30B=20C=29D=31

Total

Tratamientos= formulaciones de combustibleA= A1+A2+A3+A4+A5= 24+30+26+27+36= 143B= B1+B2+B3+B4+B5= 17+20+20+23+21= 101C= C1+C2+C3+C4+C5= 18+24+19+29+22= 112D= D1+D2+D3+D4+D5= 26+38+30+24+31= 149E= E1+E2+E3+E4+E5= 22+31+26+27+24= 130Total Media

A=243026273614328.6

B=172020232110120.2

C=182419292211222.4

D=263830243114929.8

E=223126272413026.0

Cuadro de anlisis de varianzaFuentes de VariacinG.L.S.C.C.m.FcFt

0.050.01

Tratamiento433082.57.73443.265.41

Hileras468171.59383.265.41

Columnas4150373.51563.265.41

Error1212810.666

Total24676

Cv= 12.85%Regla de desicin:

Para tratamientos:

Si Fc es F; se rechaza Ho: t1= t2=t3......ta

por lo tanto se acepta Ha: t1 t2t3......ta

Como Fc es > que Ft en los dos niveles hay alta diferencia significativa entre los tratamientos, por lo tanto no ce acepta a Ho y no se rechaza a Ha de que los tratamientos son diferentes entre s o al menos uno de ellos.

Para hileras:

Si Fc es F; se rechaza Ho: h1=h2=h3..hn por lo tanto se acepta Ha: h1h2h3..hn

Como Fc es < que la Ft no hay diferencia significativa entre las Hileras por lo tanto no rechaza Ho y no se acepta a Ha.

Para columnas:

Si Fc es F; se rechaza Ho: c1=c2=c3..cn; por lo tanto se acepta Ha: c1c2c3..cn

Como Fc es > que la Ft al 0.01 y menor al 0.05 solamente hay diferencia significativa entre las columnas; por lo tanto se rechaza Ho y se acepta a Ha de que las columnas sean diferentes entre s o al menos una de ellas.

Como Fc es < que la Ft no hay diferencia significativa entre las columnas por lo tanto no rechaza Ho y no se acepta a Ha.

Calcular el intervalo de Confianza al 95% para la media de tratamiento 2:

2.- Un ingeniero industrial est investigando el efecto que tienen cuatro mtodos de ensamble sobre el tiempo de ensamble de un componente para televisores a color. Se seleccionan 4 operadores para realizar este estudio. Por otra parte, el ingeniero sabe que cada mtodo de ensamble fatiga, por lo que el tiempo que se tarda en el ltimo ensamble puede ser mayor que en el primero, independientemente del mtodo. En otras palabras se produce un patrn en el tiempo de ensamble. Para controlar esta posible fuente de variabilidad, el ingeniero decide utilizar un diseo en cuadrado latino. Los datos se muestran a continuacin.

Orden de montaje1234

1C 10D 14A 7B 8

2B 7C 18D 11A 8

3A 5 B 10C 11D 9

4D 10A 10B 12C 14

DATOS FALTANTES EN DISEO CUADRADO LATINO

UN DATO FALTANTE

Suponiendo que falta la observacin de la hilera w, columna m y que el tratamiento correspondiente a dicha celda es s.

COLUMNASHILERASIII......m...... n

IH1

IIH2

....

WX tsHw+X

....

NHn

C1C2....Cm+X......CnX...+X

Donde:

a= Tratamientosts= Suma total del tratamiento donde se encuentra la parcela perdida.Hw= Suma total de la hilera donde se encuentra el dato perdidoCm= Suma total de la columna donde se encuentra el dato perdidoX= Suma total de las observaciones con el dato perdido

Si se detecta diferencia significativa para tratamientos es necesario realizar la prueba exacta o insesgada que consiste en corregir la suma de cuadrados de tratamientos.

DOS DATOS FALTANTES

LOS DATOS FALTANTES PERTENECEN AL MISMO TRATAMIENTO

COLUMNASHILERASIII.....M.....Z....n

IH1

IIH2

....

WX1H+X1=Hw

....

QX2H+X2=Hq

....

NHn

C1C2.....C1+X1= Cm......C2+X2=Cz.....CnX...+X1+X2= X..

Donde:

H1 : Suma de las n-1 observaciones presentes en la hilera donde se ubica X1H2 : Suma de las n-1 observaciones presentes en la hilera donde se ubica X2C1 : Suma de las n-1 observaciones presentes en la columna donde se ubica X1C2 : Suma de las n-1 observaciones presentes en la columna donde se ubica X2X... : Suma de las a2-2 observaciones presentes en todo el experimentoT12 : Suma de las a-2 observaciones presentes que se tienen para el tratamiento

LOS DATOS FALTANTES PERTENECEN A LA MISMA HILERA

HILERASIII.....m.....Z....N

IH1

IIH2

....

WX1 tsX2 taHw=H12+X1+X2

....

q

....

nHn

C1C2.....Cm+X1= C1.....Cz+X2=C2.....CnX...+X1+X2=X..

Donde:

T1 : Total o suma de a-1 datos para el tratamiento al que pertenece X1T2 : Total o suma de a-1 datos para el tratamiento al que pertenece X2

LOS DATOS FALTANTES CORRESPONDEN A LA MISMA COLUMNA

HILERASIII.....m.....n

IH1

IIH2

....

WX1Hw=H1+X1

....

QX2Hq=H2+X2

....

NHn

C1C2.....Cm+X1+X2= C12+X1+X2.....CnX...+X1+X2= X..

LOS DATOS FALTANTES PERTENECEN A COLUMNA, HILERA Y TRATAMIENTO DIFERENTE

HILERASIII.....m.....Z....n

IH1

IIH2

....

WX1 tsHw=H+X1

....

QX2 taHq=H2+X2

....

NHn

C1C2.....C1+X1=CmC2+X2=CzX...+X1+X2=X..

Una vez que se tienen las estimaciones de los datos faltantes, stos se incluyen en el cuadro de concentracin de datos y se procede al clculo de la suma de cuadrados en el ANAVA deber disminuirse 2 glE y 2 gl al total.

ESTIMACION DE UN DATO PERDIDO:

1.- En un experimento para observar el efecto de 5 niveles de vitaminas en el crecimiento de cerdos se tenan 5 camadas de 5 cerdos cada una bajo 5 sistemas de crianza. La variable a medir es el incremento en peso en el primer mes despus de la aplicacin de la vitamina. Los resultados fueron los siguientes.

A 30B 28C 15D 14E 30

B 29 A 31D 16E 31C 16

C 17D 15EX B 30A 32

D 13E 31A 32C 19B 29

E 33C 16B 31A 33D 14

COLUMNASHILERASIII......m...... n

IH1

IIH2

....

WX tsHw+X

....

NHn

C1C2....Cm+X......CnX...+X=X..

COLUMNASSUMA H

A 30B 28C 15D 14E 30 117

B 29 A 31D 16E 31C 16 123

C 17D 15EX =32.92B 30A 3294+X=126.92

D 13E 31A 32C 19B 29 124

E 33C 16B 31 A 33D 14 127

12212194+X127121 585+XX..=617.92

SUMA C126.92

E1= 30 + E2=31 + E4=31 + E5= 33 = ts= 125

ts = 125Hw=94Cm=94X..=585a = 5

7.- = = 32.9I6

1.- =

2.-

3.-

=15286.337-15273.005= 13.332

4.- = 15280.7372-15273.005= 7.7323

5.-

=16716.9453-15273.005 = 1443.9403

6.-

=1475.7214 (13.332+7.7323+ 1443.9403) = 10.72

FVGLSCCMFcF

TratsHilerasColumnasErrorTotala-1 = 4 -1 = 3n-1 = 4 -1 = 3n-1 = 4 -1 = 3(n-1)(n-2)-1(3)(2)=61=5(a2-1)-1=15-1=141443.940313.3327.732210.721475.72481.31344.4442.57742.144224.491.721.20

Prueba exacta para corregir la SCt

2.- Se realiza un estudio para comparar los ndices de monxido de carbono en 5 puntos estratgicos de una ciudad.( N-norte, S-sur, E-este, O-oeste, C-centro). Los conjuntos de bloques involucrados son determinados das de la semana y distintos horarios del da. El cuadrado obtenido y los datos (ppm) registrados se presenta a continuacin. Realizar la comparacin.

Lunes MircolesViernesSbadoDomingo

08:00N (124)S (124)C (124)O (122)E (124)

11:00E (112)C (100)N (X)S (131)O (114)

14:00S (123)N (133)O (112)E (121)C (133)

17:00O (118)E (112)S (133)C (124)N (134)

20:00C (102)O (122)E (118)N (131)S (133)

42