Upload
william-leon
View
438
Download
1
Embed Size (px)
Citation preview
ANALISIS DE LAS
VARIANZAS
William Jaime
León Velásquez
UNIVERSIDAD NACIONAL MAYOR DE
SAN MARCOS
ESTADISTICA
INDUSTRIAL
FACULTAD DE INGENIERIA INDUSTRIAL
SESION 04
NOTA:
Para
cambiar la
imagen de
esta
dispositiva
,
seleccione
la imagen
y
elimínela.
A
continuaci
ón haga
clic en el
icono
Imágenes
en el
marcador
de
posición e
inserte su
imagen.
Prueba de medias de mas de dos muestras a través de la comparación de dos varianzas poblacionales Otro uso de la distribución F es el análisis de la técnica de la varianza (ANOVA), en la cual se comparan tres o más medias poblacionales para determinar si pueden ser iguales.
Ing. William león Velásquez 4
Suposiciones en el análisis de la varianza (ANOVA)
5
•Para emplear ANOVA se supone lo siguiente:
• Las poblaciones siguen la distribución
normal.
• Las poblaciones tienen desviaciones
estándar iguales (σ).
• Las poblaciones son independientes.
Ing. William león Velásquez
El análisis de la varianza (ANOVA)
6
ANOVA se desarrolló para aplicaciones en agricultura, y aún se emplean muchos de los términos relacionados con ese contexto. En particular, con el término tratamiento se identifican las poblaciones diferentes que se examinan.
• ANOVA permite comparar las medias de tratamiento de forma simultánea y evitar la acumulación del error tipo I.
Ing. William león Velásquez
Se utiliza para determina si una población tiene mas variación que otra, o si es deseable
validar un supuesto respecto a una prueba estadística
Procedimiento:
Primero se establece la hipótesis nula.
Esta hipótesis es que la varianza de una
población normal, σ21 , es igual a la
varianza de otra población σ22 también
normal, …… es igual a la varianza de otra población σ2
i también normal .
Procedimiento
Ing. William león Velásquez 7
La hipótesis alternativa podría ser que las varianzas difieren.
La hipótesis nula y la hipótesis alternativa
son:
Procedimiento
Ing. William león Velásquez 8
iH 2......2212:0
iH 2......2212:1
Procedimiento
•El Valor Estadístico de Prueba para la Comparación de dos Varianzas estará dada por la siguiente relación:
Ing. William león Velásquez 9
mnE
mT
S
SF
2
1
2
EJEMPLO DIDACTICO
10
El gerente de un centro financiero, desea comparar la productividad, medida por el número de clientes atendidos entre tres empleados. Selecciona cuatro días en forma aleatoria y registra el número de clientes atendidos por cada empleado. Los resultados son
Ejemplo:
Ing. William león Velásquez
Walter Willy Kike
11
¿Hay alguna diferencia en el número de clientes atendidos?
En la siguiente gráfica se ilustrará cómo pueden aparecer las poblaciones si hubiera una diferencia en las medias del tratamiento.
Ing. William león Velásquez
EJEMPLO DIDACTICO
12
Observe que las poblaciones en la gráfica de la izquierda siguen la distribución normal y la variación en cada población es la misma. Sin embargo, las medias no son iguales.
Suponer que las poblaciones son iguales es decir que no hay diferencia en las medias (tratamiento). Estos se muestra en la gráfica de la derecha. Observe que las poblaciones siguen la distribución normal y la variación en cada población es la misma.
Ing. William león Velásquez
Kike
Kike
Walter
Walter
Willy
Willy
Servicio al cliente
Servicio al cliente
EJEMPLO DIDACTICO
La prueba ANOVA
13
•Si desea determinar si varias medias muestrales provienen de una sola población o de poblaciones con medias diferentes. Lo que se hace en realidad, es que estas medias muestrales se comparan mediante sus varianzas.
•Una de las suposiciones para aplicar la prueba ANOVA fue que la desviación estándar de las diversas poblaciones normales tenían que ser las mismas. Se aprovecha este requisito en la prueba ANOVA.
Ing. William león Velásquez
La prueba ANOVA
14
•La estrategia es estimar la varianza de la población de dos formas y después determinar la razón de dichos estimados.
•Si esta razón es aproximadamente 1, entonces por lógica los dos estimados son iguales, y se concluye que las medias poblaciones son iguales.
La distribución F sirve como un árbitro al indicar en que instancia la razón de las varianzas muestrales es mucho mayor que 1 para haber ocurrido por casualidad.
Ing. William león Velásquez
La prueba ANOVA
Ing. William león Velásquez 15
VARIACIÓN TOTAL (SS) Suma de las diferencias elevadas al cuadrado entre cada observación y la media global
Se definirá algunos conceptos que nos ayudaran en problemas posteriores, a través del ejemplo planteado
Ing. William león Velásquez 16
58GX
La variación total del ejemplo:
• Se calcula la media global de las 12 observaciones:
• (55+54+59+56+66+76+67+71+47+51+46+48)/12 = 58
EJEMPLO DIDACTICO
•Después, para cada una de las 12 observaciones se encuentra la diferencia entre el valor particular y la media global. Cada una de estas diferencias se eleva al cuadrado y estos cuadrados se suman, este resultado es la variación total,
SS= 1082.
(55-58)2+(54-58)2+(59-58)2+(56-58)2+
(66-58)2+(76-58)2+(67-58)2+(71-58)2+
(47-58)2+(51-58)2+(46-58)2+(48-58)2=
Ing. William león Velásquez 17
EJEMPLO DIDACTICO
•Luego se divide esta variación total en dos componentes: la que se debe a los tratamientos y la que es aleatoria.
Para encontrar estas dos componentes, se determina la media de cada tratamiento.
La primera fuente de variación se debe a los tratamientos.
SS = SST + SSE
Ing. William león Velásquez 18
SS: Suma de cuadrados SST: Suma de cuadrados de los tratamientos SSE: Suma de cuadrados del error
EJEMPLO DIDACTICO
La prueba ANOVA
19
VARIACIÓN DE TRATAMIENTO (SST) Suma de las diferencias elevadas al cuadrado entre la media de cada tratamiento y la media global
Ing. William león Velásquez
20
•En el ejemplo, la variación debida a los tratamientos es la
suma de las diferencias al cuadrado entre la media de cada
empleado y la media global.
•Para calcularlo, primero se encuentra la media de cada uno
de los tres tratamientos.
Ing. William león Velásquez
La media de Walter es 56, determinada por
(55 + 54 + 59 + 56)/4.
La media de Willy es son 70 determinada por:
(66 + 76 + 67 + 71)/4.
La media de Kike es 48 determinada por:
(47 + 51 + 46 + 48)/4.
EJEMPLO DIDACTICO
21
La suma de los cuadrados debida a los tratamientos es:
(56 – 58)2 +(56 – 58)2 + … + (48 – 58)2 =
4(56 – 58)2 + 4(70 – 58)2 + 4(48 – 58)2 = 992
Si existe una variación considerable entre las medias de los tratamientos, es lógico que este término sea grande.
El valor más bajo posible es cero. Esto ocurrirá cuando todas las medias de los tratamientos sean iguales.
SST = 992
Ing. William león Velásquez
EJEMPLO DIDACTICO
La prueba ANOVA
•La otra fuente de variación se le conoce como componente
aleatoria o componente de error.
VARIACIÓN ALEATORIA (SSE) Suma de las diferencias elevadas al cuadrado entre cada observación y su media de tratamiento.
Ing. William león Velásquez 22
• En el ejemplo, este término es la suma de las diferencias al
cuadrado entre cada valor y la media para ese empleado
en particular.
SSE=(55 – 56)2 +(54 – 56)2 + … + (46 – 48)2+(48 – 48)2 = 90
La variación de error es de 90.
SSE = 90
Walter es 56 Willy es 70 Kike es 48
Ing. William león Velásquez 23
EJEMPLO DIDACTICO
•En resumen:
La suma de la diferencia entre el valor particular y la media global elevado al cuadrado es la variación total, y es igual 1082.
La suma de los cuadrados debida a los
tratamientos es 992
La variación de error es de 90.
Por lo tanto:
SS = SST + SSE
1082 = 992 + 90 Ing. William león Velásquez 24
EJEMPLO DIDACTICO
La prueba ANOVA
El estadístico de prueba, que es la razón de los dos estimados de la varianza poblacional, se determina a partir de la siguiente ecuación:
Ing. William león Velásquez 25
La prueba ANOVA
Ing. William león Velásquez 26
Diferencias dentro de cada grupos
Diferencia entre grupos
mnE
mT
S
SF
2
1
2
El primer estimado de la varianza poblacional entre los tratamientos, es decir, de la diferencia entre las medias. Éste es 992/2.
¿Por qué se divide entre 2?
Recuerde que para encontrar una varianza muestral , se divide entre el número de observaciones menos uno (n-1).
En este caso hay 3 tratamientos por lo que se divide entre 2.
El primer estimado poblacional es 992/2.
Ing. William león Velásquez 27
Entre grupos
EJEMPLO DIDACTICO
El estimado de la varianza dentro de los tratamientos es la variación aleatoria dividida entre el número total de observaciones menos el número de tratamientos.
Es decir 90 / (12-3).
De aquí, el segundo estimado de la varianza poblacional es 90/9.
Ing. William león Velásquez 28
Dentro de cada grupos
EJEMPLO DIDACTICO
Por tanto
Ing. William león Velásquez 29
Entre grupos
Dentro de cada grupos
mnE
mT
S
SF
2
1
2
EJEMPLO DIDACTICO
Como esta razón es muy distinta a 1, se concluye que las medias de los tratamientos no son iguales.
Por lo tanto hay una diferencia en el número medio de clientes atendidos por los tres empleados.
Al igual que en la prueba de hipótesis de dos muestras y una muestra se sigue la regla de los cinco pasos.
Ing. William león Velásquez 30
EJEMPLO DIDACTICO
Comparación de varias medias
Análisis de Varianza (ANOVA)
Es la relación entre una variable cualitativa (con más de 2 categorías) y una variable cuantitativa
Ing. William león Velásquez 31
El problema
•Se tiene varias medias muestrales y se desea saber si realmente son evidencia de una diferencia entre los diferentes grupos
•Existe una variable cuanlitativa X que podría explicar los cambios en una variable cuantitativa Y
Ing. William león Velásquez 32
Esquema ANOVA
Variable Independiente o Explicativa
Cualitativa
Variable dependiente o Respuesta
Cuantitativa
FACTOR que incluye varios posibles
tratamientos que pueden influir en la
respuesta
Medición que puede RESPONDER a los
varios posibles tratamientos del factor estudiado
X Y
Ing. William león Velásquez 33
La Hipótesis
Ho: No hay relación entre X e Y
Ho: Las medias de Y en los diferentes grupos son iguales
Ha: Si hay relación entre X e Y
Ha: Por lo menos una media de Y es diferente en los grupos definidos por la variable X
Ing. William león Velásquez 34
Ilustración mediante un ejemplo
La muestra seleccionada permite ver que hay diferencias, pero sólo en la muestra
Se tiene los datos de las compras de limpiadores que
efectúan las familias consumidoras, por nivel de
educación del jefe de familia
Total Primaria Secundaria Superior
Compra promedio
(onzas)
15.5 11.1 15.9 22.7
Desviación estándar (onzas)
10.4 5.6 6.2 5.9
Base n 589 244 206 139
Ing. William león Velásquez 35
Si se asume que Ho es cierta (No hay relación)
En la población las medias deberían ser
iguales (Este es el supuesto de Ho)
Primaria Secundaria Superior Total
Compra
promedio
15.5 15.5 15.5 15.5
Base (n) 244 206 139 589
Ing. William león Velásquez 36
Modelo de ANOVA de un factor
Y=
Media general
Efecto del tratamiento en el factor analizado
Error aleatorio
Ing. William león Velásquez 37
En el ejemplo
Y es la cantidad comprada
X es el factor analizado es la variable cualitativa: educación
El factor educación tiene 3 tratamientos: Primaria, Secundaria, Superior
El efecto sobre la cantidad comprada de cada tratamiento (nivel específico de educación) no tiene que ser el mismo.
La hipótesis nula dice que por menos uno de los tratamientos (un nivel específico de educación) tiene efecto sobre la cantidad comprada
Ing. William león Velásquez 38
Resultados de ANOVA
Ing. William león Velásquez 39
En este caso, p es muy pequeño Con lo cual podríamos rechazar la hipótesis de
igualdad de medias
Supuestos de ANOVA
• La dispersión debe ser la misma en cada grupo o categoría (igualdad de varianza)
• La distribución de las observaciones en cada grupo debe ser normal
ANOVA es más sensible al primer supuesto que la segundo En casos extremos hay que considerar alternativas no paramétricas
Ing. William león Velásquez 40
Ejemplo 1
• En una ciudad está dividida en cuatro distritos. El jefe de policía quiere determinar si hay alguna diferencia en el número promedio de delitos cometidos en cada distrito.
• Se registró el número de infracciones reportados en cada distrito en una muestra de seis días.
• Al nivel de significancia 0,05; puede el funcionario concluir que hay diferencia en el número promedio de infracciones?
Distrito 01
Distrito 02
Distrito 03
Distrito 04
Ing. William león Velásquez 41
Ejemplo 1
Ing. William león Velásquez 42
Ejemplo 1
c) El valor estadístico de la prueba:
Distrito 01 x2
Distrito 02 x2
Distrito 03 x2
Distrito 04 x2 total
13 169 21 441 12 144 16 256 15 225 13 169 14 196 17 289 14 196 18 324 15 225 18 324 15 225 19 361 13 169 15 225 14 196 18 324 12 144 20 400 15 225 19 361 15 225 18 324
Tc (X) 86 108 81 104 379 nc 6 6 6 6 x2 1236 1980 1103 1818 6137
Ing. William león Velásquez 43
SST =
Ejemplo 1
SST = (86)2 (108)2 (81)2 (104)2 (379)2
------ + ------ + ------ + -------- - --------
6 6 6 6 24
1232.67 + 1944.00 + 1093.50 + 1802.67 - 5985.04 = 87.79
Ing. William león Velásquez 44
Ejemplo 1
Ing. William león Velásquez 45
d) Criterio de decisión Se rechaza la Ho debido a que el valor calculado es 9.118 que es mayor al valor crítico de 3.10 y se concluye de que no hay diferencia en el número promedio de infracciones entre las citadas ciudades
Ejemplo 2
Al nivel de significancia de 0,05; existe alguna diferencia entre las cuatro empresas, en el número medio de meses antes de recibir un aumento de sueldo?
• Una egresada de ingeniería industrial tiene ofertas de trabajo de cuatro empresas. Para examinar un poco más las propuestas, solicitó a una muestra de personas recién ingresadas, que le indiquen cuántos meses trabajaron cada una para su compañía, antes de recibir un aumento de sueldo.
• La información muestral fueron lo siguiente:
Ing. William león Velásquez 46
Empresa1 Empresa2
Empresa3
Empresa4
12 14 18 12
10 12 12 14
14 10 16 16
12 10
Ejemplo 2
Ing. William león Velásquez 47
Ejemplo 2
Empresa 01
Empresa 02
Empresa 03
Empresa 04
X2 X2 X2 X2 Total
Ing. William león Velásquez 48
Ejemplo 2
Ing. William león Velásquez 49
n
XXSStotal
22
n
X
nTSST
c
c
22
Ejemplo 2
Ing. William león Velásquez 50
Ejemplo 3
Los miembros de un equipo ciclista se dividen al azar en tres grupos que entrenan con métodos diferentes.
El primer grupo realiza largos recorridos a ritmo pausado, el segundo grupo realiza series cortas de alta intensidad y el tercero trabaja en el gimnasio con pesas y se ejercita en el pedaleo de alta frecuencia.
Después de un mes de entrenamiento se realiza un test de rendimiento consistente en un recorrido cronometrado de 9 Km.
Ing. William león Velásquez 51
Ejemplo 3
Los tiempos empleados fueron los siguientes
A un nivel de confianza del 95% ¿Puede considerarse que los tres métodos producen resultados equivalentes? O por el contrario ¿Hay algún método superior a los demás?
Ing. William león Velásquez 52
Método I Método II Método III
15 14 13
16 13 12
14 15 11
15 16 14
17 14 11
Ejemplo 3
Ing. William león Velásquez 53
Se calcula los totales y los cuadrados de los totales divididos por el numero de observaciones
Ejemplo 3
A partir de estas cantidades básicas calculamos las Sumas de Cuadrados:
SC(total) = 2984 - 2940 = 44 SC(entre) = 2966,8 – 2940 = 26,8 SC(intra) = 2984 – 2966,8 = 17,2 Ing. William león Velásquez 54
SS = SST + SSE SST = SS -SSE
n
XXSStotal
22
n
X
nTSST
c
c
22
29842X
2940
2
n
X
Ejemplo 3
Los cuadrados medios serán:
CM(entre) = 26,8/2 = 13,4 CM(intra) = 17,2/12 = 1,43
Ing. William león Velásquez 55
mnE
mT
S
SF
2
1
2
Por consiguiente el estadístico de contraste vale: F = 13,4/ 1,43 = 9,37
Ejemplo 3
El valor de la F teórica con 2 y 12 grados de libertad, a un nivel de confianza del 95% es 3,89. Por consiguiente se rechaza la hipótesis nula y Se concluye que los tres métodos de entrenamiento producen diferencias significativas.
Ing. William león Velásquez 56
Ejemplo 4
Un estudio muestra en la pantalla de cuatro computadores una lista de palabras sin sentido con procedimientos diferentes, asignados aleatoriamente a un grupo de personas. Luego se les realiza una prueba de memoria de dichas palabras, obteniéndose los siguientes resultados:
Ing. William león Velásquez 57
Ejemplo 4
¿Qué conclusiones pueden obtenerse acerca de las cuatro formas de presentación, con un nivel de significación del 5%? Solución: Calcular los totales y los cuadrados de los totales divididos por el número de observaciones:
Ing. William león Velásquez 58
Ejemplo 4
Luego calcular los cuadrados de las observaciones y su total
Ing. William león Velásquez 59
Ejemplo 4
A partir de estas cantidades básicas calcular las Sumas de Cuadrados: SC(total) = 988 – 819,8 = 168,2 SC(entre) = 902 – 819,8 = 82,2 SC(intra) = 988 – 902 = 86 Los cuadrados medios serán: CM(entre) = 82,2/3 = 27,4 CM(intra) = 86/22 = 3,9
Ing. William león Velásquez 60
Ejemplo 4
Por lo tanto el estadístico de contraste será: F = 27,4/ 3,9 = 7,03 El valor de la F teórica con 3 y 22 grados de libertad, a un nivel de confianza del 95% es 3,05. Por consiguiente se rechaza la hipótesis nula y se concluye que los cuatro procedimientos de presentación producen diferencias significativas.
Ing. William león Velásquez 61
NOTA:
Para
cambiar la
imagen de
esta
dispositiva
,
seleccione
la imagen
y
elimínela.
A
continuaci
ón haga
clic en el
icono
Imágenes
en el
marcador
de
posición e
inserte su
imagen.
ANOVA de dos factores
◦ Se consideran los efectos de dos factores simultáneamente
• Diseño de bloques aleatorios
◦ Cuando una característica puede afectar la medición de la variable dependiente, se trata de controlar o bloquear esta variable, de tal manera que se pueda comparar mejor la influencia de un determinado tratamiento
Ing. William león Velásquez 63
ANOVA de dos factores
Y=
Media general
Efecto del tratamiento específico del primer factor
Efecto del tratamiento específico del segundo factor
Efecto de la interacción entre tratamientos
Error aleatorio Ing. William león Velásquez 64
Diseño de Bloques aleatorios
Y=
Media general
Efecto del tratamiento específico del primer factor
Efecto del bloque
Error aleatorio
Ing. William león Velásquez 65
ANOVA – P.H. para probar la igualdad de medias de varias poblaciones con dos factores
66
Se trata de probar si el efecto de un factor o
Tratamiento en la respuesta de un proceso o sistema es
significativo, al realizar experimentos variando los
niveles de ese factor (Temp.1, Temp.2, etc.)
POR FILAS
Y Considerando los niveles de otro factor que se piensa
que tiene influencia en la prueba – FACTOR DE
BLOQUEO
POR COLUMNA
Ing. William león Velásquez
ANOVA – P.H. para probar la igualdad de medias de varias poblaciones con dos factores
67
diferentessonsunasAHa
Ho a
..'.lg:
.........: 321
diferentessonsunasAHa
Ho a
..'.lg:
'.........''': 321
Para el tratamiento – en filas
Para el factor de bloqueo – en columnas
Ing. William león Velásquez
ANOVA 2 Factores - Ejemplo
68
Experiencia en años de los operadores
Maquinas 1 2 3 4 5
Maq 1 27 31 42 38 45
Maq 2 21 33 39 41 46
Maq 3 25 35 39 37 45
Ing. William león Velásquez
ANOVA – Dos factores o direcciones
69
•La SCTot y SCTr (filas) se determina de la misma forma que para la ANOVA de una dirección o factor
•En forma adicional se determina la suma de cuadrados del factor de bloqueo (columnas) de forma similar a la de las filas
•La SCE = SCT – SCTr - SCBl
Ing. William león Velásquez
ANOVA de 2 factores – Suma de cuadrados, gl. y Cuadrado medio para el factor de bloqueo (en cols)
70
)1/(
1.
)( 2
1
bSCBlCMBl
bSCBlgl
XXaSCBl j
b
j
Ing. William león Velásquez
ANOVA de 2 factores – Suma de cuadrados, gl. y Cuadrado medio para el error
71
))(/(
))((.
bnanSCBlCME
bnanSCEgl
SCBlSCTrSCTSCE
Ing. William león Velásquez
ANOVA – Cálculo del estadístico Fc y Ftabla
72
SCEglSCTrglALFAFFtabla
MCE
MCTrFc
.,.,
Ing. William león Velásquez
ANOVA de 2 factores – Cálculo del estadístico Fcbl y Ftabla bloques (columnas)
73
SCEglSCBlglALFAFFtabla
MCE
MCBlFc
.,.,
Ing. William león Velásquez
Tabla final ANOVA 2 Factores
74
FUENTE DE VARIACIÓN SUMA DE GRADOS DE CUADRADO VALOR F
CUADRADOS LIBERTAD MEDIO
Entre muestras (tratam.) SCTR a-1 CMTR CMTR/CME
Entre Bloques (Factor Bl) SCBl b-1 CMBL CMBL/CME
Dentro de muestras (error) SCE (a-1)(b-1) CME
Variación total SCT n-1 CMT
Regla: No rechazar si la F de la muestra es menor que la F de tabla para una cierta alfa
Ing. William león Velásquez
ANOVA – 2 F. Toma de decisión
75
Ftabla
Fc: Tr o Bl
Alfa
Zona de rechazo
De Ho o aceptar Ha
Zona de no rechazo de Ho
O de no aceptar Ha
Distribución F
Ing. William león Velásquez
ANOVA – 2 F. Toma de decisión
76
Si Fc (Tr o Bl) es mayor que Ftabla se
rechaza Ho Aceptando Ha donde las
medias son diferentes
O si el valor de p correspondiente a Fc
(Tr o Bl) es menor de Alfa se rechaza Ho
Ing. William león Velásquez
Ejemplo 1
•Se ha diseñado una prueba de vocabulario para detectar la afinidad hacia la mecánica.
•La prueba consiste en un cierto número de palabras tomadas de una lista de términos alusivos a la mecánica y a la maquinaria; y que la calificación que una persona puede obtener en esa prueba es, simplemente, el número de palabras que puede definir correctamente.
•Supongamos que se quiere probar si hay diferencias relativas a dos características, sexo y lugar donde viven, y también si se presentan diferencias atribuibles a la combinación de ambas.
Ing. William león Velásquez 77
Ejemplo 1
•Las calificaciones de los sujetos clasificadas de acuerdo a estas dos variables fueron las siguientes:
Urbano Rural
Hombre Mujer Hombre Mujer
4 1 3 4
9 4 7 4
9 5 7 4
10 6 7 8
Ing. William león Velásquez 78
Ejemplo 1
• Sería posible, por supuesto, llevar a efecto un análisis de varianza de una sola clasificación con estos cuatro grupos de sujetos, sin embargo, si se encuentra una diferencia significativa entre estos cuatro grupos,
• ¿Como saber si esas diferencias deben atribuirse al sexo o al lugar donde viven o a una combinación de ambos?
• Para estos casos se utiliza el método de análisis de varianza de doble clasificación, este método consta de varios pasos.
Ing. William león Velásquez 79
Pasos
1.- Establecer Hipótesis
Se tiene que establecer hipótesis para cada uno de los tratamientos y para la interacción de ambos:
a) Respecto al primer tratamiento:
Ho: “Los hombres no tienen más afinidad hacia la mecánica que las mujeres”
Ha: “Los hombres tienen más afinidad hacia la mecánica que las mujeres”
Ing. William león Velásquez 80
Ejemplo 1
1.- Establecer Hipótesis
b) Respecto al segundo tratamiento:
Ho:”Los residentes de zonas urbanas no tienen más afinidad hacia la mecánica que los residentes de zonas rurales”
Ha:”Los residentes de zonas urbanas tienen más afinidad hacia la mecánica que los residentes de zonas rurales”
Ing. William león Velásquez 81
Ejemplo 1
1.- Establecer Hipótesis
• c) Respecto a la interacción de los dos tratamientos
Ho:” La combinación de las circunstancias sexo y lugar de residencia no afecta de manera significativa el tener más afinidad hacia la mecánica”
Ha:”La combinación de las circunstancias sexo y lugar de residencia afecta de manera significativa el tener más afinidad hacia la mecánica”
Ing. William león Velásquez 82
Ejemplo 1
2.- Establecer el Criterio de Contraste
a=2 b=2 n=16
gl T1 a-1 1
gl T2 b-1 1
gl Iter (a-1)(b-1) 1
gl Tot n-1 15
gl SCE glTot-gl T1 +gl T2 - gl Iter 12
Gl T1 =1 Gl SCE= 12 F= 4 .75
Gl T2 =1 Gl SCE= 12 F= 4 .75
Gl Iter =1 Gl SCE= 12 F= 4 .75
Ing. William león Velásquez 83
Ejemplo 1
3.- Calcular el Estadístico de Prueba
Urbano Rural
Hombre x2 Mujer x2 Hombre x2 Mujer x2
4 16 1 1 3 9 4 16
9 81 4 16 7 49 4 16
9 81 5 25 7 49 4 16
10 100 6 36 7 49 8 64 ΣΣ
ΣX = 32 16 24 20 92
ΣX² = 278 78 156 112 624
n 4 4 4 4 16
Ing. William león Velásquez 84
Sumatoria de los totales
Ejemplo 1
•Cálculo del Factor de corrección:
Ing. William león Velásquez 85
529
16
922
FC
n
XFC
2)(
Ejemplo 1
•Cálculo de la Suma Total de Cuadrados
SCTotal = X 2 - FC
= ( 278 + 78 + 156 + 112) - 529 = 95
= 624 - 529 = 95
Ing. William león Velásquez 86
Ejemplo 1
•Calcular la suma de cuadrados por cada tipo de tratamiento
•SCT1 (por el lugar donde viven)
•
Ing. William león Velásquez 87
Ejemplo 1
•Calcular la suma de cuadrados por cada tipo de tratamiento
•SCT2 (por sexo)
•
Ing. William león Velásquez 88
Hombre Mujer
Ejemplo 1
•Calcular la suma de cuadrados por grupos
•
•*Este valor nos servirá para calcular el SCI y SCE
Ing. William león Velásquez 89
Ejemplo 1
• Calcular la suma de cuadrados de la interacción de los dos tratamientos
SCI = SCG – SCT1 – SCT2 =
= 35 – 1 – 25 = 9
• Calcular la suma de cuadrados del error
SCE = SCTOT – SCG =
= 95 – 35 = 60
Ing. William león Velásquez 90
Ejemplo 1
•Construir la Tabla ANOVA
FUENTE SC GL MC F
TRATAMIENTO 1 1.0 1 1 0.2
TRATAMIENTO 2 25.0 1 25 5
POR GRUPOS 35
INTERACCION 9.0 1 9 1.8
ERROR 60 12 5
TOTAL 95 15
Ing. William león Velásquez 91
Ejemplo 1
4.- Tomar Decisión y Conclusión Decisión Como los Estadísticos de Prueba, en los casos de las variables de localidad (F*1 = 0.2) y la combinación de sexo y localidad (F*i =1.8) son mas pequeños que sus respectivos criterios de contraste (F = 4.75), en estos casos se no rechaza la hipótesis nula, Mientras que en el caso del sexo el Estadístico de Prueba (F*2 = 5.0) es mas grande que el Criterio de Contraste (F = 4.75), entonces por lógica inferimos que F* queda dentro de la zona crítica y por lo tanto se rechaza la hipótesis nula por lo tanto aceptamos la hipótesis alterna,
Ing. William león Velásquez
92
Ejemplo 1
y la conclusión :
“Hay evidencia suficiente, con un nivel de significancia de .05, para afirmar que en promedio de la afinidad hacia la mecánica de los hombres es mayor que el de las mujeres,
mientras que no la hay para afirmar que los residentes de zonas urbanas tengan más afinidad hacia la mecánica que los residentes de zonas rurales,
ni tampoco podemos afirmar que la combinación de ambas circunstancias influya en la afinidad hacia la mecánica de los individuos”.
Ing. William león Velásquez 93
Ejemplo 02
• El departamento de nutrición de cierta universidad lleva a cabo un estudio para determinar si hay diferencia o no en el contenido de ácido ascórbico entre tres diferentes marcas de concentrado de jugo de naranja. Se hacen cuatro pruebas de los tres tipos de concentrado de jugo de naranja que fue congelado durante tres periodos de tiempo diferentes (en días)
Ing. William león Velásquez 94
Ejemplo 02
• Los resultados, en miligramos de ácido ascórbico por litro, son los siguientes:
Ing. William león Velásquez 95
MARCA
TIEMPO ( DÍAS )
0 3 7
RICA 52.6 54.2 49.4 49.2 42.7 48.8
49.8 46.5 42.8 53.2 40.4 47.6
BUENA 56.0 48.0 48.8 44.0 49.2 44.0
49.6 48.4 44.0 42.4 42.0 43.2
BARATA 52.5 52.0 48.0 47.0 48.5 43.3
51.8 53.6 48.2 49.6 45.2 47.6
Ejemplo 02
• Utilice un nivel de significancia de .05 para probar la hipótesis de que:
• Los contenidos de ácido ascórbico por marca de jugo son diferentes
• Los contenidos de ácido ascórbico por tiempo de congelamiento son diferentes
• Los contenidos de ácido ascórbico son diferentes debido a la interacción de las dos variables.
Ing. William león Velásquez 96
Ejemplo 2
2.- Establecer el Criterio de Contraste
Gl T1 =2 Gl SCE= 27 F=3.35
Gl T2 =2 Gl SCE= 27 F= 3.35
Gl Iter =4 Gl SCE= 27 F=2.73
a b n
3 3 36
gl T1 a-1 2
gl T2 b-1 2
gl Iter (a-1)(b-1) 4
gl Tot n-1 35
gl SCE glTot-gl T1 +gl T2 - gl Iter 27
Ing. William león Velásquez 97
3.35
3.35
2.73
Ejemplo 02
• Elaborar la tabla ANOVA
Ing. William león Velásquez 98
n
0
3
7
RICA 52.6 54.2 49.4 49.2 42.7 48.8 12 577.2
49.8 46.5 42.8 53.2 40.4 47.6
BUENA 56 48 48.8 44 49.2 44 12 559.6
49.6 48.4 44 42.4 42 43.2
BARATA
52.5 52 48 47 48.5 43.3 12 587.3
51.8 53.6 48.2 49.6 45.2 47.6
1724.1
Tratamientos 615 566.6 542.5 1724.1
n 12 12 12 36
Ejemplo 02
• 1- Cálculo del Factor de corrección
Ing. William león Velásquez 99
2972520.81
FC = ---------------- = 82570.0225
36
FC
= 82570
81.2972520)1.1724( 22X
n
XFC
2)(
Ejemplo 02
• 2- Cálculo de la Suma cuadrado de totales
Ing. William león Velásquez 100
83102.01 - 82570 = 531.9875 SCTotales=
FCXSCTotales 2
Ejemplo 02
• 3- Cálculos de los tratamientos
101
TIEMPO SCT1 = 31518.75 + 26752.96 + 24525.52
ΣX²/ n0 ΣX²/ n3 ΣX²/ n7
82797.23 - 82570.02 = 227.212 SCT1=
82570.02 -
FCn
XSCT
2
1
FCSCT 12
5.542
12
6.566
12
615 222
1
23.82797
2
n
X
Ejemplo 02
• 3- Cálculos de los tratamientos
Ing. William león Velásquez
MARCA SCT2 = 27763.32 + 26096.01 + 28743.44
ΣX²/ nRICA ΣX²/ nBUENA ΣX²/ nBARATA
82602.77 - 82570.02 = 32.752 SCT2=
- FC
82570.02 -
FCSCT 12
3.587
12
66.559
12
2.577 222
2
FCn
XSCT
2
2
77.82602
2
n
X
Ejemplo 02
4- Calcular la suma de cuadrados por bloques
103
0 3 7
RICA 203.1 194.6 179.5
BUENA 202 179.2 178.4
BARATA 209.9 192.8 184.6
SCG = 10312.40 + 9467.29 + 8055.06 +
+ 10201 + 8028.16 + 7956.64 +
+ 11014.50 + 9292.96 + 8519.29 - 82570.02 = 277.29
Ing. William león Velásquez
n=4
FC
n
XSGG
2
4.10312
4
41249.61
4
1.20322
n
X
X
Ejemplo 02
• 5- Calcular la suma de cuadrados de la interacción de los dos tratamientos
104
Ing. William león Velásquez
SCI = SCG – SCT1 – SCT2 =
SCI = 277.29 - 227.212 - 32.752
= 17.322
Ejemplo 02
• 6- Calcular la suma de cuadrados del error
105
Ing. William león Velásquez
SCE = SCTOT – SCG
SCE = 531.9875 - 277.29 = 254.703
Ejemplo 02
•Construir la Tabla ANOVA
FUENTE SC GL MC F
TRATAMIENTO 1 227.21 2 113.606 12.0429
TRATAMIENTO 2 32.75 2 16.376 1.7359
POR GRUPOS 277.29
INTERACCION 17.32 4 4.330 0.4591
ERROR 254.70 27 9.433
TOTAL 531.99 35
Ing. William león Velásquez 106
Ejemplo 02
Ing. William león Velásquez 107
FCRITICO
FT1= 4 .75
FT2= 4 .75
FINT= 4 .75
FDATOS
12.0429
1.7359
0.4591
Conclusión
Se rechaza la Ho
No se rechaza la Ho
No se rechaza la Ho
•Conclusión
FCrítico