Upload
ledan
View
231
Download
0
Embed Size (px)
Citation preview
PROJETO E ANÁLISES DE EXPERIMENTOS (PAE)
EXPERIMENTOS COM UM ÚNICO FATOR E A ANÁLISE
DE VARIÂNCIA
Dr. Sivaldo Leite Correia
EXEMPLO DE UM PROBLEMA COM UM ÚNICO FATOR
Uma empresa do ramo textil deseja desenvolver um novo tecido
com uma tensão de ruptura superior ao produto existente, o qual é
usado para a confecção de camisas
A resistência do tecido é infuenciada pelas características técnicas
de uma fibra que compõe o tecido
Pesquisadores do departamento de pesquisa e desenvolvimento
da empresa conhecem, pela experiência, que a tensão de ruptura
da fibra é afetada pela quantidade de algodão nas misturas de
materiais que entram na composição da fibra
O grupo suspeita que, aumentando o teor de algodão, aumentará a
resistência da fibra, pelo menos inicialmente
Após uma discussão de idéias, a equipe decide testar amostras
em 5 níveis de algodão, em teores (massa) de 15, 20, 25, 30 e 35 %
e utilizar 5 corpos-de-provas em cada nível de teor de algodão
Um projeto de experimento (NÃO ALEATÓRIO) é apresentado,
conforme Tabela 1
EXEMPLO DE UM PROBLEMA COM UM ÚNICO FATOR
Tabela 1. Projeto de experimentos para o problema o estudo do
efeito do teor de algodão na resistência de uma fibra
A ordem dos experimentos apresentada não é ALEATÓRIA. Os 25
ensaios devem ser aleatórios
Uma ordem aleatória é necessária para prevenir efeitos de
váriáveis desconhecidas e incontroláveis (ruídos), que podem
influenciar a resposta (Tabela 2)
EXEMPLO DE UM PROBLEMA COM UM ÚNICO FATOR
Tabela 2. Sequência aleatória dos experimentos
Ensaio
Número do
Experimento
Teor de Algodão (%)
1 8 20
2 18 30
3 10 20
4 23 35
5 17 30
6 5 15
7 14 25
8 6 20
9 15 25
10 20 30
11 9 20
12 4 15
13 12 25
14 7 20
15 1 15
16 24 35
17 21 35
18 11 25
19 2 15
20 13 25
21 22 35
22 16 30
23 25 35
24 19 30
25 3 15
EXEMPLO DE UM PROBLEMA COM UM ÚNICO FATOR
Tabela 3. Resultados obtidos para a resistência à tração da
fibra (lff/in2) para cada teor
Uma análise gráfica (diagrama de caixa) permite ter uma idéia
inicial à cerca dos dados da amostra
Na maioria das situações, é necessário ter um conhecimento
mais completo dos dados da amostra
Por exemplo, podemos estar interessados em avaliar se o fator
A afeta a variável resposta (propriedade) e comparar a
diferença das médias para cada tratamento
O procedimento mais adequado utiliza como ferramenta
estatística a ANÁLISE DE VARIÂNCIA, a qual permite obter uma
análise mais completa dos dados
Teor algodão Ensaios
(%) 1 2 3 4 5
15 7 7 15 11 9
20 12 17 12 18 18
25 14 18 18 19 19
30 19 25 22 19 23
35 7 10 11 15 11
ANÁLISE DE VARIÂNCIA
Suponhamos que a tratamentos ou níveis diferentes ( n réplicas) de
um fator sejam comparados
As observações para a resposta de cada a nível é uma variável
ALEATÓRIA
Tabela 4. Análise de variância de experimentos com um único fator
As somatórias e médias são definidas abaixo:
Tratamento
(nível)
Ensaio
s Totais Médias
1 y11 y12 ... y1n y1. ȳ1.
2 y21 y22 ... y2n y2. ȳ2.
. . . . . .
. . . . . .
a ya1 ya2 ... yan ya. ȳa.
y.. ȳ..
𝑦𝑖. = 𝑦𝑖𝑗
𝑛
𝑗=1
𝑦 𝑖. = 𝑦𝑖.
𝑛 , 𝑖 = 1, 2, … , 𝑎
𝑦.. = 𝑦𝑖𝑗
𝑛
𝑗=1
𝑎
𝑖=1
𝑦 .. = 𝑦..𝑁
𝑁 = 𝑎. 𝑛
ANÁLISE DE VARIÂNCIA
Tabela 5. Resultados para as somas e médias da resistência à tração
para a fibra (lbf/in2)
O procedimento para a análise de variância parte do princípio que as
observações seguem um MODELO LINEAR do tipo:
Onde yij é a ij-ésima observação; µ é parâmetro comum a todos os
tratamentos, isto é, a média global; τi é o efeito para o tratamento i,
e ϵij é o componente relacionado com o ERRO ALEATÓRIO
𝑦𝑖𝑗 = 𝜇 + 𝜏𝑖 + 𝜖𝑖𝑗 𝑖 = 1, 2, … , 𝑎𝑗 = 1, 2, … , 𝑛
Teor algodão Ensaios Totais Médias
(%) 1 2 3 4 5 yi. ȳi.
15 7 7 15 11 9 49 9,8
20 12 17 12 18 18 77 15,4
25 14 18 18 19 19 88 17,6
30 19 25 22 19 23 108 21,6
35 7 10 11 15 11 54 10,8
y.. = 376 ȳ..= 15,04
ANÁLISE DE VARIÂNCIA
O objetivo da análise estatística é realizar teste de hipótesis a cerca
do efeito dos tratamentos e estimação dos mesmos
Devemos assumir que os erros são variáveis aleatórias,
independentes e com distribuição normal, com média zero e
variância constante σ2
O teste de hipóteses pode ser definido da forma:
H0: µ1 = µ2 = . . . = µa
H1: µi ≠ µj para pelo menos um par (i, j)
Se H0 é verdadeira, todos os tratamentos tem a mesma média µ
comum
Alternativamente podemos escrever
H0: τ1 = τ 2 = . . . = τ a = 0
H1: τi ≠ 0 para pelo menos um i
ANÁLISE DE VARIÂNCIA
A variabilidade total nos dados é dada pela Soma dos Quadrados
Totais, SST
Podese-se demonstrar que a variabilidade total pode ser dividida em
duas partes:
𝑆𝑆𝑇 = 𝑦𝑖𝑗 − 𝑦 ..2
𝑛
𝑗=1
𝑎
𝑖=1
𝑦𝑖𝑗 − 𝑦 ..2
𝑛
𝑗=1
𝑎
𝑖=1
= 𝑛 𝑦 𝑖. − 𝑦 ..2
𝑎
𝑖=1
+ 𝑦𝑖𝑗 − 𝑦 𝑖.2
𝑛
𝑗=1
𝑎
𝑖=1
ANÁLISE DE VARIÂNCIA
(1) a soma dos quadrados entre as diferenças das médias dos
tratamentos e a média global
(2) a soma dos quadrados entre as diferenças dos valores
observados e a média do tratamento
A primeira grandeza está relacionada com o efeito dos tratamentos
(SSL), enquanto a segunda representa o erro aleatório (SSE)
Portanto,
𝑆𝑆𝑇 = 𝑆𝑆𝐿 + 𝑆𝑆𝐸
𝑆𝑆𝐸 = 𝑦𝑖𝑗 − 𝑦 𝑖.2
𝑛
𝑗=1
𝑎
𝑖=1
𝑆𝑆𝐿 = 𝑛 𝑦 𝑖. − 𝑦 ..2
𝑎
𝑖=1
ANÁLISE DE VARIÂNCIA
Média dos quadrados dos tratamentos (MSL) e média dos quadrados
dos erros (MSE)
O teste é baseado no cálculo da estatística F0 (parâmetro estatístico
da distribuição F), com (a-1) graus de liberdade (MSL) e (N-a) graus
de liberdade (MSE)
H0 será rejeitada se F0 > Fα, a – 1, N – a (ou p ≤ α)
Tabela 6. Análise de variância para um único fator
𝑀𝑆𝐿 = 𝑆𝑆𝐿
𝑎 − 1 𝑀𝑆𝐸 =
𝑆𝑆𝐸
𝑁 − 𝑎
𝐹0 = 𝑀𝑆𝐿
𝑀𝑆𝐸
Fonte de variação Soma dos Quadrados
Graus de liberdade
Média dos Quadrados
F0
Tratamentos SSL a - 1 MSL
E
L
MS
MSF 0
Erros SSE N - a MSE
Total SST N - 1
EXEMPLO DO ESTUDO DO TEOR DE ALGODÃO NA
RESISTÊNCIA DA FIBRA
Retomando ao exemplo do efeito do teor de algodão na resistência
da fibra
H0: µ1 = µ2 = µ3 = µ4 = µ5
H1: algumas médias são diferentes
Teor algodão Ensaios Totais Médias
(%) 1 2 3 4 5 yi. ȳi.
15 7 7 15 11 9 49 9,8
20 12 17 12 18 18 77 15,4
25 14 18 18 19 19 88 17,6
30 19 25 22 19 23 108 21,6
35 7 10 11 15 11 54 10,8
y.. = 376 ȳ..= 15,04
𝑆𝑆𝑇 = 𝑦𝑖𝑗 − 𝑦 ..2
𝑛
𝑗=1
𝑎
𝑖=1
= 𝑦𝑖𝑗2
𝑛
𝑗=1
𝑎
𝑖=1
−𝑦..
2
𝑁
= 7 2 + 7 2 + 15 2+. . . + 11 2 − 376 2
25= 636,96
EXEMPLO DO ESTUDO DO TEOR DE ALGODÃO NA
RESISTÊNCIA DA FIBRA
Cálculo de SSL
Cálculo de SSE
Cálculo das médias MSL, MSE e F0
𝑆𝑆𝐸 = 𝑆𝑆𝑇 − 𝑆𝑆𝐿 = 636,96 − 475,76 = 161,20
𝑀𝑆𝐿 = 𝑆𝑆𝐿
𝑎 − 1=
475,76
4= 118,94 𝑀𝑆𝐸 =
𝑆𝑆𝐸
𝑁 − 𝑎=
161,20
20= 8,06
𝐹0 = 𝑀𝑆𝐿
𝑀𝑆𝐸=
118,94
8,06= 14,76
𝑆𝑆𝐿 = 𝑛 𝑦 𝑖. − 𝑦 ..2
𝑎
𝑖=1
= 1
𝑛 𝑦𝑖.
2
𝑎
𝑖=1
−𝑦..
2
𝑁
= 1
549 2 + 77 2 +. . . + 54 2 −
376 2
25= 475,76
EXEMPLO DO ESTUDO DO TEOR DE ALGODÃO NA
RESISTÊNCIA DA FIBRA
Tabela 7. Resultados para a análise de variância do exemplo da
resistência da fibra
O valor Fα, a-1, N-a pode ser obtido usando a Tabela de Distribuição F
Para α = 0,05, F0,05, 4, 20 = 2,87
Como F0,05, 4, 20 < F0 (2,87 < 4,76 ou p < 0,05), Rejeita-se H0 a um nível
menor que 0,01 (valor exato é de 9,11 x 10-6)
Conclusão: O teor de algodão na fibra afeta significativamente a
tensão média de ruptura do material
Fonte de
variação
Soma
Quadrados
Graus
liberdade
Média
Quadrados
F0 p
Teor de
algodão
475,76
4
118,94
14,76
< 0,01
Erros
161,20 20 8,06
Total 636,96 24
ANÁLISE COM DADOS NÃO BALANCEADOS
Se os dados não são balanceados, o procedimento é o mesmo,
porém com ligeiras modificações nos cálculos de SST e SSL
Entretanto, mesmo sendo possível usar a análise de variância em
dados não balanceados, recomenda-se sempre que for possível usar
dados balanceados
𝑁 = 𝑛𝑖
𝑎
𝑖=1
𝑆𝑆𝑇 = 𝑦𝑖𝑗2
𝑛𝑖
𝑗=1
𝑎
𝑖=1
−𝑦..
2
𝑁 𝑆𝑆𝐿 =
𝑦𝑖.2
𝑛𝑖
𝑎
𝑖=1
−𝑦..
2
𝑁
INTERVALO DE CONFIANÇA PARA AS MÉDIAS
POPULACIONAIS EM CADA TRATAMENTO
Um intervalo de confiança de 100 (1-α) % da média no i-ésimo
tratamento, ou seja, µi é
Um intervalo de confiança de 95 % para a média do tratamento 4
(30 % de algodão) é
𝜇4 = 21,60 ± 2,0868,06
5= 21,60 ± 2,65 𝑜𝑢 18,95 ≤ 𝜇4 ≤ 25,25
𝜇𝑖 = ȳ𝑖. ± 𝑡(𝛼 2 , 𝑁−𝑎)
𝑀𝑆𝐸
𝑛
COEFICIENTE DE DETERMINAÇÃO
A quantidade chamada coeficiente de determinação, R2, é uma
medida da proporção da variabilidade nos dados explicada pelo
modelo de análise de variância (neste caso os tratamentos)
Para o exemplo do efeito do teor de algodão na resistência da fibra
O fator teor de algodão na fibra explica 74,69 % da variabilidade na
resistência à tração da fibra
𝑅2 = 636,96 − 161,20
636,96= 1 −
161,20
636,96= 0,7469 𝑜𝑢 74,69 %
𝑅2 = 𝑆𝑆𝑒𝑥𝑝𝑙𝑖𝑐𝑎𝑑𝑎
𝑆𝑆𝑇=
𝑆𝑆𝑇 − 𝑆𝑆𝐸
𝑆𝑆𝑇= 1 −
𝑆𝑆𝐸
𝑆𝑆𝑇=
𝑆𝑆𝐿
𝑆𝑆𝑇
VERIFICAÇÃO DA ADEQUAÇÃO DO MODELO
Para que a análise de variância seja uma ferramenta viável para o
teste de hipóteses, as considerações a cerca da normalidade devem
ser satisfeitas:
Os erros são independentes e normalmente distribuídos com média
zero e variância desconhecida, mas constante σ2
Na prática, entretanto, tais considerações geralmente não são
levadas a sério e, nesse caso, as conclusões da análise de variância
não podem ser confiáveis até que as considerações sejam checadas
Violações nas considerações básicas e adequação do modelo
podem ser investigadas pela avaliação dos RESÍDUOS
Define-se resíduo (eij), para a observação j no tratamento i, a
grandeza
Onde ȳi. é uma estimativa da correspondente observação yij
𝑒𝑖𝑗 = 𝑦𝑖𝑗 − 𝑦 𝑖𝑗 = 𝑦𝑖𝑗 − ȳ𝑖.
VERIFICAÇÃO DA ADEQUAÇÃO DO MODELO
A avaliação dos resíduos deve ser parte da análise de variância
Se as considerações estão sendo obedecidas, os resíduos NÃO
DEVEM APRESENTAR NENHUMA TENDÊNCIA PADRÃO, OU SEJA,
DEVEM SER DESORGANIZADOS, NÃO APRESENTANDO
CORRELAÇÕES ÓBVIAS
A checagem da adequação é feita pela análise gráfica dos resíduos
As técnicas mais usadas englobam
(1) Comprovação gráfica da normalidade
(2) Gráfico dos resíduos versus a sequência dos experimentos
(3) Gráfico dos resíduos versus valor predito ou ajustado para as
medidas
Para checar a normalidade, calcula-se a grandeza Pk, onde k é a
ordem do resíduo
𝑃𝑘 = (𝑘 −
12)
𝑁
VERIFICAÇÃO DA ADEQUAÇÃO DO MODELO
Os resíduos são colocados em ordem crescente e a grandeza Pk é
plotada versus os resíduos em PAPEL de PROBABILIDADE NORMAL
Se os resíduos seguem uma distribuição normal os mesmos devem
seguir uma linha reta, a qual representa a curva normal
Pequenos devios são aceitáveis, desde que a tendência seja
verificada
Para a verificação nos gráficos dos resíduos, não devem ser
observados resíduos:
(1) com tendências positivas e negativas consecutivas, pois tais
comportamentos indicam correlação
(2) tendência de afunilamento no caso do gráfico dos resíduos
versus valor predito, pois tal tendência indica uma variação na
variância