25
Estatística 2 1.Teste de Hipóteses Prof. Gustavo B. Araujo Bibliografia → Anderson, Sweeney e Williams – cap. 9 → Morettin e Bussab – cap. 12

1.2 Testes de Hipótese - 3a Parte

Embed Size (px)

DESCRIPTION

FECAP

Citation preview

Page 1: 1.2 Testes de Hipótese - 3a Parte

Estatística 2

1.Teste de Hipóteses 1.Teste de Hipóteses

Prof. Gustavo B. Araujo

Bibliografia→ Anderson, Sweeney e Williams – cap. 9→Morettin e Bussab – cap. 12

Page 2: 1.2 Testes de Hipótese - 3a Parte

Recapitulando

- Teste de Hipóteses:

→ usado quando estamos interessados em testar alguma informaçãofeita sobre uma população (sobre um parâmetro de uma população).

→ a idéia é supor verdadeira a hipótese em questão e verificar a→ a idéia é supor verdadeira a hipótese em questão e verificar aprobabilidade que se teria de encontrar determinado resultado amostral, dadoque a hipótese é verdadeira.

→ se a probabilidade de encontrarmos certo valor amostral for muitobaixa, dada uma população com parâmetro igual ao de nossa hipótese,passamos a acreditar que o parâmetro populacional não deve ser o da hipótese.

Page 3: 1.2 Testes de Hipótese - 3a Parte

- Teste de Hipóteses – procedimento geral:

- X é uma variável aleatória da população.

- Hipótese: um parâmetro θ da população é igual a um valor específico,digamos θ .digamos θ0.

- Colhe-se uma amostra aleatória de elementos dessa população e comela deseja-se comprovar ou não a hipótese feita.

Page 4: 1.2 Testes de Hipótese - 3a Parte

1° Passo) Explicitar a hipótese nula (H0) a ser testada, assim como ahipótese alternativa (H1).

2° Passo) Fixar o nível de significância (8) do teste:8 = P(erro do tipo I) = P(rejeitar H0|H0 é verdadeira)e usar esta informação para construir a região de rejeição do teste

0 0e usar esta informação para construir a região de rejeição do teste

(Região Crítica).

3° Passo) Se o valor da estatística calculado com os dados da amostrapertencer à região crítica, rejeite H0, caso contrário, não rejeite H0.

Page 5: 1.2 Testes de Hipótese - 3a Parte

Teste para Proporção

1° Passo) Temos uma população e uma hipótese sobre a proporção pde indivíduos portadores de certa característica. Esta hipótese afirma que essaproporção é igual a certo valor p0.

H0 : p = p00 0

→ o problema fornece informações sobre a hipótese alternativa, quepode assumir três formas:

H0 : p ≠ p0 (teste bilateral)

H0 : p > p0 (teste unilateral à direita)

H0 : p < p0 (teste unilateral à esquerda)

Page 6: 1.2 Testes de Hipótese - 3a Parte

Obs: O estimador de interesse, , a proporção amostral, tem umadistribuição aproximadamente normal:

2° Passo) Fixado um valor de 8, devemos construir a região crítica para2° Passo) Fixado um valor de 8, devemos construir a região crítica parap, sob a suposição de que o valor do parâmetro definido por H0 seja overdadeiro.

3° Passo) Se o valor da estatística calculado com os dados da amostrapertencer à região crítica, rejeite H0, caso contrário, não rejeite H0.

Page 7: 1.2 Testes de Hipótese - 3a Parte

Ex.: Uma estação de televisão afirma que 60% dos televisores estavamligados em seu programa especial da última segunda-feira. Uma estaçãoconcorrente contesta a afirmação, sustentando que menos de 60% dostelevisores estavam ligados no programa especial. Para verificar as afirmações,selecionou-se uma amostra de 200 famílias e verificou-se que 104 assistiram aoprograma. Qual das emissoras provavelmente estava certa, considerando nívelprograma. Qual das emissoras provavelmente estava certa, considerando nívelde significância de 5%?

1° Passo) Explicitar a hipótese nula (H0) a ser testada, assim como ahipótese alternativa (H1).

H0 : p = 0,60

H1 : p < 0,60

Page 8: 1.2 Testes de Hipótese - 3a Parte

2° Passo) Fixamos 8 = 0,05 e supondo que H0 seja verdadeira:

Assim, a região crítica será dada por: RC = { }.→ queremos achar o valor tal que = 0,05.→ ou seja:→ ou seja:

= 0,05 →

→ Segue-se que = 0,543. Assim: RC = { }.

Page 9: 1.2 Testes de Hipótese - 3a Parte

3° Passo) Como = 0,52, podemos perceber que .

→ portanto, somos levados a rejeitar H0.

→ ou seja, há evidência de que a audiência do programa especial desegunda-feira provavelmente não foi de 60% e sim inferior a esse número.segunda-feira provavelmente não foi de 60% e sim inferior a esse número.

Page 10: 1.2 Testes de Hipótese - 3a Parte

Probabilidade de Significância

- O método de construção de um teste de hipóteses parte da fixação donível de significância 8.

→ esse procedimento pode levar à rejeição da hipótese nula para umvalor de 8 e à não-rejeição para outro valor (menor).

- Outra maneira de proceder consiste em apresentar a probabilidadede significância ou nível descritivo ou ainda p-valor do teste.

→ os passos são muito parecidos aos já apresentados. A principaldiferença está em não construir a região crítica. O que se faz é indicar aprobabilidade de ocorrer valores da estatística mais extremos do que oobservado, sob a hipótese de H0 ser verdadeira.

Page 11: 1.2 Testes de Hipótese - 3a Parte

- Vamos voltar ao exemplo anterior das emissoras de televisão.

Ex.: Uma estação de televisão afirma que 60% dos televisores estavamligados em seu programa especial da última segunda-feira. Uma estaçãoconcorrente contesta a afirmação, sustentando que menos de 60% dostelevisores estavam ligados no programa especial. Para verificar as afirmações,televisores estavam ligados no programa especial. Para verificar as afirmações,selecionou-se uma amostra de 200 famílias e verificou-se que 104 assistiram aoprograma. Qual das emissoras provavelmente estava certa?

1° Passo) Explicitar a hipótese nula (H0) a ser testada, assim como ahipótese alternativa (H1).

H0 : p = 0,60H1 : p < 0,60

Page 12: 1.2 Testes de Hipótese - 3a Parte

2° Passo) Admitindo a hipótese H0 verdadeira, .Colhida a amostra obtivemos = 0,52.→ portanto, podemos calcular qual a probabilidade de ocorrerem

valores de mais desfavoráveis para H0 do que esse.→ quanto menor for , maior será a evidência contra H0: p = 0,60.0

P( < 0,52|p = 0,60) = = P(Z < -2,30) = 0,01 ou 1%

Page 13: 1.2 Testes de Hipótese - 3a Parte

→ esse resultado mostra que, se a audiência do programa fosserealmente de 60%, a probabilidade de encontrarmos uma amostra de 200famílias com 52% ou menos de audiência seria de 1%.

→ isso sugere que, ou demos azar de estar diante de uma amostrabastante rara de ocorrer (probabilidade de 1 em 100), ou então a hipótesebastante rara de ocorrer (probabilidade de 1 em 100), ou então a hipóteseformulada não parece boa. Ou seja, os dados da amostra sugerem que ahipótese H0 deve ser rejeitada.

Page 14: 1.2 Testes de Hipótese - 3a Parte

- Como calcular o p-valor em um teste bilateral?

→ uma alternativa é tomar o p-valor bilateral como sendo igual a duasvezes o p-valor unilateral, prática que é razoável quando a distribuição daestatística do teste, sob H0, for simétrica.0

Ex.: Uma companhia de ônibus intermunicipais planejou uma novarota para servir vários locais situados entre duas cidades importantes. Umestudo preliminar afirma que a duração das viagens pode ser considerada umavariável normal , com média igual a 300 minutos e desvio padrão de 30minutos. As dez primeiras viagens realizadas nessa nova rota apresentarammédia igual a 314 minutos. Esse resultado comprova ou não o tempo médiodeterminado nos estudos preliminares?

Page 15: 1.2 Testes de Hipótese - 3a Parte

1° Passo) Explicitar a hipótese nula (H0) a ser testada, assim como ahipótese alternativa (H1).

H0 : µ = 300H1 : µ ≠ 3001

2° Passo) Sob a hipótese de que H0 é verdadeira e pelo fato de que deU2 ser conhecido (U = 30), temos: ~ N(300 ; 900/10).

→ como o valor observado = 314, podemos encontrar a probabilidadede ocorrerem amostras com valores de mais extremos do que esse:

P( > 314) = = P(Z > 1,48) = 0,07

Page 16: 1.2 Testes de Hipótese - 3a Parte

→ Como a distribuição de é normal, portanto simétrica, tomamos8 = 0,14. Se considerarmos que essa probabilidade não é suficientementepequena para rejeitar H0, consideraremos que os estudos preliminares parecemestar corretos.

· um problema que pode ocorrer com o procedimento de dobrar o p-· um problema que pode ocorrer com o procedimento de dobrar o p-valor unilateral para obter o p-valor bilateral é que o valor encontrado pode sermaior do que um (o que viola o princípio da probabilidade de que nenhumevento pode ter probabilidade de ocorrência maior do que um).

→ por isso, às vezes é preferível anunciar o valor do p-valor unilaterale a direção segundo a qual a observação afasta-se de H0 (a probabilidade deacharmos um valor tão maior ou tão menor, dada a suposta veracidade de H0).

Page 17: 1.2 Testes de Hipótese - 3a Parte

Poder de um Teste

- Na construção de um teste de hipóteses, procuramos controlar o errode tipo I, fixando sua probabilidade de ocorrência, 8, e construindo a regiãocrítica de modo que P(rejeitar H0|H0 é verdadeira) = 8.

- Por outro lado, a probabilidade de erro do tipo II, na maioria doscasos, não pode ser calculada, pois a hipótese alternativa usualmente especificacasos, não pode ser calculada, pois a hipótese alternativa usualmente especificaum conjunto de valores para o parâmetro. A probabilidade β do erro de tipo IInão pode ser calculada, a menos que se especifique um determinado valoralternativo para µ.

Page 18: 1.2 Testes de Hipótese - 3a Parte

Ex.: Uma máquina automática para encher pacotes de café enche-ossegundo uma distribuição normal, com média µ e variância U2 sempre igual a400 g2. A máquina foi regulada para µ = 500 g.

Periodicamente colhe-se uma amostra de 16 pacotes e verifica-se se aprodução está sob controle, isto é, se µ = 500 g ou não.

Uma dessas amostras apresentou uma média igual a 492g. Com nívelUma dessas amostras apresentou uma média igual a 492g. Com nívelde significância de 1%, você pararia ou não a produção para regular amáquina?

Page 19: 1.2 Testes de Hipótese - 3a Parte

→ no exemplo já visto da máquina de encher pacotes de café, a variávelaleatória X, que descrevia o peso de cada pacote, tinha uma distribuição normalcom média µ e variância 400 g2, de modo que a média amostral ~ N(500 ; 25),sob a hipótese H0 (n = 16 casos).

→ utilizamos o fato de que ~ N(500 ; 25) para determinar a região→ utilizamos o fato de que ~ N(500 ; 25) para determinar a regiãocrítica RC = .

→ a regra de decisão para verificar se a máquina estava ou nãoproduzindo sob controle foi:

. se RC, a máquina não estaria sob controle; se RNR, a máquinanão estaria.

→ RNR é a região de não-rejeição do teste, dada neste caso por:

Page 20: 1.2 Testes de Hipótese - 3a Parte

→ a probabilidade β do erro de tipo II não pode ser calculada, a menosque se especifique um valor alternativo para µ.

→ uma vez que especificamos um valor alternativo para µ (porexemplo, µ = 505) é possível calcular a probabilidade do erro de tipo II:

β = P(não-rejeitar H |µ = 505) = P( RNR|µ = 505) =β(µ = 505) = P(não-rejeitar H0|µ = 505) = P( RNR|µ = 505) == P(487,1≤ ≤512,9|µ = 505)

→ ou seja: β(505) = P( RNR|µ = 505) = P(-3,58 ≤ Z ≤ 1,58) = 0,943 ou94,3%, usando o fato de que agora ~ N(505 ; 25).

· os cálculos feitos foram: Zi,8/2 = (487,1 – 505)/5 ; Zs,8/2= (512,9 – 505)/5

Page 21: 1.2 Testes de Hipótese - 3a Parte

→ para qualquer outro valor do parâmetro µ podemos encontrar orespectivo valor de β, dada a região de aceitação original do teste.

- A quantidade 1 – β(µ) é usualmente chamada de poder ou potência doteste, e é a probabilidade de rejeitar a hipótese H0, dado um valor qualquer deµ, especificado ou não pela hipótese alternativa, e será dado por π .

0µ, especificado ou não pela hipótese alternativa, e será dado por π (µ).

→ no exemplo que acabamos de ver:π (µ) = P(rejeitar H0|µ) = P( < 487,1 ou > 512,9| µ)

Page 22: 1.2 Testes de Hipótese - 3a Parte

→ na tabela abaixo temos alguns valores de β(µ) e de π (µ), paradiferentes valores de µ. Observe que quanto maior for a distância entre o valorfixado em H0 (µ = 500) e o valor atribuído para a outra hipótese (µ = 505, porexemplo), maior será a probabilidade de tomar a decisão correta.

Tabela: Valores de β(µ) e π(µ), usando a regra de decisão RC = {x ̅∈R|x ̅≤ 487,1 ou x ̅≥ 512,9}Tabela: Valores de β(µ) e π(µ), usando a regra de decisão RC = {x ̅∈R|x ̅≤ 487,1 ou x ̅≥ 512,9}Verdadeiro valor de µ

π(µ) (em %) β(µ) (em %)À esquerda de 500 À direita de 500500 500 1,0 99,0498 502 1,7 98,3495 505 5,7 94,3492 508 16,4 83,6490 510 28,1 71,9487 513 49,0 51,0485 515 66,3 33,7480 520 92,1 7,9475 525 99,2 0,8

Page 23: 1.2 Testes de Hipótese - 3a Parte

Ex.: Retomando o exemplo anterior, se a amostra colhida fosse de 100pacotes ao invés de 16, mantivéssemos o mesmo nível de significância 8 = 1% ea mesma hipótese alternativa de que µ = 505:

a) qual seria a nova região crítica?b) qual seria o poder (π (µ)) do novo teste?(µ)

a) utilizamos o fato de que, com a nova amostra, ~ N(500 ; 4) paradeterminar a nova região crítica RC = { }.

b) os cálculos que temos de fazer são:Zi,8/2= (494,8 – 505)/2 e Zs,8/2= (505,2 – 505)/2Assim, temos: β(505) = P( RA|µ = 505) = P(-5,1 ≤ Z ≤ 0,1) = 0,54 ou 54%O poder do novo teste é: π (µ) = 46%.Dessa forma, vemos que π (µ,16) = 5,7% < π (µ,100) = 46%

Page 24: 1.2 Testes de Hipótese - 3a Parte

→ não só para o valor alternativo de µ = 505 o teste realizado commaior amostra apresenta maior probabilidade de uma resposta correta. Paraqualquer outro valor, o teste realizado com amostra maior é ao menos tão bomquanto o teste com amostra menor. Dizemos, assim, que o teste baseado emamostras de tamanho 100 é mais poderoso do que o teste baseado em amostrasde tamanho 16.de tamanho 16.

→ esse fato está de acordo com a intuição de que um teste comamostras maiores deve levar a melhores resultados.

Page 25: 1.2 Testes de Hipótese - 3a Parte