Teste de Hipóteses 4 Prof. Miguel Angel Uribe Opazo

•Teste de Hipóteses 4

Prof. Miguel Angel Uribe Opazo

Introdução Ao contrário do que ocorria nos problemas de

estimação, vamos agora supor que exista uma hipótese a respeito de valores dos parâmetros populacionais, a qual será considerada válida até prova em contrário.

Pelo fato de se tratar de testes referentes aos parâmetros populacionais, estes são ditos de testes paramétricos.

Essa hipótese será testada com base em resultados experimentais, sendo rejeitada ou não rejeitada.

Conceitos Fundamentais Define-se por H0 a hipótese existente,

chamada hipótese nula, a ser testada e por H1 a hipótese alternativa.

Nos casos que serão examinados, H1 será a hipótese complementar de H0.

O teste irá levar a não rejeitar ou rejeição de H0, o que corresponde à negação ou aceitação de H1.

Conceitos Fundamentais Entretanto para manter a uniformidade,

enuncia-se o resultado final sempre em termos da hipótese H0, ou seja, rejeitar ou não rejeitar H0.

Podem ocorrer situações em que a hipótese nula H0 seja verdadeira e o teste leve à rejeitar H0, o que consiste em num erro, chamado erro tipo I.

Por outro lado, pode-se não rejeitar H0, sendo ela falsa, o que levaria a cometer erro tipo II.

Em resumo, em um teste de hipótese pode ocorrer dois tipos de erro, erro tipo I, rejeitar H0, sendo H0 verdadeira e erro tipo II, não rejeitar H0 sendo H0 falsa.

P[erro tipo I]= P[rejeitar H0, sendo H0 verdadeira] = α

P[erro tipo II]= P[não rejeitar H0, sendo H0 falsa] = β

A probabilidade do erro tipo I, α é denominada nível de significância do teste.

A probabilidade do erro tipo II, β está associado ao Poder do teste (1-β) .

Possíveis resultados de um teste de hipóteses e suas probabilidades condicionadas a realidade

Decisão Realidade H0 verdadeira H0 falsa Aceitar H0 Decisão correta Erro tipo II (1- ) ( ) Rejeitar H0 Erro tipo I Decisão correta ( ) ( 1- )

A faixa de valores da variável de teste que leva à rejeição de H0 é denominada Região Crítica ou Região de Rejeição do Teste.

A faixa restante, Região de Não rejeição. Em nossos problemas de teste de

hipóteses, serão controlados as probabilidade do erro tipos I e II, ou seja, o nível de significância do teste () e o poder do teste (1- ).

Etapas Básicas em um Teste de Hipótese

Em um teste de hipótese, inicia-se com um valor suposto (hipotético) de um parâmetro da população.

Fixe qual é a hipótese H0 a ser testada e qual é a hipótese alternativa H1.

Fixar a probabilidade de cometer erro tipo I. Use este valor para construir a Região Crítica - RC

Etapas Básicas em um Teste de Hipótese Depois de coletar uma amostra aleatória,

compara-se a estatística da amostra com o parâmetro suposto.

Então rejeita-se ou não o valor hipotético. O valor hipotético é rejeitado somente se o

resultado da amostra for claramente improvável de ocorrer.

Isto é, se o valor da estatística observada na amostra não pertencer a região crítica, não rejeito H0, caso contrário, rejeita-se H0 ao nível de % de significância.

PROCURE SEMPRE, QUE FIZER TESTE DE

HIPÓTESE, DISTINGUIR BEM ESTAS ESTAPAS.

Teste de Hipótese da Média Objetivo: avaliar afirmação feita respeito

da média populacional. Considerar dois casos: A) Desvio Padrão Populacional Conhecido; e B) Desvio Padrão Populacional

Desconhecido.

Procedimentos Gerali) Dados X , 0 , n, , ou S

ii) Sejam as hipóteses:

H0 : = 0 (hipótese nula)

Versus

a) H1 : 0 ou

b) H1 : > 0 ou

c) H1 : < 0 (hipótese alternativa) .

iii) Cálculos:

Se é conhecida, a estatística do teste é:

Z = nX

0

Se é desconhecida, a estatística do teste é:

T = nSX 0

iii) Regra de Decisão:1) Para o teste bicaudal H0: = 0 versus H1: 0 Considerando é conhecida, rejeita-se H0 , se | Z | > z/2 ao nível de % de

significância, onde z/2, é o valor da tabela normal padrão bicaudal ao nível de % de significância.

Considerando é desconhecido, rejeita-se H0, se | T | > t/2 ao nível de % de significância,

onde t/2, é o valor da tabela t-Student bicaudal com n-1 graus de liberdade e ao nível de % de significância.

2) Para o teste unicaudal a direita H0: <= 0 versus H1: > 0

Considerando é conhecida, rejeita-se H0,

se Z > z ao nível de % de significância, onde z é o valor da tabela normal padrão unicaudal ao nível de % de significância.

Considerando é desconhecido, rejeita-se H0 ,

se T > t ao nível de % de significância, onde t é o valor da tabela t-Student unicaudal com n-1 graus de liberdade e ao nível de % de significância.

3) Para o teste unicaudais a direita e esquerda

H0: = > 0 versus H1: < 0

Considerando é conhecido, rejeita-se H0,

se Z < - z ao nível de % de significância, onde z é o valor da tabela normal padrão unicaudal ao nível de % de significância.

Considerando é desconhecido, rejeita-se H0,

se T < - t ao nível de % de significância, onde t é o valor da tabela t-Student unicaudal com n-1 graus de liberdade e ao nível de % de significância.

Nível de significância para testes bicaudal e unicaudal

Nível de confiança Nível de significância Valor bicaudal Valor Unicaidal (1- )% ( )% z/2 z 99,90 0,1 3,29 99,00 1,00 2,58 2,33 95,00 5,00 1,96 1,65 90,00 10,00 1,65 1,28

Exemplo

Os registros dos últimos anos de um colégio atestam para os calouros admitidos que a nota média 115 pontos (teste vocacional). Para testar a hipótese de que a média de uma nova turma é a mesma, tirou-se, ao acaso, uma amostra de 50 notas, obtendo-se uma média 118 e um desvio padrão 20. Admitir que = 5%, para efetuar o teste.

H0: = 115 (hipótese nula, com 0 =115)

versus

H1: 115 (hipótese alternativa)

Como é desconhecida, a estatística do teste é:

T = nS

X 0 =

5020115118

= 1,06,

Para = 5% /2 o valor t/2 da tabela t-Student bicaudal com ( n– 1) = 49 graus de liberdade

é t/2 =.2,093.

Como |T| = 1,06 < 2,093, concluímos que não rejeitamos H0 , isto é, ao nível de 5% de

significância concluímos que a nova turma tem a mesma nota média no teste vocacional que

os do registro dos últimos anos.

Teste de Hipótese para Proporção

Quando a finalidade da amostragem é julgar a validade de uma alegação de uma proporção (p), é apropriado um teste de uma amostra.

O procedimento é análogo ao das médias, inclusive, a preocupação de se tratar de uma distribuição normal padronizada para valores críticos.

Procedimento Gerali. Procedimento Geral:

ii. i) Dados x, n, p0 ,

ii) Hipóteses:

iii. a) Teste bicaudal: H0: p = p0 (hipótese nula)

iv. versus

v. H1: p p0 ( hipótese alternativa)

vi. Teste unicaudal: H0 : p <= p0

vii. versus

viii. H1: p > p0

a) Teste unicaudal: H0 : p = > p0

ix. versus

x. H1: p < p0

ii) Cálculos:

nxp ˆ ; q0 = 1 – p0 ; 0 =

nqp 00

A estatística do teste ( a), (b) ou (c) é:

Z = 0

0ˆ

pp

iv) Regra de Decisão:

a) Para o teste bicaudal H0 : p = p0 versus H1 : p p0

Rejeita-se H0 se | Z| > z/2 ao nível de % de significância.

b) Para o teste unicaudal H0 : p <= p0 versus H1 : p > p0

Rejeita-se H0 se Z > z ao nível de % de significância.

c) Para o teste unicaudal H0 : p = > p0 versus H1 : p < p0

Rejeita-se H0 se Z < - z ao nível de % de significância

Exemplo

Um certo analgésico adotado em determinado hospital é eficaz em 70% dos casos. Um grupo de médicos chineses em visita a esse hospital afirma que a utilização de acupuntura produz melhores resultados. A direção do hospital resolve testar o método alternativo em 80 pacientes, com a finalidade de adotá-lo em definitivo se ele apresentar eficiência satisfatória numa proporção de casos maior que do anestésico atual. Seja 85% dos casos que o método de acupuntura apresenta a eficiência satisfatória quando aplicado a um paciente. Que decisão tomar ao nível de 5% de significância?.

A hipótese de interesse é:

H0: p = 0,70 (hipótese nula)

versus

H1: p > 0,70 (hipótese alternativa)

Neste problema

p0 = 0,70 ; q0 = 1 –0,70 = 0,30 ; n=80; 0 =80

30,0*70,0 =0,051 e 85,0ˆ p

A estatística do teste é:

Z = 0

0ˆ

pp = 051,0

70,085,0 = 2,94

Decisão:

O valor de z unicaudal ao nível de 5% de significância é z =1,65.

Como Z > 1,65 concluímos que se rejeita H0 ao nível de 5% de significância, isto é, o

método de acupuntura produz melhores resultados que o método tradicional ao nível de 5%

de significância.

Testes Não -Paramétricos

O método não-paramétrico é um método estatístico que não formula a hipótese sobre formas específicas de distribuição e, assim, não cogita de estimar valores desconhecidos de parâmetros.

Teste Qui-Quadrado

Tabela de Contingência Teste de Aderência Teste para Adequação de Ajuste

Análise Bidimensional de Variáveis Qualitativas Análise Bidimensional de Variáveis Qualitativas A técnica mais simples e mais flexível para descrever o grau A técnica mais simples e mais flexível para descrever o grau

de associação entre duas variáveis é a análise por de associação entre duas variáveis é a análise por classificação cruzada.classificação cruzada.

Exemplo 1.7 Exemplo 1.7 Cento e vinte e cinco proprietários de certa Cento e vinte e cinco proprietários de certa marca de automóvel foram entrevistados acerca do marca de automóvel foram entrevistados acerca do desempenho e do consumo de seus carros. O resultado da desempenho e do consumo de seus carros. O resultado da pesquisa de opinião é resumido na Tabela 1.9.pesquisa de opinião é resumido na Tabela 1.9.

Devemos considerar que, no consenso geral, o Devemos considerar que, no consenso geral, o desempenho e o consumo guardam relação entre sem?desempenho e o consumo guardam relação entre sem?

Para responder esta pergunta é necessário utilizar o Para responder esta pergunta é necessário utilizar o Teste Qui-quadrado de Independência, considerando as Teste Qui-quadrado de Independência, considerando as hipóteses:hipóteses:

HH00: o consumo e o desempenho são independentes ou : o consumo e o desempenho são independentes ou não existe associação.(hipótese nula)não existe associação.(hipótese nula)

versusversusHH11: o consumo e o desempenho não são independentes ou : o consumo e o desempenho não são independentes ou

existe associação. (hipótese alternativa).existe associação. (hipótese alternativa). Ao um nível de 5% de siginificância. (probabilidade de Ao um nível de 5% de siginificância. (probabilidade de

erro tipo I: rejeitar Herro tipo I: rejeitar H00 quando ela é verdadeira) quando ela é verdadeira)

A estatística do teste é da forma: estatística do teste é da forma:

i. Regra de Decisão:

ii. Se 2 > TAB2 , rejeito a hipótese H0 ao nível de 5%, onde TAB

2 é o valor da tabela

qui-quadrado com (r-1)(c-1) graus de liberdade (Anexo 2)

iii. Em nosso exemplo temos 2 = 3,7915 e TAB2 = 5,99 o qual implica que não existe

de associação entre o consumo e o desempenho. Outra regra é a seguinte se o nível

descritivo p-valor < 0,05 rejeito a hipótese H0 ao nível de 5%.

iv.

Tabela Qui -quadrado

Teste de Aderência

Devemos localizar neste teste os problemas em que se deseja verificar se a prática esta de acordo com a teoria, ou seja, problemas em que se deseja comparar a freqüência esperada (teoria) com a freqüência observada (prática).

Exemplo

Raias 1 2 3 4 5 6 7 8 Total Oi 29 19 18 25 17 10 15 11 144

A tabela abaixo mostra o número de vitórias de cavalos que correram em 8 raias diferentes de um moderno hipódromo. Sabe-se que a numeração das raias são feitas em sentido crescente da parte interna para a externa da pista circular. Um determinado turista acha que a raia em que o cavalo corre influência o resultado. Verifique se o mesmo tem razão.

A hipótese de nulidade dá a freqüência ou proporção de indivíduos ou objetos, que se enquadram em cada uma das k categorias na população presumida.

Isto é, a partir da hipótese de nulidade, podemos deduzir as freqüências esperadas.

A técnica ² testa se as freqüências observadas estão suficientemente próximas das esperadas para justificar sua ocorrência sob H0.

A hipótese de nulidade pode ser testada por: 2)1k(

k

1i iii2

cal E²EO

onde Oi = n° de casos observados classificados na categoria i Ei = n° de casos esperados classificados na categoria i, sob H0

a) Quando se espera que a freqüência de cada categoria seja a mesma, então knEi ,

i = 1, 2, ..., k. b) Quando se espera que cada freqüência seja diferente, para pelo menos uma

categoria, na razão de r1, r2, ..., rk tal que r1 + r2 + ... + rk = S, então S)n)(r(E i

i ,

onde n é o tamanho da amostra e k, o n° de categorias.

Se há concordância entre os valores observados e os valores esperados, as diferenças (Oi - Ei) serão pequenas e, conseqüentemente, ²cal será também pequeno.

Se as divergências forem grandes, o valor ²cal também será grande.

De modo intuitivo, quanto maior for o valor do ²cal, maior será a probabilidade de rejeitar H0, ou seja, das freqüências observadas não serem provenientes da população em que se baseou a hipótese de nulidade.

As hipóteses são do tipo:H0: f1 = f2 = ... = fk ou H0: f1 : f2 : ... = fk

(não existe diferença entre as freqüências observadas e as esperadas)

H1: existe diferença entre as freqüências observadas e as esperadas

k

1i iii2

cal E²EO segue uma distribuição 2

)1k( . Daí a hipótese H0 é testada em comparação

ao ² cal com ² (k – 1, ) onde é o nível de significância. Como estaremos sempre comparando os dados de uma amostra com uma população presumida, usa-se sempre uma teste unilateral à direita. Os valores do ² (k – 1, ) é observado na tabela da Distribuição Qui-quadrado.

Conclusão:

Rejeitamos H0, se ²cal ²(k – 1, ),

ou se a probabilidade associada à ocorrência, sob H0, do valor obtido do ²cal com (k - 1) g.l. não superar o valor de a, ou seja, P[²k - 1 ²cal ] < (for significativo )

Teste de Adequação do Ajuste Quando usamos a estatística ² para comprovar a

concordância entre valores esperados e observados para certo fenômeno, estaremos realizando um teste de adequação do ajustamento.

Quando usamos o Teste Qui-Quadrado para colocar à prova hipóteses referentes à forma da distribuição da população, como a Normal, Binomial, Poisson, etc, estaremos efetuando um "Teste de Aderência".

Nesses testes, admitimos que a distribuição da variável em estudo seja descrita por determinado modelo teórico de probabilidade e verificamos o grau de aderência dos dados amostrais ao modelo.

Essa forma de testar a aderência foi desenvolvida por Karl Pearson e baseia-se na

estatística

k

1i iii2

cal E²EO que tem distribuição qui-quadrado com (k - r - 1) graus de

liberdade, sendo k, o n° de parcelas somadas e r, o n° de parâmetros do modelo estimados independentemente a partir da amostra. O cálculo das freqüências esperadas é feito através da expressão Ei = npi, onde pi é a probabilidade, segundo o modelo, de se obter um valor da variável na classe considerada, e n, o tamanho da amostra.

Verificar se os dados a seguir se ajustam a uma distribuição de Poisson

Número de acidentes 0 1 2 3 4 5 Número de dias 25 19 10 9 4 3

Documents

Teste de Hipóteses 4 Prof. Miguel Angel Uribe Opazo