10 INFERÊNCIA ESTATÍSTICA Testes de Hipó · 10.2 - Lógica dos Testes

  • View
    213

  • Download
    0

Embed Size (px)

Text of 10 INFERÊNCIA ESTATÍSTICA Testes de Hipó · 10.2 - Lógica dos Testes

  • INE 7002 - Inferncia Estatstica Testes de Hipteses

    1

    10 INFERNCIA ESTATSTICA Testes de Hipteses

    10.1 - Introduo

    Viu-se anteriormente que uma determinada populao pode ser descrita atravs de um

    modelo probabilstico, que apresenta caractersticas e parmetros. Muitas vezes estes parmetros

    so desconhecidos e h interesse em estim-los para obter um melhor conhecimento sobre a

    populao: retira-se ento uma amostra aleatria da populao e atravs das tcnicas de Estimao

    de Parmetros1 procura-se obter uma estimativa de algum parmetro de interesse, e associamos

    uma probabilidade de que a estimativa esteja correta. A Estimao de Parmetros uma subdiviso

    da Inferncia Estatstica (que consiste em fazer afirmaes probabilsticas sobre o modelo

    probabilstico da populao a partir de uma amostra aleatria desta populao), a outra grande

    subdiviso constitui os Testes de Hipteses.

    Contrariamente Estimao de Parmetros os Testes de Hipteses permitem fazer

    inferncias sobre outras caractersticas do modelo probabilstico da populao alm dos parmetros

    (como, por exemplo, a forma do modelo probabilstico da populao). Quando os Testes so feitos

    sobre os parmetros da populao so chamados de Testes Paramtricos, e quando so feitos sobre

    outras caractersticas so chamados de Testes No Paramtricos2. No obstante vamos nos restringir

    aos Testes Paramtricos3.

    10.2 - Lgica dos Testes de Hipteses

    Imagine-se que um determinado pesquisador est interessado em alguma caracterstica de

    uma populao. Devido a estudos prvios, ou simplesmente por bom senso (melhor ponto de partida

    para o estudo) ele estabelece que a caracterstica ter um determinado comportamento. Formula

    ento uma hiptese estatstica sobre a caracterstica da populao, e esta hiptese aceita como

    vlida at prova estatstica em contrrio.

    Para testar a hiptese coletada uma amostra aleatria representativa da populao, sendo

    calculadas as estatsticas necessrias para o teste. Naturalmente (devido ao fato de ser utilizada uma

    amostra aleatria) haver diferenas entre o que se esperava (sob a condio da hiptese verdadeira)

    e o que realmente foi obtido na amostra. A questo a ser respondida : as diferenas so

    significativas o bastante para que a hiptese estatstica estabelecida seja rejeitada? Esta no uma

    pergunta simples de responder: depender do que est sob teste (que parmetro, por exemplo), da

    confiabilidade desejada para o resultado, etc. Basicamente, porm, ser necessrio comparar as

    diferenas com uma referncia (a distribuio amostral de um parmetro, por exemplo), que supe

    que a hiptese sob teste verdadeira: a comparao costuma ser feita atravs de uma estatstica de

    teste que envolve os valores da amostra e os valores sob teste.

    A tomada de deciso feita da seguinte forma:

    1 Ver o Captulo 9. 2 Na realidade a denominao correta deveria ser Testes dependentes de distribuio de referncia (porque para fazer

    inferncias sobre os parmetros devemos supor que o modelo probabilstico populacional normal, por exemplo, ou que a distribuio amostral do parmetro pode ser aproximada por uma normal), e Testes livres de distribuio

    (porque os Testes No Paramtricos no exigem que os dados tenham uma aderncia a um certo modelo). 3 Ao leitor interessado em Testes No Paramtricos recomenda-se a referncia: SIEGEL, S. Estatstica No Paramtrica

    (para as Cincias do Comportamento); McGraw-Hill, So Paulo, 1975. uma boa referncia no assunto, em portugus.

  • INE 7002 - Inferncia Estatstica Testes de Hipteses

    2

    - se a diferena entre o que foi observado na amostra e o que era esperado (sob a condio da

    hiptese verdadeira) no for SIGNIFICATIVA a hiptese ser aceita.

    - se a diferena entre o que foi observado na amostra e o que era esperado (sob a condio da

    hiptese verdadeira) for SIGNIFICATIVA a hiptese ser rejeitada.

    O valor a partir do qual a diferena ser considerada significativa ser determinado pelo

    Nvel de Significncia do teste. O Nvel de Significncia geralmente fixado pelo pesquisador,

    muitas vezes de forma arbitrria, e tambm ser a probabilidade de erro do Teste de Hipteses: a

    probabilidade de cometer um erro no teste, rejeitando uma hiptese vlida. Como a deciso do teste

    tomada a partir dos dados de uma amostra aleatria da populao h SEMPRE a probabilidade de

    estar cometendo um erro, mas com a utilizao de mtodos estatsticos possvel calcular o valor

    desta probabilidade4. O Nvel de Significncia uma probabilidade, portanto um nmero real que

    varia de 0 a 1 (0 a 100%), e como a probabilidade de se cometer um erro no teste interessante

    que seja o mais prximo possvel de zero: valores tpicos so 5%, 10%, 1% e at menores

    dependendo do problema sob anlise. Contudo, no possvel usar um Nvel de Significncia igual

    a zero porque devido ao uso de uma amostra aleatria sempre haver chance de erro, a no ser que a

    amostra fosse do tamanho da populao. O complementar do Nvel de Significncia chamado de

    Nvel de Confiana, pois ele indica a confiabilidade do resultado obtido, a probabilidade de que a

    deciso tomada esteja correta5.

    10.3 - Tipos de Hipteses

    Para realizar um Teste de Hipteses necessrio definir (enunciar) duas Hipteses

    Estatsticas complementares (que abrangem todos os resultados possveis): a chamada Hiptese

    Nula (denotada por H0) e a Hiptese Alternativa (denotada por H1 ou Ha). Enunciar as hipteses

    o primeiro e possivelmente mais importante passo de um Teste de Hipteses, pois todo o

    procedimento depender dele.

    A Hiptese Nula (H0) a hiptese estatstica aceita como verdadeira at prova estatstica em

    contrrio: pode ser o ponto de partida mais adequado para o estudo, ou exatamente o contrrio do

    que o pesquisador quer provar (ou o contrrio daquilo que o preocupa).

    A Hiptese Alternativa (H1), que ser uma hiptese complementar de H0, fornecer uma

    alternativa hiptese nula: muitas vezes justamente o que o pesquisador quer provar (ou o que o

    preocupa).

    Quando as hipteses so formuladas sobre os parmetros do modelo probabilstico da

    populao o Teste de Hipteses chamado de Paramtrico. Quando as hipteses so formuladas

    sobre outras caractersticas do modelo o Teste chamado de No Paramtrico.

    A deciso do teste consiste em ACEITAR ou REJEITAR a Hiptese Nula (H0): vai-se

    aceitar ou no a hiptese at ento considerada verdadeira.

    importante ter a noo exata do que significa ACEITAR ou REJEITAR a Hiptese Nula

    (H0). A deciso tomada sobre esta hiptese e no sobre a Hiptese Alternativa porque a

    4 Usando outros mtodos (empricos) no h como ter idia da chance de erro (pode ser um erro de 0% ou de 5000%...). 5 O leitor deve estar lembrado destes dois conceitos de Estimao de Parmetros: Nvel de Confiana era a

    probabilidade de que o Intervalo de Confiana contivesse o valor real do parmetro, e Nvel de Significncia,

    complementar daquele, era a probabilidade de que o Intervalo NO contivesse o parmetro, em suma a probabilidade

    da Estimao estar correta ou no, respectivamente.

  • INE 7002 - Inferncia Estatstica Testes de Hipteses

    3

    Hiptese Nula que considerada verdadeira (at prova em contrrio). Quando se aceita a Hiptese

    Nula significa que no h provas suficiente para rejeit-la. J quando a deciso por rejeitar a

    Hiptese Nula h evidncias suficientes de que as diferenas obtidas (entre o que era esperado e o

    que foi observado na amostra) no ocorreram por acaso. Usando uma analogia com o direito dos

    EUA, aceitar H0 seria comparvel a um veredito de no culpado (not guilty), ou seja, no h

    provas suficientes para condenar o ru... Por outro lado rejeitar H0 seria comparvel a um veredito

    de culpado (guilty), ou seja, as provas reunidas so suficientes para condenar o ru. O Nvel de

    Significncia ser a probabilidade assumida de Rejeitar H0 sendo H0 verdadeira.

    10.4 - Tipos de Testes Paramtricos

    A formulao das hipteses o ponto inicial do problema, e deve depender NICA E

    EXCLUSIVAMENTE das concluses que se pretende obter com o teste. A formulao da hiptese

    alternativa determinar o tipo de teste: se Unilateral ou Bilateral.

    Se a formulao da hiptese alternativa indicar que o parmetro maior ou menor do que o

    valor de teste (valor considerado verdadeiro at prova em contrrio) o teste ser Unilateral:

    somente h interesse se as diferenas entre os dados da amostra e o valor de teste forem em uma

    determinada direo. Se a formulao da hiptese alternativa indicar que o parmetro diferente

    do valor de teste o teste ser Bilateral: h interesse nas diferenas em qualquer direo. As

    hipteses ento seriam:

    Testes Unilaterais

    H0 : parmetro = valor de teste

    H1 : parmetro < valor de teste

    H0 : parmetro = valor de teste

    H1 : parmetro > valor de teste

    Testes Bilaterais

    H0 : parmetro = valor de teste

    H1 : parmetro valor de teste A escolha do tipo de teste depender das condies do problema sob estudo, sejam as trs

    situaes abaixo:

    a) Um novo protocolo de atendimento foi implementado no Banco RMG, visando reduzir o tempo

    que as pessoas passam na fila do caixa. O protocolo ser considerado satisfatrio se a mdia do

    tempo de fila for menor do que 30 minutos. Um teste Unilateral seria o adequado.

    b) Cerca de 2000 formulrios de pedidos de compra esto sendo analisados. Os clientes podem ficar