20
Testes de Hipóteses Hipótese Estatística de teste Distribuição da estatística de teste Decisão H 0 : Não existe efeito vs. H 1 : Existe efeito Hipótese nula Hipótese alternativa Varia conforme a natureza do problema Ou rejeito a hipótese nula o que significa que existe um efeito de tratamento Ou não rejeito a hipótese nula o que significa que não existem evidências de um efeito de tratamento

Testes de Hipóteses - pn-aulas.wdfiles.compn-aulas.wdfiles.com/local--files/madeira/bioestatística2_2.pdf · Estatística de teste Distribuição da estatística de teste Decisão

  • Upload
    lamphuc

  • View
    224

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Testes de Hipóteses - pn-aulas.wdfiles.compn-aulas.wdfiles.com/local--files/madeira/bioestatística2_2.pdf · Estatística de teste Distribuição da estatística de teste Decisão

Testes de HipótesesHipótese

Estatística de teste

Distribuição da estatística de teste

Decisão

H0: Não existe efeito vs. H1: Existe efeito Hipótese nula Hipótese alternativa

Varia conforme a natureza do problema

Ou rejeito a hipótese nula o que significa que existe um efeito de tratamento

Ou não rejeito a hipótese nula o que significa que não existem evidências de um efeito de tratamento

Page 2: Testes de Hipóteses - pn-aulas.wdfiles.compn-aulas.wdfiles.com/local--files/madeira/bioestatística2_2.pdf · Estatística de teste Distribuição da estatística de teste Decisão

Aceitar ou Não rejeitar?

Do ponto de vista estatístico puro não se diz “Aceito H0”,porque existem sempre erros.

O facto de não se rejeitar H0 pode ter duas causas:

•Ou o efeito não existe•Ou não existe potência para mostrar o efeito.

Page 3: Testes de Hipóteses - pn-aulas.wdfiles.compn-aulas.wdfiles.com/local--files/madeira/bioestatística2_2.pdf · Estatística de teste Distribuição da estatística de teste Decisão

Interpretação dos p-values

O p-value é a probabilidade de observar os dados quando a hipótese nula é verdadeira.

Por exemplo num ensaio clínico

Estamos interessados na diferença observada entre dois grupos de tratamentos.Relacionamos então os dados com a provável variação numaamostra devida ao acaso quando a hipótese nula é verdadeirana população.

Regra geral,Se o p-value > 0,05 o resultado do teste não

é significativo

Se o p-value < 0,05 o resultado do teste é significativo(rejeita-se a hipótese nula)

Se o p-value < 0,01 Pode-se dizer que o resultado é muito significativo

Page 4: Testes de Hipóteses - pn-aulas.wdfiles.compn-aulas.wdfiles.com/local--files/madeira/bioestatística2_2.pdf · Estatística de teste Distribuição da estatística de teste Decisão

Erros de Tipo I e Tipo II

Existem sempre erros ao fazer um teste de hipóteses.

Decisão: H0

Realidade: H0

Verdadeira

Verdadeira

Falsa

Falsa Erro I

αααα

Erro II

ββββconfiança

1 1 1 1 −−−− αααα

Potência

1 1 1 1 −−−− ββββ

Page 5: Testes de Hipóteses - pn-aulas.wdfiles.compn-aulas.wdfiles.com/local--files/madeira/bioestatística2_2.pdf · Estatística de teste Distribuição da estatística de teste Decisão

[ ] [ ]a verdadeiré H|HRejeitar I tipode erro 00PP ==α

[ ] [ ]falsa é H|HRejeitar NãoII tipode erro 00PP ==β

[ ]Falsa é H|HRejeitar 1 00PPotência =β−=

Page 6: Testes de Hipóteses - pn-aulas.wdfiles.compn-aulas.wdfiles.com/local--files/madeira/bioestatística2_2.pdf · Estatística de teste Distribuição da estatística de teste Decisão
Page 7: Testes de Hipóteses - pn-aulas.wdfiles.compn-aulas.wdfiles.com/local--files/madeira/bioestatística2_2.pdf · Estatística de teste Distribuição da estatística de teste Decisão

Quantas variáveis?

• 1– Análise descritiva

• Variável numérica– Medidas de localização, medidas de disperssão– Gráficos

» Variável discreta com poucos valores � Barras, linhas, sectogramas

» Variável contínua � Histograma, caixa de bigodes, etc.

• Variável qualitativa– Frequências, moda– Gráficos (barras, linhas, sectogramas, etc)

Page 8: Testes de Hipóteses - pn-aulas.wdfiles.compn-aulas.wdfiles.com/local--files/madeira/bioestatística2_2.pdf · Estatística de teste Distribuição da estatística de teste Decisão

Quantas variáveis?

• 1– Inferência estatística

• Variável numérica– Teste z– Teste t– Teste para uma variância

» A comparação é feita com um valor para o parâmetro populacional “externo”

• Variável qualitativa– Teste do Qui-quadrado

» Teste que avalia a homogeneidade das observações pelas diferentes categorias

– Teste para uma proporção» Teste que avalia se a proporção observada está de acordo

com uma hipótese populacional

Page 9: Testes de Hipóteses - pn-aulas.wdfiles.compn-aulas.wdfiles.com/local--files/madeira/bioestatística2_2.pdf · Estatística de teste Distribuição da estatística de teste Decisão

Quantas variáveis?

• 2 � v. categorial vs v. categorial– Análise descritiva bivariada

• Crosstabs• Frequências cruzadas• Proporções (por linha, por coluna, totais)

Page 10: Testes de Hipóteses - pn-aulas.wdfiles.compn-aulas.wdfiles.com/local--files/madeira/bioestatística2_2.pdf · Estatística de teste Distribuição da estatística de teste Decisão

Quantas variáveis?

• 2 � v. categorial vs v. categorial– Inferência estatística

• Qui-quadrado– Teste de independência (não associação)

» Pressupostos: o número esperado em cada célula da tabela é maior que 5

• Qui-quadrado com correcção para a continuidade (correcção de Yates)

– Quando se trata de uma tabela 2x2

• Teste exacto de Fisher– Quando se trata de uma tabela 2x2, sempre aplicável mesmo

quando falha o pressuposto de aplicação do quiquadrado

Page 11: Testes de Hipóteses - pn-aulas.wdfiles.compn-aulas.wdfiles.com/local--files/madeira/bioestatística2_2.pdf · Estatística de teste Distribuição da estatística de teste Decisão

Quantas variáveis?

• 2 � v. numérica vs v. categorial– A v. numérica toma o lugar de v. dependente

ou v. de teste– Análise descritiva bivariada

• Medidas de localização e de dispersão por cada nível da v. categorial

• Histogramas por painel• Caixas de bigodes paralelas

Page 12: Testes de Hipóteses - pn-aulas.wdfiles.compn-aulas.wdfiles.com/local--files/madeira/bioestatística2_2.pdf · Estatística de teste Distribuição da estatística de teste Decisão

Quantas variáveis?

• 2 � v. numérica vs v. Categorial � a v. categorial tem 2 níveis

– Inferência estatística• Teste t

– Comparação das duas média populacionais– Existem dois teste t

» 1 teste que assume a igualdade das variâncias populacionais

» 1 teste que assume a desigualdades das variâncias populacionais

• Teste F ou teste de Levene– Comparação de duas variâncias populacionais

• Teste de Mann-Whitney– Teste não paramétrico

» Compara as duas distribuições

Page 13: Testes de Hipóteses - pn-aulas.wdfiles.compn-aulas.wdfiles.com/local--files/madeira/bioestatística2_2.pdf · Estatística de teste Distribuição da estatística de teste Decisão

Quantas variáveis?• 2 � v. numérica vs v. Categorial

� a v. categorial tem mais de 2 níveis– Inferência estatística

• ANOVA– Testa a igualdade de todas as médias populacionais– Pressupostos:

» Todas as amostras são normais» Homocedaticidade: as variâncias de todos os grupos são iguais

• teste de Levene– Testa a igualdade das variâncias

» Este teste deve ser sempre feito antes de analisar os resultadosda igualdade das médias

• Teste de Kruskal-Wallis– Teste não paramétrico

» Compara as distribuições• Nota: quando existem diferenças estatísticas usam-se teste de

comparações múltiplas para perceber em que níveis ocorrem as diferenças: testes Post-Hoc

Page 14: Testes de Hipóteses - pn-aulas.wdfiles.compn-aulas.wdfiles.com/local--files/madeira/bioestatística2_2.pdf · Estatística de teste Distribuição da estatística de teste Decisão

Quantas variáveis?

• 2 � v. numérica vs v. numérica

– Coeficiente de correlação de Pearson• O teste associado é um teste t e assume

normalidade das variáveis para efectuar o teste

– Coeficiente de correlação de Spearman• Teste não paramétrico• Usa as ordens dos valores e não os valores

Page 15: Testes de Hipóteses - pn-aulas.wdfiles.compn-aulas.wdfiles.com/local--files/madeira/bioestatística2_2.pdf · Estatística de teste Distribuição da estatística de teste Decisão

Quantas variáveis?

• Mais de 2 variáveis – Análise multifactorial

• Temos uma variável dependente e queremos explicar a sua variação usando as restantes variáveis

– Análise multivariada• Queremos estudar a variação conjunta de mais do

que uma variável

Page 16: Testes de Hipóteses - pn-aulas.wdfiles.compn-aulas.wdfiles.com/local--files/madeira/bioestatística2_2.pdf · Estatística de teste Distribuição da estatística de teste Decisão

Quantas variáveis?• Mais de 2 variáveis �

Análise Multifactorial– A variável dependente (explicada) é numérica

(assumida normal)• Regressão linear múltipla

– Só são admitidas variáveis numéricas» Para variáveis categoriais é necessário usar variáveis

mudas/indicadoras» Exemplo: sexo � criar uma v. Com 1- Masculino e 0-

feiminino• ANOVA Multifactorial / MANCOVA

– São admitidas variáveis categoriais � FACTORES– Existem factores fixos � todos os possíveis valores presentes– Existem factores aleatórios � não todos os possiveis valores

representados– São admitidas variáveis numéricas � Covariáveis

(MANCOVA)

Page 17: Testes de Hipóteses - pn-aulas.wdfiles.compn-aulas.wdfiles.com/local--files/madeira/bioestatística2_2.pdf · Estatística de teste Distribuição da estatística de teste Decisão

Quantas variáveis?

• Mais de 2 variáveis � Análise Multifactorial

– A variável dependente (explicada) é dicotómica

• Regressão logistica (binária)– São admitidas variáveis categoriais � FACTORES– São admitidas variáveis numéricas � Covariáveis

(MANCOVA)

– A variável dependente (explicada) é dicotómica e tem associado um tempo até ao evento

• Análise de Sobrevivência / Regressão de Cox– Muito semelhante à regressão logistica

Page 18: Testes de Hipóteses - pn-aulas.wdfiles.compn-aulas.wdfiles.com/local--files/madeira/bioestatística2_2.pdf · Estatística de teste Distribuição da estatística de teste Decisão

Quantas variáveis?

• Mais de 2 variáveis � Análise Multifactorial

– Existem outros métodos menos usuais• Modelos linear generalizados

– Regressão de poisson– Logit– Probit

• Modelos lineares aditivos• etc

Page 19: Testes de Hipóteses - pn-aulas.wdfiles.compn-aulas.wdfiles.com/local--files/madeira/bioestatística2_2.pdf · Estatística de teste Distribuição da estatística de teste Decisão

Quantas variáveis?

• Mais de 2 variáveis � Análise multivariada

– Análise exploratória de dados multivariados• Não são metodos de inferência estatística

• Análise factorial• Componentes principais• Etc.

Page 20: Testes de Hipóteses - pn-aulas.wdfiles.compn-aulas.wdfiles.com/local--files/madeira/bioestatística2_2.pdf · Estatística de teste Distribuição da estatística de teste Decisão