23
Bioestatística UNESP Prof. Dr. Carlos Roberto Padovani Prof. Titular de Bioestatística IB-UNESP/Botucatu-SP

Sistemas de Informação em Saúde - ibb.unesp.br · Análise Estatística Inferencial Utilizar testes de hipóteses e/ou calcular intervalos de confiança Concluir sobre populações

Embed Size (px)

Citation preview

Page 1: Sistemas de Informação em Saúde - ibb.unesp.br · Análise Estatística Inferencial Utilizar testes de hipóteses e/ou calcular intervalos de confiança Concluir sobre populações

Bioestatística

UNESP

Prof. Dr. Carlos Roberto Padovani

Prof. Titular de Bioestatística

IB-UNESP/Botucatu-SP

Page 2: Sistemas de Informação em Saúde - ibb.unesp.br · Análise Estatística Inferencial Utilizar testes de hipóteses e/ou calcular intervalos de confiança Concluir sobre populações

Perguntas iniciais para reflexão

I - O que é Estatística?

II - Com que tipo de informação (dados) a Estatística trabalha?

III - De que forma a Estatística interage com a pesquisa experimental ou

observacional (analítica ou descritiva)?

IV - Quais são as formas de obtenção de dados?

V - Que conceitos são fundamentais para se entender o conjunto de

dados gerados por uma pesquisa: por amostragem ou simples

levantamento de dados ?

VI - Que conceitos são fundamentais para se analisar estatisticamente

dados gerados por levantamentos amostrais?

Page 3: Sistemas de Informação em Saúde - ibb.unesp.br · Análise Estatística Inferencial Utilizar testes de hipóteses e/ou calcular intervalos de confiança Concluir sobre populações

Conteúdo Canônico

Prática

Filosofia do Pescador(Estatística)

Page 4: Sistemas de Informação em Saúde - ibb.unesp.br · Análise Estatística Inferencial Utilizar testes de hipóteses e/ou calcular intervalos de confiança Concluir sobre populações

O artista vê a verdade no belo e o pesquisador vê o belo na verdade

Interação Teoria e Prática

Estatística = Ciência + Tecnologia + Arte

Page 5: Sistemas de Informação em Saúde - ibb.unesp.br · Análise Estatística Inferencial Utilizar testes de hipóteses e/ou calcular intervalos de confiança Concluir sobre populações

DEFINIÇÃO DE ESTATÍSTICA

Estatística instrumento metodológico • Decidir qual é o melhor plano para a realização de um

estudo experimental ou observacional

• Organizar e sumarizar dados obtidos por classificação,

contagem ou mensuração

• Fazer inferências sobre populações de unidades

(indivíduos, objetos, animais) quando apenas uma parte

(amostra) é estudada

Áreas da Estatística (1) Planejamento de Experimentos e Técnicas de

Amostragem

(2) Estatística Descritiva

(3) Estatística Inferencial

Page 6: Sistemas de Informação em Saúde - ibb.unesp.br · Análise Estatística Inferencial Utilizar testes de hipóteses e/ou calcular intervalos de confiança Concluir sobre populações

Planejamento Estatístico e Amostragem

Cálculo do tamanho da amostra e definição da forma de coleta de dados

Obter amostras com poder adequado e sem distorções (vieses)

Análise Estatística Descritiva Identificar a natureza dos dados e o tipo de distribuição; resumir os

resultados

Ter uma idéia geral dos resultados obtidos; escolher o tipo de testes estatísticos que serão utilizados

Análise Estatística Inferencial Utilizar testes de hipóteses e/ou calcular intervalos de

confiança

Concluir sobre populações a partir de amostras

Planejamento e Análise Estatística

Page 7: Sistemas de Informação em Saúde - ibb.unesp.br · Análise Estatística Inferencial Utilizar testes de hipóteses e/ou calcular intervalos de confiança Concluir sobre populações

Conhecimento e seus níveis

• O que é conhecer? É uma relação que se estabelece entre o sujeito que conhece e o objeto conhecido

• No processo de conhecimento o sujeito procura se apropriar, de certo modo, do objeto conhecido

Conhecimento

SUJEITO (Empírico, Científico, OBJETO

Filosófico, Teológico)

Page 8: Sistemas de Informação em Saúde - ibb.unesp.br · Análise Estatística Inferencial Utilizar testes de hipóteses e/ou calcular intervalos de confiança Concluir sobre populações

SUJEITO CONHECIMENTO OBJETO

(MANIFESTAÇÃO) (ESTADO DE

ESPIRITO)

IGNORÂNCIA

DÚVIDA

OPINIÃO

CERTEZA

NADA

UM POUCO

SEM CLAREZA

EVIDÊNCIA

VERDADE

VERDADE – EVIDÊNCIA - CERTEZA

Page 9: Sistemas de Informação em Saúde - ibb.unesp.br · Análise Estatística Inferencial Utilizar testes de hipóteses e/ou calcular intervalos de confiança Concluir sobre populações

O Conhecimento e seus níveis

Dado Informação Conhecimento

Glicemia = 150mg/dl Hiperglicemia Paciente diabético

Page 10: Sistemas de Informação em Saúde - ibb.unesp.br · Análise Estatística Inferencial Utilizar testes de hipóteses e/ou calcular intervalos de confiança Concluir sobre populações

Estatística e o método científico

Análise Estatística

Descritiva

Análise Inferencial

Conclusões

Formulação de novos

objetivos

Objetivos da pesquisa

Planejamento de uma pesquisa

que será realizada por

levantamentos populacionais,

levantamentos amostrais ou

experimentos controlados

Observações

Dados

Page 11: Sistemas de Informação em Saúde - ibb.unesp.br · Análise Estatística Inferencial Utilizar testes de hipóteses e/ou calcular intervalos de confiança Concluir sobre populações

Dados relevantes

ao objeto de estudo

Analisar

Descrever Concluir

Entender Discutir

Planejar Predizer

Transformação dos

dados em informação Análise

Exploratória

Estatística

Descritiva

Análise

Confirmatória

Inferência

Estatística

Page 12: Sistemas de Informação em Saúde - ibb.unesp.br · Análise Estatística Inferencial Utilizar testes de hipóteses e/ou calcular intervalos de confiança Concluir sobre populações

A bioestatística é a metodologia estatística aplicada às ciências biológicas e da saúde, envolvendo o planejamento, a análise de dados e a interpretação dos resultados (divide-se em : estatística descritiva e inferência estatística)

A estatística descritiva consiste na organização dos dados obtidos por meio de classificação, contagem ou mensuração, apresentados de forma resumida em tabelas e gráficos,incluindo medidas de posição e variabilidade

Estatística descritiva e inferencial

Page 13: Sistemas de Informação em Saúde - ibb.unesp.br · Análise Estatística Inferencial Utilizar testes de hipóteses e/ou calcular intervalos de confiança Concluir sobre populações

A inferência estatística permite inferir a respeito de populações a partir de amostras, além de verificar se amostras provém da mesma população, por meio de teste de hipóteses ou da construção de intervalos de confiança

A partir de estatísticas(valores obtidos nos dados amostrais) busca-se inferir sobre os dados reais da população (denominados parâmetros) sujeito a uma margem controlada de erro

Estatística descritiva e inferencial

Page 14: Sistemas de Informação em Saúde - ibb.unesp.br · Análise Estatística Inferencial Utilizar testes de hipóteses e/ou calcular intervalos de confiança Concluir sobre populações

Categórica (qualitativa): dados obtidos por classificação em categorias, não existindo intervalo fixo entre as classes

Nominal: não existe ordem definida

Ordinal: grupos ou classes ordenadas

Numérica (quantitativa) ou intervalar: existe um intervalo fixo entre as classes

Discreta: dados obtidos por contagem, correspondendo a números inteiros (existe um hiato entre as classes)

Contínua: dados obtidos por mensuração; números reais (não existe hiato entre as classes)

Escala de Variáveis

Page 15: Sistemas de Informação em Saúde - ibb.unesp.br · Análise Estatística Inferencial Utilizar testes de hipóteses e/ou calcular intervalos de confiança Concluir sobre populações

TIPOS DE VARIÁVEIS

Categóricas Numéricas

Nominal

(classificação)

Ordinal

(classificação)

Discreta

(contagem)

Contínua

(mensuração)

gênero, raça,

região, grupo

sangüíneo

pressão

sangüínea

(baixa,

normal, alta)

Número de

acidentes,

número de

filhos

Peso, altura,

pressão

sangüínea

Page 16: Sistemas de Informação em Saúde - ibb.unesp.br · Análise Estatística Inferencial Utilizar testes de hipóteses e/ou calcular intervalos de confiança Concluir sobre populações

• Média: Soma dos valores dividida pelo número de observações

• Moda: Valor mais frequentemente observado

• Mediana: Valor que divide as observações, ordenadas de forma crescente, em igual número acima e abaixo

• Média e Mediana são aplicáveis apenas para variáveis numéricas (discretas ou contínuas). A moda pode ser calculada para variáveis numéricas ou categóricas.

• A média é uma medida muito afetada por valores discrepantes (outliers). A mediana é mais resistente.

Medidas de tendência central

Page 17: Sistemas de Informação em Saúde - ibb.unesp.br · Análise Estatística Inferencial Utilizar testes de hipóteses e/ou calcular intervalos de confiança Concluir sobre populações

Quartis dividem a amostra em quatro partes

Primeiro quartil limita 25% dos menores valores observados

Segundo quartil (mediana) limita 50% dos menores(maiores) valores observados

Terceiro quartil :limita 75% dos menores valores observados

Percentis dividem a amostra em 100 partes

O percentil 95, por exemplo, é o valor abaixo do qual encontram-se 95% das observações

Separatrizes

Page 18: Sistemas de Informação em Saúde - ibb.unesp.br · Análise Estatística Inferencial Utilizar testes de hipóteses e/ou calcular intervalos de confiança Concluir sobre populações

• Amplitude Total medida de variabilidade mais simples( resulta da diferença entre o maior e o menor valor)

• Variância e Desvio-Padrão medidas de variabilidade individual, ou seja, indicam como os valores variam de um indivíduo para outro, por meio do afastamento dos valores em relação à média

• Coeficiente de Variação medida de variabilidade relativa calculada dividindo-se o desvio-padrão pela média.

Medidas de Variabilidade ou Dispersão

Page 19: Sistemas de Informação em Saúde - ibb.unesp.br · Análise Estatística Inferencial Utilizar testes de hipóteses e/ou calcular intervalos de confiança Concluir sobre populações

• Os resultados apresentados sob a forma de tabelas e gráficos, devem resumir as informações e ser auto-explicativos. Todos os itens de uma tabela ou gráfico, se possível, devem constar na mesma página

• As tabelas são compostas de linha e colunas, incluindo sempre um título e a descrição dos resultados

• As bordas das tabelas devem conter apenas traços horizontais acima e abaixo da primeira linha e da última, quando esta contiver total ou média

• Quando a última linha não contiver total ou média, deverá ter apenas uma linha horizontal ao final

• Não incluir traços verticais

• Tabelas de contingência são compostas de linhas e colunas e apresentam as freqüências de ocorrência de uma associação que se deseje pesquisar

Tabelas

Page 20: Sistemas de Informação em Saúde - ibb.unesp.br · Análise Estatística Inferencial Utilizar testes de hipóteses e/ou calcular intervalos de confiança Concluir sobre populações

• Os gráficos devem facilitar muito a compreensão dos resultados. Os principais gráficos utilizados para variáveis numéricas são os histogramas e os diagramas de caixas(também chamados de boxplots)

• Para variáveis categóricas podemos construir gráficos de setores circulares indicando a participação percentual de cada categoria

• Os gráficos de barras podem ser utilizados tanto para representar variáveis categóricas (indicando a contagem ou percentual de cada categoria) como para comparar médias de grupos

Gráficos

Page 21: Sistemas de Informação em Saúde - ibb.unesp.br · Análise Estatística Inferencial Utilizar testes de hipóteses e/ou calcular intervalos de confiança Concluir sobre populações

• Outlier significa "aquele que está fora", podendo ser traduzido como "valor discrepante". A prática estatística para detectar os outlier consiste em

calcular a amplitude interquartis (Q3 – Q1)

calcular o limite inferior LI= Q1-1,5*Ampl.interquartis

Calcular o limite superior LS= Q3+1,5*Ampl.interquartis

• Valores abaixo do limite inferior ou acima do limite superior são considerados outliers

• O que fazer com outliers?

Primeiro, verificar se não houve erro de digitação. Em seguida, analisar se não ocorreu erro na mensuração da variável. Se o valor extremo está correto, deve-se avaliar se indivíduo correspondente apresenta alguma condição que o caracterize como os diferentes dos demais. Se isto ocorrer deve ser desprezado. Caso contrário, não desprezar.

Outlier

Page 22: Sistemas de Informação em Saúde - ibb.unesp.br · Análise Estatística Inferencial Utilizar testes de hipóteses e/ou calcular intervalos de confiança Concluir sobre populações

• Erro Padrão medida de variabilidade da média amostral ( a média varia de uma amostra para outra). A média populacional estimada a partir de uma amostra apresenta sempre uma margem de erro, que é estimada pelo erro padrão. Não se trata de uma medida de variabilidade individual (como o desvio-padrão), mas sim de uma estimativa da variabilidade da média obtida, em função do tamanho amostral

• Erro Amostral medida de afastamento da média amostral em relação à média da população, associada sempre a um nível de confiança

Erro padrão e erro amostral

Page 23: Sistemas de Informação em Saúde - ibb.unesp.br · Análise Estatística Inferencial Utilizar testes de hipóteses e/ou calcular intervalos de confiança Concluir sobre populações

• Simétrica em relação à média

• Unimodal (apresenta uma única moda)

• Média = mediana = moda (as três medidas do centro são iguais, portanto, considera-se apenas a média)

• Completamente caracterizada pela média e pelo desvio-padrão

• Coeficiente de assimetria (skewness) varia de -2 a +2.Mede a assimetria da distribuição em torno da média, sendo positivo quando existe desvio para a direita e negativo quando há desvio para a esquerda

• Coeficiente de curtose (kurtosis) varia de 1 a 5.Mede a relação entre a altura e a largura da curva

• Normal Padrão (z) é uma distribuição normal com média = 0 e desvio padrão = 1. Representada pela notação N (0, 1)

Distribuição normal