Introdução à Inferência Estatística - each.usp.br .2. População e Amostra • Definição:

  • View
    212

  • Download
    0

Embed Size (px)

Text of Introdução à Inferência Estatística - each.usp.br .2. População e Amostra • Definição:

ACH4513 INFERNCIA ESTATSTICA

2 Sem/2017

Introduo Inferncia Estatstica

Prof. Marcelo S. Lauretto marcelolauretto@usp.br www.each.usp.br/lauretto

Referncia:

W.O.Bussab, P.A.Morettin. Estatstica Bsica, 6 Edio. So Paulo: Saraiva, 2010 Captulo 10

1

1. Inferncia Estatstica: Introduo

Definio de Inferncia Estatstica:

Processo de aprender (inferir/generalizar) as caractersticas

de uma populao a partir de uma amostra

As caractersticas da populao so denominadas parmetros

Usualmente, no so observveis diretamente

As caractersticas da amostra so denominadas estatsticas

So observadas / computadas a partir dos dados

Contraste com a Estatstica Descritiva:

Estatstica descritiva foca exclusivamente nas propriedades

dos dados observados

No se assume que os dados vieram de uma populao maior

No h preocupao com a generalizao para a populao

2

1. Inferncia Estatstica: Introduo

Principais problemas da inferncia estatstica:

Estimao

Derivao de estimativas pontuais e intervalos estatsticos para os

parmetros

Testes de hipteses

Previso

3

2. Populao e Amostra

Definio:

Populao o conjunto de todos os elementos ou resultados

sob investigao.

Amostra qualquer subconjunto da populao.

Exemplo 10.1 (adaptado): Salrios dos moradores de um bairro

Consideremos uma pesquisa para estudar as remuneraes

dos moradores de um bairro em So Paulo (populao)

Seleciona-se uma amostra de 2000 moradores daquele bairro

Esperamos que a distribuio observada dos salrios na

amostra reflita a distribuio de todos os salrios desde que

a amostra tenha sido escolhida com cuidado.

4

2. Populao e Amostra

Exemplo 10.2: Opinio sobre um projeto

Queremos estudar a proporo de indivduos na cidade A que

so favorveis a um certo projeto governamental

Uma amostra de 200 moradores sorteada, e a opinio

(contrrio/favorvel) registrada

Podemos definir a varivel X da seguinte forma:

X=1 se o morador for favorvel; X = 0 se for contrrio

A amostra pode ser sintetizada como a sequncia de 0s e 1s

obtidos

Inferncias de interesse:

Qual a proporo (estimada) de moradores favorveis ao projeto?

Assumindo que uma pesquisa similar tenha sido conduzida na cidade B

(com outra amostra, naturalmente), ser que as taxas de aprovao ao

projeto so as mesmas para as duas cidades?

5

2. Populao e Amostra

Exemplo 10.3: Durao de lmpadas

Suponha que o interesse seja investigar a durao de um

novo tipo de lmpada

Uma amostra de 100 lmpadas do novo tipo so deixadas

acesas at queimarem, e a durao (h) de cada lmpada

registrada

Populao: universo de todas as lmpadas fabricadas ou a

serem fabricadas por essa empresa sob o mesmo processo

Impossvel observar toda a populao:

Ensaio destrutivo

No possvel conhecer todas as lmpadas que ainda sero

produzidas

6

2. Populao e Amostra

Exemplo 10.5: Moeda

Suponha que, no lanamento de uma moeda especfica,

consideramos a varivel aleatria X definida como:

X = 1 se a moeda der cara; X = 0 se der coroa

A probabilidade da moeda dar cara, denotada por p,

desconhecida. Ou seja, Pr = 1 = , Pr = 0 = 1

Para poder conhecer melhor a moeda e podermos fazer

algumas inferncias sobre , lanamos a moeda 50 vezes e contamos o nmero de caras observadas.

A populao pode ser considerada como tendo distribuio de

Bernoulli com parmetro .

A amostra ser uma sequncia de 50 nmeros 0s e 1s.

7

2. Populao e Amostra

Exemplo 10.6: Tempo de reao a estmulos visuais

Suponha que um investigador deseja verificar se o tempo Y de

reao a certo estmulo visual dependa da idade do indivduo

Para verificar se a suposio verdadeira, obteve-se uma

amostra de 20 pessoas

10 homens e 10 mulheres

Dentro de cada grupo de homens e de mulheres, foram selecionadas

duas pessoas das seguintes faixas de idades: 20, 25, 30, 35 e 40 anos

Cada pessoa foi submetida ao teste e seu tempo de reao y

foi medido

Populao: todas as pessoas que viessem a ser submetidas

ao teste, segundo o sexo e a idade

Obs:

Varivel aleatria desconhecida: Y (maiscula)

Valores observados: y1, y2, ..., y20 (minsculas) 8

3. Problemas de Inferncia

Exemplos de formulaes e problemas de inferncia:

Retornando ao Exemplo 10.5 moeda

Indicando por Y o nmero de caras obtidas depois de lanar a

moeda 50 vezes, se pudermos assumir que os lanamentos

so independentes e realizados aproximadamente sob as

mesmas condies, sabemos que Y segue uma distribuio

binomial, 50,

Suponha que, aps os lanamentos da moeda, tenham

ocorrido 36 caras.

Podemos concluir que a moeda honesta?

Problema de teste de hiptese

Supondo que tenhamos concludo que a moeda no honesta (ou seja,

conclumos que 1/2), qual a melhor estimativa para ?

Problema de estimao 9

3. Problemas de Inferncia

Retornando ao Exemplo 10.6 Tempo de reao a estmulos visuais

Um investigador deseja verificar se o tempo Y de reao a

certo estmulo visual dependa da idade do indivduo; para

isso, tomou uma amostra de pessoas de diferentes idades

Suponha que o tempo Y, para uma dada idade x, seja uma

varivel aleatria com distribuio normal, com mdia

dependendo da idade x, ou seja, ( , 2), onde = + .

Problemas de inferncia:

Estimar os parmetros e (e assim explicar melhor a relao entre idade e tempo de reao)

Testar se = 0 (uma forte evidncia de que 0 indica que h uma associao, causal ou no, entre as duas variveis)

Prever o tempo de reao para um indivduo com uma certa idade

10

3. Problemas de Inferncia

Exemplo 10.6 (cont): Tempo de reao a estmulos visuais

11

3. Problemas de Inferncia

Perguntas importantes antes de aplicar um plano para selecionar amostras:

a) Qual a populao a ser amostrada?

b) Quais so os parmetros de interesse sobre essa

populao?

E quais as inferncias de interesse?

c) Como obter os dados (a amostra)?

d) Que informaes pertinentes (estatsticas) sero retiradas da

amostra?

e) Como se comportam as estatsticas quando o mesmo

procedimento de escolher a amostra usado numa

populao (distribuio) conhecida?

12

4. Como selecionar uma amostra

As observaes contidas em uma amostra so tanto mais informativas sobre a populao quanto mais conhecimento explcito ou implcito houver sobre essa populao

Para estimar a quantidade de glbulos brancos no sangue,

algumas gotas colhidas na ponta do dedo fornecem uma

amostra representativa

Distribuio de glbulos brancos homognea

J para o exemplo 2 (opinio sobre projeto governamental),

entrevistar pessoas apenas em um bairro pode no ser

representativo

Vis de seleo: bairros beneficiados tendem a ser mais favorveis

Se a opinio tiver associao com fatores socioeconmicos, entrevistar

apenas um bairro dar uma ideia apenas das subpopulaes com

mesmas caractersticas daquele bairro 13

4. Como selecionar uma amostra

Procedimentos cientficos de obteno de dados amostrais podem ser divididos em trs grandes grupos

1. Levantamentos amostrais:

A amostra obtida de uma populao bem definida, por meio de

processos bem protocolados e controlados pelo pesquisador

Podem ser subdivididos em dois subgrupos:

Levantamentos probabilsticos: usam mecanismos aleatrios de

seleo dos elementos de uma amostra, atribuindo a cada um deles

uma probabilidade, conhecida a priori, de pertencer amostra

Levantamentos no-probabilsticos: incluem outros grupos, como:

amostras intencionais, obtidas com o auxlio de especialistas

amostras de voluntrios (tambm chamadas amostras por

convenincia), como ocorre em ensaios clnicos.

14

4. Como selecionar uma amostra

2. Planejamento de experimentos:

Objetivo principal o de analisar o efeito de uma varivel sobre outra

Requer interferncias do pesquisador sobre o ambiente em estudo

(populao), bem como o controle de fatores externos, com o intuito de

medir o efeito desejado.

Ex 1: considere a seguinte pergunta: a altura em que um produto

colocado na gndola de um supermercado afeta sua venda?

Para responder a essa pergunta, necessrio

obter dados de vendas do produto em diferentes alturas

que essas vendas sejam controladas para evitar interferncias de

outros fatores que no a altura (p.ex. sazonalidade)

Ex 2: ensaios clnicos para teste de eficcia de novos medicamentos

15

4. Como selecionar uma amostra

3. Levantamentos observacionais:

Os dados so coletados sem que o pesquisador tenha controle sobre as

informaes obtidas, exceto eventualmente sobre possveis erros

grosseiros ou condies anmalas