15
Estatística Aplicada à Engenharia Prof. Lupércio F. Bessegato - UFJF 1 Estatística Aplicada à Engenharia 1 DISTRIBUIÇÃO AMOSTRAL E ESTIMAÇÃO PONTUAL ROTEIRO 1. Introdução 2. Teorema Central do Limite 3. Conceitos de estimação pontual 4. Métodos de estimação pontual 5. Referências Estatística Aplicada à Engenharia 2 INTRODUÇÃO POPULAÇÃO E AMOSTRA • População: Conjunto de elementos que apresentam pelo menos uma característica em comum • População Alvo: População de interesse da pesquisa • Amostra: Qualquer subconjunto não vazio da população Estatística Aplicada à Engenharia 4

DISTRIBUIÇÃO AMOSTRAL E ESTIMAÇÃO PONTUAL · DESCRITIVA INFERÊNCIA ESTATÍSTICA PROBABILIDADE População Amostra EXTRAÇÃO DE AMOSTRAS ALEATÓRIAS Estatística Aplicada à

Embed Size (px)

Citation preview

Page 1: DISTRIBUIÇÃO AMOSTRAL E ESTIMAÇÃO PONTUAL · DESCRITIVA INFERÊNCIA ESTATÍSTICA PROBABILIDADE População Amostra EXTRAÇÃO DE AMOSTRAS ALEATÓRIAS Estatística Aplicada à

Estatística Aplicada à Engenharia

Prof. Lupércio F. Bessegato - UFJF 1

Estatística Aplicada à Engenharia 1

DISTRIBUIÇÃO AMOSTRAL E ESTIMAÇÃO PONTUAL

ROTEIRO

1.  Introdução 2.  Teorema Central do Limite 3.  Conceitos de estimação pontual 4.  Métodos de estimação pontual 5.  Referências

Estatística Aplicada à Engenharia 2

INTRODUÇÃO

POPULAÇÃO E AMOSTRA

• População: •  Conjunto de elementos que apresentam pelo menos uma

característica em comum

• População Alvo: •  População de interesse da pesquisa

• Amostra: •  Qualquer subconjunto não vazio da população

Estatística Aplicada à Engenharia 4

Page 2: DISTRIBUIÇÃO AMOSTRAL E ESTIMAÇÃO PONTUAL · DESCRITIVA INFERÊNCIA ESTATÍSTICA PROBABILIDADE População Amostra EXTRAÇÃO DE AMOSTRAS ALEATÓRIAS Estatística Aplicada à

Estatística Aplicada à Engenharia

Prof. Lupércio F. Bessegato - UFJF 2

CARACTERÍSTICAS DA AMOSTRA

CARACTERÍSTICAS DA POPULAÇÃO

ESTATÍSTICA DESCRITIVA

INFERÊNCIA ESTATÍSTICA

PROBABILIDADE

População

Amostra

EXTRAÇÃO DE AMOSTRAS

ALEATÓRIAS

Estatística Aplicada à Engenharia 5

TÉCNICAS DE AMOSTRAGEM

• Procedimento a ser adotado na seleção dos elementos da amostra

• O objetivo central é obter uma amostra representativa •  Amostra que representa toda a população da melhor

maneira possível

• A representatividade depende de: •  Metodologia adotada para seleção da amostra •  Tamanho da amostra

Estatística Aplicada à Engenharia 6

PROBLEMA FUNDAMENTAL DA ESTATÍSTICA

A partir da observação de amostras, COMO podemos tirar CONCLUSÕES sobre a POPULAÇÃO ?

Estatística Aplicada à Engenharia 7

PLANEJANDO UM EXPERIMENTO

•  Identificar seu objetivo

•  Coletar dados amostrais

•  Usar procedimento aleatório para evitar vício

•  Analisar dados e tirar conclusões

Estatística Aplicada à Engenharia 8

Page 3: DISTRIBUIÇÃO AMOSTRAL E ESTIMAÇÃO PONTUAL · DESCRITIVA INFERÊNCIA ESTATÍSTICA PROBABILIDADE População Amostra EXTRAÇÃO DE AMOSTRAS ALEATÓRIAS Estatística Aplicada à

Estatística Aplicada à Engenharia

Prof. Lupércio F. Bessegato - UFJF 3

ERRO AMOSTRAL

•  Diferença entre um resultado amostral e o verdadeiro resultado populacional •  são resultantes de flutuações amostrais aleatórias.

Estatística Aplicada à Engenharia 9

ERRO NÃO–AMOSTRAL

•  Incorreção na coleta, registro ou análise de dados amostrais

•  Exemplos •  Coleta tendenciosa de amostra •  Utilização de instrumento descalibrado •  Registro incorreto de dados amostrais

Estatística Aplicada à Engenharia 10

INFERÊNCIA ESTATÍSTICA

•  Definição: •  Procedimentos para generalizar características de uma

população a partir da informação contida na amostra.

•  Baseia-se na Teoria de Probabilidades

•  Áreas: •  Estimação de parâmetros •  Testes de hipóteses.

Estatística Aplicada à Engenharia 11

ESTIMAÇÃO DE PARÂMETROS

•  Estimação Pontual

•  Estimação Intervalar •  Intervalos de Confiança

Estatística Aplicada à Engenharia 12

Page 4: DISTRIBUIÇÃO AMOSTRAL E ESTIMAÇÃO PONTUAL · DESCRITIVA INFERÊNCIA ESTATÍSTICA PROBABILIDADE População Amostra EXTRAÇÃO DE AMOSTRAS ALEATÓRIAS Estatística Aplicada à

Estatística Aplicada à Engenharia

Prof. Lupércio F. Bessegato - UFJF 4

TESTE DE HIPÓTESES

•  Hipótese: •  Afirmação (alegação) sobre característica populacional

•  Teste de Hipóteses: •  Procedimento padrão para se testar uma afirmativa sobre

característica populacional

Estatística Aplicada à Engenharia 13

CONCEITOS FUNDAMENTAIS

•  Amostra aleatória: •  As variáveis aleatórias X1, X2, ..., Xn são uma amostra

aleatória de tamanho n, se: •  Forem independentes •  Cada Xi tiver mesma distribuição de probabilidades

Estatística Aplicada à Engenharia 14

•  Parâmetro: •  Quantidades de interesse da população •  Em geral, desconhecidas •  Média de uma população (µ) •  Desvio-padrão de uma população (σ)

•  Representadas por letras gregas •  Notação para estimador qualquer: θ

Estatística Aplicada à Engenharia 15

CONCEITOS

•  Estatística: •  Qualquer função da amostra

•  Estimador: •  Qualquer função da amostra que não dependa de

parâmetros desconhecidos •  Exemplo : Alguns estimadores da amostra aleatória X1, X2, ...,

Xn: X(1) = mín(X1, X2, ..., Xn) X(n) = máx(X1, X2, ..., Xn)

Estatística Aplicada à Engenharia 16

n

XX

n

ii

n

∑== 1

( )1

2

12

−=∑=

n

XXS

n

ii

CONCEITOS

Page 5: DISTRIBUIÇÃO AMOSTRAL E ESTIMAÇÃO PONTUAL · DESCRITIVA INFERÊNCIA ESTATÍSTICA PROBABILIDADE População Amostra EXTRAÇÃO DE AMOSTRAS ALEATÓRIAS Estatística Aplicada à

Estatística Aplicada à Engenharia

Prof. Lupércio F. Bessegato - UFJF 5

•  Distribuição amostral: •  Distribuição de probabilidades de um estimador

•  Exemplo: •  Distribuição amostral da média •  Parâmetros da distribuição amostral da média

Estatística Aplicada à Engenharia 17

( ) XnX µ=E ( )n

X Xn

2

Var σ=

CONCEITOS

•  Espaço paramétrico (Θ) •  Conjunto de possíveis valores que o parâmetroθpode assumir

•  Exemplo: Seja a amostra aleatória X1, X2, ..., Xn de X ~ N(µ, σ2)

•  Se σ2 = 1, então θ = µ é o parâmetro desconhecido e Θ = {µ, –∞ < µ < ∞}

•  Se µ = 0, então θ = σ2 é o parâmetro desconhecido e

Θ = {σ2, σ2 > 0}

Estatística Aplicada à Engenharia 18

CONCEITOS

•  Estimador de θ •  Qualquer estatística que assuma valores em Θ.

•  Notação:

•  Exemplo: Alguns estimadores para a média µ de uma população •  Média da amostra •  Mediana da amostra •  X1

Estatística Aplicada à Engenharia 19

θ̂

CONCEITOS

•  Estimativa de parâmetro populacional: •  é um valor específico, ou um intervalo de valores, usado para

estimar parâmetro populacional

•  Estimativa pontual: •  é um único valor numérico de uma estatística θ

Estatística Aplicada à Engenharia 20

CONCEITOS

Page 6: DISTRIBUIÇÃO AMOSTRAL E ESTIMAÇÃO PONTUAL · DESCRITIVA INFERÊNCIA ESTATÍSTICA PROBABILIDADE População Amostra EXTRAÇÃO DE AMOSTRAS ALEATÓRIAS Estatística Aplicada à

Estatística Aplicada à Engenharia

Prof. Lupércio F. Bessegato - UFJF 6

TEOREMA CENTRAL DO LIMITE (TCL)

TEOREMA CENTRAL DO LIMITE

•  Seja X1, X2, ..., Xn uma amostra aleatória de tamanho n de uma população (finita ou infinita), com média µ e variância finita σ2. Então

quando n → ∞.

Estatística Aplicada à Engenharia 22

Z = Xn −µσ / n

~ N(0,1)

•  Comentários: •  A aproximação normal para a média amostral depende do

tamanho da amostra

•  Com população contínua, unimodal e simétrica, na maioria dos casos, o TCL trabalha bem para pequenas amostras (n = 4, 5).

•  Em muitos casos de interesse prático, a aproximação normal será satisfatória para n ≥ 30

•  Se n < 30, o TCL funcionará se a distribuição da população não for muito diferente da normal

Estatística Aplicada à Engenharia 23

TEOREMA CENTRAL DO LIMITE EXEMPLO – SIMULAÇÃO

•  População exponencial com média 1: •  λ = 1 •  Geração de 10.000 valores dessa população •  Amostra de tamanho 1 (n = 1)

Estatística Aplicada à Engenharia 24

Page 7: DISTRIBUIÇÃO AMOSTRAL E ESTIMAÇÃO PONTUAL · DESCRITIVA INFERÊNCIA ESTATÍSTICA PROBABILIDADE População Amostra EXTRAÇÃO DE AMOSTRAS ALEATÓRIAS Estatística Aplicada à

Estatística Aplicada à Engenharia

Prof. Lupércio F. Bessegato - UFJF 7

Amostra n =1

Estatística Aplicada à Engenharia 25

> mean(amostra); sd(amostra) [1] 0.9990838 [1] 1.010478

Amostra n = 2

Estatística Aplicada à Engenharia 26

> mean(media_n); sd(media_n) [1] 1.012711 [1] 0.7129089

•  Amostras de tamanhos 2, 4, 10 e 20

Estatística Aplicada à Engenharia 27

n_2 n_4 n_10 n_20 n 2.000 4.000 10.000 20.000 media 0.995 1.000 0.996 0.999 dp 0.704 0.502 0.319 0.222

EXEMPLO – SIMULAÇÃO

•  População com densidade em U: •  f(x) = 12 (x – 0,5)2

•  Geração de 10.000 valores dessa população

•  Amostra de tamanho 1 (n = 1)

Estatística Aplicada à Engenharia 28

Page 8: DISTRIBUIÇÃO AMOSTRAL E ESTIMAÇÃO PONTUAL · DESCRITIVA INFERÊNCIA ESTATÍSTICA PROBABILIDADE População Amostra EXTRAÇÃO DE AMOSTRAS ALEATÓRIAS Estatística Aplicada à

Estatística Aplicada à Engenharia

Prof. Lupércio F. Bessegato - UFJF 8

Amostra n =1

Estatística Aplicada à Engenharia 29

> mean(amostra); sd(amostra) [1] 0.5061657 [1] 0.3877259

Amostra n = 2

Estatística Aplicada à Engenharia 30

> mean(media_n); sd(media_n) [1] 1.012711 [1] 0.7129089

Amostras de tamanhos 2, 4, 10 e 20

Estatística Aplicada à Engenharia 31

n 2.000 4.000 10.000 20.000 media 0.502 0.499 0.499 0.499 Dp 0.274 0.196 0.122 0.086

COMPARAÇÃO DE POPULAÇÕES

•  Considere duas populações: •  População 1: média µ1 e variância σ1

2 •  População 2: média µ2 e variância σ2

2

•  Amostras aleatórias das duas populações? •  Amostra da população 1 de tamanho n1: •  Amostra da população 2 de tamanho n2:

Estatística Aplicada à Engenharia 32

X1X2

Page 9: DISTRIBUIÇÃO AMOSTRAL E ESTIMAÇÃO PONTUAL · DESCRITIVA INFERÊNCIA ESTATÍSTICA PROBABILIDADE População Amostra EXTRAÇÃO DE AMOSTRAS ALEATÓRIAS Estatística Aplicada à

Estatística Aplicada à Engenharia

Prof. Lupércio F. Bessegato - UFJF 9

•  Caso 1: As duas populações são normais independentes •  Distribuição amostral da diferença

•  Média da diferença de médias amostrais:

•  Variância da diferença de médias amostrais:

Estatística Aplicada à Engenharia 33

COMPARAÇÃO DE POPULAÇÕES

X1 − X2 ~ N(µdif ,σ2dif )

µdif = E X1 − X2( ) = E X1( )−E X2( ) = µ1 −µ2

σ dif2 =Var X1 − X2( ) =Var X1( )+Var X2( ) = σ1

2

n1+σ 22

n2

•  Caso 2: populações não normais com tamanhos amostrais maiores que 30

•  Pode-se usar o TCL para aproximar a distribuição amostral da diferença:

Estatística Aplicada à Engenharia 34

COMPARAÇÃO DE POPULAÇÕES

DISTRIBUIÇÃO AMOSTRAL APROXIMADA DE DIFERENÇA DE MÉDIAS AMOSTRAIS

•  Suponha: •  Duas populações independentes, com médias µ1 e µ2 e

variâncias σ12 e σ2

2 •  Amostras aleatórias independentes de tamanhos n1 e n2

dessas populações

se as condições do TCL se aplicarem.

Estatística Aplicada à Engenharia 35

Z =X1 − X2( )− µ1 −µ2( )

σ12

n1+σ 22

n2

~ N(0,1)

A vida efetiva de um componente usado no motor de uma turbina de um avião a jato é uma variável aleatória com média 5000 horas e desvio-padrão 40 horas. Suponha normalidade e independência onde necessário. O fabricante do motor introduz uma melhor ia no processo de fabr icação desse componente, que aumenta a vida média para 5050 horas e diminui o desvio-padrão para 30 horas. Uma amostra aleatória de 16 componentes é selecionada do processo antigo e outra de 25 elementos é selecionada. Qual a probabilidade de que a diferença das média amostrais seja no mínimo de 25 horas? Estatística Aplicada à Engenharia 36

EXEMPLO – VIDA DE MOTOR

Page 10: DISTRIBUIÇÃO AMOSTRAL E ESTIMAÇÃO PONTUAL · DESCRITIVA INFERÊNCIA ESTATÍSTICA PROBABILIDADE População Amostra EXTRAÇÃO DE AMOSTRAS ALEATÓRIAS Estatística Aplicada à

Estatística Aplicada à Engenharia

Prof. Lupércio F. Bessegato - UFJF 10

C O N C E I T O S

ESTIMAÇÃO PONTUAL

PROPRIEDADES DE UM ESTIMADOR

•  Alguma propriedades importantes:

•  Vício

•  Consistência

•  Eficiência

Estatística Aplicada à Engenharia 38

VÍCIO

•  Vício de um estimador:

•  Um estimador é não viciado (não viesado, não tendencioso) para um parâmetro θ se

•  A esperança de um estimador está relacionada com sua exatidão

Estatística Aplicada à Engenharia 39

Vicio θ̂( ) = E θ̂ −θ( ) = E θ̂( )−θ;θ̂

E θ̂( ) =θ;

•  Exemplos: •  A média amostral é não viciada para estimar a média

populacional:

•  X1 (primeiro item coletado da amostra) é não viciado para estimar a média populacional:

Estatística Aplicada à Engenharia 40

( ) XnX µ=E

( ) XX µ=1E

VÍCIO

Page 11: DISTRIBUIÇÃO AMOSTRAL E ESTIMAÇÃO PONTUAL · DESCRITIVA INFERÊNCIA ESTATÍSTICA PROBABILIDADE População Amostra EXTRAÇÃO DE AMOSTRAS ALEATÓRIAS Estatística Aplicada à

Estatística Aplicada à Engenharia

Prof. Lupércio F. Bessegato - UFJF 11

•  A variância amostral

é não viciada para estimar a variância populacional (σ2)? Em outras palavras, verifique se

Estatística Aplicada à Engenharia 41

VÍCIO

E(S2 ) =σ 2.

S2 = 1n−1

Xi − X( )2

i=1

n

VARIÂNCIA DE ESTIMADOR

•  e estimadores não viciados para θ•  Variâncias diferentes

•  É mais provável que θ1 produza uma estimativa mais próxima de θ.

Estatística Aplicada à Engenharia 42

θ̂1 θ̂2

Var θ̂1( ) <Var θ̂2( )

ESTIMADOR DE VARIÂNCIA MÍNIMA

•  Se considerarmos todos os estimadores não tendenciosos para θ, aquele com a menor variância será chamado de estimador não tendencioso de variância mínima;

•  Esse estimador é o mais provável, dentre todos os não viciados, para produzir uma estimativa que seja mais próxima do valor verdadeiro.

Estatística Aplicada à Engenharia 43

ERRO-PADRÃO

•  O erro-padrão de um estimador é o seu desvio-padrão

•  O erro-padrão do estimador está relacionado com sua precisão;

Estatística Aplicada à Engenharia 44

θ̂

σθ̂= Var θ̂( );

Page 12: DISTRIBUIÇÃO AMOSTRAL E ESTIMAÇÃO PONTUAL · DESCRITIVA INFERÊNCIA ESTATÍSTICA PROBABILIDADE População Amostra EXTRAÇÃO DE AMOSTRAS ALEATÓRIAS Estatística Aplicada à

Estatística Aplicada à Engenharia

Prof. Lupércio F. Bessegato - UFJF 12

•  S e o e r r o - p a d r ã o e n v o l v e r p a r â m e t r o s desconhecidos que possam ser estimados, então a substituição daqueles valores produz um erro-padrão estimado •  O erro-padrão da média amostral será

•  Se não conhecermos σ, substituímos pelo desvio-padrão amostral. O erro-padrão estimado da média amostral será

Estatística Aplicada à Engenharia 45

ERRO-PADRÃO

σ X =σn;

σ̂ X =Sn;

•  Quando o estimador seguir uma distribuição normal, podemos estar confiantes que o valor verdadeiro do parâmetro estará entre dois erros-padrão da estimativa •  Esse resultado é muito útil para grandes valores de n

•  Nos casos em que o estimador é não viciado e não normalmente distribuído •  Estimativa do parâmetro desviará do valor verdadeiro em

mais de 4 erros-padrão no máximo 6% das vezes

Estatística Aplicada à Engenharia 46

ERRO-PADRÃO

•  Quadro comparativo:

Estatística Aplicada à Engenharia 47

PRECISÃO VS. EXATIDÃO

Definição: Um estimador é consistente se, à medida em que o tamanho amostral aumenta, seu valor esperado converge para o parâmetro de interesse e sua variância converge para zero.

Estatística Aplicada à Engenharia 48

θ̂

•  O estimador é consistente se

•  Consistência é uma propriedade assintótica (grandes amostras);

limn→∞

E θ̂( ) =θ e limn→∞

Var θ̂( ) = 0;

CONSISTÊNCIA

Page 13: DISTRIBUIÇÃO AMOSTRAL E ESTIMAÇÃO PONTUAL · DESCRITIVA INFERÊNCIA ESTATÍSTICA PROBABILIDADE População Amostra EXTRAÇÃO DE AMOSTRAS ALEATÓRIAS Estatística Aplicada à

Estatística Aplicada à Engenharia

Prof. Lupércio F. Bessegato - UFJF 13

•  Exemplos: •  A média amostral é consistente para estimar a média

populacional;

•  O primeiro item coletado da amostra não é consistente para estimar a média populacional.

Estatística Aplicada à Engenharia 49

CONSISTÊNCIA

•  O erro quadrático médio de um estimador para o parâmetro θ é definido como

•  EQM – Vício e erro-padrão

•  O EQM é um critério importante para comparar dois estimadores;

Estatística Aplicada à Engenharia 50

ERRO QUADRÁTICO MÉDIO

EQM θ̂( ) = E θ̂ −θ( )2;

θ̂

EQM θ̂( ) =Var θ̂( )+ Vicio θ̂( )⎡⎣

⎤⎦2;

•  Estimadores tendenciosos podem ser preferíveis a estimadores não viciados se tiverem um menor EQM;

•  Estimativa baseada em θ1 estaria provavelmente mais próxima do valor verdadeiro do que a baseada em θ2;

Estatística Aplicada à Engenharia 51

ERRO QUADRÁTICO MÉDIO

•  Estimador ótimo para θ: •  Tem EQM menor ou igual ao EQM de qualquer outro

estimador, para todos os valores de θ no espaço paramétrico;

•  Estimadores ótimos raramente existem;

Estatística Aplicada à Engenharia 52

ERRO QUADRÁTICO MÉDIO

Page 14: DISTRIBUIÇÃO AMOSTRAL E ESTIMAÇÃO PONTUAL · DESCRITIVA INFERÊNCIA ESTATÍSTICA PROBABILIDADE População Amostra EXTRAÇÃO DE AMOSTRAS ALEATÓRIAS Estatística Aplicada à

Estatística Aplicada à Engenharia

Prof. Lupércio F. Bessegato - UFJF 14

•  No caso em que é um estimador não viciado para um parâmetro θ, então

Estatística Aplicada à Engenharia 53

θ̂

EQM θ̂( ) =Var θ̂( ).

ERRO QUADRÁTICO MÉDIO EFICIÊNCIA

•  Dados dois estimadores e , não viciados para um parâmetro θ, dizemos que é mais eficiente que se

Estatística Aplicada à Engenharia 54

θ̂1 θ̂2θ̂1

θ̂2

Var θ̂1( ) <Var θ̂2( ).

•  Exemplo: •  No caso de amostra proveniente de distribuição Normal. •  Média amostral e mediana amostral são não viciadas para

estimar a média populacional:

•  Média amostral e mediana amostral são consistentes para estimar a média verdadeira:

•  A média amostral é mais eficiente que a mediana amostral para estimar a média populacional

Estatística Aplicada à Engenharia 55

E X( ) = µ e E !X( ) = µ;

EFICIÊNCIA

Var X( ) = σ2

n e Var !X( ) = π2

σ 2

n;

Var X( )Var !X( )

=σ 2

nπ2σ 2

n

=2π≈ 0,64 <1;

REFERÊNCIAS

Page 15: DISTRIBUIÇÃO AMOSTRAL E ESTIMAÇÃO PONTUAL · DESCRITIVA INFERÊNCIA ESTATÍSTICA PROBABILIDADE População Amostra EXTRAÇÃO DE AMOSTRAS ALEATÓRIAS Estatística Aplicada à

Estatística Aplicada à Engenharia

Prof. Lupércio F. Bessegato - UFJF 15

BIBLIOGRAFIA RECOMENDADA

•  Montgomery, D. C. (LTC) Estatística Aplicada e Probabilidade para Engenheiros

•  Pinheiro, J. I. D et al. (Campus) Probabilidade e Estatística: Quantificando a Incerteza

Estatística Aplicada à Engenharia 57