Capítulo III-Introdução à Inferência Estatística .A Probabilidade e a Inferência Estatística

  • View
    215

  • Download
    0

Embed Size (px)

Text of Capítulo III-Introdução à Inferência Estatística .A Probabilidade e a Inferência Estatística

Captulo III-Introduo Inferncia Estatstica

A Probabilidade e a Inferncia Estatstica.A amostragem. Principais Distribuies por AmostragemTpicos de Estimao e de Inferncia

estimao pontualestimao por intervalostestes de hipteses

156 / 220

A Probabilidade e a Inferncia Estatstica

Comemos esta unidade curricular pelo estudo descritivo de umaamostra. Passmos depois pela Introduo Teoria daProbabilidade com o estudo de alguns dos modelos de probabilidade(discretos e contnuos).

Veremos agora como utilizar todo esse conhecimento na InfernciaEstatstica. A Inferncia Estatstica ... aquilo que permite o saltoque vai da amostra para a populao (Pestana e Velosa, 2008).

157 / 220

A Probabilidade e a Inferncia Estatstica

Mas ... sem conhecimento da probabilidade no possvel avanar nainferncia estatstica. Apenas para breve orientao podemos dizerque:

na probabilidade temos o modelo da populao que nos permitecalcular a probabilidade de certos acontecimentos;na inferncia estatstica parte-se da amostra e pretende-se obterinformao sobre o modelo ou sobre caractersticas dapopulao.

158 / 220

Conceitos em Inferncia Estatstica

A Inferncia Estatstica pretende responder a dois grandesproblemas:

calcular valores aproximados (estimativas) e obter intervalos deconfiana para parmetros desconhecidos da populao.formular hipteses e verificar se h concordncia entre o que sesupe e os factos testes de hipteses

Conceitos bsicos:Populao conjunto completo de todas os objectos (elementos)com uma (ou mais) caracterstica(s) comuns;Unidade Estatstica cada elemento da populao;Amostra conjunto dos valores efectivamente observados;Parmetro de uma populao constante desconhecida, cujoverdadeiro valor se pretende estimar ou validar.

159 / 220

Introduo Teoria da Amostragem

Amostragem procedimento de recolha de elementos da populaopara obter uma amostra.

De uma dada populao podemos retirar muitas amostras:Amostra 1

Amostra 2

. . .

Amostra k

. . .

Mas quase sempre recolhemos s uma amostra paraestudarmos uma caracterstica X da populao.

Seja (x1, x2, , xn) uma amostra de n observaes dacaracterstica, obtidas aps um processo de amostragem.

160 / 220

Introduo Teoria da Amostragem

Vamos considerar a amostra (x1, x2, , xn) como uma realizaode n variveis (X1,X2, ,Xn) que so cpias da varivel X

Recapitulando:Antes da amostragem ser realizada temos n variveis aleatrias(X1,X2, ...,Xn)Depois de efectuada a amostragem temos um conjunto de dadosque constituem a amostra observada (x1, ..., xn).

Definio de amostra aleatriaChama-se amostra aleatria de dimenso n a um conjunto de n va-riveis aleatrias (X1,X2, ...,Xn) independentes e semelhantes, i.e.,tendo todas a mesma distribuio que a da caracterstica X em es-tudo na populao.

161 / 220

Tpicos de Estimao

Quais os parmetros desconhecidos da populao que nos vointeressar e que procedimentos usar para os estimar?

Os procedimentos so mtodos adequados (queremos os melhores)para estimar os parmetros desconhecidos.Em Estatstica, esses mtodos consistem na obteno de variveisaleatrias especiais, chamadas estimadores.

Definio de estimadorChama-se estimador de um parmetro a uma funo da amostra ale-atria (X1,X2, ...,Xn), que permite obter um valor para o parmetrodesconhecido (esta funo no possui quantidades desconhecidas).

NOTA: No iremos referir procedimentos para obter estimadores

162 / 220

Tpicos de Estimao

Um estimador ento uma varivel aleatria que ter portanto umadada distribuio (pelo menos aproximadamente).

O valor que o estimador (varivel aleatria) toma quando se observa aamostra chama-se estimativa.

Definio de estimativaEstimativa de um parmetro um valor concreto assumido pelo esti-mador.

Dada a amostra aleatria, (X1,X2, ...,Xn), i.e., v.a. i.i.d. a X , vamosver os parmetros que nos vo interessar, os seus estimadores eestimativas

163 / 220

Tpicos de Estimao

Parmetro(s) a estimar Estimador(es) Estimativa(s)

X =n

i=1 Xin x =

ni=1 xin

2 S2 =n

i=1(XiX)2n1 s

2 =n

i=1(xix)2n1

p P = Xn(a)

p = xn(b)

1 ?? 2 X1 ?? X2 x1 ?? x2

21 ?? 22 S

21 ?? S

22 s

21 ?? s

22

p1 ?? p2 P1 ?? P2 p1 ?? p2

(a)X - v.a. que conta o nmero de sucessos na amostra de dimenso n(b)x - nmero observado de sucessos na amostra de dimenso n.?? significa que teremos que escolher a melhor operao para fazer a comparao

164 / 220

Propriedades dos estimadores - s uma nota

Seja X a v.a. (populao) em estudo e um parmetro desconhecido.

1. Estimador centradoO estimador T = T (X1,X2, ,Xn) do parmetro diz-secentrado ou no enviesado se E[T ] = .

De entre os estimadores centrados, a situao desejvel oestimador ter varincia mnima.

Diz-se ento que temos o estimador mais eficiente.

165 / 220

Propriedades dos estimadores - s uma nota

Na verdade a propriedade de um estimador ser centrado umapropriedade que muitos estimadores no possuem e da ter maisinteresse definir uma medida da diferena entre o estimador e oparmetro que ele pretende estimar.

o chamado vis (ou em ingls bias) que representaremos porb(T ) e se define como

b(T ) = E[T ]

166 / 220

Tpicos de Estimao

Suponhamos que temos uma amostra

Como inferir valores de interesse para a populao?

Estimao dos parmetrosEstimao pontualEstimao intervalar intervalos de confiana

Testes de hipteses estatsticas.

Estimao pontual indicar um nico valor como estimativa.Exemplos de estimativas: x , s2, p, .

Estimao por intervalos neste caso calcula-se um intervalo (alea-trio) que com uma probabilidade elevada contenha o verdadeiro valordo parmetro.

167 / 220

Estimao por intervalos

Para a construo do intervalo necessrio conhecer adistribuio - exacta ou aproximada - do estimador (ou qualquerexpresso dele)

Definio de intervalo de confianaChama-se intervalo de confiana ao intervalo que resulta da concre-tizao do intervalo (aleatrio) e portanto um intervalo (a, b), onde ae b so nmeros reais e a < b.

Relembre-se que para obter o intervalo de confiana entonecessrio conhecer a lei do estimador do parmetro desconhecido.

168 / 220

Intervalos de confiana

Comecemos ento por ver como se construiria um intervalo deconfiana para , (valor mdio de uma caracterstica X .)

Precisamos de procurar a distribuio do estimador de XSeja X v.a. c/ dist. Normal, i.e., X _ N (, )Para uma amostra de dimenso n tem-se X n _ N (, /

n)

Ento . . .

169 / 220

Intervalos de confiana

Seja X v.a. c/ dist. Normal , i.e., X _ N (, )

Se conhecido considera-seX /

n_ N (0, 1)

Intervalo de confiana a (1 ) 100% para

x z/2

n< < x + z/2

n

(z/2 valor da v.a. Z tal que P(Z > z/2) = /2)

Observaes: Chama-se preciso da estimativa semi-amplitude do intervalo deconfiana e confiana ou grau de confiana a (1 ) 100%Quanto maior for o intervalo, maior o grau de confiana, mas menor a preciso daestimativa.

170 / 220

Exerccio 1

Um mtodo utilizado na determinao do pH de uma dada soluofornece medies que se admite terem distribuio normal de valormdio igual ao verdadeiro valor do pH da soluo e desvio padro de0.02.Para avaliar o pH de uma soluo, efectuaram-se 10 mediesindependentes tendo-se obtido os seguintes valores:

8.18 8.16 8.17 8.22 8.19 8.17 8.15 8.21 8.16 8.18

a) Indique uma estimativa do valor mdio do pH da soluo.b) Com base nestas 10 medies, determine um intervalo a 95% de

confiana para o valor mdio do pH da soluo.c) Para um certo processo quimico muito importante que uma

dada soluo tenha um pH de exactamente 8.20. Com base noresultado da alnea anterior, o que pode concluir relativamente utilizao desta soluo no referido processo qumico?

171 / 220

Distribuies por amostragem

A determinao de intervalos de confiana para os parmetros , 2,p, 1 2, 21/22 e p1 p2, necessita do conhecimento dadistribuio dos estimadores envolvidos distribuies poramostragem

So distribuies de funes da amostra aleatria (X1,X2, ,Xn),que vamos usar para obter Intervalos de Confiana

J vimos

Se X _ N (, ) e conhecido usamos X/

n_ N (0, 1)

para construir um I.C. para o valor mdio, .

172 / 220

Distribuies por amostragem

Mas na maior parte das situaes no conhecemos a varincia.Ento neste caso j no possvel obter um I.C. para , pois oslimites do intervalo dependem de , desconhecido.

Vamos ento referir brevemente alguns resultados importantes, quenos permitem definir distribuies que precisamos de utilizar agora

173 / 220

Resultados (distribuies) importantes

TeoremaSejam Xi (i = 1, . . . ,n) v.a. independentes com distribuio N (, ).Ento:(

Xi

)2_ 2(1),

que se designa distribuio qui-quadrado com 1 grau deliberdade.n

i=1

(Xi

)2_ 2(n).

Aplicao distribuio da varincia numa populao normalSejam Xi (i = 1, . . . ,n) v.a. independentes com distribuio N (, ).

(n 1)S2

2_ 2(n1) S

2 =

ni=1(Xi X )

2

n 1

174 / 220

Grficos da funo densidade de uma v.a. comdistribuio 2

0 5 10 15

0.0

0.2

0.4

0.6

f. densidade da Quiquadrado(n=4)

x

0 5 10 15

0.0

0.1

0.2

0.3

0.4

f. densidade da Quiquadrado(n=10)

x