21
Inferência Para Duas Populações VÍCTOR HUGO LACHOS DÁVILA ME320

Inferência Para Duas Populações - ime.unicamp.brhlachos/Inferencia_Hipo2ME320.pdf · circuito integrado. I: 35 35 37 33 31 33 II: 32 34 34 31 32 Há evidência para se afirmar

Embed Size (px)

Citation preview

Page 1: Inferência Para Duas Populações - ime.unicamp.brhlachos/Inferencia_Hipo2ME320.pdf · circuito integrado. I: 35 35 37 33 31 33 II: 32 34 34 31 32 Há evidência para se afirmar

Inferência Para Duas Populações

VÍCTOR HUGO LACHOS DÁVILA

ME320

Page 2: Inferência Para Duas Populações - ime.unicamp.brhlachos/Inferencia_Hipo2ME320.pdf · circuito integrado. I: 35 35 37 33 31 33 II: 32 34 34 31 32 Há evidência para se afirmar

2

nXX ,,1 mYY ,,1

nNX

2

11 ,~

mNY m

2

2 ,~

População 1 População 2

mnNYX

2

2

2

121 ,~

Inferência Para Duas Amostras

Page 3: Inferência Para Duas Populações - ime.unicamp.brhlachos/Inferencia_Hipo2ME320.pdf · circuito integrado. I: 35 35 37 33 31 33 II: 32 34 34 31 32 Há evidência para se afirmar

3

Suponha que X1,,Xn é uma amostral aleatória de tamanho n

de uma população com característica X, que tem distribuição

normal com média 1 e variância 2

1 . Considere que Y1,,Ym é

uma amostra aleatória de tamanho m, de uma população

com característica Y que tem distribuição normal com média

2 e variância 2

2 , alem disso, X e Y são independentes.

Suponha que tem-se interesse em verificar se existe ou não uma

diferença significativa entre as médias populacionais 1 e 2. O

procedimento básico de teste, neste caso é a seguinte:

BilateralDireitoUEsquerdoU

HHH

HouHouH

i

211

.

211

.

211

21000210

:::

:)(:)(:

)(

onde é constante conhecida no caso =0, temos teste de hipóteses para a igualdade de 2 médias populacionais

Teste de hipóteses e intervalo de confiança para 21

Page 4: Inferência Para Duas Populações - ime.unicamp.brhlachos/Inferencia_Hipo2ME320.pdf · circuito integrado. I: 35 35 37 33 31 33 II: 32 34 34 31 32 Há evidência para se afirmar

4

(ii) A estatística de teste

(a) Quando 2

2

2

1, e são conhecidos

)1,0(~02

2

2

1

N

mn

YXZ

Hsob

(b) Quando 22

2

2

1 desconhecidos

)2(11

~0

2

mnt

mnS

YXT

Hsob

p

2

)1()1( 2

2

2

12

mn

SmSnS

p onde

Page 5: Inferência Para Duas Populações - ime.unicamp.brhlachos/Inferencia_Hipo2ME320.pdf · circuito integrado. I: 35 35 37 33 31 33 II: 32 34 34 31 32 Há evidência para se afirmar

5

Exemplo 1: Estuda-se o conteúdo de nicotina de duas marcas de

cigarros (A e B), obtendo-se os seguintes resultados.

A: 17; 20; 23; 20

B: 18; 20; 21; 22; 24

Admitindo que o conteúdo de nicotinas das duas marcas tem

distribuição normal e que as variâncias populacionais são iguais,

com =0,05, pode-se afirmar que existe alguma diferença

significativa no conteúdo médio de nicotina nas duas marcas?

Sejam X: O conteúdo de nicotina da marca A

Y: : O conteúdo de nicotina da marca B

),(~ 2

11NX

),(~ 2

22NY

Nosso interesse é testar as seguintes hipóteses:

211

210

:

:

H

H

0:

0:

211

210

H

H

(i)

Page 6: Inferência Para Duas Populações - ime.unicamp.brhlachos/Inferencia_Hipo2ME320.pdf · circuito integrado. I: 35 35 37 33 31 33 II: 32 34 34 31 32 Há evidência para se afirmar

6

BA

24

23

22

21

20

19

18

17

Marca

Con

teúd

o N

icot

ina

Boxplots do Conteúdo de Nicotina por Marca

521,5

620,42

2

2

1

SYm

SXn

A estatística de teste é dada por:

)2(11

~0

2

mnt

mnS

YXT

Hsob

p

(ii)

Page 7: Inferência Para Duas Populações - ime.unicamp.brhlachos/Inferencia_Hipo2ME320.pdf · circuito integrado. I: 35 35 37 33 31 33 II: 32 34 34 31 32 Há evidência para se afirmar

7

(iii) A região crítica, para =0,05, (parte achurada) representa os

valores correspondente da distribuição t-Student com n+m-

2=4+5-2=7 graus de liberdade com mostra a figura

365,2||);7( TttRc

Page 8: Inferência Para Duas Populações - ime.unicamp.brhlachos/Inferencia_Hipo2ME320.pdf · circuito integrado. I: 35 35 37 33 31 33 II: 32 34 34 31 32 Há evidência para se afirmar

8

(iv) Dos dados do exemplo temos:

7

38

254

5)15()6)(14(

2

)1()1( 2

2

2

12

mn

SmSnS

p

Daí temos, que estatística observada ou calculada é:

641,0

5

1

4

1

7

38

2120

112

mnS

YXT

p

obs

0Hrejeitar para amostrais evidencias existe Não Como RcTobs

Page 9: Inferência Para Duas Populações - ime.unicamp.brhlachos/Inferencia_Hipo2ME320.pdf · circuito integrado. I: 35 35 37 33 31 33 II: 32 34 34 31 32 Há evidência para se afirmar

9

Suponha que X1,,Xn é uma a. a. de tamanho n de uma

população com característica X ~N(1, 2

1 ). Considere que

Y1,,Ym é uma a.a. de tamanho m, de uma população com

característica Y~ N(2, 2

2 ). Se X e Y são independentes então

a v.a.

2

1

2

2

2

2

2

1

S

SF

(3)

Tem distribuição F-Snedecor com n-1 (numerador) e m-1

(denominador) graus de liberdade.

Teste de hipóteses para a igualdade de variâncias

A distribuição F-Snedecor

Page 10: Inferência Para Duas Populações - ime.unicamp.brhlachos/Inferencia_Hipo2ME320.pdf · circuito integrado. I: 35 35 37 33 31 33 II: 32 34 34 31 32 Há evidência para se afirmar

10

A função de densidade de um v.a F-Snedecor com u e v graus

de liberdade é dado por:.

0;

122

/2

)(2/)(

2

12/2/

t

k

tvu

tvuvu

tfvu

uu

),(~ :Notação vuFT

.4,)4()2(

)2(2)(;2,

2)(

2

2

v

vvu

vuvTVarv

v

vTE

Page 11: Inferência Para Duas Populações - ime.unicamp.brhlachos/Inferencia_Hipo2ME320.pdf · circuito integrado. I: 35 35 37 33 31 33 II: 32 34 34 31 32 Há evidência para se afirmar

11

Suponha que temos amostras aleatórias de duas populações

normais independentes, isto é, ),(~),(~ 2

22

2

11 NYeNX . Temos

interesse em verificar se as variâncias populacionais são

homogêneas ou heterogêneas.

Nosso interesse é testar as hipóteses seguintes:

22

1

22

0

21

21

:

:

H

H

(ii) A estatística de teste

)1,1(~2

2

2

1 mnFS

SF

oHsob

(i)

Page 12: Inferência Para Duas Populações - ime.unicamp.brhlachos/Inferencia_Hipo2ME320.pdf · circuito integrado. I: 35 35 37 33 31 33 II: 32 34 34 31 32 Há evidência para se afirmar

12

(iii) A região crítica, para fixado é mostrado na figura.

1,1,2/11,1,2/ mnmnc fFoufFR

(iv) Se a ETobs RC., rejeita-se Ho em caso contrário não se rejeita H0.

Page 13: Inferência Para Duas Populações - ime.unicamp.brhlachos/Inferencia_Hipo2ME320.pdf · circuito integrado. I: 35 35 37 33 31 33 II: 32 34 34 31 32 Há evidência para se afirmar

13

Exemplo: A tabela seguinte sintetiza medidas de corrente elétrica (em mA) obtidas por dois engenheiros na análise de placas de circuito integrado. I: 35 35 37 33 31 33 II: 32 34 34 31 32 Há evidência para se afirmar que as medidas possuem a mesma variância?

Engenheiro Média Mediana Desvio

Padrão

I 34,00 34,00 2,098

II 32,25 32,00 1,258

Page 14: Inferência Para Duas Populações - ime.unicamp.brhlachos/Inferencia_Hipo2ME320.pdf · circuito integrado. I: 35 35 37 33 31 33 II: 32 34 34 31 32 Há evidência para se afirmar

14

III

37

36

35

34

33

32

31

Eng

corr

ente

Boxplots of corrente by Eng

Page 15: Inferência Para Duas Populações - ime.unicamp.brhlachos/Inferencia_Hipo2ME320.pdf · circuito integrado. I: 35 35 37 33 31 33 II: 32 34 34 31 32 Há evidência para se afirmar

15

Sejam X: Medição do Eng. I

Y: Medição do Eng. II

),(~ 2

11NX

),(~ 2

22NY

Nosso interesse é provar as seguintes hipóteses:

22

1

22

0

21

21

:

:

H

H

(ii) A estatística de teste

onde n=6, e m=5

)1,1(~2

2

2

1 mnFS

SF

oHsob

Page 16: Inferência Para Duas Populações - ime.unicamp.brhlachos/Inferencia_Hipo2ME320.pdf · circuito integrado. I: 35 35 37 33 31 33 II: 32 34 34 31 32 Há evidência para se afirmar

16

(iii) Os valores críticos, para =0,10 são

193,019,5

1126,6

5,4,05,0

4,5,05,04,5,95,0 f

fef

26,6193,0 FouFRc

A região crítica é dado por

(iv) A estatística calculada é

2,7811,258

2,098 2

2

2

2

1

S

SFcal

0 para evidencias ,, HrejeitarexistemnãoentãoRFqueDesde ccal

Page 17: Inferência Para Duas Populações - ime.unicamp.brhlachos/Inferencia_Hipo2ME320.pdf · circuito integrado. I: 35 35 37 33 31 33 II: 32 34 34 31 32 Há evidência para se afirmar

17

nXX ,,1 mYY ,,1

n

pppNp

)1(,~ˆ 11

11

2

)1(,~ˆ 22

22

pppNp

m

pp

n

ppppNpp

)1()1(,~ˆˆ 2211

2121

Page 18: Inferência Para Duas Populações - ime.unicamp.brhlachos/Inferencia_Hipo2ME320.pdf · circuito integrado. I: 35 35 37 33 31 33 II: 32 34 34 31 32 Há evidência para se afirmar

18

Suponha que tem-se duas amostras independentes de tamanhos n

e m suficientemente grandes (n>30 e m>30), de duas populações

Bernoulli, com probabilidades de sucessos p1 e p2 respectivamente.

E sejam X: o número de sucessos na amostra de tamanho n e Y: o

número de sucessos na amostra de tamanho m. Portanto, X~B(n,p1

e Y~ B(m,p2). Há interesse em verificar as seguintes hipóteses

estatística:

Teste de hipóteses para 21

pp

BilateralDireitoUEsquerdoU

ppHppHppH

ppHpouppHpouppH

i

211

.

211

.

211

21022102210

:::

:)(:)(:

)(

(ii) A estatística de teste

)1,0(~11

)1(

ˆˆ0

21 N

mnpp

ppZ

HSob

Page 19: Inferência Para Duas Populações - ime.unicamp.brhlachos/Inferencia_Hipo2ME320.pdf · circuito integrado. I: 35 35 37 33 31 33 II: 32 34 34 31 32 Há evidência para se afirmar

19

mn

pmpn

mn

yxp;

m

yp,

n

xp

21

21

ˆˆˆˆ onde

Os passos (iii) e (iv) são equivalentes ao procedimento de teste

para uma média populacional.

Exemplo 3: Dois tipos de solução de polimento estão sendo avaliados para possível uso em uma operação de polimento na fabricação de lentes intra-oculares usadas no olho humano depois de uma operação de catarata. Trezentas lentes foram polidas usando a primeira solução de polimento e, desse número 253 não tiveram defeitos induzidos pelo polimento. Outras 300 lentes foram polidas, usando a segunda solução de polimento sendo 196 lentes consideradas satisfatórios. Há qualquer razão para acreditar que as duas soluções diferem? Use =0,01.

Page 20: Inferência Para Duas Populações - ime.unicamp.brhlachos/Inferencia_Hipo2ME320.pdf · circuito integrado. I: 35 35 37 33 31 33 II: 32 34 34 31 32 Há evidência para se afirmar

20

X= lente não defeituoso com a 1ª solução, X~Bernoulli(p1)

Y: lentes não defeituoso com a 2ª solução Y~Bernoulli(p2).

211

210

:

:

ppH

ppH

)1,0(~11

)1(

ˆˆ0

21 N

mnpp

ppZ

HSob

(ii) A estatística de teste

Nosso interesse é testar as seguintes hipóteses:

Page 21: Inferência Para Duas Populações - ime.unicamp.brhlachos/Inferencia_Hipo2ME320.pdf · circuito integrado. I: 35 35 37 33 31 33 II: 32 34 34 31 32 Há evidência para se afirmar

21

(iii) A região crítica, para =0,01, (parte achurada) representa os

valores correspondente da distribuição norma padrão com

mostra a figura

58,2||; ZZtRc

(iv) Dos dados do exemplo temos:

7483,0300

196253;300;

300

196ˆ;8433,0

300

253ˆ

21

pmnpp

36,5

300

1

300

1)2517,0(7483,0

6533,08433,0

11)1(

ˆˆ21

mnpp

ppZ

obs

0H se-rejeita Como RcZ

obs