28
Prof. Dr. Levent ŞENYAY II- ĠSTATĠSTĠK II 1 HĠPOTEZ TESTLERĠ VE ARALIK TAHMĠNĠ (GÜVEN ARALIĞI) (konuların özeti) 1. Populasyon ortalaması( ) ve oranı (p)için 1.1 Büyük örneklerde n>30 ya da populasyon varyansı biliniyorsa 1.1.1 için 1.1.2 1 - 2 için ( bağımsız örnekler ) 1.1.3 p için 1.1.4 1 p - 2 p için 1.2 Küçük örneklerde n 30 ve populasyon varyansı 2 bilinmiyor 1.2.1 için 1.2.2 1 - 2 için eĢleĢtirilmiĢ gözlemlerde 1.2.3 1 - 2 için eĢleĢtirilmemiĢ gözlemlerde 2. Populasyon varyansı için 2.1 2 için 2.2 2 2 2 1 / için 3. Örnek büyüklüğünün tespiti 4. Testin Gücü

HİPOTEZ TESTLERİ VE ARALIK TAHMİNİ (GÜVEN ARALIĞI)

Embed Size (px)

Citation preview

Page 1: HİPOTEZ TESTLERİ VE ARALIK TAHMİNİ (GÜVEN ARALIĞI)

Prof. Dr. Levent ŞENYAY II- ĠSTATĠSTĠK II 1

HĠPOTEZ TESTLERĠ VE ARALIK TAHMĠNĠ (GÜVEN ARALIĞI)

(konuların özeti)

1. Populasyon ortalaması( ) ve oranı (p)için

1.1 Büyük örneklerde n>30 ya da populasyon varyansı biliniyorsa

1.1.1 için

1.1.2 1

- 2 için ( bağımsız örnekler )

1.1.3 p için

1.1.4 1p - 2p için

1.2 Küçük örneklerde n 30 ve populasyon varyansı 2 bilinmiyor

1.2.1 için

1.2.2 1

- 2 için eĢleĢtirilmiĢ gözlemlerde

1.2.3 1

- 2 için eĢleĢtirilmemiĢ gözlemlerde

2. Populasyon varyansı için

2.1 2 için

2.2 2

2

2

1 / için

3. Örnek büyüklüğünün tespiti

4. Testin Gücü

Page 2: HİPOTEZ TESTLERİ VE ARALIK TAHMİNİ (GÜVEN ARALIĞI)

Prof. Dr. Levent ŞENYAY II- ĠSTATĠSTĠK II 2

ĠSTATĠSTĠKSEL YORUMLAMA

Örnekten elde edilmiĢ istatistikler varken ,örnek özelliklerine dayanılarak

populasyon parametreleri hakkında genellemeler yapmak gerekir. Bu iĢleme istatistiksel

yorumlama denir.

Ġstatistiksel yorumlama iki tip problemden oluĢur.

1.Tahmin

2.Hipotez testi

Hipotez testi yapılırken örnek istatistiğine karĢılık gelen (değeri bilinmeye

çalıĢılan)populasyon parametresine uygun olup olmadığının saptanmasına çalıĢılır.

Bir istatistik yardımı ile parametre tahmini yapılırken mutlaka belli bir

seviyede belirsizlik olacaktır. Sınırlı fayda çalıĢılan örnek istatistiği ile populasyon

parametresi arasında bir fark oluĢur. Bu durumda tahmin yapılırken hata yapma riski ile

karĢı karĢıya kalınır.

Bir hipotez kurulduğunda, bir tahmini kullanabilmek için bu tahmine ne derece güvenle

bakıldığının bilinmesi gerekir. Diğer taraftan da hangi tür hatalar ile karĢı karĢıya

kalındığının bilinmesi gerekir.

Hipotez Test Sonucu

RED KABUL

I. tip hata Doğru karar

DOĞRU 1-

(önem seviyesi) (güven aralığı)

0H hipotezi

Doğru karar II. tip hata

YANLIġ 1-

(testin gücü) (testin zayıflığı)

0H doğru olduğu hallerde hipotezin red edilmesi olasılığı ( ) ne kadar küçük ise bu

tercih edilen bir durumdur.

Page 3: HİPOTEZ TESTLERİ VE ARALIK TAHMİNİ (GÜVEN ARALIĞI)

Prof. Dr. Levent ŞENYAY II- ĠSTATĠSTĠK II 3

BĠR HĠPOTEZ TESTĠNĠN AġAMALARI

1.Hipotez kurulur.0H ve

1H belirlenir.

Bu aĢamada testin tek veya çift yönlü olduğu belirlenir.

a)Çift yönlü hipotez testi

00 : H

01 : H

REDRED1-α

α/2α/2

b)Tek yönlü hipotez testi

0 0

1 0

:

:

H

H

RED1-αα

veya

0 0

1 0

:

:

H

H

RED 1-αα

2) I. tip hata ( ) belirlenir, ya uygun örnek hacminde belirlenir, ve yı

sınırlayan n bulunur

Page 4: HİPOTEZ TESTLERİ VE ARALIK TAHMİNİ (GÜVEN ARALIĞI)

Prof. Dr. Levent ŞENYAY II- ĠSTATĠSTĠK II 4

3)Test istatistiği belirlenir.

a)Populasyon ortalaması( ) ve populasyon oranı için(p) için

2 biliniyorsa Z istatistiği

2 bilinmiyor ve n30 ise Z istatistiği

2 bilinmiyor ve n 30 ise t istatistiği

b)Populasyon varyansı ( 2 ) için 2 istatistiği

c)Ġki populasyon varyansının karĢılaĢtırılması için F istatistiği kullanılır.

4)Kritik tablo değeri bulunur.

-Bu değer 3. adımda kullanılan test istatistiği ve onun dağılıĢına bağlıdır.

-Tablonun nasıl kullanılacağı,tablo üzerindeki Ģekile göre farklılık gösterebilir.

-1. aĢamada belirtilen alternatif hipotez testi

çift yönlü ise 2

tek yönlü ise değerleri kullanılır.

5)Örneğe iliĢkin test istatistiği hesaplanır.

6)Karar: Kritik tablo değeri ile hesaplanan test istatistiği karĢılaĢtırılır,hipotez hakkında

karar verilir ve sonuç yorumlanır.

Hesaplanan test istatistiği Kritik tablo değeri ise 0H red edilir

Hesaplanan test istatistiği Kritik tablo değeri ise 0H kabul edilir.(red edilmez)

Diğer bazı hipotez testleri;

:0H 0

klasik teori geçerli

:1H 0

:0H 0

klasik teori geçersiz

11 : H

00 : H

klasik test teorisi kullanılamaz.

11 : H (ardıĢık analizler)

Page 5: HİPOTEZ TESTLERİ VE ARALIK TAHMİNİ (GÜVEN ARALIĞI)

Prof. Dr. Levent ŞENYAY II- ĠSTATĠSTĠK II 5

1.1.1 BÜYÜK ÖRNEKLERDE POPULASYON ORTALAMASI ĠÇĠN

HĠPOTEZ TESTĠ ( 2 BĠLĠNĠYOR)

ÖRNEK : Bilye üreten bir iĢletmede bilyelerin ağırlıklarının ortalaması 5 gr, standart

sapması 0,1 gr olan bir normal dağılıma uymaktadır.ĠĢletmede belli bir değiĢiklik yapılmıĢ

ve bu değiĢikliğin bilye ağırlıklarını arttırdığı düĢünülmektedir.Bu amaçla üretimden 16

rassal örnek alınmıĢ ve bu örneğin ortalaması 5,038 gr bulunmuĢtur.Bu verilere

dayanılarak 0.05 önem seviyesinde populasyon ortalamasının 5 gr.dan artıp artmadığını

test ediniz.

H0: =5

H 1 : >5

05.0

Z =

n

X

0

x

z

1.52

Red

Bölgesi

Red Edememe

Bölgesi

1.645

0.4500 0.05

olduğu için

H 0 red edilemez!!

Page 6: HİPOTEZ TESTLERİ VE ARALIK TAHMİNİ (GÜVEN ARALIĞI)

Prof. Dr. Levent ŞENYAY II- ĠSTATĠSTĠK II 6

H0 hipotezinin red edilebileceği en küçük anlamlılık düzeyine, hipotezin olasılık

değeri(p) denir.

(p)

0

0.5

1.28 1.52 1.645

0.10 0.643 0.05

Z=

n

X

H0: 5 Ģeklinde belirlense de

H 1 : 5 için aynı karar kuralı geçerli olur.

0.064

3

Page 7: HİPOTEZ TESTLERİ VE ARALIK TAHMİNİ (GÜVEN ARALIĞI)

Prof. Dr. Levent ŞENYAY II- ĠSTATĠSTĠK II 7

GÜVEN ARALIĞI 1-

P( ZX X )=1-

1-

0

x

z

1.645

5.079

Gerçek populasyon ortalaması için 0,95 güven aralığı

Page 8: HİPOTEZ TESTLERİ VE ARALIK TAHMİNİ (GÜVEN ARALIĞI)

Prof. Dr. Levent ŞENYAY II- ĠSTATĠSTĠK II 8

Örnek: Bir cıvata üreten fabrikada, belli bir tezgahta ortalaması 2 mm ve standart

sapması 0.06 mm olan normal dağılıĢa uygun cıvata üretilmektedir. Tezgahın doğru çalıĢıp

çalıĢmadığını test etmek amacıyla 9 rassal örnek alınmıĢ ve ortalaması 1.95 mm

bulunmuĢtur. 0.05 önem seviyesinde tezgahın doğru çalıĢıp çalıĢmadığını test ediniz.

-1.96 1.96

Red Edememe Bölgesi

(Kabul Bölgesi)Red Bölgesi

Red Bölgesi

-2.50

z

x

0

Page 9: HİPOTEZ TESTLERİ VE ARALIK TAHMİNİ (GÜVEN ARALIĞI)

Prof. Dr. Levent ŞENYAY II- ĠSTATĠSTĠK II 9

95,01 Güven Aralığı

nZx

nZxP

22

-1.96 1.96

x

z

21.9108 1.9892

0

Page 10: HİPOTEZ TESTLERİ VE ARALIK TAHMİNİ (GÜVEN ARALIĞI)

Prof. Dr. Levent ŞENYAY II- ĠSTATĠSTĠK II 10

1.1.2 BÜYÜK ÖRNEKLEMDE ĠKĠ POPULASYON ARASINDAKĠ FARK

21 ĠÇĠN HĠPOTEZ TESTĠ VE GÜVEN ARALIĞI

(varyanslar biliniyor veya büyük örnek,bağımsız örnekler.)

Belli bir soruya verilen cevaplar ile ilgili bir araĢtırmada (ankette)verilen cevaplar

1=kesinlikle karĢıyım ile 5=kesinlikle katılıyorum arasında bir ölçekte değerlendirme

istenmiĢtir. AraĢtırmaya 186 erkek cevap vermiĢ,cevapların ortalaması 4,059 ve standart

sapması 0,839 bulunmuĢ,172 kadın katılmıĢ yanıt ortalaması 3,68 ,standart sapması ise

0,966 bulunmuĢtur.0,01 lik önem seviyesinde erkeklerin cevaplarının gerçek ortalamasının

kadınlarınkinden daha yüksek olup olmadığını test ediniz.

0

1

: 0

: 0

0.01

E K

E K

H

H

KE xx

KEKE

S

xxz

K

K

E

Exx

n

S

n

SS

KE

22

0

x

z

2.33

Red

Bölgesi

3.95

E-K=0

0.49

.

95,333,2 hZZ olduğu için 0H red

Var( )x(Var)x(Var)xx 2121

Page 11: HİPOTEZ TESTLERİ VE ARALIK TAHMİNİ (GÜVEN ARALIĞI)

Prof. Dr. Levent ŞENYAY II- ĠSTATĠSTĠK II 11

98,01 Güven aralığı

01,02

1

22KEKE xxKExxKE SzSzxxP

-2.33 2.33

x

z

20.1556 0.6024

1-

E-

K

0

Page 12: HİPOTEZ TESTLERİ VE ARALIK TAHMİNİ (GÜVEN ARALIĞI)

Prof. Dr. Levent ŞENYAY II- ĠSTATĠSTĠK II 12

1.1.3.BÜYÜK ÖRNEKLERDE POPULASYON ORANI (p) ĠÇĠN HĠPOTEZ

TESTĠ

( 2 BĠLĠNĠYOR VEYA n>30)

Bir süpermarkette 802 müĢterinin 378’i belli bir malı alıĢveriĢ arabasına koyduktan

hemen sonra doğru fiyatı söyleyebilmiĢtir.MüĢterilerin ancak (en az) yarısının doğru fiyatı

söyleyebileceği hipotezini 0,1 seviyesinde test ediniz.

H 0 = p 0,5 (veya p=p0 da olabilir)

H 1 = p< 0,5

=0,1 (p 00 , H doğru iken oran)

p

pp

ˆ

n

ppp

)1( 00ˆ

0-1.28

p

z

1-α

α=0.1

Page 13: HİPOTEZ TESTLERİ VE ARALIK TAHMİNİ (GÜVEN ARALIĞI)

Prof. Dr. Levent ŞENYAY II- ĠSTATĠSTĠK II 13

Açıklama:

Binom dağılıĢında x Ģans değiĢkeni için

E(x)=np

Var(x)=npq

n

xp

Var(p)=Var )(n

x= )(

1)(

122

npqn

xVarn

=n

pq

Page 14: HİPOTEZ TESTLERİ VE ARALIK TAHMİNİ (GÜVEN ARALIĞI)

Prof. Dr. Levent ŞENYAY II- ĠSTATĠSTĠK II 14

1- =0.90 Güven Aralığı

ˆ/ 2ˆ 1pP p p

-1.28

z

0.448

1-

0

pp

=0.1

Page 15: HİPOTEZ TESTLERİ VE ARALIK TAHMİNİ (GÜVEN ARALIĞI)

Prof. Dr. Levent ŞENYAY II- ĠSTATĠSTĠK II 15

1.1.4 BÜYÜK ÖRNEKLERDE ĠKĠ POPULASYON ORANI ARASINDAKĠ

FARK (p1-p2) ĠÇĠN HĠPOTEZ TESTĠ

( 2 BĠLĠNĠYOR VEYA n>30)

Tesadüfi olarak seçilen 203 Ġngiliz ticari dergi reklamından 52’sinde gülme unsuru

varken,270 Amerikan ticari dergi reklamından 56’sında gülme unsuru iĢlenmektedir. Tüm

Ġngiliz ve Amerikan ticari dergi reklamlarında gülme unsuru iĢlenme oranlarının aynı olup

olmadığının testi için kritik değeri bulun ve buna karĢılık gelen 0H red olasılığının limit

değerini hesaplayınız.

0:

0:

1

0

yx

yx

ppH

ppH

0

56 56ˆ 0.228

203 270

x y

x x y y x y

x y x y x y

x yn n

n p n p n n x yp

n n n n n n

2 2 2

ˆ ˆ ˆ ˆ

ˆ ˆˆ ˆx y x y

y yx xp p p p

x y

p qp q

n n

0H doğru iken 0p̂pp yx olacağına göre

2

ˆ ˆ

ˆ ˆ ˆ ˆ 1 1ˆ ˆ ˆ ˆ

x y

x y

p p

x y x y x y

n npq pqpq pq

n n n n n n

olur.

yx

yxyx

x

nnqp

pppp

11ˆˆ

ˆˆ

00

Page 16: HİPOTEZ TESTLERİ VE ARALIK TAHMİNİ (GÜVEN ARALIĞI)

Prof. Dr. Levent ŞENYAY II- ĠSTATĠSTĠK II 16

-1.26 1.26

z

0

0.3962

px-py

Page 17: HİPOTEZ TESTLERİ VE ARALIK TAHMİNİ (GÜVEN ARALIĞI)

Prof. Dr. Levent ŞENYAY II- ĠSTATĠSTĠK II 17

1- 90.0 Güven Aralığı

P 1ˆˆˆˆˆˆ2/ˆˆ2/ yxyx ppyxyxppyx pppppp

-1.645 1.645

z

1-

0

px-py-0.0148 0.1128

px-py

Page 18: HİPOTEZ TESTLERİ VE ARALIK TAHMİNİ (GÜVEN ARALIĞI)

Prof. Dr. Levent ŞENYAY II- ĠSTATĠSTĠK II 18

1.2.1 KÜÇÜK ÖRNEKLERDE POPULASYON ORTALAMASI ĠÇĠN

HĠPOTEZ TESTĠ( 2 bilinmiyor, ve n < 30)

Bir mağaza zincirinde Aralık ayı satıĢlarının Kasım ayı satıĢlarından 0,20 daha fazla

olduğu bilinmektedir. Bu amaçla 6 ayrı mağazadaki Aralık ayı satıĢ artıĢ yüzdeleri

alınmıĢtır. Bu verilere gör, populasyon dağılımının normal olduğu varsayımı altında Aralık

ayı satıĢ ortalamalarındaki gerçek artıĢın 0,20 olduğu hipotezini 0,1 anlamlılık düzeyinde

test ediniz.

Mağaza No

6 ayrı mağazadaki

Kasım–Aralık SatıĢ ArtıĢ %si

x

2

ix

1 19,2 368,64

2 18,4 338,56

3 19,8 392,04

4 20,2 408,04

5 20,4 416,16

6 19,00 361,00

Toplam 117 2,284,44

20: 00 H

20:1 H

1,0

nS

x

S

xt

x

n

1,

5,196

117

n

xx

Page 19: HİPOTEZ TESTLERİ VE ARALIK TAHMİNİ (GÜVEN ARALIĞI)

Prof. Dr. Levent ŞENYAY II- ĠSTATĠSTĠK II 19

-2.015 2.015

1-

0

-0.0148 0.1128

t /2,n-1

x

Page 20: HİPOTEZ TESTLERİ VE ARALIK TAHMİNİ (GÜVEN ARALIĞI)

Prof. Dr. Levent ŞENYAY II- ĠSTATĠSTĠK II 20

99,01 Güven Aralığı

1

1,2

1,2

xnxnStxStxP

-2.015 2.015

x

1-

0

18.82 20.17

t /2,n-1

Page 21: HİPOTEZ TESTLERİ VE ARALIK TAHMİNİ (GÜVEN ARALIĞI)

Prof. Dr. Levent ŞENYAY II- ĠSTATĠSTĠK II 21

1.2.2 KÜÇÜK ÖRNEKLERDE ĠKĠ POPULASYON ORTALAMASI

ARASINDAKI FARK )( 21 ĠÇĠN HĠPOTEZ TESTĠ : EġLEġTĠRĠLMĠġ

BAĞIMLI GÖZLEMLER bilinmiyor2( ve )30n

Ġki ayrı TV program kuĢağında 10 ayrı reklam kiĢilere izlettirilmiĢ ve 24 saat sonra, iki

ayrı kuĢaktaki reklamlardan hatırlanma indeksleri elde edilmiĢtir.

Ürün Sabah

KuĢağı

AkĢam

KuĢağı id 2

id

1 137 53 84 7,056

2 135 114 21 441

3 83 81 2 4

4 125 86 39 1,521

5 47 34 13 169

6 46 66 -20 400

7 114 89 25 625

8 157 113 44 1,936

9 57 88 -31 961

10 144 111 23 1,089

Toplam 210 14,202

Ġki ayrı kuĢakta izlenen reklamların hatırlanması indeksleri karĢılaĢtırıldığında sabah

kuĢağının hatırlanması indeksinin daha yüksek olup olmadığını 05,0 seviyesinde test

ediniz.

00 0: DH aB

0:1 aBH

d

nS

Ddt 0

1,

2110

210

n

dd

i

n

SS d

d

2

2

Page 22: HİPOTEZ TESTLERİ VE ARALIK TAHMİNİ (GÜVEN ARALIĞI)

Prof. Dr. Levent ŞENYAY II- ĠSTATĠSTĠK II 22

0 1.833

d

t ,n-1

Page 23: HİPOTEZ TESTLERİ VE ARALIK TAHMİNİ (GÜVEN ARALIĞI)

Prof. Dr. Levent ŞENYAY II- ĠSTATĠSTĠK II 23

Açıklama :

Eğer gözlemler bağımlı ise ;

2

,

222

212121

2xxxxxx

n

xxCov

nn

xx 21

2

2

1

2,

221

222

21 xx ve nnn 21 ise

n

xxCov

nn

21

22 ,2

n

xxCov

n

21

2 ,22

olur.

Page 24: HİPOTEZ TESTLERİ VE ARALIK TAHMİNİ (GÜVEN ARALIĞI)

Prof. Dr. Levent ŞENYAY II- ĠSTATĠSTĠK II 24

90,01 Güven Aralığı

1**

1,2

1,2 agag xxnagagxxnag StxxStxxP

-1.833 1.833

1-

0

1.869 40.13D0

d

t /2,n-1

Page 25: HİPOTEZ TESTLERİ VE ARALIK TAHMİNİ (GÜVEN ARALIĞI)

Prof. Dr. Levent ŞENYAY II- ĠSTATĠSTĠK II 25

1.2.3 KÜÇÜK ÖRNEKLERDE ĠKĠ POPULASYON ORTALAMASI

ARASINDAKĠ FARK )( 21 ĠÇĠN HĠPOTEZ TESTĠ:

EĢleĢtirilmemiĢ (bağımsız) gözlemler ( varyanslar eĢit, 2 bilinmiyor ve n 30 )

Belli bir kuĢ cinsinde erkek ve diĢi ağırlıklarının eĢit olup olmadığı araĢtırılmaktadır.

AĢağıdaki verilere göre bu hipotezi 0.05 seviyesinde test ediniz.

Örnek hacmi(n) ortalama( x ) varyans( 2 )

Erkek 10 90.80 55.2

DiĢi 9 81.52 66.2

H0: 1 - 2 = 0

H 1 : 1 - 2 0

= 0.05

2

)1()1(

)11

(

)()(

21

2

22

2

112

21

22

2121

21

21

nn

SnSnS

nnSS

S

xxt

xx

xx

( 22

2

2

1 SSS varsayımı ile )

0

x1-x2

-2,110 2,110

t /2,n1+n 2-1

Page 26: HİPOTEZ TESTLERİ VE ARALIK TAHMİNİ (GÜVEN ARALIĞI)

Prof. Dr. Levent ŞENYAY II- ĠSTATĠSTĠK II 26

Açıklama.:

22

2

2

1 değil ise

2

2

2

1

2

1

21_

n

S

n

Sxx olur.

tt

n

S

n

S

xxt

2

2

2

1

2

1

2121 )()( dağılıĢı gösterir.

2

2

2

1

2

1

1,

2

2

21,

1

2

1

21

221121

**

n

s

n

s

tn

st

n

S

ww

twtwt

nn

t

olur.

Eğer 1n = nn 2 ise

1,

2

2

1

2

2

2

1

1,

2

2

2

1

1,

2

21,

2

1

)(1

)(

nt

n

nn

t

tt

ssn

ssn

t

n

s

n

s

tn

st

n

s

t

dağılıĢı gösterdiği görülür.

Page 27: HİPOTEZ TESTLERİ VE ARALIK TAHMİNİ (GÜVEN ARALIĞI)

Prof. Dr. Levent ŞENYAY II- ĠSTATĠSTĠK II 27

95.01 GÜVEN ARALIĞI

1)()(

2121 1,2

21211,

2

21 xxn

xxn

stxxstxxP

0

x1-x2

-2,110 2,110

1.7473 16.81271-

2

t /2,n1+n 2-2

Page 28: HİPOTEZ TESTLERİ VE ARALIK TAHMİNİ (GÜVEN ARALIĞI)

Prof. Dr. Levent ŞENYAY II- ĠSTATĠSTĠK II 28