38
HATALARDA NORMAL DAĞILIM •EKK tahmincilerinin olasılık dağılımları u i ’nin olasılık dağılımı hakkında yapılan varsayıma bağlıdır. tahminleri için uygulanan testlerin geçerliliği u i ’nin normal dağılmasına bağlıdır. Çünkü u i normal dağılıyorsa, EKK b 1 ve b 2 ’nin tahmincileri de normal dağılır. • Normal dağılmış değişkenleri olan bir doğrusal fonksiyonun kendisi de NORMAL DAĞILIR.

Hatalarda Normal Dağılım

  • Upload
    zuriel

  • View
    83

  • Download
    0

Embed Size (px)

DESCRIPTION

Hatalarda Normal Dağılım. EKK tahmincilerinin olasılık dağılımları u i ’nin olasılık dağılımı hakkında yapılan varsayıma bağlıdır. b tahminleri için uygulanan testlerin geçerliliği u i ’nin normal dağılmasına bağlıdır. - PowerPoint PPT Presentation

Citation preview

Page 1: Hatalarda Normal Dağılım

HATALARDA NORMAL DAĞILIM

•EKK tahmincilerinin olasılık dağılımları ui’nin olasılık dağılımı hakkında yapılan varsayıma bağlıdır.

• tahminleri için uygulanan testlerin geçerliliği ui’nin normal dağılmasına bağlıdır.

• Çünkü ui normal dağılıyorsa, EKK b1 ve b2’nin tahmincileri de normal dağılır.

• Normal dağılmış değişkenleri olan bir doğrusal fonksiyonun kendisi de NORMAL DAĞILIR.

Page 2: Hatalarda Normal Dağılım

ui değerleri- +E(ui)=0

Page 3: Hatalarda Normal Dağılım

JARQUE-BERA NORMALLİK TESTİ1.Aşama H0: ui’ler normal dağılımlıdır

H1: ui’ler normal dağılımlı değildir

2.Aşama = ?

3.Aşama

,sd =?

?24

)3(

6

22

BE

nJB

4.Aşama JB > ,sd H0 hipotezi reddedilebilir

sd=?

?24

)3(

6

222

4

22

23

nJB

Page 4: Hatalarda Normal Dağılım

JARQUE-BERA NORMALLİK TESTİ

33E

44B

n

e2

2

n

e3

3

n

e4

4

Page 5: Hatalarda Normal Dağılım

JARQUE-BERA NORMALLİK TESTİ

e4

7.0544.709

-3.636411.018

-14.3273-17.6727

4.981-3.3636-7.709118.9455

e e2 e3

49.7722.1813.22

121.40205.27312.32

24.8211.3159.43

358.93

e2 = 1178.66

351.0104.43-48.09

1337.62-2940.99-5519.61

123.6-38.06

-458.156800.15

e3 = -287.99

2476.65491.76174.8

14738.1442136.4097546.48

615.9128.0

3531.95128832.16

e4 = 290672.35e = 0

Page 6: Hatalarda Normal Dağılım

JARQUE-BERA NORMALLİK TESTİ

44B

n

e2

2

10

66.1178

n

e4

4

10

35.290672

=117.866

n

e3

3

10

99.287 =-28.799

=29067.235

= 2

33E

23

)857.10)(866.117(

799.28 =-0.023

224

)866.117)(866.117(

235.29067 = 2.09

Page 7: Hatalarda Normal Dağılım

JARQUE-BERA NORMALLİK TESTİ1.Aşama H0: ui’ler normal dağılımlıdır

H1: ui’ler normal dağılımlı değildir

2.Aşama = 0.05

3.Aşama

,sd =5.991

?24

)3(

6

22

BE

nJB

4.Aşama JB < ,sd H0 hipotezi reddedilemez.

Sd=2

24

)309.2(

6

)023.0(10JB

22

0.3459

Page 8: Hatalarda Normal Dağılım

On ülkede günlük gazete satış adedi (Y), nüfus (X2) ve gayrisafi milli hasıla (X3) verilerden elde edilen doğrusal modelin hata terimlerinin normal dağılıp dağılmadığını test etmek için:i) H0: Hatalar normal dağılıma sahiptir H1: Hatalar normal dağılıma sahip değildir.

ii) JB test istatistiği hesaplanır:

24

3B

6

EnJB

22

24

3

6nJB

2

22

4

32

23

93.9178n

e

73.509n

e

781.34n

e

4

4

3

3

2

2

NORMAL DAĞILIM UYGULAMASI

Page 9: Hatalarda Normal Dağılım

iv) JB =19 > 5.99 H0 red Hatalar normal dağılıma sahip değildir.

19

24

3781.34

93.9178

781.346

738.50910JB

2

2

3

2

99.5 )iii 20.052,

Page 10: Hatalarda Normal Dağılım

0

2

4

6

8

10

-5 0 5 10 15 20

Series: ResidualsSample 1 10Observations 10

Mean -3.46E-15Median -1.571819Maximum 17.37865Minimum -4.544198Std. Dev. 6.216577Skewness 2.485017Kurtosis 7.587552

Jarque-Bera 19.06119Probability 0.000073

Eviews ile normal dağılımı test edilirse

iv) JB =19.06 > 5.99 ya da prob= 0.000< 0.05 H0 red Hatalar normal dağılıma sahip değildir.

Page 11: Hatalarda Normal Dağılım

ÇOKLU DOĞRUSAL BAĞLANTI

11

Page 12: Hatalarda Normal Dağılım

ÇOKLU DOĞRUSALLIĞIN ANLAMI

Çoklu doğrusal bağlantı; Bağımsız değişkenler arasında doğrusal (yada doğrusala yakın) ilişki olmasıdır.

1.i jx xr 1 parametreler belirlenemez hale gelir. Her bir

parametre için ayrı ayrı sayısal değerler bulmak zorlaşır

.

i jx xr 02. ise bu değişkenlere ortogonal değişkenler denir ve katsayıların tahmininde çoklu doğrusal bağlantı açısından hiçbir sorun yoktur.

i jx xr 13. ise tam çoklu doğrusal bağlantı yoktur.

12

Page 13: Hatalarda Normal Dağılım

ÇOKLU DOĞRUSAL BAĞLANTI

0

5

10

15

0 2 4 6 8

X3

X2

rX2X3= 1 Tam Çoklu Doğrusal

Bağlantı

Page 14: Hatalarda Normal Dağılım

ÇOKLU DOĞRUSALLIĞIN NEDENLERİ

İktisadi değişkenlerin zaman içerisinde birlikte değişme eğiliminde olmaları

Bazı açıklayıcı değişkenlerin gecikmeli değerlerinin ilişkide ayrı birer etmen olarak kullanılmasıdır.

Genellikle zaman serilerinde görülür.

14

Page 15: Hatalarda Normal Dağılım

ÇOKLU DOĞRUSAL BAĞLANTININ ORTAYA ÇIKARDIĞI SONUÇLAR

•Regresyon katsayılarının değerleri belirsiz olur,

•Regresyon katsayılarının varyansları büyür,

•t-istatistikleri azalır,

•Güven aralıkları büyür,

•r2 olduğundan büyük çıkar,

•Katsayı tahmincileri ve standart hataları verilerdeki

küçük değişmelerden önemli ölçüde etkilenirler,

Page 16: Hatalarda Normal Dağılım

ÇOKLU DOĞRUSALLIĞIN DOĞURDUĞU SONUÇLAR

i jx xr 1a) Katsayıları tahminleri belirlenemez.

b)Tahminlerin standart hataları sonsuz büyük olur.

16

Page 17: Hatalarda Normal Dağılım

ÇOKLU DOĞRUSAL BAĞLANTININ VARLIĞININ BELİRLENMESİ

Çoklu doğrusal bağlantı stokastik olmadığı kabul edilen bağımsız değişkenler arasında ilişki olmaması durumunu gösterir.

Anakütle ile ilgili değil örnek ile ilgili bir özelliktir. Bu nedenle çoklu doğrusal bağlantı test edilemez. Ancak belli bir örnekten hareketle derecesi ölçülebilmektedir.

Çoklu doğrusallığın belirlenmesinde bir çok yöntem vardır.

Page 18: Hatalarda Normal Dağılım

1. Çoklu doğrusallığın en önemli belirtisi bir modelde yüksek R2 olması ve ancak regresyon katsayılarının t istatistiklerinin anlamsız olmasıdır. F istatistiğinin çoğu durumda anlamlı olmasıdır. (Regresyon katsayılarının varyansları büyür t istatistikleri küçülür)

2. Bağımsız değişkenler arasında ikişerli kuvvetli ilişki bulunması da çoklu doğrusal bağlantı bulunması belirtilerindendir. Örneğin iki bağımsız değişken arasındaki korelasyon katsayısı 0.80 ve üstü ise çoklu doğrusal bağlantı önemli problem gösterir.

Bazen bağımsız değişkenler arasında ikişerli zayıf ilişki olması durumunda da çoklu doğrusal bağlantı problemi olabilir.

Page 19: Hatalarda Normal Dağılım

İkiden fazla bağımsız değişken olması durumunda kısmi korelasyon katsayıları kriterine de bakılmaktadır. Örneğin Y ile X1, X2, X3 ve X4

arasındaki regresyonda

R değeri yüksekken

r12.34

r13.24

r14.23

kısmi korelasyon katsayıları değerleri düşükse X2, X3 ve X4 arasında ikişerli kuvvetli çoklu doğrusal bağlantı olduğu sonucuna varılabilir. X lerden biri modelden çıkarılabilir.

R değeri yüksek ve kısmi korelasyon katsayıları da yüksekse çoklu doğrusal bağlantı olduğuna karar veremeyiz.

Page 20: Hatalarda Normal Dağılım

20

3.Yardımcı Regresyon Modelleri için F testi

Modelde yer alan her bir bağımsız değişken ayrı ayrı bağımlı değişken olmak üzere kalan diğer bağımsız değişkenlerle regresyona tabi tutulur.

Oluşturulan söz konusu yeni regresyon modellerine yardımcı regresyon modelleri denir.

Oluşturulan yardımcı regresyon modellerinin belirlilik katsayıları hesaplanarak F test istatistiği hesaplanır.

Bu yöntem için temel hipotez bağımsız değişkenler arasında ilişki yoktur şeklindedir.

Page 21: Hatalarda Normal Dağılım

21

i 0 1 1t 2 2t k kt tY b b X b X ..... b X

1t 2t , 3t ktX f X X ,.....,X

2t 1t , 3t ktX f X X ,.....,X

kt 1t , 2t (k 1)tX f X X ,.....,X

.

.

i 1 2 k

i 1 2 k

2X ,X X ...X

i 2X ,X X ...X

R /(k 2)F

(1 R ) /(n k 1)

k: Esas modelin tahmin edilen katsayı sayısı

Test istatistiği yukarıdaki her denklem için hesaplanır.

R2

R2

R2

Page 22: Hatalarda Normal Dağılım

22

Yıllar GSMH PA DT TEFE1990 0.397178 0.072425 -0.0244 425.61991 0.634393 0.117118 -0.03118 661.61992 1.103605 0.190736 -0.05618 1072.51993 1.997323 0.282442 -0.15573 1701.61994 3.887903 0.630348 -0.15414 3757.41995 7.854887 1.256632 -0.64664 7065.21996 14.97807 2.924893 -1.66881 12335.41997 29.39326 5.6588 -3.40719 22366.11998 53.51833 11.4232 -4.96864 38067.21999 78.28297 22.40182 -5.94562 58599.12000 125.5961 31.9121 -16.7507 89239.72001 179.4801 47.24108 -12.3931 144862.22002 265.4756 61.87976 -23.4451 216711.5

ÖRNEK: 1990-2002 dönemi için Türkiye’nin GSMH(milyar TL), Para Arzı(PA, milyar TL), Dış Ticaret Açığı (DT, milyar TL) ve Toptan Eşya Fiyat Endeksi (TEFE,1987=100) değerleri verilmiştir.

Yardımcı regresyon kriteri ile çoklu doğrusal bağlantı sorununu araştırınız.

Page 23: Hatalarda Normal Dağılım

23

Bu verilerden elde edilen model;

t t t tGSMH 0.6708 1.0473PA 1.3636DT 0.00078TEFE 2R 0.9997

Bağımsız değişkenleri sırası ile bağımlı değişken yaparak diğer bağımsız değişkenlerle regresyon modeli tahmin edilir.

t t tPA 0.191 0.304DT 0.000272TEFE 2R 0.987

t t tDT 0.3421 0.259PA 0.000028TEFE 2R 0.918

t t tTEFE 517.59 379.96DT 3102.99PA 2R 0.986

Page 24: Hatalarda Normal Dağılım

24

H0: Çoklu doğrusal bağlantı yoktur.

H1: Çoklu doğrusal bağlantı vardır.

t t tPA 0.191 0.304DT 0.000272TEFE 2R 0.987

i

0.987 /(4 2)F 379.62

(1 0.987) /(13 4 1)

F0.05,(k-2),(n-k+1) =4.10

1.Aşama:

2.Aşama:

3.Aşama:

4.Aşama: Fhes > Ftab H0 reddedilir.

Page 25: Hatalarda Normal Dağılım

25

t t tDT 0.3421 0.259PA 0.000028TEFE 2R 0.918

i

0.918 /(4 2)F 55.98

(1 0.918) /(13 4 1)

Fhes > Ftab H0 reddedilir.

t t tTEFE 517.59 379.96DT 3102.99PA 2R 0.986

i

0.986 /(4 2)F 352.14

(1 0.986) /(13 4 1)

Fhes > Ftab H0 reddedilir.

Page 26: Hatalarda Normal Dağılım

ÇOKLU DOĞRUSAL BAĞLANTININ BELİRLENMESİ

Dependent Variable: HOUSINGMethod: Least SquaresSample: 1963 1985Included observations: 23

Variable Coefficient Std. Error t-Statistic Prob. C 5087.434 11045.79 0.460577 0.6506GNP 1.756353 2.139984 0.820732 0.4225INTRATE -174.6918 61.00066 -2.863769 0.0103POP -33.43369 83.07564 -0.402449 0.6921UNEMP 79.71988 122.5794 0.650353 0.5237

R-squared 0.449950 Mean dependent var 1601.100Adjusted R-squared 0.327716 S.D. dependent var 345.4715S.E. of regression 283.2621 Akaike info criterion14.32028Sum squared resid 1444274. Schwarz criterion 14.56713Log likelihood -159.6833 F-statistic 3.681069Durbin-Watson stat 0.793569 Prob(F-statistic) 0.023274

2.Yardımcı Regresyon Modelleri için F testi

Page 27: Hatalarda Normal Dağılım

GNP 5101.49 11.99INTRATE 38.53POP 50.79UNEMP 2R 0.996

1.Aşama: H0: Çoklu doğrusal bağlantı yoktur.

H1: Çoklu doğrusal bağlantı vardır.

i

0.996 /(5 2)F 1577

(1 0.996) /(23 5 1)

F0.05,(3),(19) =3.132.Aşama:

3.Aşama:

4.Aşama: Fhes > Ftab H0 reddedilir.

Page 28: Hatalarda Normal Dağılım

INTRATE 93.82 0.68POP 0.509UNEMP 0.014GNP 2R 0.873

1.Aşama: H0: Çoklu doğrusal bağlantı yoktur.

H1: Çoklu doğrusal bağlantı vardır.

i

0.873/(5 2)F 43.55

(1 0.873) /(23 5 1)

2.Aşama:

3.Aşama:

4.Aşama: Fhes > Ftab H0 reddedilir.

F0.05,(3),(19) =3.13

Page 29: Hatalarda Normal Dağılım

POP 132.87 1.32UNEMP 0.025GNP 0.368INTRATE

2R 0.997

1.Aşama: H0: Çoklu doğrusal bağlantı yoktur.

H1: Çoklu doğrusal bağlantı vardır.

i

0.997 /(5 2)F 2104.77

(1 0.997) /(23 5 1)

2.Aşama:

3.Aşama:

4.Aşama: Fhes > Ftab H0 reddedilir.

F0.05,(3),(19) =3.13

Page 30: Hatalarda Normal Dağılım

UNEMP 80.32 0.015GNP 0.126INTRATE 0.606POP 2R 0.924

1.Aşama: H0: Çoklu doğrusal bağlantı yoktur.

H1: Çoklu doğrusal bağlantı vardır.

i

0.924 /(5 2)F 77

(1 0.924) /(23 5 1)

2.Aşama:

3.Aşama:

4.Aşama: Fhes > Ftab H0 reddedilir.

F0.05,(3),(19) =3.13

Page 31: Hatalarda Normal Dağılım

31

ÇOKLU DOĞRUSAL BAĞLANTI PROBLEMİNİ ORTADAN KALDIRMA YOLLARI

1. Ön bilgi yöntemi ile;

2. Kesit ve zaman serisi verilerinin birleştirme yöntemi ile;

3. Bazı değişkenlerin modelden çıkarılması yöntemi ile;

4. Değişkenleri dönüştürme yöntemi ile;

5. Ek veya yeni örnek verisi temini yöntemi ile;

Page 32: Hatalarda Normal Dağılım

Çoklu Doğrusal Bağlantı

Otomobil Bakım Harcamaları Model TahminleriDeğişkenler Model A Model B Model C

Sabit

Yas

Km

s.d.

Düzeltilmiş-R2

-626.24(-5.98)7.35(22.16)

55

0.897

-796.07(-5.91)

53.45(18.27)

55

0.856

-151.15(-7.06)

27.58(9.58)

7.29(0.06)

54

0.946

Page 33: Hatalarda Normal Dağılım

Çoklu Doğrusal Bağlantı Problemini Ortadan Kaldırma Yolları

1.Ön Bilgi Yöntemi

Y = b1 + b2 X2 + b3 X3 +b4 X4+ u b3 = 0.2b2

Y = b1 + b2 X2 + 0.2b2 X3 +b4 X4+ u

Y = b1 + b2 (X2 + 0.2 X3 )+b4 X4+ u

Y = b1 + b2 X*+ b4 X4+ uYukarıdaki hesaplama bağımsız değişkenler arasında çoklu doğrusal bağlantıdan etkilenmemektedir. Katsayılara sınır koyarak iki değişken arasında çoklu doğrusal bağlantı problemi ortadan kaldırılmış oluyor.

Page 34: Hatalarda Normal Dağılım

2.Kesit ve Zaman Serilerinin Birleştirilmesi

lnY = b1 + b2 lnPt+ b3 lnIt + u

Y:Talep P:Malın fiyatı I:Tüketici geliri t:Yıl

b2 ve b3 fiyat ve gelir elastikiyetidir. Zaman serisi P ve I (fiyat ve gelir) değişkenleri arasında genellikle yüksek dereceli ilişki vardır. Çoklu doğrusal bağlantı var.

b3 gelir elastikiyeti (eğer varsa) anket verilerinden ayrıca tahmin edilir. 3̂b

Page 35: Hatalarda Normal Dağılım

lnY - b3 lnIt = b1 + b2 lnPt+ u

lnY* = b1 + b2 lnPt + u

Yukarıdaki regresyon modelinden aşağıdaki gibi yararlanırız:

Burada

IbYYt lnˆln 3*

Gelir değişkeninin etkisi giderildikten sonraki Y değeridir.

Bu yöntemde katsayı tahminlerinin yorumu sorundur.

Zaman serisi verisi ve kesit serisi verisindeki gelir elastikiyetinin aynı olduğunu kabul ediyoruz.

Page 36: Hatalarda Normal Dağılım

3.Bazı Değişkenlerin Modelden Çıkarılması

Modelden bir bağımsız değişken çıkarılırsa spesifikasyon hatası yapma olasılığı artar:

Katsayı tahminleri gerçek değerinin üstünde veya altında tahmin edilebilir.

4.Değişkenleri Dönüştürme Yöntemi,

Fark denklemi yaratılır:

ttttt uXbXbXbbY 4433221

11,441,331,2211 ttttt uXbXbXbbY

Page 37: Hatalarda Normal Dağılım

6.Diğer Yöntemler.

ttttttt vXXbXXbbYY ...)()( 1,3331,22211

Dönüşümlü modelde çoklu doğrusal bağlantı önemli ölçüde azalmış olur.

5.Ek veya Yeni Örnek Verisi Temin etme,

Page 38: Hatalarda Normal Dağılım

Ev Talebi Model TahminleriDeğişkenler Model A Model B Model C

s.d.

Sabit

Faiz

Nüfus

GSMH

Düzeltilmiş-R2

200.371

-3812.93(-2.40)

-198.40(-3.87)33.82(3.61)

0.37520

687.90(1.80)

-169.66(-3.87)

0.91(3.64)

0.348

19

14.90(0.41)

-184.75(-3.18)

-1315.75(-0.27)

0.52(0.54)

r(GSMH,Nüfus)=0.99 r(GSMH,faiz)=0.88 r(Nüfus,faiz)= 0.91