Upload
zuriel
View
83
Download
0
Embed Size (px)
DESCRIPTION
Hatalarda Normal Dağılım. EKK tahmincilerinin olasılık dağılımları u i ’nin olasılık dağılımı hakkında yapılan varsayıma bağlıdır. b tahminleri için uygulanan testlerin geçerliliği u i ’nin normal dağılmasına bağlıdır. - PowerPoint PPT Presentation
Citation preview
HATALARDA NORMAL DAĞILIM
•EKK tahmincilerinin olasılık dağılımları ui’nin olasılık dağılımı hakkında yapılan varsayıma bağlıdır.
• tahminleri için uygulanan testlerin geçerliliği ui’nin normal dağılmasına bağlıdır.
• Çünkü ui normal dağılıyorsa, EKK b1 ve b2’nin tahmincileri de normal dağılır.
• Normal dağılmış değişkenleri olan bir doğrusal fonksiyonun kendisi de NORMAL DAĞILIR.
ui değerleri- +E(ui)=0
JARQUE-BERA NORMALLİK TESTİ1.Aşama H0: ui’ler normal dağılımlıdır
H1: ui’ler normal dağılımlı değildir
2.Aşama = ?
3.Aşama
,sd =?
?24
)3(
6
22
BE
nJB
4.Aşama JB > ,sd H0 hipotezi reddedilebilir
sd=?
?24
)3(
6
222
4
22
23
nJB
JARQUE-BERA NORMALLİK TESTİ
33E
44B
n
e2
2
n
e3
3
n
e4
4
JARQUE-BERA NORMALLİK TESTİ
e4
7.0544.709
-3.636411.018
-14.3273-17.6727
4.981-3.3636-7.709118.9455
e e2 e3
49.7722.1813.22
121.40205.27312.32
24.8211.3159.43
358.93
e2 = 1178.66
351.0104.43-48.09
1337.62-2940.99-5519.61
123.6-38.06
-458.156800.15
e3 = -287.99
2476.65491.76174.8
14738.1442136.4097546.48
615.9128.0
3531.95128832.16
e4 = 290672.35e = 0
JARQUE-BERA NORMALLİK TESTİ
44B
n
e2
2
10
66.1178
n
e4
4
10
35.290672
=117.866
n
e3
3
10
99.287 =-28.799
=29067.235
= 2
33E
23
)857.10)(866.117(
799.28 =-0.023
224
)866.117)(866.117(
235.29067 = 2.09
JARQUE-BERA NORMALLİK TESTİ1.Aşama H0: ui’ler normal dağılımlıdır
H1: ui’ler normal dağılımlı değildir
2.Aşama = 0.05
3.Aşama
,sd =5.991
?24
)3(
6
22
BE
nJB
4.Aşama JB < ,sd H0 hipotezi reddedilemez.
Sd=2
24
)309.2(
6
)023.0(10JB
22
0.3459
On ülkede günlük gazete satış adedi (Y), nüfus (X2) ve gayrisafi milli hasıla (X3) verilerden elde edilen doğrusal modelin hata terimlerinin normal dağılıp dağılmadığını test etmek için:i) H0: Hatalar normal dağılıma sahiptir H1: Hatalar normal dağılıma sahip değildir.
ii) JB test istatistiği hesaplanır:
24
3B
6
EnJB
22
24
3
6nJB
2
22
4
32
23
93.9178n
e
73.509n
e
781.34n
e
4
4
3
3
2
2
NORMAL DAĞILIM UYGULAMASI
iv) JB =19 > 5.99 H0 red Hatalar normal dağılıma sahip değildir.
19
24
3781.34
93.9178
781.346
738.50910JB
2
2
3
2
99.5 )iii 20.052,
0
2
4
6
8
10
-5 0 5 10 15 20
Series: ResidualsSample 1 10Observations 10
Mean -3.46E-15Median -1.571819Maximum 17.37865Minimum -4.544198Std. Dev. 6.216577Skewness 2.485017Kurtosis 7.587552
Jarque-Bera 19.06119Probability 0.000073
Eviews ile normal dağılımı test edilirse
iv) JB =19.06 > 5.99 ya da prob= 0.000< 0.05 H0 red Hatalar normal dağılıma sahip değildir.
ÇOKLU DOĞRUSAL BAĞLANTI
11
ÇOKLU DOĞRUSALLIĞIN ANLAMI
Çoklu doğrusal bağlantı; Bağımsız değişkenler arasında doğrusal (yada doğrusala yakın) ilişki olmasıdır.
1.i jx xr 1 parametreler belirlenemez hale gelir. Her bir
parametre için ayrı ayrı sayısal değerler bulmak zorlaşır
.
i jx xr 02. ise bu değişkenlere ortogonal değişkenler denir ve katsayıların tahmininde çoklu doğrusal bağlantı açısından hiçbir sorun yoktur.
i jx xr 13. ise tam çoklu doğrusal bağlantı yoktur.
12
ÇOKLU DOĞRUSAL BAĞLANTI
0
5
10
15
0 2 4 6 8
X3
X2
rX2X3= 1 Tam Çoklu Doğrusal
Bağlantı
ÇOKLU DOĞRUSALLIĞIN NEDENLERİ
İktisadi değişkenlerin zaman içerisinde birlikte değişme eğiliminde olmaları
Bazı açıklayıcı değişkenlerin gecikmeli değerlerinin ilişkide ayrı birer etmen olarak kullanılmasıdır.
Genellikle zaman serilerinde görülür.
14
ÇOKLU DOĞRUSAL BAĞLANTININ ORTAYA ÇIKARDIĞI SONUÇLAR
•Regresyon katsayılarının değerleri belirsiz olur,
•Regresyon katsayılarının varyansları büyür,
•t-istatistikleri azalır,
•Güven aralıkları büyür,
•r2 olduğundan büyük çıkar,
•Katsayı tahmincileri ve standart hataları verilerdeki
küçük değişmelerden önemli ölçüde etkilenirler,
ÇOKLU DOĞRUSALLIĞIN DOĞURDUĞU SONUÇLAR
i jx xr 1a) Katsayıları tahminleri belirlenemez.
b)Tahminlerin standart hataları sonsuz büyük olur.
16
ÇOKLU DOĞRUSAL BAĞLANTININ VARLIĞININ BELİRLENMESİ
Çoklu doğrusal bağlantı stokastik olmadığı kabul edilen bağımsız değişkenler arasında ilişki olmaması durumunu gösterir.
Anakütle ile ilgili değil örnek ile ilgili bir özelliktir. Bu nedenle çoklu doğrusal bağlantı test edilemez. Ancak belli bir örnekten hareketle derecesi ölçülebilmektedir.
Çoklu doğrusallığın belirlenmesinde bir çok yöntem vardır.
1. Çoklu doğrusallığın en önemli belirtisi bir modelde yüksek R2 olması ve ancak regresyon katsayılarının t istatistiklerinin anlamsız olmasıdır. F istatistiğinin çoğu durumda anlamlı olmasıdır. (Regresyon katsayılarının varyansları büyür t istatistikleri küçülür)
2. Bağımsız değişkenler arasında ikişerli kuvvetli ilişki bulunması da çoklu doğrusal bağlantı bulunması belirtilerindendir. Örneğin iki bağımsız değişken arasındaki korelasyon katsayısı 0.80 ve üstü ise çoklu doğrusal bağlantı önemli problem gösterir.
Bazen bağımsız değişkenler arasında ikişerli zayıf ilişki olması durumunda da çoklu doğrusal bağlantı problemi olabilir.
İkiden fazla bağımsız değişken olması durumunda kısmi korelasyon katsayıları kriterine de bakılmaktadır. Örneğin Y ile X1, X2, X3 ve X4
arasındaki regresyonda
R değeri yüksekken
r12.34
r13.24
r14.23
kısmi korelasyon katsayıları değerleri düşükse X2, X3 ve X4 arasında ikişerli kuvvetli çoklu doğrusal bağlantı olduğu sonucuna varılabilir. X lerden biri modelden çıkarılabilir.
R değeri yüksek ve kısmi korelasyon katsayıları da yüksekse çoklu doğrusal bağlantı olduğuna karar veremeyiz.
20
3.Yardımcı Regresyon Modelleri için F testi
Modelde yer alan her bir bağımsız değişken ayrı ayrı bağımlı değişken olmak üzere kalan diğer bağımsız değişkenlerle regresyona tabi tutulur.
Oluşturulan söz konusu yeni regresyon modellerine yardımcı regresyon modelleri denir.
Oluşturulan yardımcı regresyon modellerinin belirlilik katsayıları hesaplanarak F test istatistiği hesaplanır.
Bu yöntem için temel hipotez bağımsız değişkenler arasında ilişki yoktur şeklindedir.
21
i 0 1 1t 2 2t k kt tY b b X b X ..... b X
1t 2t , 3t ktX f X X ,.....,X
2t 1t , 3t ktX f X X ,.....,X
kt 1t , 2t (k 1)tX f X X ,.....,X
.
.
i 1 2 k
i 1 2 k
2X ,X X ...X
i 2X ,X X ...X
R /(k 2)F
(1 R ) /(n k 1)
k: Esas modelin tahmin edilen katsayı sayısı
Test istatistiği yukarıdaki her denklem için hesaplanır.
R2
R2
R2
22
Yıllar GSMH PA DT TEFE1990 0.397178 0.072425 -0.0244 425.61991 0.634393 0.117118 -0.03118 661.61992 1.103605 0.190736 -0.05618 1072.51993 1.997323 0.282442 -0.15573 1701.61994 3.887903 0.630348 -0.15414 3757.41995 7.854887 1.256632 -0.64664 7065.21996 14.97807 2.924893 -1.66881 12335.41997 29.39326 5.6588 -3.40719 22366.11998 53.51833 11.4232 -4.96864 38067.21999 78.28297 22.40182 -5.94562 58599.12000 125.5961 31.9121 -16.7507 89239.72001 179.4801 47.24108 -12.3931 144862.22002 265.4756 61.87976 -23.4451 216711.5
ÖRNEK: 1990-2002 dönemi için Türkiye’nin GSMH(milyar TL), Para Arzı(PA, milyar TL), Dış Ticaret Açığı (DT, milyar TL) ve Toptan Eşya Fiyat Endeksi (TEFE,1987=100) değerleri verilmiştir.
Yardımcı regresyon kriteri ile çoklu doğrusal bağlantı sorununu araştırınız.
23
Bu verilerden elde edilen model;
t t t tGSMH 0.6708 1.0473PA 1.3636DT 0.00078TEFE 2R 0.9997
Bağımsız değişkenleri sırası ile bağımlı değişken yaparak diğer bağımsız değişkenlerle regresyon modeli tahmin edilir.
t t tPA 0.191 0.304DT 0.000272TEFE 2R 0.987
t t tDT 0.3421 0.259PA 0.000028TEFE 2R 0.918
t t tTEFE 517.59 379.96DT 3102.99PA 2R 0.986
24
H0: Çoklu doğrusal bağlantı yoktur.
H1: Çoklu doğrusal bağlantı vardır.
t t tPA 0.191 0.304DT 0.000272TEFE 2R 0.987
i
0.987 /(4 2)F 379.62
(1 0.987) /(13 4 1)
F0.05,(k-2),(n-k+1) =4.10
1.Aşama:
2.Aşama:
3.Aşama:
4.Aşama: Fhes > Ftab H0 reddedilir.
25
t t tDT 0.3421 0.259PA 0.000028TEFE 2R 0.918
i
0.918 /(4 2)F 55.98
(1 0.918) /(13 4 1)
Fhes > Ftab H0 reddedilir.
t t tTEFE 517.59 379.96DT 3102.99PA 2R 0.986
i
0.986 /(4 2)F 352.14
(1 0.986) /(13 4 1)
Fhes > Ftab H0 reddedilir.
ÇOKLU DOĞRUSAL BAĞLANTININ BELİRLENMESİ
Dependent Variable: HOUSINGMethod: Least SquaresSample: 1963 1985Included observations: 23
Variable Coefficient Std. Error t-Statistic Prob. C 5087.434 11045.79 0.460577 0.6506GNP 1.756353 2.139984 0.820732 0.4225INTRATE -174.6918 61.00066 -2.863769 0.0103POP -33.43369 83.07564 -0.402449 0.6921UNEMP 79.71988 122.5794 0.650353 0.5237
R-squared 0.449950 Mean dependent var 1601.100Adjusted R-squared 0.327716 S.D. dependent var 345.4715S.E. of regression 283.2621 Akaike info criterion14.32028Sum squared resid 1444274. Schwarz criterion 14.56713Log likelihood -159.6833 F-statistic 3.681069Durbin-Watson stat 0.793569 Prob(F-statistic) 0.023274
2.Yardımcı Regresyon Modelleri için F testi
GNP 5101.49 11.99INTRATE 38.53POP 50.79UNEMP 2R 0.996
1.Aşama: H0: Çoklu doğrusal bağlantı yoktur.
H1: Çoklu doğrusal bağlantı vardır.
i
0.996 /(5 2)F 1577
(1 0.996) /(23 5 1)
F0.05,(3),(19) =3.132.Aşama:
3.Aşama:
4.Aşama: Fhes > Ftab H0 reddedilir.
INTRATE 93.82 0.68POP 0.509UNEMP 0.014GNP 2R 0.873
1.Aşama: H0: Çoklu doğrusal bağlantı yoktur.
H1: Çoklu doğrusal bağlantı vardır.
i
0.873/(5 2)F 43.55
(1 0.873) /(23 5 1)
2.Aşama:
3.Aşama:
4.Aşama: Fhes > Ftab H0 reddedilir.
F0.05,(3),(19) =3.13
POP 132.87 1.32UNEMP 0.025GNP 0.368INTRATE
2R 0.997
1.Aşama: H0: Çoklu doğrusal bağlantı yoktur.
H1: Çoklu doğrusal bağlantı vardır.
i
0.997 /(5 2)F 2104.77
(1 0.997) /(23 5 1)
2.Aşama:
3.Aşama:
4.Aşama: Fhes > Ftab H0 reddedilir.
F0.05,(3),(19) =3.13
UNEMP 80.32 0.015GNP 0.126INTRATE 0.606POP 2R 0.924
1.Aşama: H0: Çoklu doğrusal bağlantı yoktur.
H1: Çoklu doğrusal bağlantı vardır.
i
0.924 /(5 2)F 77
(1 0.924) /(23 5 1)
2.Aşama:
3.Aşama:
4.Aşama: Fhes > Ftab H0 reddedilir.
F0.05,(3),(19) =3.13
31
ÇOKLU DOĞRUSAL BAĞLANTI PROBLEMİNİ ORTADAN KALDIRMA YOLLARI
1. Ön bilgi yöntemi ile;
2. Kesit ve zaman serisi verilerinin birleştirme yöntemi ile;
3. Bazı değişkenlerin modelden çıkarılması yöntemi ile;
4. Değişkenleri dönüştürme yöntemi ile;
5. Ek veya yeni örnek verisi temini yöntemi ile;
Çoklu Doğrusal Bağlantı
Otomobil Bakım Harcamaları Model TahminleriDeğişkenler Model A Model B Model C
Sabit
Yas
Km
s.d.
Düzeltilmiş-R2
-626.24(-5.98)7.35(22.16)
55
0.897
-796.07(-5.91)
53.45(18.27)
55
0.856
-151.15(-7.06)
27.58(9.58)
7.29(0.06)
54
0.946
Çoklu Doğrusal Bağlantı Problemini Ortadan Kaldırma Yolları
1.Ön Bilgi Yöntemi
Y = b1 + b2 X2 + b3 X3 +b4 X4+ u b3 = 0.2b2
Y = b1 + b2 X2 + 0.2b2 X3 +b4 X4+ u
Y = b1 + b2 (X2 + 0.2 X3 )+b4 X4+ u
Y = b1 + b2 X*+ b4 X4+ uYukarıdaki hesaplama bağımsız değişkenler arasında çoklu doğrusal bağlantıdan etkilenmemektedir. Katsayılara sınır koyarak iki değişken arasında çoklu doğrusal bağlantı problemi ortadan kaldırılmış oluyor.
2.Kesit ve Zaman Serilerinin Birleştirilmesi
lnY = b1 + b2 lnPt+ b3 lnIt + u
Y:Talep P:Malın fiyatı I:Tüketici geliri t:Yıl
b2 ve b3 fiyat ve gelir elastikiyetidir. Zaman serisi P ve I (fiyat ve gelir) değişkenleri arasında genellikle yüksek dereceli ilişki vardır. Çoklu doğrusal bağlantı var.
b3 gelir elastikiyeti (eğer varsa) anket verilerinden ayrıca tahmin edilir. 3̂b
lnY - b3 lnIt = b1 + b2 lnPt+ u
lnY* = b1 + b2 lnPt + u
Yukarıdaki regresyon modelinden aşağıdaki gibi yararlanırız:
Burada
IbYYt lnˆln 3*
Gelir değişkeninin etkisi giderildikten sonraki Y değeridir.
Bu yöntemde katsayı tahminlerinin yorumu sorundur.
Zaman serisi verisi ve kesit serisi verisindeki gelir elastikiyetinin aynı olduğunu kabul ediyoruz.
3.Bazı Değişkenlerin Modelden Çıkarılması
Modelden bir bağımsız değişken çıkarılırsa spesifikasyon hatası yapma olasılığı artar:
Katsayı tahminleri gerçek değerinin üstünde veya altında tahmin edilebilir.
4.Değişkenleri Dönüştürme Yöntemi,
Fark denklemi yaratılır:
ttttt uXbXbXbbY 4433221
11,441,331,2211 ttttt uXbXbXbbY
6.Diğer Yöntemler.
ttttttt vXXbXXbbYY ...)()( 1,3331,22211
Dönüşümlü modelde çoklu doğrusal bağlantı önemli ölçüde azalmış olur.
5.Ek veya Yeni Örnek Verisi Temin etme,
Ev Talebi Model TahminleriDeğişkenler Model A Model B Model C
s.d.
Sabit
Faiz
Nüfus
GSMH
Düzeltilmiş-R2
200.371
-3812.93(-2.40)
-198.40(-3.87)33.82(3.61)
0.37520
687.90(1.80)
-169.66(-3.87)
0.91(3.64)
0.348
19
14.90(0.41)
-184.75(-3.18)
-1315.75(-0.27)
0.52(0.54)
r(GSMH,Nüfus)=0.99 r(GSMH,faiz)=0.88 r(Nüfus,faiz)= 0.91